Académique Documents
Professionnel Documents
Culture Documents
CRI
PCI
N
BRE
VE
En
el
cont
exto
de
esti
mar
un
par
MUESTREO ALEATORIO
Ya que el conocimiento de la poblacin lo va a proporcionar la
muestra, es lgico que la misma no se deba tomar de un modo
arbitrario, sino que debe representar adecuadamente a toda la
poblacin. Si la muestra no es representativa, nada de lo que se
concluya a partir de ella ser vlido para la poblacin de inters,
sino que lo ser para la subpoblacin que representa. As, para
determinar el nivel medio de colesterol de todos los espaoles, la
muestra no puede tomarse slo de personas de edad avanzada, ni
slo de individuos que aparezcan en la gua telefnica, ni slo de
individuos que acuden a un hospital, etc. Para que la muestra sea
representativa de la poblacin, es preciso que sea extrada de ella
de modo que:
1 Todos los individuos de la poblacin tengan la misma probabilidad
de ser seleccionados e incluidos en la muestra (igual probabilidad)
2 La seleccin de un individuo no influya para nada en la seleccin
o no de otro individuo cualquiera (independencia).
Cuando ello se verifica diremos que la muestra es una muestra
aleatoria. La obtencin de una muestra aleatoria requiere en primer
lugar la identificacin completa de la poblacin en estudio; a
continuacin se numeran los individuos de la poblacin y, por
medios similares a un sorteo, se extrae al azar un conjunto de
nmeros, los individuos correspondientes a ellos forman una
muestra aleatoria de tal poblacin. Para hacer esta seleccin
podemos utilizar tambin las tablas de nmeros aleatorios.
ESTIMACIN PUNTUAL
Supongamos que se desea conocer la estatura media de todos los
espaoles. Si tomamos una muestra de n = 100 espaoles qu
valor elegiremos como el ms aproximado, presuntamente, a ?
Parece razonable que si 170 cm es la estatura media de dicha
intervalo
(4.1)
podemos
expresarlo
abreviadamente
como
), entonces el
(4.2)
Con , en la tabla de la D. N.
Ejemplo 1: Para determinar la estatura media de los varones
adultos espaoles, se tom una muestra al azar de 10 de ellos
en la que se obtuvo los valores 162, 176, 169, 165, 171, 169,
172, 168, 167 y 175 cm. Determinar el valor de la estatura
media, suponiendo que = 16.
Un estimador puntual para la estatura media es la que en
este caso es 169,4. Para dar un intervalo de confianza hemos
de suponer que es una v. a. normal. Como n=10, = 169,4
y = 4, para el intervalo de confianza al 95%, la expresin
(4.1) indica que
As pues, esperamos que este intervalo sea un de los 95 de
cada 100 que contienen a , o, ms brevemente, la estatura
media de los espaoles varones adultos es algn valor entre
166,92 cm y 171,88 cm con una confianza del 95%.
Es evidente que un intervalo de confianza para un dado ser tanto
ms preciso cuanto ms estrecho sea. As, ser preferible afirmar
que la estatura media est entre 170 y 171 cm al 95% de confianza,
que afirmar que la estatura est entre 165 y 175 con igual
confianza. Como la longitud del intervalo es dos veces su radio, el
mismo puede disminuirse aumentando el valor del tamao de la
muestra (pues n aparece dividiendo). Ello responde a una regla que
ser general en toda la Estadstica: cuanto ms grande sea una
muestra, ms informacin da y ms precisas son las conclusiones
que se obtengan a partir de ella.
La otra forma de estrechar el intervalo es disminuyendo la confianza
(es decir, aumentando el error). As z0,05 = 1,96, pero z0,15 = 1,44, que
por ser menor da un intervalo ms estrecho. Sin embargo ahora la
anchura del intervalo ha disminuido a costa de la seguridad
(confianza) del mismo, y ello no es deseable. Lo usual es considerar
errores del 5%, aunque en ocasiones se utilizan otros como los del
1% o del 10%. Nos podemos preguntar se puede dar un intervalo al
100% de confianza?; la respuesta es que esto exigira una z 0,00 = ,
TAMAO DE LA MUESTRA
En la fase de diseo de una experiencia suele plantearse cul debe
ser el tamao mnimo de la muestra para lograr una precisin dada
en la estimacin de la media. As, cuntos espaoles debo tomar
para determinar su estatura media con una precisin de 1 cm? Con
ello se quiere indicar que si concluyo que debo tomar n = 100
espaoles y tomo una muestra de 100 de ellos, la estatura media en
la muestra (
habr de ser
, y despejando n
(4.4)
La expresin (4.4) tiene la desventaja de depender de
desconocido usualmente.
, valor
(4.5)
2) Tomar una muestra piloto de tamao n pequeo, obtener en
ella su varianza
y entonces:
(4.6)
Con t
. As, si
(4.7)
Ejemplo 3: Determinar el tamao de muestra requerido para
obtener la estatura media de la poblacin, con una precisin
de 1 cm, si la varianza poblacional es = 25.
Ahora n=10 y
. Como 6 < 10 = n, ello
indica que con la muestra piloto nos basta para la precisin
deseada.
Ejemplo 6: Igual que el anterior pero exigiendo un d = 1 cm.
De nuevo n= 10 y ahora
son precisos 85 individuos ms que antes.
INTERVALO
DE
PROPORCIN
CONFIANZA
, con lo que
PARA
UNA
Intervalo.
La distribucin Binomial, bajo ciertas circunstancias, se aproxima a
una Normal. Los resultados siguientes se basan en esta
aproximacin. La expresin ms tradicional del intervalo de
confianza para una proporcin p es la siguiente:
(4.8)
Esta expresin es vlida si x > 20 y n-x >20.Tiene la ventaja de ser
cmoda, pero a cambio es ms imprecisa y tiene unas condiciones
de validez ms exigentes. La siguiente expresin es ms exacta
(pero ms incmoda) y para su validez basta con que sean x > 5 y n
- x > 5:
(4.9)
Ejemplo 7(continuacin):
Aqu n = 100 y x = 30. Como x > 20 y n - x = 70 > 20, se
puede utilizar (4.8):
; 0,4011)
= (0,2145
(4.10)
La idea es tener garantas de que tomando una muestra de tamao
n, la proporcin poblacional p de individuos que verifican la
caracterstica es, con una confianza de (1 - ), alguno de los valores
entre p1 d, con p1 la proporcin en la muestra y d un nmero dado
de antemano.
El problema, una vez ms, es que la expresin anterior depende de
p (que es desconocido). Puede demostrarse que pq es tanto mayor
cuanto ms se aproxime p a 0,5 alcanzando el mximo cuando p =
0,5, o sea,
(4.11).
Como sucede en todas las frmulas de tamao de muestra, n es
tanto ms grande cuanto mayor sea la confianza del intervalo y
cuanto menor sea d (cuanta mayor precisin se desee). La (4.11)
aporta una novedad: el tamao de la muestra es ms grande cuanto
ms se aproxime p al valor 0,5, disminuyendo cuando nos
enfrentemos a caracteres raros (p pequeo) o muy frecuentes (p
grande). Igual sucede con la anchura de los intervalos de confianza
para p: son ms anchos cuanto ms se acerque p a 0,5. Volviendo al
problema del desconocimiento de p, la aplicacin de (4.10) puede
hacerse de dos modos:
1) Si no se tiene idea alguna acerca de su posible valor, sustituir pq
por 1/4, quedando:
(4.12)
2) Si se tiene alguna informacin, sustituir p por el valor ms
cercano posible ( y compatible con la informacin) a 0,5.
Ejemplo 8 (continuacin):
Si el partido es nuevo y no se tiene idea acerca del porcentaje
posible
de
votos
favorables,
sera