Vous êtes sur la page 1sur 34

Como lo veremos

Tema 2: Análisis estadístico de una población


7. Variabilidad de la muestra. Distribuciones Bernoulli y Binomial. Comportamiento
de la media muestral en muestras grandes. Algunos ejemplos. La distribución
normal.
8. Estimación puntual y por intervalos. Error de estimación y su interpretación.
Interpretación del intervalo de confianza. Estudio estadístico de una proporción
poblacional. Estimación de una proporción. Cálculo del tamaño muestral
mediante intervalos de confianza
9. Contraste de hipótesis. Contrastes unilaterales y bilaterales. Contrastes de
significatividad y p-valor. Error de Tipo I y de Tipo II. Acotación de los errores
para calcular el tamaño muestral.. Contrastes sobre una proporción
10.Estimación puntual y por intervalos de la media poblacional con muestras
grandes Estimación de la media poblacional en muestras pequeñas. Distribución
t de Student. Intervalos de confianza.
11.Contrastes de hipótesis sobre la media de una población con muestras grandes.
Test t de Student para una muestra. Solución al contraste bilateral. Solución a
los contrastes unilaterales.
12.Condiciones de aplicabilidad del test t de Student para una muestra. Contrastes
de normalidad. Alternativas no paramétricas: test de los signos y test de
Wilcoxon. 1
Tema 2: Análisis estadístico de una población
7. Variabilidad de la muestra. Comportamiento de la media muestral en muestras
grandes. La distribución normal. Algunos ejemplos.
8. Estimación puntual y por intervalos de la media poblacional con muestras
grandes. Error de estimación y su interpretación. Interpretación del intervalo de
confianza.
9. Contrastes de hipótesis sobre la media de una población con muestras grandes.
Contrastes unilaterales y bilaterales. Contrastes de significatividad y p-valor.
10.Error de Tipo I y de Tipo II. Acotación de los errores para calcular el tamaño
muestral. Cálculo del tamaño muestral mediante intervalos de confianza.
11.Estudio estadístico de una proporción poblacional. Distribuciones Bernoulli y
Binomial. Estimación de una proporción.
12.Contraste de hipótesis sobre una proporción. Cálculo del tamaño muestral.
13.Estimación de la media poblacional en muestras pequeñas. Distribución t de
Student. Intervalos de confianza.
14.Test t de Student para una muestra. Solución al contraste bilateral. Solución a
los contrastes unilaterales.
15.Condiciones de aplicabilidad del test t de Student para una muestra. Contrastes
de normalidad. Alternativas no paramétricas: test de los signos y test de
Wilcoxon.
2
8- Estimación puntual y por intervalos de la media poblacional con muestras grandes.
Error de estimación y su interpretación. Interpretación del intervalo de confianza.

Lección 7 conocíamos la población podíamos


“adivinar” o “predecir” cómo sería la muestra

TEMA 1 teníamos una


PROBABILIDAD muestra. No conocíamos la
población

POBLACIÓN INFERENCIA
ESTADÍSTICA MUESTRA

Lección 8 SÓLO conocemos la muestra PERO vamos a


intentar “predecir” cómo es la población,
A PESAR DE QUE SEGUIRÁ SIENDO DESCONOCIDA
CUANDO TERMINE EL PROCESO DE INFERENCIA
3
8- Estimación puntual y por intervalos de la media poblacional con muestras grandes.
Error de estimación y su interpretación. Interpretación del intervalo de confianza.

Inferencia Estadística: proceso de obtener conclusiones válidas para una población a


partir de una muestra aleatoria extraída de dicha población.

¿Cómo hacemos inferencia estadística?

Y  variable Población Estadística Muestreo


respuesta Aleatorio
 𝝅 Muestra Muestra
Inferencia n elementos
𝑦𝑠𝑝

Parámetros: media, desviación típica,


proporción, poblacionales. Estadísticos : media, desviación típica,
DESCONOCIDOS proporción muestrales = estimadores.
CONOCIDOS AL VER LA MUESTRA
8- Estimación puntual y por intervalos de la media poblacional con muestras grandes.
Error de estimación y su interpretación. Interpretación del intervalo de confianza.

Inferencia Estadística: proceso de obtener conclusiones válidas para una población a


partir de una muestra aleatoria extraída de dicha población.

¿Cuáles son los procedimientos básicos


de Inferencia Estadística?

Estimación puntual a partir del valor de los


estadísticos
Estimación
(aproximación del valor de un parámetro) Estimación por intervalos a partir de la
distribución en el muestreo de los estadísticos.

Contraste de Hipótesis
(análisis de teorías sobre los posibles valores de un parámetro)
8- Estimación puntual y por intervalos de la media poblacional con muestras grandes.
Error de estimación y su interpretación. Interpretación del intervalo de confianza.

¿Estimación puntual?

Estimación Aproximación del valor DESCONOCIDO de un parámetro POBLACIONAL


• Estimación puntual: Aproxima el parámetro poblacional por el valor del estadístico
correspondiente, calculado a partir de la muestra.

Si el parámetro es la media poblacional  se estima por 𝑦=𝜇

Si el parámetro es la varianza poblacional  se estima por s 2  ˆ 2


Si el parámetro es la Desviación Típica poblacional  se estima por s  ˆ
Si el parámetro es la proporción poblacional  se estima por p  ˆ
8- Estimación puntual y por intervalos de la media poblacional con muestras grandes.
Error de estimación y su interpretación. Interpretación del intervalo de confianza.

Quién es la media poblacional? 60,0%

Porcentaje
Distribución Bernoulli () 40,0%

= Probabilidad de que un individuo presente la 20,0%

0,0%
característica (infección bronquial, fractura de cadera, ,00
ber025
1,00

hombres …)

100= % de presencia de la característica en la


1=Presencia de la característica
0=Ausencia de la característica
población
Caso especial: “PREVALENCIA”

Conozco la población si puedo calcular la probabilidad de sus valores:


𝑃 𝑌 = 1 = 𝜋, 𝑃 𝑌 = 0 = 1 − 𝜋  Solo necesito conocer 𝜋

Objetivo: Aprender sobre 


Teniendo en cuenta que la media de los
valores de la variable Bernoulli en toda la 𝜋=𝑝=𝑦
Población es  Proporción de valores 1 en la muestra Media muestral
8- Estimación puntual y por intervalos de la media poblacional con muestras grandes.
Error de estimación y su interpretación. Interpretación del intervalo de confianza.

Parece natural aproximar (estimar) la media poblacional, , por la media muestral, 𝑌


Pero, ¿ podemos estar seguros de que es una buena aproximación?

En la lección 7 𝜎𝑌
𝜇𝑌 = 𝜇𝑌 vimos que SIEMPRE, sea grande 𝜎𝑌 =
𝑛
o pequeña la muestra,

La media muestral proporciona valores Cuantas más observaciones tenemos, más se


alrededor de la media poblacional concentran los valores posibles de la media
muestral alrededor del de la media poblacional

8
11. Estudio estadístico de una proporción poblacional. Distribuciones Bernoulli y
Binomial. Estimación de una proporción

EJEMPLO: Fumadores
Consideremos una población con una
proporción desconocida () de
individuos que son fumadores.

Supongamos que la población


tiene 100 individuos y podemos
observar de cada individuo
selecconadom si es fumador ( )
o es no fumador ( ).
Elegimos dos muestras aleatorias
de tamaño 5.
Cómo podemos hacerlo?
Individuos de la Muestra 2
53, 31, 80, 21, 38

Individuos de la Muestra 1:
10 34, 61, 16, 84
9
11. Estudio estadístico de una proporción poblacional. Distribuciones Bernoulli y
Binomial. Estimación de una proporción

Ejemplo: Fumadores (n = 5)
MUESTRAS DIFERENTES PUEDEN
Muestra 1: 1 fumador DAR DISTINTAS ESTIMACIONES DEL
MISMO PARÁMETRO .
Muestra 2: 3 fumadores

varía de muestra en muestra con un error estándar

Desviación típica muestral de 𝜋 = 𝑦

10
11. Estudio estadístico de una proporción poblacional. Distribuciones Bernoulli y
Binomial. Estimación de una proporción

EJERCICIO: Asma
El asma es una enfermedad inflamatoria del aparato respiratorio que provoca dificultad en la
respiración (disnea). En una revisión médica de 400 empleados de una cierta empresa se vio que
40 padecían asma. Estima el porcentaje de empleados de la empresa que padecen asma y
proporciona una medida del error de esta estimación

40 ˆ  π)
π(1 ˆ 0.1 0.9
ˆ   0.1 SE ˆ    0.015
400 n 400

¿Cómo analizamos una muestra de datos categóricos con SPSS?


3º Pedimos la tabla de frecuencias, la Recordamos que 𝑦 = 𝜋
media y el error estándar

11
8- Estimación puntual y por intervalos de la media poblacional con muestras grandes.
Error de estimación y su interpretación. Interpretación del intervalo de confianza.

Si siempre se comporta “razonablemente”¿Qué pasa si la muestra es grande?


Que podemos conocer su distribución y trabajar con ella: Teorema Central del Límite.

El teorema central del límite (TCL) establece que:


Sea Y1,Y2,..,Yn una muestra aleatoria de una población con media  y desviación típica .
Entonces, para valores de n grandes, la 𝑌 (media muestral de Y1,Y2,..,Yn ) toma valores que
siguen aproximadamente una distribución Normal con media  y desviación típica 𝝈 𝒏 .
¿A partir de qué valor de n (¿grande?)
podemos aplicar el TCL? Lección 7

RESPUESTA: Depende de la forma de la


El TCL es fundamental porque se puede
distribución de la población:
aplicar en la práctica cuando la
 Si es Normal Cualquier n vale. forma de la distribución de la
Leve desviación de Normalidad n>15 población se desconoce.
Gran desviación de Normalidad n>30

Vamos a desarrollar el método de estimación por intervalos suponiendo que la


media muestral se comporta como una distribución Normal, ya sea porque la
población original era Normal o porque el tamaño muestral es grande 12
8- Estimación puntual y por intervalos de la media poblacional con muestras grandes.
Error de estimación y su interpretación. Interpretación del intervalo de confianza.

¿Estimación por intervalo …de confianza?

◦Estimación por intervalo de confianza: Aproximamos la característica de la población ()


por un INTERVALO [a, b], que tiene asociado un NIVEL DE CONFIANZA 1-
◦Los cálculos están basados en LA muestra observada en la realización del experimento.
◦Distintas muestras darían distintos extremos [a, b]  los extremos del intervalo SON, en
realidad, VARIABLES ALEATORIAS (varían con el muestreo)

◦El método de estimación por intervalo garantiza que el 100(1- )% de las muestras,
que pueden aparecer al hacer el muestreo, proporcionan límites, [a, b], entre los
cuales se encuentra el valor VERDADERO y DESCONOCIDO DEL PARÁMETRO QUE
INTENTAMOS ESTIMAR
IDEA INTUITIVA DE LA CONSTRUCCIÓN DE UN INTERVALO DE CONFIANZA La Figura es un dibujo
de un hombre invisible paseando con su perro. El perro, que es visible, lleva una correa, invisible,
de muelle. La tensión en el resorte es tal que: el perro está a menos de 2 medidas (errores
estándar) del hombre, el 95% del tiempo.
Podemos ver al perro, pero nos gustaría saber dónde está el hombre.
Como la distancia entre ellos es, generalmente, menor que 2 SE,
podemos tomar el intervalo perro  2.SE como un intervalo que
típicamente incluye al hombre. Podríamos decir, con una
Hombre invisible paseando con su perro confianza del 95%, que el hombre está en este intervalo.
8- Estimación puntual y por intervalos de la media poblacional con muestras grandes.
Error de estimación y su interpretación. Interpretación del intervalo de confianza.

2*SE
?

?
𝒚
?
IDEA INTUITIVA DE LA CONSTRUCCIÓN DE UN INTERVALO DE CONFIANZA La Figura es un dibujo
de un hombre invisible paseando con su perro. El perro, que es visible, lleva una correa, invisible,
de muelle. La tensión en el resorte es tal que: el perro está a menos de 2 medidas (errores
estándar) del hombre, el 95% del tiempo.
Podemos ver al perro, pero nos gustaría saber dónde está el hombre.
Como la distancia entre ellos es, generalmente, menor que 2 SE, podemos tomar el intervalo
[perro - 2.SE, perro + 2.SE] como un intervalo que típicamente incluye al hombre. Podríamos decir,
con una confianza del 95%, que el hombre está en este intervalo.
8- Estimación puntual y por intervalos de la media poblacional con muestras grandes.
Error de estimación y su interpretación. Interpretación del intervalo de confianza.

Construcción del Intervalo de Confianza al 95% para 


𝜎 𝜎
(ver lección 7 para seguir este razonamiento) 1,96 ≈2
Si la muestra viene de una distribución Normal 𝑛 𝑛
 o si el tamaño muestral es bastante grande (TCL) ,
sabemos que la media muestral
 se distribuye 𝑁(𝜇, 𝜎 𝑛)
El 95% de sus valores distan de  menos de
2 desviaciones : 2𝝈 𝑛

Un 95% de las muestras de tamaño n


proporcionarán una media muestral
cuya distancia a la media poblacional no
2σ 2σ
será superior a 2𝜎 𝑛 μ μ μ 𝑌
n n

Para esas muestras (el 95% de las posibles) , se cumple que el intervalo
𝜎 𝜎
𝐼𝐶0,95 𝜇 = 𝑦 − 1,96 , 𝑦 + 1,96
𝑛 𝑛
contiene al verdadero valor de la media poblacional, es decir .
15
8- Estimación puntual y por intervalos de la media poblacional con muestras grandes.
Error de estimación y su interpretación. Interpretación del intervalo de confianza.

Las 4 diapositivas (Extra) siguientes incluyen la explicación de porqué el


radio del intervalo al 95% se obtiene multiplicando el Error Estándar por
1,96.

No hay que aprenderlo, nunca haremos el cálculo.

Sólo pretenden recordar las contestaciones a las preguntas que


surgieron en clase:

• ¿Qué es Z?La letra con que representamos la N(0,1) o Normal


estándar, también se llama Normal tipificada.

• ¿Por qué 1,96? Eso lo explican las diapositivas que siguen.

• ¿Siempre es 1,96? No, depende del nivel de confianza, 1,96 es


para el 95%

• ¿Quién elige el nivel de confianza? El investigador. Depende de la


seguridad con que quiera dar los resultados.
16
7. Variabilidad de la muestra. Comportamiento de la media muestral en muestras grandes.
La distribución normal. Algunos ejemplos.

Diapositiva extra 1
Función de densidad de la Normal
f(X) Recordemos que en la
lección 7 comentamos
que la densidad Normal
X no es integrable
2
 1   x  
1    
f ( x)  e 2  

 2

f(x)=Función de densidad de la variable X En una distribución Normal, aproximadamente


=3.14159; e = 2.71828 el 95% de los valores están a menos de 2
=Media poblacional. desviaciones típicas de la media
=Desviación típica de la población.
x=Valor de la variable aleatoria (- < X <)

Esa densidad no es integrable,


las probabilidades (áreas) se
obtienen con cálculo numérico
¿Cómo? Ver las
siguientes diapositivas 17
7. - Describir poblaciones. La distribución normal. Variabilidad de la muestra.
Comportamiento de la media muestral en muestras grandes. Ejemplos.

Cálculo de áreas bajo una curva normal Diapositiva extra 2

¡La probabilidad es el
área bajo la curva!

18
7. - Describir poblaciones. La distribución normal. Variabilidad de la muestra.
Comportamiento de la media muestral en muestras grandes. Ejemplos.

Diapositiva extra 3
¿Cómo se calculan las probabilidades en una Normal?
𝐸𝑗𝑒𝑚𝑝𝑙𝑜: 𝐸𝑙 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑙𝑒𝑠𝑡𝑒𝑟𝑜𝑙 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑛𝑓𝑒𝑟𝑚𝑜𝑠 𝑑𝑒 𝑢𝑛 ℎ𝑜𝑠𝑝𝑖𝑡𝑎𝑙 𝑌 𝑠𝑖𝑔𝑢𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑁𝑜𝑟𝑚𝑎𝑙 𝑐𝑜𝑛
𝑢𝑛𝑎 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 179,1 𝑚𝑔 𝑑𝐿 𝑦 𝑢𝑛𝑎 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑡í𝑝𝑖𝑐𝑎 𝑑𝑒 28,2 𝑚𝑔 𝑑𝐿 . 𝑌~𝑁𝑜𝑟𝑚𝑎𝑙 𝜇 = 179.1, 𝜎 = 28.2

¿ 𝑄𝑢é 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑑𝑒 𝑒𝑛𝑓𝑒𝑟𝑚𝑜𝑠 𝑡𝑖𝑒𝑛𝑒 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑙𝑒𝑠𝑡𝑒𝑟𝑜𝑙 𝑚𝑒𝑛𝑜𝑟 𝑎 169 𝑚𝑔 𝑑𝐿?

𝑌 − 179.1
𝑇𝑖𝑝𝑖𝑓𝑖𝑐𝑎𝑛𝑑𝑜 𝑍 = ~𝑁 0,1
28.2

169 − 179.1
𝑃 𝑌 < 169 = 𝑃(𝑍 < ) = 𝑃 𝑍 < −0,36
28.2
= 0,3594
 Para calcular las probabilidades solo necesito
conocer 𝝁, 𝛔
7. - Describir poblaciones. La distribución normal. Variabilidad de la muestra.
Comportamiento de la media muestral en muestras grandes. Ejemplos.

Cálculo de áreas bajo una curva normal Diapositiva extra 4

Si quiero un intervalo 𝑎, 𝑏 de nivel de


confianza 1 − 𝛼=0.95 (centrado en 𝜇, en
el que estén el 95% de los valores de X)
fuera quedará un 5% (2,5% a cada lado), El valor de 𝒃 en la 𝑵𝒐𝒓𝒎𝒂𝒍(𝟎, 𝟏) será 1,96
eso hace que por debajo de 𝑏 quede el
97,5%, por lo que habrá un área de 0,975.
20
8- Estimación puntual y por intervalos de la media poblacional con muestras grandes.
Error de estimación y su interpretación. Interpretación del intervalo de confianza.

¿Estimación por intervalo …de confianza?


Tenemos un 95% de
Imaginemos que hemos obtenido “buenas muestras”
una muestra cuya media muestral  dan medias, 𝐱
está a menos de 2 𝜎 𝑛 de . cerca de 

𝜎 𝜎
1,96 ≈2
𝑛 𝑛

σ σ σ σ
μ 2
n
μ
n μ μ
n
μ2
n
𝑌
𝜎 𝜎
𝑦−2 𝒚 𝑦+2 El intervalo construido
𝑛 𝑛 contiene a 
21
8- Estimación puntual y por intervalos de la media poblacional con muestras grandes.
Error de estimación y su interpretación. Interpretación del intervalo de confianza.

¿Estimación por intervalo …de confianza?


Muestra
Imaginemos
n elementos que hemos obtenido Tenemos un 5% de
una muestra cuya media muestral “muestras
está a más de 𝟐 𝝈 𝒏 de . no tan buenas”

σ σ σ σ
y
μ
μ 2
n n μ μ
n
μ2
n
El intervalo construido NO
CONTIENE A 
y 2
σ y y 2
σ
n n
22
11. Estudio estadístico de una proporción poblacional. Distribuciones Bernoulli y
Binomial. Estimación de una proporción

𝑌 𝜋 1−𝜋 𝜋−𝜋
Para muestras grandes, TCL, 𝜋 = ~𝑁𝑜𝑟𝑚𝑎𝑙 𝜇 = 𝜋, 𝜎 = →𝑍= ~𝑁𝑜𝑟𝑚𝑎𝑙(0,1)
𝑛 𝑛 𝜋 1−𝜋
𝑛

Como  = media poblacional, la podemos estimar


π(1  π)
σ mediante intervalos de confianza para la media:
n
πˆ  z1α/2  SEπˆ  π  πˆ  z1α/2  SEπˆ

𝜋 1−𝜋
𝑆𝐸𝜋 =
𝑛

π̂  
Confianza=1- 90% 95% 99%
Valor crítico=Z1-/2 1,645 1,96 2,576

Los intervalos que obtenemos con estas


expresiones son válidos SÓLO SI SE CUMPLE

nπˆ 1  πˆ   5
23
11. Estudio estadístico de una proporción poblacional. Distribuciones Bernoulli y
Binomial. Estimación de una proporción

EJERCICIO: Asma
El asma es una enfermedad inflamatoria del aparato respiratorio que provoca dificultad en la
respiración (disnea). En una revisión médica de 400 empleados de una cierta empresa se vio que
40 padecían asma.
Construye un intervalo de confianza al 95% para la proporción de empleados con asma e
interpreta el resultado

Como n=400 es grande y 400x0,1x0,9=36>5 :

I0.95  π   πˆ  1,96  SEπˆ ,πˆ  1,96  SEπˆ 


= [ 0.1 – 1.960 . 0.015, 0.1 + 1.960 . 0.015 ] = [ 0.07, 0.13 ]

Por tanto, podemos decir que, con una confianza del 95%, entre un 7% y un 13% de los empleados
de la empresa tienen asma.

Con SPSS, Analizar/estadísticos Descriptivos/ Explorar

24
11. Estudio estadístico de una proporción poblacional. Distribuciones Bernoulli y
Binomial. Estimación de una proporción

PROBLEMAS CON LA ESTIMACIÓN POR INTERVALO CUANDO 𝐧𝝅(𝟏 − 𝝅)<5


𝝅(𝟏−𝝅) 0×1
Si 𝝅 0, el Error estándar es 𝑆𝐸𝜋 = ≅ ≈0
𝑛 𝑛
y el intervalo “tradicional” resulta
I0.95  π   πˆ  1,96  SEπˆ ,πˆ  1,96  SEπˆ   0  1,96  0, 0  1,96  0  0,0

Pero, aunque no observemos ningún éxito en la muestra (o todo sean éxitos)


no podemos estar seguros de que sea así en la población,
Consideremos una enfermedad de muy baja prevalencia en cierta población
Supongamos que para estimar el porcentaje de individuos libre de la enfermedad en la población,
se toma una muestra de 75000 observaciones y sólo aparece 1 “éxito”

Sabemos que no es
así!!!!!!

25
11. Estudio estadístico de una proporción poblacional. Distribuciones Bernoulli y
Binomial. Estimación de una proporción

EDITANDO LA TABLA SPSS (Doble clic sobre ella) podemos ver más decimales, y en este caso,
PROBLEMAS CON LA ESTIMACIÓN POR INTERVALO CUANDO 𝐧𝝅(𝟏 − 𝝅)<5
como había 1 éxito y 74999 fracasos, el extremo superior del intervalo es 0,000039
𝝅(𝟏−𝝅) 0×1
Si 𝝅 0, el Error estándar es 𝑆𝐸𝜋 = ≅ ≈0
𝑛 𝑛
y el intervalo “tradicional” resulta
I0.95  π   πˆ  1,96  SEπˆ ,πˆ  1,96  SEπˆ   0  1,96  0, 0  1,96  0  0,0

Pero, aunque no observemos ningún éxito en la muestra (o todo sean éxitos)


no podemos estar seguros de que sea así en la población,
Consideremos una enfermedad de muy baja prevalencia en cierta población
Supongamos que para estimar el porcentaje de individuos libre de la enfermedad en la población,
se toma una muestra de 75000 observaciones y sólo aparece 1 “éxito”

Sabemos que no es
así!!!!!!

26
11. Estudio estadístico de una proporción poblacional. Distribuciones Bernoulli y
Binomial. Estimación de una proporción

27
27
11. Estudio estadístico de una proporción poblacional. Distribuciones Bernoulli y
Binomial. Estimación de una proporción

Existen métodos alternativos para obtener el intervalo de confianza en estos


casos.

SPSS: PRUEBAS NO PARAMÉTRICAS: INTERVALOS DE CONFIANZA DE UNA PROPORCIÓN

28
28
8- Estimación puntual y por intervalos de la media poblacional con muestras grandes.
Error de estimación y su interpretación. Interpretación del intervalo de confianza.

Interpretación del intervalo de confianza (1-=0.9)


Cada muestra da un intervalo de confianza:
 
Diversas muestras de
y  z1/2  , y  z1/2 
n n
tamaño 5

90%, de
todos los
intervalos de
confianza,
que
podríamos
hacer,
contendrían
el verdadero
valor de
=0.38
8- Estimación puntual y por intervalos de la media poblacional con muestras grandes.
Error de estimación y su interpretación. Interpretación del intervalo de confianza.

𝝈
Pero, recordemos: Radio del intervalo =𝒛𝟏−𝜶 𝟐 ∙
𝒏

Podemos disminuir la longitud del intervalo


aumentando el tamaño muestral

90%, de todos los intervalos de


confianza, que podríamos
hacer, contendrían el verdadero valor
de =0.38

=0.38

90%, de todos los intervalos de


confianza, que podríamos
Población hacer, contendrían el verdadero valor
de =0.38

n=20
8- Estimación puntual y por intervalos de la media poblacional con muestras grandes.
Error de estimación y su interpretación. Interpretación del intervalo de confianza.

Factores que afectan a la Amplitud del Intervalo

𝝈
Error=Radio del intervalo =𝒛𝟏−𝜶 𝟐 ∙ 𝒏

• Variabilidad poblacional=  A menor , menor amplitud Mayor precisión


• Tamaño muestral = n  A mayor n, menor amplitud Mayor precisión
• Nivel de confianza =(1 - )  A mayor (1 - ) , mayor z1-/2  Mayor amplitud
Menor precisión, PERO MAYOR SEGURIDAD

Un IC amplio indica poca precisión en la estimación


Un IC estrecho indica una estimación con precisión
PERO PRECISIÓN NO IMPLICA SEGURIDAD
Para obtener precisión y seguridad, como  está fijo (no depende de nosotros):
• elegimos 1 -  que nos proporcione la seguridad que nos interesa
•fijamos un Radio del intervalo (semiamplitud=Error de estimación) máximo y
•Determinamos el tamaño muestral (n) que necesitamos

31
12. Contraste de hipótesis sobre una proporción. Cálculo del tamaño muestral.

Cuando no se dispone de un estudio piloto, se utiliza una aproximación extrema,


la que supone máxima varianza (desviación típica) en la población y, por eso,
requiere la mayor cantidad de datos:
ˆ  π)
π(1 ˆ  0,5(1  0,5)  0,25

“Rollo
π̂  0,5 matemático”,
ZZZZZ…..
0,25 0,25
SEπ̂  n SE2π̂ (deseado)
n

̂ = 0.5 nos da la máxima variabilidad posible y nos proporciona una n muy


“conservadora”(segura).

Ejemplo: Asma
Supongamos que no tenemos información preliminar y queremos un error estándar de
0.01. Tomando ̂ = 0.5, tenemos:

Necesitamos estudiar 2500 empleados 32


12. Contraste de hipótesis sobre una proporción. Cálculo del tamaño muestral.

Precisión y Error en la estimación mediante un Intervalo de Confianza (1-) para 

Límite de confianza Límite de confianza


inferior Estimación puntual
superior

Margen de error inferior Margen de error superior

𝜋(1−𝜋) Ejemplo: Asma. Supongamos que queremos


El margen de error es 𝑧1−𝛼/2 realizar un estudio para poder estimar  con un
𝑛
2 error en la estimación de 0.01 con una confianza
𝑧1−𝛼/2 𝜋(1−𝜋) del 95%:
Eso nos da: 𝑛≥
𝑑2
d es el máximo error que se considera
aceptable en la estimación y z1-α/2 es el valor de
la N(0,1) para el intervalo de confianza de nivel
(1-α)
33
12. Contraste de hipótesis sobre una proporción. Cálculo del tamaño muestral.

Planificación de un estudio para estimar 


¿Qué tamaño muestral hemos de elegir para asegurar
un error estándar prefijado?
un error máximo en la estimación con una cierta confianza?

Fijamos el error estándar con que queremos trabajar 𝑆𝐸𝜋 = 𝜋(1−𝑛 𝜋)


Hacemos un estudio piloto para obtener una primera aproximación de   π̂
ˆ  π)
π(1 ˆ
A partir de 𝑆𝐸𝜋 = 𝑛 obtenemos el tamaño muestral necesario:
𝜋(1−𝜋) n 
SE 2
π̂

Ejercicio: Asma. Si se desea estimar  con un error estándar de 0.01, teniendo en cuenta
los resultados del estudio anterior, ¿cuántas observaciones hay que realizar?
Los datos del estudio anterior proporcionaban π̂=0.1 , podemos usarlo como estudio
piloto y resulta:
ˆ  π)
π(1 ˆ 0.10(1  0.10)
n  SE2 (deseado)  2
 900
π̂ 0.01
Necesitamos observar 900 empleados.
34

Vous aimerez peut-être aussi