Tema 2 - 2

Como lo veremos
Tema 2: Análisis estadístico de una población

7. Variabilidad de la muestra. Distribuciones Bernoulli y Binomial. Comportamiento
de la media muestral en muestras grandes. Algunos ejemplos. La distribución
normal.
8. Estimación puntual y por intervalos. Error de estimación y su interpretación.
Interpretación del intervalo de confianza. Estudio estadístico de una proporción
poblacional. Estimación de una proporción. Cálculo del tamaño muestral
mediante intervalos de confianza
9. Contraste de hipótesis. Contrastes unilaterales y bilaterales. Contrastes de
significatividad y p-valor. Error de Tipo I y de Tipo II. Acotación de los errores
para calcular el tamaño muestral.. Contrastes sobre una proporción
10.Estimación puntual y por intervalos de la media poblacional con muestras
grandes Estimación de la media poblacional en muestras pequeñas. Distribución
t de Student. Intervalos de confianza.
11.Contrastes de hipótesis sobre la media de una población con muestras grandes.
Test t de Student para una muestra. Solución al contraste bilateral. Solución a
los contrastes unilaterales.
12.Condiciones de aplicabilidad del test t de Student para una muestra. Contrastes
de normalidad. Alternativas no paramétricas: test de los signos y test de
Wilcoxon. 1
Tema 2: Análisis estadístico de una población
7. Variabilidad de la muestra. Comportamiento de la media muestral en muestras
grandes. La distribución normal. Algunos ejemplos.
8. Estimación puntual y por intervalos de la media poblacional con muestras
grandes. Error de estimación y su interpretación. Interpretación del intervalo de
confianza.
9. Contrastes de hipótesis sobre la media de una población con muestras grandes.
Contrastes unilaterales y bilaterales. Contrastes de significatividad y p-valor.
10.Error de Tipo I y de Tipo II. Acotación de los errores para calcular el tamaño
muestral. Cálculo del tamaño muestral mediante intervalos de confianza.
11.Estudio estadístico de una proporción poblacional. Distribuciones Bernoulli y
Binomial. Estimación de una proporción.
12.Contraste de hipótesis sobre una proporción. Cálculo del tamaño muestral.
13.Estimación de la media poblacional en muestras pequeñas. Distribución t de
Student. Intervalos de confianza.
14.Test t de Student para una muestra. Solución al contraste bilateral. Solución a
los contrastes unilaterales.
15.Condiciones de aplicabilidad del test t de Student para una muestra. Contrastes
de normalidad. Alternativas no paramétricas: test de los signos y test de
Wilcoxon.
2
8- Estimación puntual y por intervalos de la media poblacional con muestras grandes.
Error de estimación y su interpretación. Interpretación del intervalo de confianza.
Lección 7 conocíamos la población podíamos

“adivinar” o “predecir” cómo sería la muestra
TEMA 1 teníamos una

PROBABILIDAD muestra. No conocíamos la
población
POBLACIÓN INFERENCIA
ESTADÍSTICA MUESTRA
Lección 8 SÓLO conocemos la muestra PERO vamos a

intentar “predecir” cómo es la población,
A PESAR DE QUE SEGUIRÁ SIENDO DESCONOCIDA
CUANDO TERMINE EL PROCESO DE INFERENCIA
3
Inferencia Estadística: proceso de obtener conclusiones válidas para una población a

partir de una muestra aleatoria extraída de dicha población.
¿Cómo hacemos inferencia estadística?
Y  variable Población Estadística Muestreo

respuesta Aleatorio
 𝝅 Muestra Muestra
Inferencia n elementos
𝑦𝑠𝑝
Parámetros: media, desviación típica,

proporción, poblacionales. Estadísticos : media, desviación típica,
DESCONOCIDOS proporción muestrales = estimadores.
CONOCIDOS AL VER LA MUESTRA
Inferencia Estadística: proceso de obtener conclusiones válidas para una población a

partir de una muestra aleatoria extraída de dicha población.
¿Cuáles son los procedimientos básicos

de Inferencia Estadística?
Estimación puntual a partir del valor de los

estadísticos
Estimación
(aproximación del valor de un parámetro) Estimación por intervalos a partir de la
distribución en el muestreo de los estadísticos.
Contraste de Hipótesis
(análisis de teorías sobre los posibles valores de un parámetro)
¿Estimación puntual?
Estimación Aproximación del valor DESCONOCIDO de un parámetro POBLACIONAL

• Estimación puntual: Aproxima el parámetro poblacional por el valor del estadístico
correspondiente, calculado a partir de la muestra.
Si el parámetro es la media poblacional  se estima por 𝑦=𝜇
Si el parámetro es la varianza poblacional  se estima por s 2  ˆ 2

Si el parámetro es la Desviación Típica poblacional  se estima por s  ˆ
Si el parámetro es la proporción poblacional  se estima por p  ˆ
Quién es la media poblacional? 60,0%
Porcentaje
Distribución Bernoulli () 40,0%
= Probabilidad de que un individuo presente la 20,0%
0,0%
característica (infección bronquial, fractura de cadera, ,00
ber025
1,00
hombres …)
100= % de presencia de la característica en la

1=Presencia de la característica
0=Ausencia de la característica
población
Caso especial: “PREVALENCIA”
Conozco la población si puedo calcular la probabilidad de sus valores:

𝑃 𝑌 = 1 = 𝜋, 𝑃 𝑌 = 0 = 1 − 𝜋  Solo necesito conocer 𝜋
Objetivo: Aprender sobre 

Teniendo en cuenta que la media de los
valores de la variable Bernoulli en toda la 𝜋=𝑝=𝑦
Población es  Proporción de valores 1 en la muestra Media muestral
Parece natural aproximar (estimar) la media poblacional, , por la media muestral, 𝑌

Pero, ¿ podemos estar seguros de que es una buena aproximación?
En la lección 7 𝜎𝑌
𝜇𝑌 = 𝜇𝑌 vimos que SIEMPRE, sea grande 𝜎𝑌 =
𝑛
o pequeña la muestra,
La media muestral proporciona valores Cuantas más observaciones tenemos, más se

alrededor de la media poblacional concentran los valores posibles de la media
muestral alrededor del de la media poblacional
8
11. Estudio estadístico de una proporción poblacional. Distribuciones Bernoulli y
Binomial. Estimación de una proporción
EJEMPLO: Fumadores
Consideremos una población con una
proporción desconocida () de
individuos que son fumadores.
Supongamos que la población

tiene 100 individuos y podemos
observar de cada individuo
selecconadom si es fumador ( )
o es no fumador ( ).
Elegimos dos muestras aleatorias
de tamaño 5.
Cómo podemos hacerlo?
Individuos de la Muestra 2
53, 31, 80, 21, 38
Individuos de la Muestra 1:
10 34, 61, 16, 84
9
Ejemplo: Fumadores (n = 5)
MUESTRAS DIFERENTES PUEDEN
Muestra 1: 1 fumador DAR DISTINTAS ESTIMACIONES DEL
MISMO PARÁMETRO .
Muestra 2: 3 fumadores
varía de muestra en muestra con un error estándar
Desviación típica muestral de 𝜋 = 𝑦
10
EJERCICIO: Asma
El asma es una enfermedad inflamatoria del aparato respiratorio que provoca dificultad en la
respiración (disnea). En una revisión médica de 400 empleados de una cierta empresa se vio que
40 padecían asma. Estima el porcentaje de empleados de la empresa que padecen asma y
proporciona una medida del error de esta estimación
40 ˆ  π)
π(1 ˆ 0.1 0.9
ˆ   0.1 SE ˆ    0.015
400 n 400
¿Cómo analizamos una muestra de datos categóricos con SPSS?

3º Pedimos la tabla de frecuencias, la Recordamos que 𝑦 = 𝜋
media y el error estándar
11
Si siempre se comporta “razonablemente”¿Qué pasa si la muestra es grande?

Que podemos conocer su distribución y trabajar con ella: Teorema Central del Límite.
El teorema central del límite (TCL) establece que:

Sea Y1,Y2,..,Yn una muestra aleatoria de una población con media  y desviación típica .
Entonces, para valores de n grandes, la 𝑌 (media muestral de Y1,Y2,..,Yn ) toma valores que
siguen aproximadamente una distribución Normal con media  y desviación típica 𝝈 𝒏 .
¿A partir de qué valor de n (¿grande?)
podemos aplicar el TCL? Lección 7
RESPUESTA: Depende de la forma de la

El TCL es fundamental porque se puede
distribución de la población:
aplicar en la práctica cuando la
 Si es Normal Cualquier n vale. forma de la distribución de la
Leve desviación de Normalidad n>15 población se desconoce.
Gran desviación de Normalidad n>30
Vamos a desarrollar el método de estimación por intervalos suponiendo que la

media muestral se comporta como una distribución Normal, ya sea porque la
población original era Normal o porque el tamaño muestral es grande 12
¿Estimación por intervalo …de confianza?
◦Estimación por intervalo de confianza: Aproximamos la característica de la población ()

por un INTERVALO [a, b], que tiene asociado un NIVEL DE CONFIANZA 1-
◦Los cálculos están basados en LA muestra observada en la realización del experimento.
◦Distintas muestras darían distintos extremos [a, b]  los extremos del intervalo SON, en
realidad, VARIABLES ALEATORIAS (varían con el muestreo)
◦El método de estimación por intervalo garantiza que el 100(1- )% de las muestras,
que pueden aparecer al hacer el muestreo, proporcionan límites, [a, b], entre los
cuales se encuentra el valor VERDADERO y DESCONOCIDO DEL PARÁMETRO QUE
INTENTAMOS ESTIMAR
IDEA INTUITIVA DE LA CONSTRUCCIÓN DE UN INTERVALO DE CONFIANZA La Figura es un dibujo
de un hombre invisible paseando con su perro. El perro, que es visible, lleva una correa, invisible,
de muelle. La tensión en el resorte es tal que: el perro está a menos de 2 medidas (errores
estándar) del hombre, el 95% del tiempo.
Podemos ver al perro, pero nos gustaría saber dónde está el hombre.
Como la distancia entre ellos es, generalmente, menor que 2 SE,
podemos tomar el intervalo perro  2.SE como un intervalo que
típicamente incluye al hombre. Podríamos decir, con una
Hombre invisible paseando con su perro confianza del 95%, que el hombre está en este intervalo.
2*SE
?
?
𝒚
?
IDEA INTUITIVA DE LA CONSTRUCCIÓN DE UN INTERVALO DE CONFIANZA La Figura es un dibujo
de un hombre invisible paseando con su perro. El perro, que es visible, lleva una correa, invisible,
de muelle. La tensión en el resorte es tal que: el perro está a menos de 2 medidas (errores
estándar) del hombre, el 95% del tiempo.
Podemos ver al perro, pero nos gustaría saber dónde está el hombre.
Como la distancia entre ellos es, generalmente, menor que 2 SE, podemos tomar el intervalo
[perro - 2.SE, perro + 2.SE] como un intervalo que típicamente incluye al hombre. Podríamos decir,
con una confianza del 95%, que el hombre está en este intervalo.
Construcción del Intervalo de Confianza al 95% para 

𝜎 𝜎
(ver lección 7 para seguir este razonamiento) 1,96 ≈2
Si la muestra viene de una distribución Normal 𝑛 𝑛
 o si el tamaño muestral es bastante grande (TCL) ,
sabemos que la media muestral
 se distribuye 𝑁(𝜇, 𝜎 𝑛)
El 95% de sus valores distan de  menos de
2 desviaciones : 2𝝈 𝑛
Un 95% de las muestras de tamaño n

proporcionarán una media muestral
cuya distancia a la media poblacional no
2σ 2σ
será superior a 2𝜎 𝑛 μ μ μ 𝑌
n n
Para esas muestras (el 95% de las posibles) , se cumple que el intervalo
𝜎 𝜎
𝐼𝐶0,95 𝜇 = 𝑦 − 1,96 , 𝑦 + 1,96
𝑛 𝑛
contiene al verdadero valor de la media poblacional, es decir .
15
Las 4 diapositivas (Extra) siguientes incluyen la explicación de porqué el

radio del intervalo al 95% se obtiene multiplicando el Error Estándar por
1,96.
No hay que aprenderlo, nunca haremos el cálculo.
Sólo pretenden recordar las contestaciones a las preguntas que

surgieron en clase:
• ¿Qué es Z?La letra con que representamos la N(0,1) o Normal

estándar, también se llama Normal tipificada.
• ¿Por qué 1,96? Eso lo explican las diapositivas que siguen.
• ¿Siempre es 1,96? No, depende del nivel de confianza, 1,96 es

para el 95%
• ¿Quién elige el nivel de confianza? El investigador. Depende de la

seguridad con que quiera dar los resultados.
16
7. Variabilidad de la muestra. Comportamiento de la media muestral en muestras grandes.
La distribución normal. Algunos ejemplos.
Diapositiva extra 1
Función de densidad de la Normal
f(X) Recordemos que en la
lección 7 comentamos
que la densidad Normal
X no es integrable
2
 1   x  
1    
f ( x)  e 2  
 2
f(x)=Función de densidad de la variable X En una distribución Normal, aproximadamente

=3.14159; e = 2.71828 el 95% de los valores están a menos de 2
=Media poblacional. desviaciones típicas de la media
=Desviación típica de la población.
x=Valor de la variable aleatoria (- < X <)
Esa densidad no es integrable,

las probabilidades (áreas) se
obtienen con cálculo numérico
¿Cómo? Ver las
siguientes diapositivas 17
7. - Describir poblaciones. La distribución normal. Variabilidad de la muestra.
Comportamiento de la media muestral en muestras grandes. Ejemplos.
Cálculo de áreas bajo una curva normal Diapositiva extra 2
¡La probabilidad es el
área bajo la curva!
18
Diapositiva extra 3
¿Cómo se calculan las probabilidades en una Normal?
𝐸𝑗𝑒𝑚𝑝𝑙𝑜: 𝐸𝑙 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑙𝑒𝑠𝑡𝑒𝑟𝑜𝑙 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑛𝑓𝑒𝑟𝑚𝑜𝑠 𝑑𝑒 𝑢𝑛 ℎ𝑜𝑠𝑝𝑖𝑡𝑎𝑙 𝑌 𝑠𝑖𝑔𝑢𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑁𝑜𝑟𝑚𝑎𝑙 𝑐𝑜𝑛
𝑢𝑛𝑎 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 179,1 𝑚𝑔 𝑑𝐿 𝑦 𝑢𝑛𝑎 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑡í𝑝𝑖𝑐𝑎 𝑑𝑒 28,2 𝑚𝑔 𝑑𝐿 . 𝑌~𝑁𝑜𝑟𝑚𝑎𝑙 𝜇 = 179.1, 𝜎 = 28.2
¿ 𝑄𝑢é 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑑𝑒 𝑒𝑛𝑓𝑒𝑟𝑚𝑜𝑠 𝑡𝑖𝑒𝑛𝑒 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑙𝑒𝑠𝑡𝑒𝑟𝑜𝑙 𝑚𝑒𝑛𝑜𝑟 𝑎 169 𝑚𝑔 𝑑𝐿?
𝑌 − 179.1
𝑇𝑖𝑝𝑖𝑓𝑖𝑐𝑎𝑛𝑑𝑜 𝑍 = ~𝑁 0,1
28.2
169 − 179.1
𝑃 𝑌 < 169 = 𝑃(𝑍 < ) = 𝑃 𝑍 < −0,36
28.2
= 0,3594
 Para calcular las probabilidades solo necesito
conocer 𝝁, 𝛔
Cálculo de áreas bajo una curva normal Diapositiva extra 4
Si quiero un intervalo 𝑎, 𝑏 de nivel de

confianza 1 − 𝛼=0.95 (centrado en 𝜇, en
el que estén el 95% de los valores de X)
fuera quedará un 5% (2,5% a cada lado), El valor de 𝒃 en la 𝑵𝒐𝒓𝒎𝒂𝒍(𝟎, 𝟏) será 1,96
eso hace que por debajo de 𝑏 quede el
97,5%, por lo que habrá un área de 0,975.
20

Tenemos un 95% de
Imaginemos que hemos obtenido “buenas muestras”
una muestra cuya media muestral  dan medias, 𝐱
está a menos de 2 𝜎 𝑛 de . cerca de 
𝜎 𝜎
1,96 ≈2
𝑛 𝑛
σ σ σ σ
μ 2
n
μ
n μ μ
n
μ2
n
𝑌
𝜎 𝜎
𝑦−2 𝒚 𝑦+2 El intervalo construido
𝑛 𝑛 contiene a 
21

Muestra
Imaginemos
n elementos que hemos obtenido Tenemos un 5% de
una muestra cuya media muestral “muestras
está a más de 𝟐 𝝈 𝒏 de . no tan buenas”
σ σ σ σ
y
μ
μ 2
n n μ μ
n
μ2
n
El intervalo construido NO
CONTIENE A 
y 2
σ y y 2
σ
n n
22
𝑌 𝜋 1−𝜋 𝜋−𝜋
Para muestras grandes, TCL, 𝜋 = ~𝑁𝑜𝑟𝑚𝑎𝑙 𝜇 = 𝜋, 𝜎 = →𝑍= ~𝑁𝑜𝑟𝑚𝑎𝑙(0,1)
𝑛 𝑛 𝜋 1−𝜋
𝑛
Como  = media poblacional, la podemos estimar

π(1  π)
σ mediante intervalos de confianza para la media:
n
πˆ  z1α/2  SEπˆ  π  πˆ  z1α/2  SEπˆ
𝜋 1−𝜋
𝑆𝐸𝜋 =
𝑛
π̂  
Confianza=1- 90% 95% 99%
Valor crítico=Z1-/2 1,645 1,96 2,576
Los intervalos que obtenemos con estas

expresiones son válidos SÓLO SI SE CUMPLE
nπˆ 1  πˆ   5
23
EJERCICIO: Asma
El asma es una enfermedad inflamatoria del aparato respiratorio que provoca dificultad en la
respiración (disnea). En una revisión médica de 400 empleados de una cierta empresa se vio que
40 padecían asma.
Construye un intervalo de confianza al 95% para la proporción de empleados con asma e
interpreta el resultado
Como n=400 es grande y 400x0,1x0,9=36>5 :
I0.95  π   πˆ  1,96  SEπˆ ,πˆ  1,96  SEπˆ 

= [ 0.1 – 1.960 . 0.015, 0.1 + 1.960 . 0.015 ] = [ 0.07, 0.13 ]
Por tanto, podemos decir que, con una confianza del 95%, entre un 7% y un 13% de los empleados
de la empresa tienen asma.
Con SPSS, Analizar/estadísticos Descriptivos/ Explorar
24
PROBLEMAS CON LA ESTIMACIÓN POR INTERVALO CUANDO 𝐧𝝅(𝟏 − 𝝅)<5

𝝅(𝟏−𝝅) 0×1
Si 𝝅 0, el Error estándar es 𝑆𝐸𝜋 = ≅ ≈0
𝑛 𝑛
y el intervalo “tradicional” resulta
I0.95  π   πˆ  1,96  SEπˆ ,πˆ  1,96  SEπˆ   0  1,96  0, 0  1,96  0  0,0
Pero, aunque no observemos ningún éxito en la muestra (o todo sean éxitos)

no podemos estar seguros de que sea así en la población,
Consideremos una enfermedad de muy baja prevalencia en cierta población
Supongamos que para estimar el porcentaje de individuos libre de la enfermedad en la población,
se toma una muestra de 75000 observaciones y sólo aparece 1 “éxito”
Sabemos que no es
así!!!!!!
25
EDITANDO LA TABLA SPSS (Doble clic sobre ella) podemos ver más decimales, y en este caso,
PROBLEMAS CON LA ESTIMACIÓN POR INTERVALO CUANDO 𝐧𝝅(𝟏 − 𝝅)<5
como había 1 éxito y 74999 fracasos, el extremo superior del intervalo es 0,000039
𝝅(𝟏−𝝅) 0×1
Si 𝝅 0, el Error estándar es 𝑆𝐸𝜋 = ≅ ≈0
𝑛 𝑛
y el intervalo “tradicional” resulta
I0.95  π   πˆ  1,96  SEπˆ ,πˆ  1,96  SEπˆ   0  1,96  0, 0  1,96  0  0,0
Pero, aunque no observemos ningún éxito en la muestra (o todo sean éxitos)

no podemos estar seguros de que sea así en la población,
Consideremos una enfermedad de muy baja prevalencia en cierta población
Supongamos que para estimar el porcentaje de individuos libre de la enfermedad en la población,
se toma una muestra de 75000 observaciones y sólo aparece 1 “éxito”
Sabemos que no es
así!!!!!!
26
27
27
Existen métodos alternativos para obtener el intervalo de confianza en estos

casos.
SPSS: PRUEBAS NO PARAMÉTRICAS: INTERVALOS DE CONFIANZA DE UNA PROPORCIÓN
28
28
Interpretación del intervalo de confianza (1-=0.9)

Cada muestra da un intervalo de confianza:
 
Diversas muestras de
y  z1/2  , y  z1/2 
n n
tamaño 5
90%, de
todos los
intervalos de
confianza,
que
podríamos
hacer,
contendrían
el verdadero
valor de
=0.38
𝝈
Pero, recordemos: Radio del intervalo =𝒛𝟏−𝜶 𝟐 ∙
𝒏
Podemos disminuir la longitud del intervalo

aumentando el tamaño muestral
90%, de todos los intervalos de

confianza, que podríamos
hacer, contendrían el verdadero valor
de =0.38
=0.38
90%, de todos los intervalos de

confianza, que podríamos
Población hacer, contendrían el verdadero valor
de =0.38
n=20
Factores que afectan a la Amplitud del Intervalo
𝝈
Error=Radio del intervalo =𝒛𝟏−𝜶 𝟐 ∙ 𝒏
• Variabilidad poblacional=  A menor , menor amplitud Mayor precisión

• Tamaño muestral = n  A mayor n, menor amplitud Mayor precisión
• Nivel de confianza =(1 - )  A mayor (1 - ) , mayor z1-/2  Mayor amplitud
Menor precisión, PERO MAYOR SEGURIDAD
Un IC amplio indica poca precisión en la estimación

Un IC estrecho indica una estimación con precisión
PERO PRECISIÓN NO IMPLICA SEGURIDAD
Para obtener precisión y seguridad, como  está fijo (no depende de nosotros):
• elegimos 1 -  que nos proporcione la seguridad que nos interesa
•fijamos un Radio del intervalo (semiamplitud=Error de estimación) máximo y
•Determinamos el tamaño muestral (n) que necesitamos
31
12. Contraste de hipótesis sobre una proporción. Cálculo del tamaño muestral.
Cuando no se dispone de un estudio piloto, se utiliza una aproximación extrema,

la que supone máxima varianza (desviación típica) en la población y, por eso,
requiere la mayor cantidad de datos:
ˆ  π)
π(1 ˆ  0,5(1  0,5)  0,25

“Rollo
π̂  0,5 matemático”,
ZZZZZ…..
0,25 0,25
SEπ̂  n SE2π̂ (deseado)
n
̂ = 0.5 nos da la máxima variabilidad posible y nos proporciona una n muy

“conservadora”(segura).
Ejemplo: Asma
Supongamos que no tenemos información preliminar y queremos un error estándar de
0.01. Tomando ̂ = 0.5, tenemos:
Necesitamos estudiar 2500 empleados 32

Precisión y Error en la estimación mediante un Intervalo de Confianza (1-) para 
Límite de confianza Límite de confianza

inferior Estimación puntual
superior
Margen de error inferior Margen de error superior
𝜋(1−𝜋) Ejemplo: Asma. Supongamos que queremos

El margen de error es 𝑧1−𝛼/2 realizar un estudio para poder estimar  con un
𝑛
2 error en la estimación de 0.01 con una confianza
𝑧1−𝛼/2 𝜋(1−𝜋) del 95%:
Eso nos da: 𝑛≥
𝑑2
d es el máximo error que se considera
aceptable en la estimación y z1-α/2 es el valor de
la N(0,1) para el intervalo de confianza de nivel
(1-α)
33
Planificación de un estudio para estimar 

¿Qué tamaño muestral hemos de elegir para asegurar
un error estándar prefijado?
un error máximo en la estimación con una cierta confianza?
Fijamos el error estándar con que queremos trabajar 𝑆𝐸𝜋 = 𝜋(1−𝑛 𝜋)

Hacemos un estudio piloto para obtener una primera aproximación de   π̂
ˆ  π)
π(1 ˆ
A partir de 𝑆𝐸𝜋 = 𝑛 obtenemos el tamaño muestral necesario:
𝜋(1−𝜋) n 
SE 2
π̂
Ejercicio: Asma. Si se desea estimar  con un error estándar de 0.01, teniendo en cuenta
los resultados del estudio anterior, ¿cuántas observaciones hay que realizar?
Los datos del estudio anterior proporcionaban π̂=0.1 , podemos usarlo como estudio
piloto y resulta:
ˆ  π)
π(1 ˆ 0.10(1  0.10)
n  SE2 (deseado)  2
 900
π̂ 0.01
Necesitamos observar 900 empleados.
34

Tema 2 - 2

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Tema 2 - 2

Transféré par

Droits d'auteur :

Formats disponibles

Como lo veremos

Tema 2: Análisis estadístico de una población

Lección 7 conocíamos la población podíamos

TEMA 1 teníamos una

Lección 8 SÓLO conocemos la muestra PERO vamos a

Inferencia Estadística: proceso de obtener conclusiones válidas para una población a

¿Cómo hacemos inferencia estadística?

Y  variable Población Estadística Muestreo

Parámetros: media, desviación típica,

Inferencia Estadística: proceso de obtener conclusiones válidas para una población a

¿Cuáles son los procedimientos básicos

Estimación puntual a partir del valor de los

Estimación Aproximación del valor DESCONOCIDO de un parámetro POBLACIONAL

Si el parámetro es la media poblacional  se estima por 𝑦=𝜇

Si el parámetro es la varianza poblacional  se estima por s 2  ˆ 2

Quién es la media poblacional? 60,0%

= Probabilidad de que un individuo presente la 20,0%

100= % de presencia de la característica en la

Conozco la población si puedo calcular la probabilidad de sus valores:

Objetivo: Aprender sobre 

Parece natural aproximar (estimar) la media poblacional, , por la media muestral, 𝑌

La media muestral proporciona valores Cuantas más observaciones tenemos, más se

Supongamos que la población

varía de muestra en muestra con un error estándar

Desviación típica muestral de 𝜋 = 𝑦

¿Cómo analizamos una muestra de datos categóricos con SPSS?

Si siempre se comporta “razonablemente”¿Qué pasa si la muestra es grande?

El teorema central del límite (TCL) establece que:

RESPUESTA: Depende de la forma de la

Vamos a desarrollar el método de estimación por intervalos suponiendo que la

¿Estimación por intervalo …de confianza?

◦Estimación por intervalo de confianza: Aproximamos la característica de la población ()

Construcción del Intervalo de Confianza al 95% para 

Un 95% de las muestras de tamaño n

Las 4 diapositivas (Extra) siguientes incluyen la explicación de porqué el

No hay que aprenderlo, nunca haremos el cálculo.

Sólo pretenden recordar las contestaciones a las preguntas que

• ¿Qué es Z?La letra con que representamos la N(0,1) o Normal

• ¿Por qué 1,96? Eso lo explican las diapositivas que siguen.

• ¿Siempre es 1,96? No, depende del nivel de confianza, 1,96 es

• ¿Quién elige el nivel de confianza? El investigador. Depende de la

f(x)=Función de densidad de la variable X En una distribución Normal, aproximadamente

Esa densidad no es integrable,

Cálculo de áreas bajo una curva normal Diapositiva extra 2

¿ 𝑄𝑢é 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑑𝑒 𝑒𝑛𝑓𝑒𝑟𝑚𝑜𝑠 𝑡𝑖𝑒𝑛𝑒 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑙𝑒𝑠𝑡𝑒𝑟𝑜𝑙 𝑚𝑒𝑛𝑜𝑟 𝑎 169 𝑚𝑔 𝑑𝐿?

Cálculo de áreas bajo una curva normal Diapositiva extra 4

Si quiero un intervalo 𝑎, 𝑏 de nivel de

¿Estimación por intervalo …de confianza?

¿Estimación por intervalo …de confianza?

Como  = media poblacional, la podemos estimar

Los intervalos que obtenemos con estas

Como n=400 es grande y 400x0,1x0,9=36>5 :

I0.95  π   πˆ  1,96  SEπˆ ,πˆ  1,96  SEπˆ 

Con SPSS, Analizar/estadísticos Descriptivos/ Explorar

PROBLEMAS CON LA ESTIMACIÓN POR INTERVALO CUANDO 𝐧𝝅(𝟏 − 𝝅)<5

Pero, aunque no observemos ningún éxito en la muestra (o todo sean éxitos)

Pero, aunque no observemos ningún éxito en la muestra (o todo sean éxitos)

Existen métodos alternativos para obtener el intervalo de confianza en estos

SPSS: PRUEBAS NO PARAMÉTRICAS: INTERVALOS DE CONFIANZA DE UNA PROPORCIÓN

Interpretación del intervalo de confianza (1-=0.9)

Podemos disminuir la longitud del intervalo

90%, de todos los intervalos de

90%, de todos los intervalos de