Académique Documents
Professionnel Documents
Culture Documents
.
Considere los siguientes estimadores para :
( )
a) Determine cules son insesgados:
Debemos analizar en cada caso si se cumple que:
()
Consideremos
) (
[(
) (
)]
[ ]
Luego, resulta que
es insesgado.
Consideremos
()
) (
( )
( )
(
( )
[(
) (
)]
( )
( )
Con lo cual resulta que
es insesgado.
Consideremos
Sabemos que (
) (
) , luego
es insesgado.
b) Determine la eficiencia relativa de
respecto a
Para ello debemos analizar si (
) (
) y (
) (
)
Introduccin al Anlisis Estadstico 2014
Ganga, Leonel Pgina 2
(
) (
) (
[(
) (
)]
Luego como se tiene que:
(
)
Con lo cual se prueba que
es ms eficiente que
Analicemos si (
) (
)
(
) *
()
()
((
)
(
))
()
()
Actividad 2:
Con los datos proporcionados en la Encuesta Permanente de Hogares (EPH), los que se
encuentran tabulados en el archivo base EPH.xls resuelva las siguientes consignas:
a) Estime con un 99 % de confianza los ingresos mensuales (SUELDO) promedio
de los jefes de hogar varones y mujeres (por separado y conjunto). Considere
que se aplic un muestreo estratificado con afijacin proporcional en una
poblacin de 10.000 jefes de hogar. Corrobore manualmente los resultados
obtenidos con el software.
Ingresos mensuales PROMEDIO (sueldo) de varones, mujeres y ambos
99% de confianza
Muestreo estratificado con afijacin proporcional
Frecuencias absolutas
SEXO Total Porcentaje
Mujer 54 54,00
Varn 46 46,00
Total 100 100,00
Introduccin al Anlisis Estadstico 2014
Ganga, Leonel Pgina 3
Frecuencias relativas al total
SEXO Total Porcentaje
Mujer 0,54 0,54
Varn 0,46 0,46
Total 1,00 1,00
()
()
()
(
()
) (
) (
)
(
) () ( )
(
) ( ) ( )
Medidas resumen
SEXO Variable n Media D.E. Var(n-1) E.E. Mn. Mx.
Mujer SUELDO 54 580,00 405,58 164498,11 55,19 0,00 2000,00
Varn SUELDO 46 678,70 545,04 297073,82 80,36 0,00 2200,00
Introduccin al Anlisis Estadstico 2014
Ganga, Leonel Pgina 4
(
) ( )
(
)
(
) ( )
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
()
() [ ]
(
)
(
) [ ]
(
)
(
) [ ]
Resultados del Software
Muestreo estratificado
Estratos Variable N n Media E.E. LI(99)
LS(99) VR
Mujer SUELDO 5400 54 580,00 54,92 438,55
721,45 0,01
Varn SUELDO 4600 46 678,70 79,96 472,73
884,66 0,01
Todos SUELDO 10000 100 625,40 47,25 503,70
747,10 0,01
Introduccin al Anlisis Estadstico 2014
Ganga, Leonel Pgina 5
b) Existen evidencias para apoyar la hiptesis de que el nmero promedio de
horas trabajadas (HS.TRA) en la semana es significativamente distinto de 31
horas? Considere un nivel de significacin del 0,05. En caso de corresponder
construya una estimacin por intervalo del 95 % e interprete. Qu supuesto/s
debe hacer para aplicar la prueba? Evale si se cumplen. Plantee las hiptesis de
trabajo y el estadstico de prueba.
Prueba t para una media
Valor de la media bajo la hiptesis nula: 31
Variable n Media DE LI(95) LS(95) T p(Bilateral)
HS.TRA 100 34,04 11,42 31,77 36,31 2,66 0,0091
Supuestos de la prueba t para una media:
Para poder aplicar la prueba t debemos tener en cuenta que se deben cumplir los
siguientes supuestos:
Siempre que la poblacin provenga de una distribucin normal (muestra
pequea)
La varianza
sea desconocida
Estadstico de prueba:
La varianza poblacional es desconocida, y se trabaja en el estadstico a partir de la
varianza de los datos de la muestra. En este caso el tamao de muestra es de
con lo cual podramos aplicar el estadstico de la distribucin normal pero el Infostat
trabaja por defecto con el test t para una muestra.
Test de Hiptesis para la media
Tipo de contraste: Bilateral
Planteo de la prueba:
Introduccin al Anlisis Estadstico 2014
Ganga, Leonel Pgina 6
( )
( )
( )
Como
)
Donde:
Test de Hiptesis para la diferencia de medias
Tipo de contraste: Bilateral
Planteo de la prueba:
Introduccin al Anlisis Estadstico 2014
Ganga, Leonel Pgina 7
()
()
( )( ) ( )( )
)
()
)
()
Como
()
se rechaza la hiptesis nula, luego existen
diferencias significativas en las horas promedio trabajadas entre hombres y mujeres.
Prueba T para muestras Independientes
Clasific SEXO
Variable HS.TRA
Grupo 1 {Mujer}
Grupo 2 {Varn}
n(1) 54
n(2) 46
Media(1) 31,52
Media(2) 37,00
Media(1)-Media(2) -5,48
LI(95) -9,92
LS(95) -1,05
Var(1) 105,80
Var(2) 145,73
pHomVar 0,2620
T -2,45
gl 98
p-valor 0,0160
prueba Bilateral
Intervalo de confianza para la diferencia de medias:
Introduccin al Anlisis Estadstico 2014
Ganga, Leonel Pgina 8
Luego con un 95% de confianza, se evidencia que la diferencia de medias en horas
trabajadas es negativa lo cual implica que la media de horas trabajadas del grupo de
varones es mayor que la media de horas trabajadas del grupo de mujeres.
d) Pruebe si existen diferencias significativas en la proporcin de solteros entre
varones y mujeres. Considere un nivel de significacin del 0,05. Plantee las
hiptesis de trabajo y el estadstico de prueba.
Prueba de Hiptesis para la Diferencia de Proporciones
Supuestos:
Poblaciones dicotmicas (xito y fracaso)
Ensayos binomiales
Poblaciones normales e independientes
En nuestra base de datos tenemos un total de 100 datos referidos a 54 correspondiente a
mujeres y 46 correspondiente a hombres, para cada uno de los grupos se determin la
siguiente cantidad de solteros:
Mujeres solteras: 22
Hombres solteros: 25
Con lo cual las proporciones estimadas en funcin de las muestras son las siguientes:
( )
( )
Estadstico de prueba:
)
( ) (
)
( )
Donde (estimacin ponderada de la proporcin poblacional)
En nuestro caso el estadstico sera:
Introduccin al Anlisis Estadstico 2014
Ganga, Leonel Pgina 9
)
( ) (
Como
Tablas de contingencia
Frecuencias absolutas
En columnas:SEXO
LEER Mujer Varn Total
No 6 4 10
Si 48 42 90
Total 54 46 100
Frecuencias esperadas bajo independencia
En columnas:SEXO
LEER Mujer Varn Total
No 5,40 4,60 10,00
Si 48,60 41,40 90,00
Total 54,00 46,00 100,00
Estadstico Valor gl p
Chi Cuadrado Pearson 0,16 1 0,6882
Chi Cuadrado MV-G2 0,16 1 0,6870
Irwin-Fisher bilateral 0,07 0,7496
Coef.Conting.Cramer 0,03
Coef.Conting.Pearson 0,04
Coeficiente Phi 0,04
Introduccin al Anlisis Estadstico 2014
Ganga, Leonel Pgina 10
Cocientes de chance (odds ratio)
Estadstico Estim LI 95% LS 95%
Odds Ratio 1/2 1,31 0,37 4,68
Odds Ratio 2/1 0,76 0,21 2,71
A partir de las frecuencias absolutas y esperadas, calculamos el estadstico de prueba:
( )
( )
( )
( )
Este valor debemos compararlo con el percentil de la distribucin
con (2-1)(2-1)=1
grados de libertad
()
Como el valor del estadstico es inferior al valor crtico, se concluye que no se
rechaza la hiptesis nula, es decir, efectivamente las variables SEXO y LEER son
independientes.
f) Pruebe si el nmero de habitaciones se ajusta a una distribucin Poisson.
Considere un nivel de significacin del 0,05. Plantee las hiptesis de trabajo y el
estadstico de prueba.
Tablas de frecuencias
Variable Clase FA
HABIT 1 9
HABIT 2 27
HABIT 3 31
HABIT 4 19
HABIT 5 10
HABIT 6 3
HABIT 7 0
HABIT 8 0
HABIT 9 1
Tablas de frecuencias
Ajuste: Poisson con estimacin de parmetros: Lambda= 3,09000
Variable Clase MC FA FR E(FA) E(FR) Chi-Cuadrado p
HABIT 1 1 9 0,09 18,61 0,19 4,96
HABIT 2 2 27 0,27 21,72 0,22 6,24
HABIT 3 3 31 0,31 22,37 0,22 9,57
HABIT 4 4 19 0,19 17,28 0,17 9,74
Introduccin al Anlisis Estadstico 2014
Ganga, Leonel Pgina 11
HABIT 5 5 10 0,10 10,68 0,11 9,78
HABIT 6 6 3 0,03 5,50 0,06 10,92
HABIT 7 7 0 0,00 2,43 0,02 13,35
HABIT 8 8 0 0,00 0,94 0,01 14,29
HABIT 9 9 1 0,01 0,46 4,6E-03 14,93 0,0370
Prueba Chi Cuadrado de Bondad de Ajuste
Planteo de la prueba:
A partir de las frecuencias absolutas y esperadas bajo el modelo Poisson especificado
(es decir bajo hiptesis nula), calculamos el estadstico de prueba:
( )
( )
( )
( )
( )
( )
( )
( )
( )
Este valor debemos compararlo con el percentil de la distribucin
con (9-1)=8
grados de libertad
()
Como el valor del estadstico de prueba es superior al valor crtico, se concluye que
se rechaza la hiptesis nula, es decir, el nmero de habitaciones no se ajusta a una
distribucin Poisson.
Actividad 3:
Se quiere testear H0: =200 versus H1: >200 con un nivel de significacin del 0,05.
Suponiendo que la variable tiene distribucin normal y la varianza poblacional es 100, evale la
potencia de la prueba si la verdadera media es 210 para los siguientes tamaos muestrales 5, 10
y 20. (Obs: resolver con InfoStat)
La potencia de una prueba es la probabilidad de rechazar la hiptesis nula, siendo cierta
la hiptesis alternativa, esto es: (
).
Introduccin al Anlisis Estadstico 2014
Ganga, Leonel Pgina 12
Una prueba de hiptesis ser tanto mejor, cuanto mayor potencia tenga, pues tendr
mayor habilidad en aceptar correctamente hiptesis alternativas.
Probabilidad de error Tipo II () para tamaos de muestra 5, 10 y 20
respectivamente:
Introduccin al Anlisis Estadstico 2014
Ganga, Leonel Pgina 13
Luego para un tamao muestral 5, la potencia de prueba ser:
Para un tamao muestral de 10, la potencia de prueba ser:
Para un tamao muestral de 20, la potencia de prueba ser:
Actividad 4:
Se hizo un estudio para determinar si los ejercicios aerbicos reducen el ritmo cardiaco
de una persona durante el descanso. Se examinaron a diez voluntarios antes y despus
de seguir un programa de ese tipo durante seis meses; sus pulsaciones, en latidos por
minuto, dieron los siguientes registros:
Antes 73 77 68 62 72 80 76 64 70 72
Despus 68 72 64 60 71 77 74 60 64 68
Pruebe si los ejercicios aerbicos reducen el ritmo cardiaco durante el reposo. Considere
un nivel de significacin del 1 %. Plantee las hiptesis de trabajo y el estadstico de
prueba. Calcule el valor p.
Test t para muestras pareadas
Planteo de Hiptesis:
Introduccin al Anlisis Estadstico 2014
Ganga, Leonel Pgina 14
Nivel de significancia:
Valor crtico:
()
Antes 73 77 68 62 72 80 76 64 70 72
Despus 68 72 64 60 71 77 74 60 64 68
Diferencia 5 5 4 2 1 3 2 4 6 4
Estadstico de prueba:
De modo que:
( )
Puesto que supera a , la hiptesis nula se rechaza con nivel
Luego se concluye que los ejercicios aerbicos reducen el ritmo cardaco durante el
reposo.
Infostat:
Prueba T (muestras apareadas)
Obs(1) Obs(2) N media(dif) DE(dif) T p(Unilateral D)
Antes Despus 10 3,60 1,58 7,22 <0,0001
Como luego se tiene que por lo tanto se rechaza la hiptesis nula.
Actividad 5:
Un estudio sobre caries dental en nios de tres ciudades con diferentes cantidades de
flor en el suministro de agua, ha proporcionado los resultados siguientes:
Ciudad A Ciudad B Ciudad C Total
Nios sin caries 38 8 30 76
Introduccin al Anlisis Estadstico 2014
Ganga, Leonel Pgina 15
Nios con caries 87 117 95 299
Total de nios 125 125 125 375
Se quiere saber si la incidencia de caries infantil es igual en las tres ciudades. Considere
un nivel de significacin del 1 %. Plantee las hiptesis de trabajo y el estadstico de
prueba.
Prueba Chi Cuadrado para la igualdad de proporciones
Planteo de la prueba:
Nivel de significancia:
Valor crtico:
()
Regla de decisin: Rechazar la hiptesis nula si
()
Las frecuencias esperadas para las primeras dos celdas de la primera fila son:
Se encuentra por sustraccin que:
( )
Las frecuencias esperadas para la segunda fila son:
Luego al sustituir dichos valores conjuntamente con las frecuencias observadas en la
frmula para
( )
( )
( )
( )
( )
( )
Decisin: Dado que
supera
()
, se rechaza la hiptesis
nula, es decir, la incidencia de caries no es igual en las tres ciudades.