Vous êtes sur la page 1sur 15

Introducción al Análisis Estadístico 2014

Ganga, Leonel Página 1

Guía de Actividades Nº 2

Actividad 1:
Sea

una muestra aleatoria de una población con media y varianza

.
Considere los siguientes estimadores para :

̂

̂

( )

̂
̅

a) Determine cuáles son insesgados:
Debemos analizar en cada caso si se cumple que:
(̂)
Consideremos

̂

(

̂) (

)

(

)

[(

) (

)]

[ ]

Luego, resulta que

̂ es insesgado.

Consideremos

̂

()

(

̂) (

( )

)

(

)

( )
(

)

(

)

( )
[(

) (

)]

( )
( )

Con lo cual resulta que

̂ es insesgado.
Consideremos

̂
̅

Sabemos que (

̂) (
̅

) , luego

̂ es insesgado.
b) Determine la eficiencia relativa de

̂ respecto a

̂ y

̂
Para ello debemos analizar si (

̂) (

̂) y (

̂) (

̂)
Introducción al Análisis Estadístico 2014

Ganga, Leonel Página 2

(

̂)

(

̂) (

) (

)

[(

) (

)]

[

]

[

]

Luego como se tiene que:
(

̂)

(

̂)
Con lo cual se prueba que

̂ es más eficiente que

̂
Analicemos si (

̂) (

̂)
(

̂) *

()

+

(

)

()

((

)
(

))

(

)

()

()


Actividad 2:
Con los datos proporcionados en la Encuesta Permanente de Hogares (EPH), los que se
encuentran tabulados en el archivo base EPH.xls resuelva las siguientes consignas:

a) Estime con un 99 % de confianza los ingresos mensuales (SUELDO) promedio
de los jefes de hogar varones y mujeres (por separado y conjunto). Considere
que se aplicó un muestreo estratificado con afijación proporcional en una
población de 10.000 jefes de hogar. Corrobore manualmente los resultados
obtenidos con el software.
Ingresos mensuales PROMEDIO (sueldo) de varones, mujeres y ambos
99% de confianza
Muestreo estratificado con afijación proporcional






Frecuencias absolutas
SEXO Total Porcentaje
Mujer 54 54,00
Varón 46 46,00
Total 100 100,00
Introducción al Análisis Estadístico 2014

Ganga, Leonel Página 3


Frecuencias relativas al total
SEXO Total Porcentaje
Mujer 0,54 0,54
Varón 0,46 0,46
Total 1,00 1,00



()
()

̅

̅̅̅̅

̅̅̅


()

(

)

̅̅̅̅̅

(

)

̅̅̅

√()

̅

̅̅̅̅̅

̅̅̅



(
̅
) (

̅̅̅̅̅
) (

̅̅̅
)


(

̅̅̅̅̅
) () ( )
(

̅̅̅
) ( ) ( )

Medidas resumen

SEXO Variable n Media D.E. Var(n-1) E.E. Mín. Máx.
Mujer SUELDO 54 580,00 405,58 164498,11 55,19 0,00 2000,00
Varón SUELDO 46 678,70 545,04 297073,82 80,36 0,00 2200,00

̅

̅

Introducción al Análisis Estadístico 2014

Ganga, Leonel Página 4


(

̅̅̅̅̅
) ( )
(

̅̅̅̅̅
)

(

̅̅̅̅
) ( )
(

̅̅̅̅
)

(
̅
)

(
̅
)

(
̅
)
(
̅
)

(

̅̅̅̅̅
)
(

̅̅̅̅̅
)

(

̅̅̅̅
)
(

̅̅̅̅
)

()
() [ ]

(

)
(

) [ ]

(

)
(

) [ ]


Resultados del Software
Muestreo estratificado
Estratos Variable N n Media E.E. LI(99)
LS(99) VR
Mujer SUELDO 5400 54 580,00 54,92 438,55
721,45 0,01
Varón SUELDO 4600 46 678,70 79,96 472,73
884,66 0,01
Todos SUELDO 10000 100 625,40 47,25 503,70
747,10 0,01

Introducción al Análisis Estadístico 2014

Ganga, Leonel Página 5


b) ¿Existen evidencias para apoyar la hipótesis de que el número promedio de
horas trabajadas (HS.TRA) en la semana es significativamente distinto de 31
horas? Considere un nivel de significación del 0,05. En caso de corresponder
construya una estimación por intervalo del 95 % e interprete. ¿Qué supuesto/s
debe hacer para aplicar la prueba? Evalúe si se cumplen. Plantee las hipótesis de
trabajo y el estadístico de prueba.

Prueba t para una media


Valor de la media bajo la hipótesis nula: 31

Variable n Media DE LI(95) LS(95) T p(Bilateral)
HS.TRA 100 34,04 11,42 31,77 36,31 2,66 0,0091

Supuestos de la prueba t para una media:

Para poder aplicar la prueba t debemos tener en cuenta que se deben cumplir los
siguientes supuestos:
 Siempre que la población provenga de una distribución normal (muestra
pequeña)
 La varianza

sea desconocida

Estadístico de prueba:

̅






La varianza poblacional es desconocida, y se trabaja en el estadístico a partir de la
varianza de los datos de la muestra. En este caso el tamaño de muestra es de
con lo cual podríamos aplicar el estadístico de la distribución normal pero el Infostat
trabaja por defecto con el test t para una muestra.

Test de Hipótesis para la media
Tipo de contraste: Bilateral

Planteo de la prueba:

̅



Introducción al Análisis Estadístico 2014

Ganga, Leonel Página 6




( )


( )


( )

Como

se rechaza la hipótesis nula, luego la media de
horas trabajadas es distinta de 31 horas.

c) Pruebe si existen diferencias significativas en las horas promedio trabajadas de
varones y mujeres. Considere un nivel de significación del 0,05. En caso de
corresponder construya una estimación por intervalo del 95 % e interprete. ¿Qué
supuesto/s debe hacer para aplicar la prueba? Evalúe si se cumplen. Plantee las
hipótesis de trabajo y el estadístico de prueba.

Supuestos de la prueba t para la diferencia de medias:

Para poder aplicar la prueba t debemos tener en cuenta que se deben cumplir los
siguientes supuestos:
 Siempre que ambas poblaciones provengan de distribuciones normales pero
independientes. (muestra pequeña)
 Las varianzas de cada población se suponen iguales pero desconocidas.

Estadístico de prueba:

̅

̅

(

)

Donde:

(

)

(

)

Test de Hipótesis para la diferencia de medias
Tipo de contraste: Bilateral

Planteo de la prueba:

̅

Introducción al Análisis Estadístico 2014

Ganga, Leonel Página 7

̅

()

()

( )( ) ( )( )







(

)
()


(

)
()


Como
()
se rechaza la hipótesis nula, luego existen
diferencias significativas en las horas promedio trabajadas entre hombres y mujeres.

Prueba T para muestras Independientes

Clasific SEXO
Variable HS.TRA
Grupo 1 {Mujer}
Grupo 2 {Varón}
n(1) 54
n(2) 46
Media(1) 31,52
Media(2) 37,00
Media(1)-Media(2) -5,48
LI(95) -9,92
LS(95) -1,05
Var(1) 105,80
Var(2) 145,73
pHomVar 0,2620
T -2,45
gl 98
p-valor 0,0160
prueba Bilateral

Intervalo de confianza para la diferencia de medias:
Introducción al Análisis Estadístico 2014

Ganga, Leonel Página 8

Luego con un 95% de confianza, se evidencia que la diferencia de medias en horas
trabajadas es negativa lo cual implica que la media de horas trabajadas del grupo de
varones es mayor que la media de horas trabajadas del grupo de mujeres.

d) Pruebe si existen diferencias significativas en la proporción de solteros entre
varones y mujeres. Considere un nivel de significación del 0,05. Plantee las
hipótesis de trabajo y el estadístico de prueba.


Prueba de Hipótesis para la Diferencia de Proporciones

Supuestos:
 Poblaciones dicotómicas (éxito y fracaso)
 Ensayos binomiales
 Poblaciones normales e independientes
En nuestra base de datos tenemos un total de 100 datos referidos a 54 correspondiente a
mujeres y 46 correspondiente a hombres, para cada uno de los grupos se determinó la
siguiente cantidad de solteros:
Mujeres solteras: 22
Hombres solteros: 25
Con lo cual las proporciones estimadas en función de las muestras son las siguientes:
̂

( )
̂

( )
Estadístico de prueba:


̂

̂

(

)
√̅( ̅) (

)
( )

Donde ̅ (estimación ponderada de la proporción poblacional)
En nuestro caso el estadístico sería:
Introducción al Análisis Estadístico 2014

Ganga, Leonel Página 9


)

( ) (

)

Como

, luego rechazamos la hipótesis nula, es decir
existe evidencia de diferencia en la proporción de solteros entre hombres y mujeres.
Como la diferencia es de se tiene que la proporción de hombres solteros es
mayor que la proporción de mujeres solteras.


e) Pruebe si las variables SEXO y LEER son independientes. Considere un nivel de
significación del 0,05. Plantee las hipótesis de trabajo y el estadístico de prueba.


Prueba Chi Cuadrado de Contraste de independencia
Planteo de la prueba:

Tablas de contingencia



Frecuencias absolutas
En columnas:SEXO
LEER Mujer Varón Total
No 6 4 10
Si 48 42 90
Total 54 46 100

Frecuencias esperadas bajo independencia
En columnas:SEXO
LEER Mujer Varón Total
No 5,40 4,60 10,00
Si 48,60 41,40 90,00
Total 54,00 46,00 100,00



Estadístico Valor gl p
Chi Cuadrado Pearson 0,16 1 0,6882
Chi Cuadrado MV-G2 0,16 1 0,6870
Irwin-Fisher bilateral 0,07 0,7496
Coef.Conting.Cramer 0,03
Coef.Conting.Pearson 0,04
Coeficiente Phi 0,04
Introducción al Análisis Estadístico 2014

Ganga, Leonel Página 10


Cocientes de chance (odds ratio)

Estadístico Estim LI 95% LS 95%
Odds Ratio 1/2 1,31 0,37 4,68
Odds Ratio 2/1 0,76 0,21 2,71


A partir de las frecuencias absolutas y esperadas, calculamos el estadístico de prueba:

( )

( )

( )

( )

Este valor debemos compararlo con el percentil de la distribución

con (2-1)(2-1)=1
grados de libertad

()

Como el valor del estadístico es inferior al valor crítico, se concluye que no se
rechaza la hipótesis nula, es decir, efectivamente las variables SEXO y LEER son
independientes.

f) Pruebe si el número de habitaciones se ajusta a una distribución Poisson.
Considere un nivel de significación del 0,05. Plantee las hipótesis de trabajo y el
estadístico de prueba.

Tablas de frecuencias


Variable Clase FA
HABIT 1 9
HABIT 2 27
HABIT 3 31
HABIT 4 19
HABIT 5 10
HABIT 6 3
HABIT 7 0
HABIT 8 0
HABIT 9 1


Tablas de frecuencias


Ajuste: Poisson con estimación de parámetros: Lambda= 3,09000

Variable Clase MC FA FR E(FA) E(FR) Chi-Cuadrado p
HABIT 1 1 9 0,09 18,61 0,19 4,96
HABIT 2 2 27 0,27 21,72 0,22 6,24
HABIT 3 3 31 0,31 22,37 0,22 9,57
HABIT 4 4 19 0,19 17,28 0,17 9,74
Introducción al Análisis Estadístico 2014

Ganga, Leonel Página 11

HABIT 5 5 10 0,10 10,68 0,11 9,78
HABIT 6 6 3 0,03 5,50 0,06 10,92
HABIT 7 7 0 0,00 2,43 0,02 13,35
HABIT 8 8 0 0,00 0,94 0,01 14,29
HABIT 9 9 1 0,01 0,46 4,6E-03 14,93 0,0370


Prueba Chi Cuadrado de Bondad de Ajuste

Planteo de la prueba:

A partir de las frecuencias absolutas y esperadas bajo el modelo Poisson especificado
(es decir bajo hipótesis nula), calculamos el estadístico de prueba:

( )

( )

( )

( )

( )

( )

( )

( )

( )

Este valor debemos compararlo con el percentil de la distribución

con (9-1)=8
grados de libertad

()

Como el valor del estadístico de prueba es superior al valor crítico, se concluye que
se rechaza la hipótesis nula, es decir, el número de habitaciones no se ajusta a una
distribución Poisson.
Actividad 3:
Se quiere testear H0: μ=200 versus H1: μ>200 con un nivel de significación del 0,05.
Suponiendo que la variable tiene distribución normal y la varianza poblacional es 100, evalúe la
potencia de la prueba si la verdadera media es 210 para los siguientes tamaños muestrales 5, 10
y 20. (Obs: resolver con InfoStat)
La potencia de una prueba es la probabilidad de rechazar la hipótesis nula, siendo cierta
la hipótesis alternativa, esto es: (

).
Introducción al Análisis Estadístico 2014

Ganga, Leonel Página 12

Una prueba de hipótesis será tanto mejor, cuanto mayor potencia tenga, pues tendrá
mayor habilidad en aceptar correctamente hipótesis alternativas.
Probabilidad de error Tipo II () para tamaños de muestra 5, 10 y 20
respectivamente:


Introducción al Análisis Estadístico 2014

Ganga, Leonel Página 13


Luego para un tamaño muestral 5, la potencia de prueba será:

Para un tamaño muestral de 10, la potencia de prueba será:

Para un tamaño muestral de 20, la potencia de prueba será:


Actividad 4:

Se hizo un estudio para determinar si los ejercicios aeróbicos reducen el ritmo cardiaco
de una persona durante el descanso. Se examinaron a diez voluntarios antes y después
de seguir un programa de ese tipo durante seis meses; sus pulsaciones, en latidos por
minuto, dieron los siguientes registros:
Antes 73 77 68 62 72 80 76 64 70 72
Después 68 72 64 60 71 77 74 60 64 68

Pruebe si los ejercicios aeróbicos reducen el ritmo cardiaco durante el reposo. Considere
un nivel de significación del 1 %. Plantee las hipótesis de trabajo y el estadístico de
prueba. Calcule el valor p.
Test t para muestras pareadas
Planteo de Hipótesis:

Introducción al Análisis Estadístico 2014

Ganga, Leonel Página 14

Nivel de significancia:
Valor crítico:
()

Antes 73 77 68 62 72 80 76 64 70 72
Después 68 72 64 60 71 77 74 60 64 68
Diferencia 5 5 4 2 1 3 2 4 6 4

̅

Estadístico de prueba:

̅



De modo que:




( )
Puesto que supera a , la hipótesis nula se rechaza con nivel
Luego se concluye que los ejercicios aeróbicos reducen el ritmo cardíaco durante el
reposo.

Infostat:

Prueba T (muestras apareadas)

Obs(1) Obs(2) N media(dif) DE(dif) T p(Unilateral D)
Antes Después 10 3,60 1,58 7,22 <0,0001

Como luego se tiene que por lo tanto se rechaza la hipótesis nula.

Actividad 5:

Un estudio sobre caries dental en niños de tres ciudades con diferentes cantidades de
flúor en el suministro de agua, ha proporcionado los resultados siguientes:
Ciudad A Ciudad B Ciudad C Total
Niños sin caries 38 8 30 76
Introducción al Análisis Estadístico 2014

Ganga, Leonel Página 15

Niños con caries 87 117 95 299
Total de niños 125 125 125 375

Se quiere saber si la incidencia de caries infantil es igual en las tres ciudades. Considere
un nivel de significación del 1 %. Plantee las hipótesis de trabajo y el estadístico de
prueba.
Prueba Chi Cuadrado para la igualdad de proporciones

Planteo de la prueba:

Nivel de significancia:
Valor crítico:

con (3-1)=2 grados de libertad

()

Regla de decisión: Rechazar la hipótesis nula si

()

Las frecuencias esperadas para las primeras dos celdas de la primera fila son:

Se encuentra por sustracción que:

( )
Las frecuencias esperadas para la segunda fila son:

Luego al sustituir dichos valores conjuntamente con las frecuencias observadas en la
fórmula para

,

( )

( )

( )

( )

( )

( )

Decisión: Dado que

supera

()
, se rechaza la hipótesis
nula, es decir, la incidencia de caries no es igual en las tres ciudades.