Vous êtes sur la page 1sur 15

Introduccin al Anlisis Estadstico 2014

Ganga, Leonel Pgina 1



Gua de Actividades N 2

Actividad 1:
Sea

una muestra aleatoria de una poblacin con media y varianza

.
Considere los siguientes estimadores para :

( )


a) Determine cules son insesgados:
Debemos analizar en cada caso si se cumple que:
()
Consideremos

) (

[(

) (

)]

[ ]


Luego, resulta que

es insesgado.

Consideremos

()

) (

( )

( )
(

( )
[(

) (

)]

( )
( )


Con lo cual resulta que

es insesgado.
Consideremos


Sabemos que (

) (

) , luego

es insesgado.
b) Determine la eficiencia relativa de

respecto a


Para ello debemos analizar si (

) (

) y (

) (

)
Introduccin al Anlisis Estadstico 2014

Ganga, Leonel Pgina 2

(

) (

) (

[(

) (

)]


Luego como se tiene que:
(

)
Con lo cual se prueba que

es ms eficiente que


Analicemos si (

) (

)
(

) *

()

()

((

)
(

))

()

()


Actividad 2:
Con los datos proporcionados en la Encuesta Permanente de Hogares (EPH), los que se
encuentran tabulados en el archivo base EPH.xls resuelva las siguientes consignas:

a) Estime con un 99 % de confianza los ingresos mensuales (SUELDO) promedio
de los jefes de hogar varones y mujeres (por separado y conjunto). Considere
que se aplic un muestreo estratificado con afijacin proporcional en una
poblacin de 10.000 jefes de hogar. Corrobore manualmente los resultados
obtenidos con el software.
Ingresos mensuales PROMEDIO (sueldo) de varones, mujeres y ambos
99% de confianza
Muestreo estratificado con afijacin proporcional






Frecuencias absolutas
SEXO Total Porcentaje
Mujer 54 54,00
Varn 46 46,00
Total 100 100,00
Introduccin al Anlisis Estadstico 2014

Ganga, Leonel Pgina 3


Frecuencias relativas al total
SEXO Total Porcentaje
Mujer 0,54 0,54
Varn 0,46 0,46
Total 1,00 1,00



()
()



()

(



()

) (

) (

)


(

) () ( )
(

) ( ) ( )

Medidas resumen

SEXO Variable n Media D.E. Var(n-1) E.E. Mn. Mx.
Mujer SUELDO 54 580,00 405,58 164498,11 55,19 0,00 2000,00
Varn SUELDO 46 678,70 545,04 297073,82 80,36 0,00 2200,00


Introduccin al Anlisis Estadstico 2014

Ganga, Leonel Pgina 4


(

) ( )
(

)

(

) ( )
(

)

(

)

(

)

(

)
(

)

(

)
(

)

(

)
(



()
() [ ]

(

)
(

) [ ]

(

)
(

) [ ]


Resultados del Software
Muestreo estratificado
Estratos Variable N n Media E.E. LI(99)
LS(99) VR
Mujer SUELDO 5400 54 580,00 54,92 438,55
721,45 0,01
Varn SUELDO 4600 46 678,70 79,96 472,73
884,66 0,01
Todos SUELDO 10000 100 625,40 47,25 503,70
747,10 0,01

Introduccin al Anlisis Estadstico 2014

Ganga, Leonel Pgina 5


b) Existen evidencias para apoyar la hiptesis de que el nmero promedio de
horas trabajadas (HS.TRA) en la semana es significativamente distinto de 31
horas? Considere un nivel de significacin del 0,05. En caso de corresponder
construya una estimacin por intervalo del 95 % e interprete. Qu supuesto/s
debe hacer para aplicar la prueba? Evale si se cumplen. Plantee las hiptesis de
trabajo y el estadstico de prueba.

Prueba t para una media


Valor de la media bajo la hiptesis nula: 31

Variable n Media DE LI(95) LS(95) T p(Bilateral)
HS.TRA 100 34,04 11,42 31,77 36,31 2,66 0,0091

Supuestos de la prueba t para una media:

Para poder aplicar la prueba t debemos tener en cuenta que se deben cumplir los
siguientes supuestos:
Siempre que la poblacin provenga de una distribucin normal (muestra
pequea)
La varianza

sea desconocida

Estadstico de prueba:





La varianza poblacional es desconocida, y se trabaja en el estadstico a partir de la
varianza de los datos de la muestra. En este caso el tamao de muestra es de
con lo cual podramos aplicar el estadstico de la distribucin normal pero el Infostat
trabaja por defecto con el test t para una muestra.

Test de Hiptesis para la media
Tipo de contraste: Bilateral

Planteo de la prueba:




Introduccin al Anlisis Estadstico 2014

Ganga, Leonel Pgina 6



( )

( )

( )


Como

se rechaza la hiptesis nula, luego la media de


horas trabajadas es distinta de 31 horas.

c) Pruebe si existen diferencias significativas en las horas promedio trabajadas de
varones y mujeres. Considere un nivel de significacin del 0,05. En caso de
corresponder construya una estimacin por intervalo del 95 % e interprete. Qu
supuesto/s debe hacer para aplicar la prueba? Evale si se cumplen. Plantee las
hiptesis de trabajo y el estadstico de prueba.

Supuestos de la prueba t para la diferencia de medias:

Para poder aplicar la prueba t debemos tener en cuenta que se deben cumplir los
siguientes supuestos:
Siempre que ambas poblaciones provengan de distribuciones normales pero
independientes. (muestra pequea)
Las varianzas de cada poblacin se suponen iguales pero desconocidas.

Estadstico de prueba:

)

Donde:




Test de Hiptesis para la diferencia de medias
Tipo de contraste: Bilateral

Planteo de la prueba:


Introduccin al Anlisis Estadstico 2014

Ganga, Leonel Pgina 7

()

()

( )( ) ( )( )





)
()

)
()


Como
()
se rechaza la hiptesis nula, luego existen
diferencias significativas en las horas promedio trabajadas entre hombres y mujeres.

Prueba T para muestras Independientes

Clasific SEXO
Variable HS.TRA
Grupo 1 {Mujer}
Grupo 2 {Varn}
n(1) 54
n(2) 46
Media(1) 31,52
Media(2) 37,00
Media(1)-Media(2) -5,48
LI(95) -9,92
LS(95) -1,05
Var(1) 105,80
Var(2) 145,73
pHomVar 0,2620
T -2,45
gl 98
p-valor 0,0160
prueba Bilateral

Intervalo de confianza para la diferencia de medias:
Introduccin al Anlisis Estadstico 2014

Ganga, Leonel Pgina 8


Luego con un 95% de confianza, se evidencia que la diferencia de medias en horas
trabajadas es negativa lo cual implica que la media de horas trabajadas del grupo de
varones es mayor que la media de horas trabajadas del grupo de mujeres.

d) Pruebe si existen diferencias significativas en la proporcin de solteros entre
varones y mujeres. Considere un nivel de significacin del 0,05. Plantee las
hiptesis de trabajo y el estadstico de prueba.


Prueba de Hiptesis para la Diferencia de Proporciones

Supuestos:
Poblaciones dicotmicas (xito y fracaso)
Ensayos binomiales
Poblaciones normales e independientes
En nuestra base de datos tenemos un total de 100 datos referidos a 54 correspondiente a
mujeres y 46 correspondiente a hombres, para cada uno de los grupos se determin la
siguiente cantidad de solteros:
Mujeres solteras: 22
Hombres solteros: 25
Con lo cual las proporciones estimadas en funcin de las muestras son las siguientes:

( )

( )
Estadstico de prueba:

)
( ) (

)
( )

Donde (estimacin ponderada de la proporcin poblacional)
En nuestro caso el estadstico sera:
Introduccin al Anlisis Estadstico 2014

Ganga, Leonel Pgina 9


)

( ) (





Como

, luego rechazamos la hiptesis nula, es decir


existe evidencia de diferencia en la proporcin de solteros entre hombres y mujeres.
Como la diferencia es de se tiene que la proporcin de hombres solteros es
mayor que la proporcin de mujeres solteras.


e) Pruebe si las variables SEXO y LEER son independientes. Considere un nivel de
significacin del 0,05. Plantee las hiptesis de trabajo y el estadstico de prueba.


Prueba Chi Cuadrado de Contraste de independencia
Planteo de la prueba:





Tablas de contingencia



Frecuencias absolutas
En columnas:SEXO
LEER Mujer Varn Total
No 6 4 10
Si 48 42 90
Total 54 46 100

Frecuencias esperadas bajo independencia
En columnas:SEXO
LEER Mujer Varn Total
No 5,40 4,60 10,00
Si 48,60 41,40 90,00
Total 54,00 46,00 100,00



Estadstico Valor gl p
Chi Cuadrado Pearson 0,16 1 0,6882
Chi Cuadrado MV-G2 0,16 1 0,6870
Irwin-Fisher bilateral 0,07 0,7496
Coef.Conting.Cramer 0,03
Coef.Conting.Pearson 0,04
Coeficiente Phi 0,04
Introduccin al Anlisis Estadstico 2014

Ganga, Leonel Pgina 10


Cocientes de chance (odds ratio)

Estadstico Estim LI 95% LS 95%
Odds Ratio 1/2 1,31 0,37 4,68
Odds Ratio 2/1 0,76 0,21 2,71


A partir de las frecuencias absolutas y esperadas, calculamos el estadstico de prueba:

( )

( )

( )

( )




Este valor debemos compararlo con el percentil de la distribucin

con (2-1)(2-1)=1
grados de libertad

()

Como el valor del estadstico es inferior al valor crtico, se concluye que no se
rechaza la hiptesis nula, es decir, efectivamente las variables SEXO y LEER son
independientes.

f) Pruebe si el nmero de habitaciones se ajusta a una distribucin Poisson.
Considere un nivel de significacin del 0,05. Plantee las hiptesis de trabajo y el
estadstico de prueba.

Tablas de frecuencias


Variable Clase FA
HABIT 1 9
HABIT 2 27
HABIT 3 31
HABIT 4 19
HABIT 5 10
HABIT 6 3
HABIT 7 0
HABIT 8 0
HABIT 9 1


Tablas de frecuencias


Ajuste: Poisson con estimacin de parmetros: Lambda= 3,09000

Variable Clase MC FA FR E(FA) E(FR) Chi-Cuadrado p
HABIT 1 1 9 0,09 18,61 0,19 4,96
HABIT 2 2 27 0,27 21,72 0,22 6,24
HABIT 3 3 31 0,31 22,37 0,22 9,57
HABIT 4 4 19 0,19 17,28 0,17 9,74
Introduccin al Anlisis Estadstico 2014

Ganga, Leonel Pgina 11

HABIT 5 5 10 0,10 10,68 0,11 9,78
HABIT 6 6 3 0,03 5,50 0,06 10,92
HABIT 7 7 0 0,00 2,43 0,02 13,35
HABIT 8 8 0 0,00 0,94 0,01 14,29
HABIT 9 9 1 0,01 0,46 4,6E-03 14,93 0,0370


Prueba Chi Cuadrado de Bondad de Ajuste

Planteo de la prueba:





A partir de las frecuencias absolutas y esperadas bajo el modelo Poisson especificado
(es decir bajo hiptesis nula), calculamos el estadstico de prueba:

( )

( )

( )

( )

( )

( )

( )

( )

( )




Este valor debemos compararlo con el percentil de la distribucin

con (9-1)=8
grados de libertad

()

Como el valor del estadstico de prueba es superior al valor crtico, se concluye que
se rechaza la hiptesis nula, es decir, el nmero de habitaciones no se ajusta a una
distribucin Poisson.
Actividad 3:
Se quiere testear H0: =200 versus H1: >200 con un nivel de significacin del 0,05.
Suponiendo que la variable tiene distribucin normal y la varianza poblacional es 100, evale la
potencia de la prueba si la verdadera media es 210 para los siguientes tamaos muestrales 5, 10
y 20. (Obs: resolver con InfoStat)
La potencia de una prueba es la probabilidad de rechazar la hiptesis nula, siendo cierta
la hiptesis alternativa, esto es: (

).
Introduccin al Anlisis Estadstico 2014

Ganga, Leonel Pgina 12

Una prueba de hiptesis ser tanto mejor, cuanto mayor potencia tenga, pues tendr
mayor habilidad en aceptar correctamente hiptesis alternativas.
Probabilidad de error Tipo II () para tamaos de muestra 5, 10 y 20
respectivamente:


Introduccin al Anlisis Estadstico 2014

Ganga, Leonel Pgina 13


Luego para un tamao muestral 5, la potencia de prueba ser:

Para un tamao muestral de 10, la potencia de prueba ser:

Para un tamao muestral de 20, la potencia de prueba ser:


Actividad 4:

Se hizo un estudio para determinar si los ejercicios aerbicos reducen el ritmo cardiaco
de una persona durante el descanso. Se examinaron a diez voluntarios antes y despus
de seguir un programa de ese tipo durante seis meses; sus pulsaciones, en latidos por
minuto, dieron los siguientes registros:
Antes 73 77 68 62 72 80 76 64 70 72
Despus 68 72 64 60 71 77 74 60 64 68

Pruebe si los ejercicios aerbicos reducen el ritmo cardiaco durante el reposo. Considere
un nivel de significacin del 1 %. Plantee las hiptesis de trabajo y el estadstico de
prueba. Calcule el valor p.
Test t para muestras pareadas
Planteo de Hiptesis:


Introduccin al Anlisis Estadstico 2014

Ganga, Leonel Pgina 14

Nivel de significancia:
Valor crtico:
()

Antes 73 77 68 62 72 80 76 64 70 72
Despus 68 72 64 60 71 77 74 60 64 68
Diferencia 5 5 4 2 1 3 2 4 6 4


Estadstico de prueba:


De modo que:



( )
Puesto que supera a , la hiptesis nula se rechaza con nivel
Luego se concluye que los ejercicios aerbicos reducen el ritmo cardaco durante el
reposo.

Infostat:

Prueba T (muestras apareadas)

Obs(1) Obs(2) N media(dif) DE(dif) T p(Unilateral D)
Antes Despus 10 3,60 1,58 7,22 <0,0001

Como luego se tiene que por lo tanto se rechaza la hiptesis nula.

Actividad 5:

Un estudio sobre caries dental en nios de tres ciudades con diferentes cantidades de
flor en el suministro de agua, ha proporcionado los resultados siguientes:
Ciudad A Ciudad B Ciudad C Total
Nios sin caries 38 8 30 76
Introduccin al Anlisis Estadstico 2014

Ganga, Leonel Pgina 15

Nios con caries 87 117 95 299
Total de nios 125 125 125 375

Se quiere saber si la incidencia de caries infantil es igual en las tres ciudades. Considere
un nivel de significacin del 1 %. Plantee las hiptesis de trabajo y el estadstico de
prueba.
Prueba Chi Cuadrado para la igualdad de proporciones

Planteo de la prueba:



Nivel de significancia:
Valor crtico:

con (3-1)=2 grados de libertad

()

Regla de decisin: Rechazar la hiptesis nula si

()

Las frecuencias esperadas para las primeras dos celdas de la primera fila son:


Se encuentra por sustraccin que:

( )
Las frecuencias esperadas para la segunda fila son:


Luego al sustituir dichos valores conjuntamente con las frecuencias observadas en la
frmula para

( )

( )

( )

( )

( )

( )



Decisin: Dado que

supera

()
, se rechaza la hiptesis
nula, es decir, la incidencia de caries no es igual en las tres ciudades.

Vous aimerez peut-être aussi