Académique Documents
Professionnel Documents
Culture Documents
ESTADISTICA II
Contexto
A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares
(GEIH), realizada por el DANE[1]. Esta encuesta se hace en las 13 ciudades
principales de Colombia (Bogotá, Medellín, Cali, barranquilla, Bucaramanga,
Manizales, Pasto, Pereira, Ibagué, Cúcuta, Villavicencio, Montería, Cartagena) y
11 ciudades intermedias (Tunja, Florencia, Popayán, Valledupar, Quibdó, Neiva,
Riohacha, Santa Marta, Armenia, Sincelejo, San Andrés). Esta encuesta, se
solicita información sobre las condiciones de empleo de las personas (si trabajan,
en qué trabajan, cuánto ganan, si tienen seguridad social en salud o si están
buscando empleo), además de las características generales de la población como
sexo, edad, estado civil y nivel educativo, se pregunta sobre sus fuentes de
ingresos. La GEIH proporciona al país información a nivel nacional, cabecera -
resto, regional, departamental, y para cada una de las capitales de los
departamentos.
Parte 1 (semana 3 - 5)
Parte 2 (Semana 5)
En esta semana, los integrantes del grupo Consolidar la información del Parte 1
en un archivo PDF con los soportes de excel, el cual debe ser subido en el Foro:
Desarrollo del trabajo colaborativo. Este archivo debe tener:
Introducción
Objetivos
Desarrollo de la actividad
60356
𝑛= = 1050
60356 − 1
+1
1068
Fórmula a desarrollar
Estimación de la proporción de mujeres
Nivel de confiabilidad
Error de estimación
Dpto Nh Wh
Antioquia 3651 0,0605
Atlántico 3355 0,0556
Bogotá, D.C. 2971 0,0492
Bolívar 3180 0,0527
Boyacá 1928 0,0319
Caldas 2451 0,0406
Caquetá 2346 0,0389
Cauca 2256 0,0374
Cesar 2540 0,0421
Chocó 2197 0,0364
Córdoba 2284 0,0378
Cundinamarca 800 0,0133
Huila 2573 0,0426
La Guajira 2696 0,0447
Magdalena 2985 0,0495
Meta 2398 0,0397
Nariño 2178 0,0361
Norte de
2723 0,0451
Santander
Quindio 2049 0,0339
Risaralda 2300 0,0381
Santander 2331 0,0386
Sucre 2731 0,0452
Tolima 2248 0,0372
Valle del Cauca 3185 0,0528
Total general 60356 1,0000
Para determinar cuántas muestra por estrato de las 196 unidades total
considerando fijación proporcional se tiene que
Estratos Wh
Antioquia 0,0605 12
Atlántico 0,0556 11
Bogotá, D.C. 0,0492 10
Bolívar 0,0527 10
Boyacá 0,0319 6
Caldas 0,0406 8
Caquetá 0,0389 8
Cauca 0,0374 7
Cesar 0,0421 8
Chocó 0,0364 7
Córdoba 0,0378 7
Cundinamarca 0,0133 3
Huila 0,0426 8
La Guajira 0,0447 9
Magdalena 0,0495 10
Meta 0,0397 8
Nariño 0,0361 7
Norte de
0,0451 9
Santander
Quindio 0,0339 7
Risaralda 0,0381 7
Santander 0,0386 8
Sucre 0,0452 9
Tolima 0,0372 7
Valle del Cauca 0,0528 10
Total general 1,0000 196
60356
𝑛= = 1050
60356 − 1
1068 + 1
Se toma 1050 observaciones, de la base de datos en EXCEL, realizamos la
selección aleatorias de las 1050 obsevaciones , en una columna generamos
60356 números aleatorios con la función aleatorio(), se procede ordenar de mayor
a menor los datos por estos numeros aleatorios y se elgine los primeros 1050
observaciones correspondientes a los 1050 números aleatorio más grandes ver
archivo adjunto de excel
Se muestra a continuación las primeras 10 obsevaciones de nuestra muestra solo
con las variables relevantes al trabajo, esto por cuestion de espacio de trabajo.
La muestra está compuesta por 538 mujeres (51.24%) y 512 hombre (48.78%)
Para nuestra muestra, la escolaridad presenta practicamente la misma distribución
para hombres y mujeres. y podemos concluir que no existen diferencia en la
escolaridad entre hombres y mujeres.
2. Asumiendo que los datos son normales, calcule un intervalo de confianza del
95% para estimar, la escolaridad promedio de los hombres y de las mujeres
de forma individual, en los niveles de estudio de Bachiller, Tecnólogo y
Universitario.
Se presenta a continuación la distribución del nivel de estudio por género
Técnico o
/ Bachiller Ninguno Postgrado tecnológico Universitario Sum
Hombre 138 14 8 28 25 213
Mujer 133 12 11 45 35 236
Sum 271 26 19 73 60 449
En la tabla anterior se observa que hay 213 hombre y 236 mujeres , esto se debe
a que hay información incompleta, es decir , casillas vacias, por lo que no se
tienen en cuenta en los cálculos.
El promedio y la desviación tipica de la escolaridad para las mujeres de acuerdo al
mayor nivel de educativo respectivamente son.
Bachiller Ninguno Postgrado
11.43 10.00 17.91
Técnico o tecnológico Universitario
13.53 16.14
Bachiller Ninguno Postgrado
1.11 0.00 1.14
Técnico o tecnológico Universitario
1.25 0.88
El promedio y la desviación típica de la escolaridad para las hombres de acuerdo
al mayor nivel de educativo respectivamente son.
Bachiller Ninguno Postgrado
11.57 10.00 19.00
Técnico o tecnológico Universitario
13.82 16.20
Bachiller Ninguno Postgrado
1.24 0.00 2.00
Técnico o tecnológico Universitario
1.02 0.58
1.02 1.02
13.82 − 1.96 × ; 13.82 + 1.96 ×
√28 √28
(13.44; 14.20)
c. Universitario
0.58 0.58
16.20 − 1.96 × ; 16.20 + 1.96 ×
√25 √25
(15.98; 16.43)
Intervalos de confianza del 95% para la escolaridad de la mujeres de acuerdo al
nivel de estudio son:
a. Bachillerato
1.11 1.11
11.43 − 1.96 × ; 11.43 + 1.96 ×
√133 √133
(11.41; 11.45)
b. Técnico o tecnólogo
1.25 1.25
13.53 − 1.96 × ; 13.53 + 1.96 ×
√45 √45
(13.16; 13.90)
c. Universitario
0.88 0.88
16.14 − 1.96 × ; 16.14 + 1.96 ×
√35 √35
(15.85; 16.43)
3. Asumiendo que los datos son normales, calcule un Intervalo de confianza al
95% para estimar la diferencia promedio de escolaridad para los hombres y
mujeres, en los niveles de estudio de Bachiller, Tecnólogo y Universitario.
Aplicaremos la fórmula del cálculo de un intervalo de confianza para la diferencias
de medias para varianzas desconocidos pero iguales , ya que las desviaciones
fueron muy parecidas en cada nivel de estudio por género , ademas de tener
tamaños de muestras grandes en cada población, por lo que la diferencia es
aproxiamdamente y por tanto para muestras grandes la fórmula es.
1 1
(𝑥ℎ − 𝑥𝑚 ) ∓ 1.96 × √𝑆𝑝2 ( + )
𝑛ℎ 𝑛𝑚
1 1
(11.57 − 11.43) ∓ 1.96 × √1.388( + )
138 133
(−0.140; 0.421)
b. Diferencia de la escolaridad a nivel de ténico o tecnólogo.
1.022 (28 − 1) + 1.252 (45 − 1)
𝑆𝑝2 = = 1.364
28 + 45 − 2
1 1
(13.82 − 13.53) ∓ 1.96 × √1.364( + )
28 45
(−0.261; 0.841)
c. Diferencia de la escolaridad a nivel de univeritario.
0.582 (25 − 1) + 0.882 (35 − 1)
𝑆𝑝2 = = 0.593
25 + 35 − 2
1 1
(16.20 − 16.14) ∓ 1.96 × √0.593( + )
25 35
(−0.335; 0.455)
(semana 5) Prueba de hipótesis para dos variables cualitativas
Un investigador, cree determinar que los hombres asisten más a un colegio oficial
que las mujeres en Colombia.Para determinar lo anterior, use la “muestra”
encontrada en la semana 3:
1. Utilizando la variable si actualmente asiste a un establecimiento oficial
(P6175) y sexo (P6020), realice un diagrama de barras comparativo para los
hombres y mujeres en un solo gráfico. Según los resultados, ¿Existen
diferencias?
2. Con un nivel de confianza del 95%, estime e interprete la proporción de
hombres y de mujeres que asisten a un establecimiento oficial.
3. Realice una prueba de hipótesis para determinar la afirmación del
investigador. Utilice un nivel de significancia del 5%. ¿Qué se puede decir de
lo anterior?
/ No Sí
Hombre 49 136
Mujer 41 115
/ No Sí
Hombre 26.49 73.51
Mujer 26.28 73.72
[0.6715; 0.7987]
La proporción de hombres que asisten a un establecimiento oficial se encuentran
entre 0.6715 (67.15%) y 0.7987 (79.87%) , con una confianza del 95%.
Estimación de la proporción de mujeres que asisten a un establecimiento oficial
[0.6681; 0.8063]
La proporción de mujeres que asisten a un establecimiento oficial se encuentran
entre 0.6681 (66.81%) y 0.8063 (80.63%) , con una confianza del 95%.
3. Realice una prueba de hipótesis para determinar la afirmación del
investigador. Utilice un nivel de significancia del 5%. ¿Qué se puede decir de
lo anterior?
De acuerdo a la afirmación del investigador las hipótesis quedan planteadas de la
siguientes manera.
Planteamiento de las hipótesis
𝐻𝑜 : 𝑃1 > 𝑃2 𝑉𝑠 𝐻𝑎 : 𝑃1 ≤ 𝑃2
o equivalentemente.
𝐻𝑜 : 𝑃1 − 𝑃2 > 0 𝑉𝑠 𝐻𝑎 : 𝑃1 − 𝑃2 ≤ 0
Estadístico de prueba
𝑝1 − 𝑝2
𝑍=
𝑝1 𝑞1 𝑝2 𝑞2
√ 𝑛 + 𝑛
1 2
entonces,
0.7351 − 0.7372
𝑍=
√0.7351 × 0.2649 + 0.7372 × 0.2628
185 156
−0.0021
𝑍= = −0.044
0.0479
Críterio de decisión
Si 𝑍 > 𝑍0.05 se rechaza la hipótesis nula, ahora bien el valor de 𝑍0.05 = 1.645,
Dado que el valor de Z es menor a 1.645, No se rechaza la hipótesis nula , es
decir , no hay suficiente evidencia estadística , de que la proporción de hombre
que asisten a un establecimiento oficial es mayor al de las mujeres.
Conclusiones