Vous êtes sur la page 1sur 11

El siguiente trabajo analiza algunas variables de la Gran encuesta Integrada de hogares (GEIH)

realizada por el Departamento Administrativo Nacional de Estadística (DANE), en este se propone


la solución, a algunos ejercicios planteados, con contribuciones grupales semanales.

Para la selección de la muestra a partir de la base de datos presentada1 y teniendo en cuenta que
cada uno de los encuestados tiene la misma probabilidad de ser elegido, se ha escogido el
muestreo aleatorio simple. Para la aplicación de este tipo de muestreo se puede calcular el
tamaño de la muestra aplicando la siguiente fórmula

𝑁𝑍 2 𝑝𝑞
𝑛=
(𝑁 − 1)𝐸 2 + 𝑍 2 𝑝𝑞

Donde,

N: Tamaño de la población
Z: Nivel de confianza
p: Probabilidad de éxito o proporción esperada
q: Probabilidad de fracaso
E: Error máximo admisible

De esta manera, trabajando con la variable género (P6020), si tenemos en cuenta que el total de
mujeres es de 31969 (valor obtenido con la función de Excel contar si) y el de los hombres es
28387 para un total de 60356 encuestados,

31969
𝑝= = 0.53 𝑎𝑝𝑟𝑜𝑥.
60356
28387
𝑞= = 0.47 𝑎𝑝𝑟𝑜𝑥.
60356

Donde p será la proporción de mujeres en la población y 𝑞 la proporción de hombre de la misma.


Luego proponiendo un nivel de confianza del 95% (para el cual Z=1.96)2 y un margen de error del
5% (este es el margen más recomendado para el nivel de confianza escogido), con lo cual E=0.05

Ahora,
𝑁𝑍 2 𝑝𝑞
𝑛=
(𝑁 − 1)𝐸 2 + 𝑍 2 𝑝𝑞

60356(1.96)2 (0.53)(0.47)
𝑛=
(60356 − 1)(0.05)2 + (1.96)2 (0.53)(0.47)

60356(3.8416)(0.53)(0.47)
𝑛=
(60355)(0.0025) + (3.8416)(0.53)(0.47)

1
El lector puede consultar este archivo en formato Excel en https://goo.gl/zB3Ntf
2
Valor que se puede comprobar en la tabla de distribución Normal
57757.2252
𝑛=
150.8875 + 0.9569
12653.1864
𝑛=
151.8444

𝑛 = 380.3711 ≈ 381 𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠

De esta manera se hará un análisis a una muestra de 381 encuestados seleccionados de manera
aleatoria. Para esto, se han usado las herramientas que ofrece el programa Excel, en el cual se
aplicaron los siguientes pasos:

1- Enumerar cada uno de los datos de la variable género desde 1 hasta 60356

2- Haciendo uso de la función aleatorio de Excel se obtuvo un primer valor entre 1 y 60356.

3- Se obtienen otros números aleatorios con las mismas condiciones hasta tener un total de 381
datos.

Tabla de números aleatorios para la muestra


55515 47377 31523 23221 6227 43140 2964 25639 3119 56244 12014 7811 57524 36908 58217 34044
12336 31799 17001 50715 26621 35124 9414 53270 26493 11912 32659 43326 36301 5049 56243 5317
54800 1584 38520 42431 20010 36403 44841 39686 54637 50544 45775 14336 11120 4913 636 52450
51407 44410 18564 25326 5400 30690 29955 27692 7080 39928 34403 9197 11705 47670 9951 37759
24455 47451 4357 39511 24947 6429 10142 52267 37666 10740 24921 40362 51823 40471 36084 22643
24662 4135 41266 22071 15107 54463 40892 5511 54381 21114 22302 24980 30335 8200 58895 25163
56665 11643 33154 55925 29189 42217 6394 22076 18566 56622 2884 2841 36383 24700 5516
53043 48111 16830 6717 33068 40604 44174 42268 39430 10262 38348 46210 49689 14917 5852
38805 16023 21289 50227 34539 37575 52370 11629 7484 41295 49614 4178 58846 35878 44760
5546 17779 32223 1100 24605 9229 9488 2620 30231 22059 12478 15802 41570 21884 43326
4030 41170 1297 37142 16752 32023 39927 52082 27982 30932 28714 56531 30428 41187 3782
12355 38623 38114 26920 15417 12766 19511 21524 46558 35222 25266 10430 19896 52865 48480
46329 17083 13977 44378 47861 5858 26251 1358 4604 24850 22357 17066 60308 38005 47328
44775 31725 53348 8456 36444 31864 36820 31487 38167 21569 13717 15186 17649 56557 5090
8935 56966 8233 34887 10648 43782 11056 11793 50211 16251 11715 10433 49687 60105 40506
19243 49047 16023 2777 46504 23902 9678 36520 16056 59901 25585 9135 8429 34036 40913
7345 42738 60119 48981 38863 36956 30813 50059 48785 23428 40153 43278 30166 3862 39599
13601 11954 8636 57159 44094 13967 56766 27607 50636 35311 51827 14060 29270 49804 47059
50452 52185 23432 29431 19143 46394 40922 39803 58706 47308 39192 48169 43089 36389 57227
34543 40567 1462 31007 35807 5543 19854 10800 9337 45422 35897 25505 33937 23425 12792
44259 43359 18684 1823 50069 43123 1808 60288 58601 29009 23092 14688 59917 25440 27083
36511 11391 35881 20860 23564 46978 7456 21943 9189 54756 19835 11271 34378 57761 44081
44272 48359 24321 58096 15305 8636 38673 54157 16703 25942 26069 2709 57044 49089 57552
48399 27306 15721 12054 4919 32847 41648 31915 867 39732 50119 20381 43964 4189 28384
Posteriormente, bajo la hipótesis propuesta de que existen diferencias entre los niveles de estudio
de los hombres y las mujeres en Colombia, se trabajó con la muestra encontrada y usando las
variables género (P6020) y escolaridad (ESC) y se construyeron los siguientes histogramas

Histograma Escolaridad hombres


35
30 29
30

25
Frecuencias

19
20
14
15
11
9 9 9
10 7
6 5 5 5 5
5 3 3 2 2
0
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Escolaridad (Años)

En este puede evidenciarse que los más común es que los hombres en Colombia no ingresen a
estudiar (0 años) o terminen el bachillerato (11 años), también se ve una tendencia a solo terminar
la primaria.

Histograma Escolaridad mujeres


60
53
50

40
Frecuencias

30 26
21
20
12 12 12
8 7 9 10 9 8
10 4 4 6
2 3 1 1
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Escolaridad (Años)

En cuanto a las mujeres, también hay tendencia a estudiar hasta terminar el bachillerato (11 años),
otro tanto a terminar sus estudios con la primaria o no ingresar a ella.

Veamos cómo se ven estos comportamientos al comparar ambos gráficos


Histograma comparativo escolaridad
60

50

40
Frecuencia

30
Hombres
20
mujeres
10

0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

Escolaridad (Años)

Con este nuevo gráfico, podemos ver mayor número de mujeres que terminan su bachillerato,
aunque recordemos que estas tienen mayor proporción de los encuestados y que esto podría
influir en nuestra apreciación. Para ello hemos calculado con las herramientas de Excel los
siguientes datos, representados en la tabla.

Comparaciones
Genero Media Desviación
Hombres 6,79 4,88
Mujeres 7,98 4,71

Estos datos muestran que si existe una diferencia entre los niveles de escolaridad de hombres y
mujeres, y apuntan a que las mujeres tienen un mayor nivel de escolaridad pues presentan un
mayor promedio (7.98) y una menor dispersión (4.71)

Ahora vamos a calcular intervalos de confianza del 95% de confianza para estimar la escolaridad
promedio de los hombres y las mujeres de forma individual.

Par efectuar este cálculo, asumimos que los datos son normales, según la sugerencia del ejercicio
propuesto para este trabajo. Y al tratarse de un análisis para dos proporciones de la muestra
tenemos que la formula a utilizar debe ser

𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
𝑝̂ − 𝑍𝛼 √ < 𝑝 < 𝑝̂ + 𝑍𝛼 √
2 𝑛 2 𝑛

Para lo cual se tiene que:

𝑝̂ : es la proporción que cumple cierta característica en la muestra


𝑝: es la proporción que cumple cierta característica en la población

𝑛: Tamaño de la muestra

𝑍𝛼 : Nivel alfa; valor que en una distribución normal estándar deja a su derecha una probabilidad
2
𝛼
de 2 .

Para calcular primero el intervalo de confianza del 95% para la escolaridad promedio de las
mujeres (208 en la muestra) se hizo uso de los siguientes datos
208
𝑝̂ = 381 = 0.55 𝑎𝑝𝑟𝑜𝑥.

31969
𝑝= 60356
= 0.53 𝑎𝑝𝑟𝑜𝑥.

𝑛: 381

Ahora es necesario calcular el valor de 𝑍𝛼 para lo cual tenemos que


2

100% - 95% =5%

5%
= 2.5%
2

50% − 2.5% = 47.5%

47.5% = 0.475

Este valor en la tabla de distribución normal Z corresponde a 1.96 por lo cual tenemos entonces
que 𝑍𝛼 = 1.96
2

Así,

𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
𝑝̂ − 𝑍𝛼 √ < 𝑝 < 𝑝̂ + 𝑍𝛼 √
2 𝑛 2 𝑛

0.53(0.47) 0.53(0.47)
0.55 − 1.96√ < 𝑝 < 0.55 + 1.96√
381 381

0.55 − 1.96(0.026) < 𝑝 < 0.55 + 1.96(0.026)

0.55 − 0.051 < 𝑝 < 0.55 + 0.051

0.499 < 𝑝 < 0.601

49.9% < 𝑝 < 60.1%


Con lo que se tiene que la escolaridad promedio de las mujeres esta entre un 49.9% y un 60.1%.

Ahora se procede a estimar el intervalo de confianza del 95% para la escolaridad promedio de los
hombres (173 en la muestra), haciendo uso de los siguientes datos:

173
𝑝̂ = = 0.45 𝑎𝑝𝑟𝑜𝑥.
381

28387
𝑝= = 0.47 𝑎𝑝𝑟𝑜𝑥.
60356

𝑛: 381

𝑍𝛼 = 1.96
2

Así,

𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
𝑝̂ − 𝑍𝛼 √ < 𝑝 < 𝑝̂ + 𝑍𝛼 √
2 𝑛 2 𝑛

0.47(0.53) 0.47(0.53)
0.45 − 1.96√ < 𝑝 < 0.45 + 1.96√
381 381

0.45 − 1.96(0.026) < 𝑝 < 0.45 + 1.96(0.026)

0.45 − 0.051 < 𝑝 < 0.45 + 0.051

0.399 < 𝑝 < 0.501

39.9% < 𝑝 < 50.1%

Con lo que se tiene que la escolaridad promedio de los hombres esta entre un 39.9% y un 50.1%.

Comparando ambos intervalos se puede observar que existe una diferencia de 10% en cada uno
de los valores del intervalo.

Procedemos entonces a calcular la diferencia promedio de escolaridad para hombres y mujeres


con un intervalo de confianza del 95% asumiendo nuevamente que los datos son normales según
la sugerencia del ejercicio propuesto para este trabajo.

De acuerdo a las guías de trabajo estudiadas se tiene que para calcular un intervalo para diferencia
de dos proporciones se tiene que:
𝑝1 (1 − 𝑝1 ) 𝑝2 (1 − 𝑝2 )
𝐼 = (𝑃̂1 − 𝑃̂2 ) ± 𝑍𝛼 √ +
2 𝑛 𝑛

Donde 𝑃̂1 y 𝑝1 será para nuestro ejercicio la proporción de mujeres en la muestra y en la población,
respectivamente. Además, 𝑃̂2 y 𝑝2 la proporción de hombres en la muestra y en la población
también respectivamente. 𝑍𝛼 el nivel alfa, correspondiente a 1.96 según se calculó anteriormente.
2

0.53(0.47) 0.47(0.53)
𝐼 = (0.55 − 0.45) ± 1.96√ +
381 381

𝐼 = (0.1) ± 1.96(0.036)

𝐼 = (0.1) ± 0.071

𝐼 = 0.029 = 2.9% 𝐼 = 0.171 = 17.1%

Con un nivel de confianza del 95% se puede decir que la diferencia en la proporción de mujeres y
hombres según el nivel de escolaridad esta entre el 2.9% y el 17.1%

Continuando con los ejercicios propuestos para este trabajo se pretende analizar utilizando la
variable asiste a un establecimiento oficial (P6175) inicialmente con una representación gráfica de
la cantidad de hombres y mujeres que están asistiendo a un establecimiento público para verificar
si es correcto afirmar que los hombres asisten más a un colegio oficial que las mujeres. Los datos
encontrados se presentan a continuación:

Hombres
P6175 Frecuencia
Sí 43
No 16
0 114
Total 173
Mujeres
P6175 Frecuencia
Sí 42
No 15
0 151
Total 208

En los datos analizados se encontró que algunos encuestados no respondieron a esta pregunta ni
de forma afirmativa ni negativa por lo cual se contabilizaron estos espacios en blanco con el valor
0 que nos arroja el programa Excel. El siguiente es el gráfico comparativo para hombres y mujeres.

Diagrama comparativo de asistencia


a establecimientos oficiales
160 151
140
114
120
Frecuencia

100
80
60 Hombres
43 42
40 Mujeres
16 15
20
0
Sí No 0
Asistencia a establecimiento oficial

Según este gráfico no parece existir diferencias entre las mujeres y los hombres que asisten o no a
un establecimiento oficial. Sin embargo, se debe tener en cuenta que tanto en la población como
en la muestra es mayor la proporción de mujeres que las de los hombres, si este gráfico solo
muestra la cantidad de los que asisten o no y los presenta casi iguales, los hombres podrían ser
quienes asistan más a los colegios públicos según su proporción.

La diferencia solo se hace notoria en el número de hombres y mujeres que no contestaron a esta
pregunta.

Procederemos entonces a calcular la proporción de mujeres y de hombres que asisten a un


establecimiento oficial, para lo cual tenemos que:
𝑝(1−𝑝) 𝑝(1−𝑝)
𝑝̂ − 𝑍𝛼 √ < 𝑝 < 𝑝̂ + 𝑍𝛼 √ ,
2 𝑛 2 𝑛

42
Donde 𝑝̂ = 381 0.11 𝑎𝑝𝑟𝑜𝑥. es el número de mujeres que si asiste a un establecimiento oficial.

Con lo que tenemos

0.53(0.47) 0.53(0.47)
0.11 − 1.96√ < 𝑝 < 0.11 + 1.96√
381 381

0.11 − 1.96(0.026) < 𝑝 < 0.11 + 1.96(0.026)

0.11 − 0.051 < 𝑝 < 0.11 + 0.051

0.059 < 𝑝 < 0.161

5.9% < 𝑝 < 16.1%

43
Ahora si 𝑝̂ = 381 0.11 𝑎𝑝𝑟𝑜𝑥. es el número de hombres que si asiste a un establecimiento oficial y

realizando el mismo procedimiento tenemos

0.53(0.47) 0.53(0.47)
0.11 − 1.96√ < 𝑝 < 0.11 + 1.96√
381 381

0.11 − 1.96(0.026) < 𝑝 < 0.11 + 1.96(0.026)

0.11 − 0.051 < 𝑝 < 0.11 + 0.051

0.059 < 𝑝 < 0.161

5.9% < 𝑝 < 16.1%

Estas dos proporciones oscilan dentro del mismo intervalo, lo que confirma lo mostrado en el
gráfico anterior.

Procederemos a continuación a demostrar o rechazar la hipótesis que afirmaba que los hombres
asisten más a un colegio oficial que las mujeres. Para ello realizaremos una prueba de hipótesis y
definiremos los siguientes parámetros
Sea 𝐻0 : los hombres asisten igual o en menor cantidad que las mujeres a un colegio público
(Hipótesis nula). Así, 𝐻1 : los hombres asisten más a colegio público que las mujeres (hipótesis
alternativa). Para lo cual tendremos los siguientes valores.

𝐻0 : 𝜋 ≤ 0.5 𝑦 𝐻1 > 0.5

Según estos valores y atendiendo al material de apoyo estudiado, la hipótesis nula (𝐻0 ) se rechaza
si

𝑃 − 𝜋0
𝑍= > 𝑍𝛼
√𝜋0 (1 − 𝜋0 )
2
𝑛

43
Donde 𝑃 = 0.11 𝑎𝑝𝑟𝑜𝑥. será la proporción de hombres que asisten a un establecimiento
381

oficial, 𝑍𝛼 = 1.96 para un nivel de significancia del 5% y 𝜋0 = 0.5 el valor comparativo para la
2

hipótesis nula.

De esta manera
0.11 − 0.5
𝑍= > 1.96
√0.5(0.5)
381

−0.39
𝑍= > 1.96
0.026

𝑍 = −15 > 1.96

Como la desigualdad obtenida no se cumple no podemos rechazar nuestra hipótesis nula, con lo
cual se podría concluir que los hombres asisten igual o en menor cantidad que las mujeres a un
colegio público.

Conclusiones

Según los datos analizados se puede concluir que existe diferencia entre los niveles de escolaridad
de hombres y mujeres siendo estas las mujeres tienen un mayor nivel de escolaridad pues
presentan un mayor promedio (7.98) y una menor dispersión (4.71)
En cuanto a la asistencia a establecimientos oficiales este trabajo permite evidenciar que los
hombres no asisten más a colegios oficiales que las mujeres.

Cibergrafía
(s.f.). Obtenido de https://www.psyma.com/company/news/message/como-determinar-el-
tamano-de-una-muestra

(s.f.). Obtenido de https://www.youtube.com/watch?v=Y0XLJnGbFQs

(s.f.). Obtenido de https://www.youtube.com/watch?v=CrDDcXUtO-8

(s.f.). Obtenido de http://www.telencuestas.com/calculadora-de-margen-de-error-y-


tama%C3%B1o-de-muestras-para-encuestas

DANE. (s.f.). Obtenido de


http://www.dane.gov.co/files/investigaciones/fichas/empleo/ficha_metodologica_GEIH-
01_V10.pdf

Vous aimerez peut-être aussi