Académique Documents
Professionnel Documents
Culture Documents
Para la selección de la muestra a partir de la base de datos presentada1 y teniendo en cuenta que
cada uno de los encuestados tiene la misma probabilidad de ser elegido, se ha escogido el
muestreo aleatorio simple. Para la aplicación de este tipo de muestreo se puede calcular el
tamaño de la muestra aplicando la siguiente fórmula
𝑁𝑍 2 𝑝𝑞
𝑛=
(𝑁 − 1)𝐸 2 + 𝑍 2 𝑝𝑞
Donde,
N: Tamaño de la población
Z: Nivel de confianza
p: Probabilidad de éxito o proporción esperada
q: Probabilidad de fracaso
E: Error máximo admisible
De esta manera, trabajando con la variable género (P6020), si tenemos en cuenta que el total de
mujeres es de 31969 (valor obtenido con la función de Excel contar si) y el de los hombres es
28387 para un total de 60356 encuestados,
31969
𝑝= = 0.53 𝑎𝑝𝑟𝑜𝑥.
60356
28387
𝑞= = 0.47 𝑎𝑝𝑟𝑜𝑥.
60356
Ahora,
𝑁𝑍 2 𝑝𝑞
𝑛=
(𝑁 − 1)𝐸 2 + 𝑍 2 𝑝𝑞
60356(1.96)2 (0.53)(0.47)
𝑛=
(60356 − 1)(0.05)2 + (1.96)2 (0.53)(0.47)
60356(3.8416)(0.53)(0.47)
𝑛=
(60355)(0.0025) + (3.8416)(0.53)(0.47)
1
El lector puede consultar este archivo en formato Excel en https://goo.gl/zB3Ntf
2
Valor que se puede comprobar en la tabla de distribución Normal
57757.2252
𝑛=
150.8875 + 0.9569
12653.1864
𝑛=
151.8444
De esta manera se hará un análisis a una muestra de 381 encuestados seleccionados de manera
aleatoria. Para esto, se han usado las herramientas que ofrece el programa Excel, en el cual se
aplicaron los siguientes pasos:
1- Enumerar cada uno de los datos de la variable género desde 1 hasta 60356
2- Haciendo uso de la función aleatorio de Excel se obtuvo un primer valor entre 1 y 60356.
3- Se obtienen otros números aleatorios con las mismas condiciones hasta tener un total de 381
datos.
25
Frecuencias
19
20
14
15
11
9 9 9
10 7
6 5 5 5 5
5 3 3 2 2
0
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Escolaridad (Años)
En este puede evidenciarse que los más común es que los hombres en Colombia no ingresen a
estudiar (0 años) o terminen el bachillerato (11 años), también se ve una tendencia a solo terminar
la primaria.
40
Frecuencias
30 26
21
20
12 12 12
8 7 9 10 9 8
10 4 4 6
2 3 1 1
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Escolaridad (Años)
En cuanto a las mujeres, también hay tendencia a estudiar hasta terminar el bachillerato (11 años),
otro tanto a terminar sus estudios con la primaria o no ingresar a ella.
50
40
Frecuencia
30
Hombres
20
mujeres
10
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Escolaridad (Años)
Con este nuevo gráfico, podemos ver mayor número de mujeres que terminan su bachillerato,
aunque recordemos que estas tienen mayor proporción de los encuestados y que esto podría
influir en nuestra apreciación. Para ello hemos calculado con las herramientas de Excel los
siguientes datos, representados en la tabla.
Comparaciones
Genero Media Desviación
Hombres 6,79 4,88
Mujeres 7,98 4,71
Estos datos muestran que si existe una diferencia entre los niveles de escolaridad de hombres y
mujeres, y apuntan a que las mujeres tienen un mayor nivel de escolaridad pues presentan un
mayor promedio (7.98) y una menor dispersión (4.71)
Ahora vamos a calcular intervalos de confianza del 95% de confianza para estimar la escolaridad
promedio de los hombres y las mujeres de forma individual.
Par efectuar este cálculo, asumimos que los datos son normales, según la sugerencia del ejercicio
propuesto para este trabajo. Y al tratarse de un análisis para dos proporciones de la muestra
tenemos que la formula a utilizar debe ser
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
𝑝̂ − 𝑍𝛼 √ < 𝑝 < 𝑝̂ + 𝑍𝛼 √
2 𝑛 2 𝑛
𝑛: Tamaño de la muestra
𝑍𝛼 : Nivel alfa; valor que en una distribución normal estándar deja a su derecha una probabilidad
2
𝛼
de 2 .
Para calcular primero el intervalo de confianza del 95% para la escolaridad promedio de las
mujeres (208 en la muestra) se hizo uso de los siguientes datos
208
𝑝̂ = 381 = 0.55 𝑎𝑝𝑟𝑜𝑥.
31969
𝑝= 60356
= 0.53 𝑎𝑝𝑟𝑜𝑥.
𝑛: 381
5%
= 2.5%
2
47.5% = 0.475
Este valor en la tabla de distribución normal Z corresponde a 1.96 por lo cual tenemos entonces
que 𝑍𝛼 = 1.96
2
Así,
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
𝑝̂ − 𝑍𝛼 √ < 𝑝 < 𝑝̂ + 𝑍𝛼 √
2 𝑛 2 𝑛
0.53(0.47) 0.53(0.47)
0.55 − 1.96√ < 𝑝 < 0.55 + 1.96√
381 381
Ahora se procede a estimar el intervalo de confianza del 95% para la escolaridad promedio de los
hombres (173 en la muestra), haciendo uso de los siguientes datos:
173
𝑝̂ = = 0.45 𝑎𝑝𝑟𝑜𝑥.
381
28387
𝑝= = 0.47 𝑎𝑝𝑟𝑜𝑥.
60356
𝑛: 381
𝑍𝛼 = 1.96
2
Así,
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
𝑝̂ − 𝑍𝛼 √ < 𝑝 < 𝑝̂ + 𝑍𝛼 √
2 𝑛 2 𝑛
0.47(0.53) 0.47(0.53)
0.45 − 1.96√ < 𝑝 < 0.45 + 1.96√
381 381
Con lo que se tiene que la escolaridad promedio de los hombres esta entre un 39.9% y un 50.1%.
Comparando ambos intervalos se puede observar que existe una diferencia de 10% en cada uno
de los valores del intervalo.
De acuerdo a las guías de trabajo estudiadas se tiene que para calcular un intervalo para diferencia
de dos proporciones se tiene que:
𝑝1 (1 − 𝑝1 ) 𝑝2 (1 − 𝑝2 )
𝐼 = (𝑃̂1 − 𝑃̂2 ) ± 𝑍𝛼 √ +
2 𝑛 𝑛
Donde 𝑃̂1 y 𝑝1 será para nuestro ejercicio la proporción de mujeres en la muestra y en la población,
respectivamente. Además, 𝑃̂2 y 𝑝2 la proporción de hombres en la muestra y en la población
también respectivamente. 𝑍𝛼 el nivel alfa, correspondiente a 1.96 según se calculó anteriormente.
2
0.53(0.47) 0.47(0.53)
𝐼 = (0.55 − 0.45) ± 1.96√ +
381 381
𝐼 = (0.1) ± 1.96(0.036)
𝐼 = (0.1) ± 0.071
Con un nivel de confianza del 95% se puede decir que la diferencia en la proporción de mujeres y
hombres según el nivel de escolaridad esta entre el 2.9% y el 17.1%
Continuando con los ejercicios propuestos para este trabajo se pretende analizar utilizando la
variable asiste a un establecimiento oficial (P6175) inicialmente con una representación gráfica de
la cantidad de hombres y mujeres que están asistiendo a un establecimiento público para verificar
si es correcto afirmar que los hombres asisten más a un colegio oficial que las mujeres. Los datos
encontrados se presentan a continuación:
Hombres
P6175 Frecuencia
Sí 43
No 16
0 114
Total 173
Mujeres
P6175 Frecuencia
Sí 42
No 15
0 151
Total 208
En los datos analizados se encontró que algunos encuestados no respondieron a esta pregunta ni
de forma afirmativa ni negativa por lo cual se contabilizaron estos espacios en blanco con el valor
0 que nos arroja el programa Excel. El siguiente es el gráfico comparativo para hombres y mujeres.
100
80
60 Hombres
43 42
40 Mujeres
16 15
20
0
Sí No 0
Asistencia a establecimiento oficial
Según este gráfico no parece existir diferencias entre las mujeres y los hombres que asisten o no a
un establecimiento oficial. Sin embargo, se debe tener en cuenta que tanto en la población como
en la muestra es mayor la proporción de mujeres que las de los hombres, si este gráfico solo
muestra la cantidad de los que asisten o no y los presenta casi iguales, los hombres podrían ser
quienes asistan más a los colegios públicos según su proporción.
La diferencia solo se hace notoria en el número de hombres y mujeres que no contestaron a esta
pregunta.
42
Donde 𝑝̂ = 381 0.11 𝑎𝑝𝑟𝑜𝑥. es el número de mujeres que si asiste a un establecimiento oficial.
0.53(0.47) 0.53(0.47)
0.11 − 1.96√ < 𝑝 < 0.11 + 1.96√
381 381
43
Ahora si 𝑝̂ = 381 0.11 𝑎𝑝𝑟𝑜𝑥. es el número de hombres que si asiste a un establecimiento oficial y
0.53(0.47) 0.53(0.47)
0.11 − 1.96√ < 𝑝 < 0.11 + 1.96√
381 381
Estas dos proporciones oscilan dentro del mismo intervalo, lo que confirma lo mostrado en el
gráfico anterior.
Procederemos a continuación a demostrar o rechazar la hipótesis que afirmaba que los hombres
asisten más a un colegio oficial que las mujeres. Para ello realizaremos una prueba de hipótesis y
definiremos los siguientes parámetros
Sea 𝐻0 : los hombres asisten igual o en menor cantidad que las mujeres a un colegio público
(Hipótesis nula). Así, 𝐻1 : los hombres asisten más a colegio público que las mujeres (hipótesis
alternativa). Para lo cual tendremos los siguientes valores.
Según estos valores y atendiendo al material de apoyo estudiado, la hipótesis nula (𝐻0 ) se rechaza
si
𝑃 − 𝜋0
𝑍= > 𝑍𝛼
√𝜋0 (1 − 𝜋0 )
2
𝑛
43
Donde 𝑃 = 0.11 𝑎𝑝𝑟𝑜𝑥. será la proporción de hombres que asisten a un establecimiento
381
oficial, 𝑍𝛼 = 1.96 para un nivel de significancia del 5% y 𝜋0 = 0.5 el valor comparativo para la
2
hipótesis nula.
De esta manera
0.11 − 0.5
𝑍= > 1.96
√0.5(0.5)
381
−0.39
𝑍= > 1.96
0.026
Como la desigualdad obtenida no se cumple no podemos rechazar nuestra hipótesis nula, con lo
cual se podría concluir que los hombres asisten igual o en menor cantidad que las mujeres a un
colegio público.
Conclusiones
Según los datos analizados se puede concluir que existe diferencia entre los niveles de escolaridad
de hombres y mujeres siendo estas las mujeres tienen un mayor nivel de escolaridad pues
presentan un mayor promedio (7.98) y una menor dispersión (4.71)
En cuanto a la asistencia a establecimientos oficiales este trabajo permite evidenciar que los
hombres no asisten más a colegios oficiales que las mujeres.
Cibergrafía
(s.f.). Obtenido de https://www.psyma.com/company/news/message/como-determinar-el-
tamano-de-una-muestra