Vous êtes sur la page 1sur 11

Facultad de Ingeniería y Ciencia Básicas Estadística II

Presentado a:

Fabio ortegon

Presentado por:

Leady Yazmin Reyes poveda 1714000160

Dayanna Camila Díaz Hernández código 1710650010

Yesica Andrea Lara Gonzales 1811981684

Yury Andrea Quintero Ruge 1611982130

Institución Universitario Politécnico Grancolombiano

Estadística II

Administración de Empresas

Colombia 2018
OBJETIVOS

Identificar a través de los tipos de muestreo existentes si existen diferencias entre los niveles de
estudio de los hombres y mujeres en Colombia.

Determinar si los hombres asisten más a un colegio oficial en Colombia que las mujeres.

Estime la proporción de hombres y de mujeres q asisten a un establecimiento oficial.


1. La información proveniente de la Gran Encuesta Integrada de Hogares (GEIH) en ciudades
principales e intermedias del territorio colombiano, requiere de la caracterización de variables
para un estudio de tipo cualitativo o cuantitativo según el interés del investigador; de manera
apriori, conviene primero estimar el tamaño de una posible muestra, es decir, a aquel
subconjunto que un momento dado se va a seleccionar, para este caso se considera un tamaño
de población conocida de 𝑁 = 60356 individuos. Para tal fin y dada la intención del estudio,
es conveniente estimar una determinada porción que represente a dicha población, esto
conlleva a usar la ecuación:
𝑁. [𝑍𝛼/2 ]2 . 𝑝. 𝑞
𝑛= .
(𝑁 − 1). 𝑒 2 + 𝑍𝛼/2 2 . 𝑝. 𝑞

Como sugerencia convencional se debe considerar un nivel de confianza usual del 95%, con
un error del 5%. De donde 𝑝 = .5 y 𝑞 = .5, respectivamente, ... <Sea asume que los datos
tienen una distribución cuasi- normal >. Por cuanto, resolviendo para 𝑛 en estos valores
tenemos:

60356. [1,96]2 . (0,5). (0,5)


𝑛= .
60355. (0.05)2 +. [1,96]2 (0,5). (0,5)
𝑛 = 381,6609.
𝑛 ≈ 381.
Lo anterior es válido si se considera que muestra finita con N < 100.000.

Lo anterior indica que un posible tamaño de muestra para representar a dicha población debe estar
al rededor de 𝑛 ≈ 381 individuos, ...< según convenga el tipo de muestreo >; la tabla siguiente
muestra las variables de intervención que en este caso se pretenden estudiar.

Variable Posición Etiqueta


DIRECTORIO 1 DIRECTORIO
SECUENCIA_P 2 SECUENCIA_P
ORDEN 3 ORDEN
HOGAR 4 HOGAR
REGIS 5 REGISTRO DE LA ENCUESTA
P6016 6 QUIEN PROPORCIONA LA MAYOR PARTE DE LA INFORMACIÓN DE ESTE MIEMBRO DEL HOGAR
P6020 7 ¿ES HOMBRE O MUJER?
P6030 8 ¿CUÁL ES LA FECHA DE NACIMIENTO DE … ?
P6030S1 9 MES (MM):
P6030S3 10 AÑO (AAAA):
P6040 11 ¿CUÁNTOS AÑOS CUMPLIDOS TIENE...? (SI ES MENOR DE 1 AÑO, ESCRIBA 00)
P6050 12 ¿CUÁL ES EL PARENTESCO DE ... CON EL JEFE O JEFA DEL HOGAR?

P6070 13 ACTUALMENTE:
P6090 ¿... ESTÁ AFILIADO, ES COTIZANTE O ES BENEFICIARIO DE ALGUNA ENTIDAD DE SEGURIDAD
14
SOCIAL EN SALUD?
P6140 ¿ANTERIORMENTE ESTUVO ... AFILIADO, FUE COTIZANTE O BENEFICIARIO DE ALGUNA ENTIDAD DE
15
SEGURIDAD SOCIAL EN SALUD?
P6150 ¿CUÁNTOS MESES HACE QUE ... NO ESTÁ AFILIADO O NO COTIZA A LA SEGURIDAD SOCIAL EN
16
SALUD?
P6100 17 ¿A CUAL DE LOS SIGUIENTES REGÍMENES DE SEGURIDAD SOCIAL EN SALUD ESTÁ AFILIADO:
P6110 18 ¿QUIÉN PAGA MENSUALMENTE POR LA AFILIACIÓN DE ...?
P6120 ¿CUÁNTO PAGA O CUÁNTO LE DESCUENTAN MENSUALMENTE? (SI NO SABE CUANTO PAGA O
19
CUANTO LE DESCUENTAN ESCRIBA 98)
P6125 ¿EN LOS ÚLTIMOS DOCE MESES DEJÓ DE ASISTIR AL MÉDICO O NO SE HOSPITALIZÓ, POR NO TENER
20
CON QUE PAGAR ESTOS SERVICIOS EN LA EPS O ARS?
P6160 21 ¿SABE LEER Y ESCRIBIR?
P6170 22 ¿ACTUALMENTE ... ASISTE A LA ESCUELA, COLEGIO O UNIVERSIDAD?
P6175 23 EL ESTABLECIMIENTO AL QUE ASISTE ... ¿ES OFICIAL?
P6210 ¿CUÁL ES EL NIVEL EDUCATIVO MÁS ALTO
24 ALCANZADO POR... Y EL ÚLTIMO AÑO O GRADO
APROBADO EN ESTE NIVEL?
P6210S1 25 GRADO
P6220 26 ¿CUÁL ES EL TÍTULO O DIPLOMA DE MAYOR NIVEL EDUCATIVO QUE USTED HA RECIBIDO?
CLASE 27 CLASE
ESC 28 ESCOLARIDAD
MES 29 MES
DPTO 30 DEPARTAMENTO
AREA 31 AREA
fex_c_2011 32 FACTOR DE EXPANSIÓN

Al criterio: "entendiendo por tal una parte representativa de la población", y una vez pre-
fijado el tamaño muestral requerido de 𝑛 ≈ 381, en este orden, el tipo de muestreo más
adecuado que puede dar lugar al estudio de carácter representativo, sugiere usar un tipo de
muestreo probabilístico ya sea: <Aleatorio simple, Sistemático, Estratificado o por
Conglomerados >, lo cual garantiza que todas las unidades de estudio tengan la misma
oportunidad de ser elegidas, por lo que tal selección, deberá permitir la extrapolación de los
resultados en ésta población de estudio. No obstante, es importante que antes de ejecutar el
muestreo se analice muy bien la variable de intervención sobre la cual se va a realizar el trabajo.
2. Dado que la variable de interés es de tipo cualitativa dicotómica, se asume un subgrupo de
estudio como lo es el género, realizando un aserie de cálculos en Excel encontramos que: el
porcentaje de Mujeres es de 52,96% y el de Hombres es de 47,03%, esto sugiere incluir de
una u otra manera, más mujeres que hombres, puesto que genero mujer es el más
representativo en ésta sub-población, por cuanto se propone entonces la toma de una muestra
estratificada proporcionada en relación al tamaño de la población. Los estratos a trabajar en
este caso son el ser "hombre o mujer", según el método, se deberá calcular un tamaño de
muestra para cada género, logrando que la muestra sea representativa para emular a la
población.

Por lo anterior, fijaremos un nivel de confianza del 95%, con un límite de error no superior a
𝑒 = 2, de tal manera que realizaremos la estimación del número de unidades por cada uno de
los estratos, como la muestra está en función de los diferentes estratos, se denominara afijación
proporcional, puesto que cada estrato se encuentra representado en la muestra en
correspondencia al tamaño de la población.

Así, la varianza V tiene por ecuación:


2
2
𝑒
𝑉=[ ] ,
𝑍𝛼
2

22
esto es, 𝑉 = , es decir 𝑉 = 1,041232.
1,962

Para la estimación previa de 𝑛0 , se tiene que:


𝑘
1
𝑛0 = ∑ 𝑁𝑖 𝑆𝑖 2
𝑁. 𝑉
𝑖=1

de donde 𝑁𝑖 es el tamaño de cada estrato y 𝑆𝑖 2 varianza de cada estrato, como se trata de una
afijación proporcional el tamaño de cada uno de los estratos deberá ser 𝑛𝑖 , de donde

𝑁𝑖 𝑛0
𝑛𝑖 = 𝑛 ∗ , 𝑐𝑜𝑛 𝑛= 𝑛
𝑁 1+ 0
𝑁

Para el caso de la estimación de la proporción del género Mujer será de 𝑝̂ = 𝑁𝑖 ⁄𝑛, así,
𝑝̂ = 0,470. de donde 𝑝̂ es una estimación puntual.

3. Intervalo de confianza para dos variables numéricas

Un investigador, cree determinar que existen diferencias entre los niveles de estudio de los
hombres y las mujeres en Colombia. Para determinar lo anterior, use la “muestra” encontrada
en la semana 3:

a. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma para los
hombres y mujeres. Según los resultados, ¿Existen diferencias?
8000
Mujer. Hombre.
6000

4000

2000

0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

Mujer 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
fi 4389 805 1304 1459 1140 3678 1331 1461 1380 1441 853 6530 736 1389 1068 475 1719 329 303 68 39 34 14 11 4
Hombre 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Fi 4350 798 1211 1340 1106 3155 1278 1355 1261 1244 752 5624 589 955 833 393 1370 271 268 97 37 41 20 16 6

En este caso, se opto por determinar la frecuencia absoluta correspondiente a la escolaridad


para cada uno de los géneros dando como resultado 27 categorías de escolaridad para
hombres y mujeres respectivamente. Realizado el en conteo y construido el histograma de
frecuencias absolutas por cada nivel de escolaridad, se superponen los resultados como lo
muestra la gráfica, encontrando un nivel de escolaridad mayor en el género Mujer, así
mismo, se observa una fuerte tendencia en los niveles de escolaridad < 0, 5 y 11> como
también un sesgo de tipo positivo a medida que aumenta el nivel de escolaridad tanto en
Hombres como en Mujeres.

b. Asumiendo que los datos son normales, calcule un intervalo de confianza del 95% para
estimar, la escolaridad promedio de los hombres y de las mujeres de forma individual, en
los niveles de estudio de Bachiller, Tecnólogo y Universitario.
Dado que se asume condición de normalidad; respecto a la media tenemos la siguiente
ecuación para la estimación de las medias respectivas:

𝜎
𝜇 = 𝑥̅ ∓ 𝑍𝛼/2
√𝑛

Para un 95% de confianza y dado 𝑍𝛼/2 = 1,96, con 𝜎 y 𝑛 conocidas respectivamente,


se consideran los siguientes valores de los intervalos de confianza para cada uno de los
niveles de estudio como lo son "Bachiller, Tecnólogo y Universitario".

No sabe no Técnico o
Ninguno Bachiller. Universitario Postgrado
responde Tecnológico
Hombre. Media 9,9811 4,099170 8,61038 3,108165 5,2422998 7,5027523
σ 0,569951 3,497835269 4,065408027 2,112452187 1,106093296 1,95173653
Total 7112 1432 1460
Mujer. Media 9,98231 6,0000 8,746560 2,9655805 5,0983333 7,171849
σ 0,530904 5,65685425 4,00411623 2,11714096 0,84205570 1,6610069
Total 2 8139 2178 1779

Bachiller. 8,515891508 8,704862148


Técnico o
Hombre. 2,998751054 3,217578325
Tecnológico
Universitario 5,185562137 5,299037452

Bachiller. 8,659568616 8,833551777


Técnico o
Mujer. 2,876665158 3,054495925
Tecnológico
Universitario 5,059203417 5,13746325
c. Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para
estimar la diferencia promedio de escolaridad para los hombres y mujeres, en los niveles
de estudio de Bachiller, Tecnólogo y Universitario.

La diferencia de medias en este caso se utiliza para comprar datos de dos conjuntos de
valores < Hombres, Mujeres > Asumiendo que los datos son normales, se
considera la diferencia:

𝜎1 2 𝜎2 2
𝜇 ̂2 ≈ (𝑥
̂1 − 𝜇 𝑥2 ) ∓ 𝑍𝛼/2 (√
̅̅̅1 − ̅̅̅ + )
𝑛1 𝑛2

Así, para el caso de género Mujer y Hombre respectivamente se tiene que:

Bachiller. 0,007750465 0,264616272 A favor de las Mujeres.


Técnico o
Tecnológico
-0,283570988 -0,001597307 A favor de los Hombres.

Universitario -0,21288897 -0,00992253 A favor de los Hombres.


Conclusión

El muestreo es una actividad por la cual se toman varias muestras de una población de
elementos, sobre los cuales se tomarán ciertos criterios de decisión, es importante ya que a través
de él podamos hacer análisis de situaciones de una empresa o de algún campo de la sociedad,
dado por sentado que los resultados obtenidos en la muestra son de hecho representativa de toda
la población, la principal ventaja es que es mucho más sencillo trabajar una pequeña parte de un
todo.

La utilización del muestreo permite al auditor la selección de una muestra eficiente y objetiva
midiendo en si la suficiencia de la muestra obtenida y cuantificando el riesgo del muestreo.
Bibliografía. _______________________________________________________________________________________________________
[1] Elorza P. y Tejada H. Estadística para las ciencias sociales, del comportamiento y de la salud, 3ª. Ed. Cengage L. Editores, México, 2008.
[2] Walpole, Ronald E. Probabilidad y Estadística para ingenieros, 6ª. Ed. Prentice - Hall Hispano América SA., México, 1999.
[3] Anderson & Williams. Estadística para administración y Economía, 10ª. Ed. Cengage Learning Editores, S.A., México, 2008.
[4] Martínez Ciro. Estadística y Muestreo. 13ª. Ed. Ecoe Ediciones, Bogotá, 2012.
[5] Devore Jay. Probabilidad y Estadística, 7ª. Ed. Thomson. México, 2005.

Vous aimerez peut-être aussi