Vous êtes sur la page 1sur 21

INSTITUCION UNIVERSITARIA POLITECTICO GRANCOLOMBIANO

FACULTAD DE CIENCIAS – ESTADISTICA II

TRABAJO COLABORATIVO

CORREA POLONIA KARLA KATHERINE


GODOY MONTAÑEZ PAULA ANDREA
LOZANO RICARDO KARINA DEL CARMEN
VILLALOBOS ALFONSO ANGIE CAROLINA

ESTADISTICA II – SUB-GRUPO 28

CICLO I – 2019

TUTOR: EFRAIN MORENO SARMIENTO

MODALIDAD VIRTUAL

JUNIO – 2019

1
CONTENIDO

Contenido
1. OBJETIVOS.................................................................................................................... 3
1.2. OBJETIVO GENERAL: ............................................................................................................. 3
1.3. OBJETIVOS ESPECIFICOS: ................................................................................................... 3
2. CONTEXTO .................................................................................................................... 4
3. PARTE 1: SELECCIÓN DE MUESTRA .......................................................................... 4
3.1. En ocasiones en que no es posible o conveniente realizar un censo (analizar a
todos los elementos de una población), se selecciona una muestra, entendiendo por tal
una parte representativa de la población. En ese sentido, escoja un tipo de muestreo y
argumente la viabilidad de esta técnica para la base de datos dada. Para seleccionar una
muestra debe tenerse en cuenta el cómo seleccionar los elementos que formarán parte de
la muestra (tipo de muestreo) y cuántos elementos debemos seleccionar (Tamaño de
muestra). ............................................................................................................................................. 4
3.2. Utilizando la variable género P(6020) determine el tamaño de la muestra
seleccionando adecuadamente justificando: ............................................................................... 5
4. INTERVALO DE CONFIANZA PARA DOS VARIABLES NUMÉRICAS......................... 9
4.1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma para
los hombres y mujeres. Según los resultados, ¿Existen diferencias? ...................................... 9
4.2. Asumiendo que los datos son normales, calcule un intervalo de confianza del 95%
para estimar, la escolaridad promedio de los hombres y de las mujeres de forma individual,
en los niveles de estudio de Bachiller, Tecnólogo y Universitario. .......................................... 10
4.3. Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95%
para estimar la diferencia promedio de escolaridad para los hombres y mujeres, en los
niveles de estudio de Bachiller, Tecnólogo y Universitario. ...................................................... 14
5. PRUEBA DE HIPÓTESIS PARA DOS VARIABLES CUALITATIVAS ......................... 15
5.1. Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y
sexo (P6020), realice un diagrama de barras comparativo para los hombres y mujeres en
un solo gráfico. Según los resultados, ¿Existen diferencias? .................................................. 15
4.2. Con un nivel de confianza del 95%, estime e interprete la proporción de hombres y de
mujeres que asisten a un establecimiento oficial. ...................................................................... 16
6. CONCLUSIONES ......................................................................................................... 20

2
1. OBJETIVOS

1.2. OBJETIVO GENERAL:

 Seleccionar una muestra a partir de una población de 60.356 personas,


aplicando un muestreo estratificado con el fin de interpretar y conocer un
análisis de datos, determinando diferencias en el nivel educativo de los hombres
y mujeres en Colombia.

1.3. OBJETIVOS ESPECIFICOS:

 Fijar un grado de confianza y un error máximo permisible en la población,


hallado una muestra representativa de hombres y mujeres.

 Establecer diferencias en los niveles de estudio y la asistencia a un colegio


oficial entre hombres y mujeres de la muestra seleccionada.

 Calcular un intervalo de confianza del 95%, estimando la escolaridad promedio


y la diferencia promedio de los hombres y mujeres según su nivel de escolaridad

 Realizar una prueba de hipótesis fijando un nivel de significancia del 5%, para
dos muestras.

3
2. CONTEXTO

A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares


(GEIH), realizada por el DANE[1]. Esta encuesta se hace en las 13 ciudades
principales de Colombia (Bogotá, Medellín, Cali, barranquilla, Bucaramanga,
Manizales, Pasto, Pereira, Ibagué, Cúcuta, Villavicencio, Montería, Cartagena) y 11
ciudades intermedias (Tunja, Florencia, Popayán, Valledupar, Quibdó, Neiva,
Riohacha, Santa Marta, Armenia, Sincelejo, San Andrés). Esta encuesta, se solicita
información sobre las condiciones de empleo de las personas (si trabajan, en qué
trabajan, cuánto ganan, si tienen seguridad social en salud o si están buscando
empleo), además de las características generales de la población como sexo, edad,
estado civil y nivel educativo, se pregunta sobre sus fuentes de ingresos. La GEIH
proporciona al país información a nivel nacional, cabecera - resto, regional,
departamental, y para cada una de las capitales de los departamentos.

3. PARTE 1: SELECCIÓN DE MUESTRA

3.1. En ocasiones en que no es posible o conveniente realizar un censo


(analizar a todos los elementos de una población), se selecciona una
muestra, entendiendo por tal una parte representativa de la población. En
ese sentido, escoja un tipo de muestreo y argumente la viabilidad de esta
técnica para la base de datos dada. Para seleccionar una muestra debe
tenerse en cuenta el cómo seleccionar los elementos que formarán parte
de la muestra (tipo de muestreo) y cuántos elementos debemos
seleccionar (Tamaño de muestra).

Solución:
El tipo de muestreo que se escogió fue muestreo estratificado.
Se escogió este muestreo ya que podemos resaltar los grupos y subgrupos de dicha
población, ya que, con esta técnica, tenemos una precisión estadística más elevada
en comparación con el muestreo aleatorio simple.
Las variables que vamos a utilizar principalmente P6020, correspondiente al género
(hombre - mujer), donde hombre se identificara con el #1 y mujer con el #2.
Otra variable que escogí es la P6160 que corresponde a las personas que saben o no
saben leer y escribir. Donde las que saben se identifican con el #1 y las que no, con el
#2.

4
3.2. Utilizando la variable género P(6020) determine el tamaño de la muestra
seleccionando adecuadamente justificando:

a. Fórmula a desarrollar
b. Estimación de la proporción de mujeres
c. Nivel de confiabilidad
d. Error de estimación

Solución:
Para iniciar, se realiza la siguiente tabla de frecuencia indicando la cantidad de
mujeres y la cantidad de hombres que conforman la población

Se puede observar que del 100% de la población, el 45,8% son hombres y el 54,2%
son mujeres.
Para estimar el tamaño de la muestra se realiza lo siguiente. Donde se fija un grado
de confianza de 0,95 y se fijo un error máximo permisible de 0,11

5
FORMULA

Se ha fijado el tamaño de la muestra, donde se toma una muestra de 36 personas


que son hombres, y 43 que son mujeres.
Se escogió la variable P6160 que corresponde a las personas que saben o no saben
leer y escribir. Las personas que saben leer y escribir se identifican con el #1, y las
que no saben, con el #2.
Para seleccionar los 36 hombres y las 43 mujeres, se enumeró cada persona de la
población (desde 1, hasta 60.356), seguidamente se ordenaron las dos variables, 1.
hombre, 2 mujeres.

6
Luego se realizó un muestreo aleatorio, seleccionando como muestra 43
mujeres, donde nos indica quienes de ellas saben leer y escribir y quién no. Esto se
visualiza en la siguiente tabla.

De la muestra que se tomó de mujeres, podemos observar en la anterior tabla que una
mujer no sabe leer ni escribir, donde esta mujer es la número 42 de la muestra, y la
numero 458 de la población.

7
Luego se realizó lo mismo con la variable de los hombres, seleccionando 36 hombres
como muestra, donde nos indica quienes de ellos saben leer y escribir y quién no.
Esto se visualiza en la siguiente tabla.

podemos ver que solo una persona de la muestra que se tomó de los hombres, no
sabe leer ni escribir, donde este hombre, es el número 18 de la muestra y número
27.957 de la población.

8
4. INTERVALO DE CONFIANZA PARA DOS VARIABLES NUMÉRICAS

Un investigador, cree determinar que existen diferencias entre los niveles de estudio
de los hombres y las mujeres en Colombia. Para determinar lo anterior, use la
“muestra” encontrada en la semana 3:

4.1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un


histograma para los hombres y mujeres. Según los resultados, ¿Existen
diferencias?

Para realizar este punto lo que se hizo hice fue escoger 6 tipos de escolaridad, como
se evidencia en las siguientes tablas, donde se muestra los hombre y mujeres que
tienen el número de escolaridad indicado en la tabla.

con la información anterior se procede a realizar la gráfica

9
Como podemos observar en las tablas y en las gráficas, si existen diferencias en el
grado de escolaridad, como, por ejemplo:
Se observa, la variable de escolaridad de 22 años de estudio se puede evidenciar que
de las personas encuestadas 20 hombres tuvieron un estudio de 22 años, y 14 mujeres
tuvieron un estudio de 22 años, esto nos genera una diferencia de 6.
También observamos, la variable de escolaridad de 18 años de estudio, se evidencia
que 308 hombres tuvieron un estudio de 18 años, y 163 mujeres tuvieron un estudio
de 18 años, lo que nos genera una diferencia de 145.
Es notable que los hombres tienen más años de estudio que las mujeres, esto respecto
a las muestras que se seleccionaron.

4.2. Asumiendo que los datos son normales, calcule un intervalo de confianza
del 95% para estimar, la escolaridad promedio de los hombres y de las
mujeres de forma individual, en los niveles de estudio de Bachiller,
Tecnólogo y Universitario.

 Para estimar la escolaridad promedio de los hombres se realizó la siguiente


tabla, donde nos indica la muestra de 36 hombres, donde estos se escogieron
aleatoria mente, indicando la variable de escolaridad y la variable P6220,
correspondiente a los niveles de estudio, en este caso bachiller, tecnólogo y
universitario.

10
Después de seleccionar las 36 personas de la muestra con niveles de estudio de
Bachiller, Tecnólogo y Universitario, y con la variable de escolaridad indicada en
la anterior tabla, se procede a sacar los siguientes datos

INTERVALO DE CONFIANZA PARA LOS HOMBRES

Formula

INTERVALO:

INTERPRETACIÓN: Con una confianza del 95% podemos estimar que la escolaridad
promedio por individuo en la población de hombres esta entre 5 y 8 años de estudio.

11
 Para estimar la escolaridad promedio de las mujeres se realizó la siguiente
tabla, donde nos indica la muestra de 43 mujeres, donde estos se escogieron
aleatoria mente, indicando la variable de escolaridad y la variable P6220,
correspondiente a los niveles de estudio, en este caso bachiller, tecnólogo y
universitario.

Después de seleccionar la muestra de 43 personas, con niveles de estudio de


Bachiller, Tecnólogo y Universitario, y con la variable de escolaridad indicada en la
anterior tabla, se procede a sacar los siguientes datos.

12
INTERVALO DE CONFIANZA PARA LOS HOMBRES

Formula

INTERVALO

INTERPRETACIÓN: con una confianza del 95% podemos estimar que la escolaridad
promedio por individuo en la población de mujeres esta entre 6 y 9 años de estudio.

13
4.3. Asumiendo que los datos son normales, calcule un Intervalo de confianza
al 95% para estimar la diferencia promedio de escolaridad para los
hombres y mujeres, en los niveles de estudio de Bachiller, Tecnólogo y
Universitario.

Para la realización de este punto se calcularon y se tuvieron en cuenta los siguientes


datos:

DIFERENCIA PROMEDIO DE ESCOLARIDAD EN HOMBRES Y MUJERES

INTERVALO:

INTERPRETACIÓN Con una confianza del 95%, podemos estimar que la diferencia
promedio de escolaridad entre hombres y mujeres en la población está entre -3,19 y
1,19 años de estudio, como hay cambio en el sentido de los signos no se puede
concluir que haya diferencia de los años de escolaridad en la población con estas
muestras.

14
5. PRUEBA DE HIPÓTESIS PARA DOS VARIABLES CUALITATIVAS

Un investigador, cree determinar que los hombres asisten más a un colegio oficial que
las mujeres en Colombia. Para determinar lo anterior, use la “muestra” encontrada en
la semana 3:

5.1. Utilizando la variable si actualmente asiste a un establecimiento oficial


(P6175) y sexo (P6020), realice un diagrama de barras comparativo para
los hombres y mujeres en un solo gráfico. Según los resultados, ¿Existen
diferencias?

Para la realización de este punto se realizó la siguiente tabla donde se evidencia que,
para una muestra de 43 mujeres, 28 de ellas si asisten a un establecimiento oficial y
15 no. De igual forma para la muestra de 36 hombres, 27 de ellos asisten a un
establecimiento oficial y 9 no.

Como se observa en el diagrama de barras y de acuerdo a la muestra tomada, se


evidencia que hay un poco de diferencia entre las mujeres y hombres que asisten a un
establecimiento oficial, se evidencia que los hombres a pesar de que la muestra fue
de 36 personas, un grado alto de personas asisten a establecimiento oficial, mientras
que en la muestra que se tomó de las mujeres que fue de 43 personas, siempre hay
un grado alto de las personas que no asisten a un establecimiento oficial.
Si lo miramos por el lado de porcentajes, el 75% de los hombres asisten a un
establecimiento oficial, mientras que las mujeres que asisten a un establecimiento
oficial el porcentaje es del 65%.

15
4.2. Con un nivel de confianza del 95%, estime e interprete la proporción de
hombres y de mujeres que asisten a un establecimiento oficial.

 Para la realización de este punto se realiza las siguientes tablas, donde la primera
hace referencia a las mujeres, se seleccionan 43 personas aleatoria mente
señalando si asisten o no a un establecimiento oficial, (en la columna 3 el número
1 hace referencia a que si asisten y el numero 2 hace referencia a que no asiste).
Y se realiza lo mismo para la muestra de 36 hombres.

16
Posterior a ello se sacaron los siguientes datos
Para las mujeres, se saca la proporción, donde esta es igual a 28 personas que si
asisten a un establecimiento oficial, sobre el valor de la muestra.

Sabiendo que Z=,196 y n=43, se procede a realizar la siguiente formula.

FORMULA

INTERPRETACIÓN:
Tenemos una certeza del 95% de que la verdadera proporción de las mujeres que si
asisten a un establecimiento oficial esta entre el 50,8% y el 79,3%

17
 Para estimar e interpretar la proporción de hombre que asisten a un
establecimiento oficial, se realizó los siguientes procedimientos:

18
Posterior a ello se sacaron los siguientes datos
Para los hombres, se saca la proporción, donde esta es igual a 27 personas que si
asisten a un establecimiento oficial, sobre el valor de la muestra.

Sabiendo que Z=,196 y n=36, se procede a resolver la siguiente formula.

FORMULA

INTERPRETACIÓN:
Tenemos una certeza del 95% de que la verdadera proporción de los hombres que si
asisten a un establecimiento oficial esta entre el 60,8% y el 89,1%.

19
6. CONCLUSIONES

Desarrollado nuestro trabajo el cual pretendía analizar los datos presentados en la


base de datos inicial para dar respuesta a varios interrogantes, es así como en cada
una de las semanas se logra el objetivo planteado para cada una de ellas.
Inicialmente escogimos el tipo de muestro que en nuestro caso fue estratificado,
teniendo en cuenta que éste nos permite dividir la población en grupos y subgrupos y
seleccionar muestras aleatorias para definir lo que queremos puntualmente, por
nuestra parte decidimos al iniciar evaluar la muestra en genero donde 45,8% son
hombres y 54,2% son mujeres con una confianza del 95% y un margen de error
máximo permitido de 11%, de ello obtuvimos una muestra de 79 personas
encuestadas.
Se analizó el número de años que las personas seleccionadas en la muestra a tenido
como estudio a lo largo de sus vidas, encontrando diferencias entre los dos géneros
(hombre y mujer), del total de la muestra el número de años de escolaridad
predominante fue 4 años, sin embargo donde se evidencia mayor diferencia es en 18
años de escolaridad puesto que los hombres tienen 145 personas más que las mujeres
con este número de años estudiados, este junto a 22 años cursados son los únicos
ítems donde los hombres sobrepasan a las mujeres, en este análisis utilizamos
histograma para dar un enfoque grafico a los resultados de nuestra investigación y es
un poco más fácil determinar las diferencias a simple vista.
Seguidamente quisimos determinar la escolaridad promedio entre hombres y mujeres
para los niveles de estudio (bachiller, técnico y universitario) trabajamos con un
intervalo de confianza del 95% que es recomendable para que nuestra investigación
obtenga resultados determinantes, en el caso de los hombres el intervalo de confianza
resultante fue (5,5028;8,4970) y en las mujeres (6,6474; 9,3525) en términos puntuales
decimos que la escolaridad promedio por individuo en la población de hombres está
entre 5 y 8 años de estudio, y en la población de mujeres la escolaridad promedio fue
de 6 y 9 años de estudio, la diferencia entre la escolaridad promedio generada y
mencionada anteriormente está entre (-3,19 y 1,19) años de estudio por el sentido de
los signos no podemos definir diferencias en la escolaridad promedio por cada género
de la muestra.
De acuerdo a la interpretación del diagrama de barras respecto a las personas que
asisten a un establecimiento oficial, se evidencio que de la muestra de hombres que
es menor a la muestra de mujeres, sobrepasa en un 10% a las mujeres.
Según el análisis en la estimación y proporción de hombres y de mujeres que asisten
a un establecimiento oficial, nos da como resultado que tenemos una certeza del 95%,
que la proporción de las mujeres que si asisten a un establecimiento oficial esta entre
el 50,8% y el 79,3%. Y la proporción de los hombres esta entre el 60,8% y el 89,1%.

20
Con el ejercicio desarrollo en el transcurso de estas semanas podemos determinar que
la estadística juega un papel importante en las investigaciones de cualquier entidad u
organización, dado que se puede utilizar para cualquier campo de acción donde
queramos determinar y hallar cualquier variable, es necesario aplicar correctamente
las fórmulas para tener resultados védicos y generar conclusiones acordes a nuestro
planteamiento inicial.

21

Vous aimerez peut-être aussi