Vous êtes sur la page 1sur 18

P ági n a |1

POLITECNICO GRANCOLOMBIANO

Trabajo colaborativo

GRAN ENCUESTA INTEGRADA DE HOGARES (GEIH)

Guerrero Paez Jenny Paola

Pulido Cubillos Jessica Paola

ESTADISTICA II

Tutor: Velasquez Diana

2019
P ági n a |2

ÍNDICE

1. Objetivos.

2. Desarrollo de la actividad.

3. Conclusiones.

4. Referencias.
P ági n a |3

OBJETIVOS

• Conocer y trabajar conceptos básicos de la estadística descriptiva, identificando que

opciones de muestreo existen y en qué circunstancias aplicar, en nuestro caso utilizamos

tipo de muestreo aleatorio o probabilístico.

• Analizar situaciones representadas en los gráficos e histogramas.

• Adquirir habilidades para conseguir una tabla de frecuencias, un diagrama de barras y

algunos índices descriptivos, y saber interpretar los mismos.

• Cuestionar la validez y generalidad de las afirmaciones en relación a los conocimientos

del método estadístico adquiridos en los módulos trabajados.


P ági n a |4

DESARROLLO DE LA ACTIVIDAD

PARTE 1 (semana 3) Selección de muestra:

1. En ocasiones en que no es posible o conveniente realizar un censo (analizar a

todos los elementos de una población), se selecciona una muestra, entendiendo

por tal una parte representativa de la población. En ese sentido, escoja un tipo de

muestreo y argumente la viabilidad de esta técnica para la base de datos dada.

Para seleccionar una muestra debe tenerse en cuenta el cómo seleccionar los

elementos que formarán parte de la muestra (tipo de muestreo) y cuántos

elementos debemos seleccionar (Tamaño de muestra).

Para este caso debemos considerar realizar el muestreo con la opción "Muestreo aleatorio o

probabilístico". Esto porque sabemos qué posibilidades hay de que un elemento de la población

proporcionada en este caso por el DANE figure o no en la muestra. Basándonos en el Excel

anexo. Y de este tipo escogeremos un sub tipo, "Muestreo aleatorio simple", Esto porque todos

los elementos suministrados por el DANE tienen la misma probabilidad de ser seleccionados

puesto que la variable para muestrear es el "género".

TAMAÑO DE MUESTRA DE POBLACION FINITA PARA UNA PROPORCION


P ági n a |5

n: Tamaño de muestra

N: Tamaño de Población

d: Error o precisión, si no se tienen datos se usa 5%

p: Proporción esperada, si no se tienen datos se usa 50% lo que maximiza la muestra

q: 1 - p

Za/2: Parámetro de la distribución normal según el nivel de confianza escogido, si no se tienen

datos se usa habitualmente un nivel de confianza del 95%

Se presentan algunos valores convencionales:

2. Utilizando la variable género P(6020) determine el tamaño de la muestra

seleccionando adecuadamente justificando:

a. Fórmula a desarrollar

b. Estimación de la proporción de mujeres

c. Nivel de confiabilidad

d. Error de estimación
P ági n a |6

TAMAÑO DE MUESTRA 382

Se usa el muestreo aleatorio porque es el más comúnmente utilizado, es el método que da igual

importancia a todos los datos . La muestra aportada contiene proporcionalmente todas las

características de la población.

• Se toma la columna P6020 de la tabla de datos original

• Se numera de 1 a 60356

• Se incluye una columna con un valor aleatorio

• Se ordena de menor a mayor la columna del dato aleatorio

• Se toman los 382 primeros datos los cuales corresponderán a la muestra

• Se hace el conteo de la variable hombre y mujer tanto para la población como para la

muestra

• Se calcula la proporción de hombres y mujeres para la proporción como para la muestra


P ági n a |7

PARTE 2 (semana 4) Intervalo de confianza para dos variables numéricas

Un investigador, cree determinar que existen diferencias entre los niveles de estudio de los

hombres y las mujeres en Colombia. Para determinar lo anterior, use la “mues tra”

encontrada en la semana 3:

1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma

para los hombres y mujeres. Según los resultados, ¿Existen diferencias?


P ági n a |8
P ági n a |9

• Se hace una tabla dinámica con la muestra de 382 datos y se toman los años de

escolaridad por sexo, obteniendo las columnas de hombres y mujeres con las cuales se

hace la gráfica de histograma.

• Las gráficas tienen tendencias relativamente similares, aunque no coinciden sus valores

ambas tienen valores extremos en los mismos niveles de escolaridad y sus formas

poligonales deben ser muy parecidas.

2. Asumiendo que los datos son normales, calcule un intervalo de confianza del

95% para estimar, la escolaridad promedio de los hombres y de las mujeres de

forma individual, en los niveles de estudio de Bachiller, Tecnólogo y

Universitario.
P á g i n a | 10

SOLUCION

3. Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95%

para estimar la diferencia promedio de escolaridad para los hombres y mujeres,

en los niveles de estudio de Bachiller, Tecnólogo y Universitario.

Valores de T

En conclusión no existen diferencias significativas entre la escolaridad de las mujeres y la

de los hombres.
P á g i n a | 11

• Se hacen tablas dinámicas con los datos de la muestra, clasificando hombres y mujeres de

acuerdo a su escolaridad en bachiller, técnico o universitario, en la primera tabla se

cuentan las personas que clasifican en este rango, en la segunda se toman los promedios y

en la tercera las desviaciones estándar.

• Los intervalos de confianza en su extremo superior y en su extremo inferior se calculan

todos con un valor de z igual a 1,96 correspondiente al 95% de nivel de confianza, pese a

tener grupos con menos de 30 elementos como los hombres universitarios o las mujeres

técnicas.

• La fórmula para determinar la diferencia de las medias trabaja con los valores de la

distribución t - student por lo cual se registran estos valores para n1+n2-2 grados de

libertad con un nivel de confianza de 95%, por ejemplo, al calcular la diferencia de

universitarios se usa t para 13 (9+6-2) grados de libertad.


P á g i n a | 12

PARTE 3 (semana 5) Prueba de hipótesis para dos variables cualitativas

Un investigador, cree determinar que los hombres asisten más a un colegio oficial que las

mujeres en Colombia. Para determinar lo anterior, use la “muestra” encontrada en la

semana 3:

1. Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y

sexo (P6020), realice un diagrama de barras comparativo para los hombres y

mujeres en un solo gráfico. Según los resultados, ¿Existen diferencias?


P á g i n a | 13
P á g i n a | 14
P á g i n a | 15

• Se hace una tabla dinámica con la muestra de 382 datos y se toman las personas que

estando en etapa escolar asisten a colegios oficiales y los que no, separándolos por sexo,

obteniendo las columnas de hombres y mujeres con las cuales se hace la gráfica de

histograma.

• La grafica muestra que en general son mayoría las personas que asisten a colegio oficial

con respecto a los que no, pero en ambos casos los porcentajes de mujeres son un poco

mayor al de los hombres.

2. Con un nivel de confianza del 95%, estime e interprete la proporción de hombres

y de mujeres que asisten a un establecimiento oficial.

• Se sabe con un 95% de confianza que entre el 67,75% y el 89,95% de los hombres asisten

a colegio oficial

• Se sabe con un 95% de confianza que entre el 65,73% y el 87,84% de las mujeres asisten

a colegio oficial
P á g i n a | 16

3. Realice una prueba de hipótesis para determinar la afirmación del investigador.

Utilice un nivel de significancia del 5%. ¿Qué se puede decir de lo ante rior?

Hipotesis Nula: P1(Hombres) - P2(Mujeres) debe ser mayor a cero, con lo cual a un colegio

oficial asistirán en proporción más hombres que mujeres.

Hipotesis Alternativa: P1(Hombres) - P2(Mujeres) igual o menor que cero, con lo cual a un

colegio oficial NO asistirán en proporción más hombres que mujeres.

• Se calcula el Z con la expresión para la diferencia de proporciones.

• Se compara con el z calculado con el z teórico que resulta de la tabla.

Si se encuentra en la región de aceptación, es válida la hipótesis nula, de lo contrario es válido la

hipótesis alternativa. Debido a que se busca un rango extremo (mayor que) en este caso hacia el

extremo superior o máximo para que hayan más hombres que mujeres, la región z de aceptación
P á g i n a | 17

estará al costado derecho de la gráfica, es decir que para una significancia del 5% o 95% de

confianza, se buscara el z = o superior al 5%

Z teorico -1,645
Si Z calculado es superior a Z teórico se acepta H0 sino se rechaza

Z
calculado 0,1823

Finalmente, al tener que Z calculado es superior a Z teórico, entonces se Acepta la Hipótesis

Nula concluyendo que: En proporción los hombres estudian más en colegio oficial que las

mujeres.

CONCLUSIONES

• La estadística nos permite realizar estudios reales, con poblaciones exactas; lo cual nos

ayuda a mejorar nuestros proyectos.

• Este trabajo evidencia todos y cada uno de los temas vistos dentro de los módulos

trabajados de Estadística II; lo aquí presentado permitió desarrollar “Un caso de muestreo

aleatorio”, con la base de datos suministrada.

• Llevar un buen registro de datos estadísticos nos permite conocer de mejor manera el

problema, cuando nosotros conocemos con exactitud los conceptos a trabajar; es más

fácil dar soluciones.


P á g i n a | 18

• Una de las técnicas más utilizadas dentro de la estadística es la medición de parámetros

de tendencial central, la moda, mediana y media.

• Dentro de un programa de censo a nivel poblacional los datos estadísticos juegan un

papel muy importante, pues nos van a determinar en primera medida la cantidad de

población que existe y con ello en qué estado de vida se encuentran.

REFERENCIAS

• https://poli.instructure.com/courses/9351/modules

• https://poli.instructure.com/courses/9351/conferences

• Anexo No1. (Excel-Trabajo colaborativo)

Vous aimerez peut-être aussi