Académique Documents
Professionnel Documents
Culture Documents
Matemática
[Tarea 1 – Estadística
descriptiva]
[MAT042 – Probabilidad y Estadística
Industrial]
[1er Semestre 2010]
[Fecha]
04-05-2010
[Profesor] [Paralelo]
Patricio Videla Jiménez 4
Departamento de Matemática
Probabilidad y Estadística Industrial
Tarea N°1
[Introducción]
El siguiente estudio tiene por objetivo analizar exhaustivamente una población compuesta
por 10000 hogares para poder visualizar, mediante una serie de características en común, la
calidad de vida de sus habitantes. Para poder recopilar y obtener información relevante para el
estudio de esta población, se hizo una encuesta generalizada a cada grupo familiar, la cual
contiene preguntas relacionadas con el nivel de ingresos, consumo de insumos básicos, posesión
de bienes, cantidad de miembros en la familia, y nivel educacional.
Una vez realizada la encuesta y registrado los datos de toda la población, se procederá a
analizar cada una de las características, de forma separada y conjunta, para determinar qué tipo de
comportamiento tiene cada una de ellas como variables y también poder determinar qué tanta
correlación o influencia tienen éstas sobre la calidad de vida de los habitantes de la población.
2
Departamento de Matemática
Probabilidad y Estadística Industrial
Tarea N°1
[Desarrollo]
Obtenga una muestra de 150 unidades de la población presentada
Cumpliendo las condiciones de que se tienen que medir siete características distintas de la
población, de las cuales dos de ellas sean medidas en escala nominal, una en escala ordinal, dos
de tipo cuantitativa continua y tres de tipo cuantitativa continua medidas en escala
intervalar/razón, se obtuvo la muestra representativa adjunta en una tabla en el Anexo 1, al final
de este informe.
En primer lugar, se procedió a analizar las distintas técnicas de muestreo de las cuales se
tiene información, estudiando cuál, en términos prácticos, es la más conveniente de utilizar.
Por lo tanto, el mejor método a utilizar (y que se usará en este estudio) será el de muestreo
sistemático, porque al someterse a un proceso completamente azaroso de selección del primer
número, el resto de la selección quedará determinado por la propia dinámica del muestreo. Se
tuvo la precaución de que los datos de la población no estuviesen ordenados con respecto a
alguna de las variables en estudio, considerando que todas las características pudiesen ser
efectivamente variables.
M=Nn=10000150=66,667≅66
Se hace la observación de que se redondea hacia abajo porque de haber elegido 67, las
últimas observaciones habrían superado la cantidad total de la población, eligiendo datos que en
la práctica no existen.
Posteriormente, para seleccionar un número al azar entre 1 y 66, y luego poder seleccionar
cada M unidades el resto de los datos, se procede a utilizar la función de Excel
“ALEATORIO.ENTRE”, la cual arrojó a la primera ejecución el número 38.
Definido este parámetro y, por tanto, la muestra, se procede a calcular los índices de
tendencia central y dispersión más importantes para poder tener referencia de la representatividad
de la muestra respecto de la población, obteniendo los siguientes resultados (para las variables
cuantitativas continuas escogidas):
I. Mensual G. Consumo
Alimentación Energía
Promedio 345,55 98,84 148,70
349,81 100,14 149,91
Mediana 345,38 99,04 149,00
349,29 100,30 150,00
Desviación 68,12 19,27 19,37
Estándar 70,03 19,79 19,94
Coeficiente de 0,20 0,19 0,13
Variación 0,20 0,20 0,13
Azul: Datos muestra obtenida Rojo: Datos población
Se puede apreciar que el muestreo realizado para poder obtener nuestra muestra resultó
bastante preciso, al notar que con menos de 1,5% de error, las medidas de tendencia central y
dispersión de la muestra son muy cercanas a las de la población, concluyendo que se pudo llegar
a una muestra concretamente representativa de la población.
1
Departamento de Matemática
Probabilidad y Estadística Industrial
Tarea N°1
2. Agrupe los datos de la variable cuantitativa continua que posea menor dispersión, en
una tabla de doce clases
I. Mensual G. Consumo
Alimentación Energía
X 345,55 98,84 148,70
s 68,12 19,27 19,37
CV 0,20 0,19 0,13
Se puede apreciar que la variable con menor dispersión es el Consumo Medio Mensual de
Energía Eléctrica.
CONSUMO DE mi ni fi Ni Fi
ENERGÍA
97,5 - 106,3 101,9 2 0,013 2 0,013
106,3 - 115,1 110,7 4 0,027 6 0,040
115,1 - 123,9 119,5 11 0,073 17 0,113
123,9 - 132,7 128,3 12 0,080 29 0,193
132,7 - 141,5 137,1 23 0,153 52 0,347
141,5 - 150,3 145,9 26 0,173 78 0,520
150,3 - 159,1 154,7 28 0,187 106 0,707
159,1 - 167,9 163,5 22 0,147 128 0,853
167,9 - 176,7 172,3 11 0,073 139 0,927
176,7 - 185,5 181,1 5 0,033 144 0,960
185,5 - 194,3 189,9 5 0,033 149 0,993
194,3 - 203,1 198,7 1 0,007 150 1,000
150 1,000
1.
2.
1
Departamento de Matemática
Probabilidad y Estadística Industrial
Tarea N°1
2.2 Obtenga medidas de desempeño utilizando la tabla construida por ud. que considere
interesante de acuerdo al problema (tendencia central, posición, dispersión y forma)
La siguiente tabla presenta las medidas de tendencia central, posición, dispersión y forma más
apropiadas para este estudio:
1
Departamento de Matemática
Probabilidad y Estadística Industrial
Tarea N°1
1
Departamento de Matemática
Probabilidad y Estadística Industrial
Tarea N°1
X-1,5*s=148,83-1,5*19,32=119,85
X+1,5*s=148,83+1,5*19,32=177,82
Utilizando cada límite del intervalo, se hará necesario calcular sus respectivos cuantiles
para poder comprobar la desigualdad.
Pi=LPi+n*i100-NPi-1nPi*aPi
1
Departamento de Matemática
Probabilidad y Estadística Industrial
Tarea N°1
Piinferior=119,85→i=7,9555964%
Pjsuperior=177,82→j=93,090891%
Se puede concluir que la muestra (y por tanto, la población) presenta un consumo mensual
de energía eléctrica muy homogénea y simétrica, donde el promedio y la mediana de consumo
mensual de ésta se centran en los valores centrales de la distribución, mayoritariamente entre los
137,1 y los 163,5 [kWh]. Extrapolando esta situación, se puede deber básicamente a que el gran
porcentaje de consumo de energía eléctrica se puede deber a que una gran proporción de la
población pertenece a sectores residenciales.
2. Construya una tabla de doble entrada, utilizando la variable continua que posee mayor
dispersión y la variable en escala ordinal
I. Mensual G. Consumo
Alimentación Energía
X 345,55 98,84 148,70
s 68,12 19,27 19,37
CV 0,20 0,19 0,13
Se puede observar que ahora la variable continua que posee mayor dispersión es el
Ingreso Familiar Mensual, la cual se cruzará con la única variable ordinal presente, a saber, el
Nivel Educacional.
1
Departamento de Matemática
Probabilidad y Estadística Industrial
Tarea N°1
1
Departamento de Matemática
Probabilidad y Estadística Industrial
Tarea N°1
n·j 2 29 55 38 26 150
f·j 0,013 0,193 0,367 0,253 0,173 1,000
N·j 2 31 86 124 150
F·j 0,013 0,207 0,573 0,827 1,000
2.2 Obtenga, si es posible y correcto de la tabla, medidas de desempeño para cada variable:
2.2.1 Tendencia central: Media aritmética, Mediana, Moda
2.2.2 Dispersión: Varianza, Coeficiente de variación
Ingreso Educaci
ón
Promedi 345,663 -
o
Mediana 346,795 Medio
Moda 344,367 Medio
Varianz 4595,856 -
a
CV 0,196 -
Se puede observar que en el caso del nivel educacional, no se puede obtener un valor para
el promedio (y por lo tanto, para la varianza y el coeficiente de variación) porque por tratarse de
una variable ordinal, no se puede establecer un valor medio entre un nivel y otro (por ejemplo,
una persona no puede tener un nivel educacional “medio universitario” o “medio técnico”). Sí se
puede obtener la mediana y la moda por sus definiciones mismas: si se ordena esta variable en
forma ascendente, se puede visualizar fácilmente el valor central y el más frecuente.
1
Departamento de Matemática
Probabilidad y Estadística Industrial
Tarea N°1
La siguiente tabla presenta la distribución condicional del ingreso mensual dado el nivel
educacional, sujeto a una clase de éste último. Se tomará la clase “Medio” por ser la que contiene
la mayor cantidad de observaciones.
1
Departamento de Matemática
Probabilidad y Estadística Industrial
Tarea N°1
Número de hijos
0 1 2 3 4 5
i Gasto Gasto Gasto Gasto Gasto Gasto
1 65,83 48,70 59,97 67,63 102,71 50,46
2 71,95 63,34 64,67 68,39 103,13 69,98
3 73,18 64,97 66,95 70,11 103,77 91,25
4 76,67 69,08 68,82 77,76 111,73 96,97
5 81,29 69,67 70,12 78,20 112,08 97,35
6 86,99 77,70 81,90 79,68 113,12 97,36
7 87,07 78,86 84,80 82,31 113,29 101,19
8 87,75 79,50 85,67 83,69 115,48 101,76
9 89,12 80,14 87,44 90,45 121,49 103,53
10 89,68 84,93 87,65 91,13 126,54 111,07
11 90,48 85,34 88,18 93,53 127,44 118,62
12 93,23 85,93 88,39 94,78 140,64 125,09
13 96,38 86,93 91,47 95,41 142,61
14 98,88 92,59 91,63 95,52 144,18
15 101,23 94,13 91,89 95,74
16 102,09 97,41 95,77 96,94
17 103,20 97,86 96,35 97,04
18 107,43 101,07 97,03 97,43
19 102,04 99,19 97,90
20 102,77 100,89 98,31
21 107,77 101,25 99,20
22 117,70 101,43 99,77
23 102,36 102,08
24 102,36 102,18
25 103,54 103,96
26 107,91 104,38
27 109,75 107,11
28 112,30 107,97
29 112,37 110,77
30 112,78 112,66
31 112,79 114,27
32 112,84 115,10
33 115,39 115,14
34 115,65 115,42
35 117,70 117,52
36 120,17 118,75
37 121,50 120,92
38 122,27 123,17
39 123,93 127,41
40 124,42 128,53
41 127,43 153,63
42 137,64
43 138,94
1
Departamento de Matemática
Probabilidad y Estadística Industrial
Tarea N°1
ni 18 22 43 41 12 14
Promedi 89,025 85,838 101,291 101,266 115,952 103,673
o
Varianz 137,263 272,530 365,017 314,370 129,141 626,885
a
Luego, se calcula el peso relativo de cada estrato para poder determinar la media total de
la variable cuantitativa en estudio:
N° nh Ph Promedi
Hijos oh
0 18 0,120 89,025
1 22 0,147 85,838
2 43 0,287 101,291
3 41 0,273 101,266
4 12 0,080 115,952
5 14 0,093 103,673
TOTAL 150 98,941
Asimismo, utilizando la columna del peso relativo de cada estrato, se calcula la varianza
total de la muestra estratificada, la cual se puede descomponer en varianza “intra” y varianza
“inter”, obteniendo los siguientes resultados:
Varianza %
Intra 315,85 82,87%
Inter 65,28 17,13%
Total 381,13 100,00%
1
Departamento de Matemática
Probabilidad y Estadística Industrial
Tarea N°1
4. Calcule un coeficiente de asociación entre las dos variables medidas en escala nominal.
Comente.
1
Departamento de Matemática
Probabilidad y Estadística Industrial
Tarea N°1
Conclusiones generales
1
Departamento de Matemática
Probabilidad y Estadística Industrial
Tarea N°1
Bibliografía
1
Departamento de Matemática
Probabilidad y Estadística Industrial
Tarea N°1
[Anexos]
1
Departamento de Matemática
Probabilidad y Estadística Industrial
Tarea N°1
1
Departamento de Matemática
Probabilidad y Estadística Industrial
Tarea N°1
1
Departamento de Matemática
Probabilidad y Estadística Industrial
Tarea N°1
1
Departamento de Matemática
Probabilidad y Estadística Industrial
Tarea N°1