Vous êtes sur la page 1sur 53

Laboratorios en Estadstica y Econometra

Usando MS Excel 2010 y Tutoriales en Video


Gregory Crawford

Roberto Jaln

2012

Contents
1 Presentacin de Datos en Tablas y Grficos
1.1 Objetivos . . . . . . . . . . . . . . . . . . . .
1.2 Funciones Excel 2010 . . . . . . . . . . . . . .
1.3 Caso Aplicado: Industria de los Bebestibles en
1.4 Preguntas a Resolver . . . . . . . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

9
. 9
. 9
. 9
. 14

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

15
15
15
15
19

3 Media Geomtrica y Tasa Media de Crecimiento


3.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Funciones Excel 2010 . . . . . . . . . . . . . . . . . . . . .
3.3 Caso Aplicado: Producto Interno Bruto de Chile 1990-2010
3.4 Preguntas a Resolver . . . . . . . . . . . . . . . . . . . . .

.
.
.
.

.
.
.
.

21
21
21
21
23

. . . .
. . . .
Chile
. . . .

2 Medidas de Tendencia Central y de Dispersin


2.1 Objetivos . . . . . . . . . . . . . . . . . . . . .
2.2 Funciones Excel 2010 . . . . . . . . . . . . . . .
2.3 Caso Aplicado: Encuesta CASEN 2009 . . . . .
2.4 Preguntas a Resolver . . . . . . . . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

4 Entendiendo la Distribucin Normal


4.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Funciones Excel 2010 . . . . . . . . . . . . . . . . . . . . . . .
4.3 Caso Aplicado: Simulando y Graficando la Distribucin Normal
4.4 Preguntas a Resolver . . . . . . . . . . . . . . . . . . . . . . .
1

24
24
24
24
27

5 Muestreo y Distribucin Muestral


5.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Funciones Excel 2010 . . . . . . . . . . . . . . . . . . . . .
5.3 Caso Aplicado: Construyendo las distribuciones muestrales
5.4 Preguntas a Resolver . . . . . . . . . . . . . . . . . . . . .

.
.
.
.

6 Intervalo de Confianza y Prueba de Hiptesis


6.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.2 Funciones Excel 2010 . . . . . . . . . . . . . . . . . . . . . .
6.3 Caso Aplicado: Puntos de Venta del Comercio Minorista de
Santiago . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.4 Preguntas a Resolver . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.

29
29
29
29
31

33
. 33
. 33
. 33
. 35

7 Prueba t de diferencia de medias muestrales y prueba F de


varianzas
7.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.2 Funciones Excel 2010 . . . . . . . . . . . . . . . . . . . . . . .
7.3 Caso Aplicado: La PSU (Prueba de Seleccin Universitaria) .
7.4 Preguntas a Resolver . . . . . . . . . . . . . . . . . . . . . . .

36
36
36
36
38

8 Pruebas No-Paramtricas. Prueba de Mann-Whitney


8.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . .
8.2 Funciones Excel 2010 . . . . . . . . . . . . . . . . . . . .
8.3 Caso Aplicado: Hipdromo Chile y Club Hpico . . . . .
8.4 Preguntas a Resolver . . . . . . . . . . . . . . . . . . . .

.
.
.
.

39
39
39
39
40

.
.
.
.

41
41
41
41
42

.
.
.
.

45
45
45
45
47

9 Correlacin y causalidad. Dependencia


9.1 Objetivos . . . . . . . . . . . . . . . .
9.2 Funciones Excel 2010 . . . . . . . . . .
9.3 Caso Aplicado: Venta de Autos Nuevos
9.4 Preguntas a Resolver . . . . . . . . . .

lineal
. . . .
. . . .
. . . .
. . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

10 Test de Significancia Individual. R-cuadrado. Pronstico


10.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.2 Funciones Excel 2010 . . . . . . . . . . . . . . . . . . . . . .
10.3 Caso Aplicado: Modelo CAPM del Sector Elctrico . . . . .
10.4 Preguntas a Resolver . . . . . . . . . . . . . . . . . . . . . .

11 Modelo de regresin mltiple. Variables dicotmicas y politmicas. Test de significancia conjunta


48
11.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
11.2 Funciones Excel 2010 . . . . . . . . . . . . . . . . . . . . . . . 48
11.3 Caso Aplicado: Sector Inmobiliario en Santiago . . . . . . . . 48
11.4 Preguntas a Resolver . . . . . . . . . . . . . . . . . . . . . . . 50
12 Modelo de regresin mltiple. Especificacin funcional y seleccin de modelos. Modelo semi-logartmico. R-cuadrado
ajustado
12.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.2 Funciones Excel 2010 . . . . . . . . . . . . . . . . . . . . . . .
12.3 Caso Aplicado: La Industria de Cervezas en Chile . . . . . . .
12.4 Preguntas a Resolver . . . . . . . . . . . . . . . . . . . . . . .

51
51
51
51
52

Agradecimiento
Este recurso didctico es el resultado del Fondo de ayuda al Mejoramiento
de la Didctica de la Universidad Finis Terrae, 2011.

Autores
Gregory Crawford Harnecker
Magister en Economa Aplicada mencin Economa Financiera. Pontificia Universidad Catlica de Chile. Licenciado en Lingstica y Literatura Hispnicas
PUC. Profesor de los cursos: Probabilidad y Estadstica, Inferencia Estadstica,
Econometra, Modelos Financieros Aplicados, Evaluacin Econmica de Derivados.
A lo largo de su carrera, en la Facultad de Economa y Negocios de la Universidad
Finis Terrae, ha desempeado los cargos de Coordinador Lnea Mtodos Cuantitativos y Finanzas, Coordinador de postgrados de especializacin, Coordinador
Examenes de grado y ttulo, y Director de Estudios de la carrera de Ingeniera
Comercial.

Roberto E. Jaln Gardella


Magster en Direccin de Empresas, ESE Business School, Universidad de
los Andes. Magster(e) en Economa, Dep.de Economa, Universidad de Chile.
Ingeniero Civil Electrnico Universidad Escuela Superior Politcnica del Litoral
(Guayaquil, Ecuador). Es Coordinador del Magster de Especialidad en Marketing, Coordinador del Diplomado de Marketing Cuantitativo (Mercadometra),
Coordinador de Lnea de los cursos de Marketing de la carrera de Ingeniera Comercial de la Facultad de Economa y Negocios de la Universidad Finis Terrae. Profesor de los cursos: Investigacin de Mercados, Marketing Cuantitativo, Modelos
Aplicados de Marketing, Estadstica Descriptiva, Econometra. Socio Fundador
y Gerente General de la consultora EXPERIMETRICAL S.A.

Introduccin
La Universidad Finis Terrae, a travs de la Vicerrectora Acadmica,
viene impulsando desde hace ya varios aos el que los profesores de pregrado
utilicen metodologas activas para fortalecer la aplicacin del nuevo modelo
formativo, el cual tiene en cuenta que la sociedad demanda profesionales
formados sobre la base de potenciar en ellos determinadas competencias,
habilidades y destrezas. Por consiguiente, las prcticas pedaggicas deben
adecuarse al nuevo perfil del estudiante que ingresa a la educacin superior,
quien llega especialmente influenciado por las tecnologas de informacin.
Los profesores estn de acuerdo y comparten la importancia de adoptar
este cambio pedaggico. Sin embargo, es de nuestra experiencia que cuando
se han visto enfrentados al reto de incorporar metodologas activas, esta
introduccin del enfoque se ha realizado lentamente, de modo que algunos
cursos mantienen un alto porcentaje del estilo acostumbrado, desarrollando
los contenidos en una modalidad de conferencias expositivas.
Este panorama refuerza un crculo vicioso respecto al propio estudiante:
dado que el alumno da por descontado que el profesor har una exposicin
tipo conferencia sobre los contenidos relevantes, ellos mantienen su actitud
pasiva y continan viendo al instructor como la fuente del aprendizaje. De
esta forma, el cuadro empeora por la dependencia que los estudiantes desarrollan respecto al instructor y los ayudantes. Esto a su vez induce a que
lleguen poco o nada preparados para las actividades, o la dejen consistentemente para el ltimo minuto, lo que a su vez lleva a que los estudiantes
entreguen y desarrollen un trabajo de pobre calidad.
Los estudiantes de Estadstica y Probabilidades, Inferencia Estadstica,
y Econometra, suelen describir estos cursos como aburridos, ridos o irrelevantes, cuando los contenidos son presentados predominantemente centradosen-el-profesor. Y, a pesar de que estos ramos tienen que ver con el anlisis
de evidencia emprica y de datos, suele darse la paradoja que los estudiantes
llegan a percibir que hay poca relacin entre la teora y los contenidos ms
aplicados, o que las clases estn desconectadas de la realidad chilena, de su
propia realidad, y de sus intereses.
Una de las explicaciones para esta inercia, es el costo de cambio a la
incorporacin de metodologas activas (incluso en el caso de los profesores ya
instruidos en el Diplomado en Metodologas y Habilidades Docentes, bajo el
total auspicio de la Vicerrectora Acadmica) debido al tiempo requerido para

la preparacin de las actividades concretas y su adecuacin al formato activo


centrado en el alumno. En esta perspectiva, que los profesores cuenten con un
libro de laboratorios para la sala de clases, reduce dicho costo de cambio de
transitar de un estilo centrado-en-el-profesor a una metodologa centrada-enel-alumno, por lo que un efecto esperado de este proyecto es que los cursos
de esta rea estadstico-economtrica puedan combinar ambos estilos pero
elevando la proporcin centrada-en-el-alumno.
Este proyecto pretende colaborar a facilitar la implementacin, en la sala
de clases, de un ambiente centrado-en-el-alumno, donde los estudiantes, utilizando datos genuinos extrados de la realidad chilena, puedan descubrir los
conceptos estadsticos, explorar los principios, aplicar las tcnicas estadsticas mediante herramientas e instrumentos numricos y grficos, facilitado
por el uso de una planilla electrnica como Microsoft Excel. Esta ltima les
permitir ms oportunidades de desarrollar y fortalececer sus habilidades de
razonamiento y pensamiento matemtico-estadstico:
el proceso de abstraccin
la capacidad de distinguir entre lo relevante de lo irrelevante
la capacidad de ir de casos especiales a generalizaciones
la capacidad de proponer conjeturas y verificarlas o contrastarlas con
los datos de la realidad
la capacidad de utilizar ideas abstractas en situaciones aplicadas
la capacidad de argumentar de manera lgica soportado en la evidencia
cuantitativa
la capacidad de entender diferencias que dependen de mltiples variables o causas
la capacidad de diferenciar entre correlacin y causalidad
por mencionar algunas de las competencias ms relevantes de la formacin
matemtico-estadstica, indispensables no slo para estudiantes de ingeniera,
sino para el ciudadano comn y corriente del siglo XXI.
Para facilitar al profesor la seleccin y ubicacin del laboratorio en la
sesin de clase ms conveniente de acuerdo a su programa del curso, cada uno
6

de ellos tiene claramente identificados al inicio los objetivos de aprendizaje y


las funciones de Excel que se utilizarn, adems de las preguntas propuestas y
sugeridas de anlisis, las que siguen a la descripcin propia del caso aplicado.
Finalmente, se debe aclarar que las soluciones a los enunciados de los
laboratorios se desarrollan por separado, de modo que el profesor cuente con
las respuestas y sugerencias docentes asociados a cada laboratorio.

Objetivos
El objetivo general de este proyecto fue el de generar un libro de laboratorios para la sala de clases (workbook) y videos cortos (tutoriales), que
incluya casos, problemas y aplicaciones reales con datos estadsticos chilenos,
utilizando planillas electrnicas (Excel) para estudiantes de ramos de Estadstica, Econometra y Mtodos Cuantitativos. Su uso no estar circunscrito
slo para la carrera de Ingeniera comercial sino tambin podr utilizarse en
cursos de estadstica para Medicina, Educacin, Kinesiologa, Odontologa y
Postgrados.
Los objetivos especficos que se defini para este proyecto, fueron los
siguientes:
Proveer actividades y casos para trabajo y discusin en clases
Acercar al alumno a la realidad de los datos y realidad chilena (en
contraste con los textos traducidos)
Desarrollar competencias en uso de Excel
Desarrollar el pensamiento crtico en un contexto de evidencias basadas
en datos para el apoyo y soporte de opiniones y afirmaciones
Motivar la bsqueda de datos en Internet en bases institucionales de
uso pblico

1
1.1

Presentacin de Datos en Tablas y Grficos


Objetivos

Crear grficos diversos. Descubrir patrones y obtener conclusiones a partir


de la observacin de grficos. Construir histogramas utilizando funciones
bsicas de Excel, y utilizando el complemento de anlisis de datos.

1.2

Funciones Excel 2010

Funciones: FRECUENCIA, CUARTIL, PERCENTIL, MIN, MAX, CONTAR, CONTAR.SI, CONTAR.SI.CONJUNTO.


Mdulo de Anlisis de Datos: Histograma.

1.3

Caso Aplicado: Industria de los Bebestibles en


Chile

La industria de los bebestibles en Chile, se divide en dos grandes grupos:


los que tienen algn grado alcohlico vino, pisco, cerveza, entre otros, y
los bebestibles refrescantes gaseosas o bebidas de fantasa, aguas minerales,
jugos y nctares, bebidas para deportistas y bebidas a base de t.
De acuerdo a cifras de la Asociacin Nacional de Bebidas Refrescantes
(ANBER), las ventas de bebestibles no alcohlicos del ao 2009 ascendieron
a 2195 millones de litros, de los cuales las gaseosas tambin denominadas
bebidas de fantasa, representaron aproximadamente el 82% del volumen
total vendido.
Bebestible
Millones de litros Porcentaje
Aguas
221
10.1%
Jugos y Nctares
174
7.9%
Bebidas para Deportistas
9
0.4%
Gaseosas
1790
81.6%
Total
2194
100.0%
Fuente: ANBER
En la pgina web de la ANBER, puede leerse que esta industria representa el 9% de la inversin publicitaria que se realiza en el pas, el 20% del
9

consumo total de azcar y el 0.6% de la fuerza de trabajo considerando que


"por cada empleo directo de esta industria se generan 3.4 empleos indirectos
adicionales".
Una empresa importante de la categora de jugos y nctares, a fines de
2009, contrat a la consultora EXPERIMETRICAL para realizar un concepttest de un nuevo producto. Un concept-test consiste en construir y testear
prototipos del producto, combinando los diversos atributos o ingredientes que constituyen al producto. La idea detrs es que cada combinacin
distinta de estos atributos es o puede ser, desde el punto de vista del consumidor, un distinto producto o concepto. A partir de los ratings a cada
concepto, dado por el respondente, es posible identificar las combinaciones
ptimas de atributos que motiva o capta la mxima aceptacin o preferencia
del consumidor, o de un grupo de consumidores que comparten alguna caracterstica demogrfica, o de un segmento de consumidores que comparten
una misma reaccin a los conceptos pinsese en un mismo "paladar" ante
las "recetas" testeadas.
Junto con el testeo de los prototipos, los encuestados respondieron otras
preguntas como cul es el lugar habitual donde compra bebestibles, qu
tipo de bebestible es el que usted toma ms habitualmente, cul es la
marca de agua/jugo/nctar/gaseosa que usted bebe ms habitualmente,
entre otras. Estas preguntas, adems de permitirnos conocer a los respondentes, permiten agruparlos segn variables relevantes y responder preguntas
del tipo: qu atributos incluidos en los conceptos testeados son ms valorados por las mujeres que compran en el Jumbo y cuya marca habitual de
bebida de fantasa es Fanta?.
Datos y Cuestionario

Esta investigacin de marketing se realiz va online, y participaron en l


548 respondentes de la Regin Metropolitana, seleccionados mediante cuotas
por gnero, tramos de edad, y nivel socioeconmico, de un panel de respondentes de la empresa internacional LIVRA PANELS (www.livrapanels.com).
Por confidencialidad, se han omitido los contenidos explcitos del concepttest y varias de las preguntas de caracterizacin de los respondentes, y se
suministra una base de datos con una submuestra de 180 observaciones de
las 548 efectivamente realizadas, con las respuestas a las preguntas que se
entregan a continuacin.
10

Q1: Cul es su GENERO?


S1. Masculino
S2. Femenino
Q2: A qu rango de EDAD pertenece usted?
S1. Menor de 18
S2. 18-24
S3. 25-34
S4. 35-44
S5. 45-54
S6. 55-64
S7. 65-74
S8. Mayor de 74
Q3: INGRESO MENSUAL FAMILIAR de su hogar:
S1. Menos de $200.000
S2. $200.000 - $400.000
S3. $400.001 - $600.000
S4. $600.001 - $1.700.000
S5. Ms de $1.700.000
S6. Prefiero no decir
Q4: Cul de las siguientes opciones describe dnde VIVE usted?
S1. Santiago Centro
S2. Santiago Norte
S3. Santiago Oriente
S4. Santiago Poniente
S5. Santiago Sur-oriente
S6. Santiago Sur
S7. Otro
Q5 : Cul de las siguientes opciones describe su situacin LABORAL?
S1. Empleado a tiempo completo (40 o ms horas/semana)
S2. Empleado a jornada parcial (menos de 40 horas/semana)
S3. Desempleado
S4. Independiente
S5. Jubilado
S6. Duea de Casa
S7. Estudiante
Q6 : Cul de las siguientes opciones describe su ESTADO CIVIL?
S1. Soltero (nunca me he casado)

11

S2. Soltero viviendo con pareja


S3. Casado
S4. Divorciado/Separado
S5. Viudo
Q7 : Incluido usted, cuntas PERSONAS viven actualmente en su HOGAR?
S1. 1
S2. 2
S3. 3
S4. 4 o ms
Q8 : Cuntos MENORES de 18 aos viven actualmente en su HOGAR?
S1. Ninguno
S2. 1
S3. 2
S4. 3
S5. 4 o ms
Q9 : Cual es el LUGAR habitual donde usted compra BEBESTIBLES?
S1. Supermercado
S2. Gasolinera
S3. Farmacia
S4. Feria
S5. Tienda de barrio
S6. Otro
Q10 : SUPERMERCADO donde habitualmente hace sus compras?
S1. Ekono
S2. Jumbo
S3. Lider
S4. Montserrat
S5. Santa Isabel
S6. Tottus
S7. Unimarc
S8. Otro
S9. Ninguno
Q11 : Que tipo de BEBESTIBLE es el que usted toma HABITUALMENTE?
S1. Agua Mineral con/sin gas (Cachantun, Vital, Benedictino, etc)
S2. Bebidas de Fantasa (Pepsi, Coca, Fanta, Sprite, Bilz, Pap, Kem, etc)
S3. Jugos en polvo (Livean, Sprim, Tang, Zuko, etc)
S4. Jugos/Nectares (Watts, Andina, Yuz, Soprole, etc)
S5. Otro (te, caf, lacteos, etc)

12

Q12 : Marca de AGUA que usted bebe HABITUALMENTE?


S1. Aquarius
S2. Benedictino
S3. Cachantun
S4. Dasani
S5. Next
S6. Vital
S7. Otra marca
S8. Sin marca / agua de la llave
S9. Yo no tomo agua
Q13 : Marca de JUGO/NECTAR que usted bebe HABITUALMENTE?
S1. Andina
S2. Frugo
S3. Soprole
S4. Watts
S5. Yuz
S6. Otra Marca
S7. Yo no tomo jugos/nectares
Q14 : Marca de JUGO EN POLVO que usted bebe HABITUALMENTE?
S1. Livean
S2. Sprim
S3. Tang
S4. Zuko
S5. Otra marca
S6. Yo no tomo jugo en polvo
Q15 : Marca de BEBIDA DE FANTASIA que usted bebe HABITUALMENTE?
S1. Bilz/Pap
S2. Canada Dry
S3. Coca-Cola
S4. Fanta
S5. Ice Frut
S6. Kem
S7. Limon Soda
S8. Orange Crush
S9. Pepsi
S10. Sprite
S11. Otra marca
S12. Yo no tomo bebidas de fantasa

13

1.4

Preguntas a Resolver

Utilizando los datos de la hoja de Excel datoslab1.xlsx, responda de manera


rigurosa las siguientes preguntas:
1. Qu puede concluir respecto a las caractersticas de gnero, edad, zona
donde vive, supermercado habitual, bebestible habitual, de los respondentes de la muestra de este estudio? Respalde sus afirmaciones con
evidencia numrica y grfica.
2. Comente la veracidad o falsedad de la afirmacin: "quienes toman
jugos/nctares, no toman Coca-Cola, y viceversa".
3. Construya los siguientes grficos:
(a) "columna agrupada" de las diferentes marcas de bebidas de fantasa bebidas habitualmente, separadas por gnero.
(b) "barra apilada" de las diferentes marcas de bebidas de fantasa
bebidas habitualmente, separadas por gnero.
(c) "barra 100% apilada" de las diferentes marcas de bebidas de fantasa bebidas habitualmente, separadas por gnero.
4. Compare los tres grficos de la pregunta anterior, e indique claramente
sus diferencias.

14

2
2.1

Medidas de Tendencia Central y de Dispersin


Objetivos

Comparar conjuntos de datos, de acuerdo a las medidas de tendencia central


y de dispersin.

2.2

Funciones Excel 2010

Funciones: PROMEDIO, MEDIANA, MODA, DESVEST, DESVESTP, VAR,


VARP, DESVIA2.

2.3

Caso Aplicado: Encuesta CASEN 2009

Desde el ao 1985, con una periodicidad bianual y trianual, el Ministerio de


Desarrollo Social de Chile (antes Ministerio de Planificacin y Cooperacin,
MIDEPLAN), ha realizadp una encuesta de hogares representativa a nivel
nacional, regional, urbano y rural y comunal, denominada de Caracterizacin
Socioeconmica Nacional (CASEN), la que se ha llevado a cabo en los aos
1987, 1990, 1992, 1994,1996, 1998, 2000, 2003, 2006 y 2009.
El tamao de la muestra de la Encuesta CASEN 2009, fue de 71.460
hogares encuestados a nivel Nacional, representando una poblacin muestral
de 246.924 personas. En la versin del ao 2009, se tiene representatividad
para 334 comunas del pas.
Qu es la Encuesta CASEN?
En la pgina del gobierno (http://www.gobiernodechile.cl/ especiales/
que-es-la-encuesta-casen/) puede leerse:
La encuesta de Caracterizacin Socioeconmico Nacional (Casen)
es el principal instrumento de medicin para el diseo y evaluacin de la poltica social existente en nuestro pas.
Esta encuesta entrega informacin acerca de las condiciones
socioeconmicas de los diferentes sectores sociales del pas, sus
carencias ms importantes, la incidencia, magnitud y caractersticas de la pobreza, as como la distribucin del ingreso de los
hogares y la composicin de sus ingresos. Adems, contiene antecedentes sobre la cobertura y perfil de los beneficiarios de los
15

programas sociales, identificando a los sectores sociales que no


acceden a dichos programas, lo que posibilita el clculo de los
dficit de atencin asociados. Tales datos orientan el trabajo de
diseo de nuevos proyectos y de modificaciones, en los sistemas
de asignacin de los beneficios para mejorar la focalizacin de
aquellos que funcionan con carcter selectivo.
La metodologa utilizada para la elaboracin esta encuesta
responde al mismo modelo implementado para las mediciones
anteriores. Los objetivos generales de la aplicacin de este instrumento son:
Disponer de informacin que permita caracterizar la situacin
de los hogares y de la poblacin, especialmente de aqulla en
situacin de pobreza y de los grupos definidos como prioritarios
por la poltica social (segn aspectos demogrficos, de educacin,
salud, vivienda, ocupacin e ingresos.
Estimar la cobertura, focalizacin y distribucin del gasto
fiscal de los principales programas sociales de alcance nacional,
para evaluar su impacto en el hogar (ingreso adicional y su distribucin).
Adems, existen objetivos especficos para cada uno de los
mdulos sectoriales abarcados en esta encuesta -residentes, educacin, empleo, ingresos, salud y vivienda- y en relacin a los
temas emergentes. stos ltimos son: discapacidad, tecnologa/
informacin/ comunicacin, pueblos indgenas, migracin, cultura, biografa autoreportada y energa.
La informacin recolectada por esta encuesta es la que ha permitido hacer
un seguimiento de la evolucin de la pobreza e indigencia. En 1990, el
38,6% de la poblacin estaba en situacin de pobreza o de indigencia. Este

16

porcentaje, al ao 2009, es de 15,1% como se aprecia en la grfica siguiente:

Fuente: Ministerio de Desarrollo Social.


Qu se entiende por pobreza y qu por indigencia? En la misma pgina
del gobierno, de la presentacin de resultados de la Encuesta CASEN 2009,
puede leerse que:
"[U]n hogar es pobre cuando su ingreso per cpita es inferior
a 2 veces el valor de una canasta bsica de alimentos, en la zona
urbana, y a 1,75 veces, en la zona rural.
Un hogar se considera indigente si su ingreso per cpita es
inferior al valor de una canasta bsica de alimentos.
Para la clasificacin de los hogares en estas categoras, el ingreso del hogar se define como la suma del ingreso autnomo del
hogar, las transferencias monetarias que recibe el hogar del Estado y una imputacin por concepto de arriendo de la vivienda,
cuando sta es habitada por sus propietarios."
Para este laboratorio, hemos considerado una subpoblacin de la muestra
CASEN. De los 246.924 encuestados, consideramos los 71.460 que son jefes de
17

hogar, y de ellos los 45.130 cuya situacin de empleo corresponde a la de estar


trabajando (ocupado). De estos ltimos, se obtuvo una muestra de 2.000
individuos, y de ellos nos quedamos con 1.914 porque de los restantes 86 no
se tena informacin de sus ingresos ocupacionales principales. Para efectos
de este laboratorio, estos 1.914 individuos constituirn nuestra poblacin de
inters, por lo que las conclusiones que se obtengan se referirn a estos 1.914
individuos. Para obtener conclusiones a nivel nacional o regional, se deben
utilizar los ponderadores denominados "factores de expansin":
"Este factor se interpreta como la cantidad de personas en la
poblacin, que representa una persona en la muestra.
La estimacin de un total dado para una variable se obtiene,
primero, ponderando el valor de la variable en cada persona por
su factor de expansin y luego, sumando todas las personas de
la muestra. De acuerdo con el diseo de la muestra, corresponde
aplicar este factor de expansin a cada hogar y persona seleccionada, lo que depende del nmero de viviendas que tiene la
seccin geogrfica y el nmero de secciones que tiene el estrato.
Los factores de expansin incluyen un ajuste de poblacin en
hogares particulares, segn las proyecciones del INE a la fecha
de la encuesta, para de esta manera aumentar la precisin de las
estimaciones. "
Para esta subpoblacin de 2.000 individuos, en el archivo de datos, se
incluyen las siguientes variables:
folio (identificador del respondente)
sexo (1=hombre, 2=mujer)
edad (aos cumplidos)
numper (nmero de personas en el hogar)
esc (aos de escolaridad)
educ (nivel educacional: 1=sin educacion formal, 2=Bsica incompleta, 3=Bsica
completa, 4=Media Humanista Incompleta, 5=Media Tcnico Profesional Incompleta, 6=Media Humanista Completa, 7=Media Tcnico Completa, 8=Tcnica
Universitaria Incompleta, 9=Tcnica o Universitaria Completa, 99=Sin dato)
corte (situacin de indigencia o de pobreza: 1=indigente, 2=pobre no indigente, 3=no pobre)
dau (decil de ingreso autnomo per capita nacional: 1=I, 2=II, ..., 10=X)

18

qaut (quintil de ingreso autnomo per capita nacional: 1=I, 2=II, ..., 5=V)
yopraj (ingreso ocupacional principal)
yoprhaj (ingreso ocupacional principal en el hogar)

donde, los ingresos estn definidos para la Encuesta CASEN, de la siguiente manera (ver en http://www.ministeriodesarrollosocial.gob.cl/ casen/
definiciones/ ingresos.html):
"[Ingreso Ocupacional Principal es el] Ingreso que obtienen
los ocupados en su ocupacion principal, ya sea por concepto de
trabajo dependiente en el caso de los asalariados (empleados y
obreros del sector publico, de empresas publicas y del sector
privado, servicio domstico puertas adentro y puertas afuera y
miembros de las fuerzas armadas y de orden), o por concepto de
trabajo independiente en el caso de los patrones o empleadores y
trabajadores por cuenta propia."
"[Ingreso Autnomo es el] Ingreso por concepto de sueldos y
salarios, ganancias provenientes del trabajo independiente, autoprovision de bienes producidos por el hogar, bonificaciones,
gratificaciones, rentas, intereses, asi como jubilaciones, pensiones,
montepios y transferendas entre privados."

2.4

Preguntas a Resolver

Utilizando los datos de la hoja de Excel datoslab2.xlsx, responda de manera


rigurosa las siguientes preguntas:
1. Los turistas que visitan Santiago suelen comentar que les parece que
en Chile tenemos un estndar de vida superior al de otros pases de
la regin. Nuestras autoridades, de ste y del anterior gobierno, han
mencionado ms de una vez que Chile estara cada vez ms cerca de
convertirse en un pas desarrollado. Los resultados de la Encuesta
Casen 2009 indican que el porcentaje de la poblacin en situacin de
pobreza en Chile ha disminuido al 15%. Todo esto deja la impresin
que habra una gran clase media y que al menos la mitad de los chilenos
ha de ganar un sueldo superior al $1 milln de pesos. Qu afirmaciones
puede hacer usted respecto a los ingresos ocupacionales principales de
nuestra submuestra de 1.914 individuos?
19

2. Cambian sus conclusiones respecto a la pregunta anterior, si en lugar


del ingreso ocupacional principal individual se considera el del hogar?
3. Comente: "Chile ha dado un paso adelante en superar la discriminacin por gnero. En la submuestra de respondentes de la Encuesta
Casen vemos que no hay diferencias en la media del ingreso ocupacional
principal de los jefes de hogar, sean estos hombres o mujeres".
4. Comente: "Los expertos afirman que los salarios declinan despus de
los 50 aos de edad. La evidencia de nuestra submuestra indica lo
contrario."

20

3
3.1

Media Geomtrica y Tasa Media de Crecimiento


Objetivos

Calcular la tasa media (geomtrica) de crecimiento en el perodo analizado.


Calcular el nmero de aos requeridos para duplicar el nivel, para distintas
tasas media de crecimiento.

3.2

Funciones Excel 2010

Funciones: PRODUCTO, POTENCIA, MEDIA.GEOM, LOG.

3.3

Caso Aplicado: Producto Interno Bruto de Chile


1990-2010

Chile ha sido reconocido por su prudente, serio y exitoso manejo macroeconmico, que le ha permitido sortear diversas crisis ocurridas a nivel internacional desde los aos 1990s. Destaca que ha sido una economa abierta,
pequea, que ha sabido mantener tasas positivas de crecimiento anual. A
nivel interno, sin embargo, perdura el debate sobre la disyuntiva: crecer o
distribuir? Hace unos aos, en la revista Qu Pasa, el economista Eduardo
Engel se preguntaba: Estamos mal porque la distribucin del ingreso no
ha mejorado en los ltimos 15 aos, o estamos bien porque la pobreza se ha
reducido a menos de la mitad y el ingreso de todos incluido el de los ms
pobres se ha duplicado en el mismo perodo?.
Segn cifras del Ministerio de Desarrollo Social (ex Mideplan), entre 1987
y 2006 el porcentaje de la poblacin viviendo debajo de la lnea de pobreza
cay de 45.1% a 13.7%, mientras que el porcentaje de personas en extrema
pobreza cay del 17.4% al 3.2% en el mismo perodo. Cmo logr Chile esta
evolucin? Diversos estudios empricos estimaran que entre un 80% y 60%
de la reduccin de la pobreza fue consecuencia del crecimiento econmico, y
que la diferencia sera gracias a las polticas sociales.
Tanto importa el crecimiento para reducir la pobreza? Durante los aos
dorados (1986-1998) la economa chilena creci a tasas anuales de 7.3%; por
eso le bast un poco menos de 10 aos para duplicar el producto interno
bruto y con l, el ingreso de las personas en trminos reales. La evidencia
21

indicara que este ritmo de crecimiento se debi a la apertura comercial, la


contribucin de la infraestructura pblica, la expansin de la educacin, la
esperanza de vida, los trminos de intercambio positivos, la reduccin del
consumo del gobierno, la contribucin de las libertades civiles, y la sinergia
de los paquetes de buenas polticas pblicas.
Sin embargo, ltimamente le ha costado a Chile lograr recuperar las tasas
de crecimiento de aquellos perodos anteriores.
En la pgina web del Banco Central de Chile (www.bcentral.cl), puede
obtenerse los datos del Producto Interno Bruto (PIB), en millones de pesos
del ao 2003, para los aos 1990 a 2010:
Producto interno bruto a precios constantes
anual
(Millones de pesos de 2003)
Ao
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010 (*)

Habitantes
13,178,782
13,422,010
13,665,241
13,908,473
14,151,708
14,394,940
14,595,504
14,796,076
14,996,647
15,197,213
15,397,784
15,571,679
15,745,583
15,919,479
16,093,378
16,267,278
16,432,674
16,598,074
16,763,470
16,928,873
17,094,275

Fuente: Banco Central de Chile

(*) Cifras preliminares.

22

PIB
25,142,431
27,136,665
30,438,176
32,559,292
34,416,723
38,028,591
40,831,597
43,526,546
44,944,340
44,616,348
46,605,199
48,165,625
49,209,330
51,156,415
54,246,819
57,262,645
59,890,971
62,646,126
64,940,432
63,848,206
67,167,123

3.4

Preguntas a Resolver

Utilizando los datos de la hoja de Excel datoslab3.xlsx, responda de manera


rigurosa las siguientes preguntas:
1. Comente: "Las tasas medias de crecimiento del PIB y del PIB per
capita, entre 1990 y 2010, son positivas. Ello implica, necesariamente
que las tasas anuales de variacin del PIB y del PIB per capita, han
sido positivas para cada ao de ese perodo".
2. Comente: "Suponiendo que los prximos aos Chile creciese a la misma
tasa media anual del perodo 2000-2010, le tomara otros 20 aos para
poder duplicar el PIB y el PIB per capita".
3. Comente: "La tasa media de crecimiento entre los aos 1998 y 2000 es
igual a la media aritmtica de las tasas anuales de crecimiento de los
aos 1998-1999 y 1999-2000".
4. Sea la tasa de crecimiento entre el ao anterior 1 y el ao actual ,
calculada por:
1
=
1
verifique para qu aos se cumple la aproximacin:
log (1 + )
5. Comente: "Considere el grfico cartesiano, donde las abscisas (eje X)
representan cada ao, y las ordenadas (eje Y) representan el PIB medido en millones de pesos de 2003. Considere la recta que une la
observacin del ao 1990 con la observacin del ao 2010. Se podra
afirmar, entonces, que la tasa media de crecimiento entre 1990 y 2010
es equivalente a la pendiente de dicha recta".

23

4
4.1

Entendiendo la Distribucin Normal


Objetivos

Construir un simulador para graficar las funciones de densidad () y la


acumulada (), y estudiar cmo cambian los grficos cuando cambian la
media y la desviacion estndar.

4.2

Funciones Excel 2010

Funciones: DISTR.NORM, DISTR.NORM.INV, DISTR.NORM.ESTAND,


DISTR.NORM.ESTAND.INV, COEFICIENTE.ASIMETRIA, CURTOSIS

4.3

Caso Aplicado: Simulando y Graficando la Distribucin Normal

En el mundo real, hay variables cuyos "histogramas" tienen forma de "campana". Por ejempllo, consideremos la base de datos del Laboratorio #2,
consistente en una muestra de 1.914 jefes de hogar, con empleo, con ingreso
ocupacional principal, tomada a partir de los 246.924 hogares entrevistados
en la Encuesta CASEN 2009. Construyamos un histograma para la variable
"edad":

24

... para la variable "nmero de personas en el hogar":

... para la variable "escolaridad":

25

... para la variable "logaritmo del ingreso ocupacional principal":

En los histogramas graficados previamente, puede apreciarse que todos


ellos parecen tener forma de "campana", unos con mayor precisin que otros.
Uno de los tipos posibles de "campanas" se denomina "distribucin normal" o
"gaussiana", en honor a Karl Friedrich Gauss, si bien se dice que fue Abraham
De Moivre quien la utilizara por primera vez en un artculo escrito en 1733.
.
Ntese que en todos los ejemplos, se ha superpuesto una verdadera "campana gaussiana", definida por la funcin de densidad de probabilidad de una
distribucin normal, dada por:
12

1
() =

2 2

La funcin de probabilidad acumulada es el "rea bajo la curva" de la funcin


de densidad de probabilidad, por lo que est dada por el integral:
() = ( ) =

26

()

cuya solucin no tiene una forma funcional elemental, y se calcula mediante


mtodos numricos (esos clculos estn hechos en las tablas estadsticas o
pueden hacerse mediante funcin definida del Excel). Se puede calcular
el rea bajo la curva para cualquier valor de , dadas cualquier media y
cualquier desviacin estndar .
Recurdese que para un histograma, cualquiera sea su forma, se tiene que
la sumatoria de las frecuencias relativas asignadas a cada uno de los intervalos
de clase necesariamente suma 100%. As tambin el rea total bajo la curva
de densidad de probabilidad, desde hasta +, por definicin suma 1 o
100%, es decir:

2
Z+
Z+
1

1
2

() =

= 1
2
2

4.4

Preguntas a Resolver

1. Utilizando los datos de la hoja de Excel datoslab4.xlsx, comente de


manera rigurosa la siguiente afirmacin: "No hay manera de comprobar
que la variable edad, de la base de datos del Laboratorio #2 (Encuesta
CASEN), tiene o no distribucin normal".
2. Construya una tabla para diversos valores de de la funcin de densidad de probabilidad () y haga su respectivo grfico de dispersin.
Puede suponer inicialmente que = 4, 2 = 32 , pero permita que
usted pueda actualizar la tabla y el grfico cambiando los valores de
cualquiera de estos dos parmetros. Agregue al grfico anterior la funcion de densidad de probabilidad de una nueva variable adicional ,
tal que inicialmente = 0, 2 = 22 , pero nuevamente permita que
usted pueda actualizar la tabla y el grfico cambiando los valores de

27

cualquiera de estos dos parmetros. Su grfico debiera lucir as:


25.0%

20.0%

15.0%

10.0%

5.0%

0.0%
6

10

3. Construya una grfica de dispersin de las funciones de probabilidad


acumulada de las dos variables e de las preguntas anteriores. Su
grfico debiera lucir as:
100.0%
90.0%
80.0%
70.0%
60.0%
50.0%
40.0%
30.0%
20.0%
10.0%
0.0%
6

10

4. Suponiendo medias iguales, y cambiando el valor de la varianza de ,


analice y compare qu ocurre con los grficos cuando las varianzas son
distintas.
5. Suponiendo varianzas iguales, y cambiando el valor de la media de ,
analice y compare qu ocurre con los grficos cuando las medias son
distintas.

28

5
5.1

Muestreo y Distribucin Muestral


Objetivos

Constatar de manera prctica el teorema lmite central, viendo cmo la forma


de la distribucin de la variable aleatoria media muestral , va acercndose
cada vez ms a la forma de una distribucin normal, conforme aumenta el
tamao de las muestras.

5.2

Funciones Excel 2010

Mdulo Anlisis de Datos: Estadistica Descriptiva, Histograma, Generador


de Nmeros Aleatorios.

5.3

Caso Aplicado: Construyendo las distribuciones


muestrales

La hoja de Excel datoslab5.xlsx, contiene una subpoblacin de la base de


datos del Laboratorio #2 (Encuesta CASEN): los hombres, jefes de hogar,
con ocupacin, que tienen ingresos ocupacionales principales, y con educacin
tcnica o universitaria completa. Son 150. Para efectos de este laboratorio
consideraremos que estos 150 hombres constituyen nuestra poblacin de inters, y no una muestra. La variable "ingresos ocupacionales principales"

29

tiene la siguiente distribucin de probabilidad:

Histograma
50
45
40
35
30
iac
n
e 25
u
c
e
rF
20
15
10
5
0

Puede comprobarse que la media poblacional es


P150

= =1 = $988730 34
150
y la desviacin estndar poblacional
s
P150
2
=1 ( )
=
= $995280 53
150
En la prctica, generalmente no conocemos toda la poblacin de una determinada variable, sino una o algunas muestras y, a partir de ellas, se quiere
inferir cules seran los valores poblacionales de la media o de la varianza, a
partir de la distribucin de la media muestral o de la varianza muestral.
En este laboratorio se quiere repasar las propiedades de tales distribuciones de muestreo, y explorar cmo, al aumentar el tamao de la muestra,
la distribucin de muestreo de la media muestral sistemticamente empieza a
30

tomar forma de "campana", sin importar cul sea la distribucin poblacional


de la cual se obtienen las muestras (teorema lmite central) y la media de las
medias muestrales empieza a converger a la media de la poblacin de la cual
se obtuvieron las muestras.
Para lograr la distribucin completa de la media muestral, tendramos
que generar todo el espacio muestral de la media muestral, obteniendo as
todas las muestras posibles a partir de la poblacin. Cuntas muestras son
posibles en una poblacin depende del tamao que escojamos para el
muestreo. Suponiendo un muestreo con reemplazo, el nmero de muestras
posibles crece de manera multiplicativa conforme aumenta .
Dado que nuestro inters es poder ver que, conforme el tamao va
aumentando, la distribucin de la media muestral va tomando forma de
campana, procederemos de una manera ligeramente diferente, para hacerlo
manejable.

5.4

Preguntas a Resolver

1. Utilizando el mdulo de "Anlisis de Datos", del men "Datos" del


Excel, y los datos de la hoja de Excel datoslab5.xlsx :
(a) Tome 50 muestras de tamao = 1, y construya el histograma
correspondiente.
(b) Tome 50 muestras de tamao = 5, calcule la variable media
muestral para cada una de las 50 muestras, y construya el histograma correspondiente.
(c) Haga lo mismo de la pregunta anterior, para muestras de tamao
= 15, = 25, = 35 y = 50 respectivamente
(d) Verifique las propiedades de la distribucin de , conforme crece.
2. Considere los siguientes datos poblacionales de la variable :

1
2
3
4
5
31

8
25
47
10
32

(a) Construya el espacio muestral de todas las muestras posibles de


tamao = 2, y determine las respectivas medias muestrales
Verifique que = y 2 = 2 2.
(b) Para intervalos de 2.5, desde 0 hasta 50, grafique la respectiva
distribucin de probabilidades ("histograma") de , para muestras
de tamao = 2.
(c) Construya el espacio muestral de todas las muestras posibles de
tamao = 3, y determine las respectivas medias muestrales .
Verifique que = y 2 = 2 3.
(d) Para intervalos de 2.5, desde 0 hasta 50, grafique su respectiva
distribucin de probabilidades ("histograma") de , para muestras
de tamao = 3.
(e) Inserte en cada uno de los dos grficos anteriores la funcin de
densidad de probabilidad de una distribucin
normal, con la media
poblacional y la desviacin estndar . Comente.

32

6
6.1

Intervalo de Confianza y Prueba de Hiptesis


Objetivos

Construir un intervalo de confianza para la media.

6.2

Funciones Excel 2010

Funciones: DISTR.NORM, DISTR.NORM.INV, DISTR.NORM.ESTAND,


DISTR.NORM.ESTAND.INV, DISTR.T, DISTR.T.INV

6.3

Caso Aplicado: Puntos de Venta del Comercio Minorista de Santiago

Los productos de consumo masivo de diversas categoras como galletas, chocolates, cigarrillos, caramelos, bebidas, requieren gestionar sus canales de distribucin que incluyen no slo supermercados, sino un conjunto enorme de
puntos de ventas y tiendas del comercio minorista o al detalle almacenes,
minimarkets, kioscos, botilleras, panaderas.
En el sitio www.censodecomercio.cl, puede leerse:
"Mapcity ha decidido llevar a cabo el Primer Censo Georreferenciado de Comercio de la Regin Metropolitana, el que permite
tener un registro nico y exhaustivo del universo de negocios y
comercio existente en la regin, con ms de 48 mil manzanas.
Este incluye desde los ms tradicionales como restaurantes, bancos y centros comerciales hasta los que no lo son como funerarias,
casas de empeo y otras.
El Censo incluye informacin del nombre del local, su categora de rubro, nombre del dueo o responsable del negocio,
ubicacin geogrfica, rut, telfono, frente del local y otras caractersticas de inters. Todo esto ha sido georreferenciado y normalizado, para su uso de manera inteligente mediante sistemas
de informacin, lo que permite realizar consultas y selecciones
por distintos atributos, con representacin grfica de calidad para
cualquier aplicacin o uso interno de las empresas."

33

En ese sitio, podemos enterarnos que en toda la Regin Metropolitana


habran 1962 panaderas, 1428 minimarkets, 2549 kioscos, 3270 botilleras,
18506 almacenes pequeos, entre otros tipos de locales.
La consultora THE RETAIL FACTORY, especializada en temas de "shopper marketing", ha conducido investigaciones de mercado para grandes retailers regionales, con el objetivo de aplicar una nueva manera de segmentar
en el punto de venta, donde las categoras estaran dadas ms bien por la
ocasiones de consumo y misiones de compra que por los atributos de los productos. De uno de tales estudios, se suministra una base de datos con una
submuestra no aleatoria de 200 puntos de ventas.
Por confidencialidad se omiten variables e informacin estratgica. Slo
se incluyen las variables:
Tipo de Local (1=Botillera, 2=Minimarket, 3=Panadera, 4=Almacn, 5=Kiosco)
Zona (1=Centro, 2=Norte, 3=Oriente, 4=Poniente, 5=Sur-oriente, 6=Sur)
Comuna
Metros cuadrados del Local

Considrese, para efectos del presente laboratorio, que los datos para cada
tipo de local o para cada zona de Santiago, se pueden considerar representativos de cada local o de cada zona, respectivamente. Para las tiendas y
puntos de ventas de Santiago incluidas en la muestra, puede verificarse que
sus tamaos medios, medidos en metros cuadrados, son:
Tamao del Local (metros cuadrados)
Media

Desv. tp.

Botilleria

41.46

39

46.54

MiniMarket

45.47

30

44.48

Panaderia

79.86

42

113.11

Almacen

43.10

52

41.09

Kiosco

18.00

37

24.43

Total

46.21

200

65.37

34

Tamao del Local (metros cuadrados)

6.4

Santiago Centro

Media
31.34

Santiago Norte

N
35

Desv. tp.
32.17

60.86

28

73.83

Santiago Oriente

49.06

69

89.83

Santiago Poniente

57.88

24

51.98

Santiago Sur-oriente

42.69

16

32.81

Santiago Sur

35.14

28

27.05

Total

46.21

200

65.37

Preguntas a Resolver

Utilizando los datos de la hoja de Excel datoslab6.xlsx, responda de manera


rigurosa las siguientes preguntas:
1. Comente: "Segn los cuadros de tamaos medios muestrales dados anteriormente, se podra concluir que muestralmente todas las panaderas
son ms grandes que los minimarket, y todos los locales de Santiago
Oriente son ms grandes que los de Santiago Norte".
2. Comente: "Con respecto al parmetro poblacional tamao medio, la
evidencia indica que los minimarkets podran tener un tamao medio
igual que el de los almacenes, pero distinto que el de los kioscos".
3. Comente: "No es posible que en todas las zonas de Santiago el tamao
medio poblacional sea 40.0 metros cuadrados".
4. Segn los cuadros dados, se aprecia que el tamao medio muestral de
los minimarkets es parecido al de los almacenes, y el tamao medio
muestral de los locales en Santiago Norte es similar al de los locales
de Santiago Poniente. Entonces puede concluirse que: "considerando
slo los locales de Santiago Poniente, necesariamente tambin se deber cumplir que los minimarkets tendrn un tamao medio muestral
parecido al de los almacenes". Comente.

35

7
7.1

Prueba t de diferencia de medias muestrales y prueba F de varianzas


Objetivos

Analizar las varianzas y aplicar el test de diferencia de medias apropiado


para comprobar si comparten la misma media.

7.2

Funciones Excel 2010

Anlisis de Datos: Prueba t para dos muestras suponiendo varianzas iguales.


Prueba t para dos muestras suponiendo varianzas desiguales. Prueba F para
varianzas de dos muestras.

7.3

Caso Aplicado: La PSU (Prueba de Seleccin Universitaria)

Las Pruebas de Seleccin Universitaria (PSU) son un grupo de instrumentos


de evaluacin que tienen como objeto medir capacidades relacionadas con
el razonamiento y que se basan en los contenidos del Plan de Formacin
General del Ministerio de Educacin. Su objetivo final es seleccionar a los
postulantes para ingresar a las Universidades.
Existen 4 pruebas: Lenguaje y Comunicacin, Matemtica, Historia y
Ciencias Sociales y Ciencias. De las 4 pruebas son obligatorias las de Lenguaje
y Comunicacin y Matematica. Entre las dos restantes deben elegir al menos
una. Esta eleccin depender de los requisitos exigidos por la Universidad y
carrera a la cual quieren postular.
Cmo se cuantifica la evaluacin?
Primero se cuentan las respuestas correctas y se descuenta un cuarto de
punto por cada respuesta incorrecta. Las preguntas omitidas no se cuentan. Por ejemplo, si en una prueba que tiene un total de 80 preguntas, un
estudiante obtuvo 40 buenas, 12 malas y 30 omitidas, el puntaje ser de 37.
Para darle una cuantificacin al desempeo de cada alumno, se toman
los puntajes de todos los que rindieron de esa prueba y se realiza un procedimiento llamado normalizacin. Este procedimiento consiste en transformar
la distribucin de los puntajes a una distribucin normal, sin alterar la proporcin de alumnos que estn entre ciertos puntajes cualquiera, como lo
36

muestra la siguiente figura.

Fuente: Documentos tcnicos. www.demre.cl


Para realizar esta transformacin se realiza una tabla en donde se mide
la frecuencia relativa de cada punto, partiendo del mnimo puntaje (podra
ser negativo dado que se descuenta un cuarto de punto por cada respuesta
incorrecta) hasta el mximo puntaje (que podra llegar a un mximo de 80
en caso de que exista una o ms personas que respondan todas las preguntas
correctamente.

Fuente: Documentos tcnicos. www.demre.cl


Con esta frecuencia relativa, se busca en una tabla normal estandarizada
los valores z correspondientes a cada puntaje. Finalmente se considera (arbitrariamente)que la distribucin final de la prueba ser una normal con media
37

de 500 puntos y una desviacin estndar de 110. Por lo tanto, para obtener
el puntaje final de un alumno cualquiera deber calcularse como 500+110*z.
Ejemplo: Si un alumno obtuvo 56 puntos, y ese puntaje le corresponde un
valor z de 2, entonces su puntaje final ser de 720 puntos. Como ao tras ao
las tablas de distribucin de frecuencias relativas pueden ser distintas, para
un mismo nmero de respuestas malas y buenas, puede haber un z distinto
y por lo tanto un puntaje final distinto.
Por construccin del instrumento, la distribucin de los puntajes finales
distribuyen de forma normal (o gaussiana). De aqu que podamos realizar
algunos estudios interesantes, utilizando el test t de diferencia de medias.

7.4

Preguntas a Resolver

1. Se dice que la educacin de Colegios Municipales es inferior a los colegios Particulares Pagados. Suponiendo que la PSU es una buena medida de calidad en la educacin, podra usted corroborar o descartar
eso? Tome en cuenta tanto la prueba de Lenguaje y Comunicacin
como la de Matematica. No olvide verificar igualdad de varianzas para
utilizar el test adecuado. Utilice la base de datos en datoslab7.xls.1
2. Existe diferencia entre Colegios Municipales y Particulares Subvencionados?
3. Uno de los temas que se suele tocar es la gran centralizacin de Chile.
Esto quiere decir que los recursos y las prioridades se establecen para la
Regin Metropolitana en desmedro de las dems regiones. Una de las
repercusiones que puede tener esto es una inferior calidad educativa en
regiones. Puede comprobar estadsticamente esta hiptesis utilizando
las pruebas PSU como medicin de calidad?

Los datos fueron obtenidos del sitio www.demre.cl . La base de datos del archivo
datoslab7.xls contiene los promedio de todos los establecimiento educacionales diurnos.
Se excluyen los vespertinos y liceos tcnicos.

38

8
8.1

Pruebas No-Paramtricas. Prueba de MannWhitney


Objetivos

Analizar, a travs de una prueba no-paramtrica, si existe diferencia entre 2


proporciones de datos que distribuyen no-normal.

8.2

Funciones Excel 2010

Funciones: CONTARA, CONTAR.SI

8.3

Caso Aplicado: Hipdromo Chile y Club Hpico

En Chile la industria de las apuestas es permitida y est regulada. Segn


proyecciones de la Polla Chilena de Beneficencia, en Chile las apuestas facturan sobre los 1.200 millones de dlares. Esto slo contando la apuesta
regulada. De este total, un 22,7% corresponde a las carreras hpicas; el resto
lo acapara los casinos y juegos de azar (Kino, Loto, etc).
Para entender el sistema de apuesta hpica recordaremos lo bsico: Toda
carrera tiene un nico caballo favorito y un nico ganador. En general, las
carreras se corren de 10 a 15 caballos en una cancha que tiene una distancia
entre 1000 y 2000 metros. Existen varios tipos de apuestas. Las ms conocidas son: a ganador, a plac y trifecta. En el primer tipo de apuesta, se
recolecta el premio slo si el caballo elegido gana. En las apuestas a plac: se
recolecta dinero cuando el caballo elegido sale en segundo lugar o ganador.
Y trifecta, se gana si se acierta a los caballos que llegarn primero, segundo
y tercero en el orden exacto elegido. En Chile, las canchas ms importantes
dedicadas a las carreras hpicas son: Hipdromo Chile, Club Hpico y Valparaiso Sporting Club.
Pero el deporte hpico no slo es una actividad comercial en donde las
apuestas juegan un papel preponderante en su desarrollo, sino que tambin
es una fuente de supersticin, fantasa y mitos. Por ejemplo, en Inglaterra
del siglo pasado, exista el mito que ciertas personas con poderes especiales
eran capaces de conseguir lo que queran de un caballo con solo susurrarle al
odo la orden que deseaban que cumpliese. Con esto, podan, supuestamente,
lograr una mayor probabilidad de ganar en las carreras. Basado en este mito,

39

fue rodada la pelcula El hombre que susurraba a los caballos, a cargo del
director y actor Robert Redford.
As como en otros pases, en la escena nacional tambin tenemos mitos
hpicos. Uno de ellos dice relacin con los caballos favoritos. El mito establece
que en el Club Hpico la proporcin de los caballos favoritos que ganan una
carrera es mayor que en el Hipdromo Chile. Ser cierto este mito?

8.4

Preguntas a Resolver

1. Es razonable pensar que vare la probabilidad de ser ganador, dado


que un caballo es el favorito, para distintos lugares donde se desarrolla
una carrera?
2. Con la base de datos del archivo2 datoslab8.xls cree una tabla de
contingencia. Las variables son: lugar de la carrera y si gan o no el
favorito. Utilice la funcin contar.si de Excel para facilitar la obtencin
de las frecuencias.
3. Utilizando una prueba no-paramtrica, qu dira usted acerca de este
mito? Es cierto? Pruebe si existe diferencia o no entre las probabilidades.
4. Basado en su hallazgo del punto 3) qu recomendacin hara a un
apostador de caballos?

Se cont con la ayuda de Ricardo Guerra, estudiante de Ingeniera Comercial de la


Universidad Finis Terrae, en la recopilacin de datos. Estos se obtuvieron de los sitios:
www.clubhipico.cl e www.hipodromo.cl

40

9
9.1

Correlacin y causalidad. Dependencia lineal


Objetivos

Analizar correlaciones entre variables a travs del coeficiente de correlacin


y test de hiptesis. Distinguir entre correlacin y causalidad. Distinguir
variables espreas de las variables relevantes.

9.2

Funciones Excel 2010

Funciones: COEF.DE.CORREL. Mdulo de Anlisis de Datos: Coeficiente


de correlacin

9.3

Caso Aplicado: Venta de Autos Nuevos

La empresa automotora Geils S.A. es una empresa familiar dedicada a la


venta de automviles nuevos. Fundada en el ao 2006, es administrada por
Joaqun Geills, su seora Daniela y por Ignacio, su hijo menor. Al ao de su
creacin, sufrieron los embates de la crisis econmica que afect a la economa
mundial y que repercuti fuertemente en el rubro automotriz y a su negocio
en particular.
Para poder tener mayor informacin y prepararse ante posibles escenarios
macroeconmicos adversos, decidieron realizar un anlisis de las variables que
inciden en la venta de autos nuevos en Chile. Como primera aproximacin,
la familia ha decidido discutir lo que cada miembro, en su experiencia, cree
que son las variables ms importantes.
Ignacio, hermano menor y encargado de la contabilidad opina: Para
m, la variable vivienda debera ser clave. Cuando uno se compra una casa
o un departamento, lo ms probable es que si uno se independiza, tambin
adquiera un vehculo. Una vivienda va acompaada de un auto. Por lo tanto,
un aumento en la venta de viviendas nuevas debera aumentar las ventas de
automviles.
Joaqun, el padre de familia es ms categrico:Para m, las nicas variables importantes son: el precio del dlar y el Producto Interno Bruto per
cpita. Si a la economa chilena le va bien y cada habitante tiene ms poder
adquisitivo, a nosotros tambin nos debera ir bien. Por otro lado, como im-

41

portamos los vehculos, a mayor precio del dlar ms caro debemos venderlos
y por ende menos nos compran.
Daniela, su seora, agrega: Tambin hay que considerar que a medida
que la poblacin aumenta ms vehculos se van a demandar. Especialmente
si crece el nmero de personas jvenes, que son las que ms manejan. Es
decir, que la venta de automviles tambin debera depender del nmero de
personas que nazcan.

9.4

Preguntas a Resolver

1. Indique, analizando las opiniones de cada uno de los integrantes de la


familia, qu variables causan a cuales, segn lo que se desprende de lo
dicho por cada uno.
2. Los siguientes grficos fueron obtenidos de las bases de datos del Banco
Central de Chile y corresponden a las variables mencionadas por cada
integrante de. Los datos abarcan desde el ao 1994 hasta el 2007.
A partir de ellos, indique en cules se puede apreciar algn grado de
dependencia entre las variables. La dependencia observada es negativa
o positiva?
3. Con el objeto que pueda realizar un anlisis cuantitativo usted dispone
de la base de datos datoslab9.xls la que incluye las variables antes
mencionadas. Realice un anlisis de correlacin entre las variables.
Analice signo y significancia de los coeficientes de correlacin.
4. Obtenga la tasa de cambio para cada una de las variables y obtenga
las correlaciones. Analice signo y significancia.
5. Qu es ms apropiado para el anlisis de estas variables?Los valores
absolutos o las tasas de cambio? Por qu?
6. Que puede concluir respecto a las variables que afectan la venta de
autos en Chile?

42

43

44

10
10.1

Test de Significancia Individual. R-cuadrado.


Pronstico
Objetivos

Realizar una regresin lineal simple basado en el modelo de mercado. Obtener


el R cuadrado, probar significancia del estimador de la pendiente y realizar
un pronstico basado en un escenario desfavorable para la economa mundial.

10.2

Funciones Excel 2010

Funciones: PENDIENTE, PRONOSTICO, INTERSECCION.EJE, COEF.DE.CORREL.

10.3

Caso Aplicado: Modelo CAPM del Sector Elctrico

Enersis S.A.
Enersis S.A. es una empresa de distribucin elctrica, servicios de ingeniera e informtica, procesamientos de datos y servicios de abastecimiento
y comercializacin de productos elctricos. Comenz en el ao 1988 como
una sociedad nacida de la Compaa Chilena Metropolitana de Distribucin
Elctrica cuya entrada al mundo privado se formaliz el ao 1987 con la incorporacin de varias AFP-s e inversionistas privados e institucionales junto
con los mismos trabajadores de la empresa.
En el ao 1992 Enersis se expandi internacionalmente teniendo presencia en sectores elctricos de Argentina, Brasil, Colombia y Per. En 1993
comenz a transar ADRs en la Bolsa de Nueva York (NYSE) bajo el nemotcnico ENI.
Al 31 de diciembre del 2010 tena 195 plantas elctricas y serva, como
consumidores finales, a aproximadamente 50 millones de personas.
Vale S.A.
La empresa Vale do Rio Doce es una empresa fundada en 1942 con sede
en Rio de Janeiro, Brazil. Dentro de las actividades que realiza estn: la exploracin, produccin y venta de metales y fertilizantes; servicios de logstica
y generacin de energa elctrica. Su principal rubro es la minera del hierro.

45

Actualmente posee 10179 kilmetros de lneas frreas y 8 terminales martimos.


En el ao 2002 comenz a transar ADRs en la Bolsa de Nueva York
(NYSE) bajo el nemotcnico VALE.
Modelo de Mercado
El modelo de Mercado es una variante del Modelo de CAPM en donde se
tiene la siguiente ecuacin:
= + +
es la tasa de retorno de la accin en el perodo , es la tasa de retorno
de la cartera de mercado para el mismo perodo , y es el residuo de la
regresin, es decir, la tasa de retorno no explicada por la parte determinstica
del modelo.
Al igual que en el modelo del CAPM, el parmetro (el beta) es una
medida de riesgo sistemtico. Es decir, es el componente del retorno de la
accin que se ve directamente afectado por las fluctuaciones de la economa
como un todo. En el caso que el beta sea mayor que 1, el retorno de la accin
fluctuar en mayor medida que la economa. De la misma manera, en caso
que sea menor que 1, el retorno fluctuar en menor medida que los cambios
en los retornos en la economa y por tanto su riesgo ser menor.
La tasa de retorno de una accin se calcula como:

1
=

donde es el precio de cierre ajustado por dividendos y divisiones (Split)


en la fecha .
Problema del laboratorio
La empresa de inversiones BlueFinders es una empresa de inversiones con
sede en USA que invierte en compaas con alta capitalizacin burstil, y con
riesgo moderado. Dentro de las 18 carteras que administra, posee un fondo
de inversin denominado LAT20 que agrupa 20 empresas latinoamericanas.
Los requisitos mnimos para que una accin est dentro del portafolio son
los siguientes:
1. Estar dentro de las 10 empresas con mayor capitalizacin burstil de
sus respectivos pases
46

2. Transar en el mercado de ADRs en USA.


3. Poseer un riesgo de mercado (medido por su beta de 90 das bolsa) de
no ms de 1,5.
4. Tener una participacin dentro del fondo de no ms de 10% y no menos
de un 2%
A finales de mes el administrador del portafolio debe decidir si aumentar,
disminuir o dejar igual la participacin de los activos que componen su
cartera o, en caso de no cumplir con los requisitos mnimos anteriormente
establecidos por ms de 2 semestres consecutivos, sacarla del fondo.
Dos de las 20 empresas que componen el portafolio son Enersis S.A. y
Vale S.A. Actualmente cada una representa un 5% y un 7% del portafolio del
fondo LAT20 respectivamente y estn dentro de las 10 empresas con mayor
capitalizacin burstil en sus pases.

10.4

Preguntas a Resolver

1. A travs del sitio http://es.finance.yahoo.com obtenga las series de precios de ambas acciones y calcule las tasas de retorno segn metodologa
planteada en la seccin Modelo de mercado. (bsquelas en la pgina
por su nemotcnico). El precio ajustado est en la columna Adj.Close.
2. Utilice el ndice S&P500 como retorno de mercado (el nemotcnico es:
^GSPC. Analice, significancia y 2 .
3. Es el modelo de mercado un buen modelo para la tasa de retorno de
estas acciones
4. Cumplen ambas acciones con el punto 3 de los requisitos para estar
en el fondo LAT20?
5. Cul es el pronstico para 1 da suponiendo que el mercado (a travs
del ndice S&P500) baja un 1%?
6. Si usted tiene la conviccin de que aqu a 6 meses el mercado bajar
un 6%, qu cambio hara en la participacin de estas acciones en su
portafolio? Explique conceptualmente.

47

11

11.1

Modelo de regresin mltiple. Variables


dicotmicas y politmicas. Test de significancia conjunta
Objetivos

Analizar las variables que inciden en el precio de un departamento en la


comuna de providencia utilizando el modelo de precios hednicos. Probar
significancia de las variables en forma conjunta y ver impacto de variables
dicotmicas y politmicas.

11.2

Funciones Excel 2010

Mdulo Anlisis de datos: Regresin.

11.3

Caso Aplicado: Sector Inmobiliario en Santiago

La metodologa de precios hednicos consiste en explicar el precio de un


producto (o servicio) a travs de sus atributos. Por ejemplo, podemos explicar
el precio del vino por: los grados alcohlicos que tiene, el tipo de envase
(botella o caja), el tamao del envase (en centmetros cbicos), la cantidad
y tipos de premios, la nota otorgada por un catador experto, etc. Estos
atributos pueden tener una incidencia positiva (es decir hacer aumentar el
precio del producto o servicio, negativa o no tenerla. Esta incidencia es
observada en el signo del beta que acompaa a esa variable.
En este laboratorio exploraremos los atributos que inciden en el precio de
venta de departamentos en la comuna de Providencia. La funcin especfica
que utilizaremos es la de una funcin lineal. Es decir, una funcin de la
siguiente forma:
= 0 + 1 1 + 2 2 + + 1 1 +
donde es el precio del departamento y los s sus atributos.
Tambin suelen aplicarse funciones semi-logaritmicas y logartmicas (funciones que sern utilizadas en el laboratorio 12).
Las variables que utilizaremos y los nombres asociados a los datos de la

48

hoja de Excel datoslab11.xls son las siguientes:


Variable
Nombredelavariableendatoslab11.xls
Preciodeldepartamento(enpesos)
Precio
Distanciadesdeelmetro(enmetros)
Dist
Pisodelinmueble
Piso (1, primer piso; 2 segundo piso, etc.)
Superficietotal(enmetroscuadrados)
Mts2
NmerodeDormitorios
Dorm
Nmerodebaos
Ban
Silacocinaesamoblada(1si;0,no)
Cociamo
Sihaypiscina(1si;0,no)
Piscina
Siposeesalndeeventos(1si;0,no)
Saloneven
Siposeegimnasio(1si;0,no)
Gim
Siposeeestacionamiento(1si;0,no)
Estacio
Siposeebodega(1si;0,no)
Bodega
Ubicacin,variablepolitmicacompuestadelassiguientesvariablesdicotmicas:
Sitieneubicacinnororiente(1si;0,no)
Sitieneubicacinnorponiente(1si;0,no)
nororien
Sitieneubicacinsuroriente(1si;0,no)
norponien
Sitieneubicacinsurponiente(excluida)
surorien

Los datos3 fueron obtenidos de www.portalinmobiliario.com durante el mes


de noviembre de 2011 y de llamadas telefnicas realizadas para aquellas variables que no aparecan publicadas.
Para medir la distancia a la estacin de metro ms cercana se utiliz los
3

En la recoleccin de datos, este laboratorio cont con la ayuda de los alumnos Carlos
Benavente, Maximiliano Cuevas y Matas Fuentes.

49

mapas y las funciones de medicin de distancias del sitio www.mapcity.cl.

Debemos tomar en cuenta que el precio de una propiedad no slo esta dado
por estos atributos, sino por otras variables como la especulacin, las polticas
regulatorias, cercana con lugares no deseados (como crceles, basurales), etc.
Sin embargo, es un muy buen punto de inicio para entender las variables que
inciden y la magnitud en las que afectan el precio. Otro punto a considerar
es que el precio de venta utilizado fue el que se publica antes de cerrar un
acuerdo de venta y por ende no representa necesariamente el precio final ni
el de equilibrio. En este sentido existe un sesgo. Sin embargo, la diferencia
de precios para estos casos suele ser mnima.

11.4

Preguntas a Resolver

1. Antes de realizar la regresin, indique: Qu signo esperara que tuviese las variables: metros cuadrado, piscina, piso, distancia al metro?
Explique brevemente.
2. Realice la regresin utilizando la herramienta de Anlisis de Datos de
Excel. Son los signos obtenidos coherentes con lo que usted esperaba
en el punto 1)?
3. Son las variables independientes significativas en forma conjunta?
4. Es la variable ubicacin significativa? Para verificarlo realice un test
de significancia conjunta a las variables dummies asociadas a ubicacin.
50

12

12.1

Modelo de regresin mltiple. Especificacin funcional y seleccin de modelos.


Modelo semi-logartmico. R-cuadrado ajustado
Objetivos

Testear entre modelos alternativos y con distinta especificacin funcional.


Comparar R cuadrado ajustado y realizar test Reset de Ramsey.

12.2

Funciones Excel 2010

Funciones: LN, EXP.

12.3

Caso Aplicado: La Industria de Cervezas en Chile

Aunque la cerveza en nuestro pas no alcanza los niveles de consumo de otros


pases (segn la consultora Euromonitor International el ao 2010 Chile fue
el menor consumidor de Sudamrica con 47 litros anuales por persona), existe
una gran variedad de marcas y tipos. Entre ellas, destaca el gran crecimiento
que ha tenido la industria artesanal. Tambin existe una gran variedad de
cervezas internacionales. Segn informacin de ProChile para el ao 2011
los pases desde los que importamos cerveza son, en orden de mayor a menor
volumen: Estados Unidos, Argentina, Bolivia Alemania, Per, Rusia Espaa,
Blgica, Holanda, Guatemala, Turqua, Singapur, China y Reino Unido.
A travs de un modelo de Precios Hednicos, analizaremos las variables
que inciden en el precio de las cervezas en Chile. Este modelo establece que
el precio de un producto est en funcin de sus caractersticas. Las variables
que utilizaremos y los nombres asociados a los datos4 de la hoja de Excel
4

Este laboratorio cont con la ayuda en la recopilacin de datos de los alumnos Juan
Jos Snchez, Juan Pablo Barba y Guillermo Yvar.

51

datoslab12.xls son las siguientes:


Variable
Siesartesanal(1si;0no)f
Color
SiesNegra(1siesNegra;0resto)
Siesamarilla(1siesAmarilla:0resto)
Presentacin
Botellaretornable(1siesbotellaretornable;0resto)
Botelladesechable(1;siesbotelladesechable;0resto)
Lata(0;0)
Cantidaddecontenido(enCC)
Gradosalcohlicos
NacionaloImportada(1siesimportada;0siesnacional)
Siesnormalolight(1sieslight;0siesnormal)
Siesconosinalcohol(1sitienealcohol;0resto)

12.4

Nombredelavariableendatoslab11.xls
artesanal
Negra
Amarilla
Botella
Desechable
cc
grados
importada
light
alcohol

Preguntas a Resolver

1. Sin realizar an la regresin, indique qu signo esperara para las variables y ?


2. Explique qu problema puede tener la regresin dado que los datos
fueron obtenidos de distintos sitios (3 supermercados y pginas web).
Sera mejor la recopilacin de datos de un solo lugar?
3. Realice una regresin lineal simple y contraste los resultados con el
punto 1)
4. Son los grados alcohlicos una variable importante en trminos de
magnitud? (contraste con la significancia)
5. Analizando la base de datos de Excel qu inconvenientes tiene la variable light en relacin a su representatividad? Qu puede decir de la
siguiente recomendacin siempre es bueno analizar no slo los resultados de las salidas, sino que tambin la base de datos?
6. Realice una regresin con las variables que sean significativas. Compare
el R cuadrado ajustado. Cual modelo es mejor tomando en cuenta esta
medida?
52

7. Realice una regresin semi-log con todas las variables (signifcativa y no


significativas) Mejora la estimacin con esta especificacin?
8. Verifique que la especificacin funcional semi-log es apropiada con el
test de Reset de Ramsey. Elija hasta una potencia de 3 para el test.

53

Vous aimerez peut-être aussi