Vous êtes sur la page 1sur 286

Microeconometra Aplicada

Javiera Vsquez Nez1


Mayo 2012

1 Agradezco

a Jos Manuel Eguiguren la revisin y comentarios de este apunte. Cual-

quier comentario o sugerencia enviar correo electrnico a jvasquez@fen.uchile.cl

ndice general
1. Introduccin

1.1.

Algunas preguntas econmicas . . . . . . . . . . . . . . . . . . . .

1.2.

Preguntas sobre Preguntas . . . . . . . . . . . . . . . . . . . . . .

1.3.

El Ideal de lo Experimental

1.4.

. . . . . . . . . . . . . . . . . . . . .

11

1.3.1.

El Problema de Seleccin . . . . . . . . . . . . . . . . . . .

11

1.3.2.

La asignacin aleatoria resuelve el problema de seleccin

13

1.3.3.

Anlisis de Regresin para experimentos

. . . . . . . . . .

13

. . . . . . . . . . . . . . . . . . . . . . . . . . . .

14

1.4.1.

Corte Transversal . . . . . . . . . . . . . . . . . . . . . . .

14

1.4.2.

Series de tiempo

. . . . . . . . . . . . . . . . . . . . . . .

15

1.4.3.

Datos de Panel o Longitudinales . . . . . . . . . . . . . . .

15

Tipos de datos

2. Modelo de Regresin Lineal


2.1.

18

Anlisis de Regresin . . . . . . . . . . . . . . . . . . . . . . . . .

18

2.1.1.

Qu es una regresin? . . . . . . . . . . . . . . . . . . . .

18

2.1.2.

Relaciones estadsticas versus relaciones determinsticas . .

21

2.1.3.

Regresin versus Causalidad . . . . . . . . . . . . . . . . .

21

2.1.4.

Regresin versus Correlacin . . . . . . . . . . . . . . . . .

22

2.2.

Anlisis de regresin con dos variables


2.2.1.

Funcin de regresin poblacional (FRP)

2.2.2.

Especicacin estocstica de la funcin de regresin poblacional

2.3.

. . . . . . . . . . . . . . .
. . . . . . . . . .

28

2.2.3.

Funcin de regresin muestral . . . . . . . . . . . . . . . .

30

2.2.4.

Propiedades de un Estimador

. . . . . . . . . . . . . . . .

33

Modelo de regresin con dos variables . . . . . . . . . . . . . . . .

36

2.3.1.

Mtodo de Mnimos Cuadrados Ordinarios . . . . . . . . .

36

2.3.2.

Ejemplo Estimacin MCO . . . . . . . . . . . . . . . . . .

39

2.3.3.

Supuestos detrs del mtodo MCO

40

2.3.4.

Errores estndar de los Estimadores Mnimos Cuadrados

2.3.5.

2.5.

. . . . . . . . . . . . .

Estimador Mnimo Cuadrado Ordinario de

44

. . . . . . .

45

. . . . . . . . . . . . . . . .

47

2.4.1.

Representacin Matricial del Modelo de Regresin Lineal .

47

2.4.2.

Estimador Mnimo Cuadrados Ordinarios . . . . . . . . . .

48

Propiedades del estimador MCO . . . . . . . . . . . . . . . . . . .

50

2.5.1.

Propiedad de mejor estimador lineal insesgado . . . . . . .

51

2.5.2.

Teorema de Gauss-Markov . . . . . . . . . . . . . . . . . .

51

Modelo de Regresin con k variables

3. Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste


3.1.

27

. . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Ordinarios . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.4.

25

53

Bondad de Ajuste y Anlisis de Varianza . . . . . . . . . . . . . .

53

3.1.1.

Modelo de Regresin Lineal en Desvos . . . . . . . . . . .

54

3.1.2.

Anlisis de Varianza

55

3.1.3.

Bondad de Ajuste:

R2

. . . . . . . . . . . . . . . . . . . . .
y

2
R

. . . . . . . . . . . . . . . . .

56

3.2.

3.3.

Inferencia

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

58

3.2.1.

Test t (Una hiptesis lineal) . . . . . . . . . . . . . . . . .

61

3.2.2.

Test F (Conjunto de hiptesis lineales)

. . . . . . . . . . .

70

3.2.3.

Intervalos de Conanza . . . . . . . . . . . . . . . . . . . .

70

3.2.4.

Test de Normalidad (Test de Jarque-Bera) . . . . . . . . .

72

Bondad de Ajuste e Inferencia en STATA . . . . . . . . . . . . . .

73

4. Modelo de Regresin Lineal: Especicacin y Problemas

78

4.1.

Omisin de Variables Relevantes . . . . . . . . . . . . . . . . . . .

80

4.2.

Inclusin de Variables Irrelevantes . . . . . . . . . . . . . . . . . .

83

4.3.

Multicolinealidad

. . . . . . . . . . . . . . . . . . . . . . . . . . .

83

4.4.

Variables Categricas o Cualitativas como Regresores . . . . . . .

86

4.5.

Test de No Linealidades Omitidas . . . . . . . . . . . . . . . . . .

100

4.6.

Heterocedasticidad

. . . . . . . . . . . . . . . . . . . . . . . . . .

102

4.7.

Seleccin de Modelos . . . . . . . . . . . . . . . . . . . . . . . . .

106

4.7.1.

Seleccin entre modelos anidados

. . . . . . . . . . . . . .

106

4.7.2.

Seleccin de modelos no anidados . . . . . . . . . . . . . .

108

5. Estimador de Variables Instrumentales

111

5.1.

Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

111

5.2.

Simultaneidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

113

5.3.

Error de Medicin . . . . . . . . . . . . . . . . . . . . . . . . . . .

114

5.4.

Estimador de Variables Instrumentales

115

5.4.1.
5.5.

. . . . . . . . . . . . . . .

Estimador de Mnimos Cuadrados Ordinarios en dos etapas 116

Ejemplos de Variables Instrumentales . . . . . . . . . . . . . . . .

117

5.5.1.

Afecta la obligatoriedad de educacin a la escolaridad e


ingresos?, Angrist y Krueger (1991) . . . . . . . . . . . . .

5.5.2.

Using Geographic Variation in College Proximity to Estimate the Return to Schooling, Card (1993) . . . . . . . . .

5.5.3.

118

Estimating the payo to schooling using the Vietnam-era


Daft lottery, Angrist y Krueger (1992)

5.6.

117

. . . . . . . . . . .

119

Aplicacin I: Determinantes de los gastos mdicos . . . . . . . . .

120

6. Estimador Mximo Verosmil

126

6.1.

Propiedades de los estimadores MV . . . . . . . . . . . . . . . . .

127

6.2.

Estimacin MV . . . . . . . . . . . . . . . . . . . . . . . . . . . .

128

6.3.

Inferencia en el contexto MV . . . . . . . . . . . . . . . . . . . . .

132

6.3.1.

Test de Razn de Verosimilitud (LR) . . . . . . . . . . . .

132

6.3.2.

Test de Wald (W) . . . . . . . . . . . . . . . . . . . . . . .

133

6.3.3.

Test del Multiplicador de Lagrange (LM) . . . . . . . . . .

133

Algunas acotaciones respecto a la estimacin y la inferencia MV .

137

6.4.

7. Variable Dependiente Discreta

139

7.1.

Modelo de Probabilidad Lineal . . . . . . . . . . . . . . . . . . . .

140

7.2.

Modelo de Eleccin Discreta . . . . . . . . . . . . . . . . . . . . .

144

7.3.

Variable Dependiente Latente

. . . . . . . . . . . . . . . . . . . .

145

7.4.

Estimacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

146

7.5.

Medidas de Bondad de Ajuste . . . . . . . . . . . . . . . . . . . .

151

7.6.

Aplicacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

156

8. Modelos de Respuesta Mltiple


8.1.

Modelos de Respuesta Mltiple Ordenada

162
. . . . . . . . . . . . .

162

8.2.

Modelos Multinomiales . . . . . . . . . . . . . . . . . . . . . . . .

169

8.2.1.

Conditional Logit . . . . . . . . . . . . . . . . . . . . . . .

170

8.2.2.

Multinomial Logit

. . . . . . . . . . . . . . . . . . . . . .

175

8.2.3.

Mixed Logit . . . . . . . . . . . . . . . . . . . . . . . . . .

177

8.2.4.

Independencia de Alternativas Irrelevantes . . . . . . . . .

180

8.2.5.

Modelo Nested Logit . . . . . . . . . . . . . . . . . . . . .

182

8.2.6.

Multinomial Probit . . . . . . . . . . . . . . . . . . . . . .

186

9. Variable Dependiente Limitada

188

9.1.

Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

188

9.2.

Modelos Censurados y Truncados

189

9.3.

9.4.

. . . . . . . . . . . . . . . . . .

9.2.1.

Estimacin por Mxima Verosimilitud

. . . . . . . . . . .

193

9.2.2.

Modelo Tobit

. . . . . . . . . . . . . . . . . . . . . . . . .

194

9.2.3.

Media condicional truncada y censurada

9.2.4.

Efectos Marginales

9.2.5.

Estimacin de Modelos Censurados y Truncados en STATA 197

9.2.6.

Test de Normalidad y Homocedasticidad

. . . . . . . . . .

195

. . . . . . . . . . . . . . . . . . . . . .

197

. . . . . . . . . .

204

Modelos de Seleccin . . . . . . . . . . . . . . . . . . . . . . . . .

208

9.3.1.

Modelo de Seleccin Bivariado (Tobit Tipo II) . . . . . . .

208

9.3.2.

Medias Condicionales en Modelo Tobit Tipo II . . . . . . .

209

9.3.3.

Estimador Heckman Dos Etapas (Heckit) . . . . . . . . . .

210

9.3.4.

Identicacin

211

9.3.5.

Efectos Marginales

. . . . . . . . . . . . . . . . . . . . . .

211

9.3.6.

Estimacin Modelo Tobit Tipo II en STATA . . . . . . . .

212

Modelo de Probabilidad con Seleccin . . . . . . . . . . . . . . . .

215

. . . . . . . . . . . . . . . . . . . . . . . . .

10.Datos de Panel

220

10.1. Modelos de Datos de Panel . . . . . . . . . . . . . . . . . . . . . .


10.1.1. Modelo Pooled

221

. . . . . . . . . . . . . . . . . . . . . . . .

221

10.1.2. Dummies Individuales y de Tiempo . . . . . . . . . . . . .

221

10.1.3. Modelos de Efecto Fijo y Efecto Aleatorio

. . . . . . . . .

222

. . . . . . . . . . . . . . . . . . .

222

. . . . . . . . . . . . . . . . . . . . . . . . .

222

10.2.2. Estimador Between . . . . . . . . . . . . . . . . . . . . . .

223

10.2.3. Estimador de Efectos Fijos o Within

. . . . . . . . . . . .

223

. . . . . . . . . . . . .

224

10.2.5. Estimador de Efectos Aleatorios . . . . . . . . . . . . . . .

225

10.3. Test de Hausman . . . . . . . . . . . . . . . . . . . . . . . . . . .

225

10.4. Estimacin de Datos de Panel en STATA . . . . . . . . . . . . . .

226

10.4.1. Formato de la base de datos . . . . . . . . . . . . . . . . .

226

10.4.2. Descripcin de los datos

227

10.2. Estimadores de Datos de Panel


10.2.1. MCO Pooled

10.2.4. Estimador de Primeras Diferencias

. . . . . . . . . . . . . . . . . . .

11.Regresin de Mediana y Cuantiles


11.1. Regresin de Mediana y Cuantiles en STATA

237
. . . . . . . . . . .

12.Modelos de Datos de Conteo

238

244

12.1. Modelo de Regresin Poisson . . . . . . . . . . . . . . . . . . . . .

245

12.2. Estimacin de Modelo Poisson en STATA . . . . . . . . . . . . . .

246

12.3. Modelo Binomial Negativo . . . . . . . . . . . . . . . . . . . . . .

251

12.4. Estimacin Modelo Binomial Negativo en STATA

252

13.Mtodos No Paramtricos y Semi-paramtricos


6

. . . . . . . . .

256

13.1. Estimacin No Paramtrica de Funciones de Densidad . . . . . . .

256

13.2. Estimacin No Paramtrica de la Relacin Entre Dos Variables . .

260

14.Evaluacin de Tratamiento

263

14.1. El Problema de Sesgo de Seleccin

. . . . . . . . . . . . . . . . .

14.2. Metodologas para Evaluacin de Impacto

264

. . . . . . . . . . . . .

265

14.2.1. Propensity Score Matching . . . . . . . . . . . . . . . . . .

266

14.2.2. Diferencias en Diferencias

. . . . . . . . . . . . . . . . . .

275

. . . . . . . . . . . . . . . . . . . .

277

14.2.3. Regresin Discontinua

15.Modelos de Duracin

284

15.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

284

15.2. Modelos de Duracin . . . . . . . . . . . . . . . . . . . . . . . . .

285

Captulo 1
Introduccin
En este curso estudiaremos diferentes tcnicas economtricas aplicadas a datos a
nivel micro (o individual) que nos permitirn responder a preguntas econmicas
y de polticas pblicas de inters.
Primero comencemos por denir qu se entiende por Econometra, pero esta denicin no es nica:

Ciencia que testea la teora econmica


Herramientas utilizadas para predecir los valores de variables econmicas
Proceso mediante el cual se ajusta un modelo econmico matemtico a
datos reales
Ciencia y arte de usar datos histricos para hacer recomendaciones de poltica cuantitativas

Todas estas deniciones son correctas, pero siendo ms general la Econometra


se puede denir como la ciencia y arte de usar la teora econmica y tcnica
estadsticas para analizar datos econmicos.

1.1.

Algunas preguntas econmicas

Las decisiones en el gobierno y mundo privado (negocios) dependen del correcto entendimiento de la relacin entre las variables claves que afectan estas

Microeconometra Aplicada
Centro de Microdatos

Capitulo 1: Introduccin

decisiones, de esta forma se puede decir que estas decisiones requieren de respuestas cuantitativas a preguntas cuantitativas.
Algunos ejemplos de preguntas que podemos responder son los siguientes:

Aumentar la cantidad de alumnos por profesor mejora el rendimiento de


los alumnos?
Los impuestos a los cigarros reducen la cantidad de cigarros fumados?
Cul ser la tasa de inacin el prximo ao?
Cunto disminuye el consumo por energa elctrica al aumentar el precio?
Existen diferencias salariales entre hombres y mujeres?
Cmo se ve afectada participacin previsional al incrementar los benecios
sociales no contributivos?

Cada una de estas preguntas requiere una respuesta cuantitativa, por ejemplo,
necesitamos determinar en cuantos puntos porcentuales se reduce la tasa de participacin previsional por un incremento en 30 mil pesos en la pensin no contributiva, este nmero debe ser determinado de manera emprica mediante los datos
disponibles. De esta forma, al utilizar una base de datos para responder nuestras
preguntas de manera cuantitativa siempre existir incertidumbre en nuestra respuesta, por lo cual no basta con encontrar la respuesta cuantitativa a la pregunta
sino que adems determinar la precisin de esta.
Una herramienta matemtica que nos permite responder esta pregunta es el anlisis de regresin, el que mide numricamente cuanto cambia una variable (variable
de inters) al cambiar otra variable, manteniendo todo lo dems constante.

1.2.

Preguntas sobre

Preguntas

Al estudiar y aprender las tcnicas economtricas se tiene la tentacin a tratar de


ocuparlas sin pensar mucho en la agenda de investigacin o las preguntas relevantes que quiero responder. Una agenda de investigacin coherente, interesante, y
factible constituye la base sobre la cual se construyen las metodologas estadsticas y economtricas tiles. As, una muy buena econometra no puede salvar una
agenda de investigacin dbil, pero por el contrario el uso promiscuo de tcnicas

Microeconometra Aplicada
Centro de Microdatos

Capitulo 1: Introduccin

economtricas sosticadas a veces puede derrumbar una buena idea.


A continuacin se presenta lo que Angrist y Pischke en su libro Mostly Harmless Econometrics: An Empiricist's Companion denen como la base para un
proyecto de investigacin exitoso. Una agenda de investigacin puede ser organizada en torno a cuatro preguntas (Frequently Asked Questions, FAQs), las cuales
preguntan sobre:

Relacin de inters
El experimento ideal
La estrategia de identicacin
EL modo de hacer inferencia

As, para comenzar deberamos preguntarnos Cul es la relacin causal que nos

interesa?, a pesar de que la investigacin puramente descriptiva tiene un rol importante que jugar, la investigacin ms interesante en ciencias sociales tiene que
ver con causa y efecto, como por ejemplo el efecto del tamao de la clase sobre
el rendimiento de los alumnos. Una relacin causal es til para hacer predicciones sobre las consecuencias de hacer cambios o polticas, nos dice que pasara en
un mundo alternativo (o contrafactual). Por ejemplo, como parte de la agenda
que investiga la productividad de la capacidad humana o capital humano se ha
investigado el efecto causal de escolaridad sobre salarios. El efecto causal de escolaridad sobre salarios es el incremento en salarios que un individuo recibira al
incrementar su escolaridad.
La segunda pregunta tiene que ver con el experimento que idealmente nos permitira capturar el efecto causal de inters. Por ejemplo, en el caso que nos interesa
el efecto causal de escolaridad sobre ingresos podramos pensar en ofrecer una
compensacin a las personas que dejan el colegio para que no lo hagan y ver cuales son las consecuencias. Los experimentos ideales generalmente son hipotticos.
La tercera y cuarta pregunta tienen que ver con los elementos para generar un
estudio especco. Angrist y Krueger (1999) utilizan el trmino estrategia de
identicacin para describir la forma en que los investigadores utilizan los datos
observados (no experimental) para aproximar un experimento real. Con respecto a la cuarta FAQs tiene que ver con la mejor forma de hacer inferencia en el
contexto de los datos utilizados, as el modelo de hacer inferencia depender de
la poblacin bajo estudio, los datos disponibles, y los supuestos utilizados para
obtener los errores estndar.

10

Microeconometra Aplicada
Centro de Microdatos

Capitulo 1: Introduccin

1.3.

El Ideal de lo Experimental

Las investigaciones con un diseo experimental han sido las ms crebles e inuyentes. Un ejemplo es el Proyecto Perry Preschool, donde se intervinieron de
manera aleatoria 123 nios pre-escolares de raza negra en Ypsilanti (Michigan)
en el ao 1962. El grupo de tratamiento de este programa fue seleccionado de
manera aleatoria para recibir una intervencin intensiva que incluye educacin
pre-escolar y visitas a la casa. Este programa fue de gran impacto en los estudios
realizados, ya que sigui a los nios hasta la edad de 27 aos, adems este programa dio el pie de partida para un programa pre-escolar masivo.
Otro ejemplo es el programa PROGRESA en Mxico....

1.3.1. El Problema de Seleccin


Suponga que estamos en una pregunta causal (supuestamente), por ejemplo

Los hospitales hacen a las personas ms saludables? , para algunos esta pregunta puede parecer metafrica, pero es la clase de pregunta que le interesa a los
economistas en el rea de la salud, para hacerla ms realista imagine que estamos
estudiando a la poblacin de adultos mayores pobres (que no tienen seguro de
salud) que usan las atenciones de urgencia como cuidados primarios de salud,
y algunos de estos pacientes son hospitalizados recibiendo los cuidados de salud
que necesitan. Esta manera de obtener los cuidados de salud es costosa, satura
las instalaciones de urgencia de los hospitales, y probablemente no es eciente.
Adems de que esta poblacin vulnerable se expone a otro tipo de enfermedades
al ingresar al hospital mediante esta va.
Luego, podramos comparar el estatus de las personas que ingresan al hospital
con el estatus de las personas que no ingresan al hospital, la encuesta National Health Interview Survey (NHIS) de Estados Unidos contiene la informacin
necesaria para hacer esta comparacin. Especcamente, contiene las preguntas:

Durante los ltimos 12 meses, Estuvo hospitalizado?


Ud. dira que en general su salud es excelente, muy buena, buena, regular,
o mala?, la respuesta a esta pregunta toma valores de 1 a 5, donde 1 es
excelente y 5 es mala.

11

Microeconometra Aplicada
Centro de Microdatos

Capitulo 1: Introduccin

Tabla 1.1
Estatus de salud promedio hospitalizados y no hospitalizados

La diferencia en medias es 0.71 en favor de las personas no hospitalizadas, esta


diferencia es signicativa con un estadstico

t de 58.9. Tomando este resultado de

manera literal sugiere que los hospitales enferman a las personas. Sin embargo,
es fcil notar que esta comparacin no puede ser tomada de manera literal, ya
que las personas que van a los hospitales probablemente son menos saludables
desde un principio.
Para ver este problema de manera ms precisa, pensemos la variable de hacer
asistido a un hospital como un tratamiento binario

Di = {0, 1}.

La variable de

inters o resultados (outcome), en este caso el estatus de salud, es denotada por

Yi .

La pregunta es como

Yi

es afectada por el cuidado del hospital. Par responde

esta pregunta, debemos imaginarnos que hubiera pasado con el estado de salud
de una persona que fue al hospital si no hubiera ido y viceversa. As, para cada
uno de los individuos existen dos potenciales variables:

Resultado P otencial =
Es decir,

Y0i

Y1i ,
Y0i ,

es el estado de salud del individuo

independiente si fue o no, e

Y1i

si

Di = 1
Di = 0
de no haber ido al hospital

el estado de salud de haber ido al hospital. Nos

gustara saber la diferencia entre


efecto causal de que el individuo
El resultado observado

si

Y1i e Y0i lo que podra


i vaya al hospital.

ser interpretado como el

Yi puede ser escrito en funcin de los resultados potenciales

de la siguiente manera:

Y1i , si Di = 1
Y0i , si Di = 0
= Y0i + (Y1i Y0i )Di

Yi =
(1.1)
Esta notacin es til ya que

(Y1i Y0i )

mide el efecto causal de hospitalizacin

para un individuo. En general, es probable que exista una distribucin en la poblacin de

Y1i

Y0i ,

de esta forma el efecto tratamiento puede ser diferente para

diferentes personas, el problema es que nunca observamos ambos resultados potenciales para una misma persona, por lo cual debemos obtener el efecto de la

12

Microeconometra Aplicada
Centro de Microdatos

Capitulo 1: Introduccin

hospitalizacin comparando el estado de salud promedio de los que estuvieron


hospitalizados con el estado de salud promedio de los que no estuvieron hospitalizados.
As, la comparacin de los promedios por estatus de hospitalizacin nos dice
algo sobre los resultados potenciales, pero no necesariamente lo que queremos
determinar. Formalmente:

E[Y |D = 1] E[Yi |Di = 0] =


| i i
{z
}
Dif erencia

observada

E[Y1i |Di = 1] E[Y0i |Di = 1]


|
{z
}
Ef ecto

tratamiento

sobre

tratados

+ E[Y0i |Di = 1] E[Y0i |Di = 0]


|
{z
}
Sesgo

de

seleccin

EL sesgo de seleccin muestra la diferencia en la condicin inicial o sin tratamiento


entre el grupo de tratados y no tratados, en este caso como se espera que el estado
de salud de los hospitalizados sea peor que el de los no hospitalizados, el sesgo de
seleccin es positivo en este caso.

1.3.2. La asignacin aleatoria resuelve el problema de seleccin


La asignacin aleatoria de
nacin aleatoria hace que

Di
Di

resuelve el problema de seleccin ya que la asigsea independiente de los resultados potenciales.

Notemos que:

E[Yi |Di = 1] E[Yi |Di = 0] = E[Y1i |Di = 1] E[Y0i |Di = 0]


= E[Y1i |Di = 1] E[Y0i |Di = 1]
dado la independencia entre

Y0i

Di ,

el sesgo de seleccin se elimina.

1.3.3. Anlisis de Regresin para experimentos


El anlisis de regresin es una herramienta til para estudiar preguntas de causalidad, incluyendo datos experimentales. Supongamos que el efecto tratamiento
es constante para todos los individuos

= Y1i Y0i .

Luego, podemos escribir la

ecuacin (1.1) de la siguiente manera:

Yi = |{z}
+ Di +
|{z}
E[Y0i ]

(Y1i Y0i )

13

i
|{z}

Y0i E[Y0i ]

Microeconometra Aplicada
Centro de Microdatos

Capitulo 1: Introduccin

Obteniendo la esperanza condicional de la variable de resultado observada en el


estatus de tratamiento se tiene:

E[Yi |Di = 1] = + + E[i |Di = 1]


E[Yi |Di = 0] = + E[i |Di = 0]
De esta forma:

E[Yi |Di = 1] E[Yi |Di = 0] =

|{z}
ef ecto

+ E[i |Di = 1] E[i |Di = 0]


|
{z
}

tratamiento

El sesgo de seleccin reeja la correlacin entre

Sesgo

de

y el regresor

seleccin

Di ,

y dado que:

E[i |Di = 1] E[i |Di = 0] = E[Y0i |Di = 1] E[Y0i |Di = 0]


reeja las diferencias en el resultado potencial (de no ser tratado) entre tratados
y no tratados

1.4.

Tipos de datos

Los datos que disponemos para trabajar pueden tener tres formatos: corte
transversal, Series de Tiempo, y Datos de Panel (o Longitudinales).

1.4.1. Corte Transversal


Los datos de corte transversal se caracterizan por recopilar informacin para
varias unidades en un momento del tiempo, las unidades pueden ser individuos,
hogares, comunas, colegios, empresas, regiones, etc.
Un ejemplo de datos de corte transversal en Chile es la Encuesta CASEN.
La Figura 1.1 muestra un ejemplo de una base de corte transversal de pases,
que muestra la tasa de mortalidad, expectativa de vida, y otras variables para el
ao 2005.

14

Microeconometra Aplicada
Centro de Microdatos

Capitulo 1: Introduccin

Figura 1.1
Datos de tipo Corte Transversal

1.4.2. Series de tiempo


Las series de tiempo representan observaciones para una sola unidad en varios momentos del tiempo, la frecuencia de los datos puede ser diaria, semanal,
trimestral, anual, etc.
Por ejemplo, del Banco Central de Chile podemos obtener las series de tiempo del Producto Interno Bruto (PIB), Indice de Precios al Consumidor (IPC),
fuerza de trabajo, ocupados, etc. Ver Figura 1.2.

1.4.3. Datos de Panel o Longitudinales


Los datos longitudinales corresponden a observaciones de varias unidades en
distintos momentos del tiempo, por ejemplo puedo tener los puntajes en SIMCE,
PSU, nmero de alumnos, nmero de profesores, para varios colegios entre los
aos 2000 y 2008.

15

Microeconometra Aplicada
Centro de Microdatos

Capitulo 1: Introduccin

La ventaja de los datos de panel es que observamos la mima unidad en diferentes


momentos del tiempo lo que nos permite estudiar la dinmica en el comportamiento de diversas variables.
La Figura 1.3 muestra un ejemplo de datos de panel, con observaciones de varios
pases entre el ao 2004 y 2009.

Figura 1.2
Datos de tipo Series de Tiempo

16

Microeconometra Aplicada
Centro de Microdatos

Capitulo 1: Introduccin

Figura 1.3
Datos de tipo Longitudinal

17

Captulo 2
Modelo de Regresin Lineal
2.1.

Anlisis de Regresin

2.1.1. Qu es una regresin?


En la mayora de los problemas econmicos y de evaluacin de polticas pblicas
el inters est en estudiar el efecto causal que tiene una o ms variables sobre
alguna variable de inters (variable de resultado).
El concepto ceteris paribus (todo lo dems constante) juega un rol fundamental
en determinar el efecto causal, ya que generalmente habr una serie de variables
que afectan el comportamiento de nuestra variable de inters y debemos ser capaces de controlar por todas ellas para poder aislar e identicar de manera correcta
el efecto de una o ms variables particulares que nos interesen sobre la variable
de inters.
Por ejemplo, si estamos interesados en determinar el efecto de una semana adicional de capacitacin sobre la productividad de los trabajadores (lo que se ver
reejado en su salario) debemos considerar los otros factores que pueden afectar
la productividad del trabajador como educacin y experiencia, es decir, debemos
preguntarnos cul es el efecto de una semana adicional de capacitacin dado un
nivel de escolaridad y un nivel de experiencia.
Suponga que nos interesa estudiar en efecto sobre el rendimiento de los alumnos,
medido a travs del puntaje SIMCE, de reducir el tamao del curso (o alumnos

18

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

por profesor) en 2. Luego queremos encontrar una relacin entre Simce y TamaoCurso, donde signica cambio. Lo que queremos determinar es cunto cambia
el puntaje de Simce en relacin a cuanto est cambiando el tamao del curso,
vale decir:

Simce
Tamao

Curso

mide cuanto cambia el puntaje del Simce por cada cambio en tamao de curso,

por ejemplo, si beta es -5.7 se puede interpretar que un aumento en 1 alumno el


tamao del curso disminuye el puntaje de SIMCE en 5.7 puntos:

Simce = Tamao
= 5,7 1
Notemos que

Curso

corresponde a la pendiente de una recta que relaciona el puntaje

en el SIMCE con el tamao del curso:

Simce = 0 + 1 Tamao
donde

es el intercepto de la recta, y

Curso

la pendiente.

As, la regresin, elemento fundamental en la Econometra, corresponde a un


estudio de dependencia entre una variable dependiente y una o ms variables

explicativas. El anlisis de regresin tiene como objeto estimar y/o predecir el


promedio poblacional de la variable dependiente para valores jos de la(s) variable(s) explicativa(s).
Por ejemplo, observemos la Figura 2.1, en el eje de las abscisas tenemos nuestra variable explicativa (X): nmero de alumnos por profesor, y en el eje de las
ordenadas tenemos nuestra variable dependiente (Y): puntaje en prueba estandarizada. Podemos observar dos cosas: primero, para cada valor posible de Tamao
Curso tenemos un rango o distribucin de valores de rendimiento; y segundo, el
promedio de rendimiento es menor mientras mayor es el tamao de curso. Esto
ltimo se puede apreciar al trazar una recta que una los valores promedios de
rendimiento para cada valor de tamao de curso (linea negra del la Figura 2.2),
la que corresponde a la

recta de regresin. Luego, si de alguna forma podemos

determinar el valor del intercepto de esta recta as como de su pendiente, podramos predecir cul es el rendimiento promedio esperado de un curso dependiente
de la cantidad de alumnos que tenga por profesor.

19

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

Figura 2.1
Relacin entre rendimiento y tamao de curso

Figura 2.2
Recta de regresin entre rendimiento y tamao de curso

20

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

2.1.2. Relaciones estadsticas versus relaciones determinsticas


La calidad de un producto, por ejemplo el vino, depender de como fue su cosecha
y por lo tanto, de variables como la temperatura al que estuvo expuesta la uva, la
cantidad de lluvia, sol y los fertilizantes. La relacin entre estas variables explicativas y la calidad del vino tiene una naturaleza estadstica, ya que si bien estas
variables ayudan al productor de vino a saber ms o menos como ser la cosecha,
no podr predecir en forma exacta la calidad del producto debido a los errores
involucrados en estas variables y porque pueden haber otros factores difciles de
medir que estn afectando la calidad del vino.
La variable dependiente, en este caso la calidad del vino, tiene una variabilidad
aleatoria, ya que no puede ser explicada en su totalidad por las variables explicativas.
En la econometra nos interesa la dependencia estadstica entre variables, donde
tratamos con

variables aleatorias,

es decir, variables que tienen una distri-

bucin de probabilidad. La dependencia determinstica, por el contrario, trata

relaciones como la ley de gravedad de Newton , las que son exactas (no tienen
naturaleza aleatoria).

2.1.3. Regresin versus Causalidad


Es importante tener claro que la regresin es una relacin estadstica, que no
implica causalidad apriori. En el ejemplo del vino, no hay una razn estadstica
para suponer que la lluvia no depende de la calidad del vino. Pero nuestro sentido
comn nos hace considerar como variable dependiente la calidad del vino y no la
lluvia. Es importante recordar de aqu en adelante que una relacin estadstica

no puede por s misma implicar en forma lgica una causalidad. El que podamos
o no determinar y estimar una relacin causal va a depender de si estamos o no
utilizando una correcta estrategia de identicacin en nuestro modelo.

1 La

ley de gravedad de Newton plantea que toda partcula en el universo atrae a cualquier
otra partcula con una fuerza directamente proporcional al producto de sus masas e inversamente
2
), donde F=fuerza, m1 y m2
proporcional al cuadrado de la distancia entre ellas: F=k( mr1 m
2
son la masa de las dos partculas, r es la distancia y k una constante de proporcionalidad. Esta
es una relacin determinstica, ya que para valores de masas, distancia y constante sabemos
exactamente a la fuerza que se atraen estas partculas. Si alguna de las variables estuviera
medida con error, la ley de Newton pasa a ser una relacin estadstica, y F se convierte en una
variable aleatoria.

21

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

2.1.4. Regresin versus Correlacin


El

Anlisis de Correlacin est estrechamente relacionado con el de regresin

aunque conceptualmente son dos cosas muy diferentes. El anlisis de correlacin


tiene como objetivo medir el grado de asociacin lineal entre dos variables, medida
a travs del

coeciente de correlacin. Por ejemplo, se puede estar interesado

en medir el grado de correlacin entre aos de educacin y salario. En cambio, el


anlisis de regresin trata de estimar o predecir el valor promedio de salario para
un nivel dado de educacin.
Las diferencias fundamentales son que, en el anlisis de regresin, tenemos una
variable dependiente y una o ms explicativas, la que son tratadas en forma asimtrica: la variable dependiente es aleatoria, tiene una distribucin de probabilidad,
en cambio las variables explicativas toman valores jos. En el anlisis de correlacin las variables son tratadas de forma simtrica: la correlacin entre educacin
y salario es igual a la correlacin entre salario y educacin. Adems ambas variables son aleatorias. As, si

son dos variables aleatorias, el coeciente de

correlacin se dene de la siguiente manera:

yx =

E {[x E(x)] [y E(y)]}


xy

= 2 2
x y
var(x)var(y)

Lo que se calcula para una muestra de la siguiente forma:

con

X=

1
n

n
i=1

yx

][
]
n [
x

X
y

Y
i
i
= [i=1
]2 n [
]2
n
x

X
y

Y
i
i
i=1
i=1

xi

Y =

1
n

n
i=1

yi .

De ahora en adelante denotaremos con un a los estimadores de un estadstico obtenidos a partir de informacin muestral.
Algunas precauciones con el coeciente de correlacin:

Cuidado cuando el grado de correlacin muestral depende de solo unas


pocas observaciones.
El coeciente de correlacin mide una relacin lineal. Por lo tanto, una
variable puede depender de otra an cuando la correlacin sea cero si la
relacin es no lineal.

22

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

Correlacin no implica causalidad econmica, es slo una relacin estadstica.


Correlacin puede indicar relacin espuria.
No olvidar que la correlacin muestral es una variable aleatoria y que por
lo tanto, el coeciente por si slo no garantiza la existencia de una relacin
estadstica entre las series.

A continuacin las guras 2.3, 2.4, 2.5 y 2.6 muestran algunos ejemplos de correlaciones entre variables.

Figura 2.3
Portales de Internet, correlacin entre nmero de visitas y valor de la empresa

23

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

Figura 2.4
Correlacin entre Empleo y Producto (serie de tiempo)

Figura 2.5
Correlacin entre Producto per-capita y ranking ftbol

24

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

Figura 2.6
Correlacin entre temperatura media del da y estudiantes ausentes a clases

2.2.

Anlisis de regresin con dos variables

Para esta seccin asumiremos que existe una variable dependiente (Y) que es
explicada por slo una variable (X).
Consideremos el siguiente ejemplo. En la Tabla 2.1 se presentan datos de salarios
y nivel de educacin para una poblacin de 60 individuos

Tabla 2.1: Salarios y Aos de Educacin


Salario (Y)

E(Y|X)

16000
32868
50000
80000
100000
150000
219120
300000
547800
166199

18260
36520
54780
82170
109560
170000
273900
365200
730400
204532

10

15000
40000
58000
90000
120000
182600
280000
380000
913000
230956

11

15000
40000
60000
90000
120000
188973
328680
434120
821700
233164

Aos de Educacin (X)

12

20000
50000
73040
100000
140000
219120
365200
500000
1064558
281324

13

20000
54780
80000
100500
160000
257880
400000
550000
1460800
342662

14

21912
60000
89000
120000
200000
300000
500000
650000
1500000
382324

15

35000
73040
100000
140000
230000
400000
600000
883085
1826000
476347

16

40000
90000
105000
180000
280000
434686
730400
1000000
2487041
594125

17

60000
120000
165784
250000
365200
600000
1095600
1643400
4000000
922220

La poblacin tiene 10 niveles distintos de educacin, que van desde 8 a 17. Para
cada uno de estos niveles tenemos 9 individuos con distintos salarios. A pesar de
la variabilidad en los salarios para cada nivel educacional considerado, en promedio el salario se incrementa a medida que los aos de educacin aumentan. Esto
ltimo se puede vericar al calcular el promedio para cada nivel de educacin, lo

2 Una

poblacin de 60 individuos puede parecer un poco pequea, pero por el momento


consideremos que estas familias son el total existente
25

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

que se presenta en la ltima linea de la Tabla 2.1, estos corresponden a los

valores

esperados condicionales, ya que dependen de los valores dados de la variable X.


En la Figura 2.7, los valores medios condicionales estn marcados con una cruz.
La unin de estos valores representa la

Recta de regresin poblacional, don-

de el trmino poblacional se reere a que estamos trabajando con el total de la


poblacin.

Denicin:

La curva de regresin poblacional es simplemente el lugar geom-

trico de las medias condicionales de la variable dependiente para los valores jos
de la(s) variable(s) explicativa(s).
En el ejemplo anterior los valores de Y (salario) no estaban distribuidos de forma
simtrica en torno al valor promedio para cada valor X, desde ahora asumiremos
que esto

si se cumple, tal como lo podemos apreciar en la Figura 2.8.


Figura 2.7

salario
2000000

3000000

4000000

Recta de regresin salarios y educacin

1000000

Recta de regesin
poblacional (RRP)

x
8

x
10

14

12

16

Escolaridad
Figura 2: Distribucin de los salarios para distintos niveles de educacin.

26

18

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

Figura 2.8
Recta de regresin entre consumo e ingreso

Figura 3: Ingreso semanal y Gasto semanal. Distribucin simtrica

En este ejemplo, se ve la relacin entre ingreso semanal y gasto en consumo


semanal, para cada nivel de ingreso se tiene un rango de gasto que se distribuye
en forma simtrica entorno al valor promedio condicional de gasto.

2.2.1. Funcin de regresin poblacional (FRP)


De lo anterior es claro que la media condicional E(Y|Xi ) es funcin de Xi , donde
Xi es un valor dado de X:
(2.1)

E(Y |Xi ) = f (Xi )

donde f() es una funcin cualquiera, en el ejemplo anterior era una funcin lineal.
La ecuacin (2.1) se denomina

Regresin Poblacional.

Que forma tiene f() es una pregunta emprica, aunque muchas veces la teora
nos puede ayudar bastante. Supongamos que en nuestro ejemplo anterior el salario esta relacionado linealmente con la educacin, as podemos suponer que la
funcin de regresin poblacional E(Y|Xi ) es una funcin lineal de Xi , es decir:
(2.2)

E(Y |Xi ) = 0 + 1 Xi
27

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

donde

0 y 1 se denominan coecientes de regresin. As el objetivo es estimar

a partir de datos de X e Y.

2.2.2. Especicacin estocstica de la funcin de regresin


poblacional
En los dos ejemplos anteriores veamos que a medida que se incrementa la variable explicativa (educacin o ingreso), el valor promedio de la variable dependiente
(salario o gasto) tambin se incrementaba. Sin embargo, este patrn se da solo
a nivel de promedios. A nivel individual esto no es necesariamente cierto. En la
Tabla 2.1 podemos ver que el individuo que gana menos ingreso con 9 aos de
educacin, gana menos que el individuo con 8 aos de educacin con mayor salario.
Existe una dispersion de los valores individuales de Yi en torno al promedio
condicional de esta variable. De esta forma, podemos denir:

ui = Yi E(Y |Xi )
o

Yi = E(Y |Xi ) + ui

(2.3)
donde

ui

es una variable aleatoria no observable que toma valores positivos o ne-

gativos. Este trmino surge pues no se puede esperar que todas las observaciones

Yi

sean igual al promedio condicional a

Xi .

(Ver Figura 2.9).

Recordemos que la regresin es una relacin estadstica, a pesar de conocer los


valores de

Xi ,

esto no nos permite predecir en forma exacta

Yi .

Lo que no pode-

mos explicar debido a que tiene naturaleza aleatoria se representa a travs de


denominado

trmino de error estocstico.

ui ,

Entonces siguiendo el ejemplo de la Figura 2.8, podemos decir que el gasto de


una familia individual (Yi ) corresponde a la suma de dos componentes:

E(Y|Xi ), que corresponde a la media de gasto de todas las familias con el


mismo nivel de ingresos

ui

Componente Determinstico

Componente Aleatorio

28

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

Figura 2.9
Trmino de error estocstico

Si E(Y|Xi ) es lineal en Xi , podemos escribir la ecuacin (2.3) de la siguiente


forma:

(2.4)

Yi = E(Y |Xi ) + ui
= 0 + 1 X i + u i

Tomando el valor esperado condicional en Xi a la ecuacin (2.4):

(2.5)
Debido a que
(2.6)

E(Yi |Xi ) = E[E(Y |Xi )|Xi ] + E(ui |Xi )


= E(Y |Xi ) + E(ui |Xi )
E(Yi |Xi ) = E(Y |Xi ),

implica que:

E(ui |Xi ) = 0

As, el supuesto de que la recta de regresin pasa a travs de las medias condicionales de Y, implica que la media condicional de

29

ui

es cero.

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

2.2.3. Funcin de regresin muestral


En la mayora de los fenmenos econmicos a estudiar, no disponemos de las
observaciones totales de la poblacin, como hemos supuesto hasta ahora. En la
prctica se tiene alcance nada ms que a una

muestra de los valores de Y que

corresponden a unos valores jos de X. En este caso tenemos que estimar la funcin de regresin poblacional en base a informacin muestral.
Los datos poblacionales asociados a la Figura 2.8 son los siguientes:

Tabla 2.2. Ingreso familiar


Y|X
80 100 120
Gasto en
55 65
79
consumo
60 70
84
familiar
65 74
90
semanal
70 80
94
(Y)
75 85
98
88
Media Condicional 65 77
89

(X) y Gasto en consumo (Y).


140 160 180 200 220
80 102 110 120 135
93 107 115 136 137
95 110 120 140 140
103 116 130 144 152
108 118 135 145 157
113 125 140
160
115
162
101 113 125 137 149

240
137
145
155
165
175
189
161

260
150
152
175
178
180
185
191
173

Supongamos que nosotros no conocemos estos datos, es decir, no tenemos acceso


a las observaciones correspondientes a la poblacin total. Tenemos a nuestra disposicin slo una muestra (Tabla 2.3), la que ha sido obtenida de forma aleatoria
de la poblacin.
Es importante notar que a partir de una poblacin podemos sacar una gran cantidad de muestras en forma aleatoria y en la realidad nosotros observamos solo
una de ellas. Debido a esta variabilidad en las muestras podremos estimar la FRP
pero no de manera precisa. Para ejemplicar esto supongamos que adems de la
muestra en la Tabla 2.3 se saco otra muestra (Tabla 2.4) a partir de la informacin
poblacional.

Tabla 2.3. Muestra aleatoria


de la poblacin en tabla 2.
Y
X
70
80
65
100
90
120
95
140
110
160
115
180
120
200
140
220
155
240
150
260

Tabla 2.4. Muestra aleatoria


de la poblacin en tabla 2.
Y
X
55
80
88
100
90
120
80
140
118
160
120
180
145
200
135
220
145
240
175
260
30

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

Al gracar los datos de las Tablas 2.3 y 2.4 obtenemos los diagramas de dispersion en la Figura 2.10. En este diagrama se han trazado dos

rectas de regresin

muestral: FRM1 corresponde a la primera muestra y FRM2 corresponde a la se-

gunda. Como vemos, no es posible asegurar cual de las dos rectas muestrales
representa mejor la recta de regresin poblacional.
Entonces es importante tener en mente que las rectas de regresin muestral representan la recta de regresin poblacional, pero debido a uctuaciones muestrales
pueden ser consideradas slo como una aproximacin.
Como contraparte muestral la

funcin de regresin muestral puede escribirse

como:

Yi = 0 + 1 Xi

(2.7)
donde
de

Yi

es el estimador de E(Y|Xi ),

es el estimador de

es el estimador

2 .

Figura 2.10
Funcin de regresin muestral

FRM2

primera muestra (tabla 3)


segunda muestra (tabla 4)

Gasto de consumo semanal

FRM1

Regresin basada
en la primera
muestra

ingreso semanal
Figura 4: Rectas de Regresin basadas en dos muestras distintas

Denicin: Un estimador

es una regla, frmula o mtodo que dice cmo deter-

minar el parmetro poblacional a partir de la informacin suministrada por la


muestra disponible.

31

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

De igual manera que para el caso poblacional la funcin de regresin muestral


tambin tiene una representacin estocstica:
(2.8)

Yi = 0 + 1 Xi + ui

Entonces, el objetivo del Anlisis de Regresin es estimar la Funcin de regresin


poblacional:
(2.9)

Yi = 0 + 1 Xi + ui

con base en la Funcin de regresin muestral:


(2.10)

Yi = 0 + 1 Xi + ui

Esta aproximacin se puede ver en la Figura 2.11:

Figura 2.11
Funcin de regresin muestral y poblacional

Figura 5: Rectas de Regresin muestral y poblacional

En trminos de la funcin de regresin muestral, la


presada como:
(2.11)

Yi = Yi + ui
32

Yi

observada puede ser ex-

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

y en trminos de la funcin de regresin poblacional puede ser expresada como:

Yi = E(Y |Xi ) + ui

(2.12)

En la Figura 2.11 podemos notar que para todo Xi a la derecha del punto A,

Yi

E(Y |Xi ). De igual manera, para cualquier punto a la izquierda


subestima E(Y |Xi ). Esta sobreestimacin y subestimacin del modelo

sobreestima

de A,

Yi

poblacional es inevitable debido a las uctuaciones muestrales.

Cmo se puede construir la funcin de regresin muestral para 0


y 1 que este lo ms cerca de los valores verdaderos (poblacionales) de
0 y 1 ?

2.2.4. Propiedades de un Estimador


Un estimador, siendo funcin de la muestra, es una variable aleatoria y tiene su
propia distribucin de probabilidad.
Las propiedades de los estimadores son las siguientes:

1. Se denomina sesgo a la diferencia entre el valor esperado del estimador y

.
E()
= .
E()

su verdadero valor:

insesgado si

De esta forma, se dice que

es

un estimador

2. El estimador es eciente o de mnima varianza si no hay ningn otro estimador insesgado que tenga una varianza menor que

. En general se trata de

utilizar estimadores de varianza pequea, pues de este modo la estimacin


es ms precisa.
3. El Error Cuadrtico Medio (ECM) es una propiedad de los estimadores que
mezcla los conceptos de eciencia e insesgamiento. El ECM de

se dene

como:

= E[( )2 ]
ECM ()
Lo que se puede expresar equivalentemente de la siguiente manera:

= V ar()
+ [Sesgo()]
2
ECM ()
4. La ltima propiedad de un estimador es la consistencia. El estimador

es consistente si converge (en el limite) al verdadero valor del parmetro.

33

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

Se dice que la sucesin de variables aleatorias

X1 , X2 ,...,Xn

converge en

probabilidad a la variable aleatoria (o constante) X si:

> 0,
Esto se denota

plim

(X )
Y

lm P r[|Xn X| < ] = 1

plim Xn = X .

Dos reglas tiles al respecto son:

plimX
plimY

plim (X Y )=plimX plimY

Figura 2.12
Convergencia asinttica

Ejemplo: Tenemos una variable yi

que esta compuesta por la suma de un com-

ponente jo o determinstico (c) y un componente aleatorio(ui ):

yi =

Si

ui N (0, u2 ),

c
|{z}
componente

f ijo

ui
|{z}
componente

aleatorio

entonces:

= E(yi ) = c
V (yi ) = E[(yi E(yi ))2 ] = E[u2i ] = u2
34

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

Ahora consideremos el siguiente estimador de la esperanza de

yi ,

la media mues-

tral:

1
1

= Y = (y1 + y2 + ... + yn ) =
yi
n
n i=1
n

Veamos que propiedades tiene este estimador:

Insesgamiento: E() =
( )
E(
) = E Y
(
)
1
= E
(y1 + y2 + ... + yn )
n
1
(E(y1 ) + E(y2 ) + ... + E(yn ))
=
n
dado que

E(yi ) = E(c) + E(ui ) = c,


| {z }
0

E(
) = c =

Eciencia: V ar()<V ar(1 )


Comparemos el estimador promedio muestral con un estimador que es simplemente cualquier valor de

yi:

=Y

1 = yi

E(Y ) = c V ar(Y )= nu
E(yi ) = c V ar(yi ) = u2

Entonces para n>1 siempre se cumple que


rianza) que

1 ,

Como

es un estimador insesgado de

al

tiene menor error cuadrtico medio

1 .

Consistencia: es un estimador consistente dado que:


plim(
) = plim(Y ) = c
Ya que si

el error cuadrtico medio de ambos estimadores es igual a la

varianza del estimador, de esta forma


que

es ms eciente (menor va-

1 .

Error Cuadrtico Medio:


igual que

lmn V ar(Y ) = 0 plim(Y ) = c.

35

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

2.3.

Modelo de regresin con dos variables

2.3.1. Mtodo de Mnimos Cuadrados Ordinarios


De la seccin anterior tenamos que el error estimado era:

ui = Yi Yi
= Yi 1 2 Xi

(2.13)

es decir, los residuos son simplemente la diferencia entre los valores verdaderos y
estimados de Y.
Si queremos que la funcin de regresin muestral sea lo ms cercana posible
a la poblacional, debemos tratar de escoger los coecientes de regresin (los

's)

de forma tal que los errores sean lo ms pequeos posible. De acuerdo a esto
un criterio para escoger la funcin de regresin muestral podra ser minimizar la
suma de los los errores:

ui =

(Yi Yi ),

sin embargo este criterio no es muy

bueno. Observemos la Figura 2.13, existe una gran diferencia en la magnitud de


los errores, sin embargo en la suma de los errores todos reciben el mismo peso.
Debido a esto es posible que la suma de los errores sea muy pequea cercana a
cero, incluso cuando la dispersion de los errores en torno a la funcin de regresin
muestral es alta.
Este problema puede ser solucionado al considerar la suma de los errores al cuadrado como criterio a minimizar, en este caso los errores ms lejos reciben un
mayor peso:

(2.14)

u2i =
=

(Yi Yi )2
(Yi 0 1 Xi )2

36

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

Figura 2.13
Funcin de regresin muestral

Figura 6: Mnimos Cuadrados Ordinarios

El

Mtodo de Mnimos CuadradosOrdinarios (MCO) escoge 0

u2i sea lo ms pequeo posible.

forma tal que para una muestra dada,

Entonces el problema que este mtodo propone resolver es el siguiente:

mn

(2.15)

0 ,1

(Yi 0 1 Xi )2

las condiciones de primer orden de este problema son:

(2.16)

(2.17)

u2i

= 2

(Yi 0 1 Xi ) = 2

ui = 0
0

u2i
= 2
(Yi 0 1 Xi )Xi = 2
ui Xi = 0
1

Simplicando (2.16) y (2.17) obtenemos las


(2.18)
(2.19)

ecuaciones normales:

Yi = n0 + 1
Xi

Yi Xi = 0
Xi + 1
Xi2
37

de

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

Debemos resolver un sistema con dos ecuaciones y dos incgnitas. De la ecuacin


(2.18) podemos despejar

0 :

0 =

(2.20)

Yi 1
n

Xi

reemplazando (2.20) en (2.19):

(2.21)

(
Yi Xi =

Yi 1
n

Xi

Xi + 1

Xi2

1 es:

Y
X

X
Y
i
i
2
i 2 i
1 =
n Xi ( Xi )

De esta forma, el estimador de

(2.22)

El que puede ser escrito de la siguiente forma (hacerlo):

x i yi
1 = 2
xi

(2.23)

donde

xi = Xi X

yi = Yi Y ,

con

X=

1
n

n
i=1

Xi

Y =

1
n

n
i=1

Yi

Reemplazando (2.22) en (2.20):

(2.24)
(2.25)


Xi2 Yi Xi Xi Yi

=
n Xi2 ( Xi )2
= Y 1 X

Los resultados (2.23) y (2.25) podran haber sido obtenidos de igual forma, expresando inicialmente el modelo de regresin en desviaciones con respecto a la media.
El modelo de regresin original es:

Yi = 0 + 1 Xi + ui
si le restamos el promedio de esta:
(2.26)

Y = 0 + 1 X + ui

y recordando que el valor esperado del trmino de error es 0, tenemos el siguiente


modelo de regresin lineal expresado en desviaciones con respecto a la media:

(Yi Y ) = 1 (Xi X) + ui
yi = 1 xi + ui
38

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

As el problema de Mnimos Cuadrados Ordinarios es:

mn
1

(yi 1 xi )2

La condicin de primer orden de este problema es:

u2i

= 2

As obtenemos el mismo estimador de

(yi 1 xi )xi = 0

1 ,

encontrado en (2.23), y

se obtiene

simplemente despejando la ecuacin (2.26):

0 = Y 1 X
que corresponde a lo mismo en la ecuacin (2.25).
Una vez estimados los coecientes de regresin mediante MCO y utilizando la

i
informacin muestral, la recta de regresin muestral (Y

= 0 + 1 Xi )

puede ser

obtenida fcilmente.

2.3.2. Ejemplo Estimacin MCO


La Encuesta Longitudinal de la Primera Infancia (ELPI) recoge informacin sobre habilidades cognitivas y no cognitivas de nios menores de 5 aos de edad, en
particular en este ejemplo estamos interesados en estudiar como el peso al nacer
del menor afecta su desarrollo cognitivo medido a travs del Test TEPSI, este
es un test de tamizaje, es decir, es una evaluacin gruesa que permite conocer
el nivel de rendimiento en cuanto al desarrollo psicomotor de nios entre 2 y 5
aos de edad. El puntaje del test est estandarizado de acuerdo a la edad del
nio en una media de 50 puntos y con una desviacin estndar de 10 puntos. La
Figura 2.14 muestra el grco que relaciona ambas variables as como la recta de
regresin lineal.
Para obtener los coecientes estimados del intercepto y la pendiente de la recta de regresin, podemos utilizar el comando

regress

de STATA que realiza la

estimacin el modelo de regresin lineal por MCO. El Cuadro 2.1 muestra los resultados, obteniendo que cada 100 gramos adicionales de peso de menor al nacer,
el puntaje Tepsi estandarizado aumenta en 0.067 puntos.

39

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

Figura 2.14

20

Puntaje Tepsi
40
60

80

Puntaje Tepsi y Peso al nacer

20

40
Peso al nacer en 100 grs

60

80

Fuente: Elaboracin propia en base a ELPI

Cuadro 2.1
Estimacin MCO Puntaje Tepsi y Peso al Nacer

2.3.3. Supuestos detrs del mtodo MCO


En el anlisis de regresin nuestro objetivo no es slo obtener los valores de

sino tambin hacer inferencia sobre los verdaderos

40

2 .

Nos interesa saber

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

Yi
de la verdadera E(Y|Xi ). La Funcin de regresin poblacional: Yi = 1 +2 Xi +ui ,
nos muestra que Yi depende de Xi y ui . As, los supuestos hechos para estas dos

que tan cerca estn

de sus contraparte poblacional o que tan cerca esta

variables son fundamentales para lograr una interpretacin vlida de los valores
estimados de la regresin. Mientras no se especique la forma como se generan

Xi

ui ,

no hay forma de hacer inferencia estadstica sobre

Yi

ni sobre

2 .

Supuesto 1: Modelo de regresin lineal, el modelo de regresin es lineal en


parmetros:

Yi = 1 + 2 Xi + ui

Supuesto 2: Los valores de X son jos, X se supone no estocstica. Esto implica que el anlisis de regresin es un anlisis de regresin condicional,
condicionado a los valores dados del regresor X.

Supuesto 3: El valor medio del error

ui

es igual a cero. Dado el valor de

X, el valor esperado del trmino de error

ui

es cero:

E(ui |Xi ) = 0
Lo que nos dice este supuesto es que los factores que no estn considerados
en el modelo y que estn representados a travs de

ui ,

no afectan sistem-

ticamente el valor de la media de Y. Es decir, los valores positivos de


cancelan con los valores negativos de
de

ui

ui .

se

De esta forma, el efecto promedio

sobre Y es cero. Ver Figura 2.15.

Figura 2.15

Figura 7: Distribucin condicional del trmino de error ui

41

ui

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

Supuesto 4: Homocedasticidad o igual varianza de


X, la varianza de

ui

ui .

Dado el valor de

es la misma para todas las observaciones:

var(ui |Xi ) = E[ui E(ui )|Xi ]2


= E(u2i |Xi ) por supuesto 3
= 2
En la Figura 2.16 podemos apreciar el signicado del supuesto de homocedasticidad, la variacin alrededor de la recta de regresin es la misma para
todos los valores de X. Esto implica que la funcin de densidad del trmino
de error

ui

es la misma.

Figura 2.16

Figura 8: Homocedasticidad

Por el contrario, el la Figura 9 observamos el caso cuando la varianza del


trmino de error varia para cada
error aumenta en la medida que

Xi , en este
Xi crece.

caso particular la varianza del

Figura 2.17

Figura 9: Heterocedasticidad

Esto se conoce como

Heterocedasticidad

expresa de la siguiente manera:


(2.27)

var(ui |Xi ) = i2
42

o varianza desigual, lo que se

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

Supuesto 5: No existe autocorrelacin entre los errores. Dado dos valores


Xi

de X,

Xj ,

con i= j, la correlacin entre

ui

uj

es cero:

cov(ui , uj |Xi , Xj ) = E{[ui E(ui )]|Xi }{[uj E(uj )]|Xj }


= E(ui |Xi )(uj |Xj )
= 0
Yi = 1 + 2 Xi + ui , ui esta
uj , entonces Yi no depende solamente de Xi sino tambin

Si en la Funcin de regresin poblacional


correlacionado con
de

uj .

Al imponer le supuesto 5 estamos diciendo que solo se considerar

el efecto sistemtico de

Xi

sobre

Yi

sin preocuparse de otros factores que

pueden estar afectando a Y, como la correlacin entre los

Supuesto 6: La covarianza entre ui y


cov(ui , Xi ) =
=
=
=
=

Xi

u's.

es cero E(ui Xi ) = 0:

E[ui E(ui )][Xi E(Xi )]


E[ui (Xi E(Xi )] por supuesto E(ui ) = 0
E(ui Xi ) E(ui )E(Xi ) por supuesto E(Xi ) no estocastica
E(ui Xi ) por supuesto E(ui ) = 0
0

Como mencionamos en la seccin 2.2.2 se supone que X y

tienen una in-

uencia separada sobre Y (determinstica y estocstica, respectivamente),


ahora si X y

estn correlacionadas, no es posible determinar los efectos

individuales sobre Y.
Este supuesto se cumple automticamente si X es no estocstica y el supuesto 3 se cumple.

Supuesto 7: El nmero de observaciones n debe ser mayor que el nmero de parmetros por estimar. El nmero de observaciones tiene
que ser mayor que el nmero de variables explicativas, de otra forma no se
puede resolver el sistema de ecuaciones. Supongamos que tenemos una sola
observacin para nuestra variable dependiente y nuestra variable explicativa
(Y1 y

X1 ),

el modelo de regresin es tal que tiene intercepto, es decir:

Y1 = 1 + 2 X1 + u1
el estimador MCO de

es :

xi yi
2 = 2
xi

xi = Xi X e yi = Yi Y , sin embargo con una observacin X1 = X


Y1 = Y , as 2 no esta determinado y as tampoco podemos determinar

donde
e

1 .
43

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

Supuesto 8: Variabilidad en los valores de X. No todos los valores de X en


una muestra deben ser iguales, var(X) debe ser un nmero nito positivo.
Si las X son las mismas

Xi = X ,

de esta forma ni

ni

pueden ser

estimados.

Supuesto 9: El modelo de regresin esta correctamente especicado.


Esto es muy importante, ya que por ejemplo la omisin de variables importantes en el modelo, o la eleccin de la forma funcional inadecuada, o la
consideracin de supuestos estocsticos equivocados sobre las variables del
modelo, harn cuestionable la validez de la interpretacin de la regresin
estimada. (Aspectos que veremos ms adelante).

2.3.4. Errores estndar de los Estimadores Mnimos Cuadrados Ordinarios


Como vimos en la seccin 2.3.1, los valores estimados para

dependen de

los datos muestrales, sin embargo, los datos cambian de una muestra a otra y
as los valores estimados tambin, por eso es necesario tener una medida que nos
permita decir que tan cercano son los valores estimados a los valores poblacionales de los parmetros.
La medida que utilizaremos para medir la precisin del estimador es el

error es-

tndar, que es la desviacin estndar de la distribucin muestral del estimador,


la que a su vez es la distribucin del conjunto de valores del estimador obtenidos
de todas las muestras posibles de igual tamao de una poblacin dada.

2 :

x i yi
2 = 2
xi

Recordemos el estimador MCO de

donde

yi = 2 xi +ui (modelo poblacional en desviaciones con respecto a la media).


yi en el estimador de 2 :

xi (2 xi + ui )
2
2 =
x
2 i
x
ui xi
= 2 i2 + 2
x
xi
i
ui xi
= 2 + 2
xi

De esta forma reemplazando

44

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

Aplicando valor esperado a la expresin anterior:

(2.28)

(
)
u
x
i
i
E(2 ) = 2 + E 2
xi
(
)
E(ui )xi
2
= 2 +
por
xi
= 2 por supuesto 3

supuesto 2

La ecuacin (2.28) nos dice que en valor esperado el estimador MCO de

es

igual a su verdadero valor. Esta propiedad del estimador MCO se conoce como

insesgamiento.

Ahora procedamos a calcular la varianza de el estimador MCO de

2 :

var(2 ) = E[2 E(2 )]2


= E(2 2 )2
(
)
[ xi ui ]2

= E
[ x2i ]2
Por supuesto 4

E(u2i ) = 2

y por supuesto 6

E(ui uj ) = 0,

esto implica que:

2
var(2 ) = 2
xi

(2.29)

2.3.5. Estimador Mnimo Cuadrado Ordinario de 2


2
Ahora debemos estimar el parmetro poblacional , como este corresponde al
2
valor esperado de ui y u
i es una estimacin de ui , por analoga:

n
2

i=1

u2i

pareciera ser un estimador razonable. Pero los errores de MCO, estn estimados
imperfectamente si los comparamos con los errores poblacionales, ya que dependen de una estimacin de

2 .

Veamos esto con ms detalle:

Partiendo del Regresin poblacional expresado en desviaciones con respecto a


la media:
(2.30)

yi = 2 xi + (ui u)

45

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

y recordando tambin que:

ui = yi 2 xi

(2.31)

Al sustituir (2.30) en (2.31), se obtiene:

ui = 2 xi + (ui u) 2 xi
Elevando al cuadrado la expresin anterior, aplicando sumatoria y tomando valor
esperado:

u2i

= E(2 2 )2

x2i + E
|

]
[
]

(ui u)2 2 E (2 2 )
xi (ui u)
|
{z
}
{z
}
(i)

(ii)

[
]

x
u
i
i
2
xi (ui u)
= var(2 )
xi + (n 1)var(ui ) 2E 2
xi
= 2 + (n 1) 2 2 2
= (n 2) 2

(i) E

(ui u)

=
=
=
=
=
=

2ui u + u )
]

ui + nu2
E
u2i 2u
[
]
n
E
u2i 2u
ui + nu2
n
[
]
2
E
ui 2nu2 + nu2
[
]
E
u2i nu2
[
( )2 ]

ui
E
u2i n
n
n
n 2 2
n
(n 1) 2

= E
=

(u2i

[
]
[
]

(ii) E (2 2 )
xi (ui u) = E (2 2 )
xi (ui u)
[
]
xi ui
= E 2
xi (ui u)
xi

]
[
( xi ui )2
xi ui xi
2 u
2
= E
xi
xi
2
=
46

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

Por lo tanto se dene el estimador de la varianza

e2 =

(2.32)

De forma tal que,

e2

como:

u2i
n2

es un estimador insesgado de

2:

( )
1
E
u2i = 2
n2

e2 =

2.4.

e2

Modelo de Regresin con k variables

Ahora abandonemos la simplicacin de solo usar dos variables, de ahora en adelante generalizaremos el modelo de regresin lineal para que pueda tener hasta k
variables explicativas.
Aclaracin: haremos un cambio de notacin, cada observacin i de la variable
dependiente ser denotada por
va, por ejemplo

X1 ,

yi

y cada observacin i de una variable explicati-

ser denotada por

x1i .

Ahora las variables en minscula no

signica que estn en desvos.


El Modelo de Regresin Poblacional en este caso es:

yi = 1 + 2 x2i + 3 x3i + ... + k xki + ui

i = 1, ..., n

2.4.1. Representacin Matricial del Modelo de Regresin


Lineal
El modelo con k variables explicativas puede ser expresado en notacin matricial.
En efecto, cada variable explicativa

xj ,

con j=1,..., k, es un vector columna de

dimensin n, al igual que la variable dependiente y el trmino de error. De este


modo, el modelo puede ser reescrito de la siguiente forma:


x21
1
y1
x22
y2 1

.. = .. 1 +
.
.

. .
.
x2n
1
yn

xk1
x31
xk2
x32

2 +
.
. 3 + ... +
.
.

.
.
xkn
x3n

u1
u2

k + ..
.

un

Donde las variables explicativas se pueden agrupar en una sola matriz de dimensin nk, que denotaremos simplemente como X, de esta manera el modelo se
47

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

expresa de la siguiente forma:


y1
1 x21 x31 xk1
y2 1 x22 x32 xk2


(2.33)
.. = ..
.
.
.
..
.
.
.
. .
.
.
.
.
yn
1 x2n x3n xkn
donde

1
u1
2 u2

.. + .. Y = X + u
. .
k
un

es un vector de dimensin n1,

de dimensin nk y

es la matriz de variables explicativas

es un vector correspondiente al trmino de error con di-

mensin n1.

Ahora debemos expresar la distribucin del trmino de error en trminos matriciales:

E(u1 )
E(u2 )

E(u) =
= 0
.
.

n1
.
E(un )

E(u21 ) E(u1 u2 ) E(u1 un )


E(u2 u1 ) E(u2 ) E(u2 un )
2

E(uu ) =
.
.
.
..
.
.
.

.
.
.
.
E(un u1 ) E(un u2 ) E(u2n )

2 0 0
0 2 0

= ..
.
.
..
.
.
.
.
.
.
2
0 0

= 2 I
nn

De los supuestos 3, 4 y 5, tenemos entonces que el trmino de error tiene la


siguiente distribucin:

(
(2.34)

n1

)
2

, I

nn

2.4.2. Estimador Mnimo Cuadrados Ordinarios


El mtodo de MCO, plantea que los parmetros del modelo pueden ser estimados

)), la que en trminos


minimizando la suma de los errores al cuadrado (SE (
matriciales equivale a:

=
SE ()

u2i = u u

i=1

48

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

donde

u = Y X .

Entonces el problema de minimizar la suma de los errores al

cuadrado se expresa de la siguiente forma:

[
]
= mn (Y X )
(Y X )

mn SE ()

[
]

= mn Y Y 2 X Y + X X

SE ()
= 2X Y + 2X X = 0

= (X X)1 X Y

(2.35)
De (2.35) tenemos:

= 0 X u = 0
X (Y X )

(2.36)

(2.36) es la condicin de ortogonalidad.


De esta forma, el vector de parmetros estimados

se obtiene de resolver el

siguiente sistema de ecuaciones normales:

X X = X Y

1
1
1
x2,1 x2,2 x2,3
x3,1 x3,2 x3,3
.
.
.

.
.
.

.
.
.

..

xk,1 xk,2 xk,3

1
x2,n
x3,n
.
.
.

xk,n

1 x2,1 x3,1
1 x2,2 x3,2
1 x2,3 x3,3
.
.
.

.
.
.

.
.
.

..

xk,1
xk,2
xk,3
.
.
.

1 x2,n x3,n

xk,n

1
1
1
x2,1 x2,2 x2,3
x3,1 x3,2 x3,3

1
x2,n
x3,n

.
.
.

.
.
.

.
.
.

..

xk,1 xk,2 xk,3

n
n
n
i=1 x3,i
i=1 x2,i

n
n
2
n x2,i
i=1 x2,i x3,i
i=1 x2,i
i=1

n
2
n x3,i n x3,i x2,i
i=1
i=1 x3,i
i=1

.
.
.
.
.
.

.
.
n .
n
n
i=1 xk,i x3,i
i=1 xk,i x2,i
i=1 xk,i

..

.
.
.

1
2
3
.
.
.

k
y1
y2
y3
.
.
.

xk,n

yn

n
n i=1 xk,i
ni=1 x2,i xk,i
i=1 x3,i xk,i


1
2


3
.
..
k

.
.
.

i=1

x2k,i

n
n i=1 yi
ni=1 yi x2,i
i=1 yi x3,i
n

i=1

Es importante recordar que el estimador MCO esta denido solo cuando la matriz
(X'X) es invertible, lo que ocurre siempre y cuando:

49

.
.
.

yi xk,i

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

1. Las k columnas de la matriz X sean linealmente independientes.


2. Se disponga al menos de tantas observaciones como variables explicativas,
es decir: n

k .(Supuesto

7)

Pongamos atencin en el segundo supuesto, cuando n=k la matriz X tiene dimensin kk, por lo tanto salvo que no se cumpla el supuesto 8, X es invertible, y de

1
esta forma (X X)
= X 1 (X )1 y por lo tanto:
(2.37)

= (X X)1 X Y = X 1 (X )1 X Y = X 1 Y

el vector de residuos

u = Y X = Y X(X 1 Y ) = Y Y = 0n ,

de esta forma

el ajuste es perfecto, ya que todos los residuos son cero, la suma residual de igual
forma toma el mnimo valor posible, cero.
Sin embargo, esta no es una caracterstica deseable, el ajuste perfecto ocurre
porque tenemos una muestra muy reducida. Esto trae como consecuencia poco
robustez e imprecisin en las estimaciones. Si escogemos una nueva muestra, del
mismo tamao que la anterior, obtendremos otro estimador

con

suma residual

0, que puede diferir en forma arbitraria del anterior.


Para lograr estimaciones precisas de los parmetros, es necesario tener un nmero de observaciones notablemente superior al de las variables explicativas. La
diferencia n-k se conoce como el nmero de grados de libertad de la estimacin.

2.5.

Propiedades del estimador MCO

Notemos que el vector

es un vector aleatorio, ya que depende del vector de

errores:

(2.38)

= (X X)1 X Y = (X X)1 X (X + u) = + (X X)1 X u


= E() + E[(X X)1 X u]
E()
= + (X X)1 X E(u)

La esperanza de

es el mismo parmetro, ya que este es un constante (valor

poblacional), y por supuestos 2 y 3 el segundo trmino de la expresin anterior


es cero,
(2.39)

=
E()
50

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

Es decir, el estimador MCO es

insesgado, tal como lo habamos mostrado en la

ecuacin (2.28).
De (2.38) podemos denir el error de estimacin o sesgo como:

Ahora calculemos la

= (X X)1 X u
:
varianza de

=
var()
=
=
=
=
=

(2.40)

Para poder estimar la varianza

( E())
]
E[( E())
E[( ) ( ) ]
E[(X X)1 X uu X(X X)1 ]
(X X)1 X E(uu )X(X X)1
(X X)1 X ( 2 In )X(X X)1
2 (X X)1
necesitamos reemplazar 2
de

en (2.40) por su

estimador insesgado:

e2 =

u u
nk

2.5.1. Propiedad de mejor estimador lineal insesgado


Se dice que

es el mejor estimador lineal insesgado (MELI) de

si se cumple

lo siguiente:
1. El

lineal, es decir, es una funcin lineal de una variable aleatoria, como la

variable
2. Es

en el modelo de regresin.

insesgado,

valor,

es decir, su valor esperado,

,
E()

es igual a el verdadero

3. Tiene varianza mnima dentro de la clase de todos los estimadores lineales


insesgados; un estimador insesgado como varianza mnima es conocido como
un

estimador eciente.

2.5.2. Teorema de Gauss-Markov


Proposicin: El estimador MCO es el estimador lineal insesgado ptimo, en el
sentido de que cualquier otro estimador lineal e insesgado tiene una matriz de covarianza mayor que la del estimador MCO. Es decir, el estimador MCO es MELI.

51

Microeconometra Aplicada
Centro de Microdatos

Capitulo 2: Modelo de Regresin Lineal

Demostracin:

kn. Denotemos

e un estimador lineal de ,
e = Ay
e (X X)1 X , de modo que:
A=A

Sea

donde

e
A

es una matriz

e = [A + (X X)1 X ]Y
= [A + (X X)1 X ](X + u)
= AX + + [A + (X X)1 X ]u
Aplicando esperanza a la expresin anterior:

e = AX + + [A + (X X)1 X ]E(u)
E()
= AX +
El estimador

ser insesgado solo si la matriz A es tal que AX=0kk . De esta

forma:

e = + [A + (X X)1 X ]u
y su matriz de covarianza ser:

e = E[(e )(e ) ]
cov()
= E{([A + (X X)1 X ]u)([A + (X X)1 X ]u) }
= 2 AA + 2 (X X)1
| {z }

cov()

AA es semidenida positiva, se concluye la diferencia entre la


e y es una matriz semidenida positiva, con lo que la covarianza
covarianza de
e

de es mayor o igual a la covarianza de


Como la matriz

52

Captulo 3
Modelo de Regresin Lineal:
Inferencia y Bondad de Ajuste
3.1.

Bondad de Ajuste y Anlisis de Varianza

El objetivo de esta seccin es introducir un criterio de ajuste de nuestra regresin, es decir, un criterio que nos indique cuan bien se ajusta nuestro modelo a
la muestra.
En principio, podramos pensar que la suma de los residuos cuadrados, es decir, nuestro criterio original de ajuste, es una buena opcin: a menor sea ste,
mejor es nuestro ajuste. Sin embargo, la suma de los residuos cuadrados puede
ser arbitrariamente escalada al multiplicar la variable dependiente (Y) por el factor de escala deseado, lo cual invalida su uso como criterio de ajuste.
Por ello, se ha desarrollado un criterio que elimine el problema anterior. Dicho estadstico ya no se basar en la magnitud de un valor (como la suma de los
cuadrados de los residuos), sino que intentar preguntarse si la variacin de las variables independientes (X) explica la variacin de la variable independiente, como
veremos ms adelante. Para ello analizaremos con un poco ms de profundidad
el modelo de regresin lineal en desvos con respecto a la media y presentaremos
la llamada descomposicin de varianza (o anlisis de varianza), ambos, insumos
fundamentales para obtener nuestro estadstico de bondad de ajuste.

53

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

Microeconometra Aplicada
Centro de Microdatos

3.1.1. Modelo de Regresin Lineal en Desvos


Sea el modelo poblacional usual con k variables:

yi = 1 + 2 x2i + 3 x3i + + k xki + ui

(3.1)
donde

i = 1...n

y cuya contraparte estimada es:

yi = 1 + 2 x2i + 3 x3i + + k xki + ui

(3.2)

Luego, si sumamos para todas las observaciones y dividimos a ambos lados por
el tamao muestral n, tenemos:

Y = 1 + 2 x2 + 3 x3 + + k xk

(3.3)
por lo cual:

1 = Y 2 x2 + 3 x3 + + k xk

(3.4)

La ecuacin (3.4) muestra que la constante de una regresin queda determinado


por el resto de los k-1 coecientes involucrados. Finalmente, note que restando
las ecuaciones (3.2) y (3.3) obtenemos:
(3.5)

yi Y = 2 (x2i x2 ) + 3 (x3i x3 ) + + k (xki xk ) + ui

la cual es una expresin similar a (3.2), excepto por dos importantes diferencias.
Primero, el modelo no posee constante y segundo, las variables se encuentran
expresadas en desvos con respecto a la media. A pesar de ello, note que los coecientes y los residuos son los mismos en ambos modelos.
De lo anterior surge un importante corolario respecto del trmino constante de
nuestro modelo. En general, el inters del investigador se centra en el impacto de
los regresores sobre la variable dependiente, por lo cual, el trmino constante no
es ms que una correccin que garantiza que los promedios muestrales de ambos
miembros del modelo economtrico coincidan.
Para transformar en desvos con respecto a la media un modelo en trminos matriciales, introduciremos una matriz fundamental para el anlisis de esta seccin.
0
Denotaremos por M una matriz de n n, denida como:


1 n1 n1 n1
1 0 0
1 1 1
1


1 n1 n1
ii
0 1 0 1 1 1 1
M 0 = I = .. .. . . .. .. .. . . .. = .. n
.
.
..
.
.
nn
n
.
. .
.
.
.
. n .
.
.
.
.
1
1
0 0 1
1 1 1
n
n 1 n1

54

Microeconometra Aplicada
Centro de Microdatos

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

donde I es la identidad (nn) e i corresponde al vector unitario de dimensin n.


0
0
0
0
0
Dicha matriz es singular, simtrica (M '=M ) e idempotente (M M =M ). En
0
general, M es conocida como matriz de desvos, ya que resta a cada columna de
la matriz involucrada, su media aritmtica. Por ejemplo, es fcil comprobar que:

yi
y1
i=1
n

1
y2 1 i=1 yi
M 0 Y = Y ii Y = ..
.
.
n
. n
n.
yn
i=1 yi

y1 Y
y2 Y

=
.
.

yn Y

Por lo tanto, nuestro modelo expresado en matrices, puede ser expresado en trminos de desvo con respecto a la media como:

M 0 Y = M 0 X + M 0 u

(3.6)

3.1.2. Anlisis de Varianza


Suponga entonces el siguiente modelo poblacional:

Y = X + u
donde Y corresponde a una vector

n 1,

X corresponde a nuestra matriz de re-

gresores que incluye un trmino constante, tal que X es de


a nuestro vector de errores de

n 1.

nk

y u corresponde

Buscamos entonces denir la variacin de la variable dependiente (Suma de los

cuadrados totales = TSS) como :

T SS =
(Yi Y )2

(3.7)

i=1
Para encontrar entonces una expresin para (2.48), de la ecuacin (2.47) tenemos
que nuestro modelo estimado en desvos con respecto a la media es:

M 0 Y = M 0 X + M 0 u
con lo cual, al particionar nuestra matriz X en X

parmetros en = [1
2 ] y considerando que

= [i X2 ], nuestro vector de
M 0 i = 0 y que M 0 u = u,

tenemos que:

M 0Y
(3.8)

= M 0 i1 + M 0 X2 2 + M 0 u
= M 0 X2 2 + u

1 Note

que para dicha denicin utilizamos los cuadrados de la desviaciones, ya que la suma
de las desviaciones es siempre cero.
55

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

Microeconometra Aplicada
Centro de Microdatos

Luego, para formar la TSS(suma de los cuadrados totales o la suma de los cuadrados de las desviaciones de Y con respecto a su media), de la ecuacin (2.48),
multiplicamos por Y' la ecuacin (2.49):

Y M 0Y

=
=
=
Y M 0Y =
T SS =

(3.9)
(3.10)

Y (M 0 X2 2 + u)
(X + u) (M 0 X2 2 + u)
X M 0 X2 2 + X u + u M 0 X2 2 + u u
2 X M 0 X2 2 + u u
2

ESS + RSS

donde el segundo y el tercer trmino desaparecen gracias a que los residuos estimados son, por construccin, ortogonales a las variables explicativas
anterior es conocida como la

descomposicin de varianza.

2 . La igualdad

El trmino de la

izquierda corresponde a TSS o la suma de los cuadrados de las desviaciones de


la variable dependiente. En otras palabras, la variabilidad de Y. En la derecha se
encuentra la variabilidad de las variables independientes o regresores y la variabilidad de los errores. Cul es entonces el objetivo?: descomponer la varianza de
la variable dependiente aquella parte que es explicada por la regresin (ESS) de
aquella parte explicada por los residuos (RSS). Por qu?: porque intuitivamente,
la regresin se ajusta mejor si las desviaciones de Y se explican en su mayor parte
por desviaciones de X y no por desviaciones de los residuos.

3.1.3. Bondad de Ajuste: R2 y R 2


Denimos entonces la bondad de ajuste del modelo a travs del siguiente estadgrafo llamado tambin coeciente de determinacin:

R2 =

(3.11)

ESS
T SS

es decir, como la proporcin de la varianza de Y que es explicada por la varianza


de la regresin. Alternativamente:

R2 = 1

(3.12)

RSS
T SS

Note que:
1. El coeciente de determinacin es siempre menor a 1. Ello porque
1.
T SS y por lo tanto RSS
T SS

2 Ya

= X Y X Y = 0.
que X u = X (Y X )
56

RSS

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

Microeconometra Aplicada
Centro de Microdatos

2. El anlisis de varianza anterior fue derivado bajo el supuesto que el modelo


0
inclua una constante (por ello utilizbamos la matriz M ). En dicho caso,
2
necesariamente R 0. En caso de que el modelo no incluya una constante,
se debe utilizar la frmula (2.5.2) utilizando TSS=Y'Y (sin desvos).
3. Al agregar regresores al modelo, el

R2

nunca decrecer (se mantendr cons-

tante o aumentar)
4. No es claro cuan bueno sea como predictor de ajuste.

Para ver este ltimo punto, suponga que usted posee el siguiente modelo poblacional:

Y = 1 + 2 X + u
donde X es un vector (n

1).

Suponga ahora que restamos X a ambos lados de

nuestro modelo. Obtenemos entonces:

Y X = 1 + X + u
Si

2 1,

entonces es fcil vericar que el

R2

del primer modelo ser cercano a

1, mientras que el del segundo sera cercano a cero, a pesar de que los modelos
son matemticamente equivalentes. A pesar de lo anterior, en trabajos aplicados,
2
el R es ampliamente utilizado, por lo cual se recomienda su publicacin.
Retrocedamos ahora al punto tres. El nos dice que el coeciente de determinacin
probablemente crecer al incluir regresores. Ello plantea incentivos a incluir regresores no relevantes para nuestro modelo, con el n de obtener un mejor ajuste.
Porqu sucede esto?, ya que al incluir regresores, la RSS necesariamente decrece
(o en el mejor de los casos se mantiene), mientras que la TSS permanece constante.
Por esta razn se cre el coeciente de determinacin ajustado, el cual corri2
ge el R original por los grados de libertad del numerador y el denominador.
2
2 ) como:
Entonces, denimos el R ajustado (R

(3.13)

2 = 1 u u/(n k)
R
Y M Y /(n 1)

o equivalentemente:

(3.14)

2 = 1 (1 R2 ) (n 1)
R
(n k)

57

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

3.2.

Microeconometra Aplicada
Centro de Microdatos

Inferencia

Una vez que hemos estimado nuestra regresin muestral, es necesario preguntarse
cuan buena aproximacin es dicha regresin de la poblacional. Para que la aproximacin sea cercana, es condicin necesaria que los parmetros incluidos en la
regresin muestral sea estadsticamente distintos de cero (en caso contrario, no
pertenecen a la regresin poblacional). As, uno de nuestros objetivos puede ser
el testear la signicancia individual de los parmetros.
Pero lo anterior es slo una de las preguntas que como investigadores podemos
estar interesados en responder. Por ejemplo, en la estimacin de la funcin de
u
produccin de una rma, que asumimos Cobb Douglas (Y = AK L e o en logaritmo

ln Y = ln A + ln K + ln L + u), podemos estar interesados en descubrir si

la rma presenta rendimientos constantes, crecientes o decrecientes a la escala, lo


cual se reejar en que

+ > o 1.

Por lo tanto, ello podra ser otra hiptesis

interesante de plantearse. Tambin podra ser interesante descubrir si todos los


parmetros a la vez son distintos de cero, o de algn valor determinado.
La gama de preguntas posibles respecto del valor de los parmetros es slo acotada por la pregunta que el investigador desee responder. Nuestro objetivo es,
por lo tanto, desarrollar los mtodos de inferencia y contraste de hiptesis que
nos permitan responder, en el contexto de una regresin muestral particular, las
preguntas anteriores.
Dos notas precautorias. En esta seccin nos ocuparemos de restricciones o hiptesis

lineales sobre los coecientes. Restricciones no lineales son ms escasas

en econometra aplicada y se desarrollan en contexto de un modelo particular.


Segundo, en todo lo que se reere a este apartado, asumiremos que los errores de
nuestra regresin muestral siguen una distribucin normal (ya veremos porqu).
Entonces, sea nuestro modelo poblacional

Y = X + u
donde X es una matriz de (n
(k

1).

k ),u

e Y son vectores (n

1)

es vector de

Sean entonces las siguientes hiptesis:

1.

H0 : i = 0 Plantea que el regresor Xi

no posee inuencia alguna sobre Y.

Este es el test ms comn y nos referiremos a l como test de signicancia.

58

Microeconometra Aplicada
Centro de Microdatos

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

2.

3.

H0 : i = i0 Plantea
por i0 sobre Y.
H0 : i + j =1

que el regresor

Xi

posee un impacto determinado

Plantea que la suma de los regresores

Xi

Xj

poseen un

impacto conjunto de magnitud 1.


4.

H0 : i = j Plantea que los regresores Xi

Xj

poseen el mismo impacto

sobre Y.
5.

H0 : i =0

i=2. . . k

Plantea que todos los regresores conjuntamente,

excepto la constante, son cero.


6.

H0 : l =0

ha sido particionado
(kp 1) respectivamente, tal

donde el vector

mensiones

(kl 1)

en dos (l y
que

p ) con dikl + kp = k . Plantea

entonces que un subconjunto de parmetros son estadsticamente no signicativos.

Todas las hiptesis anteriores pueden ser resumidas en la siguiente expresin:

R = r
donde R es una matriz de (q k ) constantes conocidas (ceros o unos), cuyo objetivo ser seleccionar los parmetros a testear, cuyo nmero de las, q, representa
el nmero de restricciones. A su vez, r es un vector de dimensin q y contiene el
real al cual es restringido cada parmetro. Veamos como sern las matrices

en cada una de nuestras hiptesis:

1. R =[0. . . 010 . . . 0]; r=0; q=1


donde 1 se encuentra en la i-sima posicin
2. R =[0. . . 010 . . . 0]; r=i0 ; q=1
donde 1 se encuentra en la i-sima posicin
3. R =[0. . . 010 . . . 010 . . . 0]; r=1; q=1
donde 1 se encuentra en la i-sima posicin y en la j-sima posicin.
4. R =[0. . . 010 . . . 0-10 . . . 0]; r=0; q=1
donde 1 se encuentra en la i-sima posicin y en la j-sima posicin.

Ik1 ];

Iki ];

5. R =[ q1

6. R =[ ki kj

r= ; q=k

r= ; q=ki

59

Microeconometra Aplicada
Centro de Microdatos

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

Entonces, nuestra hiptesis nula corresponde a:

H0 : R = r

(3.15)

con lo cual, slo nos resta derivar el test que nos permita rechazar o no rechazar
nuestra nula. La construccin del estadgrafo es como sigue. Dado que MCO
(bajo los supuestos relevantes) es insesgado, tenemos que

= R ,
E(R)

mientras que la varianza de

= , por lo tanto,
E()

corresponde a

= E[R( )( ) R ]
V [R]

= RV ar()R
= 2 R(X X)1 R
Necesitamos an un supuesto ms para determinar la distribucin muestral de
es funcin de u y u N (0, 2 ), entonces N (, 2 (X X)1 )
nuestra nula. Dado que
N (r, 2 R(X X)1 R ), entonces:
y por lo tanto R

N [, 2 (X X)1 ]

(3.16)
y

R N [R, 2 R(X X)1 R ]

(3.17)
y si la nula

R = r

es cierta:

(3.18)

(R r) N [0, 2 R(X X)1 R ]

luego estandarizamos, con lo cual:

(3.19)

(R r)
2 R(X X)1 R

N [0, 1]
3

Adems, se puede demostrar que (hacerlo) :

u u
2(nk)
2

(3.20)

Luego, se puede demostrar que (hacerlo) :

(R r) [ 2 R(X X)1 R ]1 (R r) 2q

(3.21)

3 Basta

con recordar que si x corresponde a un vector de realizaciones normales (0,1), por lo

x N (0, 2 I) y A corresponde a una matriz simtrica e idempotente de rango n, entonces


1
2
= M Y = M u y que el rango de una matriz simtrica
2 x Ax n . Finalmente, recuerde que u

cual

e idempotente es su traza.
4 Basta con recorder que
x 1 x 2n .

si el vector x, de dimensin n, es tal que

60

x N (0, ), entonces,

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

Microeconometra Aplicada
Centro de Microdatos

luego, combinando los dos resultados anteriores, se puede demostrar que (hacer-

lo) :

[(R r) [R(X X)1 R ]1 (R r)]/q


F(q,nk)
u u/(n k)

(3.22)

El test expuesto en (2.63) corresponde a la forma general del test F. Dicho test
es de utilidad para testear cualquier hiptesis de la forma expuesta en (2.56). A
continuacin veremos subcasos de dicho test general.

3.2.1. Test t (Una hiptesis lineal)


Reescribiendo el test F como:

]1 (R r)] F(q,nk)
[(R r) [RVd
ar()R
y haciendo el reemplazo respectivo de R y r correspondientes a las hiptesis 1 o
2 (H0 :

i = 0 = i0 ),

llegaremos a:

F =

(3.23)

Recordando que

t2

( i0 )2
F (1, n k)
Vd
ar(i )

es una caso particular de una F con un grado de libertad en

el numerador, tenemos que:

i0
t=
tnk
Vd
ar(i )

(3.24)

Lo anterior es conocido como el


utilizada corresponde a

t=

test t

(test de signicancia) y en su versin ms

, donde se busca testear la hiptesis nula de


Vd
ar(i )

que el parmetro es cero.


El test t tambin cubre los casos 3. y 4.. En el caso 3. por ejemplo (H0 :

i +j =1),

el estadgrafo corresponder a:

(3.25)

i + j 1
tnk
t=

d
d
d
V ar(i ) + 2Cov(i , j ) + V ar(j )

La distribucin t es simtrica y se aproxima a la normal para tamaos de muestras

5 Slo

un poquito de lgebra y recordar como se construye una distribucin F(q, n-k) a partir
de la divisin de dos 2 con grados de libertad q en el numerador y n-k en el denominador.
61

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

Microeconometra Aplicada
Centro de Microdatos

grandes, sin embargo, la t posee colas ms gruesas que la normal (lo cual es ms
pronunciado en muestras pequeas: n30). La siguiente gura expone la relacin
entre la distribucin t y la normal:

Figura 3.1
Distribucin Normal versus Distribucin t-student

Probabilidad

Distribucin Normal

Distribucin t

Nota precautoria:
Toda la derivacin anterior se basa en el estricto supuesto de normalidad de
los errores. En caso de que los mismos no distribuyan normal, la distribucin
del test F (y por lo tanto el del t) es desconocida en muestras nitas. Sin ema
bargo, es posible demostrar que t N (0, 1), es decir, que el test t distribuye
asintticamente normal. Luego, los valores crticos de t y

(normal estndar)

se encuentran sumamente cerca si n-k30, por lo cual, en trminos prcticos no


importa mucho cual de ellas escojamos para los valores crticos (a menos que la
muestra sea especialmente pequea).
Finalmente, nos queda examinar los criterios de rechazo del test y los niveles
de conanza. Como usted recordar de sus clases de estadstica, lo anterior depende de como especiquemos la hiptesis alternativa. A continuacin, pasamos
a revisar este punto.

62

Microeconometra Aplicada
Centro de Microdatos

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

Criterio de Rechazo y Nivel de Conanza


Una vez que hemos calculado el valor del test para nuestra nula particular (o

valor calculado ), resta calcular el valor crtico o el valor que nos indica la tabla t.
Dicho valor crtico nos dir si nuestra nula es falsa o si no podemos armar que lo
es. La eleccin de dicho valor crtico se toma desde la tabla de distribucin t y el

nivel de signicancia escogido


determina el nivel de conanza del test

nmero debe ser escogido tomado en cuenta el


(1 %, 5 % o 10 %), el cual a su vez

(99 %, 95 % o 90 %, respectivamente). El nivel de conanza posee una explicacin


intuitiva: Nuestro estadgrafo es funcin de la muestra con lo que estamos trabajando, por lo cual, si contramos con una gran nmero de ellas y con cada una
pudisemos calcular nuestro estadgrafo, el nivel de conanza indica el porcentaje de veces que calculamos nuestro estadgrafo en que realmente no rechazamos
lo cierto o rechazamos correctamente lo falso. La forma en que se distribuya la
probabilidad de rechazo, es decir, el nivel de signicancia, depende de nuestra
hiptesis alternativa. A continuacin revisamos dicho asunto.

Test de una cola

Supongamos que nuestra hiptesis es:

H0 : i = io
H1 : i > io
donde

i0 R. En dicho caso, el estadgrafo es calculado segn lo propuesto en la

seccin anterior. El punto est en como acumulamos la probabilidad de rechazo.


En este caso, el total de la probabilidad de rechazo se acumula en la cola derecha

de la distribucin, como lo muestra la siguiente gura :

6 Por

qu en la cola derecha? Porque la probabilidad de rechazo, es decir, el nivel de signicancia, nos indica hasta donde puedo tolerar un valor mayor a io , por lo cual, carecera de
sentido que la zona de rechazo se encuentre en la cola izquierda de la distribucin. Por ejemplo,
si io =0, la distribucin de nuestro estadgrafo se centra en cero (vea la frmula), por lo cual la
hiptesis alternativa correspondera a que el parmetro es positivo. el punto es cun positivo
puedo aceptar que sea?.
63

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

Microeconometra Aplicada
Centro de Microdatos

Figura 3.2
Zona de rechazo test de una cola

Probabilidad

Se Rechaza (5%)
No se Rechaza

por lo tanto, rechazaremos nuestra hiptesis nula de que el coeciente es cero


contra la hiptesis alternativa que el parmetro es mayor que

io ,

si el valor cal-

culado del test es mayor al valor crtico de la tabla t. En el caso que


el parmetro es menor a

io ,

H1

sea que

entonces la probabilidad de rechazo se concentra en

la cola izquierda y se rechaza la nula en el caso que el valor calculado sea menor
que el valor crtico de la tabla t.

Test de dos colas


Supongamos que nuestra hiptesis es:

H0 : i = io
H1 : i = io
En este caso estamos repartiendo uniformemente la probabilidad de rechazo en
ambas colas de la distribucin como lo muestra la siguiente gura (al 95 % de
conanza):

64

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

Microeconometra Aplicada
Centro de Microdatos

Figura 3.3
Zona de rechazo test de dos colas

Probabilidad

Se Rechaza (2,5%))

Se Rechaza (2,5%)
No se Rechaza

Por lo tanto, rechazaremos la nula si el valor calculado es en mdulo mayor que


el valor crtico de tabla. Note que en este caso, la probabilidad de rechazo se
reparte un partes iguales en ambas colas. Ello se justica en que la distribucin
t corresponde a una distribucin simtrica.

Error de Tipo I, Error de Tipo II, Tamao y Potencia de un test


Antes de continuar, veremos cuatro conceptos estadsticos importantes que nos
indican caractersticas de nuestro test.

1.

Error de Tipo I (ETI):

Corresponde a la probabilidad de rechazar la

nula cuando es cierta.


2.

Error de Tipo II (ETII):

Corresponde a la probabilidad de aceptar la

nula cuando es falsa.


3.

Tamao del Test: Corresponde la probabilidad de cometer ETI. Se dene


como el nivel de signicancia del test ().

4.

Potencia del Test:

Corresponde a la probabilidad de rechazar la nula

cuando es falsa. Se dene como Potencia =1-ETII.

65

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

Microeconometra Aplicada
Centro de Microdatos

El ptimo para el investigador sera minimizar ambos tipos de errores y tener un


test con un menor tamao y mayor potencia posibles, sin embargo, note que el
tamao del test y por lo tanto, el ETI, es una variable endgena al investigador,
en tanto que l decide con que nivel de conanza trabajar. Luego, el objetivo se
transforma en, dado un nivel de conanza, minimizar la ocurrencia de ETII.
Intuitivamente, si usted escoge un nivel de signicancia pequeo (1 %, por ejemplo), sus zonas de rechazo sern pequeas, con lo cual, inevitablemente, la zona de
no rechazo crece, lo cual implica que por minimizar el ETI, ha aumentado el ETII.

P-value
Otra forma alternativa al valor crtico de tabla para rechazar o no rechazar nuestra nula, corresponde al uso de los llamados p-values, los cuales son reportados
en cualquier paquete estadstico. El p-value (p) se dene como:
(3.26)

p = p(tcalculado ) = P (|Z| |tcalculado |) = 2(1 (|tcalculado |))

es decir, el p-value representa la probabilidad de que el valor crtico (t de tabla, en


nuestro caso), sea mayor al valor t calculado, es decir, describe el nivel de signicancia exacto asociado a un resultado economtrico en particular. Por ejemplo,
un p-value de 0.07 indica que un coeciente es estadisticamente signicativo en
un nivel de 0.07 (o con un 93 % de conanza).

Ejemplo:
Suponga el siguiente Modelo de Regresin Lineal Simple:

Yi = 1 + 2 Xi + ui

para i = 1, ..., N

Adems posee la siguiente informacin muestral de X e Y:


Y

10

18

20

1 y 2 es el siguiente:
] [
]1 [
] [
]
4 48
20
2,1935
1
=
=
48 824
298
0,2338
2

El estimador MCO de

La matriz de varianzas y covarianzas de

es:

=
V ()
u2 (X X)1
[
]1 [
]
0,436 4 48
0,180866 0,010536
=
=
48 824
0,010536 0,000878
2
66

Microeconometra Aplicada
Centro de Microdatos

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

Primero veamos el ajuste de este modelo, es decir, en que grado la variable


2
2
explica a la variable y , para lo cual calculemos el R y R :

R
R

4
u2
RSS
0,436
= 1
= 1 4 i=1 i
= 0,969
=1
2
T SS
14
i=1 (Yi Y )
4
u2 /2
RSS/2
= 1
= 1 4 i=1 i
= 0,953
2
T SS/3
i=1 (Yi Y ) /3

Como podemos ver, el grado de ajuste del modelo es bastante bueno, como el
2
modelo incluye constante, el R se puede interpretar como la proporcin de la
variabilidad de la variable independiente que es explicada por la variabilidad de
la variable dependiente, la que en este caso alcanza un 97 %.
Ahora veamos si estos parmetros estimados son signicativos a un 95 % de conanza, para lo cual realizaremos un test

1.

Test de signicancia de

1 :

de signicancia a cada uno de ellos:

H0 : 1 = 0
H1 : 1 = 0
t=

1
V ar(1 )

t2

De esta forma, el valor calculado para el estadstico

es:

2,193548387
tc =
= 5,157850523
0,180866
El valor de tabla del estadstico

a un 95 % de conanza y con dos grados

de libertad es 4,303.

67

Microeconometra Aplicada
Centro de Microdatos

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

Figura 3.4
Inferencia Estadstica

Probabilidad

No se
Rechaza

Se
Rechaza
(2,5%))

Se
Rechaza
(2,5%)

t(2)=4,303

t(2)=4,303

tc=5,158

De esta forma, se rechaza la hiptesis nula de que

1 =0,

y por lo tanto el

parmetro estimado resulta ser estadsticamente signicativo.

2.

Test de signicancia de

2 :

H0 : 2 = 0
H1 : 2 = 0
t=

2
V ar(2 )

t2

De esta forma, el valor calculado para el estadstico

es:

0,233870968
tc =
= 7,892762865
0,000878
El valor de tabla del estadstico

a un 95 % de conanza y con dos grados

de libertad es 4,303.

68

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

Microeconometra Aplicada
Centro de Microdatos

Figura 3.5
Inferencia Estadstica

Probabilidad

No se
Rechaza

Se
Rechaza
(2,5%))

Se
Rechaza
(2,5%)

t(2)=4,303

t(2)=4,303

tc=7,893

De esta forma, se rechaza la hiptesis nula de que

2 =0,

y por lo tanto el

parmetro estimado resulta ser estadsticamente signicativo.

3.

TAREA: Testee la siguiente hiptesis nula:

H0 : 1 2 = 2
H1 : 1 2 = 2

69

Microeconometra Aplicada
Centro de Microdatos

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

3.2.2. Test F (Conjunto de hiptesis lineales)


Los casos 6. y 5. corresponden a un conjunto de hiptesis a testear. En el caso
5. corresponda a un subconjunto particular de parmetros, mientras que el caso
6. corresponda a la nula de que todos ellos eran cero, menos la constante. En
dichos casos se aplica la frmula del test F segn la ecuacin (2.63) y los criterios
de rechazo siguen lo expuesto en la seccin anterior.
Sin embargo, en ambos casos podemos derivar expresiones alternativas para nuestro test.

Todas las pendientes del modelo son cero:

En este caso, se puede

demostrar que el test F puede expresarse como:

F =

(3.27)

ESS/(k 1)
F(k1,nk)
RSS/(n k)

o alternativamente, utilizando la denicin del

F =

(3.28)

R2 :

R2 /(k 1)
F(k1,nk)
(1 R2 )/(n k)

Un subconjunto de las pendientes del modelo son cero:

En este

caso, se puede demostrar que el test F puede expresarse como:

F =

(3.29)

donde

(
u u u u)/k2
F (k2 , n k)
u u/(n k)

denotan los residuos MCO restringidos (donde

k2

representa el

nmero de regresores que han sido restringidos a cero), mientras que

representan los residuos del modelo MCO original.

3.2.3. Intervalos de Conanza


Una forma alternativa (o mejor dicho complementaria) de examinar la signicancia estadstica de un parmetro ( o un conjunto de ellos) es a travs de intervalos
de conanza (IC). Ellos nos indican, dado un nivel de conanza, el

rango de

valores admisibles del coeciente que se estima. Los niveles de conanza gene-

ralmente utilizados son 99 %, 95 % y 90 % (al igual que en los test de hiptesis),

70

Microeconometra Aplicada
Centro de Microdatos

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

donde el tamao de los mismos es necesariamente decreciente .

Una manera natural de obtener el IC asociado a

es a travs del test t aso-

ciado. Vimos entonces que l corresponde a:

i0
i
tnk
V ar(i )
entonces, si deseamos un IC del (1-) % de conanza (es decir, de
cancia) para el parmetro

i ,

de signi-

basta obtener de las tablas de distribucin el valor

correspondiente, es decir:

1 = P r Z/2

i i0

Z1/2
V ar(i )

i i0
= P r Z1/2
Z1/2

V ar(i )
]
[

= P r i Z1/2 V ar(i ) i0 i + Z1/2 V ar(i )


donde la tercera expresin se obtiene de despejar

i0

de la segunda. Note que el

intervalo ha sido construido en base a una distribucin simtrica (como la t o la


normal), por lo cual el valor de tabla a escoger debe corresponder a

/2.

Note adems que dicho intervalo est construido slo en base a constantes conocidas. Una vez construido, se puede contrastar la nula (H0 :
de signicancia

sencillamente observando si

i0

i = i0 )

al nivel

pertenece al intervalo (en cuyo

caso no rechazamos la nula) o se encuentra fuera de l (en cuyo caso rechazamos

la nula) . Nuevamente, la validez de dicho intervalo de conanza depende crticamente del supuesto de distribucin de los errores. En el caso que el valor

se obtenga de la tabla t, como ya sabemos, estamos suponiendo que los errores


siguen una distribucin normal. Un caso ms general es utilizar los valores crticos
de la distribucin normal estndar.
Tambin es posible derivar regiones de conanza, es decir, IC de conanza simultneos para una conjunto de parmetros, sin embargo, su utilizacin es escasa en

7 Intuitivamente, ya que a

ms exacta es mi estimacin del rango posible, con menos conanza


puedo armar estar en lo correcto.
8 Una forma fcil de verlo es pensando en =0, es decir, que la variable x no ayuda a
i0
i
explicar y .
71

Microeconometra Aplicada
Centro de Microdatos

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

econometra aplicada (a menos que su pregunta puntual lo requiera!).


Finalmente derivaremos el intervalo de conanza para la varianza de los errores. Sabemos de la ecuacin (2.61) que:

u u
2nk
2

(n k)
2
2nk
2

(3.30)

Utilizando la misma lgica que utilizamos para el IC de un parmetro


que el IC para
2 corresponde a:

[
(3.31)

(n k)
2
(n k)
2
2

2nk,
2nk,1

, tenemos

]
= (1 )

Note que los valores crticos utilizados corresponden a


2
la distribucin es una distribucin asimtrica.

2nk,1

2nk, ,

ya que

3.2.4. Test de Normalidad (Test de Jarque-Bera)


Consideramos ahora el problema de utilizar los momentos de los residuos MCO
para hacer inferencia sobre la distribucin de los errores poblacionales. Dado que
algunas de las propiedades de MCO y de la inferencia dependen del supuesto de
normalidad en los errores, es importante poseer un contraste para dicho supuesto.
Como es sabido, la distribucin normal es simtrica y mesocrtica. La simetra
3
implica que el tercer momento poblacional E(u ) en torno a la media, es cero. El
hecho que sea mesocrtica implica que la kurtosis es 3 (es decir, el ancho de las
colas de la distribucin, el cual se mide utilizando el cuarto momento en torno
a la media). Recordemos entonces que el coeciente de simetra poblacional se
dene como:

E(u3 )
S=
3
( 2 ) 2

mientras que la kurtosis (o coeciente de):

K=

E(u4 )
( 2 )2

72

Microeconometra Aplicada
Centro de Microdatos

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

En base a los anteriores, Bera y Jarke (1981), propusieron el siguiente estadgrafo,


construido

bajo la nula de normalidad:


[

3)2
S (K
+
JB = n
6
24

]
a

2(2)

Donde los estimadores muestrales del coeciente de asimetra y kurtosis se obtienen al considerar que un estimador natural de:

r = E[
ur ]
corresponde a:

1 r
mr =
u
n i=1 i
n

Note que el estadgrafo est denido en trminos del exceso de kurtosis, por
lo cual, a menor sea el valor, menor es la probabilidad de rechazar la nula de
normalidad. Note adems que el estadstico es esencialmente no constructivo, en
trminos de que no nos indica que camino seguir en caso de rechazar la nula,
adems de que no rechazar normalidad no implica conrmar su existencia. Sin
embargo, en la prctica corresponde al test ms utilizado.

3.3.

Bondad de Ajuste e Inferencia en STATA

Volvamos al ejemplo del captulo 2 donde se ha estimado el efecto del peso al


nacer del menor sobre los resultados estandarizados de la prueba cognitiva Tepsi.
Los resultados, presentados nuevamente en el Cuadro 3.1, nos mostraban un efectos positivo del peso al nacer sobre el puntaje de esta prueba, cada 100 gramos
adicionales de peso al nacer el puntaje del menor se incrementa en 0.067 puntos,
recordemos que el puntaje est estandarizado en una media de 50 puntos con
desviacin estndar de 10 puntos.
El cuadro en STATA tambin nos muestra el error estndar del coeciente estimado, y el correspondiente valor del estadstico

para la hiptesis nula de que

este coeciente es igual a cero. Podemos notar que:

t=

0,0675061
= 2,71
0,0249291

La comparar el valor calculado para el estadstico con la informacin de la estimacin (2.71) con el valor crtico de una distribucin

73

que acumula un 5 % en

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

Microeconometra Aplicada
Centro de Microdatos

la cola derecha e izquierda (1.96) podemos concluir que a un 5 % de signicancia


se rechaza la hiptesis nula que el coeciente de peso al nacer sea igual a cero,
concluyendo que el coeciente es estadsticamente signicativo. La cuarta columna del output de STATA nos muestra el p-value, el cual corresponde al nivel de
signicancia asociado al valor calculado del estadstico, este es 0.7 %. Como este
valor del p-value es menor al 5 % de error tipo 1 que se esta dispuesto a cometer
(nivel de signicancia) tambin podemos concluir que se rechaza la hiptesis nula.
Finalmente, las ltimas dos columnas muestran el intervalo de conanza calculado al 95 % de conanza, este intervalo nos indica que con un 95 % de seguridad
el valor poblacional del coeciente de peso sobre puntaje Tepsi est entre 0.019 y
0.116, al no pertenecer el cero al intervalo de conanza tambin podemos concluir
que el coeciente es estadsticamente signicativo. El cuadro 3.2 nos muestra la
misma estimacin pero utilizando un 1 % de signicacia (o 99 % de conanza).
Adicionalmente el resultado de STATA nos muestra la descomposicin de varian2
2
za y el coeciente de determinacin R y R ajustado estimado, en este ejemplo
el porcentaje de la varianza de la variable dependiente que esta siendo explicada
por el modelo es muy baja slo 0.007 %, porque a este modelo le falta incorporar
variables explicativas En el Cuadro 3.3 se estima el modelo pero incorporando
algunas otras variables como: aos de escolaridad de la madre, test cognitivo e
2
la madre (nmeros y lenguaje), y meses de lactancia materna, en este caso el R
ajustado es de un 8.4 %, toda las variables son estadsticamente signicativas a
excepcin de los meses de lactancia materna.

Cuadro 3.1
Estimacin MCO Puntaje Tepsi y Peso al Nacer
Inferencia al 95 %

74

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

Microeconometra Aplicada
Centro de Microdatos

Cuadro 3.2
Estimacin MCO Puntaje Tepsi y Peso al Nacer
Inferencia al 99 %

Cuadro 3.3
Estimacin MCO Puntaje Tepsi y Peso al Nacer
Inferencia al 95 %, incluyendo ms controles

Una vez estimado el modelo es posible testear si los errores cumplen con el supuesto de normalidad, para esto primero debemos obtener los errores predichos
del modelo a travs del siguiente comando:

75

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

Microeconometra Aplicada
Centro de Microdatos

predict errores, resid


El Cuadro 3.4 nos muestra la asimetra y kurtosis de los errores predichos, podemos ver que la kurtosis es muy cercana a 3, pero la asimetra se aleja de cero.
El Cuadro 3.5 muestra el test de normalidad de los errores, que testea conjuntamente kurtosis igual a 3 y asimetra igual a cero, la hiptesis nula conjunta es
rechazada, por lo cual el modelo no cumple con el supuesto de normalidad de los
errores.

Cuadro 3.4
Coeciente de asimetra y kurtosis errores del modelo

Cuadro 3.5
Test de Normalidad de los errores del modelo

Como los errores del modelo no cumplen con el supuesto de normalidad de los
errores, se puede utilizar el mtodo de simulacin de Bootstrap para obtener los
intervalos de conanza de cada uno de los coecientes, el comando para esto es:

bootstrap _b, reps(500): reg tepsi_t_s peso100 esc_madre wais* meses_lechem

76

Capitulo 3: Modelo de Regresin Lineal: Inferencia y Bondad de Ajuste

Microeconometra Aplicada
Centro de Microdatos

Cuadro 3.6
Intervalos de conanza mediante Bootstrap

77

Captulo 4
Modelo de Regresin Lineal:
Especicacin y Problemas
En el captulo anterior se revis el estimador de Mnimos Cuadrados Ordinarios
(MCO) en el contexto de un modelo de regresin simple (solo una variable explicativa) y un modelo de regresin mltiple (ms de una variable explicativa). Si
los supuestos del estimador MCO se cumplen, este es el mejor estimador lineal
insesgado. Tambin se abordaron los test de hiptesis lineal simple y conjunto, y
los intervalos de conanza tanto de los parmetros. En ambos casos, tanto para
realizar inferencias como para computar los intervalos de conanza, el supuesto
de normalidad del trmino de error es fundamental. Si este supuesto no se cumple, la inferencia realizada no es vlida. En este caso, se deben utilizar mtodos
de simulaciones para obtener los intervalos de conanza correctos y realizar la
inferencia en forma apropiada.
Para que el estimador MCO sea el mejor estimador lineal insesgado se requieren de los siguientes supuestos:

1. El modelo de regresin el lineal


2. Los errores del modelo son independiente entre ellos
3. Los errores del modelo tienen media cero
4. Los errores del modelo tienen varianza constante
5. Las variables explicativas son exgenas, o no estn correlacionadas con el
error del modelo

78

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Microeconometra Aplicada
Centro de Microdatos

6. El modelo debe estar especicado de manera correcta

El primer supuesto habla de que la relacin estimada entre la variable dependiente y la variable explicativas ser lineal, sin embargo, para capturar relaciones no
lineales entre la variable dependiente y las variables explicativas se pueden utilizar
como variables explicativas transformaciones no lineales, por ejemplo, potencias,
logaritmo, etc.
Los supuestos 2, 3 y 4 se traducen en que:

iid

ui (0, 2 )
Los errores del modelo son independiente e idnticamente distribuidos con media
cero y varianza constante. El supuesto de homocedasticidad del trmino de error,
es un supuesto que raramente se cumple cuando se trabaja con datos de corte
transversal. La ruptura de este supuesto no genera problema de sesgo, pero si de
ineciencia. Veremos cmo detectar y abordar el problema de heterocedasticidad
(varianza del error no es constante).
El supuesto 5 es clave para la identicacin del modelo, si las variables explicativas son endgenas, es decir, estn correlacionadas con el error, el efecto marginal
de la variable explicativa sobre la variable dependiente se estima de manera sesgada.
El ltimo supuesto enunciado habla de que el modelo debe estar especicado
de manera correcta, esto signica que debemos hacer todos los esfuerzos (considerando la disponibilidad de datos) para incorporar todas las variables relevantes
para explicar el comportamiento de la variable de inters (variable dependiente), y de la mejor forma posible. Algunas de las variables claves para explicar el
comportamiento de la variable dependiente pueden ser discretas, no continuas;
estas generalmente son variables de carcter cualitativo: gnero, zona geogrca,
estatus laboral, etc. Es importante incorporar la informacin que aportan estas
variables en forma correcta en la especicacin para obtener una estimacin adecuada de los impactos. En el caso de no tener acceso a algunas variables, las
variables quedaran como variables relevantes omitidas, cuando una variable es
omitida esta forma parte del trmino de error. Si la variable omitida tiene correlacin con una o ms de las variables explicativas del modelo, la estimacin
MCO ser sesgada ya que se rompe el supuesto de exogeneidad de las variables
explicativas.
Por otra parte, con el objetivo de evitar el problema de omisin de variables,

79

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Microeconometra Aplicada
Centro de Microdatos

se pueden incluir variables irrelevantes. En este caso no se genera sesgo en la


estimacin MCO, pero se pierde eciencia (el estimador tiene mayor varianza, es
menos preciso). Un tipo de variable omitida son aquellas que ayudan a explicar
un comportamiento no lineal de la variable dependiente, en estos casos las variables omitidas son potencias de las mismas variables explicativas ya incluidas en
el modelo.
Otros supuesto, para la correcta especicacin del modelo, es que las variables
explicativas no sean colineales entre ellas. Es decir, se deben incluir variables
explicativas que no sean muy parecidas o que no expliquen de igual forma el comportamiento de la variable dependiente. Cuando las variables explicativas son
muy parecidas, se habla del problema de multicolinealidad. Este problema, se
detecta por sntomas que se observan en la estimacin. No genera sesgo en la
estimacin, pero el problema es que la estimacin es muy voltil, poco robusta.
Por ltimo, una vez incorporadas todas las variables relevantes de la mejor forma,
en forma binaria o considerando no linealidades, y habiendo detectado y abordado los problemas de multicolinealidad o heterocedasticidad presentes, es posible
tener ms de un modelo que explique el comportamiento de la variable de inters
y que cumple con todos los requisitos de especicacin. Entonces, con cul de
los modelos quedarse?. Existen test de modelos anidados y no anidados que lo
ayudarn a tomar la decisin en estos casos.

4.1.

Omisin de Variables Relevantes

Supongamos que la especicacin correcta del modelo es la siguiente:

lnyphi = 0 + 1 esci + 2 expi + vi


Sin embargo, el modelo estimado es el siguiente:

lnyphi = 0 + 1 esci + ui
es decir, se ha omitido la variable correspondiente a la experiencia laboral (exp),
por lo cual el error del modelo estimado es el siguiente:

ui = vi + 2 expi
Entonces, en el modelo estimado se genera un problema de endogeneidad entre
la variable explicativa (esc) y el error (u) siempre que la variable correspondiente
a los aos de escolaridad esta correlacionada con la variable relevante omitida,

80

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Microeconometra Aplicada
Centro de Microdatos

experiencia.
Este problema de endogeneidad hace que el coeciente estimado por MCO para
la variable escolaridad sea sesgado e inconsistente:

E[1 |esc] = 1 +

cov(esc, exp)
2
V (esc)
|
{z
}
sesgo

As, podemos notar que el sesgo por omisin de variable relevantes ser distinto
de cero en la medida que la variable omitida este correlacionada con las variables incluidas en el modelo. El signo de sesgo depende de la correlacin entre la
variable omitida e incluida, y el signo esperado para el coeciente de la variable
omitida en el modelo.
Veamos el siguiente ejemplo, el Cuadro 4.1 muestra la estimacin de un modelo
para el logaritmo de salario por hora (lyph) en funcin de los aos de escolaridad
y la experiencia laboral a partir una muestra de 4,740 personas entrevistadas en
la Encuesta de Proteccin Social (EPS), que en el ao 2004 tenan entre 18 y
41 aos y se encontraban trabajando. Se tomo este universo de personas ya que
en la encuesta se pregunta por la historia laboral de las personas desde 1980. De
esta forma, las personas mayores de 41 aos en el ao 2004 reportan una historia
laboral censurada, la cual no nos permite obtener una medida apropiada de los
aos trabajados.

Cuadro 4.1
Estimacin Logaritmo Salarios

Ahora suponga que por error la variable experiencia es omitida del modelo, el
Cuadro 4.2 muestra la estimacin del modelo con la variable omitida.

81

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Microeconometra Aplicada
Centro de Microdatos

Cuadro 4.2
Estimacin Logaritmo Salarios omitiendo experiencia

Podemos ver que el coeciente estimador para el retorno a la educacin en el


modelo que omite experiencia es 10.6 % menor al coeciente en el modelo que no
omite esta variable. Es decir, omitir la variable relevante experiencia genera un
sesgo negativo en el retorno a la educacin. El sesgo negativo se debe a que existe
una correlacin negativa entre los aos de escolaridad y experiencia, tal como lo
muestra el cuadro 4.3, y el coeciente de experiencia sobre logaritmo del salario
es positivo.

Cuadro 4.3
Correlacin entre escolaridad y experiencia

En resumen, el problema de omisin de variables relevantes genera sesgo en la estimacin MCO pero no problemas de eciencia, por el contrario el error estndar
es menor dado que se estn estimando menos coecientes en el modelo. No existe
un test para detectar la omisin de variables relevantes, es algo que el investigador debe tener presente de acuerdo a su conocimiento sobre la especicacin del
modelo.

82

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

4.2.

Microeconometra Aplicada
Centro de Microdatos

Inclusin de Variables Irrelevantes

Con el objetivo de eliminar el potencial problema de omisin de variables relevantes, siempre existe la tentacin de incluir la mayor cantidad de variables
explicativas posibles. Esto nos puede llevar a incluir variables irrelevantes.
La inclusin de variables irrelevantes no genera problemas de sesgo en la estimacin, ya que el error sigue teniendo media cero y no est correlacionado con
las variables explicativas del modelo. Sin embargo, incluir variables irrelevantes
genera un problema de ineciencia, la varianza del estimador ser mayor, provocando que la estimacin sean menos precisa.

4.3.

Multicolinealidad

El problema de multicolinealidad surge cuando se incluyen variables explicativas


similares. Una de las dos variables es irrelevante, ya que no aporta informacin
adicional con respecto a la otra.
Algunas fuentes de la multicolinealidad son:

El mtodo de recoleccin de informacin empleado


Restriccin de la poblacin objeto de muestreo
Especicacin del modelo

La multicolinealidad, al igual que la inclusin de variables relevantes, genera problemas de eciencia. La estimacin MCO en presencia de variables colineales es
imprecisa o ineciente, pero sigue siendo insesgada.
El problema de multicolinealidad es fcil de detectar, pero no tiene ms solucin que eliminar la variable que no esta aportando informacin distinta de las
otras.
Sntomas de la estimacin en presencia de multicolinealidad:

2
1. El modelo tiene un ajuste bueno (R alto), pero los parmetros resultan ser
estadsticamente no signicativos.

83

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Microeconometra Aplicada
Centro de Microdatos

2. Pequeos cambios en los datos producen importantes cambios en las estimaciones.


3. Los coecientes pueden tener signos opuestos a los esperados o una magnitud poco creble.

Cuando existe multicolinealidad perfecta STATA automticamente borra una de


las dos variables.
El comando

estat vif

(post estimacin) reporta el factor de inacin de va-

rianza (VIF) de cada variable explicativa del modelo, y el promedio del modelo.
Este factor mide el grado en que la varianza del coeciente estimado para la variable ha sido inada, como producto de que esta variable no es ortogonal (no es
independiente) de las restantes variables del modelo.

V IFk =

1
1 Rk2

2
representa el coeciente de determinacin (R ) de la regresin de la
2
variable explicativa k sobre las restantes variables explicativas del modelo. Si Rk
es grande signica que el comportamiento de la variable independiente k se pue-

donde

Rk2

de explicar en gran medida con el comportamiento de las restantes variables de


modelo, con lo cual esta variable no entrega informacin diferente a la que estn
entregando las restantes variables del modelo. La regla sobre este factor, es que
existe multicolinealidad si el VIF es mayor a 10.
Volvamos al modelo donde el logaritmo del salario por hora es estimado en funcin de los aos de escolaridad y la experiencia, pero adems se le incorporan
2
tres variables explicativas: el ndice de masa corporal (peso/estatura ), estatura
y peso. Estas variables busca determinar si las caractersticas fsicas de la persona tienen inuencia sobre el salario por hora, dado un nivel de escolaridad y
experiencia constante.
El Cuadro 4.4 muestra el modelo estimado. Luego de la estimacin podemos
obtener el factor de inacin de varianza de cada una de las variables incluidas
en la especicacin, el que se obtiene haciendo una regresin de cada variable explicativa contra las restantes. Se reporta un VIF para cada variable, y el promedio
de ellos, los resultados de aplicar el comando

estat vif

luego de la estimacin

del modelo se muestran en el Cuadro 4.5. Podemos notar que las variables explicativas incorporadas al modelo tienen problema de multicolinealidad, lo que es
natural ya que el ndice de masa corporal es calculado en funcin de las variables
peso y estatura.

84

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Microeconometra Aplicada
Centro de Microdatos

Cuadro 4.4
Estimacin Logaritmo Salarios

Cuadro 4.5
Factor de Inacin de la Varianza

De los anterior se concluye que a pesar de que las variables resultan ser medianamente signicativas (al 10 %), estn no pueden ser incluidas en forma conjunta en
la especicacin, ya que generan multicolinealidad. La escolaridad y experiencia,
no tienen problema de colinealidad, un muy bajo porcentaje de su comportamiento se explica por el de las restantes variables explicativas, un 6 % aproximadamente. Luego, la nica solucin es eliminar alguna(s) de la(s) variable(s) que generan
multicolinealidad, a continuacin se estiman diferentes versiones del modelo y en
el Cuadro 4.6 se muestra la comparacin de ellos:

reg lyph esc04 experiencia [pw=factor]


estimates store modelo1
reg lyph esc04 experiencia imc [pw=factor]
85

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Microeconometra Aplicada
Centro de Microdatos

estimates store modelo2


reg lyph esc04 experiencia estatura [pw=factor]
estimates store modelo3
reg lyph esc04 experiencia peso [pw=factor]
estimates store modelo4
reg lyph esc04 experiencia estatura peso [pw=factor]
estimates store modelo5
estimates table modelo1 modelo2 modelo3 modelo4 modelo5,
stat(r2_a, rmse) b(%7.3g) p(%4.3f)

Cuadro 4.6
Comparacin de Modelos

De acuerdo a la informacin presentada en el Cuadro 4.6 deberamos quedarnos


2
con el modelo que slo incluye la estatura, ya que tiene el mayor R ajustado y
menor error cuadrtico medio.

4.4.

Variables Categricas o Cualitativas como Regresores

En gran parte de los modelos de regresin lineal las variables cualitativas son
fundamentales para una correcta especicacin. Hasta ahora hemos visto la incorporacin de una o ms variables explicativas, esencialmente cuantitativas y

86

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Microeconometra Aplicada
Centro de Microdatos

continuas.
Las variables cualitativas indican la presencia o ausencia de cierta cualidad, pueden tener dos o ms categoras. Para la incorporacin de variables cualitativas en
el modelo de regresin esto siempre se debe hacer en forma de variable Dummy.
Las variables Dummies (cticias, dicotmicas, etc.) toman slo valores 1 y 0, donde 1 indica la presencia de cierta caracterstica y 0 que la caracterstica no esta
presente.
Por ejemplo, en la base de datos contamos con la variable gnero:

Cuadro 4.7
Variable Categrica Gnero

Esta variable toma valor 1 cuando la persona es hombre y 2 cuando es mujer. La


variable as denida no es una variable Dummy, la inclusin de la variable genero
en el modelo, denida de esta forma, es incorrecta.
Debemos redenir la variable para que la cualidad Hombre o, indistintamente,
la cualidad Mujer tome el valor 1 y los restantes cero. De esta forma, se pueden
denir dos variables dummies, pero una de ellas es redundante. En trminos generales, si una variable tiene

n categoras debo denir al menos n 1 dummies para

ser incluidas en el modelo, una de ellas debe ser excluida la cul es denominada
categora base.
Siguiendo con el ejemplo de la variable gnero podemos denir una dummy de la
siguiente forma:

87

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Microeconometra Aplicada
Centro de Microdatos

g sexo=1 if genero==1
replace sexo=0 if genero==2
Pero podra haber denido de la variable de esta otra forma:

g sexo_2=1 if genero==2
replace sexo_2=0 if genero==1
Supongamos que el modelo del logaritmo del salario por hora adems de incorporar los aos de escolaridad y experiencia, queremos incorporar la cualidad gnero
en la regresin. Como la cualidad gnero puede tomar dos valores posibles, slo
una dummy (correspondiente a una de estas cualidades) debe ser incorporada en
el modelo. Suponga que estimamos el siguiente modelo:

lnyph = 1 + 2 esc + 3 experiencia + 4 sexo + u


Segn el modelo planteado, el valor esperado del logaritmo del salario por hora
para un hombre es:

E[lnyph|hombre, esc, experiencia] = 1 + 2 esc + 3 experiencia + 4


Y el valor esperado del logaritmo del salario por hora para una mujer es:

E[lnyph|mujer, esc, experiencia] = 1 + 2 esc + 3 experiencia


De esta forma, todo lo dems constante la diferencia en salario promedio de ser
hombre versus mujer es:

E[lnyph|hombre, esc, experiencia] E[lnyph|mujer, esc, experiencia] = 4


El Cuadro 4.8 muestra la estimacin del modelo plantado con los datos de la EPS
2004. El resultado nos muestra que dado un nivel de escolaridad y un nivel de
experiencia los hombres tienen un salario por hora que en promedio es 17.5 %
superior al salario promedio de las mujeres.
Se podra haber estimado el mismo modelo incluyendo la dummy correspondiente a mujer (sexo_2), el resultado se muestra en el Cuadro 4.9 obteniendo
exactamente el mismo resultado, en promedio las mujeres tienen un salario por
hora 17.5 % inferior al de los hombres.

88

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Microeconometra Aplicada
Centro de Microdatos

Cuadro 4.8
Estimacin Logaritmo Salario por Hora incluyendo dummy Hombre

Cuadro 4.9
Estimacin Logaritmo Salario por Hora incluyendo dummy Mujer

Notemos que la interpretacin del coeciente depende de cul sea la categora


base, en la primera regresin donde se incluye la dummy correspondiente a la
categora hombre, la categora base es mujer, por lo cual el coeciente que acompaa a la dummy hombre se interpreta como el efecto marginal sobre la variable
dependiente de pasar de ser mujer (categora base) a ser hombre.
Una vez estimado el modelo podemos gracar la relacin entre el logaritmo del
salario por hora y escolaridad estimada segn el modelo, separando entre hombres
y mujeres:

89

Microeconometra Aplicada
Centro de Microdatos

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

sum experiencia if e(sample)


scalar mexp=r(mean)
g pred_mujer=_b[_cons]+_b[esc04]*esc04+_b[experiencia]*mexp
g pred_hombre=_b[_cons]+_b[esc04]*esc04+_b[experiencia]*mexp+_b[sexo]
twoway (connected pred_hombre esc04 if sexo==1, msize(small)),
title(Relacin entre escolaridad y valor predicho del salario por hora)
subtitle(Diferencias por gnero) ||
(connected pred_mujer esc04 if sexo==0, msize(small))

Grco 4.1
Relacin entre escolaridad y valor predicho del salario por hora

5.5

6.5

7.5

Diferencias por gnero

10
esc04

15

pred_hombre

20

pred_mujer

Supongamos otro ejemplo donde el logaritmo del salario por hora se estima en
funcin de los aos de escolaridad, experiencia, y se quiere introducir la categora
ocupacional del trabajador, para esto se dispone de una variable con tres categoras: independiente, dependiente sin contrato, y dependiente con contrato. Como
la variable tiene tres categoras, se deben denir dos variables dummies que sern
introducidas en el modelo las cuales se interpretaran en funcin de la categora
base. Se pueden denir las siguientes dummies:

{
DC =

1
0

Dependiente con contrato


sino

{
DSC =
90

1
0

Dependiente sin contrato


sino

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Microeconometra Aplicada
Centro de Microdatos

De esta forma, la categora base son los cuenta propia. As, el modelo estimado
sera el siguiente:

lyph = 1 + 2 esc + 3 experiencia + 4 DC + 5 DSC + u


El coeciente

corresponde a la diferencia en el valor esperado del logaritmo del

salario por hora entre los dependientes con contrato y los trabajadores por cuenta
propia, y el coeciente

a la diferencia entre los dependientes sin contrato y los

trabajadores por cuenta propia, esto se puede notar al tomar valor esperado del
modelo condicional en las tres categoras de la variable explicativa:

E[lyph|cuentapropia, esc, experiencia] = 1 + 2 esc + 3 experiencia


E[lyph|dependienteconcontrato, esc, experiencia] = 1 + 2 esc + 3 experiencia + 4
E[lyph|dependientesincontrato, esc, experiencia] = 1 + 2 esc + 3 experiencia + 5

Por otra parte, las variables dummies tambin pueden ser interactuadas con
variables continuas, esta interaccin permite estimar un efecto marginal de la
variable explicativa continua sobre la variable dependiente diferente para la categoras de la variable dummy. Por ejemplo, podramos estimar el siguiente modelo
para obtener una estimacin del retorno a la educacin diferenciado entre hombres
y mujeres:

lyph = 1 + 2 esc + 3 experiencia + 4 sexo + 5 sexo esc


En este modelo el salario esperado para los hombres es:

E[lyph|hombre, esc, experiencia] = 1 + 4 + (2 + 5 ) esc + 3 experiencia


En este modelo el salario esperado para las mujeres es:

E[lyph|mujer, esc, experiencia] = 1 + 2 esc + 3 experiencia


Notemos que existe una diferencia en intercepto, pero tambin existe una diferencia el el efecto marginal de los aos de escolaridad sobre el logaritmo del salario
por hora, es decir, en el retorno a la educacin.
El retorno a la educacin para los hombres segn el modelo es:

E[lyph|hombre, esc, experiencia]


= 2 + 5
esc
El retorno a la educacin para las mujeres segn el modelo es:

E[lyph|mujer, esc, experiencia]


= 2
esc
91

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

As, en este modelo

Microeconometra Aplicada
Centro de Microdatos

(coeciente que acompaa a la variable escolaridad sin

interaccin) corresponde al retorno a la educacin de las mujeres (categora base)


y

corresponde a la

diferencia en retorno a la educacin de los hombres con

respecto a las mujeres.


El Cuadro 4.10 se muestra la estimacin del modelo con retornos a la educacin
diferenciados entre hombres y mujeres, primero debemos generar la variables interactuada:

g sexo_esc=sexo*esc04

Cuadro 4.10
Estimacin Retorno a la Educacin diferenciado por gnero

La estimacin del modelo nos muestra que el retorno a la educacin de las mujeres es 12.9 % y el de los hombres 2.13 % menor. A partir del modelo estimado
podemos gracar la relacin entre logaritmo del salario por hora y escolaridad
manteniendo constante el nivel de experiencia y separando por gnero:

g pred_hombre2=_b[_cons]+(_b[esc04]+_b[sexo_esc])*esc04+_b[experiencia]*mexp+_b[sexo]
g pred_mujer2=_b[_cons]+_b[esc04]*esc04+_b[experiencia]*mexp
twoway (connected pred_hombre2 esc04 if sexo==1, msize(small)),
title(Relacin entre escolaridad y valor predicho del salario por hora)
subtitle(Diferencias por gnero)
|| (connected pred_mujer2 esc04 if sexo==0, msize(small))

92

Microeconometra Aplicada
Centro de Microdatos

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Grco 4.2
Relacin entre escolaridad y valor predicho del salario por hora

Diferencias por gnero

10
esc04
pred_hombre2

15

20

pred_mujer2

Es importante aclarar que al incluir una variable continua interactuada con una
variable dummy se deben incluir siempre las variables involucradas sin interactuar.
EL Cuadro 4.11 muestra la comparacin del modelo de retornos a la educacin
sin controlar poe gnero, el modelo controlando por un efecto nivel en gnero, y
el modelo controlando por un efecto nivel y retorno a la educacin diferenciado
por gnero. Este cuadro se obtiene a travs de los siguientes comandos:

reg lyph esc experiencia sexo [pw=factor]


estimates store modelo6
reg lyph esc experiencia sexo sexo_esc [pw=factor]
estimates store modelo7
estimates table modelo1 modelo6 modelo7, stat(r2_a, rmse) b(%7.3g) p(%4.3f)

93

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Microeconometra Aplicada
Centro de Microdatos

Cuadro 4.11
Estimacin Retorno a la Educacin diferenciado por gnero

Las variables dummies tambin nos permiten estimar efectos umbrales, por ejemplo, en el caso de educacin puede ser ms interesantes ver el efecto sobre salarios
de completar cada nivel educacional que un efecto promedio por cada ao de
escolaridad adicional. Para esto primero denamos una variable categrica con el
nivel educacional logrado por cada persona:

g nivel=1 if esc04<8
replace nivel=2 if esc04>=8 & esc04<12
replace nivel=3 if esc04>=12 & esc04<17
replace nivel=4 if esc04>=17
label define nivellbl 1 ``Ninguna'' 2 ``Bsica Completa''
3 ``Media Completa'' 4 ``Universitaria Completa''
label values nivel nivellbl
La variable

nivel

recin creada tiene 4 categoras de nivel educacional, por lo

cul a partir de ella se pueden generar 4 variables dummies, una para cada nivel
educacional pero una de ellas debe ser excluida del modelo la que ser la categora
base y la interpretacin de los coecientes que acompaan a las dummies inclui-

tabulate de
generate generan automticamente las variables dummies:

das en el modelo ser en funcin de esta categora base. El comando


STATA con la opcin

tab nivel, generate(DE_)

94

Microeconometra Aplicada
Centro de Microdatos

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Este comando genera automticamente 4 variables binarias denidas de la siguiente forma:

DE _1 =
{
DE _3 =

1
0

1
0

si nivel=ninguna
sino

{
DE _2 =
{

si nivel=Media

DE _4 =

sino

1
0

1
0

si nivel=Bsica
sino

si nivel=Universitaria
sino

As, para estimar el efecto umbral sobre salarios se debe estimar el siguiente
modelo:

lyph = 1 + 2 experiencia + 3 sexo + 4 DE _2 + 5 DE _3 + 6 DE _4 + u


El Cuadro 4.12 muestra la estimacin de este modelo, se obtiene que completar la
educacin bsica aumenta en promedio 17 % el salario, completar educacin media
versus no tener educacin incrementa el salario en 58.2 %, y completar educacin
universitaria versus no tener educacin incrementa el salario en promedio un
150,7 %. La diferencia entre

corresponde al retorno de tener educacin

media completa versus bsica completa, y la diferencia entre

corresponde

al retorno de tener educacin media completa versus educacin media completa.

Cuadro 4.12
Estimacin Efectos Umbrales Educacin sobre Salarios

Esta misma estimacin se puede utilizar a travs del siguiente comando que crea
automticamente las variables dummies en la regresin:

95

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Microeconometra Aplicada
Centro de Microdatos

Cuadro 4.13
Estimacin Efectos Umbrales Educacin sobre Salarios

Una vez estimado el modelo podemos gracar la relacin entre escolaridad y salarios de acuerdo al modelo estimado, para esto debemos generar las siguientes
variables con la prediccin del modelo:

sum experiencia if e(sample)


scalar mexp=r(mean)
g pred_ningunaH=_b[_cons]+_b[experiencia]*mexp+_b[sexo]
g pred_ningunaM=_b[_cons]+_b[experiencia]*mexp
g pred_basicaH=_b[_cons]+_b[experiencia]*mexp+_b[sexo]+_b[DE_2]
g pred_basicaM=_b[_cons]+_b[experiencia]*mexp+_b[DE_2]
g pred_mediaH=_b[_cons]+_b[experiencia]*mexp+_b[sexo]+_b[DE_3]
g pred_mediaM=_b[_cons]+_b[experiencia]*mexp+_b[DE_3]
g pred_univH=_b[_cons]+_b[experiencia]*mexp+_b[sexo]+_b[DE_4]
g pred_univM=_b[_cons]+_b[experiencia]*mexp+_b[DE_4]
twoway (connected pred_ningunaH esc04 if sexo==1 & nivel==1, msize(small)),
title(Relacin entre escolaridad y valor predicho del salario por hora)
subtitle(Efectos Umbrales Hombres) ||
(connected pred_basicaH esc04 if sexo==1 & nivel==2, msize(small)) ||
(connected pred_mediaH esc04 if sexo==1 & nivel==3, msize(small)) ||
(connected pred_univH esc04 if sexo==1 & nivel==4, msize(small))

96

Microeconometra Aplicada
Centro de Microdatos

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

El Grco 4.3 muestra el resultado para los hombres y el grco 4.4 para las
mujeres.

Grco 4.3
Relacin entre escolaridad y valor predicho del salario por hora

6.5

7.5

Efectos Umbrales Hombres

10
esc04
pred_ningunaH
pred_mediaH

15

20

pred_basicaH
pred_univH

Grco 4.4
Relacin entre escolaridad y valor predicho del salario por hora

6.5

7.5

Efectos Umbrales Mujeres

10
esc04
pred_ningunaM
pred_mediaM

15

20

pred_basicaM
pred_univM

El modelo anterior tiene como hiptesis que slo entrega retorno, en trminos de
salario por hora, completar los diferentes niveles educacionales, pero que al inte-

97

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Microeconometra Aplicada
Centro de Microdatos

rior de cada nivel avanzar en aos de escolaridad no signica un retorno adicional.


Para poder estimar retornos a la educacin diferenciados entre los niveles educacionales se deben interactuar las dummies de nivel educacional con la variable
aos de escolaridad. Para esto primero generamos las variables con las interacciones entre las dummies de nivel educacional y la variable de aos de escolaridad,
recuerde que en el modelo se deben incluir adems las variables sin interactuar:

g DE2_esc=DE_2*esc04
g DE3_esc=DE_3*esc04
g DE4_esc=DE_4*esc04
El Cuadro 4.14 muestra la estimacin de este modelo, y el Grco 4.5 la relacin estimada entre aos de escolaridad y logaritmo del salario por hora para
los hombres.

Cuadro 4.14
Estimacin retorno a la educacin diferenciado por nivel educacional

La estimacin del modelo nos muestra que el retorno a los aos de escolaridad
para las personas con un nivel educacin inferior a bsica completa es 3.6 %, el retorno a la educacin para las personas con educacin bsica completa pero media
incompleta es un 10 % (3.6 % +6.4 %), el retorno a la educacin para las personas
con educacin media completa pero sin educacin superior completa es 18.4 %

98

Microeconometra Aplicada
Centro de Microdatos

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

(3.6 %+14.8 %), y el retorno a la educacin de las personas de las personas con
educacin universitaria completa es 19.5 % (3.6 %+15.9 %).
Para obtener el grco con la relacin entre escolaridad y logaritmo del salario por hora estimada segn el modelo se deben ejecutar los siguientes comandos:

g pred_ningunaH_esc=_b[_cons]+_b[experiencia]*mexp+_b[sexo]+_b[esc]
g pred_basicaH_esc=_b[_cons]+_b[experiencia]*mexp+_b[sexo]+_b[esc04]*esc04
+_b[DE_2]+_b[DE2_esc]*esc04
g pred_mediaH_esc=_b[_cons]+_b[experiencia]*mexp+_b[sexo]+_b[esc04]*esc04
+_b[DE_3]+_b[DE3_esc]*esc04
g pred_univH_esc=_b[_cons]+_b[experiencia]*mexp+_b[sexo]+_b[esc04]*esc04
+_b[DE_4]+_b[DE4_esc]*esc04
twoway (connected pred_ningunaH_esc esc04 if sexo==1 & nivel==1, msize(small)),
title(Relacin entre escolaridad y valor predicho del salario por hora)
subtitle(Efectos Umbrales Hombres) ||
(connected pred_basicaH_esc esc04 if sexo==1 & nivel==2, msize(small)) ||
(connected pred_mediaH_esc esc04 if sexo==1 & nivel==3, msize(small)) ||
(connected pred_univH_esc esc04 if sexo==1 & nivel==4, msize(small))

Grco 4.5
Relacin entre escolaridad y valor predicho del salario por hora

Efectos Umbrales Hombres

10
esc04

pred_ningunaH_esc
pred_mediaH_esc

99

15
pred_basicaH_esc
pred_univH_esc

20

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

4.5.

Microeconometra Aplicada
Centro de Microdatos

Test de No Linealidades Omitidas

El estimador MCO asume que la relacin entre la variable dependiente y la(s)


variable(s) explicativa(s) es lineal. Sin embargo, en algunos casos esta relacin
es no lineal, y la estimacin lineal se comportar relativamente bien para ciertos
valores de las variables pero para otros no. La omisin de no linealidades genera
un problema de especicacin equivalente a la omisin variables relevantes, que se
puede solucionar incorporando potencias de las variables explicativas al modelo
de regresin lineal.
El comando post-estimacin

estat ovtest

computa el test RESET de omisin

de no linealidades. La idea de este test es bastante simple, el test RESET hace


una nueva regresin aumentada donde incluye los regresores originales y adems
potencias de los valores predichos a travs de la especicacin original:

Yi = X + 1 Yi2 + 2 Yi3 + 3 Yi4 +


La hiptesis nula es que no existen problemas de especicacin, es decir, que no
existen no linealidades omitidas. Para testear esta hiptesis se hace un test de
hiptesis conjunta de que todos los coecientes de las potencias del valor predicho
de la variable dependiente son cero. Si no se puede rechazar la hiptesis nula, los
coecientes asociados a las potencias incluidas en la especicacin aumentada
son iguales a cero. El Cuadro 4.15 muestra como obtener el test de no linealidad
omitidas para el modelo donde se incluyen la variable aos de escolaridad sin
distinguir entre los niveles educacionales, y el Cuadro 4.16 el test aplicado al
modelo que estima retornos a la educacin diferenciados por nivel educacional, en
el primer caso se rechaza la hiptesis nula de que el modelo no tiene no linealidades
omitidas, y en el segundo caso no se puede rechazar la hiptesis nula, es decir, la
incorporacin de la interaccin entre dummies y escolaridad permite capturar la
no linealidad.

100

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Cuadro 4.15
Test de No Linealidades Omitidas

101

Microeconometra Aplicada
Centro de Microdatos

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Microeconometra Aplicada
Centro de Microdatos

Cuadro 4.16
Test de No Linealidades Omitidas

4.6.

Heterocedasticidad

En datos de corte transversal el problema de heterocedasticidad es bastante comn. La heterocedasticidad se produce cuando la varianza del error diere para
distintos valores de la(s) variable(s) explicativa(s). Por ejemplo, para niveles bajos de escolaridad la varianza en el logaritmo del salario por hora es ms baja que
para niveles de escolaridad ms elevados.
La presencia de heterocedasticidad no genera problemas de sesgo en el estimador MCO, es decir, se sigue cumpliendo la propiedad de insesgamiento de este
estimador:

=
E[]

102

Microeconometra Aplicada
Centro de Microdatos

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Grco 4.6

Logaritmo salario por hora


4
6
8

10

Relacin entre salarios y aos de escolaridad

10
Aos de escolaridad
lyph

15

20

Fitted values

Pero, al tener los errores una varianza no constante, la matriz de varianzas y


covarianzas del estimar MCO deja de ser la mnima o la ms eciente. La varianza de los coecientes estimados es mayor, por lo cual toda inferencia basada
en la varianza MCO es incorrecta, los estadsticos t se estn computando con
una varianza menor a la que se debera, por lo tanto son mayores y existe mayor
probabilidad de rechazar la hiptesis nula cuando esta no debera ser rechazada.
Es decir, la signicancia de los parmetros se puede ver afectada, mostrando signicancia cuando en realidad no la hay.
Para solucionar el problema de heterocedasticidad se debe conocer el patrn de
heterocedasticidad o que variables generan el problema, ya que el estimar MCG
o MCF tienen como espritu quitar la heterocedasticidad de las variables explicativas y dependiente, mediante una transformacin que consiste en dividir cada
observacin de la variable dependiente y las variables explicativas por la desviacin estndar del error asociado a esa observacin. Y luego aplicando MCO a este
modelo transformado se obtiene una estimacin insesgada y eciente que cumple
con la propiedad MELI (Mejor Estimador Lineal e Insesgado).

103

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Microeconometra Aplicada
Centro de Microdatos

La transformacin de las variables es la siguiente:

y1 x11
xk1
,
,...,
1 1
1
y2 x12
xk2
,
,...,
2 2
2
.
.
.
xkN

yN x1N
,
,...,
N N
N

Despus de realizar la estimacin del modelo en STATA el comando

estat hettest

permite testear la presencia de heterocedasticidad. La hiptesis nula de este test


es la homocedasticidad del error. Este comando computa el test de heterocedasticidad de Breusch-Pagan (BP) el que consiste en un test de Wald a la hiptesis
nula de que las variables explicativas del modelo original no son signicativas en
explicar el comportamiento del trmino de error estimado al cuadrado, para esto
se estima una regresin auxiliar del error estimado al cuadrado en funcin de las
variables explicativas originales del modelo. El Cuadro 4.17 muestra la aplicacin
de este test al modelo de retorno a la educacin.

Cuadro 4.17
Test de Heterocedasticidad

104

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Microeconometra Aplicada
Centro de Microdatos

De este test podemos concluir que se rechaza la hiptesis nula de homocedasticidad.


Para poder solucionar el problema y obtener una estimacin insesgada y eciente a travs de la metodologa de Mnimos Cuadrados Generalizados (MCG)
o Mnimos Cuadrados Factibles (MCF) es necesario conocer el patrn de Heterocedasticidad, es decir, conocer la verdadera matriz de varianzas y covarianzas
del trmino de error, conocer las desviaciones estndar de cada error para poder
realizar la transformacin. Esto en la prctica es poco probable.
La solucin ms sensata es la planteada por White, que consiste en quedarse
con la estimacin menos eciente pero insesgada de MCO, pero estimar el forma correcta la matriz de varianzas y covarianzas de los coecientes estimados,
de forma tal de que los test de hiptesis y la inferencia este realizada en forma
apropiada. Esto se hace en STATA simplemente introduciendo la opcin

robust

al comando regress.
A continuacin vemos las diferencias entre la estimacin del modelo de retorno
a la educacin sin corregir por heterocedasticidad y utilizando la opcin robust
que estima la matriz correcta de varianzas y covarianzas del estimador MCO en
presencia de heterocedasticidad:

reg lyph experiencia sexo esc


estimates store modelosr
reg lyph experiencia sexo esc, r
estimates store modelocr
estimates table modelosr modelocr, stat(r2_a, rmse) b(%7.3g) se(%7.4f)
El Cuadro 4.18 presenta la comparacin de ambos modelos, de la cual podemos
notar lo siguiente:

Los coecientes estimados son exactamente iguales.


La bondad de ajuste del modelo tampoco se ve afectada
Las varianzas estimadas de los coecientes son mayores en el modelo que
incorpora la presencia de heteroscedasticidad, conrmando lo que los test
estadsticos BP y White indicaban sobre la presencia de este problema.

En resumen, siempre utilice la opcin robust del comando regress de stata. Si


existe el problema de Heterocedasticidad, con esta opcin Ud. estar seguro de

105

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Microeconometra Aplicada
Centro de Microdatos

que los test estadsticos son correctos y as las conclusiones sobre la signicancia
de los parmetros. Si es que no hay Heterocedasticidad, obtendr exactamente
el mismo resultado que sin ocupar esta opcin, ya que sin Heterocedasticidad la
matriz de varianzas y covarianzas robusta (o de White), en este caso, sera la
misma que la del estimador MCO.

Cuadro 4.18
Estimacin Retorno a la Educacin Robusta

4.7.

Seleccin de Modelos

Al nal de da puede que ms de un modelo satisfaga todos los requerimientos


tericos y economtricos, pero Ud. deber escoger slo uno de estos modelos para
poder concluir, hacer predicciones y tomar decisiones de poltica.
Los modelos sobre los cuales tiene que elegir pueden estar anidados o no. Se
dice que dos modelos estn anidados cuando uno de ellos corresponde al anterior
imponiendo cierta restricciones sobre los parmetros.

4.7.1. Seleccin entre modelos anidados


Los criterios de informacin de Akaike (AIC) y Schwarz (BIC) son medidas consistentes para ver el mejor modelo. El mejor modelo es aquel que tiene menor
valor del criterio de informacin.

106

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Microeconometra Aplicada
Centro de Microdatos

Volvamos al modelo de retornos a la educacin diferenciados por nivel educacional, y suponga que queremos ver si este modelo es mejor que uno exactamente
igual pero incluyendo la variable estatura que en especicaciones anteriores haba resultado estadsticamente signicativa. El modelo ms grande (en cuanto a
variables incluidas) es el siguiente:

Cuadro 4.19
Estimacin Retorno a la Educacin por Nivel

Vemos que al aplicar el comando post-estimacin

estimates stats

luego de es-

timar el modelo, podemos obtener los criterios de informacin. Estos nmeros


por si mismos no tienen ninguna interpretacin ni relevancia slo sirven para
comparar dos o ms modelos anidados. El Cuadro 4.20 muestra la estimacin
del modelo anterior excluyendo la variable estatura y sus respectivos criterios de
informacin. El modelo con estatura tienen menor criterio de informacin por lo
cual este modelo es mejor para explicar el logaritmo del salario por hora.
Los criterios combinan el ajuste del modelo con lo parsimonioso del mismo, es
decir, dos modelos con igual poder explicativo pero uno con menos variables que

107

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Microeconometra Aplicada
Centro de Microdatos

el otro, el criterio nos va indicar que escojamos el modelo con menos variables.
Los criterios de informacin son medidas de seleccin de modelos ms consisten2
2
tes que el R y R ajustado, y entre los dos criterios el Bayesiando (BIC) es ms
consistente.

Cuadro 4.20
Estimacin Retorno a la Educacin por Nivel

4.7.2. Seleccin de modelos no anidados


Cuando estamos interesados en comparar modelos que son diferentes en cuanto a
las variables que incluyen, es decir, modelos que no estn anidados, no se pueden
utilizar los criterios de informacin. Suponga que estamos interesados en evaluar
cual de los siguientes dos modelos es mejor para explicar el comportamiento del
logaritmo del salario por hora:

lyph = 1 + 2 esc + 3 experiencia + 4 sexo + 5 sexo esc + u


lyph = 1 + 2 esc + 3 experiencia + 4 sexo + 5 DE _2 + 6 DE _3
+ 7 DE _4 + 8 DE _2 esc + 9 DE _3 esc + 10 DE _4 esc + u
108

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Microeconometra Aplicada
Centro de Microdatos

Cmo escogemos entre el modelo (1), que estima un retorno a la educacin diferenciado por sexo pero igual para todos los niveles educacionales, y el modelo
(2) que estima un retorno diferenciado por nivel educacional?
Davidson y MacKinnon (1981) propusieron el test J para poder seleccionar entre
modelos no anidados. Este test consiste denir uno de los modelos como aquel bajo la hiptesis nula y el otro como bajo la alternativa, se estiman ambos modelos
y se obtiene el valor predicho de la variable dependiente, luego el valor predicho
con el modelo de la hiptesis alternativa se incluye como variable explicativa del
modelo bajo la hiptesis nula, y se testea la signicancia estadstica de esta nueva
variable, si es estadsticamente signicativa se rechaza el modelo de la hiptesis
nula. Luego se invierten los modelos denidos bajo la hiptesis nula y se repite
el procedimiento. Se pueden dar cuatro soluciones:

1. Se rechaza el modelo (1) y no el modelo (2)


2. Se rechaza el modelo (2) y no el modelo (1)
3. Se rechazan ambos modelos
4. No se puede rechazar ninguno de los dos modelos

Slo en los primeros dos casos el test J nos permite concluir sobre el modelo que
debemos preferir.
El comando para realizar este test no viene en STATA pero puede ser instalado ejecutando el siguiente comando:

ssc install nnest.

La ejecucin de este

comando sobre los dos modelos anteriores se debe realizar de la siguiente forma:

reg lyph experiencia sexo esc DE_2-DE_4 DE2_esc- DE4_esc estatura [pw=factor]
nnest lyph esc04 experiencia estatura sexo sexo_esc
El comando nos entrega dos resultados, el del tes J de Davidson y MacKinnon y
el del test de Cox-Pearsan, que esa bastante similar. El resultado se presenta a
continuacin:

109

Capitulo 4: Modelo de Regresin Lineal: Especicacin y Problemas

Microeconometra Aplicada
Centro de Microdatos

Cuadro 4.21
Test J de modelos no anidados

En este caso el test no nos permite concluir sobre ninguno de los modelos.

110

Captulo 5
Estimador de Variables
Instrumentales
5.1.

Introduccin

Uno de los supuestos claves para que el estimador MCO sea insesgado es que
el trmino de error no debe estar correlacionado con las variables explicativas o
regresores del modelo:

cov(ui , Xi ) = 0
Existen tres situaciones en la que se puede invalidar este supuesto:

Omisin de variables relevantes


Simultaneidad o doble causalidad
Error de medicin

A pesar de que estos problemas son generados por diferentes razones, el problema es el mismo: endogeneidad; y la solucin se llama

Instrumentales (IV).

Estimador de Variables

Supongamos el siguiente modelo de regresin lineal simple:

y = x + u

111

Microeconometra Aplicada
Centro de Microdatos

Capitulo 5: Estimador de Variables Instrumentales

Donde por ejemplo,

mide el ingreso,

los aos de escolaridad, y

representa

x no est corretiene x sobre y , y el

el trmino de error del modelo. El estimador MCO asume que


lacionado con

u,

luego mide el nico efecto marginal que

estimador MCO es consistente.

Recordemos que el trmino de error captura todas las otras variables (no observables) que afectan los ingresos, en este ejemplo, una de estas variables es la
habilidad. Entonces, en la medida que exista correlacin entre habilidad ya aos
de escolaridad, el error del modelo no ser exgeno a la variable explicativa.

Luego, el estimador MCO de

ser inconsistente ya que combina el efecto directo

de aos de escolaridad sobe ingresos y el efecto indirecto de aos de escolaridad


sobe habilidad y luego sobe ingresos. En este caso la variable explicativa se dice
que es endgena.
Una solucin obvia al problema de endogeneidad es incluir variables explicativas
que controlen por la habilidad de la persona, esta metodologa se llama controlfunction. Pero muchas veces esas variables no estarn disponibles, en estos casos
el estimador de variables instrumentales ofrece una solucin para obtener un estimador consistente, este estimador tcnicamente muy fcil de implementar pero
conceptualmente es bastante complejo.
Para poder aplicar este mtodo se requiere de una variable adicional, denominada instrumento y que denotaremos por

z.

Esta variable tiene la caracterstica

de estar muy relacionada con la variable endgena (x), pero no est correlacionada
con el error.

112

Microeconometra Aplicada
Centro de Microdatos

Capitulo 5: Estimador de Variables Instrumentales

Para entender cmo funciona el estimador IV, pensemos que una de las variables
explicativas est compuesta por una parte que esta correlacionada con el error
(por cualquiera de las tres razones antes mencionadas), y otra parte que no est
correlacionada con el error. Si se tiene informacin suciente para aislar la segunda parte de la variable, luego nos podemos enfocar en como la variacin en
esta parte de la variable explicativa afecta la variacin de la variable dependiente. De esta forma, se elimina el sesgo en la estimacin MCO considerando slo
la parte de la variable explicativa que no est correlacionada con el error. Esto
es exactamente lo que hace el estimador de variables instrumentales. La informacin sobre los movimientos de la variable explicativa que no estn correlacionados
con el trmino de error se captura a travs de una o ms variables instrumentales.
En resumen, la regresin por variables instrumentales usa estas variables como
herramientas o instrumentos para aislar del comportamiento de la variable explicativa la parte no correlacionada con el trmino de error, lo que permite una
estimacin consistente de los coecientes de regresin.

5.2.

Simultaneidad

El estimador MCO asume que la causalidad es en un sentido, de la variable


explicativa a la variable dependiente. Pero la causalidad podra, en algunos casos,
tambin funcionar en ambos sentidos. Por ejemplo, generalmente en el modelo de
la ecuacin de Mincer se asume que la escolaridad afecta el nivel de ingresos, pero
la relacin entre estas variables tambin podra ser inversa, el nivel de ingresos
determina el nivel de educacin. Otro ejemplo es el relacionado con el tamao
de los cursos (o nmero de alumnos por profesor) y los resultados acadmicos
(prueba SIMCE), en general, se asume que la causalidad es en el sentido de que
cursos ms pequeos tienen mejores logros educacionales, pero se podra esperar
tambin una relacin inversa, mientras menores son los logros el gobierno entrega
mayores recursos y menor es el nmero de alumnos por profesor. En ambos casos
se dice que la variable explicativa, aos de escolaridad o nmero de alumnos por

113

Microeconometra Aplicada
Centro de Microdatos

Capitulo 5: Estimador de Variables Instrumentales

profesor, es endgena.

Yi = Xi + ui
Xi = Yi + vi
Veamos que sucede cuando hay simultaneidad de la variable explicativa. Supongamos que para un individuo cualquiera el trmino de error es negativo, es decir,
el valor puntual de la variable dependiente est por debajo del valor estimado, es
decir, un valor negativo de
si

ui

disminuye el valor de

Yi .

fuese negativo podemos ver que mientras menor es

En la segunda ecuacin

Yi

mayor es

cual podemos apreciar que existe una correlacin negativa entre

ui

Xi , con lo
Xi .De esta

forma, la simultaneidad en la variable explicativa rompe con el supuesto de no


correlacin entre el trmino de error y las variables explicativas.

5.3.

Error de Medicin

El error de medicin es un problema con la recoleccin de los datos, el error de


medicin slo genera problemas de sesgo e inconsistencia cuando las variables
explicativas estn medidas con error, cuando la variable dependiente es la que
esta medida con error no se genera problema de sesgo.
A continuacin podemos apreciar que cuando la variable explicativa esta medida con error, el trmino de error del modelo esta correlacionado con la variable
explicativa incluida (variable con error), lo que invalida, nuevamente, el supuesto
del estimador MCO sobre la no correlacin entre el error y las variables explicativas.
Supongamos que en el siguiente modelo no observamos la variable explicativa
Xi que debisemos, sino una que esta medida con error, que llamaremos Xi . De
esta forma:

Xi = Xi + i
donde

es el error de medicin.

El modelo verdadero que debera ser estimado es:

Yi = Xi + vi
Sin embargo, se estima el siguiente modelo:

Yi = Xi + ui
114

Microeconometra Aplicada
Centro de Microdatos

Capitulo 5: Estimador de Variables Instrumentales

donde

ui = vi i .

El modelo estimado no cumple con los supuestos MCO, ya que existe correlacin distinta de cero entre el trmino de error compuesto ui y la variable medida

con error Xi . El estimador MCO ser sesgado e inconsistente.

5.4.

Estimador de Variables Instrumentales

Supongamos el modelo bsico de la ecuacin de Mincer para estimar retornos a


la educacin:

lnyphi = 0 + 1 esci + ui
Si la correlacin entre el trmino de error y la variable aos de escolaridad es distinta de cero (por cualquiera de las tres razones antes mencionada), la estimacin
del retorno a la educacin ser sesgada e inconsistente.
La idea del estimador IV es buscar una variable

z,

denominada instrumento,

que permita aislar o separar la parte de los aos de escolaridad que esta correlacionada con el error de la que no est correlacionada con el error. Y luego utilizar
slo la parte de los aos de escolaridad no correlacionada con el error para estimar
correctamente el parmetro de inters a travs de MCO.
El instrumento debe satisfacer dos condiciones para que sea un instrumento vlido:

Condicin de relevancia:

cov(esci , zi ) = 0
Condicin de exogeneidad:

cov(ui , zi ) = 0
Si el instrumento es relevante, entonces la variacin del instrumento est relacionada con la variacin en la variable aos de escolaridad. Adicionalmente, si el
instrumento es exgeno, la parte de aos de escolaridad que est siendo capturada por el instrumento es justamente la parte exgena (o no correlacionada con
el error) de aos de escolaridad. De esta forma, un instrumento que es relevante

115

Microeconometra Aplicada
Centro de Microdatos

Capitulo 5: Estimador de Variables Instrumentales

y exgeno puede capturar el comportamiento de aos de escolaridad que es exgeno, y esto puede ser utilizando para estimar consistentemente el retorno a la
educacin.
En el modelo de regresin simple (una variable explicativa) con un instrumento,
se dice que el modelo est exactamente identicado, y el estimador de variables
instrumentales es:

V I

zi xi
=
zi yi

El que se obtiene de la condicin de momento

E[zu] = 0

en trminos muestrales:

zi (yi xi ) = 0

i=1
Notemos que el estimador de variables instrumentales puede ser escrito de la
siguiente manera:

V I

2
yz
zi xi
z
=
i2 =
zi y i
zi
xz

Por ejemplo, si un incremento en una unidad de

aumenta en 0.2 los aos de

escolaridad y en $300 el salario por hora, luego el estimador de variables instrumentales para el efecto de un ao ms de escolaridad sobre ingresos es $1500.

5.4.1. Estimador de Mnimos Cuadrados Ordinarios en dos


etapas
Cuando se dispone de ms instrumentos que variables explicativas endgenas
(sobreidenticado) se utiliza el estimador MCO2E, tal como su nombre sugiere,
es un estimador que consta de dos etapas. En la primera etapa se descompone
la variable que tiene el problema de endogeneidad en dos partes, la que no est
correlacionada con el trmino de error y la que esta correlacionada con el trmino
de error. De esta forma, la primera etapa consiste en hacer una regresin de la
variable con problemas, en este caso aos de escolaridad, con el instrumento:

Primera etapa:

esci = 0 + 1 zi + i
116

Microeconometra Aplicada
Centro de Microdatos

Capitulo 5: Estimador de Variables Instrumentales

Esta regresin permite hacer la descomposicin de la variable escolaridad


de la forma que necesitamos: una parte exgena
predicha por

zi ,

(0 + 1 zi), que es la parte

si el instrumento cumple la condicin de exogeneidad esta

prediccin ser justamente la parte exgena de la variable escolaridad, y otra


parte que esta correlacionada con el error y es la que genera el problema de
endogeneidad.
Segunda etapa: la segunda etapa consiste en estimar el modelo original,
pero en vez de utilizar la variable escolaridad con problema, se utiliza la
prediccin del modelo de la primera etapa, a la cual se le ha "quitado"la
parte que esta correlacionada con el trmino de error:

lnyphi = 0 + 1 esc
i + ui

5.5.

Ejemplos de Variables Instrumentales

5.5.1. Afecta la obligatoriedad de educacin a la escolaridad e ingresos?, Angrist y Krueger (1991)


El artculo publicado en el ao 1991 por Angrist y Krueger estima retornos a la
educacin a travs de variables instrumentales. Como se explico anteriormente,
la escolaridad e ingresos pueden tener un problema de endogeneidad. Adems
existe un problema potencial de omisin de variables relevante, habilidad, ambos
aspectos genera que la escolaridad en el modelo de regresin este correlacionada
con le trmino de error, lo que provoca sesgo e inconsistencia en el estimado MCO.
Este artculo explota la caracterstica de experimento natural de la fecha de nacimiento, y como esto determina los aos de escolaridad logrados, para estimar
correctamente el retorno a la educacin mediante variables instrumentales.
El instrumento utilizado en este caso para separar la parte de escolaridad exgena
de la endgena, consiste en el trimestre de nacimiento de la persona.
Por qu el trimestre de nacimiento se puede utilizar como instrumento de los
aos de escolaridad?
La ley educacional en EEUU obliga a los estudiantes a permanecer en el colegio hasta la edad de 16 aos, en el minuto que estos alumnos cumplen esta edad
pueden abandonar el colegio. Sin embargo, para ingresar al colegio deben tener

117

Microeconometra Aplicada
Centro de Microdatos

Capitulo 5: Estimador de Variables Instrumentales

los seis aos cumplidos al 1 de Enero del ao de ingreso al colegio.


De esta forma, si comparamos dos nios uno nacido el 15 de Diciembre y otro
el 15 de Enero del siguiente ao, a pesar de que la diferencia en edad es slo un
mes, el segundo de ellos deber esperar un ao completo para poder ingresar al
colegio, ingresando cuando tenga 7 aos de edad y no a los 6 aos de edad como
el primero de los nios. Sin embargo, la ley permite que ambos abandonen el
colegio a los 16 aos, si ambos decidieran abandonar el colegio a los 16 aos, el
primero tendr un ao de educacin ms que el segundo de ellos.
As, a priori, el trimestre de nacimiento es un instrumento que cumple con la
condicin de relevancia, y la condicin de exogeneidad, debido a que el cumpleaos es poco probable que este correlacionado con otros atributos personales que
puedan determinar el ingreso de la persona, slo tiene inuencia a travs de su
impacto en el nivel educacional logrado.
El modelo estimado por los autores tiene como variable dependiente el logaritmo del salario por hora, y como variables explicativas los aos de escolaridad,
dummy de raza, variable dummy de rea metropolitana, variable dummy si esta
casado, 9 dummies para ao de nacimiento, 8 dummies para regin de residencia,
49 dummies de estado, edad y edad al cuadrado.
La estimacin por MCO entrega un retorno a la educacin de 5.7 %. Cuando
se realiza la estimacin MCO2E, en la primera etapa se hace una regresin de los
aos de escolaridad (variable endgena) contra raza, rea, y todas las variables
explicativas incluidas en el modelo original distintas de la escolaridad, ms tres
dummies correspondientes al trimestre de nacimiento 1, 2 y 3, dummies que corresponden a los instrumentos de los aos de escolaridad. El retorno a la educacin
estimado por esta metodologa es de 3.9 %.

5.5.2. Using Geographic Variation in College Proximity to


Estimate the Return to Schooling, Card (1993)
Este artculo tiene como objetivo estimar el retorno a la educacin, sin embargo,
como ya mencionamos antes el nivel educacional y los ingresos presentan endogeneidad, el nivel educacional no es entregado aleatoriamente en la poblacin,
sino que depende de las decisiones tomadas sobre invertir o no en educacin,
las que dependen en parte del nivel de ingresos. De esta forma, para identicar
correctamente el impacto que tiene la escolaridad sobre los ingresos se requiere
una variacin exgena en los aos de escolaridad, es decir, requiere una variable

118

Microeconometra Aplicada
Centro de Microdatos

Capitulo 5: Estimador de Variables Instrumentales

instrumental que permita descomponer la escolaridad en la parte correlacionada con el trmino de error (endgena), y la parte no correlacionada con el error
(exgena). Este artculo utiliza como variable instrumental en la estimacin de
retornos a la educacin una variable la presencia de una universidad en el rea de
residencia de la persona. Los estudiantes que crecieron en reas donde no existen
universidades presentan mayores costos de educacin, ya que no tienen la posibilidad de seguir viviendo en sus casas. De esta forma, se espera que estos costos
reduzcan la inversin en educacin, al menos en las familias de menores ingresos.
En este artculo se estima la siguiente ecuacin de salarios por hora:

lnyphi = 0 + 1 esci + 2 expi + 3 exp2i + Xk k + ui


donde

Xk

incluye una serie de controles como: raza, rea geogrca, educacin

de los padres, y estructura familiar.


La estimacin por MCO del modelo anterior estima un retorno a la educacin de
7.3 %.
El estimador MCO2E utiliza como instrumento para la escolaridad una variable que indica que existe una universidad en el rea donde vive la persona. El
retorno a la educacin estimado en este caso es de 13.2 %.

5.5.3. Estimating the payo to schooling using the Vietnamera Daft lottery, Angrist y Krueger (1992)
Estos autores, nuevamente con el objetivo de estimar el retorno a la educacin en
forma correcta eliminando el problema de endogeneidad utilizan la metodologa
de variables instrumentales. Entre 1970 y 1973 la prioridad para servicio militar
fue seleccionada aleatoriamente mediante una lotera. Muchos de los hombres que
estimaban que podan ser seleccionados para el servicio militar se matricularon en
los colegios para evadir el servicio militar, generando un mayor nivel educacional.
Este artculo ocupa esta lotera como experimento natural para estimar el retorno
a la educacin.
El modelo estimado tiene como variable dependiente el logaritmo del salario por
hora y como variable explicativa la escolaridad ms un conjunto de regresores
como estatus de veterano, raza, cuidad metropolitana, estado civil, dummies de
ao de nacimiento, y dummies de regiones. La estimacin MCO de este modelo
entrega un valor estimado del retorno a la educacin de 5.9 %. Luego para solucionar el problema de endogeneidad de los aos de escolaridad, se estima primero

119

Microeconometra Aplicada
Centro de Microdatos

Capitulo 5: Estimador de Variables Instrumentales

un modelo de regresin entre los aos de escolaridad como variable dependiente,


y 130 dummies con la fecha de nacimiento para la lotera. Luego incorporando la
prediccin de escolaridad a partir de esta primera etapa, se obtiene un estimar
del retorno a la educacin de 6.5 %.

5.6.

Aplicacin I: Determinantes de los gastos mdicos

Para esta aplicacin se utilizarn los datos de Medical Expenditure Panel Survey
(MEPS), esta encuesta se realiza a individuos de 65 aos o ms. En particular se
estimar un modelo de regresin que tiene como variable dependiente el logaritmo
del gasto en medicinas recetadas (ldrugexp), y las variables explicativas son: una
variable binaria que toma valor 1 si el individuo tiene seguro mdico del empleador o sindicato (hi_empunion), nmero de enfermedades crnicas (totchr), edad

(age), dummy mujer (female), dummy hispano o negro (blhisp), y el logaritmo


natural del ingreso del hogar (linc).

El Cuadro 5.1 muestra las estadsticas descriptivas de estas variables:

Cuadro 5.1
Estadsticas Descriptivas Gastos Mdicos

El estimador MCO del modelo propuesto se presenta en el Cuadro 5.2, se obtiene


que las personas con seguro mdico gastan en promedio un 7.4 % ms en medicamentos, y que cada enfermedad crnica incrementa el gasto en medicamentos
en 44 %, ambas variables son signicativas al 1 %. Por otra parte se obtiene que
la edad tiene un efecto negativo pero signicativo solo al 10 %, las mujeres en
promedio gastan un 5.8 % ms que los hombres en medicamentos (signicativo al

120

Microeconometra Aplicada
Centro de Microdatos

Capitulo 5: Estimador de Variables Instrumentales

5 %), y ser de un grupo minoritario (hispano o negro) reduce el gasto promedio


en medicamentos en 15.1 %. El ingreso del hogar no tiene un efecto signicativo.

Cuadro 5.2
Estimador MCO Gastos Mdicos

Sin embargo, es probable que la variable explicativa que indica si la persona tiene
seguro de salud sea endgena ya que personas con mayor gasto esperado en salud
tienen mayor probabilidad de tomar un seguro.
En la base de datos existen cuatro potenciales instrumentos:

ssiratio:

corresponde al ratio entre el ingreso el ingreso del trabajo y el

ingreso total del individuo, mientras mayor es el valor mayor es la restriccin


de ingreso del individuo.

lowincome:

variable cualitativa que toma valor 1 si la persona es de bajos

ingresos.

firmsz:
multc:

nmero de empleados de la rma

indica que la rma tiene mltiples locaciones.

EL Cuadro 5.3 muestra la matriz de correlaciones con la variable explicativa endgena, los dos primeros instrumentos estn correlacionados de manera negativa
con tener seguro mdico, y los dos ltimos de manera positiva.

121

Microeconometra Aplicada
Centro de Microdatos

Capitulo 5: Estimador de Variables Instrumentales

Cuadro 5.3
Correlacin Variable Endgena e Instrumentos

El Cuadro 5.4 muestra el estimador de variables instrumentales (MCO2E) utilizando como nico instrumento para la nica variable endgena el ratio de ingresos (ssiratio), es decir, un modelo exactamente identicado. Se encuentra un
coeciente negativo y estadsticamente signicativo de la variable de seguro complementario de salud, indicando que las personas con seguro complementario tienen un gasto promedio en medicamentos 90 % menor a los que no tienen seguro
complementario en salud. El Cuadro 5.5 muestra la estimacin del modelo pero
adicionando el instrumento

multlc.

En este caso, se estima que las personas con

seguro complementario de salud tienen un gasto promedio en medicamentos 98 %


menor que las personas que no poseen de este seguro.
Para que el estimador de variables instrumentales sea vlido se deben cumplir
los dos supuestos de relevancia y exogeneidad del instrumento.
Para testear la exogeneidad de los instrumentos se realiza un test de sobreidenticacin del modelo, claramente no se puede testear la exogeneidad del instrumento
cuando el modelo est exactamente identicado.

122

Microeconometra Aplicada
Centro de Microdatos

Capitulo 5: Estimador de Variables Instrumentales

Cuadro 5.4
Estimador de Variables Instrumentales
Instrumento: ssiratio

123

Microeconometra Aplicada
Centro de Microdatos

Capitulo 5: Estimador de Variables Instrumentales

Cuadro 5.5
Estimador de Variables Instrumentales
Instrumento: ssiratio, multlc

Para realizar el Test de Exogeneidad se debe utilizar el comando post-estimacin


de STATA

estat overid.

La hiptesis nula de este test es que los instrumentos

son exgenos (o que se cumplen las restricciones de sobreindenticacin), en este


caso no se puede rechazar la hiptesis nula de que los instrumentos sean exgenos.
El Cuadro 5.6 muestra los resultados del test de exogeneidad para el modelo estimado, en este caso no se puede rechazar la hiptesis nula de que los instrumentos
son exgenos.

Cuadro 5.6
Test de Exogeneidad

Para testear la relevancia de los instrumentos Stock y Yogo (2005) proponen


utilizar el estadstico F de la signicancia conjunta de los instrumentos en la
primera etapa, los estadsticos de la primera etapa se obtienen de la siguiente
manera:

124

Microeconometra Aplicada
Centro de Microdatos

Capitulo 5: Estimador de Variables Instrumentales

Cuadro 5.7
Estadsticos Primera Etapa Variables Instrumentales

Se rechaza la hiptesis nula de que los instrumentos son dbiles.


De esta forma, el modelo estimado por variables instrumentales debera ser consistente ya que se han utilizado instrumentos correctos.
Una vez validado el estimador se puede testear si efectivamente la variable seguro
mdico es endgena, si la variable sugerida como endgena no resulta serlo es
mejor (consistente y eciente) el estimador de MCO por sobre el de VI. El test
de endogeneidad se realiza mediante el siguiente comando:

Cuadro 5.8
Test de Endogeneidad

La hiptesis nula es que la variable es exgena, por lo cual sera mejor el estimador
de MCO, en este caso se rechaza la hiptesis nula validando la utilizacin del
estimador de variables instrumentales por sobre el estimador MCO.

125

Captulo 6
Estimador Mximo Verosmil
Hasta el momento hemos adoptado el criterio de estimacin consistente con es,
coger los valores de los parmetros (
2 ) de modo de minimizar la suma de los
residuos al cuadrado. A continuacin, expondremos otra forma de obtener los
parmetros de inters, el cual, a diferencia de MCO, descansa en un determinado
supuesto respecto de la distribucin del trmino de error, teniendo por objetivo,
como veremos ms adelante, determinar los parmetros que maximicen la proba-

bilidad de ocurrencia de la muestra observada. La ventaja de MV es que puede


producir estimadores consistentes y asintticamente ecientes cuando MCO falla.
Sea Y'=[y1 ,

y2 , . . ., yn ]

un vector

n1

de valores muestrales para la variable

dependiente, los cuales dependen de un vector

f (y; )

k 1 '

= [1 ,

2 , . . ., k ].

Sea

la densidad conjunta asociada. A dicha probabilidad conjunta se le llama

funcin de Verosimilitud y se denota por

L(; y)

L():
f (y; )

Note que hemos invertido la notacin entre L y la densidad. Ello porque la densidad describe los valores probables de

dado un vector

determinado, sin

embargo, en nuestro caso el sentido es inverso: estamos interesados en el vector

dado un vector Y determinado.


Al maximizar
smiles

M V ),
(

L(; Y )

respecto de

se obtienen los estimadores mximo vero-

los cuales maximizan la probabilidad de ocurrencia de la muestra

observada, es decir:

M V = max L(; Y )

126

Microeconometra Aplicada
Centro de Microdatos

Capitulo 6: Estimador Mximo Verosimil


1

o equivalentemente

M V = max ln(L(; Y )) = max l(; Y )

Luego, si asumimos que las observaciones de Y son independientes, entonces

2:

n
n

l(; Y ) = ln( Li (; yi )) =
li (; yi )
i=1

i=1

La primera derivada de L es generalmente conocida como


lo cual

6.1.

M V

Score, s = (; Y ), por

se obtienen al igualar el score a cero.

Propiedades de los estimadores MV

Las propiedades de los estimadores ML se derivan en grandes muestras, por lo


cual hablaremos de las propiedades asintticas de los mismos. Ellas son:

1.

Consistencia:
plim(M V ) =
es decir, asintticamente, el parmetro estimado corresponde al parmetro
poblacional.

2.

Eciencia Asinttica: La varianza del estimador ML alcanza la llamada


Cota Inferior de Cramer Rao, es decir I()1 . Esta propiedad asinttica
es la principal virtud de los estimadores ML. La cota inferior de Cramer
Rao corresponde al inverso de la matriz de informacin (que deniremos a
continuacin), la cual corresponde a la mnima varianza que puede poseer
un estimador insesgado.

3.

Normalidad Asinttica:
M V a N (, I()1 )

1 En

general se utiliza el logaritmo de la funcin de verosimilitud, denotado como l = ln(L)


como funcin objetivo. Note que dicha transformacin es inocua, en trminos de que el vector

= L1 L
de parmetros que maximize l ser el que a su vez maximize L, ya que:

2 Bajo independencia, la funcin de distribucin conjunta de una muestra corresponde a la


multiplicacin de las funciones de densidad individuales.
l

127

Microeconometra Aplicada
Centro de Microdatos

Capitulo 6: Estimador Mximo Verosimil

es decir, el estimador ML distribuye asintticamente normal, con media


y varianza igual al inverso de la llamada
Esta ltima se dene como:

matriz de informacin (I()).

]
[ 2 ]
l l
l
I() = E
= E

donde note que la matriz hessiana de segundas derivadas de L es una matriz


cuadrada y simtrica de orden
4.

Invarianza: Si es el estimador ML de
de

6.2.

k k.

entonces

g()

es el estimador ML de

y g()
g().

es una funcin continua

Estimacin MV

Como ya es usual, sea el siguiente modelo poblacional:

Y = X + u
donde las matrices poseen los tamaos usuales y

iid

u N (0, 2 I).

f (u1 , u2 , . . . , un ; I) = f (u1 ) f (u2 ) f (un ) =


2

Entonces:

f (ui )

i=1
y asumiendo una distribucin normal para los errores, tenemos que la funcin de
verosimilitud corresponde a:

u2
1
i

exp 22
2 2
i=1

1
u u2
=
n exp 2
(2 2 ) 2

f (u1 , u2 , . . . , un ; I) =

luego, dado nuestro modelo poblacional, tenemos que:

L = f (y1 , y2 , . . . , yn ; X, 2 , ) =
con lo cual, nuestros estimadores
regla expuesta en (2.74):

(Y X) (Y X)
1

2 2
n exp
(2 2 ) 2

M V = [M V

M
V]

se obtienen siguiendo la

)
(Y X) (Y X)
1

2 2
ma2x ln(L) = ma2x ln
n exp
,
,
(2 2 ) 2
(
)
n
n
(Y X) (Y X)
2
= ma2x ln(2) ln( )
,
2
2
2 2
(

128

Microeconometra Aplicada
Centro de Microdatos

Capitulo 6: Estimador Mximo Verosimil

con lo cual, las CPO:

1
lnL
=0
= 2 X (Y X )

= M V = (X X)1 X Y
lnL
n
1
(Y X )
=0
= 2 + 4 (Y X )

(Y X M V ) (Y X M V )
2

= M V =
n
Entonces, bajo normalidad de los errores, el estimador

M V

es equivalente al es-

timador MCO. Sin embargo, note que el estimador de la varianza de los errores
(
M V

da lugar al estimador sesgado.

Nos queda entonces derivar la varianza de los estimadores MV. Vimos que la
matriz de varianzas corresponda al inverso de la matriz de informacin (I( )).
Por facilidad de clculo, generalmente se utiliza la segunda denicin de

I(),

decir, la de las segundas derivadas de la funcin de verosimilitud. Entonces:

2l
X X
=

]
2l
X X
E
=

2
2l
X u
=

2
4

]
2l
=0
E
2
[

2l
n
u u
=

( 2 )2
2 4
6

]
2l
n
E
=
( 2 )2
2 4
129

es

Microeconometra Aplicada
Centro de Microdatos

Capitulo 6: Estimador Mximo Verosimil

donde esta ltima esperanza se deriva del hecho que

E(u u) = n 2 .

Entonces, la

matriz de informacin corresponde a:

( XX

I(, ) =

n
2 4

mientras que su inversa:

I(, )

( 1 2
(X X)
=
0

0
2 4
n

Note que el hecho que la matriz de informacin (y por lo tanto su inversa) sea
una matriz diagonal, reeja que X y u se distribuyen independientemente (de otra

forma E(X u) =0).

Ejemplo: Considere la siguiente funcin de densidad condicional:


f (y|x) =

ey (y)x
x!

y 0,

Obtenga el estimador de mxima verosimilitud de

0
.

Primero debemos recordar que cada observacin i de la variable dependiente


tiene la siguiente densidad condicional a la variable explicativa

x:

eyi (yi )xi


f (yi |xi , ) =
xi !
El logaritmo de la funcin de verosimilitud asociada a cada observacin i es:

)
eyi (yi )xi
li (|yi , xi ) = ln
xi !
= ln yi + xi (ln + ln yi ) ln(xi !)
De esta forma, aplicando sumatoria a la ecuacin anterior obtengo la verosimilitud
conjunta:

L(|y, x) = n ln

i=1

yi + ln

i=1

130

xi +

i=1

xi ln yi

i=1

ln(xi !)

Microeconometra Aplicada
Centro de Microdatos

Capitulo 6: Estimador Mximo Verosimil

Maximizando la expresin anterior con respecto a

obtenemos el estimador M-

ximo Verosmil:

n
n
xi
L
n
yi + i=1
=
= 0

i=1
n
n

n
yi +
xi = 0
i=1

i=1

n + ni=1 xi

n
=
i=1 yi
= 1+x

Ahora suponga que disponemos de los siguientes datos de la variable

10

18

20

En este caso el estimador Mximo Verosmil de

= 1+x

y
1 + 13
= 2,8
=
5

131

es:

y:

Microeconometra Aplicada
Centro de Microdatos

Capitulo 6: Estimador Mximo Verosimil

6.3.

Inferencia en el contexto MV

6.3.1. Test de Razn de Verosimilitud (LR)


El valor de la funcin de verosimilitud,
militud


L(,
2 ), corresponde al valor de la verosi-

irrestricta, es decir, sin imponer ninguna restriccin sobre los parmetros

del modelo. Suponiendo entonces que nuestro inters se centra en una serie de restricciones lineales del tipo

R = r (donde R y r se denen como en la seccin 2.8),

entonces el modelo original es estimable en su versin restringida, al maximizar


la funcin de verosimilitud sujeta a R = r , cuyo resultado son los estimadores
y 2 . Luego L(, 2 ) corresponde al valor de la verosimilitud
.

restringida

El valor de la verosimilitud restringida no puede ser superior al de la no restringida, sin embargo, podra esperarse que si las restricciones impuestas son correctas,
el valor de la primera est cerca del de la segunda. Entonces, denimos la razn

de verosimilitud () como:

2 )
L(,

L(,
2)

El test LR se dene entonces como:


2 )] a 2 (q)
LR = 2 ln = 2[ln L(,
2 ) ln L(,
donde q corresponde al nmero de restricciones impuestas (es decir, el nmero de
las de R).
Intuitivamente, el valor del estadgrafo crecer a mayor sea la discrepancia entre
los valores de la verosimilitud restringida y la no restringida, lo cual nos aleja de
la posibilidad que las restricciones impuestas sea vlidas (no rechazo de la nula).
En el caso que los errores distribuyan normal, es posible derivar una versin
M V y 2 M V en
alternativa del estadgrafo utilizando los residuos. Reemplazando

l es posible demostrar:

(
n
2

2 ) = (2e)
L(,
Luego, si denimos como

uN R

n
(2 ) 2

2e
n

) n2

(
u u) 2

los residuos del modelo irrestricto y como

reemplazando en la denicin del test, obtenemos:

LR = n(ln uR uR ln uN R uN R )

132

uR ,

Microeconometra Aplicada
Centro de Microdatos

Capitulo 6: Estimador Mximo Verosimil

6.3.2. Test de Wald (W)


Un segundo test asinttico en el contexto MV corresponde al llamado Test de
Wald. Dicho test se basa en evaluar la hiptesis nula en los coecientes estimados
y evaluar cuan cercano es el resultado comprado a lo propuesto por la nula. Una
de las ventajas del test de Wald es que slo necesita de la estimacin no restringida. As, una vez obtenido

un vector

(R r)

cercano a cero tendera a apoyar

la hiptesis nula.
Siguiendo la misma lgica de la demostracin del test F, si:

a
(, I()1 )
entonces, bajo la hiptesis nula:

(R r) (0, RI()1 R )
a

entonces, se puede demostrar que:

a
(R r) [RI()1 R ]1 (R r) 2q
donde q es el nmero de las de R y por lo tanto, el nmero de restricciones
(segn la denimos en la seccin 2.8). Luego, como los estimadores MV distribuyen asintticamente normales, entonces la matriz de informacin expuesta en
la ecuacin (2.88) es vlida en muestras grandes, tenemos que el estadstico de

Wald se dene como :

W =

(R r) [R(X X)1 R ]1 (R r) a 2
q

Una nota: Dijimos que el test era vlido asintticamente, donde hemos utilizado
el resultado de normalidad asinttica de MV. En caso de que los errores efectivamente distribuyan normal en muestra nita, el test (lgicamente) mantiene su
distribucin.

6.3.3. Test del Multiplicador de Lagrange (LM)


Un tercer test corresponde al test LM, el cual tambin es conocido como el test
del Score. recordemos que el Score corresponde a la matriz de primeras derivadas

3 Note

que hemos utilizado slo el bloque superior izquierdo de la inversa de la matriz de


informacin. Ello porque el test corresponde a los parmetros asociados a los coecientes de la
regresin. Adems, ello es posible porque la matriz es diagonal, lo cual implica que no existe
correlacin entre los errores y los regresores.
133

Microeconometra Aplicada
Centro de Microdatos

Capitulo 6: Estimador Mximo Verosimil

de la funcin de Verosimilitud:

ln L

l
=

s() =

= 0, por lo cual, al evaluar el score en el


s()
), generalmente obtendremos un
estimador restringido bajo la nula R r = 0 (
Como vimos en la introduccin,

vector diferente de cero, sin embargo, si la nula no se puede rechazar, esperaramos obtener un vector cercano a cero.
Se puede demostrar que el score posee media cero y varianza igual a la matriz de
informacin (I()). Por lo tanto, tenemos que la forma cuadrtica:

s ()I()1 s() 2
a

con lo cual, al evaluar en el vector de parmetros restringido tenemos que bajo


la nula, el test LM se dene y distribuye como:

)
1 s()
a 2
LM = s ()I(
q
Note que contraposicin al test de Wald, slo necesitamos calcular el estimador
restringido. De hecho, su popularidad reside en que muchas veces es ms fcil
calcular el estimador restringido que el no restringido.
Dada la normalidad asinttica de los estimadores MV, podemos reducir el estadgrafo a una forma mucho ms simple. Para ver lo anterior, considere una
notacin matricial del score:

s() =

l
2

[
=

1
X u
2
u u
2n2 + 2
4

entonces, para evaluar el score en la estimacin restringida, utilizamos los residuos


restringidos, los cuales denotaremos por:

u = Y X
y por lo tanto:

2 =
con lo cual:

[
=
s()

u u
n

1
X u

0
134

Microeconometra Aplicada
Centro de Microdatos

Capitulo 6: Estimador Mximo Verosimil

Entonces, tomado en cuenta la denicin de

I()1

dada en (2.87) y evalundola

en el estimador restringido, tenemos que nuestro test en (2.96) queda como:

LM =
=
=
=
donde el

R2

2 (X X)1
0
0
u X(X X)1 X u

u X(X X)1 X u
n
u u
nR2 a 2q
1
uX

][

1
uX

2
4
n

corresponde a la bondad de ajuste de la regresin auxiliar entre

y X.
Resumiendo, el test se implementa en tres simples pasos:

1. Estimar el modelo restringido y obtener sus residuos


2. Con ellos correr una regresin de ellos contra X. Obtener el

R2

3. Construir el estadstico

Ejemplo: Siguiendo con el ejemplo anterior, testee la hiptesis nula de que = 5.


(i)

Test de Razn de Verosimilitud: recordemos que el estadstico de este test es:

ln L()]
a 2 (q)
LR = 2[ln L()
Primero debemos evaluar el logaritmo de la verosimilitud en el parmetro
no restringido (estimado):

y, x) = n ln

L(|

yi + ln

i=1

xi +

i=1

xi ln yi

i=1

ln(xi !)

i=1

= 4 ln(2,8) 2,8 20 + ln(2,8) 52 + 90,04 97,014


= 5,317999436
El siguiente paso es computar el logaritmo de la funcin de verosimilitud
restringida, es decir, evaluada en el valor del

y, x) = n ln

L(|

yi + ln

i=1

i=1

= 5):
bajo la hiptesis nula (
xi +

i=1

xi ln yi

i=1

= 4 ln(5) 5 20 + ln(5) 52 + 90,04 97,014


= 16,8481637
135

ln(xi !)

Microeconometra Aplicada
Centro de Microdatos

Capitulo 6: Estimador Mximo Verosimil

Luego debemos computar el estadstico restando ambas verosimilitudes en


logaritmos y multiplicar esta diferencia por 2:

ln L()]

LR = 2[ln L()
= 2[5,317999436 + 16,8481637] = 23,06032853
Finalmente, debemos comparar el valor de este estadstico con el valor de
2
tabla de una con 1 grado de libertad (slo estamos testeando una hip2
tesis). El valor de la con un grado de libertad a un 5 % de signicancia
es de 3.84, por lo tanto se rechaza la hiptesis nula de que

(ii)

sea igual a 5.

Test de Wald: para poder realizar este test primero necesitamos computar la
matriz de varianzas y covarianzas del estimador, el inverso de la matriz de
informacin. Recordemos la forma de esta matriz:

]
[ 2 ]
l l
l
I() = E
= E

El score (o primera derivada de el logaritmo de la funcin de verosimilitud


era:

lnL
n
=
yi +

i=1
n

n
i=1

xi

Ahora, la segunda derivada (o Hessiano) es:

n
lnL2
n
i=1 xi
=

2 2
2
(n + ni=1 xi )
lnL
=

2
Como la variable

es ja el valor esperado del hessiano corresponde a la

misma expresin, luego el negativo de esto constituye la matriz de informacin:

I() =

(n +

n
i=1
2

xi )

(4 + 52)
2
56
I() =
2

I() =

Ahora el estadstico de Wald se construye de la siguiente forma:

5) I()(

5) 2
W = (
1
136

Microeconometra Aplicada
Centro de Microdatos

Capitulo 6: Estimador Mximo Verosimil

Reemplazando

por 2.8:

(
W

= (2,8 5)

56
(2,8)2

)
(2,8 5)

W c = 34,6
Como el valor calculado del estadstico de Wald resulta ser mayor al valor
2
de tabla de una con un grado de libertad, se rechaza la hiptesis nula de
que

(iii)

= 5.

Test de multiplicador de Lagrange: para construir este estadstico necesitamos evaluar el score y la matriz de informacin en el estimador restringuido

e), que en este caso es igual a 5:


(

e = n
s()
yi +
e

i=1

e =
I()

i=1

4
52
20 +
= 8,8
5
5

56
= 2,24
(5)2

Reemplazando en el estadstico:

e I()
e 1 s()
e
LM = s()
LM = (8,8)(2,24)1 (8,8) = 34,6
Con lo cual se rechaza la hiptesis nula de que

6.4.

= 5.

Algunas acotaciones respecto a la estimacin


y la inferencia MV

1. La seccin 2.10.2 asume que la distribucin de los errores sigue una distribucin normal. Sin embargo, suponer errores normales es slo uno de los
posibles supuestos respecto a la distribucin de los errores. Existe una gran
cantidad de posibilidades al respecto, utilizndose otras como la distribucin
logstica y la exponencial, muy regularmente en otros tpicos economtricos.
Lo anterior es una ventaja de la estimacin MV, dado que sus propiedades
asintticas se mantienen independientemente de la distribucin utilizada.
2. Otra ventaja corresponde a la posibilidad de utilizar modelos no lineales.
MCO (tal y como lo hemos estudiado) slo permite estimar modelos lineales en parmetros, mientras que MV permite no linealidades (aunque ello

137

Microeconometra Aplicada
Centro de Microdatos

Capitulo 6: Estimador Mximo Verosimil

implique la imposibilidad de obtener de obtener formas funcionales cerradas


para nuestros estimadores, lo cual implica necesariamente utilizar mtodos
numricos para optimizar la funcin objetivo).
3. Otra ventaja reside en la inferencia. Toda la inferencia vista en MCO posea
distribucin exacta bajo el supuesto de normalidad. Los test asintticos
visto en la inferencia MV son vlidos bajo cualquier distribucin supuesta
(aunque asintticamente).
4. Adicionalmente, los tres test vistos son capaces de lidiar con restricciones no

lineales. Por qu? Porque MV es capaz de lidiar con modelos no lineales


5. Es posible demostrar que

W LR LM

al ser aplicados a un modelo

lineal. Los tres son asintticamente equivalentes, sin embargo, en muestras


nitas arrojarn resultados diferentes.
6. Cundo es recomendable utilizar un test t o un test F por sobre un test
asinttico?
7. Todos los paquetes estadsticos reportan el valor de la funcin de verosimilitud (es decir, la funcin evaluada en los parmetros estimados). Ello,
muchas veces es utilizado como un criterio de seleccin entre modelos (recuerde que nuestro objetivo es maximizar la funcin de verosimilitud).

4 Un

ejemplo de restriccin no lineal corresponde a H0 : ln(32 ) = 0,1+ln(2 ). Para estimar


el modelo restringido basta con aislar 2 e introducirlo en la funcin de verosimilitud que ser
maximizada por mtodos numricos.
138

Captulo 7
Variable Dependiente Discreta
En los problemas empricos es bastante comn encontrarse con anlisis donde
la variable de inters no es continua, por ejemplo, si estamos interesados en estudiar los factores que determinan que una mujer casada trabaje o no, esta variable

es binaria:

T rabaja =

1
0

trabaja;
no trabaja.

Cuando la variable dependiente tiene esta caracterstica usualmente el modelo de


regresin lineal no es apropiado.
Algunos ejemplos de modelos de variable dependiente discreta son:

Decisin de estudiar en colegios privados versus pblicos

Decisin de otorgar o no un crdito a una empresa

Decisin de las personas de capacitarse o no

Decisin de las personas de ahorrar o no (o de endeudarse o no)

Factores asociados a la depresin

Decisin de contribuir o no al sistema de pensiones

Decisin de tener o no un seguro

139

Microeconometra Aplicada
Centro de Microdatos

Capitulo 7: Variable Dependiente Discreta

7.1.

Modelo de Probabilidad Lineal

Suponga que estamos interesados en estudiar como el nivel de ingresos afecta la


decisin de un hogar de tener auto o no. Para esto se disponen de

1, 2, ..., N.),

la variable ingresos la denotamos por

x2 ,

familias (i

y la variable dependiente

correspondiente a la tenencia o no auto es binaria, y se dene de la siguiente


manera:

{
yi =

1
0

si el hogar
si el hogar

i
i

posee auto;
no posee auto.

Suponga que realizamos una regresin lineal para este modelo:

yi = 1 + 2 xi2 + ui
o de manera equivalente y ms general:

yi = xi + ui
xi = (1, xi2 ) . Bajo los supuestos estndar de que la

error es cero, E[ui |xi ] = 0, se tiene que E[yi |xi ] = xi .

donde
del

Pero dado que la variable dependiente

esperanza condicional

es binaria, la esperanza condicional de

la variable dependiente es equivalente a:

E[yi |xi ] = 1 P r[yi = 1|xi ] + 0 P r[yi = 0|xi ]


= P r[yi = 1|xi ]
Por lo cual, el supuesto de un modelo lineal cuando la variable dependiente es

binaria implica que x es una probabilidad, y por lo tanto debera estar entre 0
y 1, lo cual se cumplir acotando los valores que pueden tomar

Adicionalmente, el trmino de error del modelo no tendr una distribucin normal y tendr heterocedasticidad, esto se debe a que como la variable
tomar dos valores, el trmino de error (dado un valor de

x)

slo puede

tambin puede to-

mar dos valores. En particular tenemos que cuando y = 1 el trmino de error es


1 x y cuando y = 0 el trmino de error es x , y la distribucin de ui se
puede resumir de la siguiente manera:

P r[ui = 1 xi |xi ] = P r[yi = 1|xi ] = xi


P r[ui = xi |xi ] = P r[yi = 0|xi ] = 1 xi

140

Microeconometra Aplicada
Centro de Microdatos

Capitulo 7: Variable Dependiente Discreta

La varianza del error entonces es:

V [ui |xi ] =
=
=
=

(1 xi )2 P r[ui = 1 xi ] + (xi )2 P r[ui = xi ]


(1 xi )2 (xi ) + (xi )2 (1 xi )
(1 xi )(xi )[1 xi + xi ]
(1 xi )(xi )

As, podemos notar que la varianza del error no es constante sino que depende
de los valores de

xi

y adems depende de

que es un parmetro desconocido.

Suponga que estamos interesados en estudiar como la alimentacin por leche

materna afecta los niveles de obesidad en nios entre 2 y 5 aos de edad , para
cual adems de considerar la variable correspondiente a la cantidad de meses que
el nio fue alimentado con leche materna se incorporar las variables aos de escolaridad de la madre, la que usualmente es utilizada como educacin en salud de
la madre, una dummy que indica si la madre sufri de diabetes gestacional, y una
dummy que indica si la madre tuvo algn trastorno psicolgico (depresin, fobia,
pnico, etc.) durante el embarazo. El siguiente cuadro muestra la estimacin por
MCO de este modelo, donde la variable dependiente es binaria y toma valor 1 si
el menor es obeso (su ndice de masa corporal est por sobre el percentil 95 de
los nios de su mismo sexo y edad) y cero si el nio no es obeso.

Cuadro 7.1
Modelo de Regresin Lineal: Variable Dependiente Obeso

La estimacin anterior nos muestra que la cantidad de meses que el menor fue
alimentado con leche materna tiene un efecto negativo sobre la probabilidad de

1 Datos

obtenidos de la Encuesta Longitudinal de la Primera Infancia


141

Microeconometra Aplicada
Centro de Microdatos

Capitulo 7: Variable Dependiente Discreta

ser obeso, en particular un mes mas de alimentacin materna disminuye en 0.12


puntos porcentuales la probabilidad de que el menor sea obeso, tambin podemos
ver que por cada ao adicional de educacin de la madre la probabilidad de ser
obeso se reduce en 0.48 puntos porcentuales, si la madre tuvo diabetes gestacional
se incrementa la probabilidad de ser obeso en 6 puntos porcentuales, y si la madre
tuvo algn trastorno psicolgico durante el embarazo no tiene efecto signicativo
sobre la probabilidad de que el menor sea obeso.
El siguiente cuadro muestra el valor predicho de la probabilidad de ser obeso
[y = 1|x] = x ) segn este modelo lineal:
(P

Cuadro 7.2
Prediccin Obesidad segn Modelo de Regresin Lineal

En este caso puntual no se producen predicciones fuera del rango

[0, 1],

sin em-

bargo, la estimacin del modelo sigue siendo ineciente por la heterocedasticidad


del modelo, y restringida al asumir que la funcin de probabilidad es lineal.
Una vez estimado el modelo podemos utilizar los valores estimados para los coecientes para gracar la relacin entre la probabilidad de ser obeso (segn el
modelo) y los meses de lactancia materna, esto asumiendo todas las dems variables constantes y jas en algn valor (generalmente se ocupa el promedio),
el siguiente cuadro nos muestra los comando necesarios para poder realizar este
grco.

142

Microeconometra Aplicada
Centro de Microdatos

Capitulo 7: Variable Dependiente Discreta

Cuadro 7.3
Prediccin Lineal Obesidad y Lactancia Materna

Grco 7.1

.2

Probabilidad predicha obesidad


.22
.24

.26

Prediccin Lineal Obesidad y Lactancia Materna

10

20
30
Meses de lactancia materna

143

40

50

Microeconometra Aplicada
Centro de Microdatos

Capitulo 7: Variable Dependiente Discreta

7.2.

Modelo de Eleccin Discreta

Los modelos de eleccin discreta estn diseados para abordar el problema de


que la variable dependiente corresponde al resultado de una eleccin entre dos
alternativas. Estos modelos describen directamente la probabilidad de que
xi :

yi = 1

como una funcin no lineal de

P r[yi = 1|xi ] = G(xi )


La eleccin natural para esta funcin

G()

es una funcin de distribucin de

probabilidad acumulada, por ejemplo la distribucin normal estndar:

F () = () =

{
}
1
1 2
exp t dt
2
2

En este caso el modelo de eleccin discreta es conocido como Modelo Probit.


Tambin se puede asumir una funcin de probabilidad logstica:

F () = () =

e
1 + e

En este caso el modelo de eleccin discreta es conocido como Modelo Logit.


Estas dos distribuciones son bastante similares, la nica diferencia es que la distribucin logstica tiene las colas un poco ms anchas, por lo cual los resultados
entregados por ambos modelos en la prctica son bastante similares.
Notemos que en estos modelos los coecientes
ginales de la variable

no representan los efectos mar-

x sobre la probabilidad de que y = 1, ya que esta la funcin

de probabilidad de por medio. En estos modelos la interpretacin de los efectos


marginales no es directa. Si
esta variable sobre

P r[y = 1]

xk

es una variable continua, el efecto marginal de

corresponde a:

F (xi )
P r[yi = 1]
=
k
xik
xik
= f (xi )k
donde

f ()

corresponde a la funcin de densidad.

De esta forma, el efecto marginal no es constante para todas las observaciones


sino por el contrario cada individuo tienen un valor distinto del efecto marginal, en la prctica se obtiene el valor del efecto marginal evaluando las variables

144

Microeconometra Aplicada
Centro de Microdatos

Capitulo 7: Variable Dependiente Discreta

explicativas en el promedio:


P r[yi = 1]
= f (x )k

xik
xi =x

Otra alternativa, menos utilizada en la prctica, es calcular el promedio de los


efectos marginales.
Cuando la variable explicativa



F (xi )

xk

es discreta, el efecto marginal corresponde a:

xk =x,xk =1



F (xi )

xk =x,xk =0

Esto es, la probabilidad evaluada en el promedio para todas las variables explicativas excepto para la variable binaria para la cual estamos calculando el efecto
marginal, la cual se evala en 1 y se le resta la evaluada en 0.
En el caso del modelo Logit:

exi
P r[yi = 1|xi ] =

1 + exi
Denotando

P r[yi = 1|xi ]

por

pi ,

el modelo Logit puede ser expresado de la si-

guiente manera:

pi

= exi
1 pi ]
[
]
pi
ln
= xi
1 pi
donde el lado izquierdo de esta ecuacin corresponde al logaritmo natural del odds
ratio, este se dene como el ratio de las posibilidades, por ejemplo un odd ratio de

y = 1 son tres veces las posibilidades de que


estimado representa los efectos marginales
entonces si por ejemplo k es 0.12 signica que

3 indica que las posibilidades de que

y = 0.

En este modelo el coeciente

sobre el logaritmo del odd ratio,


un cambio en una unidad de

y=1

7.3.

xk

aumenta en un 12 % las posibilidades de que

sobre las posibilidades de que

y = 0.

Variable Dependiente Latente

Es posible (pero no necesario) derivar el modelo de eleccin discreta de un modelo de comportamiento, lo que lleva a una representacin del modelo mediante

145

Microeconometra Aplicada
Centro de Microdatos

Capitulo 7: Variable Dependiente Discreta

una variable latente. Por ejemplo, suponga que nuestra variable de inters es si
una mujer casada trabaja o no trabaja condicional en ciertas caractersticas, la
variable dependiente en este caso es binaria y toma valor 1 si la mujer trabaja y
0 sino trabaja. Sin embargo, la decisin de trabajar o no de la mujer fue tomada
en funcin de evaluar la utilidad de trabajar versus la utilidad de no trabajar,
esta diferencia en las utilidades depende del salario que reciba, algunas caractersticas de la mujer, educacin, si tiene hijos pequeos o no, entre otras variables.
As, para cada persona i se puede escribir la diferencia de utilidades de tener

o no tener trabajo (yi ) como una funcin de caractersticas observadas (xi ), y


caractersticas no observadas (ui ):

yi = xi + ui
dado que en realidad

yi

no se observa nos referimos a ella como variable latente.

Suponiendo, sin perdida de generalidad, que la persona decide trabajar cuando


la diferencia de utilidades es mayor a cero, y no trabaja si es mejor o igual a cero,
tenemos que la variable observada

y=

y
1
0

tiene la siguiente caracterstica:


si
si

yi > 0
yi 0

De esta forma, se tiene que:

P r[yi > 0]
P r[xi + ui > 0]
P r[ui xi ]
F (xi )

P r[yi = 1] =
=
=
=

Es equivalente al modelo de eleccin discreta antes mostrado, si se asume que el


error del modelo latente

ui

es normal estamos hablando del modelo Probit y si se

asume que es logstico estamos hablando del modelo Logit.

7.4.

Estimacin

La estimacin de este modelo es por Mxima Verosimilitud, primero notemos que


la funcin de verosimilitud es:

yi
1yi
L() = N
i=1 P [yi = 1|xi , ] P [yi = 0|xi , ]
Tomando logaritmo de la funcin de verosimilitud, se tiene que la log-likelihood
de este modelo es:

lnL() =

i=1

yi lnF (xi )

i=1

146

(1 yi )ln[1 F (xi )]

Microeconometra Aplicada
Centro de Microdatos

Capitulo 7: Variable Dependiente Discreta

donde

F ()

es la funcin de probabilidad acumulada la que puede ser normal o

logstica.
Tomando la derivada de log-likelihood con respecto a

e igualando a cero se

obtiene la condicin de primer orden:

]
N [
lnL()
yi F (xi )

=
f (xi ) xi = 0

F (xi )[1 F (xi )]


i=1
El trmino entre parntesis cuadrado recibe el nombre de residuo generalizado.
Este residuo generalizado (i ) tiene las siguientes caractersticas:

{
i =

f (xi )
F (xi )
f (xi )
1F (xi )

si

yi = 1

si

yi = 0

La condicin de primer orden nos indica que los residuos generalizados son ortogonales a las variables explicativas del modelo, similar a la condicin de primer
orden de MCO.
La condicin de primer orden de este problema no tiene una solucin cerrada
para

por lo cual se resuelve mediante mtodos de optimizacin.

El Cuadro 7.4 muestra la estimacin de la probabilidad de que el menor sea


obeso en funcin de la educacin de la madre, meses de lactancia materna, una
dummy si la madre tuvo diabetes gestacional, y una dummy si la madre tuvo un
trastorno psicolgico durante el embarazo, asumiendo una distribucin normal
estndar para el trmino de error del modelo latente. Sin embargo, los resultados
presentados corresponden a la estimacin de los coecientes

los que no tienen

una interpretacin de efectos marginales en este tipo de modelos. Para poder interpretar los efectos marginales de las variables explicativas sobre la probabilidad
de obesidad del menor, debemos computar los efectos marginales. El Cuadro 7.5
muestra el clculo de los efectos marginales para el modelo probit estimado evaluados en el promedio de las variables explicativas.
Los resultados encontrados son bastante similares a la estimacin por MCO, un
aumento en un mes de lactancia materna reduce la probabilidad de obesidad del
nio en 0.12 puntos porcentuales, un ao ms de escolaridad de la madre reduce
la probabilidad de obesidad del nio en 0.48 puntos porcentuales, si la madre tuvo
diabetes gestacional la probabilidad de obesidad es 6 puntos porcentuales mayor
que en nios con madres sin diabetes gestacional, y los trastornos psicolgicos no
tienen efectos signicativos sobre la probabilidad de obesidad.

147

Microeconometra Aplicada
Centro de Microdatos

Capitulo 7: Variable Dependiente Discreta

Cuadro 7.4
Estimacin Probit Probabilidad de Obesidad

Cuadro 7.5
Efectos Marginales Probit sobre Probabilidad de Obesidad

El Cuadro 7.6 muestra los comandos necesarios para guardar la informacin de


los efectos marginales de las estimaciones por MCO, Probit y Logit, para luego
poder mostrar en una sola tabla la comparacin de los tres modelos. El Cuadro
7.7 muestra la tabla con los resultados.

148

Microeconometra Aplicada
Centro de Microdatos

Capitulo 7: Variable Dependiente Discreta

Cuadro 7.6
Efectos Marginales Probabilidad de Obesidad
Comparacin MCO, Probit y Logit

Cuadro 7.7
Efectos Marginales Probabilidad de Obesidad
Comparacin MCO, Probit y Logit

De manera alternativa se pude utilizar el comando:

outreg2 [lineal probit logit] using javiera, replace word excel mfx
Generando archivos excel y word con la tabla de comparacin de los tres modelos.

149

Microeconometra Aplicada
Centro de Microdatos

Capitulo 7: Variable Dependiente Discreta

Al igual que en el modelo lineal podemos gracar la relacin entre la probabilidad


de obesidad predicha por el modelo y los meses de lactancia dejando constante
las dems variables. Para lograr este grco debemos ejecutar los siguientes comandos:

Cuadro 7.8
Probabilidad de Obesidad y Lactancia Materna

Podemos notar que no existen grandes diferencias en la relacin probabilidad


de obesidad y lactancia materna estimadas por los diferentes modelos, lo que
ya habamos adelantando comparando los efectos marginales de los tres modelos
estimados.

150

Microeconometra Aplicada
Centro de Microdatos

Capitulo 7: Variable Dependiente Discreta

Grco 7.2

.2

Probabilidad predicha obesidad


.22
.24

.26

Probabilidad de Obesidad y Lactancia Materna

10

20
30
Meses de lactancia materna
Lineal
Logit

7.5.

40

50

Probit

Medidas de Bondad de Ajuste

Las medidas de Bondad de Ajuste representas estadsticas indicando el grado de


precisin con la cual el modelo se aproxima a los datos observados, en el modelo
2
2
de regresin lineal se utilizada el R o R ajustado. En los modelos de variable
dependiente binaria el modelo puede ser juzgado tanto en trminos del ajuste entre las probabilidades calculadas y las frecuencias observadas como en trminos
de la habilidad de predecir las respuestas observadas.
Sea

lnL1

el valor de la funcin de verosimilitud para el modelo estimado (mximo

valor), y sea

lnL0

el valor de la funcin de verosimilitud donde todos los coe-

cientes excepto la constante son reemplazados por cero. Claramente,

lnL1 > lnL0

y la diferencia entre las dos funciones es mayor mientras mayor sea el valor de
las variables explicativas del modelo en explicar la variable dependiente. De es2
ta manera, se puede utilizar la siguiente medida, denominada pseudo R para
estudiar el ajuste del modelo:

pseudo R2 = 1

1
1 + 2(lnL1 lnL0 )/N
151

Microeconometra Aplicada
Centro de Microdatos

Capitulo 7: Variable Dependiente Discreta

donde

denota el nmero de observaciones.

Una medida alternativa es sugerida por McFadden (1974):

M cF addenR2 = 1

lnL1
lnL0

Se podra pensar que una manera razonable de estudiar el ajuste del modelo es
comparar el valor promedio de las probabilidades predichas:

N
1
pi
N i=1
con el promedio de la variable binaria observada
observaciones con valor de

y,

o la frecuencia muestral de

igual a 1. Sin embargo, esta medida no es til ya

que por supuesto de estimacin (condicin de primer orden) la igualdad de estos dos indicadores es impuesta. De esta forma, Hosmer-Lemeshow sugieren un
test que consiste en comparar la frecuencia muestral (y ) con el promedio de las
probabilidades predichas por el modelo en subgrupos de observaciones, donde la
hiptesis nula del test es que los dos grupos son iguales. La cantidad de grupos
es denida de manera arbitraria por el investigador. Sea
probabilidades predichas del grupo

yg

pg

el promedio de las

la frecuencia muestral del grupo

g,

el

estadstico de este test es:

(
pg y g )
y (1 y g )
g=1 g
los grupos se basan en los cuantiles de las probabilidades predichas. Bajo la hi2
ptesis nula el estadstico se distribuye (G2) .
El Cuadro 7.9 muestra este test para la estimacin probit del modelo de probabilidad de obesidad. En este caso no se puede rechazar la hiptesis nula de que
el promedio de las probabilidades estimadas son iguales a las frecuencias muestrales para todos los grupos cuando utilizamos 5 grupos, se rechaza al 10 % cuando
utilizamos 6 grupos.

152

Microeconometra Aplicada
Centro de Microdatos

Capitulo 7: Variable Dependiente Discreta

Cuadro 7.9
Test Hosmer-Lemeshow

Justamente uno de los problemas de este test es que es muy sensible al nmero
de grupos que se utilicen.
Otra forma de estudiar la bondad de ajuste del modelo es comparar los resultados
predichos con los resultados efectivos. Para obtener los resultados predichos por
el modelo primero debemos computar la probabilidad predicha por el modelo, y
luego denimos la variable de resultado predicha de la siguiente manera:

{
y =
Luego al comparar

y con y

1
0

si
si

p 0,5
p < 0,5

podemos computar una medida de bondad de ajuste

que indique el porcentaje de las observaciones clasicadas de manera correcta.


Para calcular esta medida de bondad de ajuste luego de estimar un modelo de
eleccin binaria debemos ejecutar el comando

estat classification,

el cua-

dro 6.10 nos muestra el resultado para el modelo probit de la probabilidad de


obesidad, un 75.5 % de las observaciones son clasicadas de manera correcta.

153

Microeconometra Aplicada
Centro de Microdatos

Capitulo 7: Variable Dependiente Discreta

Cuadro 7.10
Observaciones predichas correctamente

Cuando la variable no tienen una distribucin proporcional en la muestra, se


puede cambiar el corte de clasicacin de la variable predicha de acuerdo a la
probabilidad estimada, para esto primero se puede utilizar el comando
para determinar este corte:

154

lsens

Microeconometra Aplicada
Centro de Microdatos

0.00

Sensitivity/Specificity
0.25
0.50
0.75

1.00

Capitulo 7: Variable Dependiente Discreta

0.00

0.25

0.50
Probability cutoff
Sensitivity

En este caso se puede utilizar el corte en 0.25:

155

0.75
Specificity

1.00

Microeconometra Aplicada
Centro de Microdatos

Capitulo 7: Variable Dependiente Discreta

7.6.

Aplicacin

se utilizar la encuesta CASEN 2009 para estudiar los determinantes de que una
persona realice o no una capacitacin laboral. En esta encuesta se pregunta a
las personas han asistido a algn curso de capacitacin laboral en el ltimo ao.
Plantearemos un modelo simple para analizar la relacin entre la realizacin de
capacitacin laboral y un conjunto de variables demogrcas y caractersticas del
empleo de los ocupados, por lo cual slo se tomar como muestra de anlisis los
ocupados como asalariados. Segn los datos de la Encuesta CASEN 2009, un
47,1 % de los mayores de 15 aos (poblacin en edad de trabajar) se encuentran
ocupados. Del total de personas ocupadas, un 70.6 % trabaja como asalariado, y
de los asalariados un 19.6 % ha realizado algn curso de capacitacin en el ltimo ao. Las caractersticas individuales que se utilizarn en la estimacin son:
gnero, edad, escolaridad, estado civil, y condicin de jefe de hogar. Adems se
utilizarn algunas caractersticas del empleo como: ingreso laboral por hora, tamao de la empresa y rama de actividad econmica.
A travs de los siguientes comandos se construyen las variables necesarias para la estimacin:

g ocupado=1 if o1==1
replace ocupado=0 if o1==2
replace ocupado=1 if o2==1
replace ocupado=1 if o3==1
g asalariado=1 if o23>=3 & o23<=5 & o23!=.
replace asalariado=0 if asalariado==. & ocupado==1
g capacitado=1 if o33>=1 & o33<=7
replace capacitado=0 if o33==8
replace capacitado=. if asalariado==0
replace capacitado=. if ocupado==0
g casado=1 if ecivil==1 | ecivil==2
replace casado=0 if casado==.
replace casado=. if ecivil==.
g jefe=1 if pco1==1
replace jefe=0 if pco1!=1
156

Microeconometra Aplicada
Centro de Microdatos

Capitulo 7: Variable Dependiente Discreta

replace jefe=. if pco1==.


g genero=1 if sexo==1
replace genero=0 if sexo==2
replace o16=. if o16==999
g horas=o16/7*30
g yph=yopraj/horas
g lyph=ln(yph)
g Emediana=1 if o14==``D''
replace Emediana=0 if o14==``A'' | o14==``B'' | o14==``C'' | o14==``E''
| o14==``F''
g Egrande=1 if o14==``E'' | o14==``F''
replace Egrande=0 if o14==``A'' | o14==``B'' | o14==``C'' | o14==``D''
g actividad=int(c_o12/1000)
replace actividad=. if actividad==0
tab rama, generate(act_)
rename act_3 mineria
rename act_4 industria
rename act_5 electr
rename act_6 construccion
rename act_7 comercio
rename act_8 transporte
rename act_9 servicios
rename act_10 servcomu
Una vez generadas las variables para estimar el modelo, se puede estimar el modelo de eleccin discreta para la probabilidad de realizar una capacitacin mediante
un modelo Probit:

157

Microeconometra Aplicada
Centro de Microdatos

Capitulo 7: Variable Dependiente Discreta

La medida de bondad de ajuste

pseudoR2

nos indica que estas variables son ca-

paces de explicar un 9.6 %. La siguiente tabla muestra que el porcentaje predicho


correctamente es 83 %.

158

Microeconometra Aplicada
Centro de Microdatos

Capitulo 7: Variable Dependiente Discreta

Para interpretar el efecto de las variables explicativas sobre la probabilidad de


realizar una capacitacin se deben computar los efectos marginales:

159

Microeconometra Aplicada
Centro de Microdatos

Capitulo 7: Variable Dependiente Discreta

Podemos concluir que:

Todas las variables excepto edad resultan ser estadsticamente signicativas


Aumentar la escolaridad en un ao aumenta la probabilidad de haber realizado una capacitacin en 1 punto porcentual.
Estar casado aumenta la probabilidad en 2.8 puntos porcentuales
Ser jefe de hogar tambin aumenta la probabilidad de realizar capacitacin
en 4.5 puntos porcentuales.
Ser hombre disminuye la probabilidad en 3 puntos porcentuales.
Un 1 % ms de salario por hora aumenta la probabilidad de capacitarse en
4.2 puntos porcentuales.
Trabajar en una empresa grande versus una empresa pequea aumenta la
probabilidad de capacitarse en 12.2 puntos porcentuales.
Trabajar en una empresa mediana versus una empresa pequea aumenta la
probabilidad de capacitarse en 6.6 puntos porcentuales.

160

Microeconometra Aplicada
Centro de Microdatos

Capitulo 7: Variable Dependiente Discreta

Con respectos a los sectores econmicas (todos evaluados versus el sector agricultura) se concluye que: minera aumenta la probabilidad en 13.5
puntos porcentuales, industria aumenta la probabilidad en 3.2 puntos porcentuales, electricidad la aumenta en 9 puntos porcentuales, construccin
disminuye la probabilidad en 1.9 puntos porcentuales, comercio aumenta
la probabilidad en 1.6 puntos porcentuales, transporte aumenta la probabilidad en 2.2 puntos porcentuales, servicios nancieros aumenta la probabilidad en 4.2 puntos porcentuales, y servicios comunales aumenta la
probabilidad en 7.6 puntos porcentuales.

161

Captulo 8
Modelos de Respuesta Mltiple
Existen diversas aplicaciones donde la variable dependiente es categrica, es decir,
la variable de inters slo toma valores discretos. En el captulo anterior revisamos
el caso cuando la variable dependiente es binaria, en este captulo nos centraremos
en el caso que la variable dependiente puede tomar ms de dos valores discretos.
Por ejemplo, nuestra variable de inters podra ser la jornada de trabajo de una
persona (tiempo completo, medio tiempo o no trabaja), o la eleccin de donde
invertir de una empresa (Europa, Asia, Estados Unidos o Amrica Latina), etc.
Tambin tendremos que utilizar estos modelos cuando a pesar de que la variable
de inters es continua, por ejemplo ingreso, la manera en que se reporta la informacin es discreta, por ejemplo en algunas encuestas las personas responden en
que tramo de ingresos se ubica su salario.
Los modelos de eleccin mltiple tienen como objetivo explicar la probabilidad
de cada una de las alternativas como funcin de caractersticas de las propias
alternativas o como funcin de caractersticas de el individuo que esta escogiendo entre las diversas alternativas. Una distincin metodolgica importante surge
dependiendo si la variable categrica es ordenada o no ordenada.

8.1.

Modelos de Respuesta Mltiple Ordenada

Consideremos que nuestra variable dependiente es categrica y representa el resultado de una eleccin entre

alternativas, numeradas de 1 a

M.

Si existe un

orden lgico entre estas alternativas (por ejemplo, no tiene auto, tiene 1 auto, tiene 2 autos, y tiene ms de 2 autos), el modelo se denomina Modelo de Respuesta

162

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

Ordenada. Este modelos se basa en la existencia de una variable latente, sea


la variable latente e

yi

yi

la variable categrica ordenada observada, el modelo se

puede expresar de la siguiente manera:

yi = xi + ui
yi = j si j1 < yi j
Los parmetros

son desconocidos, con

0 =

M = +.

j sea escogida corresponde a


la probabilidad de que la variable latente este entre j y j . Bajo el supuesto de
que el error del modelo latente ui es independiente e idnticamente distribuido
De esta forma, la probabilidad de que la alternativa

normal estndar el modelo se denomina Probit Ordenado, y bajo el supuesto de


que la distribucin es logstica el modelo se denomina Logit Ordenado.
Independiente del funcin de distribucin de probabilidad escogida para el error
el modelo se estima por Mxima Verosimilitud, para plantear la funcin de verosimilitud debemos notar que la funcin de probabilidad de las observaciones
depende del valor que tome la variable dependiente categrica ordenada:

P r[yi = 1|xi ] =
=
=
P r[yi = 2|xi ] =
=
.
.
.

P r[ < x + ui 1 ]
F (1 x ) F ( x )
F (1 x )
P r[1 < x + ui 2 ]
F (2 x ) F (1 x )
.

= ..
P r[yi = M |xi ] = P r[M 1 < x + ui +]
= F (+ x ) F (M 1 x )
= 1 F (M 1 x )
De esta forma, la log-likelihood de este modelo es:

lnL(, ) =

ln [F (j x ) F (j1 x )]

j=1 Yi =j
la que debe ser maximizada con respecto a

Al igual que en los modelos de eleccin discreta, los coecientes

estimados

no representan los efectos marginales de las variables explicativas sobre la probabilidad de elegir la alternativa

j,

una vez estimado el modelo se deben computar

163

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

los efectos marginales:

P r[yi = j]
= [f (j1 xi ) f (j xi )] k
xik
Para ejemplicar la estimacin de un modelo de eleccin mltiple ordenado utilizaremos la Encuesta Casen 2009, especcamente la variable que pregunta sobre
la cantidad de personas que trabajan en la empresa de la persona entrevistada.
El Cuadro 8.1 muestra la distribucin de frecuencia de esta variable, un 24.9 %
de las personas trabajan por cuenta propia (1 persona), y un 18.4 % trabaja en
empresas grandes.

Cuadro 8.1
Distribucin de Frecuencia Tamao de Empresa

Mediante la estimacin de un modelo probit/logit ordenado se puede estudiar


como diferentes caractersticas de las personas como sexo, edad, escolaridad y
calicacin del ocio de la persona, afectan la probabilidad de trabajar en cada
una de estas categoras de tamao de empresa.
EL Cuadro 8.2 muestra la estimacin de un modelo probit ordenado para esta variable, notemos que adems de mostrar la estimacin de los coecientes

y sus respectivas desviacin estndar, muestra la estimacin de los parmetros

y su desviacin estndar, los que son llamados por el programa como \cut_1\cut_5. Para poder interpretar los resultados del modelo debemos calcular los
efectos marginales con el comando mfx pero a diferencia del modelo de eleccin
binaria donde se estimaba una sola probabilidad, en este caso debemos indicar
adems sobre que probabilidad queremos calcular el efecto marginal.

164

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

Cuadro 8.2
Probit Ordenado Tamao de Empresa

El Cuadro 8.3 muestra los efectos marginales (evaluados en el promedio) de las


variables explicativas sobre la probabilidad de trabajar en una empresa unipersonal (o por cuenta propia), los hombres tienen 8.7 puntos porcentuales menos de
probabilidad de trabajar por cuenta propia que las mujeres, cada ao adicional de
escolaridad disminuye en 1.5 puntos porcentuales la probabilidad de trabajar por
cuenta propia, cada ao adicional de edad aumenta en 0.5 puntos porcentuales la
probabilidad de trabajar por cuenta propia, y tener un ocio calicado disminuye
en 10 puntos porcentuales la probabilidad de trabajar por cuenta propia, todos
los efectos marginales son estadsticamente signicativos. El Cuadro 8.4 muestra
los efectos marginales sobre la probabilidad de trabajar en una empresa grande,
los hombres tienen 6.7 puntos porcentuales ms de probabilidad de trabajar en
una empresa grande que las mujeres, cada ao de escolaridad aumenta en 1.2
puntos porcentuales la probabilidad de trabajar en una empresa grande, cada
ao adicional de edad disminuye en 0.4 puntos porcentuales la probabilidad de
trabajar en empresa grande, y tener un ocio calicado aumenta en las puntos
porcentuales la probabilidad de trabajar en una empresa grande.

165

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

Cuadro 8.3
Efectos Marginales Probit Ordenado Tamao de Empresa
Pr[Tamao empresa=1]

Cuadro 8.4
Efectos Marginales Probit Ordenado Tamao de Empresa
Pr[Tamao empresa=200 y ms]

El modelo puede ser estimado tambin bajo el supuesto de distribucin logstica del error utilizando el comando

ologit,

ejecutando los siguientes comandos

podemos comparar los efectos marginales sobre la probabilidad de trabajar por


cuenta propia de la estimacin

oprobit

ologit

en el Cuadro 8.5:

qui oprobit tamao_empresa dhombre esc edad calificado


qui mfx, predict(outcome(1))
estimates store oprobit1
166

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

qui ologit tamao_empresa dhombre esc edad calificado


qui mfx, predict(outcome(1))
estimates store ologit1
outreg2 [oprobit1 ologit1] using order, replace mfx see

Cuadro 8.5
Efectos Marginales Probit Ordenado Tamao de Empresa
Pr[Tamao empresa=1]
Comparacin oprobit y ologit

Una vez estimado el modelo podemos utilizar el comando predict para obtener la
probabilidad predicha de cada una de las alternativas de la variable dependiente
condicional en las caractersticas del individuo:

predict categ1 categ2 categ3 categ4 categ5 categ6 if e(sample), pr


El Cuadro 8.6 muestra el promedio, mnimo y mximo de las probabilidades
predicas para cada una de las categoras de la variable dependiente ordenada,
la probabilidad predicha para trabajar como cuenta propia toma como mnimo
0.045 y como mximo 0.77, el valor promedio es 0.25. Con respecto a la probabilidad predicha de trabajar en empresa grande el valor mnimo es 0.018 y mximo
0.56 con un valor promedio de 0.18.

167

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

Cuadro 8.6
Prediccin Probit Ordenado Tamao de Empresa

Ahora si queremos gracar la relacin entre la probabilidad de trabajar en empresa grande (segn el modelo) y la edad de la persona, debemos realizar lo siguiente:

oprobit tamao_empresa dhombre esc edad calificado


sum dhombre esc edad calificado if e(sample)
g xb_oprobit=_b[dhombre]*0.64+_b[esc]*9.96+_b[edad]*edad
+_b[calificado]*0.147
g prob_oprobit1=1-normal(_b[/cut5]-xb_oprobit)
twoway (scatter prob_oprobit1 edad) if e(sample),
ytitle(Probabilidad de Trabajar en Empresa Grande) xtitle(Edad)

Grco 8.1

Probabilidad de Trabajar en Empresa Grande


.1
.2
.3

Probabilidad de Trabajar en Empresa Grande versus Edad

20

40

60
Edad

168

80

100

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

8.2.

Modelos Multinomiales

En la mayora de los casos de modelos donde la variable dependiente es categrica


no existe un orden natural de las alternativas, y por lo tanto, no es realista asumir que existe una relacin montona entre una variable latente y los resultados
categricos observados, por ejemplo si nuestra variable de inters es el medio de
transporte usado por las personas para ir al trabajo, donde las alternativas son
auto, micro, metro, bicicleta y caminando. En estos casos se plantea una metodologa distinta para darle una estructura a las probabilidades de cada una de las
alternativas.
Suponga que nuestra variable dependiente corresponde al resultado de la eleccin entre

alternativas, indexadas a travs de

j = 1, ..., M ,

pero no existe un

orden entre las alternativas. La utilidad que obtiene el individuo


tiva

es

Uij ,

Sin embargo,

j ser escogida por el individuo i


Uij = max{Ui1 , ..., UiM }.

y la alternativa

la mayor utilidad, es decir,

Uij

para

j = 1, ..., M

de la alterna-

si esta le entrega

no son observadas por lo cul es necesario

darme mayor estructura al modelo, especcamente se asume que la utilidad que


obtienen el individuo

i de la alternativa j

es una funcin de variables observables

y de factores no observables:

Uij = xij j + uij


Luego la probabilidad de elegir la alternativa

es:

P r[yi = j] = P r[Uij = max{Ui1 , ..., UiM }]


[
]

= P r xij j + uij >


max {xik k + uik }
k=1,...,M,k=j

Bajo el supuesto de que

uij

son independientes y con funcin de distribucin de

probabilidad Weibull (o Extreme Value Tipo I), es decir, la funcin de distribucin


de probabilidad de cada

uij

es:

{
}
F (t) = exp et
As, bajo estos supuestos se tiene que la probabilidad de cada alternativa:

exp(xij j )
pj = P r[yi = j] =
exp(xi1 1 ) + ... + exp(xiM M )
Una vez denida la probabilidad de cada una de las alternativas se puede estimar
el modelo por Mxima Verosimilitud, para esto denamos

169

yij

de la siguiente

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

manera:

{
yij =

1
0

y=j
y = j

si
si

Luego la funcin de verosimilitud de este modelo es:

L=

N
M

pijij

i=1 j=1
o la funcin log-likelihood:

lnL =

N
M

yij ln(pij )

i=1 j=1
Maximizando esta funcin con respecto a

se obtiene el estimador Mximo Vero-

smil de los coecientes del modelo, sin embargo, estos coecientes no representan
los efectos marginales de las variables explicativas sobre la probabilidad de escoger la alternativa

j.

En el modelo planteado podemos notar que tanto las variables explicativas como
los coecientes varan con las alternativas, sin embargo, en la prctica un modelo
as planteado no esta identicado y no se puede estimar. Cuando el modelo es
tal que los regresores varan entre alternativas, por lo tanto los coecientes son
constantes para todas las alternativas, el modelo es denominado Conditional Logit. Por el contrario, cuando los regresores no varan entre alternativas pero si los
coecientes, el modelo se denomina Multinomial Logit. Los dos modelos pueden
ser combinados en un modelo denominado Mixed Logit, donde un conjunto de variables explicativas varan entre alternativas y las restantes variables explicativas
no varan entre alternativas.

8.2.1. Conditional Logit


En el modelo Conditional Logit las probabilidades de cada una de las alternativas
se expresan de la siguiente manera:

exp(xij )
pij = M

k=1 exp(xik )
Denidas estas probabilidades se puede construir la funcin de verosimilitud y
estimar

, sin embargo, para interpretar el modelo se deben computar los efectos


170

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

marginales:

pij
= pij (ijl pil )
xil
donde

ijl

es una variable binaria que toma valor 1 cuando

j = l y 0 cuando j = l.

Consideremos el siguiente ejemplo de Herriges y Kling (1999) donde se analizan los distintos modos de pesca en funcin de algunas caractersticas de los
individuos como el ingreso y otras caractersticas especcas de las alternativas
como precio y tasa de captura. En el Cuadro 8.7 se muestra la descripcin de las
variables contenidas en la base de datos.

Cuadro 8.7
Descripcin Base de Datos Modos de Pesca

El Cuadro 8.8 muestra la distribucin de frecuencia de la variable de inters, modelo de pesca, un 11.3 % de las personas escogen pescar en la playa, un 15.1 % en
un muelle, un 35.4 % en un bote privado, y un 38.2 % en un bote compartido.
En el modelos Conditional Logit slo se pueden utilizar variables que varan entre
alternativas, en este ejemplo seran el precio y tasa de captura. En el Cuadro 8.9
podemos notar que el formato de la base de datos es wide, para poder estimar
el modelo primero necesitamos cambiar el formato de la base de datos a formato
long.

171

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

Cuadro 8.8
Distribucin de Frecuencia Modo de Pesca

Cuadro 8.9
Datos Modo de Pesca

El Cuadro 8.10 muestra el comando ejecutado para cambiar el formato de la base


de datos, y el Cuadro 8.11 el resultado donde cada observacin corresponde a los
datos de un individuo

para la alternativa

172

j.

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

Cuadro 8.10
Cambio Formato Base de Datos

Cuadro 8.11
Datos Modo de Pesca en Formato Long

El Cuadro 8.12 muestra la estimacin del modelo Conditional Logit para la eleccin de modo de pesca en funcin del precio de cada alternativa y de la tasa de
captura de cada alternativa, el modelo muestra un ajuste medido a travs del
2
pseudo-R de 0.20. Sin embargo, la informacin presentada en este cuadro corresponde a la estimacin de los coecientes, los que en este tipo de modelo no
tienen interpretacin como efectos marginales de las variables explicativas sobre
la probabilidad de elegir cada una de las alternativas de modos de pesca.

173

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

Cuadro 8.12
Conditional Logit Modo de Pesca

Para obtener los efectos marginales debemos ejecutar el comando

estat mfx,

este comando entrega como resultado los efectos marginales de los precios de
cada alternativa y tasa de captura de cada alternativa sobre las probabilidades
de escoger cada una de las alternativas, el Cuadro 8.13 muestra parte del resultado
de este comando, el que corresponde a los efectos marginales sobre la probabilidad
de escoger la alternativa barco privado.

Cuadro 8.13
Efectos Marginales Conditional Logit
Probabilidad escoger barco privado

174

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

Los resultados nos muestra que cada dlar adicional de costo de la alternativa playa aumenta en 0.06 puntos porcentuales la probabilidad de escoger barco privado,
cada dlar adicional de costo de la alternativa barco compartido aumenta en 0.47
puntos porcentuales la probabilidad de escoger la alternativa barco privado, cada
dlar adicional de la alternativa muelle aumenta en 0.075 puntos porcentuales
la probabilidad de escoger barco privado, y cada dlar adicional de costo de la
alternativa barco privado disminuye en 0.6 puntos porcentuales la probabilidad
de escoger este alternativa. Por otra parte, un aumento en un punto en la tasa
de captura en la alternativa playa disminuye en 0.0086 puntos porcentuales la
probabilidad de escoger la alternativa barco privado, un aumento en un punto en
la tasa de captura de barco compartido disminuye en 0.072 puntos porcentuales
la probabilidad de escoger barco privado, un aumento en un punto en la tasa
de captura de la alternativa muelle disminuye en 0.011 puntos porcentuales la
probabilidad de escoger barco privado, y un aumento en un punto en la tasa de
captura de la alternativa barco privado aumenta en 0.092 puntos porcentuales la
probabilidad de escoger esta alternativa.

8.2.2. Multinomial Logit


Muchos de las aplicaciones de modelos multinomiales estn basados en base de
datos con informacin de variables que no varan entre alternativas sino slo entre individuos. En este caso los modelos son estimados mediante la metodologa
Multinomial Logit.
En este modelo la probabilidad de cada una de las alternativas es igual a:

exp(xi j )
pij = M

l=1 exp(xi l )
La estimacin de este tipo de modelos requiere que los coecientes de una de las
alternativas (usualmente la primera) sean normalizados a cero, es decir,
Notemos que con esta normalizacin, la probabilidad de la alternativa
cional en que se escoge la alternativa 1 (normalizada) o la alternativa

P r[yi = j|yi = j

o yi = 1] =

1 = 0 .
j condi-

es:

exp(xi j )
1 + exp(xi j )

lo que corresponde a estimar un modelo Logit de la alternativa

contra la alter-

nativa base o normalizada.


Nuevamente los coecientes estimados no son de inters para el anlisis sino los

175

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

efectos marginales, los que se pueden computar una vez estimado el modelo de la
siguiente forma:

pij
= pij (j i )
xi
donde

i =

pil l .

El Cuadro 8.14 muestra la estimacin del modelo Multinomial Logit utilizando el comando

mlogit,

en este caso la eleccin de modo de pesca es explicada

por una nica variable correspondiente al ingreso de la persona, esta variable es


constante para un individuo entre las distintas alternativas. Para aplicar este comando el formato de la base de datos debe ser wide, es decir, una sola observacin
por individuo donde aparezca el modelo de pesca escogido y el ingreso.

Cuadro 8.14
Multinomial Logit Modo de Pesca

Sin embargo, el cuadro anterior no nos entrega informacin interesante para interpretar los resultados, analizar el modelo debemos computar los efectos marginales
lo que se hace con el comando

mfx, predict(pr outcome(j)).


176

Por ejemplo, el

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

Cuadro 8.15 muestra los efectos marginales de ingreso sobre la probabilidad de


escoger la alternativa barco privado.

Cuadro 8.15
Efectos Marginales Multinomial Logit
Probabilidad escoger barco privado

Un aumento en mil dlares de ingreso aumenta en 3.3 puntos porcentuales la


probabilidad de escoger la alternativa barco privado para ir a pescar. El Cuadro
8.16 muestra que cambiar la categora base cambia los coecientes estimados,
pero no as los efectos marginales.

8.2.3. Mixed Logit


En este caso se combina la utilizacin de variables explicativas que varan
entre alternativas con variables explicativas que no varan entre alternativas. En
este caso la probabilidad de la alternativa

es:

exp(xij + zi j )

pij = M

l=1
donde

xij

exp(xil + zi l )

son las variables explicativas que varan entre alternativas y

zi

son las

variables que no varan entre alternativas.


Denidas las probabilidades de cada alternativa se construye la funcin de verosimilitud la cual es maximizada con respecto a

para obtener los coecientes

estimados, nuevamente estos coecientes no representan los efectos marginales


de las variables explicativas sobre la probabilidad de escoger la alternativa
efectos marginales deben ser computados luego de estimar el modelo.

177

j,

los

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

Cuadro 8.16
Efectos Marginales Multinomial Logit
Probabilidad escoger barco privado

El comando

asclogit

permite estimar modelos de variable dependiente categ-

rica no ordinal cuando hay variables explicativas que varan entre alternativas y
otras que no varan entre alternativas, la base de datos debe estar en formato

long:

use ``mus15data.dta'', clear


g id=_n
reshape long d p q, i(id) j(fishmode beach pier private charter) string
El Cuadro 8.17 muestra el resultado de la estimacin de un modelo mixed logit donde la variable dependiente es el modo de pesca y las variables explicativas
son el ingreso (no vara entre alternativas), el precio (si vara entre alternativas)
y la tasa de captura (si vara entre alternativas). Luego mediante el comando

estat mfx

podemos obtener los efectos marginales para cada una de las alter-

nativas, el Cuadro 8.18 muestra parte del resultado de este comando, lo que
corresponde a los efectos marginales sobre la alternativa barco privado.

178

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

Cuadro 8.17
Mixed Logit Modo de Pesca

Cuadro 8.18
Efectos Marginales Mixed Logit Modo de Pesca
Probabilidad de escoger barco privado

179

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

8.2.4. Independencia de Alternativas Irrelevantes


Una limitacin de los modelos Conditional Logit y Multinomial Logit es que la
comparacin de las

alternativas se reduce a una serie de comparaciones entre

pares de alternativas, ya habamos mostrado que en estos modelos se obtiene un


resultado equivalente estimado modelos logit de una alternativa contra la alternativa base. Es as, como bajo este tipo de modelos sacar una de las alternativas
no debera afectar los resultados obtenidos, si por el contrario al sacar una de las
alternativas en la variable dependiente las estimaciones cambian, los supuestos
detrs de estos modelos no se estn cumpliendo, por lo cual no tienen una forma
funcional que caracterice bien los datos. La Independencia de Alternativas Irrelevantes (IIA) se puede testear a travs de un test de Hausman, este test consiste
en comparar los coecientes del modelo con todas las alternativas versus la estimacin del modelo donde una de las alternativas es eliminada.
Volvamos a nuestro ejemplo de los modos de pesca, especcamente el modelo
donde esta variable es funcin del ingreso y la estimacin corresponde a un Multinomial Logit, primero debemos estimar el modelo y guardar los resultados:

mlogit mode income, baseoutcome(4)


estimates store completa
Luego estimamos el modelo sin considerar la primera alternativa:

mlogit mode income if mode!=1, baseoutcome(4)


estimates store sin1
Con los resultados de las dos estimaciones podemos utilizar el comando

hausman

para testear la hiptesis nula de que los coecientes de los dos modelos son iguales, si no se puede rechazar la hiptesis nula la metodologa Multinomial Logit
es validada. El Cuadro 8.19 muestra el resultado del test de hausman para la categora 1 (playa), el resultado nos muestra que no se puede rechazar la hiptesis
nula de que los coeciente son iguales, en este caso se cumple el supuesto de IIA.
El test se debe realizar para cada una de las alternativas.

180

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

Cuadro 8.19
Test de Hausman: Alternativa Playa

Existe el comando

mlogtest, hausman

que entrega el resultado para todas las

alternativas, el Cuadro 8.20 muestra los resultados. En este caso se rechaza la


estimacin Multinomial Logit para este modelo ya que al sacar la alternativa
barco privado se rechaza la hiptesis nula de que los coecientes con la alternativa
sean iguales a los coecientes sin la alternativa.

Cuadro 8.20
Test de Hausman

181

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

8.2.5. Modelo Nested Logit


Los modelos Multinomial Logit y Conditional Logit asumen que los errores en la
funcin de utilidad:

Uij = xij j + uij


son independientes e idnticamente distribuidos extreme value tipo I, por lo cul
las alternativas no estn relacionadas entre ellas, y el modelo es equivalente a
estimar un modelo logit de una alternativa contra otra.
Este modelo puede ser generalizado permitiendo algn tipo de correlacin entre los errores, una forma de permitir correlacin es a travs del Modelo Nested
Logit donde las alternativas de la variable dependiente son dividas en dos grupos,
dentro de cada grupo los errores pueden estar correlacionados pero no existe correlacin entre grupos. Este tipo de modelo requiere una estructura secuencial en
la eleccin de alternativas, por ejemplo, en la eleccin del modo de pesca se puede
suponer que primero la persona decide si pescar en la orilla de la playa o en bote,
luego condicional en que elige la orilla de la playa debe elegir si pesca en la playa
o en un muelle, y condicional a que escoge pescar en bote debe escoger si en uno
privado o uno pblico. La Figura 8.1 muestra el diagrama de estas decisiones.

Figura 8.1
Decisin Anidada de Modo de Pesca

Modo
Orilla

Playa

Muelle

Barco

Pblico

Privado

j y
las del segundo nivel por k . As, en este modelo la utilidad de la alternativa (j, k)
Denotaremos el conjunto de alternativas en el primer nivel por el subndice
es:

Ujk = zj + xjk j + ujk


182

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

donde

zj

varan entre las alternativas del primer nivel, y

xjk

varan entre las

alternativas del primer nivel y segundo nivel. El Modelo Nested Logit asume
que

(uj1 , uj2 , ..., ujK )

se distribuyen con distribucin multivariada extreme value

Gumbel, y bajo este supuesto la probabilidad que la alternativa

(j, k) sea escogida

es:

pjk = pj pk|j
exp(xjk j /j )
exp(zj + j Ij )
Kj
= J

m=1 exp(zm + m Im )
l=1 exp(xjl j /j )
[
]
Kj

exp(x

/
)
. El parmetro j es llamado dissimilarity padonde Ij = ln
j
j
jl
l=1
rameter, para que el modelo sea consistente se requiere que 0 j 1, si este
parmetro es igual a 1 el modelo converge a un Conditional Logit.
El comando para estimar este tipo de modelos es

nlogit,

sin embargo antes

de utilizar este comando se debe construir una variable que especique la estructura del rbol de decisiones con el comando

nlogitgen.

El Cuadro 8.21 muestra

la denicin de la variable con el rbol de decisin diagramado en la Figura 8.1.


Primero debemos transformar la base de datos en formato long:

use mus15data.dta, clear


g id=_n
reshape long d p q, i(id) j(fishmode beach pier private charter) string
Luego utilizamos el comando

nlogitgen:

Cuadro 8.21
Denicin rbol de Decisiones Modo de Pesca

Para vericar el rbol de decisiones se puede utilizar el comando

nlogittree, tal

como muestra el Cuadro 8.22. El primer nivel quedo denido como shore (orilla)
o boat (barco), de la opcin shore del primer nivel se desprenden dos alternativas
beach (playa) o muelle (pier), y de la opcin boat las alternativas private (privado)
o charter (compartido). En la columna

que eligen cada una de las alternativas.

183

se indica la cantidad de observaciones

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

Cuadro 8.22
rbol de Decisiones Modo de Pesca

El Cuadro 8.23 muestra la estimacin del modelo de eleccin de modo de pesca


en funcin de las variables precio, tasa de captura, e ingreso. Al igual que en
los otros modelos los coecientes estimados no tienen interpretacin de efectos
marginales, pero lamentablemente el comando
medio) o

margeff

mfx

(efectos marginales en el pro-

(efectos marginales promedio) no se pueden aplicar para este

comando. La ltima parte del resultado del comando

nlogit

muestra el test de

razn de verosimilitud para la hiptesis nula conjunta de que

= 1

o de que

el modelo Conditional Logit es apropiado (las alternativas son independientes),


la cual es rechaza. Sin embargo, ambos parmetros son mayores a 1 por lo cual
tampoco es un modelo consistente el Nested Logit.
Si el modelo fuese vlido los efectos marginales (promedios) podran ser calculados
manualmente siguiendo los siguientes pasos:

1. Obtener las probabilidades predichas segn el modelo para todas las observaciones
2. Cambiar uno de los regresores en un valor pequeo (delta)
3. Volver a obtener las probabilidades predichas por el modelo con este cambio
en uno de los regresores
4. Restar los dos valores predichos y dividir delta.
5. El efecto marginal promedio corresponde al promedio de lo calculado en el
paso anterior.

184

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

Cuadro 8.23
Estimacin Nested Logit Modo de Pesca

Para obtener los efectos marginales promedios del modelo estimado debemos ejecutar los siguientes comandos:

predict plevel1 plevel2, pr


qui sum p
g delta=r(sd)/1000
qui replace p=p+delta if fishmode==``beach''
predict pnew1 pnew2, pr
g dpdbeach=(pnew2-plevel2)/delta

185

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

El Cuadro 8.24 muestra entonces el efecto marginal promedio del precio de la


alternativa beach.

Cuadro 8.24
Efectos Marginales Nested Logit Modo de Pesca

8.2.6. Multinomial Probit


Un modelo ms general es el Multinomial Probit, donde los errores se asumen que
tienen una distribucin normal conjunta. Es decir, si la utilidad de la alternativa

es:

Uij = xij + zi j + uij


los errores de las alternativas no son independientes sino que tienen una distribucin normal conjunta

(ui1 , ui2 , ..., uiM ) N (0, ). De esta forma, la probabilidad


j es:

de escoger la alternativa

pij = P r[yi = j] = P r[uik uij (xij xik ) + zi (j k )],


Esta probabilidad corresponde a una integral de dimensin
El comando

(m 1).

mprobit es anlogo al comando mlogit, es decir, slo se puede apli-

car cuando las variables explicativas no varan entre alternativas. El Cuadro 8.25
nos muestra la estimacin del modelo de eleccin de modo de pesca en funcin
del ingreso, que es una variable que no vara entre alternativas. Para poder interpretar el modelo debemos computar los efectos marginales, en el Cuadro 8.26 se
presentan los efectos marginales para las alternativas beach y charter, en el caso
de la alternativa beach el ingreso no tiene un efecto signicativa sobre la probabilidad de escoger esta alternativa, y en el caso de charter se estima que 1000
dlares ms de ingreso disminuyen en 1.3 puntos porcentuales la probabilidad de
escoger esta alternativa.

186

Microeconometra Aplicada
Centro de Microdatos

Capitulo 8: Modelos de Respuesta Mltiple

Cuadro 8.25
Multinomial Probit Modo de Pesca

Cuadro 8.26
Efectos Marginales Multinomial Probit Modo de Pesca

187

Captulo 9
Variable Dependiente Limitada
9.1.

Introduccin

En este captulo estudiaremos modelos donde la variable dependiente es continua,


sin embargo puede presentar uno de los siguientes problemas:

La variable de inters se observa de manera incompleta


La variable de inters se observa de manera completa pero para una muestra
seleccionada que no es representativa de la poblacin

Por eso se dice que la variable dependiente es limitada. En este caso, an cuando
se cumplan todos los supuestos que requiere el estimador MCO para ser insesgado
y consistente, MCO ser inconsistente porque la muestra que se est utilizando
para la estimacin no es representativa de la poblacin. De esta forma, se requerir de una metodologa alternativa de estimacin, con supuestos de distribucin
mucho ms fuerte, para obtener coecientes estimados de manera consistente.
El primer caso de variable dependiente limitada, donde se observa una muestra incompleta, se puede dar debido al problema de censura o truncamiento. Una
muestra esta truncada cuando no existen datos para algunas observaciones de
la variable dependiente y variables explicativas, por ejemplo, si el ingreso es la
variable dependiente y slo se han includo en la muestra a las personas de bajos
ingresos (bajo cierto umbral). Por otra parte, una muestra esta censurada cuando no existen datos de la variable dependiente para ciertas observaciones pero si
existen datos para las variables explicativas, por ejemplo, se incluye a personas

188

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

de todos los niveles de ingresos en la muestra, pero las personas de altos ingresos
son todas codicadas en cierto nivel.
Para los modelos truncados y censurados Tobin (1958) propone un mtodo de
estimacin consistente de los coecientes en el contexto de un modelo de regresin lineal con errores normales, conocido como el Modelo Tobit.
El segundo caso de variable dependiente limitada es conocido como Modelo de Seleccin (Sample Selection Models), estos modelos son utilizados cuando la muestra
no es aleatoria sino que de manera intencional o no intencional esta basada slo
en una parte de los valores que puede tomar la variable dependiente, los parmetros sern inconsistentes a menos que se corrija la estimacin. Por ejemplo, se ha
observado que el rendimiento de los alumnos en la PSU ha ido empeorando en el
tiempo, ya que es menor el porcentaje de alumnos que postulan a una carrera,
menor el porcentaje de alumnos seleccionados, y el porcentaje de alumnos bajo
500 puntos (media) en lenguaje y matemticas se ha incrementado, pero se ha
visto que la cantidad de estudiantes que rinden la PSU se ha incrementando en un
63 % desde el ao 2003 al 2010, por cual este resultado se puede deber a un incremento en los alumnos de bajo rendimiento que rinden la PSU. En estos modelos
la seleccin puede venir de una auto-seleccin, la variable de inters dependen de
una decisin previa que tomo el individuo de participar o no en cierta actividad
de inters, o puede ser resultado de una seleccin muestral donde los individuos
que participan en esta actividad estn sobre muestreados o en un caso extremos
slo incluye a los individuos que participan.

9.2.
Sea

Modelos Censurados y Truncados

la variable de inters que es observada de manera incompleta (variable

latente). En el caso de que existe truncamiento por abajo se observa y cuando


excede cierto valor (umbral), por ejemplo podemos asumir que ese valor es cero.
Es decir:

y = y

si

y > 0

Dado que los valores negativos de la variable de inters no aparecen en la muestra,

la media de la variable truncada observada y ser mayor a la media de y .


En el caso de censura por debajo,

no se observa completamente cuando

189

y 0

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

pero se sabe que

y < 0

pero se observa

y = y
y=0

y = 0,

si
si

es decir:

y > 0
y 0

Dado que los valores negativos son reemplazados por cero, la media de la varia
ble observada censurada ser mayor a la media de la variable y . As, podemos
notar claramente que las medias muestrales truncadas y censuradas no pueden
ser utilizadas sin ningn tipo de ajuste para estimar la media poblacional.
Consideremos la siguiente ilustracin, suponga que las horas trabajadas se determinan segn la siguiente relacin con el salario por hora:

y = 25 + 10 lnw + u
u N (0, 102 )
lnw N (2,75, 0,62 )
Luego, podemos generar 200 observaciones articiales de la variable latente

y:

set obs 200


g u=rnormal(0,10)
g lnw=rnormal(2.75,0.6)
g ystar=-25+10*lnw+u
g ytrunc=ystar
replace ytrunc=. if ystar<0
g ycens=ystar
replace ycens=0 if ystar<0
Luego podemos notar la diferencia en las medias de las tres variables tal como lo
habamos anticipado:

190

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

Cuadro 9.1
Diferencia en medias variable latente, truncada y censurada

De esto podemos concluir que al menos se producir un sesgo en el intercepto


de la regresin lineal que relaciona horas trabajadas con salario por hora en logaritmo, ya que hay diferencia en medias entre las tres variables, el problema es
que no slo se genera el sesgo en el intercepto sino tambin en la pendiente o
efecto marginal del modelo. A travs de los siguientes comandos realizamos las
regresiones con la variable latente, censurada y truncada:

reg ystar lnw


estimates store ystar
reg ycens lnw
estimates store ycens
reg ytrunc lnw
estimates store ytrunc
El siguiente cuadro resume los resultados:

Cuadro 9.2
Diferencia en efectos marginales variable latente, truncada y censurada

191

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

Grcamente tambin podemos notar las diferencias:

twoway (scatter ystar lnw) (lfit ystar lnw) (lfit ycens lnw)
(lfit ytrunc lnw), legend(order(1 ``lnw observado''
2 ``Media no censurada'' 3 ``Media censurada'' 4 ``Media truncada''))

Grco 9.1
Diferencia en efectos marginales e intercepto variable latente, truncada y

40

20

20

40

censurada

3
lnw
ystar
Fitted values

Fitted values
Fitted values

En trminos ms generales, hablaremos de censura por abajo cuando la variable


observada

cumple con:

{
y=

y
L

si
si

y > L
y L

De manera anloga hablaremos de censura por arriba cuando:

{
y=

y
U

si
si

y < U
y U

192

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

Por otra parte, cuando la variable de inters se encuentra truncada por abajo se
observa

tal que:

y = y

y > L

si

y si esta truncada por arriba se tiene que:

y = y

y < U

si

9.2.1. Estimacin por Mxima Verosimilitud


Si la distribucin de

condicional en las variables explicativas

es conocida

o asumida, los parmetros pueden ser estimados de manera eciente y consistente por Mxima Verosimilitud, a travs de la funcin de distribucin condicional
truncada y censurada de la variable observada

y.

Sean f (y |x) y F (y |x) la funcin de densidad y de probabilidad acumulada

de y , luego podemos obtener f (y|x) y F (y|x) para la variable observada como


una funcin de las funciones de la variable latente, y as podemos determinar la
funcin de verosimilitud en el caso de censura y truncamiento.
Cuando la variable

es censurada por abajo, se tiene la siguiente funcin de

densidad condicional para la variable

f (y|x) =
Notemos que cuando
que

y=L

y:

f (y |x)
F (L|x)

si
si

y>L
y=L

la densidad es discreta e igual a la probabilidad de

y L.

De esta forma, la funcin de densidad condicional de

de la funcin de densidad y de probabilidad acumulada de y .

es una mezcla

Denamos la siguiente variable binaria:

d=

1
0

si
si

y>L
y=L

Luego, la funcin de densidad condicional de la variable


en

censurada por abajo

se puede escribir de la siguiente manera:

f (y|x) = f (y|x)d F (L|x)1d


Entonces la funcin de verosimilitud de las N observaciones en la muestra es:

lnL() =

[di lnf (yi |xi , ) + (1 di )lnF (L|xi , )]

i=1
193

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

L,

Ahora, cuando la variable est truncada por abajo en


de la variable observada

la funcin de densidad

es:

f (y|x) = f (y|y > L, x)


f (y|x)
=
P r[y > L|x]
f (y|x)
=
1 F (L|x)
Luego, la funcin de verosimilitud para la variable dependiente truncada es:

lnL() =

{lnf (yi |xi , ) ln[1 F (L|xi , )]}

i=1

9.2.2. Modelo Tobit


En un contexto de un modelo de regresin lineal con errores normales y homocedsticos donde slo se observa la variable dependiente para valores positivos,
Tobin (1958) desarrolla un modelo para la estimacin que es conocido como Modelo Tobit.
Es decir,

y = x + u con u N (0, 2 )
De esta forma,
Sin embargo,

se distribuye normal con media

no es observada sino

{
y=

y varianza

2.

y:
si
si

y > 0
y 0

Esto indica que no se observa la variable cuando toma valores negativos, cuando
realmente slo hay observaciones positivas es porque la muestra est truncada,
cuando observamos ceros la muestra esta censurada.
Entonces, bajo estos supuestos:

(y x )2
exp
f (y) =
2 2
2 2

194

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

F (0) = P r[y 0]
= P r[x + u 0]
( )
x
=

( )
x
= 1

donde

()

es la funcin de probabilidad acumulada normal estndar.

Luego, la funcin de densidad de la variable censurada observada:

(y x )2
f (y) =
exp
2 2
2 2
1

}]d [

(
1

)]1d

Luego, la funcin de verosimilitud que debe ser optimizada con respecto a

para obtener los estimadores Mximo Verosmil de estos coecientes es:

)
(
( ))}
N { (

x
1
1
1
2

2
lnL(, ) =
di ln2 ln 2 (yi xi ) + (1 di )ln 1
2
2
2

i=1
2

Cuando los datos estn truncados en vez de censurados la funcin de verosimilitud


es:

( )}
N {

xi
1
1
1
2

2
lnL(, ) =
ln2 ln 2 (yi xi ) ln
2
2
2

i=1
2

El estimador Tobit ser consistente en la medida que se cumplan los supuestos


de homocedasticidad y normalidad del error.

9.2.3. Media condicional truncada y censurada


Cuando estimamos un modelo de regresin lineal estamos interesados en la
media de la variable dependiente condicional en las variables explicativas

E[y|x]

ya veamos a travs de un ejemplo simulado que la media condicional truncada o


censurada se ve alterada con respecto a la media condicional poblacional.

195

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

Si la variable est

truncada por abajo:

E[y] =
=
=
=

E[y |y > 0]
E[x + u|x + u > 0]
E[x |x + u > 0] + E[u|x + u > 0]
x + E[u|u > x ]
|
{z
}
>0

E[y] > x . En caso

anloga que E[y] < x .

de esta forma
manera

Cuando la variable est

E[y] =
=
=
=
=

de truncamiento por arriba se obtendr de

censurada por abajo:

Ed [Ey|d [y|d]]
P r[d = 0] E[y|d = 0] + P r[d = 1] E[y|d = 1]
P r[y 0] 0 + P r[y > 0] E[y |y > 0]
P r[y > 0] E[y |y > 0]
P r[u > x ] E[y |y > 0]
|
{z
}
truncada

En resumen, en un modelo de regresin lineal con censura o truncamiento bajo


cero las medias condicionales estn dadas por:
Variable Latente:
Truncada por abajo en 0:
Censurada por abajo en 0:

E[y |x] = x
E[y|x, y > 0] = x + E[u|u > x ]
E[y|x] = P r[u > x ][x + E[u|u > x ]]

Bajo el supuesto de normalidad del error se tiene que la media truncada del error
es de la forma:

E[u|u > x ] =
=

=
=
=

[
]
u u
x
>
E

( )
x
( )]
[
1 x
( )
x
( x )

( )
x

(z)

196

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

donde

() es conocido como el inverse Mills ratio. Luego, las medias condicionales

truncada y censurada en este caso son:


Variable Latente:
Truncada por abajo en 0:
Censurada por abajo en 0:

E[y |x] = x
E[y|x, y > 0] = x + (z)
E[y|x] = (z)x + (z)

9.2.4. Efectos Marginales


Notemos que en estos modelos estamos interesados en el efecto marginal que
tiene la variable explicativa sobre la variable dependiente latente, estos efectos
marginales son capturados directamente por los coecientes estimados ( ). Ahora,
tambin podemos querer estudiar los efectos marginales sobre la variable truncada
y sobre la variable censurada los cuales no son exactamente igual a los coecientes:
Variable Latente:
Truncada por abajo en 0:
Censurada por abajo en 0:

E[y |x]
=
x
E[y|x,y>0]
= [1
x
E[y|x]
= (z)
x

z(z) (z)2 ]

9.2.5. Estimacin de Modelos Censurados y Truncados en


STATA
En esta seccin estudiaremos los determinantes de las horas trabajadas de
las mujeres casadas. En este caso la variable dependiente consiste en las horas
trabajadas, la cul toma slo valores positivos. Cuando no tenemos en la muestra
mujeres que no trabajan la muestra esta truncada, cuando en la muestra tenemos las mujeres que no trabajan tomando valor cero la variable dependiente, la
muestra esta censurada.
Para esta aplicacin utilizaremos los datos de la Encuesta Casen 2009, las variables explicativas sern: nmero de hijos entre 0 y 2 aos, nmero de hijos entre
2 y 6 aos, nmero de hijos entre 6 y 18 aos, edad de la mujer, y los aos de
escolaridad. Primero generemos las variables explicativas que nos interesan:

use casen2009.dta, clear


g hijos0_2=1 if pco2==3 & edad>=0 & edad<=2
g hijos2_6=1 if pco2==3 & edad>2 & edad<=6
g hijos6_18=1 if pco2==3 & edad>6 & edad<=18
197

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

egen nucl=group(region provincia comuna zona segmento folio nucleo)


replace hijos0_2=0 if hijos0_2==.
replace hijos2_6=0 if hijos2_6==.
replace hijos6_18=0 if hijos6_18==.
egen t_hijos0_2=sum(hijos0_2), by(nucl)
egen t_hijos2_6=sum(hijos2_6), by(nucl)
egen t_hijos6_18=sum(hijos6_18), by(nucl)
keep if pco2==1 | pco2==2
keep if sexo==2 & ecivil==1
replace o16=0 if o16==.
replace o16=. if o16==999
g o16_horas=o16/7*30
Primero veamos las estadsticas descriptivas de las variables para la muestra censurada:

Cuadro 9.3
Estadsticas Descriptivas Muestra Censurada

198

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

Y para la muestra truncada:

Cuadro 9.4
Estadsticas Descriptivas Muestra Truncada

Comenzaremos con la estimacin para la muestra censurada, en este caso un


65.2 % de las observaciones estn censuradas, es decir, un 65.2 % de las mujeres
casadas no trabaja. Primero estimaremos el modelo por MCO olvidndonos del
problema de censura de la variable dependiente:

Cuadro 9.5
Estimacin MCO Muestra Censurada

Recordemos que la estimacin MCO de los coecientes es una estimacin inconsistente, esto porque la media condicional debe ser corregida para representar

199

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

una media condicional de una muestra censurada y estimar los coecientes bajo
el modelo apropiado que ser no lineal en

El comando en STATA que nos

permite estimar modelos censurados es el comando Tobit:

tobit depvar [indepvars] [if] [in] [weight] , ll[(#)] ul[(#)]


donde

ll(#)

corresponde al punto de censura por abajo y

ul(#)

corresponde

al punto de censura por arriba.


En el Cuadro 9.6 se presenta la estimacin del modelo Tobit para nuestra variable
de inters. Recordemos que lo que hace este modelo es incorporar la correccin
a la estimacin de la media condicional por tener una parte de las observaciones
de la variable dependiente censurada, por lo cual los coecientes presentados representan directamente los efectos marginales de las variables explicativas sobre
la media condicional de la variable latente. Al respecto se obtiene, por cada hijo
menor de 2 aos las mujeres trabajan en promedio 90.7 horas mensuales menos,
por cada hijo entre 2 y 6 aos las mujeres trabajan en promedio 47.7 horas mensuales menos, por cada hijo entre 6 y 18 aos las mujeres trabajan en promedio
9.4 horas mensuales menos, la edad tiene un efecto negativo sobre las horas trabajadas por cada ao se reduce en 5 en promedio las horas trabajadas al mes, y
la escolaridad tiene un efecto positivo sobre las horas trabajadas, un aumento en
un ao de escolaridad aumenta en promedio 15.2 las horas trabajadas al mes. Podemos notar que los coecientes estimados por MCO estn siendo subestimados
(en valor absoluto) o sesgados hacia el origen.

Cuadro 9.6
Estimacin Tobit Muestra Censurada

200

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

Existen otros efectos marginales de inters que pueden ser obtenidos a travs
de la opcin postestimacin

mfx.

Por ejemplo el Cuadro 7.7 muestra los efectos



marginales sobre la media de la variable truncada E[y |y > 0], la opcin e(0,.)

indica que calcule E[x + u|x + u > 0]

Cuadro 9.7
Efecto Marginal sobre Media Truncada

Podemos interpretar estos efectos marginales de la siguiente manera: por cada


hijo entre 0 y 2 aos se reducen las horas trabajadas en 26.2 horas promedio
mensual para la mujeres que trabajan, por cada hijo entre 2 y 6 aos las horas
trabajadas se reducen en promedio 13.8 horas mensuales, y por cada hijo entre
6 y 18 aos en 2.7 horas mensuales. El efecto de la edad sobre las horas trabajadas de las mujeres que trabajan es de reducir en 1.4 horas mensuales las horas
trabajadas por cada ao adicional de edad, y el efecto marginal de los aos de
escolaridad es aumentar 4.4 las horas promedio trabajadas al mes por cada ao
de escolaridad adicional.

E[y|x] debemos
calcule E(y) donde

Para obtener los efectos marginales sobre la media censurada


utilizar la siguiente opcin
y = 0 si y 0.1 .

1 Note

ystar(0,.),

la cual indica que

que en STATA la variable y es la variable observada y la variable y es la latente.


201

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

Cuadro 9.8
Efecto Marginal sobre Media Censurada

Finalmente, podemos calcular tambin los efectos marginales sobre la probabilidad de estar censurado:

Cuadro 9.9
Efecto Marginal sobre Probabilidad de estar Censurado

Cada hijo menor de dos aos aumenta en 17.3 puntos porcentuales la probabilidad
de no trabajar, los hijos entre 2 y 6 aos la aumentan en 9.1 puntos porcentuales,
y los hijos entre 6 y 18 aos aumentan en 1.8 puntos porcentuales la probabilidad
de que la mujer casada no trabaje. Cada ao de edad aumenta en 0.95 puntos
porcentuales de que la mujer casada no trabaje, y cada ao de escolaridad disminuye en 2.9 puntos porcentuales la probabilidad de que la mujer casada no trabaje.
Ahora estimaremos el modelo para la muestra truncada, el comando en STATA para hacer una regresin truncada es:

truncreg depvar [indepvars] [if] [in] [weight] [, options]


202

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

El Cuadro 9.10 muestra los resultados de la estimacin, los coecientes se pueden


interpretar directamente como los efectos marginales sobre la variable dependiente latente.

Cuadro 9.10
Estimacin Muestra Truncada

Y el cuadro 9.11 los efectos marginales sobre la media condicional de la variable


truncada:

Cuadro 9.11
Efectos Marginales Variable Truncada

203

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

9.2.6. Test de Normalidad y Homocedasticidad


Los supuestos claves del Modelo Tobit son la normalidad y homocedasticidad,
por lo cual es clave testear estos supuestos y validar la utilizacin de este modelo.
En el contexto del modelo de regresin lineal sin censura, los residuos al cuadrado
son utilizados para testear homocedasticidad y la tercera y cuarta potencia de
los residuos para testear normalidad (ya que se relacionan con los momentos
de kurtosis y asimetra). Para testear homocedasticidad y normalidad en este
contexto se construirn los residuos para utilizar las potencias de ellos en la
formulacin de los tests. Los residuos (normalizados)
i tendrn la siguiente forma
para las variables no censuradas:

i =

yi xi

Para las variables censuradas por la izquierda en

L,

el primer, segundo, tercer y

cuarto momento de los errores normalizados son:


Momentos

Expresin

E[i |di = 0]
E[2i |di = 0]
E[3i |di = 0]
E[4i |di = 0]

i
1 zi i
(2 + zi2 )i
3 (3zi + zi3 )i

donde

i =
El comando

bctobit

(xi /)
1(xi /)

zi =

Lxi

de STATA realiza este test, la hiptesis nula es que el

Modelo Tobit es vlido, es decir, cumple con los supuestos de normalidad y homocedasticidad:

204

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

En este caso, el Modelo Tobit es rechazado fuertemente. Se pueden utilizar alternativas no paramtricas o semi-paramtricas para la estimacin.
El Test de Normalidad puede ser realizado de manera independiente a travs
de los siguientes comandos:
1- Se estima el modelo tobit:

global xlist t_hijos0_2 t_hijos2_6 t_hijos6_18 edad esc


tobit o16_horas $xlist, ll(0)
2- Se genera una variable binaria que toma valor 1 para las observaciones no
censuradas y cero para las observaciones censuradas:

g dy=1 if o16_horas>0
replace dy=0 if o16_horas<=0
replace dy=. if o16_horas==.
3- Con el modelo tobit estimado se obtiene la prediccin lineal

x :

predict xb, xb
4- Se rescata el vector de coecientes estimados:

matrix btobit=e(b)
Notemos la estructura de esta matriz:

5- Con el nombre

e(df_m) se guarda la informacin sobre el nmero de variables

explicativas excepto la constante, por lo cul podemos rescatar la estimacin de


sigma de la siguiente manera:

scalar sigma=btobit[1,e(df_m)+2]
205

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

6- Se dene el punto de censura, en este caso es cero:

scalar gamma=0
y se estandariza con la media y desviacin estndar:

generate threshold=(gamma-xb)/sigma
7- Se genera el inverso de mills (i ):

generate lambda=normalden(threshold)/normal(threshold)
8- Se calculan los residuos normalizados para las observaciones no censuradas:

generate uifdyeq1=(o16_horas-xb)/sigma if dy==1


generate gres1=uifdyeq1
9- Se calcular los residos normalizados para las observaciones censuradas:

replace gres1=-lambda if dy==0


10- Luego se calcular el segundo momento de los residuos normalizados:

generate gres2=uifdyeq1^2-1
replace gres2=-threshold*lambda if dy==0
11- El tercer momento de los residuos normalizados ser:

generate gres3=uifdyeq1^3
replace gres3=-(2+threshold^2)*lambda if dy==0
12- Y el cuarto momento de los residuos normalizados es:

generate gres4=uifdyeq1^4-3
replace gres4=-(3*threshold+threshold^3)*lambda if dy==0
13- Para aplicar el test de normalidad se debe hacer una regresin de unos como
variable dependiente contra los scores (primera derivada de la funcin de verosimilitud) de cada uno de los parmetros del modelo. En este modelo los score

206

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

corresponde a

i xi ,

los que pueden ser calculados de la siguiente manera para

cada una de las variables explicativas del modelo:

foreach var in $xlist {


generate score`var'=gres1*`var'
}
El score de la constante del modelo es
14- Se hace la regresin auxiliar,

gres1 y de la desviacin estndar es gres2.


veces el

R2

de esta regresin corresponde

al estadstico LM para la hiptesis nula de normalidad:

global scores score* gres1 gres2


generate one=1
reg one gres3 gres4 $scores, nocon

Se rechaza la hiptesis nula de normalidad.


Por otra parte, el test de homocedasticidad se puede realizar mediante los siguientes comandos:

foreach var in $xlist {


generate score2`var'=gres2*`var'
}
global scores2 score* score2* gres1 gres2
reg one gres3 gres4 $scores2, nocon

207

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

Se rechaza la hiptesis nula de homocedasticidad.

9.3.

Modelos de Seleccin

Cuando la muestra de la que disponemos no es aleatoria en el sentido que


de manera intencional o no intencional nos hemos quedado con una parte de la
poblacin que no es representativa del resto, hablamos de que existe un problema
de seleccin en la muestra.

9.3.1. Modelo de Seleccin Bivariado (Tobit Tipo II)


Este modelo generaliza el modelo Tobit Tipo I mostrado en la seccin anterior
introduciendo una variable latente que determina la censura, y que es diferente a
la variable latente de inters. En denitiva la probabilidad de estar censurado es
modelado a travs de otra variable.
Sea

y2

la variable latente de inters. En el Modelo Tobit Tipo I la variable era


y2 > 0. En este modelo, llamado Tobit Tipo II o Modelo de

Heckman, se introduce la variable latente y1 y la variable de inters es observa


da slo si y1 > 0. Por ejemplo, en la aplicacin de la seccin anterior podemos

pensar en y1 como la variable que determina que la mujer casada trabaje o no,

y la variable y2 cuantas horas trabajar, en principio ests dos variable no tiene


observada slo si

porque ser iguales ya que hay factores o variables que son relevantes para explicar
la decisin de participar o no, pero que una vez que la mujer est trabajando no
son relevantes para explicar la cantidad de horas que decide trabajar.
La ecuacin de participacin en el Modelo Tobit Tipo II es:

{
y1 =

1
0

si
si

y1 > 0
y1 0

208

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

y la ecuacin de resultado (outcome) es la siguiente:

y2 =

y2

y1 > 0
y1 0

si
si

Luego, cada una de las variables latentes es funcin lineal de las variables explicativas y de un trmino de error:

y1 = x1 1 + u1
y2 = x2 2 + u2
El problema consiste en estimar

cuando los errores de ambas ecuaciones estn

correlacionados, ya que un shock en u1 genera cambios en u2 e y1 lo que a su


vez cambia

y2 ,

de esta forma se nos hace imposible identicar correctamente

Notemos que el Modelo Tobit Tipo I es un caso especial cuando y1 = y2 .

2 .

El modelo puede ser estimado de manera consistente realizando supuestos adicionales sobre la distribucin conjunta de los errores, en particular el Modelo Tobit
Tipo II o Heckman asume que los errores son homocedsticos y se distribuyen
conjuntamente normal:

u1
u2

[[
N

0
0

] [
]]
1 12
,
12 22

Al igual que en el Modelo Probit 1 es normalizada en 1 dado que slo se observa

el signo de y1 (observamos y1 igual a 1 si es positiva e y1 igual a cero si es negativo).


La funcin de densidad de

y2

que nos permite construir la funcin de verosi-

militud y estimar los coecientes

f (y2 ) =

es:

f (y2 |y1 > 0) P r[y1 > 0]


P r[y1 0]

si
si

y1 > 0
y1 0

Luego, la funcin de verosimilitud es:

L=

{P r[y1 0]}1y1i {f (y2i |y1 > 0) P r[y1 > 0]}y1i

i=1

9.3.2. Medias Condicionales en Modelo Tobit Tipo II


y1

En este modelo tenemos que la variable

> 0,

y2

est truncada para los valores de

de esta forma la media condicional de la variable de inters truncada es:

E[y2 |x, y1 > 0] = E[x2 2 + u2 |x1 1 + u1 > 0]


= x2 2 + E[u2 |u1 > x1 1 ]
209

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

En la medida que los errores no estn correlacionados el segundo trmino es igual


a

E[u2 ] = 0,

y la estimacin por MCO del modelo de inters nos lleva a una esti-

macin consistente de 2 , sin embargo si la correlacin existe la media truncada no

es igual a x2 2 y necesitamos considerar el problema de seleccin en la estimacin.


Heckman (1979) not que bajo los supuestos de normalidad conjunta de los errores se puede determinar la siguiente relacin entre ellos:

u2 = 12 u1 +
donde

es independiente de

u1 .

Utilizando este resultado:

E[y2 |x, y1 > 0] = x2 2 + E[(12 u1 + )|u1 > x1 1 ]


= x2 2 + 12 E[u1 |u1 > x1 1 ]
= x2 2 + 12 (x1 1 )
Luego, la esperanza incondicional (censurada) de

y2

se obtiene de la siguiente

manera:

E[y2 |x] = Ey1 [E[y2 |x, y1 ]]


= P r[y1 0|x] 0 + P r[y1 > 0|x] E[y2 |x, y1 > 0]
= (x1 1 )x2 2 + 12 (x1 1 )

9.3.3. Estimador Heckman Dos Etapas (Heckit)


Como notamos en la seccin anterior, la media condicional de la variable de

inters truncada no es igual a x2 2 a menos que 12 = 0. Si existe correlacin entre


los errores se debe incluir el trmino correspondiente al inverso de Mill. De esta
forma, el procedimiento de Heckman en dos etapas consiste en estimar el modelo

por MCO pero incluyendo la variable omitida correspondiente a (x1 1 ), lo que


requiere de un paso previo consistente en estimar 1 mediante un modelo probit
de

y1

sobre

x1 ,

con lo cual se puede construir el inverso de Mill:

(x1 1 )
(x1 1 ) =
(x1 1 )
As, usando slo los valores positivos de

y2

se estima el siguiente modelo por

MCO:

y2i = x2i 2 + 12 (x1 1 ) + i


210

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

Notemos que

12

ser estimada como el coeciente que acompaa al inverso de

Mill, luego se puede testear si este coeciente es cero, en caso de no poder rechazar la hiptesis nula no es necesaria la correccin por seleccin, ya que los errores
no estn correlacionados entre ellos.
Esta estimacin ser consistente pero menos eciente que la estimacin por Mxima Verosimilitud.

9.3.4. Identicacin
Dado que el inverso de Mill es una funcin casi lineal del argumento si se
ocupan exactamente las mismas variables en

x2

x1

se genera un problema de

multicolinealidad, es por eso que la estimacin del Modelo Tobit Tipo II requiere
de una variable de exclusin, es decir, de una variable que este en la ecuacin de

participacin (y1 ) pero no la en la ecuacin de resultado (y2 ). Por ejemplo, en el


modelo de horas trabajadas los costos jos de participar puede ser la variable de
exclusin.

9.3.5. Efectos Marginales


Simplemente para mejorar la notacin agruparemos las variables x1 y x2 en

un slo conjunto de variables llamado x, luego x1 1 puede ser escrito como x 1

y x2 1 como x 2 , donde 1 tiene ceros para las variables x2 y 2 tiene ceros para
las variables

x1 .

Luego, diferenciando con respecto a

la media condicional de inters (latente

o truncada en cero) se obtienen los efectos marginales:

Media Condicional Latente:


E[y2 |x] = x 2
El efecto marginal esta dado por

2 .

Media Condicional Truncada:


E[y2 |x, y1 = 1] = x 2 + 12 (x 1 )
El efecto marginal esta dado por:

E[y2 |x, y1 = 1]
= 2 12 (x 1 )[x 1 + (x 1 )]1
x
211

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

9.3.6. Estimacin Modelo Tobit Tipo II en STATA


Utilizaremos los datos de la Encuesta Casen 2009 para estimar una ecuacin
de salarios de las mujeres, en funcin de la escolaridad, la edad, y el nmero de
hijos que la mujer tiene en diferentes edades. En este caso la variable dependiente logaritmo del salario por hora (lyph) est truncada, slo observamos valores
positivos de salarios para las mujeres que trabajan, y no hay informacin para
las mujeres que no trabajan. La decisin de trabajar, no es exgena sino que
depende de un proceso de decisin de la mujer, esta ecuacin de participacin
depende de no observables que con alta probabilidad estn correlacionados con
los no observables de la ecuacin de salarios. De esta forma, nos encontramos en
un contexto de un modelo de seleccin, la variable de exclusin utilizada ser una
dummy que indica si la mujer est casada o no.
Primero generamos las variables de inters:

use casen2009.dta, clear


g hijos0_2=1 if pco2==3 & edad>=0 & edad<=2
g hijos2_6=1 if pco2==3 & edad>2 & edad<=6
g hijos6_18=1 if pco2==3 & edad>6 & edad<=18
egen nucl=group(region provincia comuna zona segmento folio nucleo)
replace hijos0_2=0 if hijos0_2==.
replace hijos2_6=0 if hijos2_6==.
replace hijos6_18=0 if hijos6_18==.
egen t_hijos0_2=sum(hijos0_2), by(nucl)
egen t_hijos2_6=sum(hijos2_6), by(nucl)
egen t_hijos6_18=sum(hijos6_18), by(nucl)
g casada=1 if ecivil==1
replace casada=0 if ecivil!=1
keep if pco2==1 | pco2==2
keep if sexo==2
g o16_horas=o16/7*30
g yph=yopraj/o16_horas
212

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

g lyph=ln(yph)
El comando en STATA que nos permite estimar un Modelo Tobit Tipo II es:

heckman depvar [indepvars], select(varlist_s) [twostep]


Las variables explicativas comunes de la ecuacin de participacin (o seleccin)
y de la ecuacin de resultados son agrupadas a travs de la siguiente macro:

global xlist esc edad t_hijos0_2 t_hijos2_6 t_hijos6_18


El Cuadro 9.12 se presenta la estimacin del modelo de inters, se utilizan 75330
observaciones de mujeres en la estimacin, de las cuales 51161 estn truncadas
o son mujeres que no tienen observaciones de salarios porque no trabajan. Se
puede notar que el test de correlacin cero entre los errores de la ecuacin de
seleccin y de resultados rechaza fuertemente la hiptesis nula de que no existe
correlacin, validando la correccin por seleccin que realiza esta metodologa
en la estimacin de la media condicional. Podemos notar que todas las variables
resultan ser signicativas excepto la cantidad de hijos entre 6 y 18 aos en la
ecuacin de inters. Los coecientes estimados para la variable de inters (o la
ecuacin de resultados) se pueden interpretar directamente como los efectos marginales sobre la variable de inters latente, sin embargo, los coecientes estimados
en la ecuacin de seleccin (o participacin) no pueden ser interpretados como
los efectos marginales sobre la probabilidad de participar, por las mismas razones
que se dieron en la estimacin de los modelos probit, debemos solicitar el clculo de estos efectos marginales a travs del comando

mfx,

lo mismo si queremos

estudiar los efectos marginales sobre la media condicional de la variable truncada.


Primero interpretemos los resultados obtenidos sobre la variable de inters latente. Se obtiene un retorno a la educacin de las mujeres de 9.3 %, cada ao
adicional de edad aumenta el salario por hora en aproximadamente 0.9 %, tener
hijos ms pequeos tiene un impacto positivo sobre salarios por hora.

213

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

Cuadro 9.12
Modelo Heckman por Mxima Verosimilitud

El Cuadro 9.13 muestra los efectos marginales de las variables explicativas sobre
la probabilidad de participacin o seleccin. Cada ao de escolaridad aumenta
en 3 puntos porcentuales la probabilidad de que una mujer trabaje, cada ao de
edad disminuye en 0.5 puntos porcentuales la probabilidad, por cada hijo entre
0 y 2 aos se reduce la probabilidad de que una mujer participe en 20.8 puntos
porcentuales, cada hijo entre 2 y 6 aos la reduce en 9.6 puntos porcentuales,
y cada hijo entre 6 y 18 aos la reduce en 0.7 puntos porcentuales. Finalmente,
estar casada reduce en 8.3 puntos porcentuales la probabilidad de que una mujer
trabaje.

214

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

Cuadro 9.13
Efectos Marginales sobre Probabilidad de Participacin

El Cuadro 9.14 muestra los efectos marginales sobre la media condicional truncada
si es que este anlisis fuese de inters:

Cuadro 9.14
Efectos Marginales sobre Media Condicional Truncada

9.4.

Modelo de Probabilidad con Seleccin

Tambin es posible estimar modelos donde la variable dependiente de inters es binaria y existe seleccin en la muestra, conocidos como Modelos Probit
Bivariados con Seleccin. Este caso es bastante similar al Modelo Tobit Tipo II,
slo observamos

y1

si es que

y2 = 1,

la diferencia es que

y1

es una variable bina-

ria. Existen tres posibles resultados observados en la muestra con sus respectivas

215

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

probabilidades:

y1 = 0
P r(y1 = 0) = (x 1 )
y1 = 1, y2 = 0 P r(y1 = 1, y2 = 0) = (x 1 ) 2 (x 1 , x 2 , )
y1 = 1, y2 = 1 P r(y1 = 1, y2 = 0) = 2 (x 1 , x 2 , )
Por lo cual la funcin de verosimilitud en este contexto es:

lnL =

{y1i y2i ln(x 1 , x 2 , ) + y1i (1 y2i )ln[(x 1 ) 2 (x 1 , x 2 , )]

i=1

+(1 y1i ) y2i ln(x 1 )}


En STATA podemos estimar este tipo de modelo a travs del siguiente comando:

heckprob depvar indepvars [if] [in] [weight] , select(varlist_s)


Utilizando los datos de la EPS 2006 se estima un modelo para la probabilidad
de que un trabajador independiente (empleador o cuenta propia) cotice para el
sistema de pensiones. As, la variable de inters es binaria ya que toma valor 1
si la persona cotiza y cero sino cotiza, pero al estar estimando el modelo slo
para los trabajadores independientes existe una seleccin en la muestra que debe
ser corregida para estimar de manera consistente los parmetros. El Cuadro 9.15
muestra los resultados de estimar el modelo de inters a travs del siguiente comando:

heckprob cotiza edad06 empleador dcasado06 cashom06 dumjefe06


jefehombre06 part_time tfirma_2 tfirma_3 tran_indep seguro_vida
ting_2 -ting_5 d_ahorro d_progreso hpobre corto_plazo,
select(indep=edad06 dumjefe06 dhombre averso) nolog
Podemos notar que del total de 9766 observaciones 8309 estn censuradas, es
decir, no son trabajadores independientes, la hiptesis nula de no correlacin entre los errores es rechazada, lo que valida la correccin a las estimaciones que
realiza esta metodologa. No es posible interpretar los efectos marginales a travs
de estos resultados ya que son modelos de probabilidad donde los coecientes
estimados no representan los efectos marginales. Para obtener los efectos marginales debemos utilizar la funcin

mfx de STATA, donde podemos pedir los efectos

marginales sobre la probabilidad incondicional de que la variable de inters sea


igual a 1, la probabilidad condicionada (truncada) de que la variable de inters
sea igual a 1, y sobre la probabilidad de seleccin. Los resultados se presentan en
los Cuadros 9.16, 9.17, y 9.18.

216

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

Cuadro 9.15
Estimacin Probit Bivariado con Seleccin

217

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

Cuadro 9.16
Efectos Marginales sobre Probabilidad Incondicional

Cuadro 9.17
Efectos Marginales sobre Probabilidad Condicional (Truncada)

218

Microeconometra Aplicada
Centro de Microdatos

Capitulo 9: Variable Dependiente Limitada

Cuadro 9.18
Efectos Marginales sobre Probabilidad de Seleccin

219

Captulo 10
Datos de Panel
Los Datos de Panel consisten en observaciones repetidas del mismo corte transversal, tpicamente individuos, empresas, colegios, etc. Otra forma de llamar estos
tipos de datos es Datos Longitudinales. En estudios a nivel microeconmico generalmente los paneles son cortos, es decir, el corte transversal de individuos es
observados un nmero reducido de periodos.
La mayor ventaja de los Datos de Panel es incrementar la precisin de las estimaciones, debido al incremento en el nmero de observaciones al combinar (pooling) varios periodos de tiempo para cada individuo. Sin embargo, hay que tener
presente para la realizacin de inferencia estadstica que en estos datos existir
correlacin en los errores en el tiempo para los mismos individuos, y esta correlacin debe ser considerada al momento de computar los errores estndar, si esto no
es considerado los errores estndar sern subestimados y los estadsticos

t inados.

La segunda ventaja de los Datos de Panel es que permite estimar de manera


consistente efectos jos en el modelo, lo que permite controlar por no observables heterogneos entre los individuos y que puedan estar correlacionados con las
otras variables explicativas. Es decir, nos permite corregir el sesgo por omisin
de variables relevantes sin necesidad de usar variables instrumentales.Este efecto
individual tambin se puede suponer como una variable aleatoria distribuida de
manera independiente de las variables explicativas, en este caso el efecto individual se llama efecto aleatorio, tienes supuestos ms fuerte pero permite incluir
variables explicativas que no varan en el tiempo como regresores y estimar de
manera consistente sus coecientes.

220

Microeconometra Aplicada
Centro de Microdatos

Capitulo 10: Datos de Panel

10.1.

Modelos de Datos de Panel

Los modelos de Datos de Panel entregan informacin sobre el comportamiento


individual a travs del tiempo y a travs de los individuos. El modelo de Datos
de Panel ms general donde el intercepto y coecientes varan entre individuos y
en el tiempo es:

yit = it + xit it + uit

i = 1, ..., N. t = 1, ..., T.

Sin embargo, este modelo no es estimable ya que posee mayor cantidad de parmetros que observaciones, se requieren hacer supuestos adicionales para estimar
este modelo, lo que deriva a los diferentes modelos de datos de panel.

10.1.1. Modelo Pooled


Este es el modelo mas restrictivo donde se asume que todos los coecientes
son constantes (supuesto de los modelos de corte transversal):

yit = + xit + uit


Si la especicacin es correcta y los regresores no estn correlacionados con el
trmino de error, los coecientes pueden ser estimados de manera consistente por
pooled-MCO. Pero hay que tener cuidado con el clculo de los errores estndar
por la presencia de correlacin entre los errores.

10.1.2. Dummies Individuales y de Tiempo


En este modelo se permite que el intercepto vara entre individuos y en el
tiempo, pero los coecientes que acompaan a las variables explicativas siguen
siendo constantes:

yit = i + t + xit + uit


el que tambin puede ser especicado de la siguiente manera:

yit =

i=1

j dj,it +

s ds,it + xit + uit

s=2

N dummies individuales dj,it que toman valor 1 si i=j y cero en otro caso, y
(T 1) dummies de tiempo ds,it que toman valor 1 si t = s y cero en otro caso.
El modelo no incluye intercepto. El problema es cuando N es muy grande.
con

221

Microeconometra Aplicada
Centro de Microdatos

Capitulo 10: Datos de Panel

10.1.3. Modelos de Efecto Fijo y Efecto Aleatorio


Estos modelos se conocen como modelo de efectos individuales:

yit = i + xit + it
donde

it

sonde independientes sobre

t.

Las dummies de tiempo pueden ser

incluidas dentro de los regresores. Los efectos individuales

son variables alea-

torias que capturan la heterogeneidad no observable.


La primera variante de este modelo asume que los
variables explicativas del modelo

xit ,

i estn correlacionados con las

este modelo es llamado de efecto jo, y los

efectos individuales son parmetros a estimar. La segunda variante de este modelo asume que los efectos individuales son variables aleatorias no correlacionadas
con las restantes variables del modelo, es llamado modelo de efectos aleatorios.

10.2.

Estimadores de Datos de Panel

A continuacin se introducirn algunos estimadores para los coecientes


Las variables explicativas pueden ser invariantes en el tiempo
tiempo e individuos

xit ,

xi

y variantes en el

pero algunos estimadores sern capaz de identicar los

coecientes que acompaan a las variables que varan en el tiempo solamente.

10.2.1. MCO Pooled


Este estimador consiste en aplicar MCO al modelo:

yit = + xit + uit


con

0,

N T observaciones. Este estimador ser consistente en la medida que Cov(uit , xit ) =


N o T , y el modelo especicado (intercepto y coecientes cons-

tantes) sea el correcto. Sin embargo, las varianza del estimador MCO no sern
apropiadas ya que los errores estn correlacionados, estos deben ser calculados de
manera robusta. Si el modelo correcto es el de efecto jo, este estimador no ser
consistente:

yit = + xit + (i + it )
ya que los efectos jos (i ) estn correlacionados con las variables explicativas,
por lo cul el error del modelo donde se omiten los efectos individuales

222

(i +it )

Microeconometra Aplicada
Centro de Microdatos

Capitulo 10: Datos de Panel

estarn correlacionados con las variables explicativas.


En resumen, el estimador MCO Pooled ser consistente si el modelo correcto
es de coecientes constantes o de efectos aleatorios, sin embargo, el calculo de
las varianzas debe ser corregido para la realizacin correcta de la inferencia. Si el
modelo correcto es el de efecto jo, el estimador ser inconsistente.

10.2.2. Estimador Between


El Estimador Between se utiliza en paneles cortos, utiliza la variacin del corte
transversal para estimar

Partiendo del modelo de efectos individuales:

yit = i + xit + it
se toma el promedio de las

observaciones para cada

i:

y i = + xi + (i + i ) i = 1, ..., N.
T
donde

yi =

t=1

yit

T
,

i =

t=1 it

T
, y

xi =

t=1

xit

De esta forma, el Estimador Between utiliza la variacin entre individuos para

, y consiste en hacer una regresin por MCO de y i sobre una constante


Este estimador ser consistente si el modelo de coecientes constantes o de

estimar
y

xi .

efectos aleatorios es el correcto, por el contrario si el modelo de efectos jos es


el correcto el estimador ser inconsistente ya que existe correlacin entre

(i + i ).

xi

10.2.3. Estimador de Efectos Fijos o Within


Al contrario del estimador MCO-Pooled o el estimador Between, el estimador
Within utiliza la caracterstica de panel de los datos. Esto lo hace midiendo la
asociacin entre las variaciones especcas del individuo de sus variables explicativas con respecto al promedio individual en el tiempo y las variaciones de la
variable dependiente con respecto a su promedio. Es decir, partiendo del modelo
de efectos individuales:

yit = i + xit + it
Se toman los promedios individuales a travs del tiempo:

y i = i + xi + i
223

Microeconometra Aplicada
Centro de Microdatos

Capitulo 10: Datos de Panel

Y al modelo se le restan los promedio, obteniendo el modelo en desvos:

yit y i = (xit xi ) + it
El estimador Within consiste en estimar por MCO el modelo anterior, y se obtiene un estimador consistente de

cuando el modelo de efectos jos es el correcto.

Si existe inters en estimar los efectos jos y la muestra de individuos no es


muy grande, se puede realizar el estimador de variables dummies por MCO incorporando al modelo N variables dummies, una para cada individuo.
La mayor limitacin del estimador Within es que los coecientes de los regresores que no varan en el tiempo no estn identicados, razn por la cul muchos
estudios preeren usar el estimador de efectos aleatorios, sin embargo este estimador ser inconsistente si el verdadero modelo es de efecto jo.

10.2.4. Estimador de Primeras Diferencias


El estimador de diferencias tambin explota la caracterstica de panel de los
datos, este tipo de estimador mide la relacin entre la variacin individual de
las variables explicativas y la variacin individual de la variable dependiente.
Partiendo del modelo con efectos individuales:

yit = i + xit + it
y tomando restando el primer rezago del modelo:

yi,t1 = i + xi,t1 + i,t1


se obtiene el modelo en primeras diferencias:

yit = xit + it
El estimador de primeras diferencias consiste en estimar por MCO el modelo
anterior, el que entrega una estimacin consistente de

si el modelo de efecto

jo es el correcto pero al igual que el estimador Within los coecientes de los
regresores que no varan en el tiempo no estn identicados. Este estimador es
menos eciente que el estimador Within para

224

T > 2.

Microeconometra Aplicada
Centro de Microdatos

Capitulo 10: Datos de Panel

10.2.5. Estimador de Efectos Aleatorios


El estimador de efectos aleatorios tambin explota la caracterstica de panel
de los datos. Comenzando con el modelo de efectos individuales:

yit = i + xit + it
el estimador de efectos aleatorios asume que

son iid. El estimador MCO-

Pooled es consistente en este contexto pero el estimador MCG-Pooled es ms


eciente. El estimador MCG factibles del modelo de efectos aleatorios es conocido
como el estimador de efectos aleatorios el que se obtiene al estimar por MCO el
siguiente modelo transformado:

donde

= (1 )
+ (xit x
i ) + it
yit y
i
i + (it
i ) es asintticamente iid,
it = (1 )

es la estimacin

consistente de:

=1
2 + T 2
Si el modelo de efectos aleatorios es el correcto este estimador es consistente y
eciente, sin embargo, si el estimador de efectos jos es el correcto el estimador
es inconsistente.

10.3.

Test de Hausman

En el modelo de efectos individuales presentado en las secciones anteriores,


los principales estimadores utilizados son el estimador de Efectos Fijos (Within)
y el estimador de Efectos Aleatorios. El estimador de Efectos Fijos es consistente
cuando existe correlacin entre los efectos individuales y las variables explicativas,
sin embargo, no permite identicar los coecientes de las variables explicativas
que son constantes en el tiempo para cada individuo. El estimador de Efectos
Aleatorios es inconsistente si existe correlacin entre las variables explicativas del
modelo y el efecto individual, asume que los efectos individuales son iid, pero
bajo este supuesto es el estimador ms eciente.
El Teste de Hausman nos permite testear si el estimador de Efectos Aleatorios
es vlido en el modelo y datos estimado. La hiptesis nula de este test es que
los efectos individuales no estn correlacionados con las variables explicativas, es
decir, que el estimador de Efectos Aleatorios es vlido. En particular la hiptesis
nula es que el estimador de Efectos Fijos y de Efectos Aleatorios son iguales, ya
que bajo el modelo de Efectos Aleatorios ambos estimadores son consistentes.

225

Microeconometra Aplicada
Centro de Microdatos

Capitulo 10: Datos de Panel

10.4.

Estimacin de Datos de Panel en STATA

Para esta seccin se utilizar una muestra de 595 individuos del Panel Study
of Income Dynamics (PSID) observada durante 7 aos 1976-1982 para estudiar
los determinantes de los salarios.

10.4.1. Formato de la base de datos


Para trabajar con Datos de Panel en STATA los datos deben ser organizados
en formato long, es decir, cada observacin en la base de datos corresponde a
un individuo en un ao puntual.
Primero abramos la base de datos:

use mus08psidextract.dta, clear


Luego veamos el formato en que debe estar la base de datos:

Cuadro 10.1
Orden Base de Datos Panel

La primera observacin corresponde al individuo 1 en el primer ao, la segunda


observacin corresponde al mismo individuo 1 pero en el segundo ao, etc.
Para utilizar los comandos de panel de STATA, los que son identicados por
comenzar con las letras

xt,

primero es necesario indicar al programa que se dis-

pone de ese formato de datos a travs del comando

226

xtset:

Microeconometra Aplicada
Centro de Microdatos

Capitulo 10: Datos de Panel

Cuadro 10.2
Formato Datos de Panel STATA

10.4.2. Descripcin de los datos


Las variables dependientes y explicativas podran varan en el tiempo y entre
individuos. La variacin en el tiempo o a nivel individual se denomina Within,
y la variacin entre individuos se denomina Between. Esto es importante ya que
nos ayuda a determinar que tipo de estimador ser el ms apropiado.
La varianza total de una variable en torno a su media puede ser descompuesta en la variacin de los individuos en el tiempo (within) y la variacin entre
individuos. Mediante el comando

xtsum podemos obtener esta descomposicin de

varianza para cada una de las variables que nos interese en la base de datos, tal
como se muestra en el Cuadro 10.3
Las variables explicativas que no varan en el tiempo tienen 0 variacin Within, como la variable

id

(identicador individual) y

ed

(aos de educacin), y

las variables que no varan entre individuos tienen 0 varianza Between como por
ejemplo

(identicador del ao). Para todas las dems variables excepto

(semanas trabajadas) la varianza Between es mayor a la varianza Within.

227

wks

Microeconometra Aplicada
Centro de Microdatos

Capitulo 10: Datos de Panel

Cuadro 10.3
Summarize Within y Between en STATA

El comando

xttab entrega una manera adicional de analizar la variacin Between

y Within de las variables, por ejemplo:

Cuadro 10.4
Tabulate Within y Between en STATA

228

Microeconometra Aplicada
Centro de Microdatos

Capitulo 10: Datos de Panel

La tabulacin Overall indica que un 71 % de las 4165 observaciones (aoindividuo) tienen la variable south=0, y el restante 29 % tienen south=1. La
parte Between de la tabla nos indica que un 72 % de los 595 individuos tiene
south igual a 0 al menos una vez y un 31 % tiene south igual a 1 al menos una vez,
el porcentaje total de esta tabla es 102.52 % ya que un 2.52 % de los individuos
(15 individuos) vivieron un tiempo en el sur y un tiempo no en el sur, por lo cual
estn contabilizados dos veces. Finalmente, la parte within de la tabla indica
que un 95 % de los individuos siempre vivieron en el sur, y un 99 % nunca vivi
en el sur, en el periodo de tiempo considerado. La variable south casi no tiene
variacin en el tiempo.

Pooled-MCO con errores estndar robustos


A continuacin estimaremos un modelo para explicar el logaritmo del salario
en funcin de la educacin, las semanas trabajadas, experiencia y experiencia al
cuadrado. Primero este modelo ser estimado por Pooled-MCO, es decir, modelo
que considera intercepto y coecientes constantes, pero se corrige la opcin de
calculo de varianzas para que estas sean robustas. El Cuadro 8.5 muestra los
resultados de la estimacin de este modelo.

Cuadro 10.5
Estimacin Pooled-MCO

Los resultados nos muestran que el salario se incrementa con la experiencia hasta
los 31 aos

(0,044675/(20,0007156) y luego disminuye. Los salarios se incremen-

tan en un 0.6 % por cada semana adicional trabajada, y el retorno a la educacin


es de 7.6 %.

229

Microeconometra Aplicada
Centro de Microdatos

Capitulo 10: Datos de Panel

Este estimador ser consistente si el modelo verdadero es de coecientes constantes o de efectos aleatorios, pero inconsistente si el modelo es de efectos jos.

Estimacin Within
El estimador Within se obtiene a travs del comando
El default del modelo asume que los errores
opcin

vce(robust)

it

xtreg con la opcin fe.

son iid, pero se puede utilizar la

relaja este supuesto y computa las varianzas robustas ante

problema de autocorrelacin o heterocedasticidad. El Cuadro 10.6 muestra los


resultados de la estimacin por efectos jos.

Cuadro 10.6
Estimacin Within

Recordemos que este estimador es consistente cuando el modelo es de efecto jo,


y existe correlacin entre los efectos individuales y las variables explicativas del
modelo. Notemos que el coeciente de los aos de escolaridad no est identicado,
esto porque la variable no tiene variacin en el tiempo para cada individuo. Todas
la variables que son constantes en el tiempo quedan controladas por el efecto
individual.

sigma_u entrega la estimacin de la desviacin estndar de los efectos


230

Microeconometra Aplicada
Centro de Microdatos

Capitulo 10: Datos de Panel

individuales

sigma_e

entrega la desviacin estndar de

it .

En este caso, la

desviacin estndar de los efectos individuales es bastante superior a la del error


2
del modelo. El output nos presenta el clculo de tres R : Within, Beetween, y
Overall (o Pooled). Dado que estamos estimando el estimador Within debemos
2
tomar el cuenta el primero de ellos, teniendo que Rw = 0,66. Notemos adems
que se nos entrega la correlacin entre los efectos individuales y las variables
explicativas

corr(ui , Xb) = 0,9107 la cul es bastante elevada. Con respecto a la

estimacin de los coecientes se obtiene que la experiencia aumenta el salario pero


a tasas decrecientes, y las semanas trabajadas no resultan ser estadsticamente
signicativas.

Estimacin de Variables Dummies


El estimador Within de

tambin es llamado estimador de Efecto Fijo ya que

se puede mostrar que este estimador es equivalente a la estimacin por MCO de


un modelo que incluye los coecientes

1 , 2 ,...,N

en el modelo de efectos

i = y i xi . En paneles

individuales. La estimacin de los efectos jos es igual a

cortos esta estimacin de los efectos individuales no es consistente ya que depende


slo de las

Ti

observaciones disponibles para calcular los promedios. Sin embargo,

es estimado de manera consistente.

Cuadro 10.7
Estimacin de Variables Dummies

231

Microeconometra Aplicada
Centro de Microdatos

Capitulo 10: Datos de Panel

Otro nombre del estimador Within es estimador de variables dummies, ya que se


puede mostrar que que es equivalente a estimar un modelo de la variable dependiente contra las variables explicativas y

variables dummies individuales.

El Cuadro 10.7 nos muestra la estimacin del modelo de variables dummies. Los
coecientes obtenidos son exactamente iguales, pero las desviaciones estndar
levemente superior.

Estimacin Between
El estimador Between slo utiliza la variacin entre individuos para estimar
los coecientes que acompaan a las variables explicativas, por lo cual los coecientes de las variables que son comunes a los individuos y slo varan en el
tiempo no estarn identicados.
Esta estimacin se obtiene aplicando el comando

xtreg

con la opcin

be,

la

cual no posee una opcin para obtener los errores estndar robustos, pero se
puede utilizar bootstrap

vce(bootstrap).

El Cuadro 8.8 muestra la estimacin

Between del modelo.


El

R2

Between es el pertinente en este caso, el cual indica que el modelo es

capaz de explicar un 33 % de las variaciones de corte transversal de la variable


dependiente. Los coecientes estimados son muy similares a los del modelo Pooled y muy diferentes a los del modelo Within, recordemos que este estimador es
inconsistente si el modelo de efectos jos es el correcto, es decir, existe correlacin
entre las variables explicativas del modelo y los efectos individuales.

Estimacin por Efectos Aleatorios


El estimador de Efectos Aleatorios corresponden a la estimacin Mnimos
Cuadrados Generalizados Factibles (MCO de un modelo transformado) bajo los
supuestos que el efecto individual es iid y el error del modelo tambin es iid. Esta
estimacin ser consistente y eciente bajo estos supuestos, pero inconsistente si
el modelo correcto es de efectos jos. El modelo debe ser transformado por una
estimacin consistente de

:
i = 1

2
+ 2
Ti 2

232

Microeconometra Aplicada
Centro de Microdatos

Capitulo 10: Datos de Panel

de manera de transformar los errores resultantes en errores sin problema de heterocedasticidad y autocorrelacin.

Cuadro 10.8
Estimacin Between

El estimador de efectos aleatorios ocupa la variacin between y within de los


datos, e incluye los casos particulares de Pooled cuando

=0

y Within cuando

= 1.
El estimador de efectos aleatorios se obtiene mediante el comando
la opcin

re.

xtreg

con

El Cuadro 8.9 muestra los resultados de la estimacin por efectos

aleatorios, la estimacin es ms eciente (menores desviaciones estndar) que la


estimacin Within porque tambin utiliza la variacin Between de los datos, los
coecientes estimados dieren del estimador Within, debemos recordar que este
estimador es inconsistente si los efectos individuales son jos.
Luego podemos comparar el modelo de efectos jos y el modelo de efectos aleatorios:

xtreg lwage exp exp2 wks ed, fe vce(robust)


estimates store fe
233

Microeconometra Aplicada
Centro de Microdatos

Capitulo 10: Datos de Panel

xtreg lwage exp exp2 wks ed, re vce(robust)


estimates store re
El Cuadro 10.10 muestra la comparacin de ambos modelos.

Cuadro 10.9
Estimacin por Efectos Aleatorios

Podemos notar que existen algunas diferencias en los coecientes estimados, dado
que el estimador de efecto jo siempre es

consistente y el estimador de efectos

aleatorios slo es consistente bajo el supuesto de que no existe correlacin entre


los efectos individuales y las variables explicativas, si existe una diferencia signicativa es porque el estimador de efectos aleatorios no es apropiado. El estimador
de efectos aleatorios siempre ser ms eciente. Adems, la ventaja del estimador
de efectos aleatorios por sobre el de efectos jos es que el primero permite identicar los coecientes de las variables que no varan en el tiempo.
Para testear si el estimador de efectos aleatorios es apropiado, o en otras palabras se cumple el supuesto de no correlacin entre los efectos individuales y las
variables explicativas se debe realizar un test de Hausman.

234

Microeconometra Aplicada
Centro de Microdatos

Capitulo 10: Datos de Panel

Cuadro 10.10
Comparacin Efectos Aleatorios y Efectos Fijos

Test de Hausman
A travs del comando

hausman

de STATA podemos realizar el test sobre la

hiptesis nula de que el estimador de efectos aleatorios es apropiado. Para esto


se estima el modelo por efectos jos y efectos aleatorios guardando los resultados
a travs del comando

estimates store,

luego se ejecuta el comando:

xtreg lwage exp exp2 wks ed, re


estimates store re
xtreg lwage exp exp2 wks ed, fe
estimates store fe

235

Microeconometra Aplicada
Centro de Microdatos

Capitulo 10: Datos de Panel

Cuadro 10.11
Test de Hausman

En este caso se rechaza la hiptesis nula de efectos aleatorios.

236

Captulo 11
Regresin de Mediana y Cuantiles
Cuando estimamos la relacin entre una variable de inters, la que hemos llamado
variable dependiente, y una o ms variables explicativas, por el mtodo de MCO,
lo que estamos estimando es la media condicional de la variable dependiente:

\
E[Y
+ xi
i |Xi ] =
Sin embargo, en muchos casos puede que nuestro inters no sea solamente la
media de la variable dependiente, sino por ejemplo la mediana o cuantiles de la
misma.
En MCO la funcin que se minimiza es la suma de los errores al cuadrado. En la
regresin de mediana:

\
M ed[Y
med + xi med
i |Xi ] =
se minimiza es la suma de los valores absolutos del error:

mn
,

i=1

|ui | mn |Yi xi |
,

En la regresin de cuantiles:

q\
[Yi |Xi ] =
+ xi
se minimiza la siguiente funcin objetivo:

mn

i:Yi +xi

|Yi xi | +

i:Yi < +xi


237

(1 )|Yi xi |

Microeconometra Aplicada
Centro de Microdatos

Capitulo 11: Regresin de Mediana y Cuantiles

Notar que la regresin de mediana es un caso especial de la regresin de cuantiles


cuando

es 0.5.

La ventaja de la regresin de cuantiles es que permite caracterizar de mejor forma


los datos, y la regresin de mediana, comparado con de la media, es ms robusta
frente a la presencia de outliers.

11.1.

Regresin de Mediana y Cuantiles en STATA

Para la aplicacin de los modelos de regresin de cuantiles se utilizarn datos del logaritmo del gasto mdicos y el logaritmo de gastos totales del hogar,
los datos fueron obtenidos de la encuesta Vietnam Living Standards del Banco
Mundial (1997), y consiste en una muestra de 5.006 hogares.
Cuando realizamos la estimacin por mnimos cuadrados ordinarios de un modelo
de regresin simple entre el logaritmo del gasto mdico y el logaritmo del gasto
total del hogar, obtenemos el siguiente resultado:

Cuadro 11.1
Estimacin MCO

Podemos apreciar que la estimacin MCO de este modelo entrega una elasticidad
del gasto mdico con respecto al gasto total del hogar de un 0.57. Es decir, un
aumento de un 1 % en el gasto total del hogar aumenta en un 0.57 % el gasto en
medicamentos del hogar. Esta estimacin anterior no considera la heterogeneidad

238

Microeconometra Aplicada
Centro de Microdatos

Capitulo 11: Regresin de Mediana y Cuantiles

en estas elasticidades que pueden existir en diferentes niveles de ingresos o de


gasto total del hogar.
El comando

qreg

de STATA nos permite realizar estimaciones por cuantiles,

por ejemplo, a travs del siguiente comando podemos estimar una regresin de
mediana:

Cuadro 11.2
Estimacin de Mediana

Se obtiene que en la mediana de la poblacin un aumento de un 1 % en el gasto


total del hogar incrementa en 0.62 % el gasto medico del hogar. La inferencia
no se puede realizar directamente a travs del output de esta regresin, sino que
debemos realizar bootstrap, con lo cual podemos concluir que la elasticidad de
0.62 sobre la media es estadsticamente signicativa.

239

Microeconometra Aplicada
Centro de Microdatos

Capitulo 11: Regresin de Mediana y Cuantiles

Cuadro 11.3
Bootstrap Estimacin de Mediana

Tambin podemos obtener la elasticidad de los gastos mdicos al gasto total del
hogar para el percentil 25:

Cuadro 11.4
Estimacin de Percentil 25

Y para el percentil 90:

240

Microeconometra Aplicada
Centro de Microdatos

Capitulo 11: Regresin de Mediana y Cuantiles

Cuadro 11.5
Estimacin de Percentil 90

El siguiente grco muestra la relacin lineal estimada entre el logaritmo de gasto


mdico y el logaritmo del gasto total del hogar, para la media, mediana, quantil
25 y quantil 90:

twoway (scatter lnmed lntotal) (lfit predmco lntotal, lcolor(blue))


(lfit predp50 lntotal, lcolor(red)) (lfit predp25 lntotal, lcolor(green))
(lfit predp90 lntotal, lcolor(purple)),
title(Logaritmo gasto mdico y logaritmo gasto total del hogar)

241

Microeconometra Aplicada
Centro de Microdatos

Capitulo 11: Regresin de Mediana y Cuantiles

Grco 11.1
Estimacin de Mediana y Cuantiles

10

15

Logaritmo gasto mdico y logaritmo gasto total del hogar

8
10
Log household total expenditure

mediana
q90

12

mco
q25

Se podra estimar una elasticidad del gasto mdico al gasto total para cada cuantil:

matrix Q=J(99,2,0)
local i=0.01
while `i'<1{
qui qreg lnmed lntotal, quantile(`i')
matrix Q[`i'*100,1]=e(q)
matrix Q[`i'*100,2]=_b[lntotal]
local i=`i'+0.01
}
svmat Q, name(quantile)
rename quantile1 quantile
rename quantile2 beta
242

Microeconometra Aplicada
Centro de Microdatos

Capitulo 11: Regresin de Mediana y Cuantiles

twoway (line beta quantile, msize(vtiny) mstyle(p1) clstyle(p1)),


yline(.5736545, lcolor(red)) title(Beta estimado para cada quantil)

Grco 11.2
Elasticidad para cada Cuantil

.2

.4

beta

.6

.8

Beta estimado para cada quantil

.2

.4

.6

.8

quantile

Podemos apreciar que mientras menor es el nivel de gasto en mdico del hogar
(cuantiles ms bajos), menor es la elasticidad del gasto en mdico con respecto
al gasto total del hogar. La lnea roja del grco representa la estimacin MCO
del coeciente de inters.

243

Captulo 12
Modelos de Datos de Conteo
En muchos contextos econmicos la variable dependiente toma slo valores enteros positivos, es decir, corresponde a una cuanta o conteo de algo y esto es lo
que queremos explicar en funcin de algunas variables explicativas. Cuando la
variable dependiente tiene estas caractersticas no es apropiado utilizar el modelo
de regresin lineal (MCO), este tipo de modelo, al igual que los modelos probit y
logit, son no lineales, por lo cual la forma correcta de estimar este tipo de modelos
es por Mxima Verosimilitud.
Algunos ejemplos de modelo de conteo son:

Estudios de fertilidad: se estudia el nmero de nacimientos y como estos


varan en funcin de la escolaridad de la madre, la edad, y el ingreso del
hogar.
Estudio del nmero de accidentes de una aerolnea como medida de seguridad de la aerolnea, que puede ser explicado por los benecios de la empresa
y la salud nanciera de la misma.
Estudios de demanda recreacional, que modelan el nmero de viajes a lugares recreacionales.
Estudios de demanda por salud, donde se trata de modelar el nmero de
veces que los individuos demandan servicios de salud como nmero de visitas
al doctor o nmero de das en el hospital.

244

Microeconometra Aplicada
Centro de Microdatos

Capitulo 12: Modelos de Datos de Conteo

12.1.

Modelo de Regresin Poisson

La distribucin Poisson es para variables discretas no negativas, de esta forma,


podemos asumir que la variable dependiente tiene este tipo de distribucin para plantear la funcin de verosimilitud. Entonces la variable dependiente tiene
distribucin Poisson, podemos escribir su funcin de masa de probabilidad como:

P r[Y = y] =
es lo que
V [Y ] = , es decir,
donde

e y
y!

y = 0, 1, 2, ...

se denomina intensidad. Notemos adems que

E[Y ] =

se tiene equidispersin o igual media y varianza.

Luego, el Modelo de Regresin Poisson es derivado de la distribucin Poisson


parametrizando la relacin entre el parmetro

y las variables explicativas:

E[yi |xi ] = i = exp(xi )


dado que la varianza de esta variable ser igual a la media, el modelo por construccin ser heterocedstico:

V [yi |xi ] = i = exp(xi )


La funcin de verosimilitud para este modelo es:

lnL =

{yi xi exp(xi ) ln(yi !)}

i=1
Los coecientes estimados de este modelo no representan los efectos marginales
de las variables explicativas sobre la media condicional de la variable dependiente,
los efectos marginales se obtienen de la siguiente manera:

E[yi |xi ]
= exp(xi )k
xk
El modelo de regresin poisson usualmente ser muy restrictivo para los datos de
conteo, el problema fundamental es que la distribucin es parametrizada en trminos de un slo parmetro

, la media y la varianza son iguales a este parmetro.

Usualmente, la varianza excede a la media lo que se conoce como sobredispersin.


Una vez estimado el modelo poisson se puede realizar un test de sobredispersin. Para realizar este test se asume que la varianza de la variable dependiente
es de la forma:

V [yi |xi ] = i + g(i )


245

Microeconometra Aplicada
Centro de Microdatos

Capitulo 12: Modelos de Datos de Conteo

donde

generalmente se asume
que

g() es una funcin desconocida, pero


g() = 2 , luego se testea la hiptesis nula de

es un parmetro desconocido y

g() =

= 0.

Para aplicar este test se estima el modelo poisson, se construye el valor estimado de la media
i = exp(xi , y se realiza la siguiente regresin auxiliar (sin
constante):

g(
i )
(yi
i )2 yi
=
+ ui

i
ui es un trmino de error. Luego se realiza un test t sobre la hiptesis nula
que = 0.

donde
de

12.2.

Estimacin de Modelo Poisson en STATA

El comando en STATA para estimar este tipo de modelos es el siguiente:

poisson depvar [indepvars] [if] [in] [weight] [, options]


Recordemos que por construccin el modelo es heterocedstico por lo cual se
deben calcular las varianzas de manera robusta, para esto se puede utilizar la
opcin

vce(robust).

Para esta aplicacin se utiliza la base de datos del RAND Experimento de Seguros de Salud (RAND Health Insurance Experiment) utilizada por Deb y Trivendi
(2002). El experimento conducido por la Coporacin RAND entre los aos 1974
y 1982, ha sido el experimento social controlado ms grande en el rea de la investigacin en seguros de salud. El objetivo principal del experimento era evaluar
como el uso de los servicios de salud por parte de los pacientes se ve afectado por
los tipos de seguros medicos, los cuales fueron asignados aleatoriamente. En el
experimento los datos fueron recolectados para cerca de 8.000 personas en 2.823
familias. Cada familia fue suscrita a uno de los 14 diferentes planes de salud por
3 o 5 aos. Los planes van desde servicio libre hasta 95 % de cobertura bajo cierto
nivel de gasto (con un tope).
El siguiente grco muestra un histograma con el nmero de visitas al mdico, podemos ver que poco ms del 30 % realiza cero visitas al ao al mdico, y
cerca de un 18 % realiza una visita al ao.

246

Microeconometra Aplicada
Centro de Microdatos

Capitulo 12: Modelos de Datos de Conteo

Grco 12.1
Distribucin Nmero de Visitas

10

Percent

20

30

Distribucin Nmero de visitas a Mdico

20

40
number facetofact md visits
Fuente: RAND Health Insurance Experiment Data

60

80

La siguiente tabla muestra las principales estadsticas de cada una de las variables
que sern utilizadas como factores determinantes en la cantidad de visitas al
mdico realizadas al ao. La variable BLACK toma valor 1 si el jefe de hogar es
de raza negra, la variable AGE corresponde a la edad en aos, FEMALE toma
valor 1 si la persona es mujer, EDUCDEC representa los aos de educacin del
jefe de hogar, MDU es la variable que queremos explicar (variable dependiente)
que mide el nmero de visitas ambulatorias a un mdico, NDISEASE es el nmero
de enfermedades crnicas, PHYSLIM toma valor 1 si la persona tiene limitaciones
fsicas, CHILD toma valor 1 si la persona tiene menos de 18 aos, FEMCHILD
corresponde a la interaccin de la Dummy FEMALE y la Dummy CHILD, LFAM
es el logaritmo del tamao familiar, LPI es el logaritmo del pago anual de incentivo
por participacin, IDP si el plan tiene deducible, LC es el logaritmo del copago,
FMDE es el logaritmo del tope de cobertura sobre 0.01 el copago, HLTHG es 1
si declara que su estado de salud es bueno, HLTHF es 1 si declara su estado de
salud regular, HLTHP si declara estado de salud malo, y LINC es el logaritmo
del ingreso familiar.

247

Microeconometra Aplicada
Centro de Microdatos

Capitulo 12: Modelos de Datos de Conteo

Cuadro 12.1
Estadsticas Descriptivas Variables Explicativas

El siguiente cuadro muestra el resultado de estimar un modelo poisson para explicar el nmero de veces que la persona va al medico al ao en funcin de las
caractersticas de los planes de salud y caractersticas familiares.
Los coecientes estimados no representan los efectos marginales, estos deben ser
computados con el comando

mfx.

EL Cuadro 12.3 muestra la estimacin de los

efectos marginales del modelo. Se encuentra que un incremento de un 1 % en el


copago disminuye en 0.11 las visitas promedio al ao, si el plan tiene deducible
disminuye en 0.4 las visitas promedio al ao, un incremento de un 1 % en el ingreso familiar aumenta en 0.21 las visitas promedio al ao, las mujeres en promedio
van 0.9 veces ms el mdico que los hombres, al igual que las personas menores
de 18 aos de edad. Las personas de raza negra van en promedio al mdico 1.7
veces menos.

248

Microeconometra Aplicada
Centro de Microdatos

Capitulo 12: Modelos de Datos de Conteo

Cuadro 12.2
Estimacin Modelo Poisson

Un supuesto implcito en la distribucin poisson es que la varianza es igual a


la media, es decir, que existe equidispersin, este supuesto es testeable para esto
despus de haber estimado el modelo generamos el valor predicho de la media (
i ):

predict mugorro, n
Luego generamos la variable dependiente de la regresin auxiliar:

g yaux=((MDU-mugorro)^2-MDU)/mugorro
y se hace una regresin de esta variable contra

i . Los resultados

se presentan en

el Cuadro 12.4. AL rechazar la hiptesis nula de que el coeciente que acompaa


a

es igual a cero, se rechaza la hiptesis nula de equidispersin.

249

Microeconometra Aplicada
Centro de Microdatos

Capitulo 12: Modelos de Datos de Conteo

Cuadro 12.3
Efectos Marginales

Cuadro 12.4
Test de sobredispersin

Una vez estimado el modelo este puede ser utilizado para comprar las frecuencias
muestrales con las frecuencias ajustadas para los valores de la variable dependiente (discreta). Las frecuencias ajustadas se obtienen promediando las probabilidades predichas segn el modelo de que cada individuo tenga un valor de la varia-

countfit (descargar
http://www.indiana.edu/~jslsoc/stata/spost9_ado/,

ble dependiente 0, 1, 2, etc..Para esto se utiliza el comando


los ado necesarios en

countt, tstat y prcounts).


El Cuadro 12.5 muestra la comparacin de la proporcin muestral y predicha
segn el modelo de regresin poisson, podemos notar las dicultades del modelo
poisson para predecir las frecuencias muestrales observadas, por ejemplo, en los

250

Microeconometra Aplicada
Centro de Microdatos

Capitulo 12: Modelos de Datos de Conteo

datos efectivos de la variable se observa que un 31.2 % no ha ido al mdico, sin


embargo, el modelo predice que un 10.7 % no ha ido al mdico.

Cuadro 12.5
Comparacin Frecuencia Observada y Predicha

12.3.

Modelo Binomial Negativo

Cuando la varianza de la variable dependiente no es igual a la media el modelo


de regresin poisson no es apropiado, una forma de modelar este problema es
asumir que el parmetro de la distribucin poisson (que corresponde a la media y
a la varianza) corresponde al producto de una funcin determinstica de
variable aleatoria. As, sea
el parmetros

y una

una variable con distribucin poisson condicional en

:
exp()y
f (y|) =
y!

= , donde mu es una funcin de determinstica de x, exp(xi ), y > 0


es iid con funcin de densidad g(|), cuando esta funcin de densidad es gamma
se obtiene el modelo binomial negativo. Cuando = 0 se converge al modelo
donde

poisson.
La media y la varianza de la distribucin binomial negativa son:

E[y|, ] =
V [y|, ] = (1 + )
251

Microeconometra Aplicada
Centro de Microdatos

Capitulo 12: Modelos de Datos de Conteo

la varianza excede la media ya que

12.4.

>0

> 0.

Estimacin Modelo Binomial Negativo en


STATA

Para estimar el modelo de nmero de visitas al mdico utilizando el supuesto de


distribucin binomial negativa con varianza cuadrtica, se debe utilizar el comando

nbreg de STATA. El Cuadro 12.6 muestra el resultado de la estimacin de este

modelo. Los coecientes estimados, al igual que en el modelo poisson, no pueden


ser interpretados como efectos marginales, por lo cul debemos preocuparnos de
calcular los efectos marginales con el comando

mfx

luego de estimar el modelo.

Al nal del output de la regresin se muestra el test sobre la hiptesis nula de


que

es igual a cero, lo que es consistente con un modelo poisson, sin embargo,

en este caso se rechaza la hiptesis nula.

Cuadro 12.6
Modelo Binomial Negativo: visitas mdico

252

Microeconometra Aplicada
Centro de Microdatos

Capitulo 12: Modelos de Datos de Conteo

El Cuadro 12.7 muestra los efectos marginales sobre el nmero de visitas al mdico
estimados mediante el modelo binomial negativo, se encuentra que un incremento
de un 1 % en el copago disminuye en 0.13 las visitas promedio al ao, si el plan
tiene deducible disminuye en 0.36 las visitas promedio al ao, un incremento de
un 1 % en el ingreso familiar aumenta en 0.21 las visitas promedio al ao, las
mujeres en promedio van 0.93 veces ms el mdico que los hombres, al igual que
las personas menores de 18 aos de edad. Las personas de raza negra van en
promedio al mdico 1.8 veces menos.

Cuadro 12.7
Efectos Marginales Binomial Negativo: visitas mdico

253

Microeconometra Aplicada
Centro de Microdatos

Capitulo 12: Modelos de Datos de Conteo

Al igual que en el modelo de regresin poisson podemos comprar las frecuencias


muestrales para los nmero de visitas con las frecuencias estimadas segn el modelo, el Cuadro 12.8 muestra que este modelo logra predecir bastante mejor que
el modelo poisson.

254

Microeconometra Aplicada
Centro de Microdatos

Capitulo 12: Modelos de Datos de Conteo

Cuadro 12.8
Comparacin Frecuencia Observada y Predicha

255

Captulo 13
Mtodos No Paramtricos y
Semi-paramtricos
En esta seccin presentaremos mtodos para el anlisis de datos que buscan realizar la menor cantidad de supuestos sobre el proceso que genera los datos. Los
primeros son los mtodos no paramtricos, los que nos permitirn estimar la densidad de una variable. Tambin se ver la regresin no paramtrica, la que slo
se puede realizar en funcin de una variable explicativa, aunque tericamente
la regresin no paramtrica se puede realizar en funcin de ms de una variable
explicativa, en la prctica esto no es factible. Es por esta razn que surgen los mtodos semi-paramtricos, en los que por ejemplo no se supone una forma funcional
especica para la relacin entre la variable dependiente y explicativa (media, mediana, etc) sino que se deja que los datos revelen esta funcin, estimando los
parmetros beta que forman parte del argumento de esta relacin.

13.1.

Estimacin No Paramtrica de Funciones de


Densidad

La primera aproximacin para estimar la densidad de una variable es mediante


el histograma de la misma, el histograma divide el espacio posible de los valores
de la variable en intervalos de igual distancia y calculando la fraccin de las
observaciones en cada uno de estos intervalos se aproxima la distribucin emprica
de la variable. Sin embargo, el histograma es una estimacin tosca o no suave de
la densidad. El siguiente grco muestra el histograma del logaritmo del ingreso

256

Microeconometra Aplicada
Centro de Microdatos

Capitulo 13: Mtodos No Paramtricos y Semiparamtricos

de la ocupacin principal, obtenido de la encuesta Casen 2009:

Grco 13.1
Histograma

.5

Density

1.5

Logaritmo Ingreso Ocupacin Principal

10

12

14

16

lny

Para obtener una estimacin ms suave de la funcin de densidad en vez de tomar


intervalos de valores de la variable, se podra tomar cada observacin puntual de
1
la variable y darle un peso de
a cada una de estas observaciones, el problema
N
de esta metodologa es que no se le asigna probabilidad a los valores de x que no
son observados en la muestra. Entonces la alternativa que surge a esto es no darle
1
el peso o probabilidad
al punto xi sino a la densidad de la variable entorno a
N
xi . Esto es justamente lo que hace la estimacin KERNEL, obtiene la densidad
emprica de la variable tomando una combinacin de densidades entorno a los
puntos observados de la variable:

1
f(x0 ) =
K
N h i=1
N

Donde

K()

xi x0
h

es la llamado funcin Kernel, y

es el llamado bandwidth. Dentro

de las funciones kernel se encuentra el Gaussiano, Epanechnikov, uniforme, entre


otros. Se ha demostrado que la funcin Kernel ptima es la Epanechnikov. Con
respecto al parmetro de suavizacin

h,

existe una eleccin ptima que corres-

ponden a aquel que minimiza el error cuadrtico medio integrado de la funcin


de densidad.

257

Microeconometra Aplicada
Centro de Microdatos

Capitulo 13: Mtodos No Paramtricos y Semiparamtricos

El comando que en STATA permite estimar la densidad utilizando la funcin


Kernel es

kdensity:

kdensity varname [if] [in] [weight] [, options]


Por ejemplo, el Grco 11.2 muestra la estimacin con Kernel Gaussino de la
funcin de densidad del logaritmo del ingreso de la ocupacin principal:

kdensity lny, gaussian generate(estim den)

Grco 13.2
Kernel Gaussiano

.2

Density
.4
.6

.8

Logartimo Ingreso Ocupacin Principal

10

12

14

16

lny
kernel = gaussian, bandwidth = 0.0477

La opcin generate, genera dos variables estim que contiene los puntos de estimacin de la densidad kernel y den que contiene la densidad estimada para cada
uno de estos puntos. En esta estimacin se ha utilizado el bandwidth ptimo, que
corresponde al default de STATA.
El siguiente grco muestra la estimacin kernel utilizando la funcin gaussiana
y epanechnikov, en ambas utilizando el bandwidth ptimo que mnimo el error
cuadrtico medio integrado.

twoway (kdensity lny, gaussian) (kdensity lny),


legend(on order(1 ``Gaussian'' 2 ``Epanechnikov''))
258

Microeconometra Aplicada
Centro de Microdatos

Capitulo 13: Mtodos No Paramtricos y Semiparamtricos

Grco 13.3
Kernel Gaussiano y Epanechnicov

.5

kdensity lny

1.5

Logaritmo Ingreso Ocupacin Principal

10

12

14

16

x
Gaussian

Epanechnikov

Las diferencias entre ambas estimaciones son mnimas. Se menciono que se ha


demostrado que el Kernel Epanechnikov ha demostrado ser ptimo pero en las
prctica las ventajas son mnimas. Lo que si puede generar grandes diferencias
es la eleccin del parmetro de suavizacin, bandwidth. El Grco 11.4 muestra
cuatro funciones kernel utilizando el kernel Epanechnikov con 4 bandwithds distintos, incluyendo el valor ptimo.

twoway (kdensity lny) (kdensity lny, width(1)) (kdensity lny, width(0.5))


(kdensity lny, width(0.05)), legend(on order(1 ``h ptimo'' 2 ``h=1''
3 ``h=0.5'' 4 ``h=0.0''))

259

Microeconometra Aplicada
Centro de Microdatos

Capitulo 13: Mtodos No Paramtricos y Semiparamtricos

Grco 13.4

.5

kdensity lny

1.5

Kernel Epanechnicov

10

12

14

16

x
h ptimo
h=0.5

h=1
h=0.05

Mientras mayor el bandwidth asumido ms se suaviza la funcin de densidad.


Este parmetro representa una especie de desviacin estndar de cada una de las
densidades que estoy combinando, mientras mayor es el parmetro ms desviacin
estndar tienen las densidades ponderadas lo que suaviza la funcin de densidad
nal obtenida.

13.2.

Estimacin No Paramtrica de la Relacin


Entre Dos Variables

Consideremos la regresin entre la variable dependiente


explicativa

x.

sobre la variable

El modelo de regresin, sin asumir una forma funcional especca

para la relacin entre ambas variables, es el siguiente:

yi = m(xi ) + i
i iid(0, 2 )
Donde la forma funcional

m()

i = 1, ..., N.

no ha sido especicada.

260

Microeconometra Aplicada
Centro de Microdatos

Capitulo 13: Mtodos No Paramtricos y Semiparamtricos

El mtodo general denominado Local Weighted Average Estimator toma la siguiente forma:

m(x
0) =

i0,h yi

i=1
donde

i0,h = (xi , x0 , h)

i0,h = 1.

i=1

De esta forma, para cada punto

x0

que observamos se obtiene la relacin es-

timada con la variable dependiente como el promedio ponderado de la variable


dependiente, donde el ponderador depende de cuan cerca esta la observacin de

xi

x0 .

El estimador Lowess utiliza la funcin kernel como ponderador. De esta

forma, el Lowess Estimator minimiza la siguiente funcin objetivo:

mn
m0

i=1

(
K

xi x0
h

)
(yi m0 )2

El comando en STATA que permite realizar esta estimacin es

lowess,

el Gr-

co 11.5 muestra la estimacin no paramtrica de la relacin entre logaritmo


del ingreso de la ocupacin principal y los aos de escolaridad, y la estimacin
paramtrica MCO de la misma relacin.

Grco 13.5
Estimacin Lowess

10

12

14

16

Logarimo del Ingreso y aos de escolaridad

10
escolaridad
observado
mco

15
lowess estimator

261

20

Capitulo 13: Mtodos No Paramtricos y Semiparamtricos

Microeconometra Aplicada
Centro de Microdatos

Otros estimadores no paramtricos son el estimador de Nadaraya-Watson (kernreg)


y el estimador del vecino ms cercano (knnreg), lo que cambia son las deniciones
del ponderador.

262

Captulo 14
Evaluacin de Tratamiento
La Evaluacin de Tratamiento consiste en medir el impacto de intervenciones o
tratamientos en variables de resultados de inters. Alguno ejemplos de tratamientos en el contexto econmico son:

Programa de Capacitacin Laboral


Pertenecer a un sindicato de trabajadores
Ser beneciario de un programa social
Cambios en las polticas que denen los beneciarios de un programa social
Cambios en incentivos econmicos

El mayor desafo en la evaluacin de impacto es determinar que habra pasado con


los beneciarios si el programa o intervencin no hubiese existido, el resultado del
beneciario en ausencia del programa es su contrafactual. Entonces el problema
para medir el impacto (independiente de otros factores) slo puede ser obtenido
comparando el resultando efectivo y el resultado contrafactual. Sin embargo, el
resultado contrafactual no es observado. As, el desafo es crear un grupo de
comparacin razonable y convincente para los beneciarios.

263

Microeconometra Aplicada
Centro de Microdatos

Capitulo 14: Evaluacin de Tratamiento

14.1.

El Problema de Sesgo de Seleccin

La siguiente ecuacin presenta el problema bsico que surge de comparar la variable de resultado

entre los individuos tratados y no tratados:

Yi = Xi + Ti + ui
donde

Ti

es una variable dummy que toma valor 1 para aquellos que participan

en el programa y cero para quienes no participan. Adems se incluyen variables


explicativas

Xi

que caracterizan al individuo y que afectan

rresponden a los factores no observables que afectan


el efecto del tratamiento a travs de

Y.

Y,

nalmente

co-

El problema en estimar

es que generalmente el tratamiento no ha

sido asignado de manera aleatoria, de esta forma puede ser el caso en que los
no observables estn relacionados con la probabilidad de recibir el tratamiento,
generando un problema de endogeneidad en la ecuacin antes planteada.
De manera alternativa, podemos denir la variable de resultado para los tratados
como

Yi (1) y para los no participantes Yi (0). Si Yi (0) se utiliza como comparacin


Yi (1) el efecto promedio del programa puede ser

del resultado de los participantes

representado de la siguiente forma:

D = E[Yi (1)|Ti = 1] E[Yi (0)|Ti = 0]


El problema es que el grupo de los tratados y no tratados pueden ser diferentes
previo al tratamiento (no han sido asignados aleatoriamente), de esta forma la
simple diferencia en las medias no representa el efecto puro del tratamiento.
Sumando y restando el resultado de los no participantes si hubiesen participado:

D = E[Yi (1)|Ti = 1] E[Yi (0)|Ti = 0] + E[Yi (0)|Ti = 1] E[Yi (0)|Ti = 1]


= E[Yi (1)|Ti = 1] E[Yi (0)|Ti = 1] + E[Yi (0)|Ti = 1] E[Yi (0)|Ti = 0]
= AT T + B
donde

AT T

es el Efecto Tratamientos sobre los Tratados (Average Treatment Ef-

fect on Treated) que representa la ganancia promedio en la variable de resultado


de los participantes relativo a los no participantes si los no participantes tambin
hubiesen sido tratados.

B representa el sesgo de seleccin que se genera al utilizar


AT T .

como una medida del

Luego, los objetivos para poder estimar de manera apropiada el Efecto Promedio
del Tratamiento es tratar de eliminar

o encontrar una manera de contabilizar

este sesgo.

264

Microeconometra Aplicada
Centro de Microdatos

Capitulo 14: Evaluacin de Tratamiento

El problema de sesgo de seleccin desaparece si se asume que el recibir o no


el tratamiento (condicional en una serie de variables explicativas

X)

es indepen-

diente de los resultados que ellos obtienen, lo que se conoce como el supuesto de
independencia condicional:

(Yi (1), Yi (0)) Ti |Xi


Cuando el programa es aplicable a todos la poblacin se est interesado en medir
el efecto tratamiento promedio (ATE):

AT E = E[Yi (1) Yi (0)]

14.2.

Metodologas para Evaluacin de Impacto

Existen diversas metodologas para abordar el problema de no existencia de contrafactual. Cada una de estas metodologas hace diferentes supuestos sobre la
naturaleza del problema de sesgo de seleccin en la participacin en el programa.
Estas metodologas son:

1. Propensity Score Matching (PSM): esta metodologa asume que el sesgo


de seleccin es en variables observables, luego estas pueden ser utilizadas
para determinar un grupo de no participantes con caractersticas similares
a las de los no participantes como si hubiesen sido seleccionados de manera
aleatoria.
2. Doble Diferencias (DD): esta metodologa asume que existe seleccin en no
observables pero que esta no vara en el tiempo por lo cul este sesgo se
elimina a tomar diferencias en el tiempo. As, el efecto del tratamiento se
obtiene tomando la deferencia en la variable de resultado entre tratados y
no tratados antes y despus del programa.
3. Variables Instrumentales: con esta metodologa se busca corregir el problema de endogeneidad que genera el sesgo de seleccin, para esto requiere
de una variable on instrumento que se correlacione con la participacin en
el programa pero no con las caractersticas no observables que afectan la
variable de resultado.
4. Regresin en la Discontinuidad (RD): esta metodologa es una extensin
del estimador de variables instrumentales, explota las reglas exgenas de
seleccin para el programa para comparar participantes y no participantes
en una vecindad de la regla que determina la seleccin, en esta vecindad se
puede argumentar que no existe sesgo de seleccin.

265

Microeconometra Aplicada
Centro de Microdatos

Capitulo 14: Evaluacin de Tratamiento

14.2.1. Propensity Score Matching


Esta metodologa construye una grupo de comparacin o de control basado en un
modelo de probabilidad de participacin en el programa utilizando caractersticas observadas, luego se hace un matching de los participantes con este grupo de
participacin en base a esta probabilidad o propensity.
El efecto tratamiento promedio del programa se obtiene de la diferencia en los
resultados de estos dos grupos. La validez de esta metodologa se sustenta en dos
condiciones:

Independencia Condicional (factores no observables no afectan la participacin)


Soporte Comn en el propensity score entre participantes y no participantes

La Figura 12.1 muestra un ejemplo de soporte comn aceptable entre tratados y


no tratados, mientras que la Figura 12.2 muestra un ejemplo de soporte dbil.

Figura 14.1
Soporte Comn

266

Microeconometra Aplicada
Centro de Microdatos

Capitulo 14: Evaluacin de Tratamiento

Figura 14.2
Soporte Comn Dbil

Diferentes metodologas pueden ser utilizadas para hacer el matching entre tratados y no tratados de acuerdo al propensity score: vecino ms cercano, matching de
radio, matching estraticado o intervalo, y Kernel Matching. Pero la estimacin
del modelo usando tratados y no tratados ponderando de acuerdo al propensity
score permite obtener estimaciones ms ecientes.
Las condiciones de independencia condicional y soporte comn requieren supuestos menos fuerte cuando se calcula el ATT, razn por la cul la mayora de las
investigaciones que utilizan esta metodologa se concentran en el clculo de este
indicador para evaluar el impacto del programa.
Utilizando datos de corte transversal, y dentro del soporte comn, el efecto tratamiento sobre los tratados se puede obtener de la siguiente manera:

AT TP SM
donde

NT

[
]

1
=
YiT
(i, j)YjC
NT iT
jC
(i, j) son los ponderadores
i a cada uno de los individuos j .

corresponde al nmero de participantes, y

que determinan que tan parecido es el individuo

A continuacin se detallan los pasos necesarios para la aplicacin de esta metodologa:

267

Microeconometra Aplicada
Centro de Microdatos

Capitulo 14: Evaluacin de Tratamiento

Estimacin del Modelo de Participacin


Tomando los datos de participantes y no participantes se debe estimar un modelo
de probabilidad donde la variable dependiente es
variables explicativas

y se deben considerar todas las

que determinen la probabilidad de recibir tratamiento.

Una vez estimado el modelo se obtiene el valor predicho para la probabilidad de


recibir tratamiento o el propensity score

P (X|T = 1) = P (X),

se deben incluir

todas las variables que se piensen puedan tener alguna relacin con el tratamiento,
2
no es necesario jarse en los estadsticos t y R ya que no se esta buscando
un modelo causal, sino una herramienta estadstica para buscar similitud entre
grupos de personas. Idealmente se debe trabajar con la misma base de datos que
contenta participantes y no participantes.

Denicin del Soporte Comn y Test de Balanceo


Se debe determinar la regin donde la densidad del propensity score de los tratados y no tratados se superponen, las observaciones que no estn en el soporte
comn deben ser eliminadas. Adicionalmente se deben realizar test de balanceo,
lo que signica chequear para cada cuantil en la distribucin del propensity score
que el promedio del propensity score y de las variables explicativas son iguales.

Matching entre Participantes y No Participantes


Existen diferentes criterios para hacer el matching entre participantes y no participantes:

1. Vecino ms cercano: cada tratado es asignado a una unidad del grupo de


control, la que tenga el valor del propensity score ms cercano
2. Radio: cuando las diferencias en propensity score entre tratados y no tratados son altas, el matching por vecino ms cercano puede ser pobre. Esta
metodologa para hacer matching acepta hasta cierta distancia en cuanto a
propensity score para realizar el matching.
3. Estraticado: se parte la muestra en el soporte comn en estratos, y en cada
estrato se calcula la diferencia promedio entre el resultado de los tratados
y no tratados. Luego, el promedio ponderado de estos estratos corresponde
al efecto del tratamiento.

268

Microeconometra Aplicada
Centro de Microdatos

Capitulo 14: Evaluacin de Tratamiento

4. Kernel: los riesgos de las metodologas anteriores es que el grupo de no


participantes comparable sea muy pequeo. Este estimador utiliza toda la
muestra de no participantes en el soporte comn ponderados de acuerdo a
su distancia en el propensity. En particular el ponderador de este estimar
es:

(
(i, j)K =

K
kC

Pj Pi
h

(P

k Pi

Dehejia (1997) plantea la siguiente manera alternativa de obtener el efecto tratamiento promedio y sobre los tratados:

]
N [

1
(D

(x
))y
i
i
i
AT E =
N i=1 p(xi )(1 p(xi ))
(
)1 N [
N

1 (Di p(xi ))yi ]


1

AT T =
Di
N i=1
N (1 p(xi ))
i=1
Hirano, Imbens, y Ridder (2003) proponen utilizar el propensity score para estimar el efecto del tratamiento de manera eciente utilizando el enfoque de regresin
lineal. Es decir, se debe estimar la siguiente regresin lineal:

Yi = + Ti + Xi + ui
Para obtener el ATT las observaciones de los no participantes deben ser ponderadas por

p(x)/(1 p(x))

y las de los participantes por 1. Para obtener el ATE

las observaciones de los no participantes deben ser ponderadas por


y las de los participantes por

1/(1 p(x))

1/
p(x)

Propensity Score Matching en STATA


El comando en STATA para la estimacin del propensity score es

pscore:

pscore treatment varlist [weight] [if exp] [in range],


pscore(newvar) [blockid(newvar) detail logit comsup level(#) numblo(#)
Se utilizar una muestra de 185 hombres que recibieron una capacitacin durante 1976 y 1977 para evaluar el impacto de capacitacin laboral sobre ingresos.
El grupo de control se obtiene de una muestra de 2.490 hombres jefes de hogar
menores de 55 aos y que no se encuentran pensionados, muestra que fue obtenida del PSID. La variable TREAT indica si la persona ha sido tratada o no. El

269

Microeconometra Aplicada
Centro de Microdatos

Capitulo 14: Evaluacin de Tratamiento

Cuadro 12.1 presenta el promedio de algunas de las variables claves, mostrando


la diferencia entre tratados y grupo de control.

Cuadro 14.1
Variables y Estadsticas

A continuacin se presenta la estimacin del propensity score para el problema y


datos presentados:

pscore TREAT AGE AGESQ EDUC EDUCSQ NODEGREE BLACK HISP MARR RE74 RE75
RE74SQ RE75SQ U74BLACK, pscore(propensity) blockid(estratos)
logit comsup numblo(8)
Luego de ejecutar el comando se genera una variable llamada propensity que
contiene el propensity score estimado, otra variable estratos que contiene el nmero de bloques en que se ha divido la muestra segn el propensity score, el
nmero de bloques por default es 5 en este caso hemos solicitado que fueran 8.
La opcin comsup es para que se genere una variable que indique si se cumple la
condicin de soporte comn que requiere el matching. El output de este comando
es el siguiente:

270

Microeconometra Aplicada
Centro de Microdatos

Capitulo 14: Evaluacin de Tratamiento

Cuadro 14.2
Estimacin Propensity Score

271

Microeconometra Aplicada
Centro de Microdatos

Capitulo 14: Evaluacin de Tratamiento

Cuadro 14.3

Cuando estamos interesados en el efecto causal de un programa de aplicabilidad


universal, la medida apropiada es el ATE, esta medida consiste en un promedio de
los efectos causales individuales, donde se requiere comparar cada individuo del
grupo de tratamiento con su contrafactual en el grupo de control. En la prctica,
lo que se ha realizado es buscar el nmero ptimo de estratos o grupos donde el
propensity score es similar entre grupo de tratamiento y grupo de control, lo que
garantiza la similitud entre ambos grupos, luego tomando el promedio de la variable de resultado al interior de cada estrato y para cada grupo, y luego sacando un

272

Microeconometra Aplicada
Centro de Microdatos

Capitulo 14: Evaluacin de Tratamiento

promedio ponderado de estas diferencias, se obtiene nalmente el estimador ATE.


En este ejemplo en particular la medida ATE ser obtenida tomando el promedio de la variable de resultado, en este caso el ingreso real post capacitacin
(1978), en cada estrato tanto para el grupo de tratamiento como para el grupo
de control, calcular la diferencia de los promedios de ambos grupos y ponderar
esta diferencia por la fraccin de individuos tratados en el estrato:

AT E =

s (RE78s,T =1 RE78s,T =0 )

s=1
La informacin para construir este estimador se obtiene de las tablas en los Cuadros 12.4 y 12.5.

Cuadro 14.4
Nmero de Observaciones por Estrato y Grupo

Cuadro 14.5
Promedio Variable Resultado por Estrato y Grupo

273

Microeconometra Aplicada
Centro de Microdatos

Capitulo 14: Evaluacin de Tratamiento

El valor estimado del tratamiento es 6009.


Recuerde que el estimador ATE tiene validez cuando se supone una universalidad en el tratamiento, es decir, es razonable considerar una ganancia hipottica
de asignar el tratamiento aleatoriamente a miembros de la poblacin.
Por otra parte, cuando el inters se centra en las ganancias en el grupo de tratamiento, el estimador pertinente es ATT:

[
]

1
AT T =
Y1,i
(i, j)Y0,j
NT iT
jC
Notar la diferencia importante con el estimador ATE el que al evaluar los efectos
sobre el total de la poblacin, utiliza directamente el grupo de control para la obtencin del efecto causal, mediante el propensity score lo que hace es considerar
la heterogeneidad en el efecto causal y agrupar tratamiento y control en estratos
similares segn el vector de variables X. Sin embargo, el estimador ATT slo se
concentra en los efectos sobre los tratados, pero como los tratados no pueden a
la vez no recibir el tratamiento busca un contrafactual en el grupo de control, es
decir, busca su clon en el grupo de control. Esto se hace mediante las tcnicas
de matching. Existen distintos tipos de matching: vecino ms cercano, kernel, y
usando la metodologa de radios.
El Cuadro 12.6 muestra la estimacin del ATT mediante Kernel:

attk RE78 TREAT , pscore(propensity) logit comsup epan boot reps(100)

Cuadro 14.6
ATT con Kernel Matching

El coeciente ATT estimado utilizando la metodologa kernel para el matching


entrega un impacto sobre el ingreso de participar en programa de capacitacin
dentro de los tratados de 1.247, pero el valor no resulta ser estadsticamente

274

Microeconometra Aplicada
Centro de Microdatos

Capitulo 14: Evaluacin de Tratamiento

signicativo, no se puede rechazar la hiptesis nula de que sea igual a cero, el


estadstico t calculado es menor al valor de tabla.
El Cuadro 12.7 muestra la estimacin del ATT utilizando el vecino ms cercano:

attnd RE78 TREAT , pscore(propensity) logit comsup boot reps(100)

Cuadro 14.7
ATT con vecino ms cercano

El coeciente ATT estimado utilizando la metodologa del vecino ms cercano


entrega un impacto sobre el ingreso de participar en programa de capacitacin
de 560, pero el valor no resulta ser estadsticamente signicativo, no se puede
rechazar la hiptesis nula de que sea igual a cero, el estadstico t calculado es
menor al valor de tabla.

14.2.2. Diferencias en Diferencias


El estimador DD hace la comparacin entre participantes y no participantes antes y despus del programa. Para eliminar el sesgo de seleccin se asume que
este no vara en el tiempo y no correlacionado con la variable de tratamiento
en el tiempo. Bajo estos supuestos el impacto del tratamiento se obtiene tomando la diferencia en el promedio de la variable de resultado entre tratados y no
tratados, antes y despus del programa. Para esto se necesita tener datos de panel.
El estimador de diferencias en diferencias tambin puede ser obtenido mediante
un modelo de regresin lineal:

Yit = + Tit t + Tit + t + uit


275

Microeconometra Aplicada
Centro de Microdatos

Capitulo 14: Evaluacin de Tratamiento

Si se disponen ms de dos periodos de tiempo, el efecto del tratamiento se puede


estimar mediante un modelo de efecto jo:

Yit = Tit + Xit + i + uit


Se puede mejorar la estimacin Diferencia en Diferencias utilizando PSM para
controlar de mejor manera por las caractersticas de los individuos antes del programa, adems con esta metodologa se puede obtener el estimador de Diferencias
en Diferencias en cortes transversales repetidos. El estimador DD utilizando PSM
y cuando se disponen de datos de panel es:

DDP SM

]
[
N

1
T
C
C
T
Yj,1
)
=
)
(i, j)(Yj,2
(Yi,2
Yi,1
N i=1
jC

Sin embargo, cuando se disponen de cortes transversales se debe hacer matching


sobre tres grupos de control : tratados y no tratados en t=1, y no tratados en t=2,
y el estimador de Diferencias en Diferencias ser igual a:

DDP SM

N
1
=
N i=1

[{
T
Yi,2

}
T
(i, j)T1 Yi,1

jT1

C
(i, j)C2 Yi,2

jC2

}]
C
(i, j)C1 Yi,1

jC1

Tambin se puede utilizar la metodologa de Hirano, Imbens, y Ridder (2003) mediante Mnimos Cuadrados Ponderados para obtener una estimacin ms eciente
del estimador de diferencias en diferencias:

Yit = + Tit t + Tit + t + Xi + uit


donde los tratados son ponderados por 1, y los no tratados ponderados por

p(x)/(1 p(x)).
El estimador de DD se puede obtener mediante una regresin MCO o una estimador de efectos jos. Por ejemplo, utilizando los datos de la Encuesta de
Proteccin Social 2006-2009 se intenta medir el impacto en horas trabajadas de
la poblacin adulta mayor luego de la introduccin de la Pensin Bsica Solidaria
(PBS). El Cuadro 12.8 muestra la estimacin por MCO, se estima un impacto de
la PBS en las horas trabajadas de los adultos mayores de 6.9 horas semanales.

276

Microeconometra Aplicada
Centro de Microdatos

Capitulo 14: Evaluacin de Tratamiento

Cuadro 14.8
Estimador MCO Diferencias en Diferencias

14.2.3. Regresin Discontinua


Esta metodologa explota las reglas de decisin de participacin en el programa exgenas, estas reglas crean un quasi-experimento para un conjunto de
observaciones en donde se produce una discontinuidad en la probabilidad de recibir el tratamiento en funcin de esta regla. Por ejemplo, Angrist y Lavy (1999)
estudian el efecto del tamao de clase sobre el rendimiento de los alumnos, tomando ventaja de los datos generados por la Maimonides Rule que indica que
los cursos deben ser divididos si la cantidad de alumnos por curso supera cierto
umbral. Otro ejemplo es el estudio de Van der Klaauw (2003) que analiza los
efectos de la oferta de ayuda nanciera en la decisin de ir a la universidad, explotando la regla de elegibilidad de ayuda nanciera en funcin del puntaje en la
prueba SAT y las notas del colegio. De esta forma, la metodologa de regresin
discontinua es bastante similar a la de variables instrumentales en el sentido que
se introduce una variable exgena altamente correlacionada con la participacin
en el programa pero no con los resultados. La Figura 12.3 muestra como la variable que determina la regla de decisin produce una discontinuidad en los valores
observados de la variable de resultado, en la vecindad de esta discontinuidad se
espera que los individuos sean muy similares en sus observables y no observables
eliminando el sesgo de seleccin al comparar simplemente el promedio de la variable de resultado entre tratados y no tratados.
Entonces, existe una variable Si que determina la probabilidad de participacin

en el programa de acuerdo a un valor umbral de esta variable s . Asumiendo que

existe el lmite a ambos lados del umbral s , el impacto estimado para un valor

277

Microeconometra Aplicada
Centro de Microdatos

Capitulo 14: Evaluacin de Tratamiento

arbitrario y pequeo de

>0

entorno al umbral es:

E[Yi |s ] E[Yi |s + ]
donde

Yi = Si + i .

Figura 14.3
Regresin Discontinua

Tomando lmite a la ecuacin anterior cuando

se puede identicar

de la

siguiente manera:

YY+
S S+

Lo anterior asume que la regla de decisin es Sharp, es decir, depende directamente de la variable

S.

Sin embargo, puede ser que esta variable

determine la

probabilidad de participar, en tal caso la regla es Fuzzy. La Figura 12.4 muestra


grcamente la diferencia entre estos dos enfoques.
Para estimar el efecto tratamiento se deben estimar modelos no paramtricos
de la variable de resultado bajo el umbral y sobre el umbral, luego tomando la
diferencia en los valores predichos segn el modelo de la esperanza condicional
de la variable de resultado, en la vecindad del umbral, se obtiene el efecto del
tratamiento:

y y = lm E[Yi |Si = s ] lm E[Yi |Si = s ]


Si s

Si s

278

Microeconometra Aplicada
Centro de Microdatos

Capitulo 14: Evaluacin de Tratamiento

Figura 14.4
Sharp versus Fuzzy

La estimacin Fuzzy requiere hacer una regresin no paramtrica tanto para la


variable de resultado como para la variable que indica la participacin en el programa.
A continuacin utilizaremos los datos de la Encuesta a Hogares de Bangladesh
1998/99 para mostrar un ejemplo de como estimar una regresin discontinua
Sharp y Fuzzy para analizar como el nivel de los gastos de los hogares se ve afectado por un programa de microcrditos. La variable
total per-cpita del hogar,

exptot corresponde al gasto

hhland corresponde al valor de las tierras que tiene el

hogar, y es utilizado como regla para poder acceder al programa de microcrditos,


los hogares son elegibles para el programa si

hhland<50.

Primero vamos a crear

las variables de inters:

use hh_98.dta
gen lexptot=ln(1+exptot)
gen lnland=ln(1+hhland/100)
El siguiente programa nos permite estimar el efecto de participar en el programa
de microcrditos sobre el gasto del hogar basado en la metodologa de regresin
discontinua Sharp:

capture prog drop rd_sharp


prog rd_sharp, rclass
279

Microeconometra Aplicada
Centro de Microdatos

Capitulo 14: Evaluacin de Tratamiento

version 8.2
args outcome
confirm var `outcome'
tempname outrd1 outrd0 outcome1 outcome0
locpoly `outcome' lnland if hhland<50, gen(`outrd1')
at(lnland) nogr tri w(3) d(1)
locpoly `outcome' lnland if hhland>=50, gen(`outrd0')
at(lnland) nogr tri w(3) d(1)
sum `outrd1' if hhland>=45 & hhland<50, meanonly
scalar `outcome1'=r(mean)
sum `outrd0' if hhland>=50 & hhland<55, meanonly
scalar `outcome0'=r(mean)
return scalar diff_outcome=`outcome1'-`outcome0'
end
Con esta serie de comandos hemos creado un comando en STATA llamado

rd_sharp

el cul har la regresin no paramtrica mediante polinomios (locpoly), podramos


utilizar otras opciones antes vistas, entre la variable de resultado que denamos
(outcome) y el logaritmo del valor de la tierra del hogar, bajo el umbral y sobre
el umbral. Luego se toma el valor predicho del

outcome

en una vecindad de este

umbral.
Luego aplicamos el comando para obtener el efecto tratamiento estimado, y su
intervalo de conanza:

set seed 12345


bootstrap ``rd_sharp lexptot'' impact_sharp=r(diff_outcome),
reps(100) nowarn
gen t_impact_sharp=_b[impact_sharp]/_se[impact_sharp]
sum t_impact_sharp
El Cuadro 14.9 muestra los resultados de la estimacin del impacto sobre el
gasto del hogar de participar en el programa de microcrditos, se encuentra que
el participar en el programa reduce el gasto promedio en un 12.6 %, sin embargo,
este impacto no resulta ser estadsticamente signicativo.

280

Microeconometra Aplicada
Centro de Microdatos

Capitulo 14: Evaluacin de Tratamiento

Cuadro 14.9
Resultado Estimacin RD Sharp

En este caso particular, la regla de decisin en el umbral de 50 no es tan clara, por


lo cul es mejor utilizar la metodologa Fuzzy siguiendo el siguiente procedimiento:

capture prog drop rd_fuzzy


prog rd_fuzzy, rclass
version 8.2
args treatment outcome
confirm var `treatment'
confirm var `outcome'
tempname treatrd1 treatrd0 outrd1 outrd0 treat1 treat0 outcome1 outcome0
locpoly `treatment' lnland if hhland<50, gen(`treatrd1')
at(lnland) nogr tri w(3) d(1)
locpoly `treatment' lnland if hhland>=50, gen(`treatrd0')
at(lnland) nogr tri w(3) d(1)
locpoly `outcome' lnland if hhland<50, gen(`outrd1')
at(lnland) nogr tri w(3) d(1)
locpoly `outcome' lnland if hhland>=50, gen(`outrd0')
at(lnland) nogr tri w(3) d(1)
sum `treatrd1' if hhland>=45 & hhland<=55, meanonly
scalar `treat1'=r(mean)
sum `treatrd0' if hhland>=45 & hhland<=55, meanonly
281

Microeconometra Aplicada
Centro de Microdatos

Capitulo 14: Evaluacin de Tratamiento

scalar `treat0'=r(mean)
sum `outrd1' if hhland>=45 & hhland<=55, meanonly
scalar `outcome1'=r(mean)
sum `outrd0' if hhland>=45 & hhland<=55, meanonly
scalar `outcome0'=r(mean)
return scalar impact=(`outcome1'-`outcome0')/(`treat1'-`treat0')
end
Es bastante similar al procedimiento que denimos para la estimacin Sharp,
pero en este caso tambin debemos estimar los modelos no paramtricos sobre la
variable de tratamiento. A continuacin se obtiene la estimacin Fuzzy, mostrando los resultados en los Cuadros 12.10 y 12.11

***Male participation
set seed 12345
bootstrap ``rd_fuzzy dmmfd lexptot'' impact_fuzzy_m=r(impact), reps(100) nowarn
gen t_impact_fuzzy_m=_b[impact_fuzzy_m]/_se[impact_fuzzy_m]
sum t_impact_fuzzy_m

Cuadro 14.10
Resultado Estimacin RD Fuzzy (Hombres)

282

Microeconometra Aplicada
Centro de Microdatos

Capitulo 14: Evaluacin de Tratamiento

***Female participation
set seed 123
bootstrap ``rd_fuzzy dfmfd lexptot'' impact_fuzzy_f=r(impact), reps(100) nowarn
gen t_impact_fuzzy_f=_b[impact_fuzzy_f]/_se[impact_fuzzy_f]
sum t_impact_fuzzy_f

Cuadro 14.11
Resultado Estimacin RD Fuzzy (Mujeres)

283

Captulo 15
Modelos de Duracin
15.1.

Introduccin

Cuando una persona esta desempleada, o cuando los trabajadores de una empresa
estn en huelga, podramos esperar que mientras ms tiempo se ha permanecido
en ese estado mayor es la probabilidad de que la persona encuentre un trabajo
o de que la huelga termine en las prximas semanas. Pero tambin podramos
pensar que mientras ms tiempo ha durado este estado las caractersticas que
provocaron este estado son ms fuertes y por lo tanto es poco probable salir de
este estado. En este tipo de problemas no slo interesa el tiempo transcurrido en
cierto estado, sino adems interesa la probabilidad de transicin a otro estado.
En la clase de hoy se estudiarn los

Modelos de duracin,

en estos mode-

los la variable de inters es el tiempo transcurrido desde el inicio de cierto evento


hasta el trmino de este o hasta que donde se tiene acceso a la informacin (fecha
de medicin). En los modelos de duracin la censura en los datos es un problema
inherente a la forma de obtener los datos, la estimacin de estos modelos debe
considerar el problema de censura presente en los datos.
Para efectos del anlisis de los modelos de duracin, se denir

estado como
transicin

la clasicacin de un individuo o unidad en un momento del tiempo,


es el movimiento de un estado a otro, y

duracin (spell) corresponde al tiempo

transcurrido en cierto estado.

284

Microeconometra Aplicada
Centro de Microdatos

Capitulo 15: Modelos de Duracin

15.2.

Modelos de Duracin

La variable de inters en los modelos de duracin corresponde al tiempo transcurrido entre el inicio de cierto estado hasta que termina o hasta cuando la medicin fue realizada. Los datos que debemos poseer para hacer una anlisis de
duracin consiste en tiempos de duracin de un estado:

285

t1 , t2 ,,tN .