Vous êtes sur la page 1sur 16

Introduccin

Errores de especicacin
Ejemplo emprico

Errores de especicacin
Javier Alejo
Econometra I
Universidad Nacional de La Plata

Mayo, 2014

Javier Alejo

Econometra I

Introduccin
Errores de especicacin
Ejemplo emprico

Modelo de regresin
Partamos otra vez del modelo lineal:
Y = X +u
Y los supuestos clsicos:
1 E (u ) = 0
2 V (u ) = 2 In
3 X es no estocstica (no aleatoria).
4 (X ) = K
Teorema de Gauss-Markov:
= (X 0 X )1 X 0 Y

es el mejor estimador lineal e insesgado (MELI).


Javier Alejo

Econometra I

Introduccin
Errores de especicacin
Ejemplo emprico

Errores de especicacin

Qu pasa si nuestro modelo Y = X + u es incorrecto?


Error de especicacin.
Vamos a considerar dos tipos de errores de especicacin:
1 Omisin de variables relevantes: estimamos un modelo ms
chico que el verdadero.
2

Inclusin de variables irrelevantes: estimamos un modelo ms


grande que el verdadero.

Analizaremos cmo afecta cada situacin a las propiedades


estadsticas de MCO.

Javier Alejo

Econometra I

Introduccin
Errores de especicacin
Ejemplo emprico

Pensemos el siguiente modelo:


k1 1

k2 1

z}|{
z}|{
Y = X1 1 + X2 2 + |{z}
u
|{z}
|{z}
|{z}
n1

nk1

nk2

n1

X1 y X2 contiene dos grupos de variables distintas.


1 y 2 son los parmetros asociados a esas variables.
Supondremos que u cumple los supuestos clsicos.

Javier Alejo

Econometra I

Introduccin
Errores de especicacin
Ejemplo emprico

1. Omisin de variables relevantes

En este caso, nos enfretamos a la siguiente situacin:

Modelo verdadero: Y = X1 1 + X2 2 + u
Modelo estimado: Y = X1 1 + u
Ejemplo: la inteligencia en las ecuaciones de Mincer (ver TP 4,
Parte II).
El salario laboral depede de la educacin y la inteligencia, pero
en la estimacin no se incluye a esta ltima.
El error es proceder como si 2 = 0 cuando en realidad no lo es.

Javier Alejo

Econometra I

Introduccin
Errores de especicacin
Ejemplo emprico

Supongamos que 2 6= 0 (X2 es una variable relevante para


explicar Y ).
Estimemos por MCO a 1 haciendo una regresin de Y con X1
como nico regresor:
1 = (X10 X1 )1 X10 Y

Noten que este estimador es lineal.


Veremos que, en general, es sesgado.

Javier Alejo

Econometra I

Introduccin
Errores de especicacin
Ejemplo emprico

Sesgo por variales omitidas


Analizemos el sesgo de este estimador:
1 =
(X10 X1 )1 X10 Y
=
(X10 X1 )1 X10 (X1 1 + X2 2 + u )
= 1 + (X10 X1 )1 X10 X2 2 + (X10 X1 )1 X10 u

Tomando esperanza:
E 1 + (X10 X1 )1 X10 X2 2 + (X10 X1 )1 X10 u
= E (1 ) + E [(X10 X1 )1 X10 X2 2 ] + E [(X10 X1 )1 X10 u ]
=
1 + (X10 X1 )1 X10 X2 2 + (X10 X1 )1 X10 E (u )
=
1 + (X10 X1 )1 X10 X2 2

E (1 ) =

Javier Alejo

Econometra I

Introduccin
Errores de especicacin
Ejemplo emprico

Vemos que aparece un trmino que impide armar que el


estimador sea insesgado.
Analizemos el ese trmino:
E (1 ) = 1 + (X10 X1 )1 X10 X2 2
|

{z

Sesgo (1 )

Supusimos que 2 6= 0.
1 ) 6= 1 (es sesgado), a no ser que...
Resultado: E (

Javier Alejo

Econometra I

Introduccin
Errores de especicacin
Ejemplo emprico

2. Inclusin de variables irrelevantes

Ahora consideremos la otra situacin:


Modelo verdadero:
Modelo estimado:

Y = X1 1 + u
Y = X1 1 + X2 2 + u

En este caso, 2 = 0 es cierto, pero procedemos como si no lo


fuera.
Vamos a obtener un par de estimadores 1 y 2 por MCO.
Estos estimadores son lineales e insesgados, para cualquier
valor de 1 y 2 (por qu?).

Javier Alejo

Econometra I

Introduccin
Errores de especicacin
Ejemplo emprico

Ineciencia
Es posible argumentar que la estimacin de 1 es ineciente.
Dado que el verdadero modelo es Y = X1 1 + u, el TGM nos
dice que el MELI es:
1 = (X10 X1 )1 X10 Y

Incluir a X2 como regresor sigue manteniendo la linealidad e


insesgadez, pero no es igual exactamente igual a 1 .
Por lo tanto, el estimador 1 es una alternativa ineciente, es
decir con mayor varianza muestral.
Qu problema prctico genera la ineciencia?
Javier Alejo

Econometra I

10

Introduccin
Errores de especicacin
Ejemplo emprico

Comentarios nales
Omitir variables relevantes del modelo puede sesgar a MCO,
aunque no necesariamente (cuando la variable omitida no tiene
relacin lineal con la incluida).
Estimar un modelo con variables irrelevantes no sesga los
estimadores, pero los vuelve inecientes.
Omitir o no? Pregunta complicada.
Desde el punto de vista de evitar sesgos, es preferible tener
modelos con muchas variables.
Sin embargo, los modelos grandes puede que no sean muy
tiles para hacer inferencia sobre los parmetros (problemas de
potencia).
Javier Alejo

Econometra I

11

Introduccin
Errores de especicacin
Ejemplo emprico

Ejemplo: la salud y el consumo de cigarrillos

Muestra: 100 hombres de entre 20 y 65 aos de edad.

Variables: ndice de riesgo de muerte construido con una serie


de pruebas mdicas (toma valores entre 0 y 1) y el consumo de
cigarrillos por da.
Objetivo: evaluar el efecto del consumo de tabaco sobre la
salud.
Literatura: Appleton, French y Vanderpump (1996). Ignoring a
Covariate: an Example of Simpsons Paradox, The American
Statistician, 50(4).

Javier Alejo

Econometra I

12

Introduccin
Errores de especicacin
Ejemplo emprico

El modelo y la estimacin MCO


Partamos del siguiente modelo:
riesgoi = 1 + 2 cigarrillosi + ui
para i = 1, ..., 100.
Estimamos por MCO en Stata:

Estos resultados muestran que fumar reduce el riesgo de


muerte. Es contraintuitivo.
Javier Alejo

Econometra I

13

Introduccin
Errores de especicacin
Ejemplo emprico

Error de especicacin?

Pensemos en un modelo ms grande:


riesgoi = 1 + 2 cigarrillosi + 3 edadi + ui
para i = 1, ..., 100.
Error de especicacin: si 3 6= 0 estariamos omitiendo una
variable relevante.
Vamos a cometer necesariamente un sesgo al omitir la edad?

Javier Alejo

Econometra I

14

Introduccin
Errores de especicacin
Ejemplo emprico

Incluimos a la edad como regresor

Tanto la edad como el consumo de cigarrillos contribuyen


signicativamente a aumentar el riesgo de muerte.
Manteniendo constante la edad, un aumento en el consumo
diario de cigarrilos tiene efecto signicativo sobre el riesgo de
muerte.
Es decir, una vez que se controla por la edad el resultado es el
esperado.
Javier Alejo

Econometra I

15

Introduccin
Errores de especicacin
Ejemplo emprico

Por qu cambiaron tanto los resultados?


Claramente, la edad es una variable relevante para explicar el
riesgo de muerte.
Pero con eso no es suciente para argumentar que omitir a la
edad va a sesgar a MCO.
La clave: la edad est altamente correlacionada con el
consumo de cigarrilos.

Javier Alejo

Econometra I

16

Vous aimerez peut-être aussi