Vous êtes sur la page 1sur 56

Econometría

Maestría en Economía - Maestría en Econometría

Lecture 2

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 1 / 64


Agenda

1 Variables Omitidas: Motivación


La Ecuación del Salario con Habilidad no Observada
Consecuencias de Ignorar la Presencia de Variables Omitidas

2 Soluciones al Problema de las Variables Omitidas


Variables “Proxy"
Variables Instrumentales
Mínimos Cuadrados en dos Etapas

3 Errores no Esféricos
Propiedades de MCC en Presencia de Errores no Esféricos
Inferencia en Presencia de Errores no Esféricos
Mínimos Cuadrados Generalizados

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 2 / 64


Motivación

La ecuación estructural típica para el salario es como sigue,

log(wage) = β0 + β1 x + β2 x 2 + β3 s + γh + v

donde x representa años de experiencia en el mercado de


trabajo, s representa años de educación formal y h es la habilidad
natural del individuo. v es el error estructural que satisface el
supuesto de exogeneidad estricta: E(v |x, s, h) = 0.
La teoría económica establece un perfil salarial creciente y
cóncavo en experiencia, sugiriendo que β1 > 0 y β2 < 0 en la
ecuación anterior. Además, la teoría del capital humano sugiere
una relación directa entre salario y educación (β3 > 0) y entre
salario y habilidad (γ > 0).

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 4 / 64


Motivación

Empíricamente el problema para estimar una ecuación salarial


como la anterior es que la habilidad de una persona no es
observable. Por lo tanto, la ecuación estimable es,

log(wage) = β0 + β1 x + β2 x 2 + β3 s + u

donde u = γh + v . En este modelo, en general E(u|x, s) 6= 0


debido a la probable correlación entre los años de educación y la
habilidad de una persona.
En econometría una variable explicativa xj se dice que es
endógena si está correlacionada con el error de la ecuación.
Empíricamente, la endogeneidad aparece frecuentemente
cuando se presenta el problema descripto para la ecuación del
salario. Es decir cuando tenemos el denominado problema de las
variables omitidas.

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 5 / 64


Mínimos Cuadrados Clásicos

Considere el siguiente modelo estructural,

y = β0 + β1 x1 + β2 x2 + · · · + βk xk + γq + v (1)

donde E(v |x1 , x2 , . . . , xk , q) = 0 y q es la variable no observada.


Nuestro interés es estimar correctamente los β’s que son los
efectos parciales de las variables observadas manteniendo
constantes el resto de las variables explicativas, incluyendo a q.
El modelo que se podría estimar es,

y = β0 + β1 x1 + β2 x2 + · · · + βk xk + u (2)

donde u = γq + v .
Sin pérdida de generalidad se puede asumir que E(q) = 0 de
forma tal que E(u) = 0.

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 7 / 64


Mínimos Cuadrados Clásicos

En este modelo si q está correlacionada con alguna de las


variables explicativas, entonces u estará correlacionado también
y tenemos el problema de la endogeneidad.
Sabemos que si no se satisface (al menos) el supuesto de
exogeneidad contemporánea MCC no dará estimaciones
consistentes de los parámetros.
Escribamos la proyección lineal de q en las k variables
explicativas observadas como,

q = δ0 + δ1 x1 + δ2 x2 + · · · + δk xk + r (3)

donde, por definición de proyección lineal, E(r ) = 0 y


Cov (xj , r ) = 0, j = 1, 2, . . . , k .
Sustituyendo la ecuación (3) en la (1) podemos ver que estimaría
MCC aplicado sobre la ecuación (2).

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 8 / 64


Mínimos Cuadrados Clásicos

y = (β0 +γδ0 )+(β1 +γδ1 )x1 +(β2 +γδ2 )x2 +· · ·+(βk +γδk )xk +v +γr

donde el error v + γr cumple con el supuesto de exogeneidad


estricta.
De la ecuación anterior surge claramente que MCC aplicado en
(2) dará estimadores consistentes, β̂j , de los parámetros βj + γδj .
Esta especificación es la más general que se puede tener.
Muchas veces en la práctica la variable omitida solo está
relacionada con alguna de las variables explicativas observadas.
Esta especificación puede obtenerse haciendo ceros a los δj
correspondientes en la ecuación (3) arriba.

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 9 / 64


La Ecuación del Salario con Habilidad no Observada

Volviendo al ejemplo del salario,

log(wage) = β0 + β1 x + β2 x 2 + β3 s + γh + v

la teoría económica sugiere correlación entre s y h. Las personas


con mayor habilidad alcanzan una educación más alta.
Supongamos que no existe relación entre la habilidad y la
experiencia.
Bajo estos supuestos, la estimación de

log(wage) = β1 x + β2 x 2 + β3 s + u
por MCC dará un estimador de β3 sesgado y no consistente. Por
simplicidad suponga que el modelo está expresado en
desviaciones de la media de cada variable.

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 10 / 64


La Ecuación del Salario con Habilidad no Observada
Definiendo z = (x, x 2 , s) y β 0 = (β1 , β2 , β3 ), los estimadores de
MCC son,
β̂ = (z 0 z)−1 z 0 log(wage)
= (z 0 z)−1 z 0 (zβ + γh + v )
= β + (z 0 z)−1 z 0 h γ + (z 0 z)−1 z 0 v
= β + (z 0 z/n)−1 (z 0 h/n) γ + (z 0 z/n)−1 (z 0 v /n) (4)

Asumiendo que la condición de rango se cumple


p p
(z 0 z/n) −→ E(z 0 z) = A, por lo tanto (z 0 z/n)−1 −→ A−1 .
Usando la WLLN y el supuesto de exogeneidad estricta,
p
(z 0 v /n) −→ E(z 0 v ) = 0.
Usando la WLLN y el hecho de que la habilidad está relacionada
con la educación pero no con la experiencia,
p
(z 0 h/n) −→ E(z 0 h) = E(sh) = Cov (s, h) 6= 0.
Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 11 / 64
La Ecuación del Salario con Habilidad no Observada

Por lo tanto,

p Cov (s, h)
β̂3 −→ β3 + γ = β3 + γδs (5)
Var (s)

En este ejemplo particular, MCC da estimaciones insesgadas y


consistentes de β1 y β2 pero no asi de β3 . Si δs > 0 como sugiere
la teoría económica, entonces MCC sobre-estimará el coeficiente
asociado con los retornos a la educación.

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 12 / 64


Solución usando variables proxy
El problema de las variables omitidas puede ser solucionado si
existe una variable proxy para la variable no observada.
Los requerimientos formales para que una variable pueda ser
considerada proxy de otra son dos.
1 La variable proxy debe ser redundante en la ecuación estructural.
Si w es una variable proxy para q, el requerimiento de redundancia
establece que E(y |x, q, w) = E(y |x, q).
2 La correlación entre la variable omitida q y cada xj debe ser cero
una vez que tomamos en consideración w. En términos de una
proyección lineal este supuesto establece que
L(q|1, x1 , . . . , xk , w) = L(q|1, w).
Es útil escribir el segundo punto en términos de una ecuación con
error,
q = θ0 + θ1 w + r (6)
donde por definición E(r ) = 0 y Cov (w, r ) = 0. Si w es una
variable proxy razonable de q, entonces θ1 6= 0. La condición 2 de
arriba establece además que Cov (xj , r ) = 0 ∀j.
Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 14 / 64
Solución usando variables proxy
Para obtener una ecuación estimable podemos reemplazar (6) en
(1),
y = (β0 + γθ0 ) + β1 x1 + β2 x2 + · · · + βk xk + γθ1 w + (γr + v )
donde, bajo los supuestos realizados, el error de la ecuación,
γr + v , no está correlacionado con xj , ∀j; redundancia establece
que w no está correlacionado con v y por definición w no está
correlacionado con r .
Por lo tanto el error satisface el supuesto de exogeneidad
contemporánea y MCC aplicados en la ecuación anterior da
estimaciones consistentes de (β0 + γθ0 ), β1 , . . . , βk y γθ1 .
Entonces, bajo los supuestos de variables proxy, MCC estima en
forma consistente el efecto parcial de las variables explicativas
observadas (xj ). En particular, en el ejemplo del salario
empíricamente se utilizan los resultados de tests de inteligencia
como proxy de habilidad.
Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 15 / 64
Solución usando variables instrumentales

Las variables instrumentales son una forma de solucionar el


problema de endogeneidad de las variables explicativas. En este
sentido, es una corrección más general que la de las variables
proxy porque no solo puede aplicarse en el caso de variables
omitidas, sino en cualquier caso en el que exista endogeneidad
de algún regresor.
Considere el siguiente modelo,

y = β0 + β1 x1 + β2 x2 + · · · + βk xk + u (7)

donde E(u) = 0 y Cov (u, xj ) = 0, j = 1, 2, . . . , k − 1. En


palabras, xk es potencialmente endógena en (7).
Por lo tanto, MCC aplicados a (7) nos dará estimadores
inconsistentes.

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 17 / 64


Solución usando variables instrumentales
Para usar el enfoque de IV con xk endógena, necesitamos una
variable observable z1 , que no esté en (7) y que satisfaga dos
condiciones:
1 z1 es una variable exógena en (7), es decir Cov (z1 , u) = 0.
6 0 en la proyección lineal de la variable endógena, xk , sobre
2 θ1 =
todas las variables exógenas,

xk = δ0 + δ1 x1 + · · · + δk −1 xk −1 + θ1 z1 + rk (8)

donde, por definición, E(rk ) = 0 y rk no está correlacionado con


x1 , x2 , . . . , xk −1 , z1 .
En palabras, z1 está parcialmente correlacionada con xk una vez
que el resto de las variables exógenas han sido tomadas en
cuenta.
Cuando z1 satisface estas dos condiciones se dice una variable
instrumental para xk . La proyección lineal (8) se denomina
ecuación de forma reducida para la variable endógena xk .
Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 18 / 64
Solución usando variables instrumentales

Reemplazando (8) en (7) tenemos,

y = α0 + α1 x1 + α2 x2 + · · · + αk −1 xk −1 + λ1 z1 + v (9)

donde v = u + βk rk , αj = βj + βk δj y λ1 = βk θ1 .
Por nuestros supuestos, v no está correlacionado con ninguna de
las variables explicativas de (9) y por lo tanto MCC estima
consistentemente los parámetros de la ecuación reducida de y .
Algunas veces, estimar los parámetros de la ecuación reducida
(9) tiene interés en si mismo pero en general se trata de estimar
en forma consistente los parámetros de (7). Los supuestos
hechos para IV también lo permiten.

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 19 / 64


Solución usando variables instrumentales

Para ver esto formalmente, escribamos (7) como,

y = xβ + u

donde x = (1, x1 , . . . , xk ) y β 0 = (β0 , β1 , . . . , βk ) son de


dimensión 1 × k .
Definamos el vector de variables exógenas
z = (1, x1 , . . . , xk −1 , z1 ) y el vector de parámetros de la ecuación
reducida δ 0 = (δ0 , δ1 , . . . , δk −1 , θ1 ).
Bajo los supuestos de (7) y el supuesto de que la variable
instrumental z1 es exógena se cumplen las siguientes
condiciones de ortogonalidad:

E(z 0 u) = 0.

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 20 / 64


Solución usando variables instrumentales

Por lo tanto,

z 0y = z 0 xβ + z 0 u ⇒ E(z 0 y ) = E(z 0 x)β + E(z 0 u)


⇒ E(z 0 y ) = E(z 0 x)β (10)

Donde E(z 0 x) es de dimensión k × k , y E(z 0 y ) es de dimensión


k × 1.
La última expresión representa un sistema de k ecuaciones
lineales con k incógnitas. El sistema tiene una solución única si y
solo sí la matriz E(z 0 x) tiene rango completo (i.e. rango
E(z 0 x) = k ).

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 21 / 64


Solución usando variables instrumentales
Note que x = zπ + r con
 
1 0 ··· 0 δ0

 0 1 ··· 0 δ1 

π=
 .. .. . . .. .. 
 . . . . . 

 0 0 ··· 1 δk −1 
0 0 ··· 0 θ1
y r = (0, . . . , 0, rk ).
Entonces E(z 0 x) = E(z 0 (zπ + r )) = E(z 0 z)π de forma tal que para
que E(z 0 x) tenga rango completo necesitamos que E(z 0 z) tenga
rango k , que es un supuesto estándar, y que π tenga rango k que
está garantizado por el supuesto 2 de IV (θ1 6= 0).
En este caso, la solución del sistema de ecuaciones está dada
por:
β = [E(z 0 x)]−1 E(z 0 y )

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 22 / 64


Solución usando variables instrumentales
Utilizando los análogos muestrales se obtiene el estimador de
variables instrumentales,
n
!−1 n
1X 0 1X 0
β̂ = zi xi zi yi
n n
i=1 i=1
0 −1 0 0 −1 0
= (z x) z y = (z x) z (xβ + u)
0 −1 0
= β + (z x) zu (11)

Usando la WLLN,
n
!
1X 0 p
zi xi −→ E(z 0 x)
n
i=1

que bajo los supuestos de IV tiene rango completo.


Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 23 / 64
Solución usando variables instrumentales

Además,
n
1X 0 p
zi ui −→ E(z 0 u) = 0
n
i=1

y el estimador de IV es consistente.
Volviendo al ejemplo de la ecuación de salarios, la omisión de la
habilidad (h) provoca que la variable que mide educación (s) sea
endógena en el modelo. Para obtener estimaciones consistentes
en la ecuación salarial necesitamos un instrumento para s.
Card(1995), por ejemplo, utiliza una variable binaria que indica si
una persona creció en el vecindario de una universidad como
variable instrumental de años de educación.

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 24 / 64


Mínimos Cuadrados en dos Etapas

Considere nuevamente la ecuación (7) con todos sus supuestos.


Es decir, suponga que existe endogeneidad potencial de xk .
Supongamos que tenemos más de una variable instrumental para
xk . En particular, supongamos que z1 , z2 , . . . , zM son variables
tal que,
Cov (zh , u) = 0, h = 1, 2, . . . , M. (12)
cada zh es exógena en la ecuación (7).
Si cada una de estas variables tiene alguna correlación parcial
con xk , tenemos M potenciales instrumentos.
En realidad, hay muchos más que M porque cualquier
combinación lineal de x1 , x2 , . . . , xk −1 , z1 , z2 , . . . , zM no tiene
correlación con u. Qué instrumento deberíamos utilizar?
Bajo ciertos supuestos Mínimos cuadrados en dos etapas (2SLS)
es el estimador de IV más eficiente.

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 26 / 64


Mínimos Cuadrados en dos Etapas
Definamos el vector de variables exógenas como antes,
z = (1, x1 , x2 , . . . , xk −1 , z1 , z2 , . . . , zM ) un vector de dimensión
1 × L con L = k + M.
Definamos la proyección lineal de la variable endógena sobre
todas las variables exógenas,

xk = δ0 + δ1 x1 + · · · + δk −1 xk −1 + θ1 z1 + · · · + θM zM + rk (13)

donde, por definición, E(rk ) = 0 y rk no está correlacionado con


ninguna de las variables en el lado derecho de la ecuación.
Como ninguna combinación lineal de z está correlacionada con u

xk∗ = δ0 + δ1 x1 + · · · + δk −1 xk −1 + θ1 z1 + · · · + θM zM (14)

tampoco lo estará.
Si observáramos xk∗ podríamos utilizarla como instrumento para
xk en (7).
Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 27 / 64
Mínimos Cuadrados en dos Etapas
Sin embargo, si no existen dependencias lineales exactas entre
las variables exógenas se podrían estimar en forma consistente
por MCC los parámetros de (13) y definir para cada observación i,
x̂i,k = δ̂0 + δ̂1 xi,1 + · · · + δ̂k −1 xi,k −1 + θ̂1 zi,1 + · · · + θ̂M zi,M (15)

Ahora para cada observación i definamos el vector


x̂i ≡ (1, xi,1 , . . . , xi,k −1 , x̂i,k ) y estimemos por IV,
n
!−1 n
X X
β̂ = x̂i0 x x̂i0 y = (x̂ 0 x)−1 x̂ 0 y . (16)
i=1 i=1

Este estimador IV es también un estimador de MCC.


x̂ = z δ̂ = z(z 0 z)−1 z 0 x = Pz x
con Pz una matriz idempotente y simétrica.
Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 28 / 64
Mínimos Cuadrados en dos Etapas

Por lo tanto, x̂ 0 x = x 0 Pz x = (Pz x)0 Pz x = x̂ 0 x̂. Reemplazando esta


última expresión en (16) se obtiene,

β̂ = (x̂ 0 x̂)−1 x̂ 0 y . (17)

El término, mínimos cuadrados en dos etapas viene de este


procedimiento.
Entonces β̂ se puede obtener con los siguientes pasos
1 Obtenga x̂k de la regresión de xk sobre x1 , . . . , xk −1 , z1 , . . . , zM .
Este paso se denomina regresión de la primera etapa.
2 Estime por MCC una regresión de y sobre x1 , . . . , xk −1 , x̂k . Esta
es la regresión de la segunda etapa.
El estimador de 2SLS y el de IV son idénticos si solo existe un
instrumento para xk .

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 29 / 64


Mínimos Cuadrados en dos Etapas

En términos generales podemos resumir los resultados de 2SLS


como sigue. Considere el modelo,

y = xβ + u

donde x es de dimensión 1 × k y varios elementos de x pueden


estar potencialmente correlacionados con u.
Supuesto 1: Para algún vector 1 × L, z, E(z 0 u) = 0.
Note que el supuesto de exogeneidad estricta E(u|z) = 0 implica
el supuesto 1.
Supuesto 2: (a) rango E(z 0 z) = L; (b) rango E(z 0 x) = k .
Técnicamente, la parte (a) del supuesto 2 es necesaria pero no
especialmente importante. La parte (b) del supuesto es la
realmente importante porque es la condición de rango que
permite la identificación de los parámetros del modelo.

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 30 / 64


Mínimos Cuadrados en dos Etapas

Definamos el vector de variables exógenas como antes,


z = (1, x1 , x2 , . . . , xk −1 , z1 , z2 , . . . , zM ) un vector de dimensión
1 × L con L = k + M.
Definamos la proyección lineal de x sobre z como x = x ∗ + r con
x ∗ = zπ = z[E(z 0 z)]−1 E(z 0 x) y r = (0, . . . , 0, rk ).
0
Entonces, multiplicando el modelo por x ∗ y tomando esperanzas
tenemos,
0 0 0 0
E(x ∗ y ) = E(x ∗ x)β + E(x ∗ u) = E(x ∗ x)β
0 0 0
y β está identificado por β = [E(x ∗ x)]−1 E(x ∗ y ) si E(x ∗ x) no es
singular.
0
Ahora E(x ∗ x) = π 0 E(z 0 x) = E(z 0 x)0 [E(z 0 z)]−1 E(z 0 x) y esta
matriz no es singular si E(z 0 x) tiene rango k , lo que está
garantizado si se cumple el supuesto 2 (b).

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 31 / 64


Mínimos Cuadrados en dos Etapas

El estimador de 2SLS se puede escribir con la ecuación (16) o


con,

n
! n
!−1 n
!−1
X X X
β̂ =  xi0 zi zi0 zi zi0 xi 
i=1 i=1 i=1
n
! n
!−1 n
!
X X X
× xi0 zi zi0 zi zi0 yi
i=1 i=1 i=1

n
! n
!−1 n
!−1
X X X
= β +  n−1 xi0 zi n−1 zi0 zi n−1 zi0 xi 
i=1 i=1 i=1
n
! n
!−1 n
!
X X X
× n−1 xi0 zi n−1 zi0 zi n−1 zi0 ui (18)
i=1 i=1 i=1

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 32 / 64


Mínimos Cuadrados en dos Etapas
El estimador de 2SLS es consistente aplicando la WLLN a la
ecuación anterior. Además apropiadamente re-escalado es
asintóticamente normal. √
La normalidad asintótica de n(β̂ − β) se sigue de la normalidad
asintótica de n−1/2 ni=1 zi0 ui , que sigue del CLT bajo el supuesto
P
1,
n
X
−1/2
n zi0 ui ∼ Normal(0, σ 2 E(z 0 z))
i=1

Si agregamos el supuesto de varianza de los errores esférica


podemos derivar la matriz de varianzas y covarianzas de los
estimadores de 2SLS.
Supuesto 3: E(uu 0 |z) = σ 2 .

√ d
n(β̂ − β) −→ Normal(0, σ 2 {E(x 0 z)[E(z 0 z)]−1 E(z 0 x)}−1 ) (19)

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 33 / 64


Mínimos Cuadrados en dos Etapas
La estimación de la matriz de varianzas y covarianzas asintótica
de los estimadores de 2SLS se obtiene usando los análogos
muestrales de las esperanzas y estimando consistentemente σ 2 .
Definiendo los residuos de la estimación de 2SLS como,

ûi = yi − xi β̂, i = 1, 2, . . . , n.

La estimación consistente de σ 2 vine dada por,


n
X
2 −1
σ̂ = (n − k ) ûi2
i=1

Por lo tanto σ̂ 2 ( ni=1 x̂i0 x̂i )−1 = σ̂ 2 (x̂ 0 x̂)−1 es un estimador válido
P
de la matriz de varianzas y covarianzas de los estimadores de
2SLS.
Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 34 / 64
Mínimos Cuadrados en dos Etapas

Bajo los supuestos 1, 2 y 3, los estimadores de 2SLS son


eficientes dentro de la clase de todos los estimadores de IV que
usan instrumentos lineales en z.
Es posible detectar la presencia de variables explicativas
endógenas?
Test de Hausman (1978)
Idea: bajo la hipótesis nula de no existencia de endogeneidad, el
estimador de MCC, β̂MCC , y el estimador de variables
instrumentales, β̂2SLS , son estimadores consistentes de β, y el
estimador de MCC es el más eficiente.
Si la hipótesis nula es falsa, el estimador de variables
instrumentales, β̂2SLS , es el único consistente.
Entonces, bajo la hipótesis nula ambos estimadores deberían
diferir solo por error muestral. Es decir, aceptar la hipótesis nula
del test es evidencia en favor de exogeneidad.
Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 35 / 64
Mínimos Cuadrados en dos Etapas

Hausman sugiere utilizar un test de Wald. Supongamos que


V2SLS es la matriz de varianzas y covarianzas asintótica del
estimador de variables instrumentales y VMCC es la
correspondiente al estimador de MCC. Entonces,

H = (β̂MCC − β̂2SLS )0 [V2SLS − VMCC ]−1 (β̂MCC − β̂2SLS ) ∼ χ2 (q)

donde q es la dimensión del vector β̂MCC .


Si hay una sola variable potencialmente endógena, xk , el
estadístico de Hausman se reduce a,

(β̂k ,MCC − β̂k ,2SLS )


tH = p ∼ Normal(0, 1)
Vk ,2SLS − Vk ,MCC

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 36 / 64


Propiedades de MCC
Considere el siguiente modelo,

y = xβ + u, E(u|x) = 0, E(uu 0 |x) = σ 2 Ω. (20)

El estimador de MCC es,

β̂ = (x 0 x)−1 x 0 y
= β + (x 0 x)−1 x 0 u (21)

Los estimadores de MCC son insesgados y consistentes,

E(β̂|x) = β + (x 0 x)−1 x 0 E(u|x)


= β (22)

y aplicando la ley de expectativas iteradas, E(β̂) = β.


Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 38 / 64
Propiedades de MCC

n
!−1 n
X X
−1
β̂ = β+ n xi0 xi n−1 xi0 ui
i=1 i=1
p 0 −1 0
−→ β + [E(x x)] E(x u)
p
−→ β (23)
donde la primera convergencia se obtiene aplicando la WLLN y la
segunda sigue del supuesto de exogeneidad estricta.
Apropiadamente re-escalado, los estimadores de MCC son
asintóticamente normales,
n
!−1 n
√ X X
n(β̂ − β) = + n−1 xi0 xi n−1/2 xi0 ui
i=1 i=1
d
−→ Normal(0, [E(x 0 x)]−1 E(x 0 uu 0 x)[E(x 0 x)]−1 )

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 39 / 64


Propiedades de MCC

La matriz de varianzas y covarianzas asintótica de β̂ puede


escribirse como,

Var [ n(β̂ − β)] = [E(x 0 x)]−1 E[E(x 0 uu 0 x|x)][E(x 0 x)]−1
= [E(x 0 x)]−1 E[x 0 E(uu 0 |x)x][E(x 0 x)]−1
= σ 2 [E(x 0 x)]−1 E[x 0 Ωx][E(x 0 x)]−1 (24)

Note que si la varianza de los errores fuera esférica, la ecuación


anterior se reduce a la matriz de varianzas y covarianzas
asintótica que obtuvimos para MCC: σ 2 [E(x 0 x)]−1 .
Entonces, una consecuencia de la heterocedasticidad y/o de la
correlación serial es que matriz de varianzas y covarianzas
asintótica convencional de MCC es incorrecta.

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 40 / 64


Inferencia Estadística

La inferencia estadística convencional de MCC no es válida en


presencia de errores no esféricos.
Para poder hacer inferencia estadística en este modelo
necesitamos tests estadísticos robustos ante la presencia de
heterocedasticidad y/o correlación serial.
Para esto necesitamos estimar la matriz de varianzas y
covarianzas asintótica de MCC correcta,
n
!−1 n
! n
!−1
X X X
\
Var (β̂) = xi0 xi xi0 ûi ûi0 xi xi0 xi (25)
i=1 i=1 i=1

donde û son los residuos de la estimación por MCC. Esta es la


matriz de varianzas y covarianzas robusta ante la presencia de
heterocedasticidad y correlación serial de White (1980).

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 42 / 64


Inferencia Estadística

La raiz cuadrada de los elementos de la diagonal principal de (25)


son los errores estándar robustos. Los estadísticos t se calculan
de la forma usual con estos errores estándar robustos.
Para realizar contrastes sobre combinación lineal de coeficientes
el estadístico de Wald se construye con la fórmula habitual,

W = (R β̂ − r )0 [R Var
\ (β̂)R 0 ]−1 (R β̂ − r )/#r (26)

\
donde Var (β̂) está definida por la ecuación (25)

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 43 / 64


Mínimos Cuadrados Generalizados
Una alternativa a la estimación por MCC y la inferencia
estadística robusta es utilizar el método de mínimos cuadrados
generalizados (MCG).
Considere la estimación del mismo modelo que antes,
y = xβ + u, E(u|x) = 0, E(uu 0 |x) = σ 2 Ω.
y asumamos por un momento que los elementos de Ω son
conocidos.
Como Ω es definida positiva, su inversa también lo es. Por lo
tanto, es posible encontrar una matriz no singular P tal que:
Ω−1 = P 0 P. (27)

Premultiplicando (20) por P se obtiene,


y∗ = x∗ β + u∗ , (28)
donde y∗ = Py , x∗ = Px y u∗ = Pu.
Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 45 / 64
Mínimos Cuadrados Generalizados
El modelo transformado cumple con el supuesto de exogeneidad
estricta,

E(u∗ |x∗ ) = E(u∗ |x) = E(Pu|x)


= PE(u|x) = 0

Además, de acuerdo con (27), Ω = P −1 (P 0 )−1 . Por lo tanto,

Var (u∗ ) = E(Puu 0 P 0 )


= σ 2 PΩP 0
= σ 2 PP −1 (P 0 )−1 P 0
= σ 2 In (29)

y el modelo transformado cumple con los supuestos del modelo


de regresión lineal múltiple y puede ser estimado por MCC.
Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 46 / 64
Mínimos Cuadrados Generalizados
El método de MCG minimiza,
RSS(β̂) = (y∗ − x∗ β̂)0 (y∗ − x∗ β̂)
= (y∗0 − β̂ 0 x∗0 )(y∗ − x∗ β̂)
= y∗0 y∗ − β̂ 0 x∗0 y∗ − y∗0 x∗ β̂ + β̂ 0 x∗0 x∗ β̂
= y∗0 y∗ − 2β̂ 0 x∗0 y∗ + β̂ 0 x∗0 x∗ β̂ (30)

El estimador de MCG es,


β̂ = (x∗0 x∗ )−1 x∗0 y∗
= (x 0 Ω−1 x)−1 x 0 Ω−1 y (31)

y usando la teoría desarrollada para MCC,

Var (β̂) = σ 2 (x∗0 x∗ )−1 = σ 2 (x 0 Ω−1 x)−1 ,

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 47 / 64


Mínimos Cuadrados Generalizados
Una estimación consistente de la varianza del estimador de MCG
es,
\
Var (β̂) = s2 (x 0 x )−1 = s2 (x 0 Ω−1 x)−1 ,
∗ ∗ (32)
con,
s2 = (y∗ − x∗ β̂)0 (y∗ − x∗ β̂)/(n − K )
= [P(y − x β̂)]0 [P(y − x β̂)]/(n − K )
= [(y − x β̂)]0 Ω−1 [(y − x β̂)]/(n − K ).
La raiz cuadrada de los elementos de la diagonal principal de (32)
son los errores estándar de los estimadores de MCG y pueden
utilizarse para construir los estadísticos t.
Restricciones lineales del tipo H0 : Rβ = r pueden contrastarse
utilizando el test de Wald,
W = (R β̂ − r )0 [Rs2 (x 0 Ω−1 x)−1 R 0 ]−1 (R β̂ − r )/#r (33)

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 48 / 64


Mínimos Cuadrados Generalizados

En términos generales, los resultados de MCG pueden resumirse


de la siguiente manera.
Para mostrar consistencia necesitamos reforzar el supuesto 3 de
no singularidad.
Supuesto 3’: Ω es positiva definida y E(x 0 Ω−1 x) no es singular.
Usando la WLLN,
n
−1
X p
n xi0 Ωxi −→ E(x 0 Ω−1 x) ≡ A
i=1

y por el supuesto 3’,

n
!−1
−1
X p
n xi0 Ωxi −→ A−1
i=1

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 49 / 64


Mínimos Cuadrados Generalizados
Usando la WLLN y el supuesto de exogeneidad estricta,
n
−1
X p
n xi0 Ωui −→ E(x 0 Ω−1 u) = 0
i=1

Prueba:
vec[E(x 0 Ω−1 u)] = [E(u 0 ⊗ x 0 )]vec(Ω−1 )
= [E(u ⊗ x)0 ]vec(Ω−1 ) = 0

Por lo tanto,
β̂ = β + (n−1 x 0 Ω−1 x)−1 n−1 x 0 Ω−1 u
p
−→ β + A−1 E(x 0 Ω−1 u) = β (34)
y el estimador de MCG es consistente.
Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 50 / 64
Mínimos Cuadrados Generalizados
La distribución asintótica se obtiene desde,

n(β̂ − β) = (n−1 x 0 Ω−1 x)−1 n−1/2 x 0 Ω−1 u
d
−→ A−1 Normal(0, σ 2 A)
d
−→ Normal(0, σ 2 A−1 ) (35)
donde se utilizó el CLT para,
n
d
X
n−1/2 xi0 Ωui −→ Normal(0, σ 2 A)
i=1

con A ≡ E(x 0 Ω−1 x).


Por lo tanto, la matriz de varianzas y covarianzas asintótica del
estimador de MCG es,
Var (β̂) = σ 2 A−1 /n

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 51 / 64


Mínimos Cuadrados Generalizados Estimados

Remark: Note que para poder obtener la consistencia del


estimador de MCG es necesario asumir que las variables
explicativas son estríctamente exógenas. Este supuesto es más
fuerte que el necesario para obtener consistencia de MCC que
es, como vimos, exogeneidad contemporánea.
Hasta ahora se asumió que Ω era conocida. En general, en la
práctica, esto no es así y se necesita una estimación consistente
de la misma.
El método que utiliza una estimación consistente de Ω es
conocido como mínimos cuadrados generalizados estimados
(MCGE) ó feasible generalized least squares (FGLS).
Vamos a mostrar, en lo que sigue, que MCGE es asintóticamente
equivalente a MCG.

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 52 / 64


Mínimos Cuadrados Generalizados Estimados
El estimador de MCGE es,
β̃ = (x 0 Ω̂−1 x)−1 x 0 Ω̂−1 y
= β + (x 0 Ω̂−1 x)−1 x 0 Ω̂−1 u
Xn n
X
= β + (n−1 xi0 Ω̂−1 xi )−1 n−1 xi0 Ω̂−1 ui , ⇒
i=1 i=1
n n
√ X X
n(β̂ − β) = (n−1 xi0 Ω̂−1 xi )−1 n−1/2 xi0 Ω̂−1 ui (36)
i=1 i=1

Comparando el segundo término de (36) con el correspondiente a


MCG tenemos,
n
X n
X n
X
n−1/2 xi0 Ω̂−1 ui − n−1/2 xi0 Ω−1 ui = n−1/2 xi0 (Ω̂−1 − Ω−1 )ui
i=1 i=1 i=1

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 53 / 64


Mínimos Cuadrados Generalizados Estimados

Note que la ecuación anterior puede escribirse como,


n
" #
X
n−1/2 (ui ⊗ xi )0 vec(Ω̂−1 − Ω−1 ) = op (1) ⇒
i=1
n
X n
X
n−1/2 xi0 Ω̂−1 ui = n−1/2 xi0 Ω−1 ui + op (1) (37)
i=1 i=1

Usando el mismo argumento,


n
X n
X
n−1 xi0 Ω̂−1 xi = n−1 xi0 Ω−1 xi + op (1) (38)
i=1 i=1

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 54 / 64


Mínimos Cuadrados Generalizados Estimados
Usando los resultados anteriores tenemos,
n n
! !
√ −1
X
0 −1 −1/2
X
0 −1
n(β̃ − β) = n xi Ω xi n xi Ω ui + op (1)
i=1 i=1

= n(β̂ − β) + op (1)

⇒ n(β̃ − β̂) = op (1) (39)
que los estimadores
√ de MCG y de MCGE son asintóticamente
equivalentes ( n asintóticamente equivalentes).
Empíricamente, la equivalencia asintótica de los estimadores de
MCG y MCGE implica que para realizar inferencia estadística
sobre β usando MCGE, no hay que preocuparse de que Ω̂ sea un
estimador de Ω.
En otras palabras,
√ d
n(β̃ − β) −→ Normal(0, σ 2 A−1 )

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 55 / 64


Mínimos Cuadrados Generalizados Estimados
Bajo MCGE la estimación de A viene dada por,
n
X
à ≡ n−1 xi0 Ω̂xi
i=1

En general la estimación de Ω se hace imponiendo alguna


estructura en la matriz (e.g. heterocedasticidad o correlación
serial).
Por ejemplo, si hay heterocedasticidad, una estimación
consistente de A es,
Xm
à = Γ̂0 + ω(j, m)(Γ̂j + Γ̂0j ),
j=1

donde,
n
1 X 0 0
Γ̂j = xi ûi ûi−j xi−j , j = 0, 1, 2, . . . , m
n
i=j+1

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 56 / 64


Mínimos Cuadrados Generalizados Estimados

ω(j, m) es una ventana a definir y m es un parámetro de


truncamiento.
Por ejemplo,

1 j = 1, 2, . . . , m. uniform window
ω(j, m) = j
1 − m+1 , j = 1, 2, . . . , m. Bartlett (Newey-West) window

ûi (i = 1, 2, . . . , n) son los residuos de la estimación por MCC.


Cómo detectar la presencia de heterocedasticidad y/ó correlación
serial en el modelo?
Vamos a desarrollar el test de White para detectar
heterocedasticidad y los tests de Durbin-Watson y
Breusch-Godfrey para detectar correlación serial.

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 57 / 64


Mínimos Cuadrados Generalizados Estimados
Test de White

H0 : No existe heterocedasticidad
H1 : Existe heterocedasticidad

Este contraste asume que la forma funcional de la


heterocedasticidad es lineal en todas las variables explicativas del
modelo, sus cuadrados y sus productos cruzados.
Por ejemplo, suponga el siguiente modelo,

yi = α0 + α1 xi,1 + α2 xi,2 + ui

La forma funcional de la heterocedasticidad de White es,

σi2 = γ0 + γ1 xi,1 + γ2 xi,2 + γ3 xi,1


2 2
+ γ4 xi,2 + γ5 xi,1 xi,2

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 58 / 64


Mínimos Cuadrados Generalizados Estimados

En este modelo la hipótesis nula se puede escribir como:


H0 : γ1 = γ2 = · · · = γ5 = 0, y la alternativa como,
H1 : al menos un γi 6= 0, i = 1, 2, . . . , 5.

El procedimiento de White es como sigue:


1 Estimar el modelo original por MCC y obtener la serie de residuos y
de sus cuadrados.
2 Estimar la ecuación de la forma funcional de la varianza
reemplazando la variable dependiente por la serie de residuos al
cuadrado obtenida en el paso anterior.
3 Construir el estadístico LM = n × R 2 ∼ χ2q . El R 2 es el de la
regresión del Paso 2 y q es el número de parámetros iguales a
cero en la hipótesis nula.

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 59 / 64


Mínimos Cuadrados Generalizados Estimados

Correlación serial de orden uno


Supongamos el mismo modelo de antes,

yi = α0 + α1 xi,1 + α2 xi,2 + ui

En este modelo, la correlación serial de orden uno se especifica


como:
ui = ρui−1 + i , |ρ| < 1.

Test de Durbin-Watson

H0 : No existe correlación serial de orden uno (ρ = 0)


H1 : Existe correlación serial de orden uno (ρ > 0 ó ρ < 0)

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 60 / 64


Mínimos Cuadrados Generalizados Estimados

El estadístico de contraste es
Pn 2 
i=2 (ûi − ûi−1 ) DWL
d= Pn 2
∼ DW
i=1 ûi
DWH

donde ûi son los residuos de la estimación por MCC.

Caso 1: H0 : ρ = 0 vs. H1 : ρ > 0.


Regla de decisión: Rechace H0 si d < DWL . Acepte H0 si
d > DWH . No se sabe si DWL < d < DWH .
Caso 2: H0 : ρ = 0 vs. H1 : ρ < 0.
Regla de decisión: Rechace H0 si d < 4 − DWL . Acepte H0 si
d > 4 − DWH . No se sabe si 4 − DWL < d < 4 − DWH .

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 61 / 64


Mínimos Cuadrados Generalizados Estimados
Test de Breusch-Godfrey

H0 : No existe correlación serial de orden uno (ρ = 0)


H1 : Existe correlación serial de orden uno (ρ 6= 0)

El procedimiento de Breusch-Godfrey es como sigue:


1 Estimar el modelo original por MCC y obtener la serie de residuos y
la serie de residuos rezagada una observación.
2 Estime una ecuación auxiliar que tenga como variable dependiente
a la serie de residuos del paso anterior y como variables
independientes a todas las variables explicativas del modelo
original más la serie de residuos rezagada una observación.
3 Construir el estadístico LM = (n − 1) × R 2 ∼ χ2q=1 . El R 2 es el de la
regresión del Paso 2 y q = 1 es el número de parámetros iguales a
cero en la hipótesis nula.
Si se rechazara la hipótesis nula una estimación consistente
viene dada por el procedimiento de Cochrane-Orcutt.
Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 62 / 64
Mínimos Cuadrados Generalizados Estimados
Procedimiento de Cochrane-Orcutt
Considere el mismo modelo de los ejemplos anteriores,

yi = α0 + α1 xi,1 + α2 xi,2 + ui (40)

ui = ρui−1 + i , |ρ| < 1. (41)


1 Estimar el modelo original (40) por MCC y obtener la serie de
residuos, ûi = yi − α̂0 − α̂1 xi,1 − α̂2 xi,2 , y la serie de residuos
rezagada una observación, ûi−1 .
2 Estimar la ecuación (41) por MCC, reemplazando a ui y ui−1 por ûi
y ûi−1 , respectivamente. Obtener ρ̂.
3 Transforme las variables del siguiente modo: yi∗ = yi − ρ̂yi−1 ,
∗ ∗
xi,1 = xi,1 − ρ̂xi−1,1 , xi,2 = xi,2 − ρ̂xi−1,2 y c ∗ = 1 − ρ̂.
4 Estimar por MCC el modelo transformado,

yi∗ = α0 c ∗ + α1 xi,1
∗ ∗
+ α2 xi,2 + ui∗
ˆ 0 , α̂
y obtenga nuevos estimadores α̂ ˆ 1 , α̂
ˆ2.

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 63 / 64


Mínimos Cuadrados Generalizados Estimados

Procedimiento de Cochrane-Orcutt (continuación)


5 Construir nuevos residuos ûˆi = yi − α̂
ˆ 0 − α̂
ˆ 1 xi,1 − α̂
ˆ 2 xi,2 y sus
ˆ
rezagos ûi−1 .
6 Vuelva al Paso 2 y repita el procedimiento.
7 El procedimiento termina cuando en dos iteraciones sucesivas el
valor estimado para ρ es el mismo.
Los estimadores obtenidos con este procedimiento son
insesgados, consistentes y asintóticamente eficientes.
Remark: Tanto el test de Breusch-Godfrey como la corrección de
Cochrane-Orcutt pueden generalizarse a correlación serial de
orden mayor a uno.

Martín González Rozada (UTDT) ECONOMETRIA Tercer Trimestre, 2009 64 / 64

Vous aimerez peut-être aussi