Vous êtes sur la page 1sur 397

NOTAS DE CLASE:

ELEMENTOS DE
ECONOMETRA Y
ESTADSTICA
FINANCIERA
Carlos Mendoza Astroz
Universidad Nacional de Colombia
Facultad de Economa

Este documento es un borrador


sujeto a correcciones y su nica
finalidad es servir como
complemento a una actividad
docente

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

Tabla de contenido

Parte I CONCEPTOS BSICOS ................................................................................................................................. 3


1. TEORA ASINTTICA ..................................................................................................................................... 4
3. VALORES Y VECTORES PROPIOS ................................................................................................................ 14
4. DISTRIBUCION NORMAL MULTIVARIANTE .............................................................................................. 20
PARTE II MODELOS MULTIVARIANTES .............................................................................................................. 30
1. ANLISIS DE COMPONENTES PRINCIPALES (ACP) ................................................................................... 31
1.1. INTRODUCCIN .................................................................................................................................... 31
1.2 INTERPRETACIN GEOMETRICA ............................................................................................................. 32
1.3. RESULTADOS MATEMATICOS Y GRAFICOS DEL ACP ....................................................................... 35
1.4. CLCULO DE LOS COMPONENTES PRINCIPALES ............................................................................. 38
1.5. PROCESO DE EXTRACCIN ................................................................................................................. 41
1.6. TEOREMAS ............................................................................................................................................ 45
1.7. COMPONENTES PRINCIPALES NORMADO O POR CORRELACIONES .............................................. 52
1.8. COMPONENTES PRINCIPALES PARA MATRICES DE COVARIANZAS CON ESTRUCTURAS
ESPECIALES ...................................................................................................................................................... 61
1.9. COMPONENTES PRINCIPALES A PARTIR DE UNA MUESTRA ......................................................... 65
1.10 IDENTIFICACIN DE LOS COMPONENTES PRINCIPALES.................................................................... 73
1.11.
PRUEBAS ESTADSTICAS ................................................................................................................. 75
1.12.
CONCLUSIONES ................................................................................................................................ 78
MODELOS DE DATOS PANEL LINEALES ............................................................................................................. 79
I. INTRODUCCIN ........................................................................................................................................ 80
II. ESPECIFICACIN GENERAL DE UN MODELO DE DATOS DE PANEL ................................................... 88
OVERVIEW DE METODOS DE PANELES DE DATOS ...................................................................................... 91
CARACTERISTICAS DE DATOS PANEL ......................................................................................................... 113
VARIACION BETWEEN-WITHIN ................................................................................................................... 100
VARIABLES OMITIDAS Y EFECTOS NO OBSERVADOS ................................................................................ 103
III.
METODOLOGIAS DE ESTIMACION DE MODELOS DE DATOS PANEL ............................................ 118
3. MODELOS DE EFECTOS FIJOS Y ALEATORIOS..................................................................................... 168
ELECCIN DEL MTODO: EFECTOS FIJOS O EFECTOS ALEATORIOS? .................................................... 213
IV.
ESTRUCTURA DE PRUEBAS DE HIPOTESIS: ANALISIS DE VARIANZA.......................................... 186
V. CONTRASTES DE HIPTESIS EN DATOS DE PANEL ........................................................................... 206
PRUEBA DE HAUSMAN .................................................................................................................................. 216
CONTRASTES DE AGRUPACIN DE DATOS ................................................................................................. 219
VIII. VENTAJAS Y DESVENAJAS DEL MODELO DE DATOS PANELES ..................................................... 249
PARTE VI. ANALISIS DE SERIES DE TIEMPO..................................................................................................... 255
PROCESOS ESTACIONALES ................................................................................................................................ 341
VECTORES AUTOREGRESIVOS (VAR) .............................................................................................................. 370

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

Parte I CONCEPTOS BSICOS

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

1. TEORA ASINTTICA
El anlisis asinttico esta interesado en varias clases de
convergencia de sucesiones de estimadores a medida que los
tamaos de muestra crecen.
Se comienza con algunas de las definiciones respecto a
sucesiones no estocsticas de nmeros. Cuando se aplican estos
resultados en econometra, N es el tamao de muestra, y esto se
efecta para todos los nmeros enteros positivos.
Definicin 1. Una sucesin de nmeros no aleatorios
{an|n=1,2,3,.,N} converge a un valor a (tiene limite en a) si para
todo >0, existe un N tal que si N>N entonces, |an-a|<. Se nota
como ana como N.
Definicin 2. Una sucesin {an|n=1,2,3,.,n} es acotada, si y solo,
si existe algn b< tal que |an|b para todo n=1,2,3,.,N. de
otro modo, se dice que {an} es no acotada. Estas definiciones
aplican a vectores y matrices elemento a elemento.
Ejercicio. Suponga las siguientes series:
1. an=2+1/n entonces an converge a 2, an2.
2. an=(-1)n entonces no es convergente pero es acotada.
3. an=n1/4 entonces an no es convergente ni es acotada.

Serie 1

Serie 2

Serie 3

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

Convergencia en Probabilidad
Definicin 3. La variable aleatoria xn converge en probabilidad a
una constante c si
limn Prob( xn c > )=0 para cualquier >0.
La definicin anterior indica que se hace cada vez ms
improbable que xn tome valores distintos a c, a medida que n, el
tamao de la muestra, aumenta. La convergencia en
probabilidad se denomina convergencia dbil.
Ejemplo. Supongamos que tenemos una variable aleatoria xn
cuya distribucin de probabilidad es la siguiente:
1
1
f ( xn ) n
1

si xn 0
si xn n

En este caso,
limn Prob( xn 0 > )=0
Es decir, xn converge en probabilidad a cero. A medida que n
aumenta, xn, toma el valor de n con una probabilidad cada vez
menor (1/n converge a cero a medida que n). Esto es, toda la
masa de la distribucin se concentra en aquellos puntos en la
vecindad de cero. En general, si, xn, converge en probabilidad a c,
es posible escribir
plim xn=c o x c
P

Definicin 4. Convergencia casi segura (almost surely o a.s) o


con probabilidad 1 se denomina convergencia fuerte. Esta se
define como:
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

Prob{

limn xn( )=x( )} = 1

Esto es, la sucesin {xn} converge a x con probabilidad 1. Esto se


simboliza como:
a .s .

x n 1

Ejemplo 2. La convergencia fuerte, se observa en los siguientes


casos:
a. Si {xn} es una sucesin de variables aleatorias
independientes e idnticamente distribuidas con
E(xn)=<, entonces:
_ a.s.

xn

Por la ley fuerte de los grandes nmeros.


b. Prob{lim n xn=0} = 1
0 x 0
Es comn encontrar notaciones O(1/n) y o(1/n). Se dice
que cn es O(1/n) ocurre que si plim(ncn) es una constante
finita distinta de cero. En tanto, se dice que c es o(1/n) si
ocurre que plim(ncn)=0. Por ejemplo,
1 3 es O(1/n) dado que plim(nc )=1
c
n
a .s .

n n2
1
cn 2
n

es o(1/n) dado que plim(ncn)=0

Si xn es una sucesin de variables aleatorias con media n y


varianza , tal que:
limn n =
y limn =0
2
n

2
n

Entonces se dice que xn converge en media cuadrtica (quadratic


mean oq.m). Esto se representa como:
q .m.

xn

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

Adems, se tiene que plim xn=. Este ltimo resultado se basa en


la desigualdad de Chebychev, la cual establece que si xn es una
variable aleatoria con c y como constantes, entonces:
Prob( xn c > ) E(xn c)2/ 2
Si
hacemos
c=mn,
tenemos
que
Prob( xn n
) E(xn n)2/ 2= / . Si tomamos lmites en
ambos lados de la desigualdad cuando n
tenemos:
limn Prob( xn n
) limn /
Lo cual implica que plim xn= , dado que limn n= y lim n
=0. La Convergencia en media cuadrtica implica convergencia
en probabilidad, pero no viceversa.
2
n

2
n

2
n

Estimador Consistente
Se dice que un estimador de un parmetro es consistente si y
slo
plim =
La media muestral x de cualquier poblacin con media finita y
varianza finita 2 es un estimador consistente de . La media
muestral esta dada por x x donde x1,...,xn es una muestra de

__

i 1

una poblacin cuya distribucin tiene media y varianza finitas


y 2, respectivamente. Entonces:

___ 1 n
1
E x E xi (n )
n
n
i 1

___ 1
Var x 2
n

1
Var x n (n
n

i 1

2
n

Asumiendo que las variables aleatorias x son independientes e


idnticamente distribuidas. De lo anterior, limn E(x)=
y

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

limn Var(x)=0. Por lo tanto, x converge en media cuadrtica a


. Ello implica que plim x =
__

Teorema 1. Con muestreo aleatorio, para cualquier funcin g(x),


si E(g(x)) y Var(g(x)) son constantes finitas, se tiene que:
p lim

1 n
g ( xi ) Eg ( xi )
n i 1

Teorema de Slutsky. Para una funcin continua g(xn) que no es


una funcin de n se tiene:
plim g(xn)=g(plim xn).
Reglas de la Probabilidad Lmite
Escalares. Si xn e yn son variables aleatorias con plim xn=c y plim
yn=d, entonces:
1. plim(xn+yn)=c + d
(regla de la suma)
2. plim(xn yn)=c d
(regla del producto)
3. p lim x c
(regla de la divisin (con d0).
n

yn

Ejemplo. Supongamos que la media y varianza muestral del


conjunto de variables aleatorias i.i.d de x1,..,xn tienen una
esperanza y varianza poblacional y 2 respectivamente, que
son estimadores consistentes. Esto es,
plim x =plim 1 x y plim s2 = 1 ( x x)
__

i 1

__

n 1 i 1

Entonces,
Matrices. Sea Wn una matriz cuyos elementos son variables
aleatorias, tal que plimWn=, con matriz invertible. Entonces:
plim Wn-1= -1

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

Si Xn e Yn son matrices de variables aleatorias, tal que plim Xn=A


y plim Yn=B, entonces,
plim(XnYn)=AB

(regla de la matriz producto)

Convergencia en Distribucin
xn converge en distribucin a una variable aleatoria x con
funcin distribucin acumulada (f.d.a) F(x) si:
limn ( F(xn) F(x) )=0
En todos aquellos puntos de continuidad de F(x). Esto se
simboliza como:
d

xn x

Reglas para la Distribucin Lmite. Si


1. Si

xn x

y plim yn=c, entonces:

xn y n c x
d

2. Si
3. Si x x y g(xn) es una funcin continua, entonces g ( x ) g ( x)
4. Si plim(xn-yn)=0, entonces xn e yn tienen la misma
distribucin lmite.
xn yn cx
d

Ejemplo. Supongamos una muestra de n observaciones i.i.d.


extradas de la distribucin x~N(0, 2). Sabemos que la
distribucin se comporta bajo una distribucin de la forma:
Donde,
Bajo ciertas condiciones de regularidad, se tiene que plim s2=2
y n x N (0, ) . Entonces,
__ d

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

10

1 __ d
n x N (0,1)
s

La convergencia en probabilidad implica convergencia en


distribucin, pero no viceversa. Es decir, el concepto de
convergencia en probabilidad es ms fuerte. En primer trmino,
si plim( ), entonces . Ello, porque:

lim n

1
si

n
f ( n )
0
e.o. p..

Grficamente,

Por otra parte, convergencia en distribucin no implica


convergencia en probabilidad a una constante. Para probar tal
aseveracin, basta con dar un contraejemplo. Supongamos que:

Se tiene que

xn x

, donde

Es decir, xn converge a una variable aleatoria pero no a una


constante.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

11

Distribucin Asinttica de una Funcin de una Variable Aleatoria


Supongamos que n ( z ) N (0, ) entonces si g(zn) es una funcin
continua que no depende de n, se tiene que:
d

n ( g ( z n ) g ( )) N (0, ( g ( )) 2 2 )

Para analizar el caso multivariado, consideremos un vector zn de


variables aleatorias, un vector de medias, ambos de tamao
kx1 y la matriz de covarianzas de tamao kxk, tal que,
n ( z ) N (0, ) . g(zn) es un vector de J funciones continuas de zn
que no dependen de n, entonces:
d

n ( g ( z n ) g ( )) N (0, CC T )

Donde C es una matriz jx k cuya j-sima fila es el vector de


derivadas parciales de la j-sima funcin con respecto a zn,
evaluado en :

Consistencia y Normalidad Asinttica de Mnimos Cuadrados


Ordinarios (MCO)
Consideremos el modelo clsico de regeresin lineal expresado
en trminos matriciales:
y=X + donde E(|X)=0, E(T)=2I, con 2 constante finita.
Asumamos que = limn (1/n)XTX=Q, matriz positiva definida e
invertible, donde, por simplicidad, se asume que X es una matriz
de variables no estocsticas. El estimador MCO viene dado por:
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

12

1
1
( X T X )1 X T Y ( X T X )1 ( X T )
n
n

( X T X )1 X T Y ( X T X )1 X T ( X )

1
1
( X T X )1 X T Y ( X T X )1 ( X T )
n
n

Entonces,
plim = +limn

1 T 1
(X X )
n

limn

1 T
(X )
n

Por las propiedades de probabilidad lmite descritas en


secciones anteriores se tiene que:
n
n
__
1 T
( X ) xi i wi w
n
i 1
i 1

Donde xi es el vector 1xk correspondiente a la i-esima fila de la


matriz X y wixii. Se tiene que:

De ello, se puede observar que:


Esto implica que w converge en media cuadrtica a cero y, por lo
tanto, plim w =0. Es decir, plim (1/n)XT=0. En consecuencia, el
estimador MICO es consistente.
=Q-10=
__

Distribucin Asinttica del Test de Restricciones Lineales


Supongamos que queremos contrastar un conjunto de J
restricciones lineales. Se realiza la prueba sobre la hiptesis
nula, H0, contra la hiptesis alternativa H1.
H0: R=q
H1: R q,

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

13

Donde R es una matriz J x k, es un vector k x 1 y q es un vector J


x 1. Por ejemplo, se dea comprobar si un subconjunto de los
coeficientes es igual a cero, de la forma:
H0: 1=0, 2=0, 3=0
H1: i0 i
Con las siguientes matrices

Dicho conjunto de J restricciones puede ser contrastado con el


siguiente estadstico:
Donde es el estimador MCO no restringido. Este se distribuye
F(J, n-k) bajo normalidad de los errores poblacionales del
modelo lineal. No obstante, aun cuando el supuesto de
normalidad no se satisfaga, es posible obtener la distribucin
asinttica del estadistico. Especficamente, en muestras grandes
se tiene que:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

3.

14

VALORES Y VECTORES PROPIOS

I.
Conceptos.
Los vectores propios, valor caracterstico o eigenvectores de un
operador lineal son los vectores no nulos que cuando son
transformados por el operador dan lugar a un mltiplo escalar
de s mismos, con lo que no cambian su direccin.
Suponga la transformacin del espacio para la siguente pintura:

En esta transformacin de la MONALISA, la imagen se ha


deformado. El vector azul, representado por la flecha azul que va
desde el pecho hasta el hombro, ha cambiado de direccin,
mientras que el rojo, representado por la flecha roja, no ha
cambiado. El vector rojo es entonces un vector propio de la
transformacin, mientras que el azul no lo es.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

15

Dado que el vector rojo no ha cambiado de longitud, su valor


propio es uno (1). Todos los vectores de esta misma direccin
son vectores propios, con el mismo valor propio.
El escalar recibe el nombre valor propio, valor caracterstico o
eigenvalor. A menudo, una transformacin del espacio queda
completamente determinada por sus vectores propios y valores
propios.
Las transformaciones lineales del espacio como rotacin,
reflexin, ensanchamiento, o cualquier combinacin de las
anteriores pueden interpretarse mediante el efecto que
producen en los vectores.
Los vectores pueden visualizarse como flechas de una cierta
longitud apuntando en una direccin y sentido determinados.
Dado lo anterior se puede inferir que:
1. Los vectores propios de las transformaciones lineales son
vectores que, o no se ven afectados por la transformacin o
se ven multiplicados por un escalar, y por tanto, no varan
su direccin.
2. El valor propio de un vector propio es el factor de escala por
el que ha sido multiplicado para que no se vean afectados
por la transformacin.
Por ejemplo, un vector propio de una rotacin en tres
dimensiones es un vector situado en el eje de rotacin sobre el
cual se realiza la rotacin. El valor propio correspondiente es 1 y
el espacio propio es el eje de giro. Como es un espacio de una

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

16

dimensin, su multiplicidad geomtrica es uno. Es el nico valor


propio del espectro (de esta rotacin) que es un nmero real.
Otro ejemplo sera una lmina de metal que se expandiera
uniformemente a partir de un punto de tal manera que las
distancias desde cualquier punto al punto fijo se duplicasen. Esta
expansin es una transformacin con valor propio 2. Cada vector
desde el punto fijo a cualquier otro es un vector propio, y el
espacio propio es el conjunto de todos esos vectores.

II. Definiciones.
Sea una matriz simtrica con de orden PxP con las siguientes
caractersticas:

12 12

21 22

p1 p 2

1p

2p

pp

Definicin 1. La traza de denotada por tr() se define como:


P

11 11 pp ii
i 1

Por lo tanto, la traza es la suma de todos los elementos de la


diagonal.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

17

Definicin 2. Los valores propios (llamados races


caractersticas) de son las races de la ecuacin polinomica.
|-I|=0
(1)
Cuando es desarrollada la expresin del determinante la
ecuacin resultante es:

c1 p c2 p 1 c p c p 1 0 (2)
La ecuacin (2) es una ecuacin polinominal de con grado p.
Los valores propios son la solucin a la ecuacin anterior.
Definicin 3. Cada valor propio tiene asociado un vector no cero
correspondiente, e, llamado vector propio que satisface la
condicin:
e =e
(1)
Debido a que tiene P valores propios (ya que la matriz es de
orden PxP), tendr P vectores propios. Denotemos, por e1,e2,ep
los vectores propios de correspondientes a los valores propios
1, 2, p respectivamente.
Ejemplo. Suponga la siguiente matriz de covarianzas, encuentre
sus valores y vectores propios.
6 2
=[
]
2 3
a. Valores propios
6 2
=[
]
2 3
6 2
1 0
I = [
] [
]
2 3
0 1
6
2
I = [
]
2
3

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

18

El determinante de la matriz -I, |-I|, es igual a la siguiente


ecuacin cuadrtica o ecuacin caracterstica:
2-9+14=(-7)(-2)=0.
La solucin son dos valores propios reales, diferentes y positivos
1=7 y 2=2.
b. Vectores propios
Es necesario calcular el vector propio asociado para la matriz ,
que para este caso corresponde al valor propio ms grande
(1=7) por lo tanto se construye el siguiente sistema de
ecuaciones:
e=e
e1
6 2 e1
[
] [ ]=7[e ]
2 3 e2
2
Construyendo un sistema de ecuaciones se llega a que:
6e1+2e2=7e1
2e1+3e2=7e2
Resolviendo y dejndolo en trminos de vectores se tiene que:
e1
2e2
7e 6e1
2e
[
]=[ 1
]
[ 2 ]=[2e ]
3e2 7e2
2e1
4e2
1
Existen infinitas soluciones. De manera que cualquier vector
propio de tamao 2X1 que tenga su primer elemento igual al
doble del segundo ser el vector propio de asociado con el
primer valor propio 1.
Si se asume, para eliminar infinitas soluciones, que la variacin
de la primera componente del vector propio e es igual a uno
(e2=1) se tiene que:
e2=1: 2e2= e1 e1=2 y por tanto
e1=2: 4e2=2e1 e2=1
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

19

Entonces el vector propio asociado para el primer valor propio


(=7) es:
2
x=[ ]
1
Es usual en la prctica determinar un valor propio de modo que
su tamao sea la unidad. Es decir, si existe el sistema x=x, es
posible tener e=x/x t x , entonces:
x t x =[2 1] [2]=5
1
El vector propio normalizado de correspondiente al primer
valor propio 1=7, corresponde a:
2/5 0.8944
e1= [
]=[
]
0.4472
1/5
Programacin en STATA
matrix input A = (6,2\2,3)
matrix symeigen Vectores Valores = A
matrix list Valores
matrix list Vectores
Ejercicio. Encuentre los valores
siguiente matriz de covarianzas:
7
=[
4

|Facultad de Economa |Carlos Mendoza Astroz|

y vectores propios de la
4
]
9

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

20

4. DISTRIBUCION NORMAL MULTIVARIANTE


Cuando se trabaja en la vida real, un supuesto habitual asume
que la variable en estudio, X, se distribuye con un
comportamiento normal. Por ejemplo, la altura, riqueza o
inteligencia de las personas, entre otras. La distribucin normal
univariada es una expresin de este hecho partiendo de un
promedio muestral y varianza muestral 2, que tiene la funcin
de densidad de probabilidad:

f ( x)

1
2

1 / 2( x ) / 2

-<x<

Un grfico de esta funcin es una forma de campana que agrupa


en el intervalo de una desviacin estndar alrededor de la media
el 68.0% de la poblacin, es decir, P(-X +)=68% y
agrupa en el intervalo con dos desviaciones estndar alrededor
de la media el 95.0% de la poblacin P(-2X +2)=95%.
La funcin de densidad normal univariada usualmente se nota
como N~(,2). Esta formulacin puede ser extendida al caso
cuando p>1. El tratamiento generalizado sobre variables como
una distribucin normal se encuentra fundamentado en el
Teorema del Lmite Central, que demuestra como la suma de
variables independientes se distribuye en el lmite, o cuando la
muestra tiende al infinito, bajo esta funcin de distribucin.
Teorema 1. Teorema de lmite central. Sea X1,..,Xn
observaciones independientes de cualquier poblacin con media
y covarianza ij, entonces:
n ( X ) se aproxima a NP(0, )
____

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

21

Para tamaos de muestra grande donde n debe ser ms grande


que p. De una manera simplificada, indica que si existen X1,...,Xp
variables aleatorias (v.a.) independientes con media y varianza
comn 2<, la funcin de densidad se aproxima a la
distribucin normal ZN(0,1) cuando el tamao de muestra, n,
es grande. Esto es, para n grande
X 1 X 2 X 3 ...... X n __
X N ( , )
n

Para observar la aplicacin en un ejemplo prctico sobre una


muestra aleatoria, es posible verificar el cumplimiento del
teorema del lmite central bajo el supuesto de diferentes tamaos
de muestra.

n=30
n=1000
n=5000
Distribucin normal bivariante
Es una generalizacin para vectores continuos del modelo
normal univariado. En el caso bivariante, la distribucin normal
no se basa en un nmero, sino en un vector de variables
aleatorias (X1,X2) con vector medias muestrales = (1, 2) y
matriz de covarianzas , definida por:
Basado en el caso univariado tiene como funcin de densidad
Una distribucin normal bivariada con media y matriz de
covarianzas se nota como N(, ), y se puede representar
grficamente como:
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

22

Propiedades
1. La distribucin marginal de X es N(1,1)
2. La distribucin marginal de Y es N(2,2)
3. La distribucin de Y condicionada por X = x0 se puede
representar como:
Donde es el coeficiente de correlacin para el caso bivariado.
= cov(X1,X2)
12
4. Si un vector aleatorio (X1,X2) tiene distribucin N(,) y
Cov(X1,X2)=0, entonces se puede representar su matriz de
covarianzas, , de la forma:
Sustituyendo esta expresin en la funcin de densidad de
probabilidad para una distribucin normal bivariada se obtiene
que f(x,y)=f(x)f(y), en este caso se denominan factores los
vectores aleatorios estadsticamente independientes.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

23

Distribucin Normal Multivariada


Se dice que un vector de variables aleatorias XT=[X1,X2..Xp]
tiene una distribucin normal multivariada si existe un vector
a=[a1,a2,..,ap], tal que:
p

a X ai xi
T

i 1

Donde cada uno de sus elementos del vector tiene una


distribucin univariada para todos los conjuntos posibles de
valores seleccionados. La media de un vector de variables
aleatorias X se denota por 1xp y la matriz de covarianzas de X se
denota por pxp. Definidas por:
E ( X 1 ) 1 )

E ( X 2 ) 2 )

E( X )

E ( X ) )
p

La matriz de covarianzas =Cov(X)=E[(X- )( X- )], de orden


pXp puede ser calculada como:
12 12

22
21

p1 p 2

1p

2p

pp

Donde ii=Var(Xi)=E[(Xi-i)2] y ij=cov(Xi)=E[(Xi-i)(Xj-j)]


Funcin de densidad de probabilidad normal multivariada
Suponga p variables estandarizadas aleatorias independientes e
idnticamente distribuidas (v.a.i.i.d.), Zi, i=1,n por el Teorema
del Limite Central poseen una funcin de distribucin de
probabilidad Zi~N(0,) si n es grande. Puesto que Zi es

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

24

independiente y con la matriz es posible obtener una funcin


de distribucin de probabilidad de la forma:
n

f ( Z1 ,.....Z n ) f ( z ) f ( zi )

si se supone una distribucin

i 1

normal multivariada

f ( Z1 ,.....Z n ) f ( z ) (2 ) 1 / 2 | |-1e 2zi

i 1

f ( Z1 ,.....Z n ) f ( z ) 2

n / 2

||

-n

n 2
e zi
i 1
1
2

f (Z1 ,.....Z n ) f ( z ) 2 n / 2 | |- n e 12 Z T Z

Donde ZT=(Z1,...,Zt) es un vector transpuesto de v.a.i.i.d.


normales. Ahora suponga la transformacin X=AZ+B donde A es
una matriz no singular de tamao nxn y B es un vector es un
vector nX1 de constantes. Es posible realizar la siguiente
transformacin:
g ( z ) 2 n / 2 | A |1 e12 Z T Z
pero Z=A-1(X-B)

g ( z ) 2 n / 2 | A |1 e 12 A1 ( X B)

( X B)

g ( z ) 2 n / 2 | A |1 e 12 ( X B)T At )( A1 ( X B) )

Puesto que E[Z]=0, entonces E[X]=B y la propiedad de


independencia que implica sobre la matriz de covarianzas
cov[Z]=In, por tanto cov(X)=AAT. Estableciendo que =B y =
AAT es posible reescribir g(x) de la forma estndar:

g ( z ) 2 n / 2 | |1 / 2 e 12 ( x )T 1 ( x ) )

La cual se conoce como distribucin normal multivariada con


media y matriz de covarianza .

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

25

Teoremas
Teorema 2. Si es positiva de modo que -1 existe, entonces
e=e implica que -1 e= 1 e

As el par de valores propios y vectores propios de


correspnden al par (1/,e) para -1. Tambin -1 es definida
positiva.
Teorema 3. Si X es distribuido como una NP(,) las q
combinaciones lineales
a11 X 1 a11 X 2 a1 p X p
a X a X a X
11 1
11 2
1p
p
AX

a
X

a
X

a
X

qp
p
q1 1 q 2 2
Son distribuidos Nq(A,AAT) . Tambin, X+d donde d es un
vector de constantes es distribuida Nq(A+b,).
Teorema 4. Si X es distribuido N(,), entonces cualquier
combinacin lineal de variables aTX=a1X1+a2x2+..+apXp es
distribuido N(aT,aTa). Tambin, si la combinacin lineal aTX es
distribuida como N(aT, aTa) para cada a, entonces X debe ser
N(,).
Teorema 5. Todos los subconjuntos de X estn normalmente
distribuidos. Si se particiona X, su vector de medias y matriz de
covariazas ser de la forma,

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

11

21

X1
1

X

X2

2

26

| 12

| 22

Teorema 6. Si X1 y X2 son dos vectores aleatorios independientes


de orden qX1 y qX2 respectivamente, entonces
a. Las covarianzas entre dichos vectores son iguales a cero,
Cov(X1,X2)=0. La matriz de ceros es de orden q1Xq2.
b. Si
es | entonces X1 y X2 son independientes si y
X1


X2

11

N q1q 2 ,
2 21

12

| 22

solo si 12=0.
c. Si X1 y X2 son independientes y distribuidas Nq1(1,11) y
Nq2(,) respectivamente, entonces [X1 X2] es normal
multivariante distribuido como:
1 11

N q1q 2 ,

2 0

|
0

| 11

Teorema 7. Sea X una variable distribuida Np(,) con ||>0.


Entonces,
a. La matriz (x-)T-1(x-) es distribuida como una chicuadrado con p grados de libertad, 2(0.5,2).
b. La distribucin Np(,) asigna una probabilidad 1- a la
elipse solida tal que {x|(x-)T-1(x-) 2(0.5,2)}, donde 2(,p)
denota el contorno superior del y se describe como el
percentil de la distribucin 2.
Ejemplo. Suponga las diez empresas ms grandes de Colombia
con los datos de ventas, utilidades y activos expresados en
millones de dlares.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA


No
Ecopetrol
Avianca
Suramerica
Tablemac
Coltejer
Coltabaco
xito
ETB
ISA
Argos

27

ventas utilidades activos


126.97
4.22
173.29
96.93
3.83
160.89
86.65
3.51
83.21
63.43
3.75
77.73
55.26
3.93
128.34
50.97
1.8
39.08
39.06
2.94
38.52
36.15
0.35
51.038
35.2
2.48
34.71
32.41
2.41
25.63

Determine si las ventas y utilidades registradas por estas


empresas hacen parte de una distribucin normal bivariada. El
resultado puede ser comparado utilizando el resultado
establecido como:
(x-)T-1(x-) 2(0.5,2)
Si no se conoce la varianza poblacional, , es necesario utilizar la
varianza muestral, S, de la forma:
(x-)TS-1(x-) 2(0.5,2)
Donde se prueba si se encuentra sobre un distribucin normal
bivariada con una distribucin chi cuadrado con dos grados de
libertad que toma un valor de 1.39 2(0.5,2)=1.39. Valores
superiores afirma que no se encuentra sobre una distribucin
normal.
varianza

inversa

POBLACIONAL
9005.32 230.38
230.38
12.89
0.0002
-0.00366

-0.00366
0.14296

MUESTRAL
1000.59
25.60
25.60
1.43
0.0018 -0.032915
-0.0329 1.2866317

Variables centradas
No
ventas
Ecopetrol
64.667
Avianca
34.627
Suramerica
24.347
Tablemac
1.127
Coltejer
-7.043
Coltabaco
-11.333
xito
-23.243
ETB
-26.153
ISA
-27.103
Argos
-29.893

utilidades
1.298
0.908
0.588
0.828
1.008
-1.122
0.018
-2.572
-0.442
-0.512

2(0.5,2)
4.343
1.199
0.594
0.823
1.866
1.019
1.023
5.343
0.815
0.975

El resultado indica que siete de esas distancias (70%) son


inferiores a 1.39. Si fuera una distribucin normalmente
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

28

distribuida es de esperarse que cerca de la mitad, cinco


observaciones, se encuentren dentro del contorno, razn por la
cual se rechaza la hiptesis que esta sea una distribucin normal
bivariada.
Constrastes de multinormalidad
Para contrastar la normalidad univariada,como primer pasose
han desarrollado estrategias graficas que alertan sobre la
normalidad de un conjunto de datos. Al estrategia mas usada
consiste en graficar cuantilas de datos frente a cuantilas de
distribucin univariada, estos graficos se conocen como QxQ
plot. Las cuantilas son similares a los percentiles, un grafico QxQ
plot se obtiene:
1. Se ordenan las observaciones de mayor a menor. As la
cuartila muestral xi es la cuartila i/n.
2. Se ubican los pares y se examina la linealidad resultante.
Ejemplo. Suponga que se generaron nmeros aleatorios
distribuidos bajo una distribucin normal estndar con 500
observaciones.
genera
siguiente QxQ plot.
NormalSe
grfico
Q-Q deel
VAR00001
4
3
2

Valor Normal esperado

1
0
-1
-2
-3
-4
-4

-3

-2

-1

Valor observado

El contraste estadstico de mayor significancia y utilizacin de


para corroborar la normalidad univariada es el Kolmogorov|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

29

Smirnov. Este estadstico calcula la distancia entre la funcin de


distribucin emprica de la muestra, Fn(X) y la terica, F(X), en
este caso la normal. El estadstico de prueba consiste en:
Dn=max{|Fn(X)-F(X)|}
Donde max es la funcin mximo. Lo que intenta la prueba es
determinar la distancia mxima entre la distribucin terica y la
muestral, con ello realizar el estadstico. La prueba de hiptesis
asociada
H0: no es normal la muestra
H1: es normal la muestra
Ejemplo. Suponga que se generaron nmeros aleatorios
distribuidos bajo una distribucin normal estndar con 500
observaciones. Se demostrara el uso del estadstico KolmogorovSmirnov (KS).

La prueba parte de un estadstico KS con un valor de 0.555 lo


que indica que la significaciona tiene un valor de 0.917 lo cual
rechaza la hiptesis nula de no normalidad de la muestra. Con
este resultado se puede asegurar con un 95.0% de confianza que
la muestra parte de una distribucin normal.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

30

PARTE II MODELOS MULTIVARIANTES

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

1.

31

ANLISIS DE COMPONENTES PRINCIPALES (ACP)

1.1. INTRODUCCIN
Un anlisis de componentes principales (ACP) est interesado en
explicar la estructura de varianzas y covarianzas (informacin)
de un conjunto de variables a travs de combinaciones lineales
de estas.
Dicha representacin debe ser tal que al desechar dimensiones
superiores (generalmente de la tercera o cuarta en adelante) la
prdida de informacin sea mnima.
El objetivo principal que persigue el ACP es la representacin de
las medidas numricas de varias variables en un espacio de
pocas dimensiones donde puedan percibir relaciones que de otra
manera permaneceran ocultas en dimensiones superiores y
permitir, en primer lugar, reducir los datos, y en segundo lugar,
efectuar interpretacin de resultados.
Aunque p componentes son necesarias para reproducir la
variabilidad completa del sistema, muchas veces esta puede ser
resumida por un pequeo nmero k de componentes principales
(k<p).
Si es as (casi siempre) mucha informacin en los k componentes
se refleja como si existiera en las p variables originales.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

32

1.2 INTERPRETACIN GEOMETRICA


La representacin grfica implica la creacin de un plano rdimensional y ubicarlo de tal manera que se encuentre lo ms
aproximado al grfico de dispersin de los datos originales.
Suponga un plano inicial que cruza a travs del origen
determinado por la combinacin lineal u1, u2,,ur consistente de
todos los puntos con las siguientes caracteristicas:
x=b1u1+b2u2+..+brur=UB para algun B
Este plano, puede ser trasladado a cualquier ubicacin a travs
de un punto a lo cual se convierte en a+UB para algn b.
El objetivo de los componentes principales (ACP) es seleccionar
un plano r-dimensional a+UB que minimice la suma de las
distancias al cuadrado, nj=1 d2j , entre las observaciones xj y el
plano r-dimensional a+UB.
Grafico 1. Visin grafica del anlisis de componentes principales

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

33

Las k componentes principales pueden reemplazar las p


variables iniciales del conjunto de datos originales, consistente
de p variables reducidas a un conjunto de datos de k
componentes principales.
Un anlisis de componentes principales muchas veces revela
relaciones que no fueron previamente sospechadas, por lo tanto,
permite efectuar interpretaciones que ordinariamente no
tendran algn tipo de sustento.
El anlisis de componentes principales es un paso intermedio,
ms que un fin en si mismo, debido a que es un intermediario
para procesos ms largos de investigacin. Por ejemplo, puede
ser insumo para regresiones mltiples, anlisis de cluster,
construccin de indicadores, entre otros.
Se quiere construir un nuevo sistema de coordenadas
ortogonales (perpendiculares) en el cual los puntos puedan ser
representados de una manera tal que sus proyecciones sobre el
nuevo primer eje recojan la mayor cantidad posible de variacin
(varianza). Las proyecciones sobre el segundo eje recoja el resto,
y asi sucesivamente.
Intuitivamente, para un grafico con dos variables, encontramos
que tales ejes corresponden a las rectas F1 y F2, representadas
en la grfica 2 cuyo origen se encuentra en la interseccin de los
promedios de las variables X y Y, que desde ahora ser
denominado centro de gravedad G de la nube de puntos.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

34

Grafica 2. ACP para dos componentes

Con mucha frecuencia se maneja simultneamente un nmero p


de variables numricas. Si cada variable se representa sobre un
eje, se necesitara un sistema de coordenadas con p ejes
perpendiculares entre s para ubicar las coordenadas de los
puntos y poderlos representar.
Este grafico es imposible incorporarlo cuando p4, pero la idea
esbozada en el ejemplo anterior sigue siendo vlida, buscar un
nuevo sistema de coordenadas con origen en el centro de
gravedad, G, de tal manera que el primer eje del nuevo sistema
(F1) refleje la mayor cantidad posible de variacin a travs de la
minimizacin de las distancias entre el plano y los datos. El
segundo eje (F2), refleje la mayor cantidad posible entre la
variacin restante, el tercer eje (F3) la mayor variacin posible
remanente despus de las dos anteriores, y as sucesivamente.
Observando la figura anterior se puede deducir que el nuevo
sistema de coordenadas se logra despus de dos movimientos en
la nube de puntos. Un primer movimiento es una traslacin que
permite situar el nuevo origen en el centro de gravedad de la
nube, G.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

35

La nueva nube, obtenida despus de esta traslacin se llama


nube centrada. Un segundo movimiento que se hace sobre la
nube centrada es una rotacin, usando el centro de gravedad
como punto pivotal. Existe una visin alternativa de rotacin a
travs de senos y cosenos
Esta rotacin ha de hacerse de tal manera que el nuevo primer
eje del sistema de coordenadas apunte en la direccin de
mxima dispersin de la nube centrada. El segundo eje apunte
en la direccin con la segunda mayor dispersin y perpendicular
al anterior. El tercer eje en la direccin de tercera mayor
dispersin perpendicular a las dos anteriores y as
sucesivamente.
Es evidente que el nuevo sistema de coordenadas tiene entonces
tantos ejes perpendiculares entre s como tena el antiguo, es
decir, tantos ejes como variables se hayan considerado
inicialmente.
1.3. RESULTADOS MATEMATICOS Y GRAFICOS DEL ACP
Suponga considerar los componentes principales derivados de
variables aleatorias con una distribucin normal multivariante.
Suponga X es distribuido como N(,), aunque este supuesto no
es necesario. Se puede demostrar que la densidad de X es
constante sobre elipsoides centrados con la formula:
(X-)-1(X-)=c2

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

36

La cual tiene ejes ci ei i=1,2,.p donde (i,ei) es la


combinacin de valor propio y vector propio de . Es decir,
Grfico 3. Representacin grafica por elipsoides

Un punto sobre el eje i-esimo de la elipsoide tendr coordenadas


a ti =[ei1,ei2,,eip] en el sistema de coordenadas que tiene
origen en y los ejes son paralelos a los ejes originales x1,x2,.,xp.
Ser conveniente, en principio, establecer el punto en el origen,
es decir, =0 de manera que con A=-1 es posible reescribir:
1
1
1
c2=xt-1x= ( )2+ ( )2+..+ ( )2
1

Esta ecuacin define una elipsoide (puesto que 1,2,..,p son


positivas) en un sistema de coordenadas con ejes y1,y2,.yn en
las direcciones e1,e2,.,ep, respectivamente.
Si 1 es el valor propio ms grande, entonces el eje principal tiene
que ir a en la direccin e1. Los restantes ejes sern definidos por
las direcciones de e2,,ep.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

37

Para resumir, los componentes principales y1=1t x, y2=t2 x,..


yp=tp x se encuentran en las direcciones de los ejes de una
elipsoide con densidad constante. Por lo tanto, cualquier punto
sobre el eje de la elipsoide i-esima tiene coordenadas x
proporcionales a ti =[ei1,ei2,, eip] y necesariamente la
coordenada de la primera componente principal tiene la forma
[0,0,.,yi,0,0].
Cuando 0, es la componente principal centrada en la medida
que yi=ti (x-) tiene media cero y direccin del vector propio ei.
Una elipse de densidad constante y componentes principales
para un vector aleatorio normal bivariante con =0 y =0.75 se
demuestran en la siguiente figura.
Grafico 4. Elipse de densidada constante de tamao xtx=c2 y las
componentes principales y1,y2 para un vector aleatorio normal
bivaraido X teniendo una media de cero.

Se puede observar que las componentes son obtenidas rotando


las coordenadas de los ejes originales en un angulo hasta que
coincida con los ejes de un plano r-esimo con densidad

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

38

constante. Este resultado aplica para p>2 dimensiones de igual


forma.
En conclusin, los resultados algebraicos y graficos indican que
los componentes principales son combinaciones de P variables
aleatorias x1,,xp. Geometricamente estas combinaciones
representan una seleccin de un nuevo sistema de coordenadas
obtenido de rotar el sistema original con x1,,xp como eje de
coordenadas. Los nuevos ejes representan las direcciones con
mxima variablilidad y proporciona una descripcin ms simple y
parsimoniosa de la estructura de covarianza de los datos.
1.4. CLCULO DE LOS COMPONENTES PRINCIPALES
Consideremos p variables aleatorias de tipo numrico X1,X2,.,Xp
las cuales posiblemente estn correlacionadas entre s. Podemos
pensar que las p variables anteriores, consideradas
conjuntamente, forman una variable aleatoria multivariada,
denotada por un vector X=(X1,X2,.,Xp).
La matriz de covarianzas asociada al vector X est definida como
donde la entrada en la fila i columna j es el valor de la
covarianza entre Xi y Xj , Cov(Xi,Xj). Esto hace que la diagonal de
est conformada por las varianzas Var(X1),Var(X2),.,Var(Xp) y
que sea simtrica1. Estas caractersticas tambin implican que
sean semidefinida positiva.

Se puede probar que es una matriz definida positiva, es decir, la forma cuadrtica asociada a ella tiene todas sus races positivas.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

39

La idea que se persigue es determinar un nuevo conjunto de


variables y1,y2,...,yp, no correlacionadas entre s (ortogonales o
perpendiculares), cuyas varianzas decrezcan desde la primera
nueva variable hasta la ltima, llamadas componentes
principales.
Cada componente principal yj (donde j=1,...,p) es una
combinacin lineal de las x1,x2, ...,xp variables originales, es decir:
Suponga para el conjunto de variables iniciales representados
por un vector de variables X la j-esima componente principal:
yj = aj1x1+aj2x2+...+ajpxp (1)
O de forma matricial:
yj = aTx
(2)
Donde aT=(aj1,..,ajp) es un vector de constantes y xT=[x1,x2,...
,xp] es un vector de p variables aleatorias que componene la jesima variable ortogonal, yj. El objetivo es recoger la mayor
cantidad posible de variacin (maximizar la varianza explicada)
por cada combinacin lineal yj.
La forma para maximizar la varianza explicada es modificar los
coeficientes aij por cada combinacin lineal yj incorporando las
condiciones de ortogonalidad definidas anteriormente.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

40

Por ello, para mantener la ortogonalidad de la transformacin, y


evitar esta solucin trivial de crecimiento infinito, se impone que
la suma de cuadrados de los coeficientes sea igual a uno y este
sea el mdulo del vector aT=(a1j, a2j,..., apj), es decir, expresado de
manera formal:
p

a a j akj2 1
T
j

k 1

(3)

El primer componente se calcula eligiendo el vector de


parmetros que maximice la informacin expresada, o minimice
la distancia entre el plano y los datos a travs del valor del vector
a1.
La primera componente (y1) tiene la mayor varianza posible y se
calcula obteniendo los parmetros que minimizan la distancia
entre los datos y el plano r-dimensional a travs de las
ponderaciones a1 del vector y1=1t x, sujeta a la restriccin que los
parmetros no aumenten infinitamente, expresado como que la
suma de los cuadrados de las ponderaciones sobre las variables
originales, X, sea igual a la unidad, es decir, 1t 1 =1.
El segundo componente principal, y2, se calcula obteniendo los
parmetros que minimizan la distancia entre los datos y el plano
r-dimensional a travs de las ponderaciones a2 del vector y2=t2 x.
Adems, sujeta a la restriccin que los parmetros no aumenten
infinitamente y la variable obtenida est no correlacionada con
la primera componente principal (y1). Es decir, exprese la mayor
varianza posible no explicada por el primer componente.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

41

Del mismo modo, se eligen y3,y4,,yp componentes no


correlacionadas entre s, de manera que las nuevas variables
obtenidas tengan cada vez menor varianza.
1.5. PROCESO DE EXTRACCIN
El objetivo del proceso para encontrar las componentes
principales (yi) es elegir un vector de constantes a1 de modo que
se maximice la varianza de y1 sujeta a la restriccin de que
1t 1 =1, como ya fue justificado.
El mtodo habitual para maximizar una funcin de varias
variables sujeta a restricciones de igualdad es el mtodo de
multiplicadores de Lagrange, usualmente aplicado en economa.
El problema consiste en maximizar la varianza explicada
ponderada por un vector de coeficientes a que determinan los
pesos de cada variable, at1 a1 , sujeta a la restriccin 1t 1 =1.
La incgnita que se busca es un vector a1 desconocido de
parmetros sobre el vector de variables originales X que balance
las p variables existentes y determine una combinacin lineal
ptima que maximiza la varianza explicada o que minimice las
distancias entre un plano y cada uno de los puntos originales.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

42

De esta forma, se puede representar un problema de


optimizacin matemtica y su representacin en una funcin
lagrangiana, (), de la forma:
Max (4)
a1
S.A. a1T a1 1
La funcin lagrangiana esta representada por:
(a1 ) a1T a1 (a1T a1 I )
Las condiciones de primer orden (CPO) del problema de
optimizacin respecto a los parmetros a estn dadas por:
()
2a1 2Ia1 0
a1
( I ) 0 (5)

Desarrollando la expresin anterior se tiene que:


(I) = 0
= I
premultiplicando por
a1
= Ia1
Var(y1) = Ia1 pero a1=Var(y1)
Var(y1) = Ia1
Var(y1) = a1 pero a1=1
Var(y1) =
(6)
De este modo, , es conocido como el primer valor propio de la
matriz de covarianzas, , que es solucin de la ecuacin
caracterstica (5) expresado en la ecuacin (6).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

43

Este resultado puede ser interpretado como la varianza de la


primera componente principal (y1) esta representada por el
primer valor propio de la matriz, , Var(y1)=1.
El segundo componente principal se calcula como y2= x y se
obtiene mediante un argumento parecido.
Adems, se requiere que y2 est no correlacionado con el
anterior componente y1, es decir, para asegurar la ortogonalidad
o independencia, se tiene que imponer que la covarianza entre
las variables (y2,y1) sea igual a cero, Cov(y2,y1)=0.
Por lo tanto, suponga la covarianza entre la primera (y1) y
segunda (y2) componente principal de la forma:
Cov(y2, y1)
= Cov( x, x)
= E[ (x)(x)T ]
=
Cov(y2, y1)
=
Por los resultados de la primera componente que:
= I
a1 = I
Cov(y2, y1) = a1 =
= a1 pero > 0 entonces
a1 = 0.
Es decir, se demuestra que los vectores de las ponderaciones de
la primera y segunda componente principal son ortogonales.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

44

De este modo, se tiene que maximizar la varianza de la segunda


componente principal, y2, es decir, a2a2, sujeta a dos
restricciones.
La primera, sobre el tamao restringido de la suma de cuadrados
del vector de ponderaciones de la segunda componente
principal, a2=1.
La segunda, la independencia entre las ponderaciones de la
primera (y1) y segunda (y2) componente principal descrita como
a1=0.
De esta forma, es posible construir un problema de optimizacin
lagrangiana, (), de la forma:
Max
a2
a2T a2 1
Sujeto a a T a 0
2

La funcin lagrangiana, (), es representada entonces por


(a2 ) a2T a2 1 (a2T a2 1) 2 (a2T a1 )

Las condiciones de primer orden (CPO) del problema estn


dadas por:
()
2a2 21 Ia2 2 a1 0
a2

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

45

Si se premultiplica por 1T la CPO en la ecuacin entonces:


= 21T 2 -21T 1Ia2-1T 21 =0
= 21T 2 -21I1T a2-21T 1 =0
Si se conoce que 1T 1 =1 y 1T 2 =0. Entonces:
0=21T 2 -2
O lo que es lo mismo:
2=21T 2
Pero se demostr anteriormente que 1T 2 = a1=0. De este
modo, queda finalmente la CPO como:
()
2a2 2 2 Ia2 0
a2

Usando el mismo procedimiento que antes, elegimos 2 como el


segundo valor propio mayor de la matriz de covarianzas, , con
su vector propio asociado a2.
1.6. TEOREMAS
Los resultados anteriores se pueden expresar de una manera
sinttica y con el formalismo necesario en los siguientes
teoremas.
Teorema 1. Sea una matriz de covarianza asociada con vectores
aleatorios xT=x1, x2,,xp. Suponga que la matriz tiene pares
de valores y vectores propios (1,e1), (2,e2),..,(p,ep) donde
12p0, la i-esima componente principal esta dada
por:
yi eiT x e1i x1 e2i x2 ....e pi x p

i 1,2,...., p

De esta forma,

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

46

Var ( yi ) eiT ei i
cov( yi , yk ) eiT ek 0

ik

Si algunos i son iguales la eleccin del coeficiente ei asi como yi


no son nicos.
La solucin a los problemas de optimizacin planteados
anteriormente por un mtodo lagrangiano son resueltos
paralelamente a travs de hallar los valores y vectores propios de
la matriz de covarianzas, .
Teorema 2. Suponga que xT=x1, x2,,xp tienen una matriz de
covarianzas con pares de valores y vectores propios (1,e1),
(2,e2),..,(p,ep) donde 12p0. Por otra parte, sea la
siguiente combinacin y1=1t x, y2=t2 x,., yp=tp x. Entonces:
p

i 1

i 1

11+22+..+pp = Var ( X i ) 1 2 .... p var( yi )


El resultado indica que la varianza poblacional (VP) es la suma
de los valores propios o el valor de la traza de la matriz . La
proporcin total de la varianza explicada (PVE) por la k-esima
componente es:

PVE=
k=1,2,.p
k

1 2 .... k

Muchas veces este porcentaje es bastante alto con un pequeo


valor de k<p lo que se traduce en una alta representatividad en
un espacio de pocas dimensiones.
Como puede deducirse de lo anterior, la varianza total se
descompone en un nmero finito de partes disjuntas j de
tamaos cada vez menores, lo que en la prctica proporciona un
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

47

mecanismo para reducir la dimensionalidad de representacin


de las variables.
En efecto, si se olvidan las ltimas p-k componentes principales,
las primeras p tendrn una tasa de representatividad igual a
1 2 p k
VT

100%

de la varianza total de las variables

originales.
Si por ejemplo, 80% o 90%, de la varianza poblacional total
puede ser atribuida a la primera y segunda componente
entonces estos pueden sustituir las p variables originales por las
componentes sin perdida de demasiada informacin.
Teorema 3. Si y1= x, y2= x,.. yp= x son componentes
principales obtenidos de la matriz de covarianzas, , entonces:

Y , X
1

eki i

kk

i=1,2.p

Son los coeficientes de correlacin entre la componente principal


i-esima (Yi) y la variable k-esima (xk). Lo que indica el teorema
anterior es que cada componente del vector ti =[ei1,e12,,eip]
tambin debe ser inspeccionado.
La magnitud de eik mide la importanica de la k-esima variable
sobre i esima componente principal, sin tener en cuenta otras
variables que se denominara driver.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

48

En particular eik es proporcional al coeficiente de correlacin


entre la componente (Yi) y la variable (xk). Aunque las
correlaciones de las variables (X) con la componente principal
(Yi) muchas veces ayuda a interpretar los componentes, ellas
miden nicamente la contribucin univariada de un individuo X
frente a la componente Y.
Es decir, ellas no indican la importancia de la variable X a la
componente principal Y, solo su grado de correlacin en la
presencia de otras variables X.
Aunque coeficientes del vector propio y correlaciones calculadas
pueden conducir a distintas clasificaciones como medidas de
importancia, no se aprecian diferencias sustanciales en sus
valores.
En la prctica financiera, variables con relativamente altos
coeficientes de los componentes del vector (en valor absoluto)
tienden a tener alternativamente ms correlacion entre la
componente y la variable.
De este modo las dos medidas, la primera multivariada
(coeficiente eik) y la segunda univariada (correlacion)
frecuentemente arrojan resultados similares.
Siempre es recomendado examinar los coeficientes y las
correlaciones en bsqueda de interpretar los componentes, por
esta razn, se recomienda en primera instancia verificar los
coeficientes eik, posteriormente las correlaciones aunque en la
mayora de los casos arrojen resultados similares.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

49

Ejemplo. Suponga la siguiente de matriz de varianzas y


covarianzas, , con variables aleatorias X1, X2, X3:
1
= [2
0

2 0
5 0]
0 2

Despues de incluir la matriz en STATA se utiliza el comando


pcamat abc, n(0) names(x1 x2 x3) components(3) covariance que
arroja los siguientes resultados:
Tabla 1

La conclusin arroja los valores y vectores propios determinados


como:
1=5.83 1t =[-0.383, 0.924,0]
2=2.00 =[0, 0, 1]
3=0.17 t3 =[0.924, 0.383, 0]
Por lo tanto, las componentes principales se convierten en:
Y1=e1t =-0.383X1+0.924X2
Y2=et2 =X3
Y3=et3 =0.924X1+0.383X2

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

50

La suma de los componentes principales 1+2+3 extraidos de


la matriz de covarianzas es igual a la traza de esta matriz.
Ambos son iguales a ocho (8).
Utilizando los resultados del TEOREMA 1, se desea determinar la
varianza de la primera componente (Y1), es decir:
Var(y1)=e1t e1
O mejor
Var(y1)=Var(-0.383X1+0.924X2)
Var(y1)=(0.383)2Var(X1)+(0.924)2Var(X2)-2(0.383)(0.924)
Recurriendo a la matriz de covarianzas, , implica que
Var(X1)=1, Var(X2)=5 y cov(X1, X2)=-2. Entonces:
Var(y1) = 0.147(1)+0.854(5)-0.708(-2)
Var(y1) = 5.83
Var(y1) = 1
La varianza de la primera componente principal corresponde al
primer valor propio.
La varianza total utiliza el TEOREMA 2 a partir de la matriz de
covarianzas, , la calcula de la siguiente forma:
Var ( X ) var( y ) = 11+ 22+ 33=1+5+2
p

i 1

i 1

La proporcion de la varianza explicada por la primera


componente principal (VEC1) es:
VEC1=

1
1 +2 +3

5.83
1 +2 +3

5.83

= 8.00 =0.7286

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

51

Es decir, la primera componente explica el 72.86% de la varianza


total.
Este mismo procedimiento se efectua para las dems
componentes. En este caso, los componentes Y1 y Y2 podran
reemplazar las tres variables originales (X1, X2, X3) sin mayor
perdida de informacin ya que entre los dos explican el 97.86%
de la varianza total.
Es decir, la proporcion de la varianza explicada por la primera y
segunda componente principal (VEC1|2) es:
1 +2
5.83+2
7.83
VEC1|2= +
=
=
=0.9786
+
+ +
8.00
1

Por otra parte, utilizando el TEOREMA 3 es posible encontrar el


coeficiente de correlacion entre la primera componente (Y1) y la
variable X1 de la forma:
Y1,X1=

e11 1
11

0.3835.83

= -0.925

Para la componente (Y1) y la variable X2 se calcula de la siguiente


forma:
Y1,X2=

e12 1
22

0.9245.83

= 0.998

Observese la variable x2 con el coeficientea asociado del valor


propio de -0.925 que recibe en la primera componente Y1.
Tambien tiene la ms alta correlacion con 0.998 (en valor
absoluto).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

52

La correlacin de x1 con Y1 (-0.925), por otra parte, es casi tan


grande como la de x2 (.0.998) son casi igualmente importantes
para la primera componente principal (Y1).
Los pesos relativos (en valor absoluto) de los coeficientes de X1 y
X2 suguiere que X2 contribuye mas en la determinacin de Y1 de
lo que hace X2. Puesto que ambos coeficientes son
razonablemente grandes y de signos opuestos, se puede afirmar
que ambas variables colaboran en la interpretacin de Y1.
1.7. COMPONENTES
PRINCIPALES
NORMADO
O
POR
CORRELACIONES
Todo lo mencionado anteriormente tiene un sentido geomtrico
y matemtico muy claro pero en la prctica tiene un problema de
interpretacin.
Qu significado tiene una variable artificial Fj que ha sido
construda, como una combinacin de otras variables cuyas
naturalezas pueden ser muy diferentes?
Qu nombre puede recibir por ejemplo, una variable
conformada por una combinacin de edad, peso, ingresos, etc?
Por otra parte, el peso de cada variable original, traducido
fundamentalmente en volatilidad, puede ser muy diferente para
cada variable.
Una variable muy dispersa puede contribuir enormemente a la
varianza total mientras que una variable ms homognea
contribuye menos. Esto finalmente determina la participacin de
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

53

cada variable en la conformacin de un factor generando ruido


en el clculo.
El clculo de los componentes principales de una serie de
variables x1,x2...,xp depende habitualmente de las unidades de
medida empleadas. Si transformamos las unidades de medida, lo
ms probable es que cambien a su vez los componentes
obtenidos.
Una solucin frecuente es usar variables x1,...,xp normalizadas.
Con ello, se eliminan las diferentes unidades de medida y se
consideran todas las variables implcitamente equivalentes en
cuanto a la informacin recogida.
Realizar ACP con variables originales estandarizadas resuelve
los dos problemas. El primero, con las variables estandarizadas
no tiene nombre, son simplemente nmeros sin unidades en las
cuales se expresen las mediciones.
De otra parte, la estandarizacin lleva todas las escalas de
medida a una forma comn de media 0 y varianza 1, con lo cual
se elimina el problema de medicin y variabilidad diferente de
las variables originales.
El ACP realizado con variables originales estandarizadas se llama
ACP normado. El ACP normado equivale al ACP corriente pero
partiendo de la matriz de correlaciones en vez de la matriz de
covarianzas .

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

54

El ACP normado debe ser la tcnica a seguir en cualquier caso, a


menos que se quieran explorar algunas otras posibilidades de tipo
terico o que se tengan variables muy similares tanto en su
naturaleza como en su escala de medida.
Los componentes principales de la matriz de correlaciones, le da
igual importancia a todas las variables originales, a diferencia del
ACP por matriz de covarianzas. En la matriz de correlaciones
todos los elementos de la diagonal son iguales a 1.
Si las variables originales estn normalizadas, esto implica que
su matriz de covarianzas es igual a la de correlaciones, con lo que
la variabilidad total (la traza) es igual al nmero total de
variables.
La suma total de todos los valores propios ser p y la proporcin
de varianza recogida por el valor propio j-simo (componente)
ser de j/p. Los componentes principales pueden ser obtendos
de variables estandarizadas de la forma:
(X1 1 )

Z1=

11
(X2 2 )

Z2=

:
:

22

(Xp p )

Zp=

pp

En notacin matricial:
Z=(V1/2)-1(X-)

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

55

Donde la matriz V1/2 es diagonal constituida por desviaciones


estndar. Donde E(Z)=0 y su matriz de covariazas es igua a:
Cov(Z)=(V1/2)-1(V1/2)-1=
Los componentes principales de Z pueden ser obtenidos de los
vectores propios de la matriz de correlaciones de X. Todos los
resultados previos aplican exactamente igual con algunas
simplificaciones, puesto que la varianza de Zi es la unidad.
En el caso de variables estandarizadas se utilizar la misma
notacin Yi para referirse a la i-esima componente principal y
(i,ei) al par de valores y vectores propios de la matriz de
correlaciones, , o matriz de covarianzas .
Sin embargo, (i,ei) derivado de la matriz de covarianzas en
general no son las mismas que las derivadas a travs de la matriz
de correlaciones.
Teorema 4. La i-esima componente principal de variables
estandarizadas Z=[Z1,Z2,.,Zp] con una matriz de covarianzas
cov(Z)= esta dada por:
Yi=ti Z=ti [(V1/2)-1](X-) i=1,..,p
De forma matricial, (V1/2)-1 es una matriz diagonal con cada uno
de los componentes de la diagonal igual a la desviacin estndar
de la j-esima variable, 1/jj . Ademas:
p

Var(Yi ) = Var(Zi ) = p
i=1

|Facultad de Economa |Carlos Mendoza Astroz|

i=1

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

56

Las covarianzas entre las variables estandarizadas y las


componentes principales esta definida como:
Yi,Zk=eiki i,k=1,2,..,p
En este caso (1,e1), (2,e2),.., (p,ep) son los pares de valores y
vectores propios de la matriz de correlaciones dada la
caracterstica de 12,.. p0.
La varianza total poblacional (variables estandarizadas) es
simplemente p, la suma de los elementos de la diagonal de la
matriz de correlaciones .
Con variables estandarizadas Z en vez de variables sin
estandarizar (X) es posible encontrar la proporcin de varianza
total explicada (VTE) por la k-esima componente principal de Z
como:

VTE = pk k=1,2,,p

Ejemplo. Suponga la siguiente de matriz de covarianzas, , con


variables aleatorias X1, X2:

=[
]

Y una matriz de correlaciones, , asociada:
.
=[
]
.
Se calularon los pares de valores y vectores propios en STATA
con la siguiente sintaxis:
pcamat covarianza, n(0) names(x1 x2) components(2) covariance

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

57

Para la matriz de covarianzas, , y para la matriz de


correlaciones, , se utiliz:
pcamat
correlaciones,
n(0)
names(x1
x2)
forcepsd
components(2).
Grafico. Comparacin resultados de PCA con matriz de
covarianzas y correlaciones
CORRELACIONES

COVARIANZAS

a. Matriz de covarianzas
Los valores y vectores propios de la matriz de covarianzas, , se
tienen que:
1=100.16 1t =[0.04, 0.99]
2= 0.84
=[0.99,-0.04]
Las componentes principales se convierten en:
Y1=e1t =0.04X1+0.99X2
Y2=et2 =0.99X1 - 0.04X2

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

58

b. Matriz de correlaciones
Los valores y vectores propios de la matriz de correlaciones, , se
tiene que:
1=1+=1.4 1t =[0.707, 0.707]
2=1-= 0.6 =[0.707,-0.707]
Las componentes principales se convierten en:
Y1=e1t =0.707X1+0.707X2
Y2=et2 =0.707X1 - 0.707X2
Por ejemplo, para la primera componente, Y1, se tiene que:
X
X
Y1=0.707Z1+0.707Z2=0.707[ 1 1 1 ]+0.707[ 21002 ]

Para la segunda componente Y2, se tiene que:


X
X
Y2=0.707Z1+0.707Z2=0.707[ 1 1 1 ]-0.707[ 21002 ]

Dada la diferencia de las varianzas observadas por los valores


propios (1=100.16 y 2=0.84), la variable X2 domina
completamente la primera componente principal (Y1)
determinada por la matriz .
Ademas, La primera componente principal explica una
proporcin de la varianza poblacional de 99.2%, es decir:
1
100.16
=
= 0.992
1 + 2 100.16 + 0.84
Cuando las variables estn estandarizadas, sin embargo, el
resultado de las variables contribuye de igual manera a las

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

59

componentes principales determinadas por la matriz de


correlaciones .
Utilizando el TEOREMA 4 se puede obtener que la correlacin
entre la variable estandarizada Z1 respecto a la primera
componente principal se calcula como:
Y1,Z1=e111 =0.7071.4=0.837
La correlacion entre la variable estandarizada Z2 respecto a la
segunda componente principal se calcula como:
Y1,Z1=e211 =0.7071.4=0.837
En el caso de la primera componente principal explica una
proporcin de 70% dela varianza total estandarizada, es decir:
1 1.4
=
= 0.7
p
2
La importancia relativa de las variables, por ejemplo, la primera
componente principal se ve significativamente afectada por la
estandarizacin.
Cuando la primera componente principal se obtiene de la matriz
de correlaciones esta expresada en trminos de X1 y X2, las
magnitudes relativas calculadas de las ponderaciones son 0.707
y 0.707, valores equilibrados, que estn en oposicin directa a
aquellas ponderaciones 0.04 y 0.99 obtenidas de la componente
principal calculada por la matriz de covarianzas .

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

60

El ejemplo precedente demuestra que los componentes


derivados de la matriz de covarianzas son diferentes a los
derivados de la matriz de correlaciones .
Ademas, se puede establecer que los componentes principales no
es una funcin simple de otra. Es decir, efecutar el proceso de
estandarizacin tiene consecuencias en el clculo y conclusiones.
Las variables deberan estar estandarizadas si ellas estn
medidas en escalas con amplios rangos de diferencia o unidades
de medida que no son fcilmente comparables.
Por ejemplo, Si X1 representa ventas anuales en un rango de
$10.000 y $350.000 y X2 es la razn de rentabilidad sobre el
activo (ingreso brutos/total de activos) que se encuentra en un
rango de 1.0% y 6.0%.
Si se calcula utilizando la matriz de covarianzas, , la variacin
total ser exclusivamente correspondiente a las ventas anuales.
En este caso se debe esperar una sola primera componente muy
importante (recoge la mayor cantidad de varianza explicada)
con una alta ponderacin para X1.
Alternativamente, si ambas variables estn estandarizadas, sus
magnitudes pueden ser del mismo orden, y X2 o (Z2) juega un rol
importante en la construccin de los componentes principales.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

61

1.8. COMPONENTES PRINCIPALES PARA MATRICES DE


COVARIANZAS CON ESTRUCTURAS ESPECIALES
Existen ciertos patrones sobre la matriz de covarianzas o
correlaciones donde los componentes principales pueden ser
expresados en formas simples.
Suponga la matriz diagonal de covarianzas, , es decir:

Si se tiene un vector propio de la forma ti =[0,0,.,1,.,0,0] con


un uno (1) en la posicin i-esima se observa que:

O visto de otra manera ei=iiei. Se puede concluir de lo anterior


que (ii,ei) es el par valor propio vector propio.
Puesto que la combinacin lineal ti X=Xi, por tanto, se establece
que el conjunto de componentes principales corresponde al total
de variables original aleatorias no correlacionadas.
Con una matriz diagonal de covarianzas, , no se gana nada
extrayendo componentes principales.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

62

Desde otro punto de vista, si X esta distribuido Np(,), el


contorno de la densidad constante son elipsiodes donde los ejes
cartesianos se encuentran en la direccin de la maxima varianza.
Consecuentemente no es necesario rotar las coordenadas del
sistema.
Si se desea efecuar estandarizacin de las variables, este
procediento substancialmente no altera la situacin para una
matriz diagonal de covarianzas, . En este caso se llega a que la
matriz de correlaciones, , es iguala a la matriz identidad de
orden pxp, o mejor =I.
De este modo, si ei=1ei, el valor propio de uno (1) que
pertenence al vector de valores propios e es multiplicado por el
correspondiente coeficiente de correlacion , asi las cosas,
ti =[0,0,..,1,..,0,0] con i=1,2,,p son elecciones convenientes
para los valores propios. Consecuentemente, las componentes de
la matriz de correlaciones son tambin las variables originales
Z1,Zp.
Otro patrn de matriz de varianzas y covarianzas, , el cual
describe algn tipo de correlacin entre variables, tiene la
siguiente forma general:

La matriz de correlaciones, , resultante es:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

63

Es tambin la matriz de covarianzas de variables estandarizadas.


La matriz de correlaciones anterior implica que las variables
X1,X2,.,Xp estan igualmente correlacionadas. Para este caso, los
p valores propios de la matriz de correlaciones correspondiente
pueden ser divididos en dos grupos.
Cuando el coeficiente de correlacion es positivo, el ms grande
es:
1=1+(p-1)
Con vectores propios asociados:
Los restantes (p-1) valores propios son:
2= 3=.=p=1-
Los restantes vectores propios son:

La primera componente principal sobre variables estandarizadas


corresponde a:
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

64

Es proporcional a la suma de p variables estandarizadas y puede


ser juzgada como un ndice con igual ponderacin.
Esta componente principal explica una proporcin del total de la
varianza de la poblacin como:
Si 1/p= para la correlacion cercana a uno (1) o p muy grande.
Por ejemplo, si la correlacion es =0.8 y el numero de variables
p=5, la primera componente explica el 84% del la varianza total.
Cuando la correlacin es cercana a uno, =0.8, las ultimas p-1
componentes colectivamente contribuyen muy poco a la
varianza total y muchas veces pueden ser ignoradas.
En este caso especial, retener nicamente al primera
componente principal Y1=(1/p)[1,1,.,1]X, una medida de
tamao total, explica la misma proporcin de la varianza de la
forma:

Si las variables estn estandarizadas Z1,Z2,,Zp tienen una


distribucin normal multivariante con matriz de covarianzas
dada por:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

65

Las elipsoides de densidad son constantes, con el eje principal


proporcional
a
la
primera
componente
principal
Y1=(1/p)[1,1,.,1]Z,. Esta componente principal es la
proyeccin de Z sobre el plano 1t =[1,1,.,1] .
El eje secundario (y restantes componentes principales) ocurren
de forma simtrica y esfrica en direccin perpendicular al eje
principal (y la primera componente principal).
1.9. COMPONENTES PRINCIPALES A PARTIR DE UNA MUESTRA
La matriz de covarianzas, , por ser desconocida, no puede ser
usualmente utilizada directamente en los clculos. En la prctica,
se usa la matriz de covarianzas estimada, S, a partir de una
muestra observada de n individuos.
Esta matriz constituye una estimacin de , por tanto, los
resultados obtenidos con ella constituyen estimaciones de los
valores poblacionales. Sin embargo, es necesaria una muestra
aleatoria cuyo tamao n sea mayor que el nmero p de variables
consideradas.
El hecho de usar la matriz de covarianzas muestrales, S, en vez
de la matriz de covarianzas poblacionales, , puede
eventualmente acarrear complicaciones de tipo computacional.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

66

Suponga x1,x2,,xn representan n variables independientes de


alguna poblacin p-dimensional con vector de media y matriz
de covarianzas, . Estos datos arrojan una media muestral, , la
matriz de covarianza muestral S y la matriz de correlaciones
muestrales R.
El objetivo es construir combinaciones lineales no
correlacionadas entre si de las medidas caractersticas que
cuentan en mayor medida con la variacin en la muestra.
La combinacin no correlacionada de variables que explican la
varianza sern llamadas componentes principales muestrales. La
combinacin se encuentra descrita como:
x=a11,xj1+a12xj2++a1pxjp para j=1,2,.,n
Tiene una media muestral at1 y varianza muestral at1 a1 .
Tambien, los pares (at1 , at2 ), para dos combinaciones lineales
tienen la covarianza muestral at1 a2 .
Los componentes principales muestrales estn definidos como
aquellas combinaciones lineales las cuales tienen mxima
varianza muestral.
Como para las cantidades poblacionales, se tiene que reescribir
los coeficientes de los vectores para satisfacer =1.
Especificamente:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

67

Primera componente = Combinacion lineal at1 xj que


principal muestral
maximiza la varianza muestral de
at1 xj sujeto a =1.
Segunda componente = Combinacion lineal at2 xj que
principal muestral
maximiza la varianza muestral de
at2 xj sujeto a =1 y la covarianza
muestral
de
los
pares
COV(at1 xj, at2 xj)=0.
::::::
::::::
::::::
::::::
i-esima componente = Combinacion
lineal
ati xj
que
principal muestral
maximiza la varianza muestral de
ati xj sujeto a =1 y la covarianza
muestral de todos los pares
COV(ati xk, ati xj)=0 k.
La primera componente principal plantea el siguiente problema
de maximizacin:
MAXIMIZAR at at1 a1

S.A.
=1
La varianza corresponde al mximo valor propio, 1, tal como se
demostr para los resultados poblacionales. Lograda por la
eleccin del vector propio 1 de la matriz de covarianzas
muestrales S.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

68

La eleccion sucesiva de maximizar las ponderaciones ai sujeto la


funcin objetivo ati ek =ati 1 ek =0, o mejor perpendicular al
vector propio .De este modo, se tiene el siguiente teorema.
Teorema 5. Si S={sik} es una matriz de covarianza muestral de
orden pxp con pares de valores y vectores propios
(1 e1 ),( 2 e2 ),.,( p ep ), la i-esima componente principal esta
dada por:
yi = eti = ei1 x1+ ei2 x1+.+eip xp
Donde 1 2 .p 0 y x es cualquier observacin de las
variables X1, X2,.,Xp.
Tambien, se puede observar que:
Varianza muestral (yk )= k para k=1,2,..,p
Covarianza poblacional (yi , yk )=0 ik
Adicionalmente:
p
Varianza total muestral =i=1 Sii = 1 +2 +.+p
El coeficiente de correlacin entre la componente i-esima y la
variable k-esima se calcula como:
ryi ,xk =

eik i
skk

Existe una notacin diferenciada entre la visin poblacional y


muestral. Se denotan los componentes principales muestrales

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

69

como y1 , y2 ,.,yp independiente si son obtenidas por la matriz


de covarianzas muestrales S o de correlaciones muestrales R.
El proceso de extraccin de los componentes construidos de la
matriz de covarianzas muestrales, S, o de la matriz de
correlaciones muestrales, R, no son los mismos, en general y
como se demostr para el caso poblacional, pero debe ser claro
del contexto la cual esta siendo utilizado, y la notacin yi se
mantiene.
Tambin es conveniente nombrar de manera adecuada los
vectores de coeficientes muestrales y el vector propio i y la
varianza de los valores propios i para ambas situaciones.
Los componentes principales muestrales pueden ser obtenidos
=S como estimaciones por mxima verosimilitud de valores
de
poblacionales de la matriz de covarianzas , si Xj esta
normalmente distribuido.
En este caso los valores propios de son distintos y en estos
casos los componentes principales muestrales como
estimaciones mximo verosmiles de sus correspondientes
contrapartes poblacionales.
tiene valores propios [(nLa matriz de covarianzas muestrales
1)/n] i y sus correspondientes vectores propios, i , donde
(i , i ) son los pares de valores propios y vectores propios
para la matriz de covarianza muestrales S.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

70

De este modo, tanto la matriz de covarianzas muestrales S y la

matriz de covarianzas estimada por mxima verosimilitud


tienen la misma primera componente principal ti x y la misma
1 +2 + p ).
proporcin de la varianza explicada 1 /(
arrojan la misma matriz de
Finalmente, ambas S y
correlaciones R asintoticamente, si las variables son
es irrelavante.
estandarizadas la eleccin entre S o
Las observaciones xj son muchas veces centradas sustrayendo la
media muestral, x. Esto no afecta la matriz de covarianzas
muestrales y arroja la i-esima componente principal.
yi = ( ) i=1,2,.,p
Los componentes principales muestrales tambin puede ser
=S, la estimacin por mxima verosimilitud de la
obtenida de
matriz de covarianzas, , si Xj esta normalente distribuida.
Ejemplo 3. En el clculo de un score de crdito se proporciona
informacin sobre 5 variables sociodemogrficas en el rea de
Bogot y sus alrededores. Los datos corresponden a 6100
potenciales clientes.
Los datos de la muestra seleccionada tienen las siguientes
estadsticas:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

t
Variable
Medida

71

X1

X2

X3

X4

X5

4.47
Total
poblacional
Cientos

3.96
Grado
profesional
(porcentaje)

71.42
Edad por
empleado
(porcentaje)

26.91
Empleado del
gobierno
(porcentaje)

1.64
Valor medio
de vivienda
Cientos

La matriz de covarianzas muestrales de la forma:

Se puede resumir la informacin anterior en uno o dos


componentes principales?
La operatividad de STATA parte de una matriz creada en Excel la
importa a STATA, posteriomente los datos son convertidos en
una matriz a travs del comando
mkmat var1 var2 var3 var4 var5, matrix(ejercicio)
rowprefix(Matriz)
Donde genera una matriz llamada ejercicio. Posteriomente,
ejecuta en anlisis de componentes principales utilizando la
sentencia
pcamat ejercicio, n(0) names(x1 x2 x3 x4 x5).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

72

Tabla 2

La primera componente explica el 67.7% de la varianza


muestral. Las primeras dos componentes, colectivamente
explican el 92.8% del total de la varianza.
Consecuentemente, la variacion muestral es resumida muy bien
por las dos componentes principales sin mayor prdida de
informacin.
La primera componente aparece esencialmente como una
diferencia ponderada para esta base de variables
sociodemogrficas entre el porcentaje del empleo del gobierno
(x4) y edad por empleado (x3). La segunda componente aparece
como una suma ponderada de las dos.
Las componentes poblacionales, los coeficientes tik y las
correlaciones ry x deben ser examinados en cada uno de los
i

componentes principales
interpretacin.

|Facultad de Economa |Carlos Mendoza Astroz|

para

efectuar

una

adecuada

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

73

Cada componente de los vectores propios ei=[e1i, e2i, epi] debe


ser analizada en la medida que corresponden a la magnitud de la
componentes del vector propio i-esimo, eki, que mide la
importancia de la k-esima variable en la i-esima componente
principal sin relacionar las dems variables.
En particular, eki es proporcional al coeficiente de correlacin
entre yi y xk. Este anlisis debe hacerse obligatoriamente con la
primera componente, es decir, ek1 que mide la importancia de la
k-esima variable en primera componente principal, adems
especifica eki el coeficiente de correlacin entre yi y x1.
1.10 IDENTIFICACIN DE LOS COMPONENTES PRINCIPALES
Cuntos factores son suficientes para una buena representacin
de un problema? Tal vez los dos ms extendidos son:
a. El criterio de Kaiser, segn el cual se deben retener tantos
factores como valores propios de la matriz de covarianzas
estn por encima del promedio de varianza total sobre
componentes existentes (VT/P).
b. Otro criterio, quizs ms natural y lgico, consiste en
retener tantos factores como sean necesarios para lograr un
alto porcentaje de explicacin de la varianza total. Para ello
se usan los porcentajes acumulados de los valores propios
con base en la varianza total del problema, junto con un
criterio personal acerca de qu se considera un buen
porcentaje de explicacin.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

74

Habitualmente, se conservan slo aquellos componentes que


recogen la mayor parte de la variabilidad, hecho que permite
representar los datos en dos o tres dimensiones si se conservan
dos o tres ejes principales, pudindose identificar entonces
grupos naturales entre las observaciones.
Si la varianza poblacional se encuentra concentrada en un 80%
en las dos o tres componentes es posible trabajar con estas
variables sin mayor perdida de informacin.
La herramienta grafica de verificacin utiliza el grfico de
sedimentacin (scree plot) para determinar el peso de los
componentes principales dentro de la varianza explicada.
Grafico. Scree plot
valor

Valor propio

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

75

1.11. PRUEBAS ESTADSTICAS


PRUEBA DE ESFECICIDAD DE BARLETT
Antes de aplicar el anlisis de componentes principales debe
comprobarse si es necesario, es decir, si la correlacin entre las
variables analizadas es lo suficientemente grande como para
justificar la factorizacin de la matriz de coeficientes de
correlacin.
Esta comprobacin puede hacerse mediante la prueba de
Bartlett (1950), que parte de la hiptesis nula que la matriz de
coeficientes de correlacin muestral, R, no es significativamente
distinta de la matriz identidad.
Ho: R=I
H1: RI
Bartlett calcula un estadstico basado en el valor del
determinante de la matriz de coeficientes de correlacin, R, del
siguiente modo:
Donde k es el rango de la matriz que corresponde al nmero de
variables, n es el tamao de la muestra y |R| es el determinante
de la matriz de correlaciones donde el estadstico de contraste es
una distribuida 2.
El test de Bartlett tiene un gran inconveniente. Tiende a ser
estadsticamente significativo cuando el tamao muestral n crece
(n) o asintticamente significativo. Algunos autores advierten
que nicamente se utilice cuando la razn n=k sea menor que 5.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

76

PRUEBA KMO
Definicion. Coeficiente de correlacion parcial. Permite conocer el
valor de la correlacin entre dos variables A y B, si la variable C
permance constante para la serie de observaciones
consideradas.
El ndice de Kaiser-Meyer-Olkin o medida de adecuacin
muestral KMO tiene el mismo objetivo que la prueba de Bartlett,
trata de saber si es posible factorizar las variables originales de
forma eficiente.
El punto de partida, al igual que con al prueba de esfericidad de
Barlett, es la matriz de correlaciones muestrales, R, entre las
variables observadas. Las variables pueden estar relativamente
correlacionadas, pero la correlacin entre dos de ellas puede
estar influenciada por las otras.
El ndice KMO compara los valores de las correlaciones lineales
simples y parciales. Al comparar la magnitud de los coeficientes
de correlacin simple y parcial determina el impacto entre
variables.
El estadstico KMO vara entre 0 y 1. Si el ndice KMO est
prximo a 1, el ACP tiene sentido. Si el ndice es bajo (prximo a
0), el ACP no ser irrelevante. El estadstico tiene la siguiente
forma:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

77

Donde rij es el coeficiente de correlacin lineal simple entre las


variables i-esima y j-esima y sij es el coeficiente de correlacin
parcial entre las variables i-esima y j-esima. Existen dos
escenarios:
a. Si el coeficiente de correlacin parcial es cercano a cero,
sij0, muestra que no existe relacin entre las variables
i-esima y j-esima de forma directa. Sin embargo, si existe un
factor comn a explicar entre todas las variables visto en la
correlacion lineal simple. Su resultado es el estadistico de
ajuste igual a uno, KMO1.
b. Si el coeficiente de correlacin parcial es cercano a uno,
sij1, indica que las variables NO estn midiendo un factor
comn, nicamente la relacin directa entr las variables
i-esima y j-esima, por tanto, el estadistico de ajuste es igual
a cero, KMO0.
Algunos autores han definido una escala para interpretar el
ndice KMO de un conjunto de datos.
KMO

CRITERIO

0.00 to 0.49

inaceptable

0.50 to 0.59

Bajo

0.60 to 0.69

Mediocre

0.70 to 0.79

Medio

0.80 to 0.89

Meritorio

0.90 to 1.00

Excelente

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

78

1.12. CONCLUSIONES
Los resultados encontrados por el mtodo de anlisis de
componentes principales pueden resumirse en las siguientes
conclusiones:
1. La varianza total es igual a la suma de los valores propios de
. Es decir, la varianza total es la misma con las variables
originales que con las variables transformadas, Fi.
2. Las componentes principales son variables aleatorias no
correlacionadas
entre
s
obtenidas
mediante
transformaciones lineales ortogonales de las variables
originales centradas. Esto es: Fj=ajX=aj1X1+ aj2X2+.+ aj2X2
para j=1,2,.p
3. Si todas las variables originales Xi son normalmente
distribuidas entonces todas las componentes principales
son normales.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

79

MODELOS DE DATOS PANEL LINEALES

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

80

I. INTRODUCCIN
En el anlisis de informacin (financiera, econmica,
empresarial, comercial, etc.) pueden existir diferentes
dimensiones sobre las cuales se podra estar interesado en la
estimacin de modelos que traten de extraer relaciones de
causalidad o comportamiento.
Una de estas dimensiones la constituye el anlisis de series de
tiempo, la cual incorpora informacin de variables individuales
durante un perodo determinado (ventana temporal).
Por otra parte, existe otra dimensin, independiente a la
anterior, que no incorpora el aspecto temporal sino que
representa el anlisis de informacin para unidades individuales
de estudio en un momento determinado del tiempo (dimensin
estructural). En este tipo de anlisis, o corte transversal, cada
elemento no lo constituye el tiempo sino las unidades de anlisis.
Desde un punto de vista de corte transversal o dimensin
estructural, se podra, por ejemplo, modelar de forma estructural
los ingresos de las firmas del sector asegurador (I).
Un anlisis de regresin basado en datos de corte transversal
para un ao en particular podra incluir una serie de variables
explicativas tales como calidad de la gestin de la administracin
(G), monto monetario del capital liquido (K), costos asociados a
mano de obra en nmero de horas (L), nivel de apalancamiento
financiero (A) y un trmino de error estocstico (uit). Con la

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

81

informacin incluida, el modelo de corte transversal se podra


expresar como2:
I=0+ 1G+2K+3L+4A+uit
Sin embargo, este modelo no podra identificar, o tomar en
cuenta, como la variable explicativa del ingreso (I) puede
identificar cualquier incremento en la productividad que pueda
ocurrir en el transcurso del tiempo como consecuencia de
mejoras tecnolgicas, aprendizaje o procesos que hayan sido
incorporados.
De otro lado, desde una dimensin temporal o una visin de
series de tiempo, o modelo ARIMA, para este mismo ejemplo, se
podra determinar una estructura dinmica del comportamiento
de los ingresos (It) sobre una ventana temporal que depende del
comportamiento anterior de la variable k periodos atrs, as
como de los errores o innovaciones pasadas (uit). La estructura
del modelo es la siguiente:
It=1It-1+2It-2+.+ kIt-k+1uit-1+ 2uit-2.+ kuit-k
Este modelo no tendra en cuenta la relacin con otras variables
que pueden determinar su comportamiento, es decir, excluye del
anlisis la gestin de la administracin (G), monto monetario del
capital liquido (K), costos asociados a mano de obra en nmero

Si se deseara utilizar variables rezagadas sobre una variable endgena, por ejemplo, considere el siguiente modelo de rezagos distribuidos de
Almon:
2

Donde xt es una variable exgena y ut es un trmino de perturbacin estocstica. En general, las variables rezagadas xt y xt-1 son cercanas.
Adicionalmente, si se desea observar el cambio de la variable x en el tiempo entonces se tiene que x t-1+xt-1= xt-1+(xt-1- xt-2)=2xt-1-xt-2. Esta
estructura expone un alto componente de colinealidad entre variables. En general, no existe suficiente informacin para efectuar una estimacin
precisa sin supuestos a priori.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

82

de horas (L), nivel apalancamiento financiero (A) como variables


de estudio.
Ambos tipos de anlisis de informacin independientemente
permiten extraer conclusiones, sin embargo, los modelos de
corte transversal (anlisis de regresin) y series de tiempo
(serie temporal) tienen ciertas limitaciones inherentes a su
estructura.
Para el primero, no arrojan luces sobre dependencia
intertemporal de eventos, tampoco resuelven satisfactoriamente
problemas fundamentales acerca de los orgenes de la
persistencia en el comportamiento, es decir, del verdadero
estado de dependencia entre variables o individuos o si su causa
es de origen espurio, siendo una metodologa que no permite
controlar comportamientos heterogneos de la poblacin.
Para el segundo, su metodologa no asume una forma
estructural, nicamente temporal, su principal utilidad radica en
la potencia frente de pronstico de corto plazo.
Un modelo de datos panel incluye una muestra repetida de
entidades (individuos, empresas, bancos, ciudades, pases, etc)
para un perodo determinado de tiempo, esto es, combina ambos
tipos de datos (dimensin temporal y estructural).
Las estructuras panel son mas informativas que una serie de
tiempo agregada, en la medida narra una historia individual. Por
ejemplo, una serie de tiempo analiza el comportamiento
histrico de la tasa de desempleo del 10% al ao. Sin embargo, es
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

83

menos informativa que un panel de individuos, en la medida que


con una tasa del 10% desempleado puede ser que exista del total
de la poblacin un total del 10% desempleado aleatoreamente
distribuido o que siempre exista el mismo tipo de personas que
corresponde al 10% de la poblacin desempleada. Las polticas
son distintas.
Para obtener, por ejemplo, un panel sobre desempleo se cuenta
con variables exgenas como salarios, sector, horas trabajadas,
etc. Se selecciona aleatoriamente a un conjunto de individuos de
la poblacin en un momento del tiempo y se recoge esa
informacin.
En otro momento (prximo mes, trimestre, ao) se debe realizar
la misma entrevista a los mismos individuos. Este es el tpico
procedimiento para construir bases de datos panel, por ejemplo,
encuestas de hogares que permiten obtener informacin de
inters para el mismo grupo de individuos en diferentes
periodos.
Una definicin, un poco ms formal, de datos panel, o datos
longitudinales (longitudinal data), representa medidas repetidas
en diferentes puntos del tiempo sobre la misma unidad individual,
como por ejemplo, personas, firmas, estados, pases.
Con esta informacin se cuenta con un gran potencial en resolver
problemas ms all del corte transversal o series temporales que
no puede manejarse de manera satisfactoriamente
indivudualmente.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

84

Las regresiones panel pueden capturar variaciones sobre


unidades desde dos puntos de vista distintos, el primero, similar
a la regresin de corte transversal, el segundo, variacin sobre el
tiempo o estructuras dinmicas.
La diferencia entre corte transversal y datos de panel radica en
que en el segundo sigue a las mismas unidades registradas en el
primero (individuos, familias, etc.), en distintos periodos de
tiempo. Un panel entonces requiere observar al mismo conjunto
de unidades en al menos dos momentos del tiempo diferentes.
ESTRUCTURA DE DATOS PANEL
E Y
y1
y2
E1 y3
:
yn
y1
y2
E2 y3
:
yn
:
y1
y2
Ek y3
:
yn

X
x1
x2
x3
:
xn
x1
x2
x3
:
xn
:
x1
x2
x3
:
xn

t-1

t-2

T
t-3

t-n

Por ejemplo, pueden construirse paneles de hogares, firmas o


pases. Un ejemplo tradicional radica en las encuestas sobre
hogares (en Colombia la Encuesta Nacional de Hogares -ENH).
Suponga que se comienza en el ao 1968 con 4802 familias,
incluyendo hogares pobres. Se efectan entrevistas anuales
donde se observan conductas y caractersticas socioeconmicas
de cada familia y de aproximadamente 31.000 individuos

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

85

quienes han sido registrados sobre la encuesta o derivados de las


familias encuestadas.
La lista de variables almacenada supera las 5.000. El objetivo es
tener cinco (5) segmentos distintos de la fuerza de trabajo. La
muestra original incluye 5.000 adultos 5.225 hombres jvenes,
5.083 mujeres adultas, 5.159 mujeres jvenes y 12.686 nios. Se
analizan por negros, indgenas, desplazados, militares y menores
de 18 aos.
Combinando estos datos proporciona una rica y valiosa fuente
de variacin la cual permite estimaciones ms eficientes de los
parmetros.
Adicionalmente, ms informacin muestral, implica estimaciones
ms confiables y pruebas ms sofisticadas de modelos de
comportamiento. Con menos supuestos restrictivos.
Otra ventaja, de las bases de datos panel es su habilidad para
controlar la heterogeneidad individual. No controlar estos
efectos individuales no observados especficos conduce a sesgo e
inconsistencia en los resultados estimados.
Las bases de datos panel son tambin mejores para identificar y
estimar efectos que no son detectables en series de tiempo o
cortes trasversales puros. En particular, los conjuntos de paneles
de datos permiten de mejor manera estudiar problemas
complejos de comportamiento dinmico.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

86

Por ejemplo, un modelo de corte transversal puede estimar la


tasa de desempleo en un punto en particular en el tiempo. Cortes
transversales repetidos en el tiempo pueden demostrar cmo
esta proporcin cambia sobre el tiempo.
nicamente bases de datos panel pueden estimar que
proporcin de aquellos que estn desempleados en un periodo
permanezcan desempleados en otro periodo y determinar sus
causas.
El principal objetivo de aplicar y estudiar datos panel, es capturar
la heterogeneidad no observable, ya sea entre individuos o
entidades, as como tambin en el tiempo, dado que esta
heterogeneidad no se puede detectar ni con estudios de series
temporales ni con estructuras de corte transversal.
En trminos ms formales. Suponga una estructura bsica del
modelo de regresin de la forma:
yit=Xit+Zi+uit
Los K regresores de Xit no incluyen el termino constante. La
heterogeneidad o efecto individual es Zi donde Zi contiene un
termino constante y un conjunto de variables especificas
individuales las cuales pueden ser observadas (sexo, raza,
religin) o no observadas (habilidades, preferencias, etc).
Esta tcnica permite realizar un anlisis dinmico, al incorporar
la dimensin temporal de los datos estructurales, lo que
enriquece el estudio, particularmente en perodos de grandes
cambios.
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

87

La principal ventaja de los paneles de datos es el incremento de


la precisin en el proceso de estimacin. Este es el resultado de
aumentos en el nmero de observaciones al combinar o agregar
diferentes periodos de tiempo para cada individuo vistos desde
una regresin de corte transversal.
La aplicacin de esta metodologa permite analizar dos aspectos
de suma importancia y forman parte de la heterogeneidad no
observable.
1. Los efectos individuales especficos. Son aquellos que afectan
de manera desigual a cada uno de los individuos de estudio
contenidos en la muestra (consumidores, empresas, bancos,
etc), los cuales son invariantes en el tiempo e impactan de
manera directa las decisiones que tomen las unidades
individualmente. Usualmente se identifica este tipo de
efectos asociados a sexo, raza, capacidad empresarial,
eficiencia operativa, capitalizacin de la experiencia, acceso
a la tecnologa, productividad, management, etc.
2.

Efectos temporales. Son aquellos que impactan por igual a


todas las unidades individuales pero que varan en el
tiempo. Este tipo de efectos pueden asociarse, por ejemplo,
a impactos regulatorios, innovaciones tecnolgicas o en
variables macroeconmicas, cambios en tasas de inters o
aranceles que pueden afectar por igual a todas las empresas
o entidades que tienen una evolucin o trayectoria
dinmica.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

88

II.

ESPECIFICACIN GENERAL DE UN MODELO DE DATOS DE


PANEL
La especificacin de un modelo de datos panel parte de las
siguientes caractersticas:
yit = it + Xit + uit con i = 1,......,N y t = 1,...,T.
Donde el subndice i se refiere al individuo o a la entidad de
estudio (corte transversal), t a la dimensin en el tiempo (serie
temporal).
El parametro, es un vector de interceptos correspondiente al
total de individuos (i) con variacin en el tiempo (t), es decir,
existen NxT parmetros, Xkit es la i-sima observacin al
momento t-esimo para la K-esima variable explicativa x que
pertenece al vector de variables explicativas X, es un vector de
tamao Kx1 con K parmetros correspondiente a cada una de las
variables explicativas, por ultimo, yit es la i-sima observacin al
momento t-esimo para la variable respuesta o dependiente y.
La muestra total de las observaciones en el modelo vendra dado
por el nmero de individuos multiplicado por el nmero de
periodos de anlisis (NxT)3.
Por otra parte, es usual interpretar modelos de datos panel a
travs de sus componentes en el trmino de error. Al trmino de
error de la ecuacin anterior, uit, se le suele llamar error
compuesto dado que tiene un componente fijo no observado
entre individuos y otro que cambia en el tiempo.
A partir de este modelo general, y con base en ciertos supuestos y restricciones acerca del valor de algunos de los parmetros, se pueden derivar
otras variantes de modelos datos panel.
3

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

89

Es decir, el trmino uit incluido en la ecuacin de regresin panel,


puede descomponerse de la siguiente manera:

uit = i + t + it
El primer trmino, conocido como heterogeneidad no observada
de la muestra, i, representa efectos no observables que difieren
entre individuos o entidades de estudio pero no en el tiempo.
Corresponde a un efecto por individuo invariante periodo a
periodo, y corresponde a un vector conformado por las variables
constantes en el tiempo capturadas por el trmino de error. Por
ejemplo, la variable sexo es un componente de heterogeneidad
individual que puede ser no observada en un anlisis.
El segundo trmino, t, se le identifica con efectos no observables
que varan en el tiempo pero no entre las unidades de estudio.
Por ejemplo, cambios regulatorios que afectan a todos los
individuos desde su periodo de expedicin.
Por ltimo, it se refiere al trmino de error puramente aleatorio
que tiene componentes por individuo y tiempo. Tiene las
caracteresiticas similares al componente del error de corte
transversal.
La mayora de las aplicaciones con datos panel modelan el
componente de error, uit, para efectos no observables entre
individuos que no varan en el tiempo (i0), pero no efectos de

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

90

cambio en el tiempo (t=0), este modelo conocido como de un


factor o one way.
Las diferentes variantes para el modelo one way de componentes
de errores surgen de distintos supuestos que se hacen acerca de
efectos no observables que difieren entre las unidades de
estudio (i). Pueden presentarse tres (3) posibilidades:
1. Considera a i=0, es decir, no existe heterogeneidad no
observable entre los individuos, entidades o firmas. Dado lo
anterior, el trmino de error, uit, satisface todos los
supuestos del modelo lineal general, por lo cual, el mtodo
de estimacin de mnimos cuadrados (OLS) produce los
mejores estimadores lineales insesgados (BLUE).
2. Considera a i0, es decir, existe heterogeneidad no
observable entre individuos, entidades o firmas. Considera a
i con un efecto fijo sobre los regresores y distinto para cada
firma. En este caso, la heterogeneidad no observable se
incorpora a la constante del modelo.
3. Considera a i0, es decir, existe heterogeneidad no
observable entre los individuos, entidades o firmas.
Considera a i como una variable aleatoria no observable
que vara entre individuos pero no en el tiempo.
En los casos dos y tres se utilizaran metodologas especiales de
estimacin para datos panel que sern expuestas ms adelante.
Existe, adems de la estructura de un factor o one way, el modelo
de dos factores o two-way en el cual el componente de error
ademas de la estructura de modelamiento individual no
observado (i0) incorpora el efecto no observable que varan
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

91

en el tiempo pero no entre las unidades de estudio es distinto de


cero (t0).
El modelo de dos factores o two way pretende capturar efectos
temporales especficos (innovaciones) sumndolos a la medicin
de efectos no observables que difieren entre las entidades de
estudio pero no en el tiempo que no estn incluidos en la
regresin (t0 y i0), Balgati (2001).
ESTRUCTURA DATA PANEL SEGN TRMINO DE ERROR
Mtodo de estimacin

Efecto no observado
OVERVIEW DE METODOS DE PANELES DE DATOS
Distintas caracteristicas en la construccin de modelos de datos
panel se pueden configurar segn la disponibilidad de las
observaciones individuales, asi como de sus intervalos de tiempo
y estructura de los errores o innovaciones. Por ejemplo, se
pueden observar los siguientes casos:
1.

Modelo A. Las pendientes de los coeficientes, , y el


intercepto, son constantes en el tiempo (t) e iguales para
todos los individuos (i), conocido como modelo restringido:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

92

2.

Modelo B. Las pendientes de los coeficientes, , son


constantes en el tiempo (t) y los individuos (i). El
intercepto, , varia sobre los individuos (i):

3.

Modelo C. Las pendientes de los coeficientes, , son


constantes para los individuos (i) y el tiempo (t). El
intercepto, , varia sobre los individuos (i) y el tiempo (t):

4.

Modelo D. Las pendientes de los coeficientes, , varan sobre


los individuos (i) pero no sobre el tiempo. El intercepto, ,
varia sobre los individuos (i).

5.

Modelo E. Las pendientes de los coeficientes, , varan sobre


el tiempo (t) e individuos (i). El intercepto, , varia sobre el
tiempo (t) y individuos (i). Se conoce como modelo no
restringido:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

93

Existen dos procedimientos para estimar el modelo en un


sistema de datos panel. Cada uno de ellos parte del supuesto de
endogeneidad, es decir, la dependencia entre trminos de error y
regresores (E[XU]=0).
El primero, asume algn tipo de correlacin entre regresores y
trminos de error (endogeneidad) e implica el reconocimiento
que variables omitidas pueden generar cambios en los
interceptos ya sea a travs del tiempo o entre unidades de corte
transversal. En este caso, el modelo es conocido como efectos fijos
(Fixed Effects o FE).
El otro modelo es efectos aleatorios, asume independencia entre
regresores y trminos de error al tratar de capturar estas
diferencias a travs del componente aleatorio (Random effects o
RE) por medio de la estructura de covarianzas.
La seleccin de Efectos Fijos (FE) o Efectos aleatorios (RE) tiene
un impacto significativo en las metodologias de estimacin y
consistencia de los estimadores.
Adems, la variabilidad del intercepto, , y las pendientes de los
parametros, , sobre los individuos (i) y el tiempo (t) tiene
impacto en la estructura de covarianzas, y por tanto, impacto en
los intervalos de confianza y pruebas de hiptesis.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

94

Una revisin de los modelos para datos paneles lineales no


dinmicos, y recopilar los puntos anteriores, se puede encontrar
en el siguiente grfico:
MODELOS DE DATOS PANEL O CORTE LONGITUDINAL

La primera especificacin (A) se refiere al caso en que no existe


heterogeneidad no observable en la estructura de datos de panel,
i=0, por tanto, se emplea el mtodo de Mnimos Cuadrados
Ordinarios (OLS) con la ventaja de ganar grados de libertad.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

95

En los casos en que se rechaza la hiptesis de homogeneidad


entre individuos en un sistema de datos de panel, i0, es decir,
existe heterogeneidad no observable ya sea a travs del tiempo,
entre unidades de estudio (individuos) o en ambos sentidos,
debe buscarse una especificacin que la capture en forma
apropiada con el fin de evitar el problema de sesgo e
inconsistencia sobre los estimadores de los parmetros de las
variables explicativas, Xit, que se cometera si se emplea la
especificacin A, o modelo restringido, cuando existe un efecto
no observado (sesgo por variables omitidas).
Una forma simple, y de hecho la ms utilizada, es incorporar esta
heterogeneidad no observada empleando los modelos de
intercepto variable, identificados en las especificaciones con
intercerto variable entre los individuos (modelo B) o con el
intercepto variable en el tiempo y los individuos (modelo C).
Estos modelos son ampliamente utilizados cuando se analizan
datos panel lineales debido a que son estimables, a diferencia de
los modelos D y E, proporcionan alternativas simples y generales
sobre el supuesto de los parmetros y toman valores comunes
para todos los individuos (i) en el tiempo.
Los modelos B y C, donde varia el intercepto, parte de un modelo
lineal para todos individuos (i) y tiempo (t). A partir del modelo
general se pueden representar los modelos B y C mediante las
siguientes ecuaciones:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

96

Modelo B
Modelo C
El primer paso despus de comprender los modelos panel de
trabajo radica en identificar las variables explicativas
observadas (Xk) en la base de datos panel de tres formas
posibles:
1. Una variable que cambia en el tiempo y por individuo (Zit). Se
trata de variables que cambian entre individuos en un
momento del tiempo, y que adems cambian a lo largo del
tiempo. Como ejemplo se pueden mencionar ingresos
totales, nivel de beneficios, nivel de capital, razones
financieras, entre otras.
2. Una variable por cada individuo, sin cambios en el tiempo
(Zit=Zi). Este es el caso de variables que son las mismas para
cada unidad de corte transversal a travs del tiempo.
Ejemplos de ellas se tienen caractersticas como sexo,
religin y otras caractersticas sociodemogrficas.
3. Una variable por periodo pero no cambia entre individuos
(Zit=Zt). Son las mismas variables para todos los individuos
en un momento del tiempo pero varan a lo largo del
periodo de estudio. Como ejemplo, cambios en la actividad
regulatoria, nivel de precios, tasas de inters, etc.
En conclusin, en una base de datos panel pueden existir
distintos tipos de variables que son capaces de representar
diferentes efectos.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

97

Se pueden tener variables invariantes en el tiempo (xit=xi), que


no varan con los individuos (xit=xt) o que varan tanto con el
tiempo como con los individuos (xit) que tienen un impacto
directo y significativo en los procesos de estimacin por paneles
de datos.
REGRESINES AGRUPADAS, EFECTOS FIJOS Y ALEATORIOS
Ya definidos los modelos de trabajo B y C en las especificaciones
panel e identificadas las variables disponibles es necesario
revisar la estructura de composicin del trmino de error con el
objetivo de implementar estrategias de estimacin. Las ms
utilizadas son las siguientes:
a.

Regresin agrupada (pooled). Estima el siguiente modelo:


Es un modelo de estimacin donde no existe diferenciacin
entre individuos y no intenta capturar efectos no
observados. Utiliza tcnicas tradicionales por OLS. Es
posible por las caractersticas de la base de datos panel que
E(xit,ui)0. Entonces, la regresin agrupada (pooled) estar
sesgada. Muchas veces dicha correlacin es debida a un
error de especificacin por la ausencia de alguna variable
relevante (variables omitidas) o la existencia de cualidades
no observables (heterogeneidad no observable) de cada
individuo.

b.

Regresin panel por Efectos fijos (Fixed effect o FE). Los


modelos de regresin de datos panel realizan distintas
hiptesis sobre el comportamiento de los residuos, como ya

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

98

se not anteriormente. Esto tiene un impacto en las


metodologas y supuestos sobre el modelo de regresin a
implementar en un modelo one way. El modelo a estimar es:
Donde i =+vi, luego reemplazando en (2) queda:
Es decir, supone que el error (uit) puede descomponerse en
dos partes, una parte fija, constante para cada uno de los
individuos representando el efecto individual no observado
(vi) y otra aleatoria que cumple requisitos OLS (uit).
El elemento representando el efecto individual no
observado (vi) se incorpora al intercepto para ser estimado
posteriormente. Esta metodologa permite modelar algn
tipo de endogeneidad en los trminos de error, a diferencia
del modelo de regresin lineal general, es decir, E[XU]0 y
efectuar estimaciones consistentes.
c.

Regresin panel por aleatorios (random effects o RE). Tiene


la misma especificacin que el modelo efectos fijos con la
salvedad que el efecto individual no observado vi, en lugar
de ser un valor fijo a ser estimado para cada individuo es
una variable aleatoria con un valor medio vi y una varianza
Var(vi)0. Es decir, la especificacin del modelo es igual a:

Salvo que ahora el efecto individual no observado, vi , es una


variable aleatoria. Su estructura parte del supuesto de

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

99

exgeneidad fuerte E[XU]=0. Por tal motivo, adems, con la


existencia de n individuos distintos la estructura de
covarianzas debe ser contemplada con el supuesto de
heterocedasticidad a travs de una estructura
de
.
covarianzas ms general,
El modelo de efectos ale atorios (RE) es ms eficiente pero
menos consistente que el de efectos fijos (FE). Es decir, es
ms exacto en el clculo del valor del parmetro pero puede
contener sesgo a diferencia del modelo de efectos fijos.
Adicionalmente, Al ser el efecto individual no observado vi
una variable aleatoria no se est seguro del valor exacto en
el origen que pueda tener cada individuo sino que este
trmino probablemente gravitar en torno a un valor
central. Eso implica que el modelo parte del supuesto que la
base de datos panel proviene de una muestra de un gran
universo de individuos.
En conclusin, La principal diferencia entre los modelos de
efectos fijos (Fixed effect o FE) y efectos aleatorios (random
effects RE) parte de como cada uno de ellos efectua un
tratamiento distinto del supuesto de exogeneidad fuerte,
E[XU]=0. Ademas de estas diferencias se suma otra importante, el
modelo de efectos fijos (Fixed effect o FE) en su construccion
parte de una poblacion, mientras el modelo de efectos aleatorios
(random effects RE) inicia desde una muestra aleatoria.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

100

VARIACION BETWEEN-WITHIN
La variable dependiente y regresores del modelo de datos panel
pueden variar sobre el tiempo (t) e individuos (i), como ya se ha
definido.
La variacin en el tiempo de una variable x para un individuo es
conocida como variacin within y la variacin de una variable x a
travs de individuos se conoce como variacin between4.
Variacin Between Vs Within

Individuo 2

Variacion Between

Individuo 1
Variacin Within
ithinetween

Esta distincin tiene una significancia importante dentro del


modelo de datos panel debido a que estimadores y variables
difieren en su uso segn la ponderacin que se efectu entre el
efecto de variabilidad between o within.
La variacin total alrededor de la media se define como
T
x = 1/NT N
i=1 t=1 x it la cual se divide en variacin within
Esta metodologa es conocida como estimacin de dinmicas entre grupos. En anlisis de corte transversal tradicional, cada observacin captura
informacin de su nivel de largo plazo y su componente cclico. El estimador de efectos entre grupos (between) en trminos generales reduce el
problema de un panel longitudinal a uno de corte transversal, empleando el clculo promedio de las variables al interior de cada individuo. El
procedimiento general para obtener este estimador necesita calcular el promedio de la variable dependiente y de los regresores a lo largo del
tiempo. Posteriormente, realiza una estimacin OLS donde se usan como regresores y variable dependiente los promedios calculados en el paso 1.
4

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

101

(suma respecto a los T periodos) y between (suma respecto a los


N individuos).
La variacin within, para cada regresor, xit, se calcula como el
promedio en el tiempo de cada uno de los individuos de la
variable x (media de la variable x para el individuo i-esimo a
travs del tiempo, xi = 1/T Tt=1 xit )
La variacin between mide las diferencias a travs de los
individuos para la variable x (xi x). Explota slo la variacin
de corte transversal.
A partir de la descomposicin de promedios (x) y la varianza
muestral (S) para la variable x es posible encontrar las
variaciones between y within calculadas como:
PROMEDIOS:
Total:
En el grupo (WITHIN):

1
x =
xit
NT
i=1 t=1
T

xi =

1
xit
T
t=1

Entre grupos (BETWEEN):


=(xi x)
VARIANZAS MUESTRAL
1
2
En el grupo (WITHIN) o swithin=
N
Tt=1(xit xi )2
=
i=1
NT1
entorno a la media individual:
1
2
Entre grupos (BETWEEN) o sbetween
N
=
(xi x )2
i=1
N1
entorno al promedio de
individuos respecto al total:
x iB

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

Total o entorno a la media total:

2
stotal

102

1
=
(xit x)2
NT 1
i=1 t=1

En la mayora de aplicativos es posible generar tablas donde se


expone estadisticos descriptivos como mximo, mnimo,
percentiles, varianza, etc. En STATA, por ejemplo, xtsum.
CALCULO WITHIN BETWEEN STATA

EJERCICIO. Calcule la variacin between, within y overall para la


siguiente base de datos panel.
PERIODO
1
2
3
1
2
3

INDIVIDUO
1
1
1
2
2
2

Y
23
45
76
21
98
5

X1
16
6.5
8
43
5
78

X2
31
87
32
4
55
24

X3
42
78
65
38
75
29

Es importante resaltar que variables para las cuales no existe


cambio en el tiempo pero si entre individuos (zit=zi) como sexo,
raza o religin existe variacin between pero no cuentan con
variacin within.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

103

Dentro del analisis de bases de datos panel es posible medir


variaciones totales que corresponden al componente between y
cero o muy pequea variacion within.
Para variables discretas, una tabulacin de valores (histograma)
puede ofrecer una visin completa de observaciones que toman
ese valor (overall), individuos para los que alguna vez toma ese
valor (between) y el porcentaje de individuos que nunca cambia
de valor (within).
A si mismo para variables dummy, se puede calcular una matriz
de transicin (ofrecen idea de persistencia dinmica de efectos
observados) donde se exponga la evolucin de la variable entre
el periodo actual (xit) y el siguiente (xit+1) bajo la existencia (1) o
no (0) del evento registrado.
MATRIZ

DE

TRANSICION

EFECTOS

PANEL

WITHIN

BETWEEN

SESGO DE HETEROGENEIDAD
Al incluir efectos between y within dentro del anlisis y observar
la significancia de la interaccin entre individuosy tiempo entre
variables e individuos surge la pregunta que ocurre si este
efecto se omite? El no contar con el efecto individual no
observado, i, y aplicar OLS a una base de datos panel se suele

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

104

llamar sesgo de heterogeneidad. Surge de omitir una variable que


difiere entre individuos pero no cambia en el tiempo.
ANALISIS BETWEEN-WITHIN-OVERALL
OLS/FGLS
Within
Between

Overall

El grafico anterior ayuda a comprender el sesgo por


heterogeneidad. Suponga una muestra con 4 individuos (N=4) y
20 periodos de tiempo (T=20). Para el individuo i-esimo existe
una pendiente idntica y positivamente relacionada en una
forma lineal entre Y y X.
Para la muestra completa la relacin es ligeramente descendente
y lineal. Si el inters se centra en el modelo anterior, la
estimacin sobre todos los eventos de la muestra (overall) es un
sesgo de heterogeneidad. Es decir, el sesgo en el proceso de
estimacin causado por omitir i y aplicar OLS a datos agrupados
(pooled).
VARIABLES OMITIDAS Y EFECTOS NO OBSERVADOS
Si la heterogeneidad no observada no es controlada conduce al
sesgo por variables omitidas que puede ser corregido por

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

105

variables instrumentales (2LS) en el caso de corte transversal5.


Para el caso de datos panel existen diferentes metodologas
alternativas de tratamiento.
Adems de la ventaja que tienen los modelos de datos panel para
construir y probar modelos de comportamiento ms amplio que
el puramente de corte transversal o series de tiempo,
proporcionan medios para resolver o reducir la magnitud de
problemas economtricos que se observan en estudios
empiricos relacionados con la presencia de variables omitidas
(no medidas o no observadas) que estan correlacionadas con
variables explicativas.
Utilizando informacin de la dinmica intertemporal, y de las
entidades individuales, de una manera natural, se pueden
incorporar efectos de variables omitidas o no observadas. Por
ejemplo, suponga el siguiente modelo de regresion:

Donde xit y zit son vectores de tamao k1X1 y K2X2 de variables


exogenas, *, y son vectores de parmetros de tamao 1X1,
k1X1 y k2X1, respectivamente. El trmino de error uit es una
variable aleatoria, independiente e identicamente distribuida
(vaiid) sobre individuos (i) y tiempo (t) con media cero y
varianza 2it .
En la prctica es difcil encontrar buen un instrumento para le calulo del estimador de variables instrumentales ya que debe tener caracterisitcas
a veces incompatibles como que revele informacin similar a la variable a reemplazar dentro del modelo de regresion y adicionalmente sea
exgena frente a los regresores.
5

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

106

La regresin por mnimos cuadrados de yit sobre xit y zit arroja


estimadores consistentes e insesgados de *, y .
Ahora suponga que valores de los regresores zit son no
observables y la covarianza entre regresores xit y zit es no cero.
Entonces, los coeficientes de regresin por minimos cuadrados
de yit sobre xit son sesgados e inconsistentes.
Sin embargo, si se encuentran disponibles observaciones
repetidas para un grupo de individuos, ellas pueden permitir
deshacerse de los efectos no observados de z.
Por ejemplo, si los regresores zit=zi para todo t (es decir, los
valores de la variable no observada, z, permanecen constantes a
traves del tiempo pero cambia a traves de los individuos), es
posible tomar la primera diferencia de las observaciones
individuales sobre el tiempo y se obtiene:

Donde la diferencia de la variable respuesta para el individuo


i-esimo entre el periodo actual (yit) y el anterior (yit-1), o mejor,
(yit-yit-1), debe ser igual a la diferencia entre los regresores para
el individuo i-esimo en los periodos t y t-1.
Si se efectua la diferencia sobre los regresores zit se eliminan
variables no observadas que no cambian en el tiempo, por
ejemplo raza o sexo.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

107

De forma similar, si zit=zt para todo i (es decir, los valores de z


permanecen constantes a traves de los individuos pero varian a
traves del tiempo), se puede tomar la desviacion respecto a la
media a traves de los individuos en un periodo dado y obtener:

Donde el promedio aritmtico de la variable respuesta para


todos los individuos, y, en cada periodo de tiempo se define
como yt=(1/N)N
t) es la diferencia entre la
i=1 yit , por tanto, (yit-y
respuesta de cada uno de los individuos (yi) respecto al
promedio de todos los individuos (y) evaluados en cada periodo
de tiempo (t).
Para los regresores, aplica una frmula similar, es el promedio
aritmtico de cada una de las observaciones de los individuos en
cada periodo de tiempo, y se define como t=(1/N)N
i=1 it ,
donde (xit-xt) ser la diferencia o desviacin entre cada
observacin para cada individuo (i) respecto a su promedio en
cada periodo de tiempo (t).
Si se efectua la diferencia sobre los regresores zit se eliminan
variables no observadas que cambian en el tiempo, pero si entre
los individuos por ejemplo polticas o legislaciones. Es decir, esta
metodologa permite minimizar el nmero de variables no
observadas que se encuentran ubicadas en la media temporal a
travs de la estructura panel.
Por ltimo, ut=(1/N)N
i=1 uit es el promedio de las innovaciones
de todos los individuos en cada periodo, su diferencia (uit-ut)
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

108

revela la distancia entre las innovaciones ocurridas en cada uno


de los individuos (i) respecto al promedio de las innovaciones de
los individuos calculadas en cada periodo de tiempo.
La regresin por OLS de las ecuaciones anteriores proporcionan
estimadores consistentes e insesgados de como una alternativa
de solucin a efectos no observados y variables omitidas.
Sin embargo, si se tiene un conjunto de datos de corte
transversal con un unico individuo (i=1) y se cuenta con
variables que no cambian en el tiempo pero si entre individuos
(zit=zi), o una base de datos con un periodo de tiempo (t=1) con
variables que no cambian entre individuos pero si en el tiempo
(zit=zt), tal transformacin no puede ser ejecutada, por tanto, no
se puede asegurar la consistencia de , a menos que existan
variables instrumento (IV) que estn correlacionados con x pero
no correlacionados con z y u.
Es importante observar que a pesar de los cambios temporales,
el valor de los parmetros permanecen constantes. La
diferencia tambin aplica a los trminos de error.
CORRELACIN SERIAL RESULTANTE DE EFECTOS CONSTANTES
EN EL TRMINO DE ERROR
Suponga el modelo de regresin panel con un efecto permanente
no observado a travs de los individuos (i).
Un problema de las estimaciones de datos panel radica en la
posible correlacin serial entre los errores de diferentes

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

109

periodos causados por la existencia de este efecto no observado


(i).
Sea el modelo E, o modelo no restringido, donde varan
intercepto () y pendientes () a travs de los individuos (i) y
tiempo (t):

Donde uit est compuesto por un trmino de heterogeneidad no


observada, i, y un trmino aleatorio puro para individuos y
tiempo it.
Suponga un anlisis para dos periodos (t=2) para el individuo
i-esimo:

En t=1: yi1= 1
+1 xi1+ui1
con ui1 = i+i1

En t=2: yi2= 2
+2 xi2+ui2
con ui2 = i+i2
Las ecuaciones anteriores demuestran como los errores, uit, del
modelo usualmente estaran correlacionados serialmente dada la
existencia del trmino de heterogeneidad no observada
invariante en el tiempo para el individuo i-esimo, i. Es decir,
COV[uit,uis]0 para todo ts.
Con datos de panel no es posible suponer que las observaciones
son independientes ya que factores no observados que afectan a
los regresores en un periodo tambin afectarn a esas mismas
variables en el periodo siguiente.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

110

Para validez del modelo Panel, y su metodologa de estimacin,


es necesario controlar la probable correlacin de los errores del
modelo de regresin sobre el tiempo para individuos objetos de
estudio.
En particular, la formula usual de OLS para los errores
estandarizados en una regresin OLS agrupada (pooled),
tpicamente exagera el volumen de informacin independiente lo
cual implica ganancias en precisin, varianza y grados de
libertad, conduciendo a subestimar los errores estndar, y por
tanto, t-estadsticos pueden ser demasiado grandes.
Esto causa estimadores OLS menos eficientes (o de mayor
varianza) en comparacin a los que se obtendran sin
autocorrelacin de los residuos y tiene implicaciones en la
construccin de pruebas t utilizadas para contrastar la
significancia de regresores, xit.
Entre mayor varianza, aumenta la posibilidad de encontrar la
verdadera significancia y mayor la probabilidad de cometer error
tipo I y error tipo II6.
INFERENCIA ROBUSTA A LA HETEROCEDASTICIDAD Y
CORRELACIN SERIAL DESPUS DE OLS
Suponga un nuevo modelo ms general donde las observaciones
de Ti para el individuo i en la ecuacin panel son las siguientes:

Declarar un coeficiente estadsticamente no significativo, cuando en realidad lo es.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

111

Donde X es un vector de variables explicativas, es un vector


Kx1 de parametros a estimar y w es el termino de error o
perturbacin estocastica. El estimador OLS es:
ols=(XtX)-1XtY

Si los errores muestrakes tienen igual varianza a 2 y son no


ols es BLUE y su varianza
correlacionados, entonces OLS de
puede ser estimada como:
ols]=S2(XtX)-1
VAR[
Si el supuesto de homocedasticidad es violado, es decir,
E[UtU]2In el estimador de la varianza pierde propiedades
deseadas de eficienciay consistencia. La varianza en este caso es:
ols]= (XtX)-1XtX(XtX)-1
VAR[
Donde ahora incluye el trmino constante. En esta
configuracin, puede asumirse heterocedasticidad entre los
individuos. Sin embargo, en un conjunto de datos panel, el
principal problema, y de mayor significancia, es la correlacin
cruzada entre individuos o autocorrelacin de los trminos de
error o perturbacin estocastica.
En una base de datos panel o longitudinales un conjunto de
observaciones pueden pertenecer al mismo individuo pero en su
componente del error se encuentran efectos no observados que
se llevar a travs de todos los T perodos.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

112

Suponga el modelo anterior con un vector de perturbacin o


trmino de error, wit, adems de los componentes omitidos.
Entonces, la estructura de covarianzas puede ser definida como:

El estimador OLS puede ser escrito como:

Con el fin de concentrar la correccin exclusivamente en la


varianza de los parmetros (y no en el valor de los parmetros)
existe una propuesta de correccin similar a la estimacin
ideada para el contexto en el que exista un problema de
autocorrelacin.
Esta correccin, se denomina estimacin de NeweyWest o
estimacion robusta y produce resultados adecuados en muestras
grandes. Para este caso la matriz de covarianza asinttica a ser
estimada siguiendo el tipo White es:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

113

i es un vector de Ti residuos para el individuo i-esimo.


Donde
CARACTERISTICAS ADICIONALES DE DATOS PANEL
A partir de lo anterior es posible identificar algunas otras
caracteristicas sobre modelos de datos panel, entre ellas:
1. Un trmino ms preciso para el modelo one way es definido
como el modelo de efectos aleatorios especficos de un solo
factor (one-way individual specific random effects model) o
simplemente modelo de intercepto aleatorio (random
intercept model).
2.

Los datos panel son usualmente observados en intervalos


regulares de tiempo (meses, trimestres, aos) con las
mismas caracteristicas de los datos de series de tiempo.

3.

Los paneles de datos pueden ser balanceados, significando


que todas las unidades individuales son observadas en
todos los periodos (Ti=T i), aunque pueden existir paneles
desbalanceados (TiT para algn i). En cualquier caso, la
consistencia del estimador requiere que el proceso de
seleccin de la muestra no conduzca a errores de
correlacin con regresores.
En la descripcin de los datos se hace indispensable para
paneles balanceados, exponer el nmero de observaciones,
determinar el nmero de individuos distintos (N) y total de
periodos cubiertos por el panel (T).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

114

Para paneles NO balanceados, adems de lo anterior, se


debe considerar periodos concretos en que se observa cada
individuo (Ti) y el nmero total de observaciones existentes,
N
i=1 Ti . Adicionalmente, es importante tener en cuenta que
no tiene porque haber individuos observados todos los
periodos y que individuos con el mismo numero de
observaciones (Ti) pueden ser observados en periodos
diferentes.
4.

Las bases de datos pueden ser de diferentes tipos. Entre


ellos, paneles cortos (pocos periodos y muchos individuos)
o paneles largos (muchos periodos y pocos individuos) o
ambos, conocido como campo aleatorio (muchas periodos y
muchos individuos).
Esta distincion tiene consecuencias para las metodologias de
estimacion e inferencia sobre el modelo. El foco inicial de
trabajo radica en paneles cortos, lo que implica, datos de
muchas unidades individuales y pocos periodos.

Por ejemplo, en paneles largos, se pueden estimar fcilmente los


parmetros (i,i). En paneles cortos, se necesita suponer una
distribucin para (i,i) o condiciones en los regresores como en
el modelo de efectos aleatorios (RE), se suele suponer que son
independientes de los regresores E[XU]=0.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

115

PANEL CORTO BALANCEADO PANEL LARGO BALANCEADO


E
E1

E2

E3

E4

Ek

Y
y1
:
yn
y1
:
yn
y1
:
yn
y1
:
yn
:
y1
:
yn

X
x1
:
xn
x1
:
xn
x1
:
xn
x1
:
xn
:
x1
:
xn

t-1

T
t-2

t-3

E
E1

E2

Y
y1
:
yn
y1
:
yn

X
x1
:
xn
x1
:
xn

t-1

t-2

T
t-3

t-n+1

t-n

PANEL CORTO DESBALANCEADO PANEL LARGO DESBALANCEADO


E
E1

E2

E3

E4

Ek

5.

Y
y1
:
yn
y1
:
yn
y1
:
yn
y1
:
yn
:
y1
:
yn

X
x1
:
xn
x1
:
xn
x1
:
xn
x1
:
xn
:
x1
:
xn

t-1

T
t-2

t-3

E
E1

E2

Y
y1
:
yn
y1
:
yn

X
x1
:
xn
x1
:
xn

t-1

t-2

T
t-3

t-n+1

t-n

Los errores del modelo estn altamente correlacionados. Se


enfatiza como la correlacin o agrupamiento sobre el
tiempo para un individuo dado, con interdependencia sobre
otras unidades individuales puede existir. Para algunos
modelos de datos panel, tales como informacin de pases,
pueden adicionalmente existir correlaciones entre
individuos. A pesar del supuesto hecho, es necesario
realizar correcciones sobre los trminos de error para
efectuar el proceso de estimacin por mnimos cuadrados
ordinarios (OLS), y en algn caso, es necesario corregirlas,
teniendo ganancias en eficiencia utilizando mnimos

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

6.

7.
8.

9.

116

cuadrados generalizados factibles (FGLS) o mtodos


generalizados de momentos (GMM).
Los coeficientes de regresin, , estn en funcin del tipo de
regresor y son capaces de modificar la metodologa de
estimacin aplicada. Por ejemplo, algunos regresores como
gnero, pueden ser invariantes en el tiempo, es decir, xit=xi
para todo t, y en algunos casos, como es para efectos fijos,
no puede ser calculada. Desde otro punto de vista, algunos
regresores, tales como una tendencia temporal, pueden ser
invariantes entre los individuos afectndolos a todos por
igual en el tiempo, es decir, xit=xt para todo i, y algunos
pueden variar sobre el tiempo y sobre los individuos de
manera simultnea, es decir, xit.
Algunos o todos los coeficientes estimados dentro del
modelo pueden variar a travs de los individuos o sobre el
tiempo, es decir, xit.
La literatura enfatiza en el modelo de efectos fijos. Este
modelo permite a los regresores, xit, tener algn grado de
endgeneidad (determinados dentro del modelo) lo que
indica que los regresores, x, estn correlacionados con un
componente del error invariante en el tiempo. Otras ramas
enfatizan el modelo de efectos aleatorios que asume
regresores completamente aleatorios y exgenos o efectos
aleatorios.
Los paneles de datos permiten estimacin de modelos
dinmicos donde la variable dependiente rezagada pueden
convertirse en regresor tal como lo expone Arellano (2002).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

117

PROBLEMA DE PARAMETROS INCIDENTALES


Bajo un contexto de paneles cortos no es posible encontrar los
parmetros para efectos fijos (FE) tanto para el proceso de
estimacin como para efectuar contrastes de hiptesis. La causa
se debe al problema de parmetros incidentales. Es decir, la
incapacidad de calcular nuevos parmetros a medida que crece
con el tamao muestral.
Si se considera que N tiende a infinito entonces conceptualmente
el nmero de efectos fijos (FE) calculados crecera tambin
infinitamente, lo que genera un modelo inestimable (N
entonces i).
En otras palabras, asintticamente a la hora de utilizar
contrastes de multiplicadores de Lagrange (LM), as como
estimacin mximo verosmil (MV), por ejemplo, cuando el
nmero de individuos (N) tienda al infinito implicara la
estimacin de un nmero infinito de variables dummy.
Existen potenciales soluciones para continuar con tcnicas
tradicionales de estimacin y contraste. En primer lugar,
modelos de efectos aleatorios (RE) en el caso que los efectos no
observables no se encuentren correlacionados con los
regresores del modelo. En segundo lugar, incluir diferencias
temporales pero no individuales (zit=zt). Por ltimo, variables
instrumentales (IV) o variables que reflejen de una manera
aproximada las diferencias no observadas.
De por si, para minimizar el impacto del problema de
parmetros incidentales en el caso de estimaciones FE los
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

118

efectos individuales no observados (i) son eliminados a travs


de diferencias temporales (yit-yit-1) o por diferencias respecto a
sus promedios (yit-).
III. METODOLOGIAS DE ESTIMACION DE MODELOS DE DATOS
PANEL
Las metodologas de estimacin en paneles de datos lineales
pueden ser resumidas de la siguiente manera:
Modelo
Agrupado (Pooled)
Between
Efectos Aleatorios (RE)

Efectos Fijos (FE)

Estimador
1.
1.
1.
2.
3.
1.
2.
3.
4.
5.

OLS
OLS
FGLS
OLS para un estimador GLS
Mximo verosmil.
LSDV.
Condicional de maxima verosimilitud.
Primeras Diferencias
Within o de efectos fijos
Within o de efectos fijos con GLS

Suponga el modelo lineal general o no restringido (Modelo E) de


la forma:
Donde yit es la variable dependiente en terminos escalares, xit, es
un vector de Kx1 variables independientes y es un vector Kx1
de parmetros estimados que varian a travs de los individuos y
el tiempo, uit es el trmino de perturbaciones con el ndice
individual (i=firma, pas, etc) de forma transversal e indexado
en el tiempo (t).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

119

Este modelo es demasiado general y no es calculable dado que


existen ms parmetros a ser estimados que observaciones en la
base de datos panel.
Por tal motivo, deben imponerse restricciones sobre la
variablidad del intercepto, it y las pendientes, it, con especto a
los individuos (i), el tiempo (t) y el comportamiento del trmino
de error (uit) en el proceso de estimacin.
1. MODELO AGRUPADO
El modelo ms restrictivo es el modelo agrupado (pooled model)
especifica coeficientes constantes, el supuesto usual para
estimaciones de corte trasversal (cross section) es el siguiente:

yit=+Xit+it
Si este modelo se encuentra correctamente especificado y los
regresores no estn correlacionados con el trmino de error
(exogeneidad fuerte), y por tanto no existen efectos individuales
no observados, entonces es consistente y eficientemente
estimado por OLS y la inferencia pueden proceder de forma
fiable. En el contexto de datos de panel tambin se le llama
promedio poblacional o population average, con los siguientes
supuestos:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

120

La inferencia debe usar errores estndar robustos por la


probable correlacin entre individuos y en el tiempo para evitar
sesgos en el clculo de la varianza estimada y el clculo de
estadsticas t y F sea apropiado.
Dada la correlacin de los errores donde se incorpore efectos no
observados se pueden obtener estimaciones consistentes si los
factores no observados, que a su vez estn correlacionados con
las variables exgenas, si se mantienen constantes en el periodo
analizado.
2. ESTIMADOR ENTRE GRUPOS (BETWEEN ESTIMATOR)
El estimador entre grupos (between estimator o BE) en paneles
cortos, al igual que el modelo pooled calcula una variacin de
corte transversal. Es decir, utiliza los datos between para el
individuo i-esimo sobre k regresores, o mejor, yi, xi1, xi2,..,xik.
Suponga el modelo de media individual de la forma:

yit=+Xit+it
Ajustando los promedios aritmticos de la variable dependiente,
yit, regresores, xit y el trmino de error, it, sobre el tiempo,
resulta en:

El cual puede ser reescrito como el modelo between de la forma:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

121

Donde los promedios aritmticos en el tiempo de la variable


endgena, regresores y trmino de error son yi = 1/T Tt=1 yit ,
= 1/T Tt=1 xit y i = 1/T Tt=1 it ), respectivamente.
El estimador entre grupos (BE) es un estimador OLS de la
regresin de yi sobre un intercepto () y los regresores
promediados a travs del tiempo, i .
Este utiliza la variacin entre diferentes individuos, anlogo a
una regresin de corte transversal. Tambien interpretable a un
modelo panel en el caso especial donde t=1.
Este estimador es consistente si los regresores, i , son
independientes del termino de error compuesto (i-+i ), o lo
que es lo mismo, bajo el supuesto de exogeneidad estricta o
fuerte de los regresores, xit, respecto al trmino de error
compuesto, it, utilizndose errores estndar robustos. Puede ser
utilizado en el caso de coeficientes constantes (pooled) y de
efectos aleatorios.
En contraste, para un modelo de efectos fijos el estimador entre
grupos (BE) es inconsistente en la medida que el intercepto i se
asume no correlacionado con xit, en este caso con i .
En la prctica apenas se utiliza debido a que el estimador
agrupado (pooled) y el de efectos aleatorios (RE) son superiores,
es decir, son consistentes bajo las mismas condiciones y ms
eficientes asintticamente.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

122

3. MODELO EQUICORRELACIONADO O EFECTOS ALEATORIOS


El estimador OLS agrupado (pooled) o BE se obtiene apilando o
promediando los datos sobre los individuos (i) y tiempo (t) con
una regresin estimada por OLS para NT observaciones de la
forma:

El estimador OLS es consistente si el modelo anterior tiene


regresores no correlacionados con los trminos de error, es
decir, si la relacin entre el termino de error (uit) y regresores
(xit) es cero, Cov[uit, xit]=0, a pesar que el numero de individuos
crezca (N) o el tiempo aumenta (T) lo cual conduce a
estimadores consistentes y eficientes.
La matriz de covarianzas, por otra parte, usualmente utilizada
para un modelo pooled o BE se fundamenta en errores que se
asumen como vaiid con matriz de covarianzas =2I.
Sin embargo, si existen efectos individuales no observados
(i0), caracteristicos de la visin panel, los trminos de error
para un individuo i-esimo estarn probablemente positivamente
correlacionados (en el tiempo para un individuo y/o entre
individuos), por lo que la matriz de covarianzas diverger de la
metodologa utilizada por OLS. Los OLS aplicables a pooled o BE
no es apropiada.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

123

El estimador OLS no es conveniente si se asume la existencia de


un efecto individual no observado sin correlacin con las
variables explicativas, COV[XiU] 0.
La metodologa de efectos aleatorios (RE) asume que la matriz
de covarianzas generada () es diferente a la esperada en OLS
donde existe homocedasticidad (=2I). Es necesario modificar
este supuesto y trabajar metodologas ms generales de
estimacin como GLS o FGLS.
Un modelo de efectos aleatorios (RE) puede ser estimado por
OLS con los parmetros consistentes aunque es un modelo
ineficiente por su estructura de covarianzas.
En un modelo de efectos aleatorios (RE) en la medida que asume
independencia entre regresores y trminos de error para los
i-esimos individuos en t periodos no es posible construir una
matriz agregada, , si cada individuo tiene su estructura de
covarianzas, que se denominar .
Este anlisis de correlacion de los trminos de error tambin se
puede observar desde un punto de vista de la informacin
utilizada para la construccin de pruebas de hiptesis e
intervalos de confianza. Los supuestos usuales de estimacin
OLS tratan cada T aos como piezas independientes de
informacin.
Si existe correlacin positiva de los trminos de error el
contenido de la informacin es menor. Las NT observaciones
correlacionadas tiene menos informacin que NT observaciones
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

124

independientes. Esto tiene implicaciones en el calculo al


sobreestimar la precisin del estimador de la varianza ya que
mayor varianza hace menores los t-estadisticos.
El modelo de efectos aleatorios (RE) es la especializacin de un
modelo agrupado (pooled) para los i-esimos individuos. En la
medida que el componente individual no observado, i, pueda
ser incluido en el trmino de error a travs del tiempo. Suponga
el modelo B:
t
yit= i+ it
+uit
Puede ser visto como la regresin de la variable dependiente, yit,
sobre los regresores, xit, con un trmino compuesto de error one
way, uit=i+it.
Los supuestos sobre el efecto individual no observable (i) y el
trmino de error (it) son variables aleatorias que tienen la
distribucin de probabilidad la forma i~[0,2 ] y it~[0,2 ]
respectivamente.
Esto implica que cada elemento de la matriz de covarianzas,
Cov[uit,uis], ser calculado como la relacin (covarianza) entre el
efecto individual no observado (i) ms el componente del
trmino de error (i) para los periodos t y s. Es igual a:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

125

Bajo un trmino de error compuesto (uit) suponiendo la


existencia de efectos individuales no observados vistos como
una variable aleatoria (i) e incluidos en el termino de error,
cuando es calculada la matriz de covarianzas para el individuo
i-esimo, , impone restricciones de estar igualmente
correlacionado (equicorrelacionado) en el mismo periodo.
Cuando los periodos t y s coincidan (t=s), la diagonal de la
matriz de covarianzas () asocia la volatilidad del trmino de
error de ese periodo corresponde a la suma de la varianza del
efecto individual no observado (2 ) ms la varianza del trmino
de error (2 ), es decir, para el caso COV[uit,uit]= (2 + 2 ).
El modelo de efectos aleatorios (RE) es conocido como modelo
equicorrelacionado por esta razn.
Para periodos cuando t y s son distintos (ts), elementos fuera
de la diagonal de la matriz de covarianzas (), la volatilidad del
modelo corresponder nicamente a la varianza del componente
individual no observado (2 ).
Se construir una matriz de covarianzas de tamao TxT que
corresponden a los T periodos de observaciones para individuo
i-esimo.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

126

De forma matricial, suponga E[ |x]= para ser estimada


por FGLS de forma que para el i-esimo individuo:
=

2 t +
2u T tT =
Se espera para un individuo i-esimo exista una correlacin
considerable en el tiempo, de modo que COR[yit,yis] is sea
alta. Despus de la inclusin de regresores la correlacion de los
termonos de error, COR[uit,uis], puede permanecer no cero y
muchas veces puede ser bastante significativa.
Por ejemplo, si un modelo pronstica ganancias individuales en
un ao, dada la correlacin positiva existente entre periodos, la
varianza calculada puede ser mucho mayor de la esperada y
puede sobrepronosticar ganancias para el mismo individuo en
otros aos.
En un modelo de efectos aleatorios (RE) el coeficiente de
correlacin no depende del tiempo, es decir, COR[uit,uis] para
ts, se calcula como:

Los coeficiente de correlacin tienen muchas correcciones


posibles, dependiendo de la estructura de correlacin y
heterocedasticidad para el individuo y entre individuos asumida
para los regresores y si son paneles cortos o largos.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

127

Puesto que las observaciones del individuo i-esimo y j-esmo se


suponen independientes, es decir, no existe relacin entre los N
individuos, la matriz de covarianzas, , del modelo RE ser
diagonal.
En estos modelos siempre es til el anlisis por bloques de T
observaciones para cada uno de individuos (i).
Cada elemento de la diagonal esta constituida por bloques de
matrices de covarianzas, , de tamao TxT que corresponden a
la estructura de covarianzas para cada individuo.
La matriz de covarianzas del modelo RE para todos los
individuos, , ser de tamao NTxNT. De forma matricial:

=[

]=I
n

ESTIMADORES PARA EL MODELO DE EFECTOS ALEATORIOS


Cuando los grupos considerados son extracciones muestrales de
una poblacin ms grande, puede resultar apropiado considerar
que los efectos individuales no observados estn aleatoriamente
distribuidos entre los grupos. En este caso se considera un
modelo de estimacin de efectos aleatorios (RE).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

128

El estimador de efectos aleatorios (RE) explota rasgos y


supuestos especiales de los datos panel. El estimador RE es
inconsistente si el modelo de efectos fijos (FE) es el adecuado.
Sea el modelo de efectos aleatorios (RE) especificado en la
siguiente forma funcional:
El cual puede ser reescrito como:

Donde adems las pendientes () y los regresores (xit) existe un


intercepto no estocstico () y un efecto individual no observado
(i). Puede ser nuevamente reescrito como:

Donde wit=[1 xit] y =[ t]t. Los efectos especficos individuales


i se asumen como una realizacin de vaiid con una distribucin
[,2 ], de la misma manera, el termino de error it es una vaiid
[0,2 ].
El intercepto escalar , a diferencia del modelo de efectos fijos,
se convierte en una variable no aleatoria y se adiciona al modelo
para posteriormente ser estimada.
De este modo, se asume en el modelo i y it como vaiid con las
siguientes propiedades:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

129

Sin embargo, bajo algunos supuestos, y trabajando sobre


promedios los efectos individuales no observados y los trminos
de error pueden ser normalizados a tener media cero, es decir:
i~[0,2 ] it~[0,2 ]
t
El modelo puede ser reexpresado como yit=+ it
+uit, donde el
termino de error compuesto, uit, tiene dos componentes
uit=i+it.

Por esta razn el modelo de efectos aleatorios (RE) es tambin


conocido como modelo de componentes del error (error
components model). Una terminologa ms explcita puede ser
conocido como modelo de intercepto aleatorio (random
intercept model).
Existen una multiplicidad de estimadores consistentes del
modelo de efectos aleatorios (RE) entre otros:
1. Estimador por GLS. Este reconoce el hecho que mnimos
cuadrados generalizados (GLS), es ms eficiente (mnima
varianza) que estimaciones por OLS.
2. Estimacin OLS para un estimador GLS. Supone efectuar
transformaciones adecuadas para realizar estimaciones OLS
con consistencia de los estimadores encontrados.
3. Estimador mximo verosmil. Asume que tanto el efecto no
observado (i) como el trmino de error (it) son
normalmente distribuidos y construye una funcin de
verosimilitud.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

130

Los dos primeros estimadores son asintticamente equivalentes


aunque en algunos casos pueden variar en muestras finitas
dependiendo de estimaciones especficas y caractersticas
utilizadas para el valor de las varianzas del efecto no observado
(2 ) y el termino estocstico (2 ). Los restantes estimadores son
consistentes aunque ineficientes si 2 y 2 son vaiid.
ESTIMADOR POR GLS
Puesto que la matriz de covarianzas para un individuo es una
matriz semidefinida positiva puede ser factorizada a travs de la
descomposicin espectral de la siguiente forma:
=CtCt
Donde C son los vectores propios de y las races caractersticas
de la matriz estn organizadas en una matriz diagonal . Sea
1/2 la matriz diagonal con el i-esimo elemento de la diagonal
igual a y sea T=Ct1/2, entonces TtT=. Tambien sea la
matriz Pt=Ct-1/2 entonces PtP=-1. Suponga un modelo lineal
general:
Y=X+
Premultiplicando por la matriz P definida anteriormente:
Y

PY =

X+

PX+P

Y* = X*+*
Al derivar los estimadores, , el estimador GLS tiene la siguiente
formula funcional:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

131

Para calcular este estimador transformando se require encontrar


-1/2=[I]-1/2. Ya que la matriz calculada es necesario encontrar
-1/2.
El valor de -1/2 corresponder a la estimacin de efectos
aleatorios (RE) por Mnimos Cuadrados Generalizados (GLS)
consistente en una regresin de desviaciones parciales entre la
variable dependiente, yit, y su media. Esta misma operacin se
efectua para las variables exgenas, xit.
Para demostrar lo anterior, se construir un estimador de
efectos aleatorios (RE) para el intercepto no estocstico () y las
pendientes (). Suponga el modelo:

Se puede demostrar, por medio de metodologas de estimacin


por mnimos cuadrados generalizados (GLS), que al multiplicar
por un factor adecuado es equivalente a encontrar un estimador
GLS a travs de regresiones de desviaciones parciales estimadas
por OLS sobre la ecuacin transformada.
Para comprender un poco mejor esta idea suponga el estimador
de mnimos cuadrados generalizados (GLS) de la forma
GLS=(Xt-1X)-1Xt-1Y, utilizando la descomposicin espectral

sobre la matriz de covarianzas se puede encontrar que:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

132

GLS=(Xt-1/2-1/2X)-1Xt-1/2-1/2Y.

Utilizando el hecho que es simtrica, semidefinida positiva y


con algunas propiedades de las matrices transpuestas se llega a
GLS=([-1/2X][ -1/2X])-1[-1/2X][Y-1/2].
que el estimador es
El estimador por GLS en este caso se puede interpretar de forma
individual cuando se efectua la multiplicacin para cada
elemento de -1/2X, que de aqui en adelante se asociar con un
parmetro de correccin .
Para calcular -1/2 se puede demostrar que -1/2=IT-(/T) T tT .
Donde el parmetro estimado de correccin, , es:

La transformacin de desviaciones parciales entre la variable


dependiente, yit, y su media sobre resulta ser:
yi1 yi
1/2
i
yi=[
]

yit yi
1/2

De la misma forma, aplica la multiplicacin de i


X para los
regresores Xi. Los datos en su conjunto transformados por GLS se
calcula regresando las desviaciones parciales de yit sobre la
transformacin de xit.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

133

Un procedimiento de estimacin parte del modelo inicial


yit=+xit+(i+it) para posteriormente restar el modelo
transformado calculado previamente el factor de correccin , es
decir, yit=+xit+(i+it). El resultado es:
El parmetro estimado de correccin, , es consistente y es
sinnimo de FGLS.
El valor de est en funcin de estimaciones de la varianza de
los efectos individuales no observados (2 ) y los trminos de
error (2 ).
El trmino de error es una combinacin del efecto no observado
(i) y el termino estocstico (it) de forma lineal,
vit=(1-)i+(it-).
Sin embargo, para el calculo del factor de correccin () es
necesario estimaciones de la varianza del efecto individual no
observado (i) y el componente del error (it).
La metodologa de clculo parte de encontrar la varianza del
componente del error de la forma:

Para el clculo de la estimacin de la varianza del error (


2 ) se
W ), y de
necesitan de los parmetros de la regresin between (
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

134

los promedios entre individuos de los los regresores (i) y la


variable dependiente (yi).
Posteriomente, se determina el componente del error al
B)2 que puede
cuadrado de la regresin Between, u2B =(yi-B-xit
ser reescrito como un trmino de error de la covarianza
u2B =2 +2 /T.
Utilizando esta ltima ecuacin se puede obtener la varianza del
componente individual no observado:

De este modo, se estima la varianza del componente individual


no observado (2 ) en funcin del termino de error estocstico
estimado (2 ).
2 en algunos casos puede ser
La varianza del estimador
negativa lo cual en algunos programas estadsticos asume que la
varianza del componente individual no observado es cero
2 =0) de modo que =0 y la estimacin se convierte en un
(
modelo pooled.
Estimadores ms eficientes de los componentes de la varianza
para 2 y 2 son posibles esta es una tcnica entre varias. Por
ejemplo Amemiya7 calcula otros estimadores pero no
RE.
necesariamente incrementa la eficiencia del estimador
7

Amemiya, T. (1985), Advanced Econometrics, Cambridge, MA, Harvard University Press.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

135

Para resumir, es necesario encontrar un parmetro de


correccin , para efectuar una estimacin consistente y eficiente
por FGLS. Para ello se estima, en primer lugar, la varianza del
trmino de error (
2 ). Posteriormente, la varianza del
componente individual no observado (
2 ).

= 1

2 + T
2
A partir del parmetro estimado de correccin, , se puede
derivar lo siguiente:
1. Si el parmetro de correccin es igual a cero, =0,
corresponde a una regresin pooled por OLS. Este escenario
ocurre cuando la varianza del componente individual no
observado () es igual a cero.
2. En la medida que el parmetro estimado de correccin,
difiere de cero, se presenta ineficiencia de OLS. El estimador
OLS comparado con GLS otorga demasiada ponderacin a
las variaciones en unidades (within).
OLS incluye todas las variaciones en los regresores X, en vez
de distribuir una parte a la variacin aleatoria entre grupos
(Between) atribuible a una variacin entre individuos.
3. Si el parmetro de correccin converge a uno, 1 debe ser
calculado como un estimador en dos etapas (2LS) de por
variables instrumentales (IV). Existen dos posibilidades
para alcanzar este valor estimado de .

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

136

La primera, si la varianza del error () es cero entonces el


total de las variaciones entre individuos serian causados por
los efectos no observados (i) que son constantes en el
tiempo y seran equivalentes a variables instrumentales
(IV).
La segunda, ocurre cuando el nmero de periodos est
creciendo (T). En la medida que el tiempo pase el efecto
no observado se vuelve observado se convierte en una
variable identificadora (no necesariamente una dummy).
4.

Si el parmetro de correccin es igual a uno, =1,


corresponde a un estimador within. Se puede interpretar
como el efecto si la varianza de los trminos de error ()
fuese cero, es decir, el nico efecto existente sera el
componente individual no observado (). En este caso, los
modelos de efectos fijos (FE) y efectos aleatorios (RE) son
indistinguibles.

Suponga, de nuevo, el modelo de regresin RE de pendientes ()


y regresores (xit) existe un intercepto no estocstico () y un
efecto individual no observado (i) que son agrupados como:

Ya calculado el factor de correccin, , el clculo de los


parmetros del modelo de efectos aleatorios (RE) para las
pendientes (RE) y el intercepto (RE) es el siguiente:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

137

=[1 xi]. Las pruebas de consistencia del


Donde wit=[1 xit] y
estimador requieren que toda la muestra crezca NT, es decir,
tanto el nmero de individuos (N) o el tiempo (T)
crezcan infinitamente.
Tambien, con las estimaciones de los trminos de error (it) y los
efectos individuales no observados (i) que se presentaron
anteriormente sobre la regresin OLS del modelo corregido se
tiene que:
Se puede calcular la matriz de covarianzas estimada de la
siguiente forma:

Que corresponde a la varianza por OLS (2XtX) incluyendo el


componente del factor de correccin, , en un modelo
transformado.
Para paneles cortos, ya que existen pocos periodos pero muchos
individuos, se debe tener en cuenta que los trminos de error en
principio se asumen independientes sobre los individuos
pierden esta propiedad de modo que Cov[uit,ujs]=0 con ij
necesita un estimador robusto de la varianza que minimice los
efectos de autocorrelacin y heterocedasticidad y permitan un
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

138

comportamiento general para calcular el error compuesto


(i+it) el cual puede ser determinado de la forma tipo White:

Lo cual arroja una forma modificada de la varianza de los


estimadores incluyendo el tiempo:

it=wit-
y it=it- donde it son los residuos
Donde
calculados del modelo RE. Esta estimacin permite
autocorrelaciones para it, as como heterocedasticidad de forma
arbitraria.
ESTIMACIN OLS PARA UN ESTIMADOR GLS
Para verificar como el estimador FGLS en el modelo de efectos
aleatorios se puede simplificar para convertirse en un estimador
OLS, y de esta forma, sea ms fcilmente calculado
computacionalmente se parte del modelo agrupado, como se
mostr anteriormente:

En primer lugar, se agrupan observaciones de todos los T


periodos para el individuo i-esimo. Posteriormente, se efecta al
igual que para el modelo de efectos fijos la agregacin por
individiuos (se pasa de yit a yi, por ejemplo). Entonces:
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

139

Donde yi, 1T, i y Xi fueron definidas anteriormente y it =[1 ti ].


Para efectuar el proceso de estimacin por GLS, como se observ
anteriormente, es necesario obtener la matriz de covarianzas
individuales, , a partir del vector de trminos de error (1i+i).
Dada la independencia de los efectos individuales no observados
(i) y el componente estocstico (it) se puede calcular el
siguiente valor esperado:
E[(1i+i)(1i+i)t]=E[iit]+E[2i ] .
Puesto que el termino de error,it , es una vaiid distribuida [0, 2 ]
y i es una vaiid distribuida [0, 2 ] se puede obtener la matriz de
covarianzas, , del modelo de la forma:

Donde la matriz Q=IT-(1/T) fue introducida anteriormente


y 2=2 /[2 +T2 ] o el factor de correcin elevado al cuadrado.
Utilizando el hecho que QQt=Q puede ser demostrado que la
inversa de la matriz de efectos individuales corresponde a:
-1=(1/2 )[Q+2(IT-Q)]

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

140

Efectuando la descomposicin espectral sobre -1/2 se puede


llegar a que:

El estimador GLS se obtiene premultiplicando la ecuacin:

Aplicando este procedimiento y efectuando el reemplazo


correspondiente se tiene que:

Donde el factor de correcin equivale a =(1-). Ejecutando


algebra para Wi,1i y i se puede encontrar el siguiente modelo:
El modelo anterior tiene una varianza de 2 IT. Lo anterior
demuestra como el estimador GLS es un estimador OLS con una
versin agrupada del modelo:

Con el escalar que es estimador consistente y comunica las


estimaciones OLS y GLS.
En conclusin, las dos metodologas anteriores son muy similares,
tanto para la estimacin por FGLS como para OLS. Necesitan de
un factor de correccin que para el primero corrige la matriz de
covarianzas. Para el segundo, deriva la misma matriz con los
supuestos de minimos cuadrados ordinarios.
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

141

ESTIMADOR MXIMO VEROSMIL


En la derivacin de las dos metodologas anteriores, los errores
no se asumen normales. Si ellos son normales puede
maximizarse una funcin de verosimilitud con respecto a las
pendientes (), intercepto () y varianzas del componente
aleatorio (2 ) y del componente individual no observado (2 ).
Dadas las varianzas del componente aleatorio (2 ) y del efecto
individula no observado (2 ) el estimador de mxima
verosimilitud (MLE) para las pendientes () y el intercepto ()
es el mismo estimador GLS.
Pero si no se toma este supuesto y se procede a efectuar el
proceso de optimizacin del estimador de mxima verosimilitud
(MLE) el cual arroja nuevos estimadores del componente
2 ) y del componente no observado (2 ) que difieren
aleatorio (

de los estimadores observados anteriormente, como son:

El estimador de mxima verosimilitud (MLE) para las


pendientes () y el intercepto () estn dadas por el modelo:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

142

Con parmetro estimado de correccin, reemplazado por un


estimador alternativo, , que tambin tiene caractersticas de
ser consistente y definido como =1-
/(T
+
)1/2 .
Asintticamente, los estimador MLE y GLS de efectos aleatorios
son equivalentes, pero pueden diferir en muestra finita.
Para el MLE, dadas las caractersticas del modelo, pueden existir
dos mximos locales mejor que uno con 0<21, as que cuando
se analicen los resultados por esta metodologa es necesario
asegurarse de la existencia de un mximo global.
ESTIMADORES PARA EL MODELO DE EFECTOS FIJOS
El modelo de efectos fijos (FE) se puede especificar a travs del
modelo B de la siguiente manera:

Donde los efectos especficos individuales 1,2,,n miden la


heterogeneidad no observada que esta posiblemente
correlacionada con los regresores, X. Es decir, admiten algn tipo
de endogeneidad (E[X]0). Los estimadores de las pendientes,
, son vectores de tamao Kx1 y los trminos de error, it,
distribuidos como vaiid [0,2].
Algunas caractersticas importantes del modelo de efectos fijos:
1. El modelo de efectos fijos (FE) tiene sentido cuando se esta
interesado en el impacto de variables que varen en el
tiempo y entre individuos (Zit).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

2.

3.

4.

143

El modelo de efectos fijos (FE) explora las relaciones entre


el regresor y las caractersticas de un individuo (agente,
empresa, etc.) aprovechando la endogeneidad implcita
dentro del modelo E[Xi]0, o mejor, los E[XU]0.
Al observar una correlacin entre los efectos individuales
no observados (i) y regresores (X) se asume
implcitamente que cada entidad tiene caracteristicas que
pueden tener influencia en la variable dependiente (por
ejemplo, si es hombre o mujer, como efecto no observado,
implica una distinta remuneracin salarial).
Cuando se utilizan el modelo de efectos fijos (FE) se asume
que algunos efectos en el tiempo (WITHIN) en cada uno de
los individuos pueden impactar o sesgar el predictor o
variable dependiente y es necesario controlarla. Este es la
racionalidad del supuesto de correlacin entre los efectos
individuales no observados y los regresores.

El reto en el proceso de estimacin en la presencia de N efectos


individuales especficos (i) incrementa el nmero de individuos
infinitamente (N), es decir, el problema de parmetros
incidentales.
Para propsitos prcticos usualmente el principal inters,
reconociendo la significancia de los efectos individuales
especficos (i), se encuentra en las K pendientes, , las cuales
representan el impacto marginal de un regresor (xit) con
respecto a la variable respuesta, E[yit]/xit, mientras los dems
permanecen constantes.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

144

En este caso, con un panel corto, los N parmetros de efectos


individuales no observados, 1,2,,n, generan el problema de
parmetros incidentales. Su presencia, por tal motivo, impide la
estimacin de los parmetros, , que s son de inters.
Es de observar que existen, para modelos lineales, distintos
caminos a ser estimados los parmetros de las pendientes y
encontrar los efectos marginales por efectos fijos (FE) a pesar
del problema de parmetros incidentales. Estos incluyen:
1. Estimador within o de efectos fijos. Estimaciones OLS a
travs de un modelo within.
2.

Estimador within o de efectos fijos con GLS. Estimar por GLS


en el siguiente modelo within:

3.

Estimador de Primeras Diferencias. Estimar por OLS el


modelo de primeras diferencias:

4.

Estimador condicional de maxima verosimilitud. Estimar por


el mtodo de mxima verosimilitud condicionada sobre las
medias de los individuos yit con i=1,2,.,n.
Estimador LSDV. Estimacin directa por OLS a travs de
variables dummy para cada uno de los N efectos fijos o
estimacin LSDV:

5.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

145

Los dos primeros modelos within siempre conducen al mismo


estimador de los parmetros .
El estimador de primeras diferencias, o tercer modelo, difiere de
los otros para T>2, estas diferencias generalmente no son
tenidas en cuenta en modelos no lineales.
Para el cuarto modelo, dada la condicin de mxima
verosimilitud, es necesario adicionar al supuesto sobre
normalidad de los trminos de error, es decir, it~N[0,2].
El modelo LSDV se puede demostrar que tiene los mismos
resultados que un estimador within.
ESTIMADOR WITHIN O DE EFECTOS FIJOS
El estimador intragrupo (within estimator o WE), a diferencia de
los modelos OLS pooled o estimadores Between.
Especficamente, suponga un modelo de media individual, o
modelo B, de la forma:
Tomando promedios aritmticos sobre el tiempo resulta en el
siguiente modelo:

Sustrayendo de yit el promedio en el tiempo yi resulta en el


modelo within:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

146

En un panel corto, por ejemplo, este estimador mide la


desviacin del individuo i-esimo respecto a los regresores, xit,
sobre sus valores promedio en el tiempo, i, es decir, (xit-i). Este
proceso tambin se efecta para la variable dependiente yit y el
termino de error, it.
Con esta metodologa el trmino de efectos individuales no
observados (i) se cancela.
Este estimador within es calculado por OLS. Un rasgo especial
resulta en estimadores consistes de en el modelo de efectos
fijos (FE), mientras para el modelo OLS agrupado (pooled) o el
estimador entre grupos (BE) no son consistentes.
Es un estimador consistente y eficiente de , si el intercepto que
representa el efecto individual no observado, i , se calcula como
efectos fijos (FE) y el trmino de error estocstico del error
compuesto it son vaiid.
Utilizando un estimador OLS resulta en el estimador within
w de la forma:
(WE) o estimador de efectos fijos

Los efectos individuales, i, pueden ser estimados como un


residuo de la regresin de la forma:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

147

i ) es
La estimacin de los efectos individuales no observados (
i
insesgada y es consistente cuando T puesto que
promedia T observaciones como mejor estimador muestral.
En paneles cortos la estimacin de los efectos individuales no
observados (
i ) es inconsistente, sin embargo, es consistente
w .
para las estimaciones de las pendientes,
En la mayora de investigaciones se juzga a los parmetros
individuales no observados estimados (
i ), como parmetros
auxiliares o problemticos8 (ancillary parameters o nuisance
parameters) ya que en algunos casos no son necesarios en
estudios, y por lo tanto, no necesitan ser consistentemente
estimados.
Adems, esta eliminacin no afecta el proceso de estimaciones
w , que determinan los efectos
consistentes de las pendientes,
marginales de las variables de inters.
debe demostrar
Para la consistencia del estimador within de
la condicin de exgeneidad fuerte:

Esto debe ocurrir si N o T y adicionalmente que:

Sin embargo, estos parametros muchas veces resultan utiles en informacion industrial, laboral, ambiental,entre otros por ejemplo vase
McClellan, M. and Staiger, D. Comparing Hospital Quality at For-Profit and Not-for-Profit Hospitals in The Changing Hospital Industry: Comparing
Not-for-Profit and For-Profit Institutions, (eds.). Cutler, David M. pp.93-112, The University of Chicago Press, 2000. Tambien, Murdock, J. 2006.
Handling unobserved site characteristics in random utility models of recreation demand. Journal of Environmental Economics and
Management,51, 1-25.
8

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

148

Debido a la presencia de promedios, como mejor estimador


mximo verosmil (MV), sobre los regresores = 1/T Tt=1 xit
y en el trmino de error hace que no exista correlacin entre
los trminos de error y regresores de manera contempornea,
E[it|xit]=0.
Una condicin suficiente, adicional a la anterior, para el
cumplimiento de la exgeneidad fuerte radica en incluir no solo
los trminos de error contemporneos y regresores actuales
sino tambin los rezagados, es decir, E[it|xi1,xi2,.,x1T,]=0. Esto
excluye en el estimador within variables rezagas endgenas como
regresores.
Por otra parte, la estimacion de la varianza debe contemplar
como los trminos del error compuesto estn correlacionados en
el tiempo (t) para un individuo dado (i).
Se puede demostrar que los mtodos OLS usuales son aplicables
cuando existe homocedasticidad. Por ejemplo, bajo el supuesto
del trmino estocstico, it , distribuido como una vaiid se tiene
que:

Donde x it = xit-xi . Un estimador consistente e insesgado de la


varianza del trmino de error 2 y calculada como
T

2 =[N(T-1)-K]-1N
it . Donde los grados de libertad son
i=1 t=1

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

149

iguales al tamao de muestra (NT) menos el nmero de


parmetros en el modelo (K) y el nmero de efectos individuales
(N).
Es de observar que si la regresin within de la forma:
Es estimada utilizando OLS a travs de un paquete estadstico
normal o comandos no panel es necesario incrementar el valor
de las varianzas reportadas en un valor [N(T-1)-K]-1[NT-K] para
ajustar la varianza a la autocorrelacin de los errores.
La matriz de covarianza asinttica de un panel robusto
(estimado con errores robustos tipo White), es decir, controla
correlacin y heterocedasticidad, est dado por:

Para paneles cortos con efectos fijos (FE) resulta en una varianza
donde se incluye efectos en el tiempo para periodos
contemporneos (t=s) y no contemporneos (ts) de la forma:

Donde el trmino de error estocstico es it = it-i .


La derivacin matricial es til en trminos de clculo dado el
tamao de las matrices.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

150

Se comenzar con un modelo para los i-esimos individuos de la


forma:

Donde xit y son vectores kx1. Los i-esimos individuos,


agrupando todas las T observaciones tienen la siguiente
estructura matricial:

Tambin pueden ser escritos de la forma:


yi=i1+Xi+i
Donde 1t=[1,1,.,1] es un vector de tamao Tx1 de unos. Xi es
una matriz TxK de T observaciones y K regresores, los vectores
de la variable respuesta, yi, y los trminos de error, i, son de
tamao Tx1.
Es posible transformar el modelo para sustraer la media
individual a travs de las matrices P y Q de tamao TxT. Es decir,
P=(T-1) de manera que Q=IT - P
Premultiplicando la matriz Q crea desviaciones respecto a la
media. Tambin tiene propiedades de ser ortogonal e
idempotente. Ahora premultiplicando el modelo de efectos fijos
por Q se obtiene:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

151

Utilizando el hecho que Q1=0 se elimina el componente de los


interceptos (i1). Este modelo, es equivalente a:
yi-1yit =(Xi-1xit )+(i-1i ).
A partir de esta premultiplicacin por la matriz Q resulta en el
modelo within.

Una estimacin por OLS del modelo de efectos fijos (FE) ajustado
w con una matriz de
por la matriz Q resulta en el estimador
covarianzas, asumiendo independencia de los individuos, igual a:

Si se asume el supuesto que los trminos de error, it, son vaiid,


eliminando
la
posibilidad
de
heterocedasticidad
y
2
autocorrelacin, se puede escribir que [0, ], de modo que su
resultado asume exgeneidad fuerte, es decir, [0,2 I].
El vector Q es entonces independiente sobre los individuos (i) y
el tiempo (t) con media cero y las siguientes propiedades sobre
la varianza:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

152

Entonces:

De modo que el clculo con la varianza asumiendo exgeneidad


fuerte resulta en:

Utilizando el hecho que:

Estimadores alternativos, ms all de la exgeneidad fuerte,


pueden ser utilizados con una visin ms general. En particular,
el supuesto de no correlacin serial sobre los trminos de error,
it, utilizado anteriormente, puede ser relajado.
Si el termino de error, i, es vaiid [0,] se utiliza una forma ms
general para la matriz de covarianzas con la correccin por la
matriz Q, o de desviaciones respecto a la media, asumiendo que
no existe correlaciones entre individuos, es decir, [Qi, Qj] para
ij.
La varianza V[Qj] se reemplaza por los (Qi )(Qi )t donde
w . Esto resulta en la estimacin dada por:
i =yi-Xi
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

153

El WE tiene varias interpretaciones y caractersticas a ser


trabajadas, entre ellas:
1. Este procedimiento se focaliza en la literatura que trata los
efectos individuales no observados como parmetros
incomodos que pueden ser ignorados dado que el principal
inters se encuentra en las pendientes () y sus efectos
marginales.
2. El estimador Within utiliza una estructura de covarianzas
que toman desviaciones respecto a los promedios de media
individual, lo que es equivalente a tomar residuos de la
regresin de yit y xit sobre dummies individuales y trabajar
con los residuos.
3. La principal limitacin del estimador WE radica en los
coeficientes de los regresores invariantes en el tiempo
(xit=xi) que no pueden ser identificados, entonces son
omitidos, es decir, (xit-i)=0. Varios estudio, por ejemplo,
buscan estimar el efecto de regresores invariantes en el
tiempo, xi. Regresiones sobre paneles de salarios se puede
estar interesados en efectos de gnero o raza, por esta razn
se prefiere no utilizar el estimador WE.
4. Estimaciones agrupadas (pooled) o efectos aleatorios (RE)
tienen, en algunos casos, mejores resultados estadisticos,
pero estos estimadores son inconsistentes si el modelo de
efectos fijos (FE) es el adecuado.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

154

ESTIMADOR WITHIN O DE EFECTOS FIJOS POR GLS


Suponga el modelo within transformado respecto a su
desviacin a la media (premultiplicado por la matriz Q), de la
forma:

Puede ser estimado por FGLS. Si los trminos de error, it, son
vaiid [0,2 ] no existen muchas ganancias estadsticas utilizando
GLS, lo recomendable es trabajar por OLS.
Pueden existir ganancias si otros modelos son asumidos para la
distribucin de los trminos de error, it. Existen situaciones
donde puede limitarse OLS para su utilizacin, como datos
multinivel.
Por ejemplo, en investigacin en educacin se podra requerir
medir el rendimiento de colegios que utilizan un mtodo de
aprendizaje contra colegios que usan uno diferente.
Sera un error analizar estos datos pensando que los estudiantes
son muestras aleatorias simples de la poblacin de estudiantes
que aprenden bajo un mtodo particular y que no estn
correlacionadas a travs del tiempo. Los alumnos son agrupados
en clases (cursos), los cuales a su vez son agrupados en colegios.
El desempeo de los estudiantes dentro de una clase est
correlacionado, como el desempeo de los estudiantes dentro de
la misma escuela y el tiempo con el programa implementado.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

155

Para observar el ejemplo anterior a travs de un modelo panel


de efectos fijos (FE) utilizando OLS no es posible, es necesaria
una nueva estructura de correlaciones, y por tanto, una matriz
de covarianzas, entre periodos e individuos como metodologa
para incorporar correlaciones temporales y datos anidados, es
decir, implementar GLS o FGLS.
La aproximacin es esencialmente la misma para GLS pooled sin
efectos fijos donde se pone de manifiesto su relacin con el
estimador RE.
Observese que Qi es independiente de Qj con ij y
V[Q2 ]= 2 Q, as que el estimador de efectos fijos con GLS, visto
como una generalizacin del OLS, se puede escribir en forma:

Para efectuar este procedimiento, en los FE los efectos


individuales no observados fueron eliminados. Esto ltimo
conduce a que el trmino de error Qi sea de rango menor al
completo.
Si no se cuenta con rango completo y se necesita calcularla la
metodologa de trabajo se orienta a la utilizacin de la inversa

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

156

generalizada o inversa de Penrose9, Q-, que es utilizada como Q


ya que no es de rango completo10.
ESTIMADOR EN PRIMERAS DIFERENCIAS
El estimador en primeras diferencias (FDE), al igual que el
estimador within explota rasgos especiales de los datos panel.
En un panel corto mide la asociacin entre cambios dentro de los
individuos durante un periodo en los regresores, xit, y la variable
dependiente, yit.
Especificamente, suponga el modelo:
Rezangando un periodo se tiene que:
Sustrayendo una de la otra, se tiene el modelo de primeras
diferencias:
El intercepto del modelo, i, se cancela, al igual que en el modelo
within.
El estimador en primeras diferencias (FDE) utiliza en su proceso
de estimacin una metodologa OLS. Al igual que el estimador
within, es consistente en un modelo de efectos fijos (FE), aunque
los coeficientes invariantes en el tiempo de los regresores, xi, no
son identificados.
Sea A una matriz cuadrada o rectangular, se dice que una matriz G es una g-inversa (o inversa generalizada) de A cuando AGA=A . Naturalmente
que G ha de ser de tipo nm en el caso de ser A del tipo mn . Si A es cuadrada e invertible, entonces es fcil comprobar que la inversa A1 es (la
nica) g-inversa de A , de manera que el concepto de g-inversa es una generalizacin del concepto de inversa
10 Sin embargo, QtQ-Q=QtQ puesto que QtQ-Q=Q, para una inversa generalizada, y Q=QQt dado que Q es idempotente. Reemplazando QtQ-Q=Q por
w,GLS .
QtQ en la frmula anterior de estimacin
9

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

157

El estimador FDE es menos eficiente que un estimador WE para


T>2 si los trminos de error, it son considerados como una
vaiid.
Una estimacin OLS efectu el estimador de primeras diferencias
de la forma:

Obsrvese que existen N(T-1) observaciones en esta regresin


ya que se perdi una en el proceso de diferenciacin11.
La consistencia del estimador de primeras diferencias requiere,
nuevamente el supuesto de exgeneidad fuerte o estricta visto
como E[it-i,t-1|xit-xi,t-1].
Esta condicin es fuerte e implica que los trminos de error y de
los regresores de forma contempornea son iguales a cero, es
decir, E[it|xit]=0, pero es una condicin ms dbil que la
condicin de exogeneidad fuerte impuesta para la consistencia
del estimador within ya que para este ltimo impone
exgeneidad fuerte para efectos contemporneos y no
contemporneos, es decir E[it|xi1,xi2,.,x1T,]=0.
La inferencia asinttica del estimador de primeras diferencias
requiere ajustar los errores estndar calculados por OLS para
tener en cuenta las correlaciones en el tiempo de los trminos de
error i = (it-i,t-1).
. Un error comn en esta implementacin radica en agrupar las NT observaciones, posteriormente substraer el primer rezago. Entonces la
observacin (1,1) es borrada mientras todas las T primeras observaciones (i,1), i=1,2,,N deben ser borradas despus de diferenciar. Deben ser
borradas todas las primeras observaciones de la muestra.
11

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

158

Como primer paso de inferencia asinttica es necesario obtener


FD . Para lo anterior, se
la varianza asinttica del estimador
agrupan las observaciones de los individuos de la siguiente
manera:
Donde para cada individuo i-esimo el modelo tiene yi como un
vector (T-1)x1 de variables dependientes y variables
ti ) como una matriz (T-1)xK y calculados los
explicativas (
regresores como la diferencia entre los periodos
(xi2-xi1)t(xiT-xiT-1)t.
Tiene una matriz de covarianzas, asumiendo independencia
entre los individuos como:

El supuesto bsico radica en asumir que los trminos de error


estocastico, it, son vaiid [0,2 ] o asume exgeneidad fuerte. Con
lo anterior, se calcula la diferencia rezagada del trmino de
error, es decir i =(it-i,t-1) y se identifica como un proceso de
media mvil con un rezago, MA(1), con varianza 22 y un
periodo separado por autocovarianzas 2 para los individuos.
De lo anterior se concluye que V[2 ] es igual a 2 multiplicado
por una matriz (T-1)x(T-1) con un valor de dos en la diagonal y
uno fuera de la diagonal.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

159

Un supuesto ms realista radica en asumir los trminos de error,


it, estn correlacionados en el tiempo para un individuo
i-esimo, de modo que COV[it,it]0 para ts, pero
independiente entre individuos.
Para calcular esta premisa en necesario hallar un estimador que
sea ms robusto y permita formas ms generales de
autocorrelacin y heterocedasticidad como:

En esta forma general se reemplaza la varianza estimada, V[2 ],


por (i )t(i ).
Es importante resaltar que no se puede utilizar OLS para estimar
los trminos de error estndar del modelo de primeras
diferencias ya que estos slo son correctos en el improbable caso
que los trminos de error, it, sean un paseo aleatorio de modo
que (it-it-1) son vaiid.
Para el caso de dos periodos (T=2) las primeras diferencias y el
estimador within son iguales. Para demostrarlo suponga el caso
de un modelo de primeras diferencias de la forma:

Analizando nicamente la variable dependiente con dos


periodos (T=2) se tiene que la diferencia (yi1-yi2) es el valor en
primeras diferencias de la variable.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

160

Ahora suponga un modelo within de la forma:


Al igual que el modelo anterior con dos periodos (T=2) se tiene
que:
(y +y )
(y y )
(y y )
yi= i1 2 i2 as que (yi1-yi)= i1 2 i2 y (yi2-yi)= i1 2 i2
Pero (yi1-yi2)=(yi1-yi)-(yi2-yi) lo cual coincide con el estimador de
primeras diferencias. De forma similar aplica para los regresores
x.
Para valores superiores a dos periodos (T>2) los dos
estimadores difieren. Bajo el supuesto que it son vaiid se puede
demostrar que el estimador GLS de primeras diferencias es igual
al estimador within.
FD calcula los parmetros del modelo por OLS. Sin
El estimador
W . Por esta razn el estimador
embargo, es menos eficiente que
en primeras diferencias no es mencionado o trabajado en
modelos lineales. Es utilizado extensivamente cuando variables
rezagadas son incluidas en modelos panel, por ejemplo, paneles
dinmicos o no lineales.
W ) se convierte en
En estos casos el estimador within (
inconsistente, aunque el estimador de primeras diferencias es
inconsistente permite a travs de supuestos de exgeneidad
dbil realizar estimacin por variables instrumentales (IV).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

161

ESTIMADOR CONDICIONAL DE MAXIMA VEROSIMILITUD


La estimacin de mxima verosimilitud condicionada maximiza
la funcin de verosimilitud conjunta de y11,.,yNT condicionada
sobre los promedios individuales y1, y2,.., yNT. Este mtodo tiene
el atractivo que para modelos paneles lineales, y bajo
normalidad, los efectos fijos, i, son eliminados de modo que el
proceso de maximizacin es nicamente con respecto a los
parmetros de las pendientes, .
Suponga que yit est condicionada sobre los regresores xit y los
parmetros i, y 2 son vaiid con distribucin normal
t
N[i+ it
,2]. Entonces la funcin de verosimilitud condicionada
es:

La primera igualdad define la verosimilitud condicionada


asumiendo independencia sobre los individuos (i). La segunda
igualdad demuestra que es una distribucin de probabilidad
condicionada sobre los promedios de la variable dependiente, y.
La tercera desigualdad plantea la funcin de verosimilitud bajo
normalidad a ser maximizada.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

162

El resultado clave radica en que para efectos fijos el parmetro


de intercepto, , no aparece en la ecuacin final de modo que
LCOND( ,2, i) es de hecho, LCOND(,2) y puede ser maximizada
el logaritmo de la funcin de verosimilitud condicional con
respecto a ,2 nicamente.
El resultado del estimador de mxima verosimilitud
CML resuelve las condiciones de primer orden
condicionada
(CPO) de la forma:

O de forma equivalente:

Sin embargo, estas son las mismas condiciones para una


regresin OLS de (yit-yi) sobre (xit-xi). El estimador condicional
CML , por lo tanto, es un
por mxima verosimilitud condicional
w .
equivalente de un estimador within,
Intuitivamente, este mtodo arroja estimadores consistentes
porque la funcin condicionada sobre el promedio de la variable
dependiente a travs del tiempo elimina los efectos individuales
no observados (i).
Ms formalmente, yi es un estadstico suficiente para i y
condicionado sobre un estadstico suficiente que permite
estimaciones consistentes de .
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

163

ESTIMADOR DE MNIMOS CUADRADOS DE VARIABLES FICTICIAS


(LSDV)
Una variacin de los modelos B o C permiten estructurar
variaciones a travs de los individuos y en el tiempo mientras las
t
pendientes permanecen constantes. Entonces, yit=i+t+ it
+uit
o el modelo a estimar de otra manera es:

Donde las N dummies individuales dj,it son iguales a uno si el


individuo (i) es igual al intercepto (j), o mejor (i=j), e igual a
cero si son diferentes, (ij).
Las (T-1) dummies temporales ds,it son iguales a uno si el
periodo (t) es igual al rezago (s), o mejor (t=s), e igual a cero si
t
son diferentes, (ts). Se asume que it
no incluyen intercepto.
Este modelo tiene N+(T-1)+dim[x] parmetros que pueden ser
estimados consistentemente si N y T
) el anlisis se puede
Si se utilizan en paneles cortos (N y T
dividir en dos partes. La primera, los parmetros de efectos no
observados para los individuos (i) implica un desafo dentro de
este proceso de estimacin, ya que es necesario calcular los
para N interceptos individuales (i), debido a que al ser un panel
corto se busca identificar diferencias para una gran cantidad de
individuos (N).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

164

En algunos casos resolver este problema implica tener dummies


individuales para grupos de observaciones, por ejemplo, regin,
ciudad, etc.
La segunda, si se desea efectuar un anlisis two way, los
parmetros de rezago (t) pueden ser consistente estimados de
modo que las (T-1) dummies son incorporadas dentro de los
t
regresores it
.
Considere el modelo original de efectos fijos de la forma:
Antes de cualquier diferenciacin. Un anlisis por OLS puede ser
aplicado directamente al modelo, simultneamente estimando
y . En principio no es necesaria una metodologa especial.
Simplemente se estima yit sobre xit y un conjunto de N variables
indicadoras d1,it,.,dN,it donde dj,it es igual a uno si i=j e igual a
cero en otra parte.
Sin embargo, como N crece existen demasiados regresores para
permitir la inversin de la matriz X de tamao (N+K)(N+K),esta
es otra caracterstica del problema de parmetros incidentales.
Con algn tratamiento matricial el problema se reduce a la
inversa de una matriz KxK.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

165

El estimador resultante de por LSDV es igual al estimador


within. Este es un caso que aplica el teorema Frish Waugh12 para
un subconjuto de una regresin y derivar los parametros.
Si las variables dummy estn particionadas en la regresin y si
los residuos de esta regresin son utilizados en un segundo
estado de la regresin, entonces es posible estimar la regresin
completa. Pero los residuos generados son desviaciones de sus
respectivas medias, es decir, una regresin within.
Para observarlo algeraicamente, agrupe un vector TxQ sobre los
N individuos para resultar en el modelo de efectos fijos por
variables dummy de la forma:

Tambin pueden ser escritos de la forma:

12

Supongamos que se particiona una matriz X, cuyo rango es k, en dos matrices X1 y X2, cuyos rangos son respectivamente r y kr, de manera que:

Para obtener la frmula del estimador OLS resulta til dividir las ecuaciones normales XtX= Xty

Este sistema puede resolverse en dos etapas. Primero obteniendo una expresin para 2 de la forma
primera
ecuacin
permite obtener
Agrupando
trminos

se

puede

Sustituyendo en la
obtener
que

Cuya solucin es
Que resulta ser es el estimador:
La matriz M2 es idempotente y simtrica por lo que:
Y
Es una matriz de
residuos de la regresin de X1 en las variables X2. De igual manera
Por lo tanto, 1 es el conjunto de coeficientes que se
obtienen cuando los residuos de una regresin de y en las variables de X 2 se regresan a su vez en el conjunto de residuos obtenidos cuando cada
variable de X1 se regresa en las variables de X2.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

166

Donde y es un vector de tamao NTx1, el producto Kroneker


(IN1T) es una matriz NTxN de bloques diagonales y X es una
matriz de tamao NTxK de regresores.
La estimacin OLS de este modelo resulta en el estimador de
mnimos cuadrados de variables ficticias (LSDV). Desde un
punto de vista algebraico de la forma:

=[x1, xN]t, xi=


Donde la matriz de medias muestrales X
=[y1,, yN]t yi= (1/T) Tt=1 yi . Utilizando la
(1/T) Tt=1 xi , Y
frmula de inversas particionadas y ejecutando el algebra
conduce a que:

Reexpresando la forma anterior en trminos de sumatoria


implica que el estimador por variables dummy es igual al
LSDV =
W . En ambos modelos
estimador within, es decir,
converge al siguiente estimador:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

167

Este mismo anlisis puede ejecutarse para las estimaciones de


efectos observados entre los estimadores de mnimos cuadrados
por variables dummy (LSDV) y el estimador within, es decir,
LSDV =
W . En ambos modelos converge al siguiente estimador:

Para paneles cortos un problema radica, al igual que para el


estimador within, en como las estimaciones consistentes de y
no garantizan que existan N+K parmetros a estimar en la
medida que N.
Es de observar que las estimaciones consistentes de es posible
aunque sea inconsistentemente estimados, a menos que T.
Este estimador es eficientemente en su segundo momento si it
son vaiid [0,2]. Resulta en el estimador within de es ms
eficiente que estimadores alternativos que eliminan i, tales que
substraen la primera observacin o periodo previsto de
observaciones.
Si adicionalmente los errores son normalmente distribuidos, el
estimador LSDV es igual al estimador por maxima verosimilitud
por la equivalencia usual de OLS y MLE en modelos lineales con
errores normales.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

168

MODELOS DE EFECTOS FIJOS Y ALEATORIOS


Sea el modelo one way, de un factor o de media individual
(individual specific effects model) para una variable dependiente
escalar, yit, la cual permite a cada unidad de corte transversal
tener interceptos diferentes (i), aunque todas las pendientes
() sean las mismas el cual se representa como:
Donde xit son los regresores, i es el intercepto individual (i), it
es el termino de error estocstico definidos como vaiid sobre
individuos (i) y tiempo (t).
Una atraccin de los datos panel radica en la posibilidad de
ejecutar estimaciones consistentes de los parmetros al permitir
heterogeneidad individual no observada que puede estar
correlacionada con los regresores conocida como modelo de
efectos fijos (Fixed Effects o FE). Con esta propiedad los
trminos de error pueden estar correlacionados con los
regresores xit y permite una forma limitada de endogeneidad.
La forma de expresar el modelo B o C en trminos de una
metodologia de estimacin de efectos fijos (FE) parte de utilizar
dummies y consideradas como parte del intercepto para
individuos (i) y tiempo (t) e incluirlas en los regresores xit a ser
estimados por el mtodo de LSDV o eliminar los interceptos para
cada individuo, i, de este modo, asegura la consistencia del
estimador en un panel corto (within).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

169

Bajos otros supuestos y escenarios de trabajo el tratamiento de


la heterogeneidad individual no observada asume una
distribucin independiente de los regresores y trminos de error
(exogeneidad fuerte) vistos en los Efectos Aleatorios (Random
Effects).
En este caso, si los interceptos para cada individuo, o efectos
individuales no observables (i), son variables aleatorias que
estn distribuidos independientemente de los regresores (xit) y
pueden capturar la heterogeneidad no observada13,
explcitamente asume que no existe correlacin entre
observaciones y trminos de error (supuesto de exgeneidad
fuerte o exgeneidad estricta14) en el proceso de estimacin de
un modelo de efectos aleatorios (RE) las dummies hacen parte
del trmino de error afectando la estructura de la matriz de
covarianzas, y por tanto, el mtodo de estimacin que utilizar
metodologas FGLS .
En el modelo de efectos aleatorios (RE) los trminos de error, it,
se asumen vaiid sobre el modelo:
Es decir, en RE:
De este modo, el trmino de error asume media cero
condicionada sobre valores presentes, pasados y futuros de los
regresores, xit.
La heterogeneidad observada se refiere a diferencias entre individuos que son medidas a travs de los regresores, y no observada se refiere a
otras diferencias no capturadas. En presencia de heterogeneidad no observada incluso individuos con los mismos valores de todas las variables
independientes pueden tener peligro de encontrarse en un estado determinado.
14 Bajo condiciones ms flexibles, como exogeneidad dbil permite incluir variales rezagadas en un modelo panel.
13

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

170

El modelo de efectos aleatorios (RE) usualmente hace el


supuesto adicional que:
Obsrvese que no existe una distribucin de probabilidad
especfica para los interceptos (i) y trminos de error (it).
En el caso que los efectos fijos (FE) estn presentes y
correlacionados con los regresores, xit, entonces los estimadores
minimo cuadrticos asociados, es decir, estimaciones OLS para
los modelos agrupados (pooled) y de efectos aleatorios (RE) son
inconsistentes.
Comparando el modelo de efectos fijos (FE) con el supuesto de
endogeneidad entre regresores y trminos de error tiene la
ventaja de permitir estimaciones consistentes de parmetros,
incluyendo coeficientes que no varan en el tiempo pero
excluyendo aquellos que varian entre individuos.
TABLA EFECTOS FIJOS Y EFECTOS ALEATORIOS

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

171

TABLA. ESTRATEGIAS DE ESTIMACIN DE DATOS PANEL


Estimacion de
Agrupado/pooled
Between
Within
Primeras diferencias
Efectos aleatorios

Agrupado o Pooled
Consistente
Consistente/ineficiente
Consistente
Consistente
Consistente

MODELO
Efectos aleatorios
Consistente/ineficiente
Consistente/ineficiente
Consistente
Consistente/ineficiente
Consistente/ineficiente

Efectos fijos
Inconsistente
Inconsistente
Consistente
Consistente
Inconsistente

Con lo anterior se pueden identificar varias caractersticas y


diferencias entre efectos fijos (FE) y efectos aleatorios (RE):
1. Las propiedades estadsticas de los paneles de datos varan
con el tratamiento de los efectos no observados. Por ejemplo,
si el supuesto de efectos aleatorios, o independencia entre
regresores y trminos de error (exgeneidad fuerte o
estricta), no puede ser soportado por los datos a travs de
las pruebas de hiptesis correspondientes, esta es la
principal razn para la eleccin del modelo de Efectos Fijos
(FE) como punto de partida.
2.

El modelo de efectos fijos tiene el atractivo al permitir


establecer relaciones de causalidad bajo supuestos ms
dbiles que las que se necesitan para establecer la relacin
de exogeneidad con datos de corte transversal o con
modelos de datos panel sin efectos fijos, como los modelos
agrupados (pooled) y modelos de efectos aleatorios.

3.

Los supuestos de exgeneidad fuerte en efectos aleatorios


(RE) excluyen modelos con variables dependientes
rezagadas o variables endgenas como regresores15.

15

Chamberlain (1980) ofrece una discusin detallada de los supuestos y pruebas de exogeneidad para datos panel.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

172

4.

Los nombres efectos fijos (FE) y efectos aleatorios (RE) son


potencialmente engaosos ya que su principal diferencia
radica desde el punto de vista de la exgeneidad entre los
regresores, xit, y el termino error, it. El efecto individual
visto como regresor (i) o por medio de la modificacin de
los trminos de error (i) es una variable aleatoria con
caractersticas iguales para los modelos FE y RE.

5.

Para el calculo de los parmetros, , en FE o RE parten del


principio de una forma lineal16:

E[yit|i,xit]= i+xit
El efecto especfico individual i es una variable aleatoria,
como se afirm en el punto anterior, para ambos modelos.
En paneles cortos, los mas utilizados, no puede ser
consistentemente calculados, por las limitaciones en el
nmero de observaciones.
De este modo, no es posible estimar E[yit|i,xit]
directamente. Para solucionar esta dificultad es posible
transformar i tomando expectativas con respecto a xit, es
decir, condicionando sobre los regresores a la ecuacin, de
la forma:

E[yit|i,xit]= i+xit

16

Se acoge por este caso la notacin de Wooldridge (2002).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

173

Para el modelo de efectos aleatorios (RE), la exgeneidad


entre regresores y trminos de error permite afirmar que
E[i|xit]=, de este modo, E[yit|xit]=+xit y es posible
identificar E[yit|xit].
En el modelo de efectos fijos (FE) E[i|xit] varia con respecto
a xit, dado el supuesto de endogeneidad entre regresores y
trminos de error, por tanto, no es conocido su valor y su
variacin.
As las cosas, en FE no es posible identificar E[yit|xit], sin
embargo, es posible consistentemente estimar en paneles
cortos y calcular los efectos marginales:
El pronstico, relacionado con el valor marginal de los
parametros, de la media condicional no es posible. En lugar
de ello, slo cambios en la media condicional causados por
regresores variables en el tiempo se pueden pronosticar.
6.

En paneles cortos el modelo FE permite nicamente la


identificacin de efectos marginales E[yit|ci,xit]/xit para
regresores que varan en el tiempo, de modo que regresores
que varian sobre los individuos como raza o gnero, por
ejemplo, no son identificados. En el modelo RE permite la
identificacin de todos los componentes de y E[yit|xit],
pero el supuesto de E[ci|xit] como una variable constante y
exgena es dbil frente a aplicaciones realistas.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

174

7.

En el modelo de efectos aleatorios (RE) las estimaciones de


los componentes de la varianza por individuos (i) o
periodos (t) asumen el mismo intercepto y pendiente para
todos. La heterogeneidad no observada se representa en el
trmino de error y no debera estar correlacionada con los
regresores. La diferencia entre individuos (i) y periodos (t)
se presenta en la varianza de los trminos de error, no en
los interceptos. Un modelo RE es estimado por GLS cuando
la matriz de covarianzas entre grupos es conocida. El
FGLS se utiliza cuando es desconocida, en la mayora de
los casos.

8.

Los coeficientes de efectos fijos de los regresores variables


en el tiempo (xt) son estimables pero pueden ser muy
imprecisos si la mayor parte de la variacin en un regresor
corresponde a la seccin transversal en lugar del tiempo. Es
decir, la variacin between es mayor a la variacion within.

9.

Incluso coeficientes de los regresores variables en el tiempo


pueden ser difciles o tericamente imposibles de identificar
en modelos no lineales con efectos fijos. Por estas razones,
tambin se utilizan modelos de efectos aleatorios, aunque la
interpretacin causal puede ser entonces injustificada.

10. La estimacin de efectos fijos es un anlisis condicional, ya


que mide el efecto de xit sobre yit controlados en algun
sentido por el efecto individual no observado (i). La
estimacin de efectos aleatorios es en cambio un ejemplo de
anlisis marginal ya que los efectos individuales se integran
como vaiid.
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

175

11. Si el verdadero modelo es efectos aleatorios y se desea


realizar un analisis condicional o anlisis marginal variar
con la aplicacin. Si el anlisis es para una muestra aleatoria
de pases entonces se utilizar efectos aleatorios. Si
intrnsecamente se est interesado en pases en particular
en la muestra parte de efectos fijos y ser la eleccin.
Aunque esto puede implicar una prdida de eficiencia en la
estimacin.
12. Si el modelo verdadero tiene efectos individuales
especficos (i) correlacionados con regresores (xi) un
anlisis de efectos aleatorios no es significativo ya que el
estimador es inconsistente. En cambio, estimadores
alternativos de efectos fijos (within-LSDV) y primeras
diferencias son necesarios. Debido al deseo de determinar la
relacin de causalidad aplicaciones se enfatizan estos
ltimos estimadores.
13. El enfoque de efectos fijos puede ser interpretado como
aplicable a grupos considerados en el estudio, pero no a
incluidos en la muestra. Cuando grupos son extracciones
muestrales de una poblacin ms grande, puede resultar
apropiado considerar que los efectos individuales no
observados estn aleatoriamente distribuidos y es aplicable
un modelo de estimacin de efectos aleatorios (RE).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

176

ESTRATEGIA DE ANLISIS PANELES DE DATOS.

INFERENCIA ESTADSTICA DE PANELES CON ESTIMADOR DE


ERRORES ROBUSTOS
Varios modelos de datos panel incluyen trminos de error
denotados por uit, it y i. En algunos escenarios es razonable
asumir la independencia sobre los individuos (i).
Sin embargo, los trminos de error potencialmente pueden ser
serialmente no correlacionados (correlacionados sobre el
tiempo, t, y para un individuo dado, i) y/o heterocedasticos. Para
encontrar una inferencia estadstica valida requiere controlar
ambos de estos factores.
Los estimadores consistentes por heterocedasticidad de White17
son fcilmente extensibles a paneles cortos puesto que para la iEste estimador propuesto por White (1980) reconoce que en los errores de los modelos de regresin lineal pueden ser heterocedasticos, y
propone efectuar una correccin que calcula los residuos del modelo de la siguiente forma:
17

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

177

esima observacin la matriz de varianza del error es de


dimensin finita TxT mientras N.
De esta forma, errores estndar robustos para datos panel
pueden ser obtenidos sin asumir formas funcionales especficas
dentro del error individual (within individual) o
heterocedasticidad. El estimador ms eficiente utiliza el mtodo
generalizado de momentos (GMM)18
Es importante observar frecuentemente y con cuidado los
comandos de datos panel en programas de cmputo donde
calcula por defecto el trmino de error asumindolos como una
vaiid conduciendo a inferencias errneas.
En particular, la regresin OLS agrupada (pooled) de yit sobre xit
sin control de los efectos individuales es muy probable que tenga
alguna correlacin en los trminos de error en el tiempo,
COV[uit,uis]>0 para ts.
Ignorando esta correlacin serial puede conducir a varianzas
ms pequeas, y por tanto, sobreestimar los t estadsticos.

Son conocidos como heteroskedasticity-robust standard error.


18 El mtodo generalizado de los momentos (GMM) es un instrumento de estimacin de parmetros estadsticos la cual bajo supuestos no muy
restrictivos, son consistentes y con funciones de distribucin fcilmente calculables. Los mnimos cuadrados ordinarios, mnimos cuadrados
generalizados, estimacin en dos etapas e incluso (bajo algunos supuestos adicionales) mxima verosimilitud, pueden ser considerados casos
particulares de GMM. Otra de las caractersticas del mtodo es que no requiere la especificacin de una forma particular de distribucin de las
variables aleatorias involucradas en el modelo que se estudia. A pesar de estas cualidades, las propiedades de los estimadores obtenidos por el
mtodo generalizado de los momentos no son siempre buenas en muestra pequeas.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

178

ERRORES ESTNDAR EN PANELES ROBUSTOS TIPO SNDWICH19


En algunos casos es posible efectuar transformaciones sobre los
modelos de datos panel para encontrar una forma comn de
tratamiento. Por ejemplo, despus de las transformaciones
correspondientes se puede construir los estimadores de un
modelo de datos panel estndar que pueden ser obtenidos por
un estimador OLS con un vector de parmetros, , en una
regresin agrupada (pooled), de la forma:

Diferentes estimadores de datos panel, pooled, WE, FDE, RE,


pueden ser ajustados para encontrar la forma funcional estndar
anterior. Con este objetivo, se utilizaran diferentes
transformaciones, segn el caso, de la variable dependiente, it,
it y el trmino de error, it, segn el caso. Por
regresores,
ejemplo:
1. Estimador agrupado (pooled). Es el caso ms simple, de un
modelo OLS agrupado (pooled) y no es necesaria ninguna
transformacin y =[,]
2. Estimador WE. Para el estimador en el grupo (WE) realiza
las transformaciones para encontrar la forma estndar
sobre la variable dependiente, it =(yit-i) y los regresores
i). Los regresores que permanecen son aquellos
it=(xit-

que varan en el tiempo, por tanto, el vector de parmetros,


, del modelo estndar est conformado por los coeficientes
que varan a travs del tiempo.
Un estimador tipo sndwich hace referencia al relajamiento de supuestos a travs de las observaciones para ser independientes a travs de los
clusters de las observaciones. Su nombre se debe a que los trminos de error estimado, e j, se encuentra entre las matrices (XtX)-1, las cuales a
medida que el tamao de muestra crece comprimen el tamao de los termos de error estimado, e j,.
19

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

179

3.

Estimador de primeras diferencias (FDE). Para el estimador


FDE, realiza las transformaciones para encontrar la forma
estndar sobre la variable dependiente, it =(yit-yi,t-1) y los
it=(xit-xi,t-1), y de nuevo, los regresores que
regresores
permanecen son aquellos que varan en el tiempo, por tanto,
el vector de parmetros, , del modelo estndar est
conformado por los coeficientes que varan a travs del
tiempo.
4. Estimador de efectos aleatorios (RE). Para el estimador de
efectos aleatorios, realiza las transformaciones para
encontrar la forma estndar sobre la variable dependiente,
it=(xit-i,t) y el vector de
yit =(yit-yi,t) y los regresores
parmetros, =[,].
Esta metodologa es conveniente para agrupar observaciones
sobre periodos de tiempo para individuos, conduciendo a un
modelo de la forma:

i, es de tamao Tx1,
Donde el vector de variables dependientes,
excepto para el estimador de primeras diferencias (FDE) que es
i es una matriz Txq o, para el
(T-1)x1 y para los regresores,
modelo de primeras diferencias (FDE) una matriz (T-1)xq.
Tambin es til para agrupar individuos de la forma:

Los modelos pueden ser estimados por OLS. Sin embargo,


efectuadas las transformaciones correspondientes, pueden
incluir correlacin serial de igual manera que si fueran los
modelos iniciales con los errores subyacentes que estn
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

180

correlacionados. El estimador por OLS del vector de parmetros


, tiene la siguiente expresin:
del modelo transformado,

Para el caso del estimador de primeras diferencias (FDE) la


suma de los periodos ser la suma desde t=2 a T. En este caso
tambin es necesario considerar la consistencia del estimador,
obsrvese que si el modelo est correctamente especificado
entonces el lgebra usual de OLS resulta en

Dada la independencia sobre los individuos (i) la condicin


esencial para la consistencia radica en la independencia de los
i,
i]=0. Este requiere un
regresores y el trmino de error, E[
puesto de exogeneidad fuerte entre los regresores y el termino
OLS
i|
i]=0 . La varianza asinttica de
de error de la forma, E[
es de la forma:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

181

Dada la independencia de los errores sobre los individuos la


OLS] en este modelo de datos
estimacin es consistente para V[
panel transformado es anlogo al problema de corte transversal
OLS] que sean
de obtener estimadores consistentes de V[
robustos a la heterocedasticidad de una forma conocida.
Esto conduce a estimadores panel robustos de la matriz de
varianza asinttica del estimador OLS agrupado (pooled) del
modelo transformado que puede controlar tanto la correlacin
serial y la heterocedasticidad, de la forma:

OLS] asume independencia


[
i =
i=i-Wi. El estimador V
Donde
sobre los individuos y ellos se encuentra creciendo, N, caso
representativo de los paneles cortos, de otro modo permite que
a varianza de los errores, V[uit], y si covarianza, Cov[uit,uis],
vare con los individuos (i) y dos periodos de tiempo t y s. Una
OLS] es la siguiente20:
[
reexpresin del estimador V

. Este estimador tambin fue propuesto por


it
it =it-
Donde
Arellano (1987) para el estimador de efectos fijos.

OLS] pueden utilizar estimaciones por OLS y ajustarles una metodologa de


[
En STATA los errores estndar de panel robustos calculados por V
trminos de error con cluster robusto seleccionadon individuos como variable de cluster.
20

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

182

ERRORES ESTNDAR POR EL MTODO DE BOOTSTRAP21


El mtodo de bootstrap proporciona un camino alternativo para
obtener errores estndar panel. El supuesto clave parte de
asumir las observaciones independientes sobre los individuos
(i), por lo que el mtodo efecta un procedimiento de
remuestreo con el remplazamiento sobre los individuos (i) y
utiliza todos los periodos de tiempo observados para un
individuo (i) dado.
Los datos {(yi,Xi)|i=1,,N} resultan en muestras pseudoaleatorias y para cada muestra ejecuta una regresin OLS de it
it B veces, por tanto al final del proceso cuenta con B
sobre
b , b=1,2B.
estimadores
El estimador de datos panel por bootsrtap calcula la matriz de
varianzas y covarianzas

=B-1Bb=1
. Este mtodo no proporciona refinamiento.
Donde
Dada la independencia sobre los individuos (i) el estimador es
consistente en la medida que los individuos crezcan, N.
OLS] y exactamente
[
Es asintticamente equivalente a estimar V
igual al caso de corte transversal y asintticamente equivalente
al estimador de heterocedasticidad consistente de White.

Es un mtodo de simulacin por remuestreo (resampling) que esencialmente es un experimento de simulacin de Montecarlo donde la muestra
observada es tratada como la poblacin. En otras palabras, cada iteracin, de tamao N, efectua una muestra con remplazamiento para
posteriormente obtener el clculo de los estimadores. Este proceso se efectua K veces. Calculando el promedi de los estimadores permite calcular
el sesgo de cualquier estimador. Puede ser utilizado para obtener errores estndar, intervalos de confianza y p-values ara pruebas estadsticas.
21

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

183

Este mtodo puede ser aplicado a cualquier estimador panel que


cuenta con independencia sobre los individuos (i)22 y N,
incluyendo el estimador GLS para regresiones agrupadas
(pooled) de paneles cortos.
ERRORES ESTNDAR CORREGIDOS PARA PANEL (PANEL
CORRECTED STANDARD ERRORS - PCSE).23
Las bases de datos panel asumen una estructura diagonal en el
proceso de estimacin en los trminos de error a travs de su
estructura de covarianzas.
En particular, y por lo general, se supone que para cualquier
individuo la varianza del error es constante, de modo que la
nica fuente de heterocedasticidad es la varianza del error a
travs de diferentes individuos.
Sin embargo, las bases de datos panel muestran a menudo
errores no esfricos debido a la correlacin contempornea y
heterocedasticidad a travs de los individuos.
Dada esta condicin de errores no esfricos en modelos para
datos panel lineales es comn el uso de una metodologa de
estimacin por FGLS para mejorar la inferencia y estimacin.
Sin embargo, Beck y Katz (1995) mostraron que estimaciones
FGLS tenan pocas propiedades de muestra finita.

Se debe efectuar un remuestreo por bootstrap nicamente sobre los individuos (i) no sobre los individuos (i) y el tiempo (t).
Para una introduccin tcnica pero fcil de entender sobre las propiedades de FGLS y PCSE, ver: Nathaniel Beck, Time-Series-Cross-Section
Data: What Have We Learned in the Past Few Years?, Annual Review of Political Science, 4: 271-93 (2001).
22
23

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

184

En particular, en un estudio de simulacin mostraron que los


errores estndar estimados para este modelo generan intervalos
de confianza significativamente pequeos y a menudo
subestiman la variabilidad en un 50% o ms, con aumentos en la
eficiencia pero que ignoran errores no esfricos.
Por lo tanto, Beck y Katz (1995) sugirieron la estimacin de
modelos lineales de datos panel por mnimos cuadrados
ordinarios (OLS) y propusieron un estimador tipo sndwich de
la matriz de covarianza de los parmetros estimados, que
llamaron errores estndar del panel con correccin (PCSE), esta
es robusta a la posibilidad de errores no esfricos. Sea el modelo
panel de la forma:

Donde i=1,,N son el numero de individuos y t=1,,T son los


periodos. Para Ti es el nmero de periodos en el panel para el iesimo individuo y it es la perturbacin estocastica que puede
estar autocorrelacionada a lo largo del tiempo (t) o
contemporaneamente correlacionada a traves de los individuos.
Este modelo puede ser escrito de forma panel como:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

185

Para un modelo con perturbaciones heterocedasticas y


correlacin contemporanea pero sin autocorrelacin, la matriz
de covarianza se asume como:

Donde ii es la varianza de las perturbaciones para el individuo iesimo, ij es la covarianza de las perturbaciones entre el
individuo i-esimo y el individuo j-esimo. Una forma ms general
si el panel es o no balanceados puede ser escrito como:

Si no existe autocorrelacin especificada los parmetros, , son


estimados por OLS. Si se especifica autocorrelacin los
parmetros, , son estimados por regresiones Prais-Wisten.
Cuando existe autocorrelacin con coeficientes de correlacin
especificados cada nivel panel i es calculado con un coeficiente
comn de correlacin calculado como:

Donde i es el coeficiente de correlacin estimada para el


individuo i-esimo y m nmero de paneles. La covarianza de OLS
o coeficientes Prais-Winsten es:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

186

Donde es la matriz de covarianza de las perturbaciones. Donde


los paneles son balanceados se puede escribir como:

Donde es una matriz de covarianzas NxN de perturbaciones.


Cada elemento de se calcula como:

Donde i y i son los residuos para las estimaciones de las


matrices de covarianzas de los individuos i-esimo y j-esimo,
respectivamente, que puede ser ajustada periodo a periodo y
donde Tij es el nmero de residuos entre los individuos i y j.

IV. ESTRUCTURA DE PRUEBAS DE HIPOTESIS: ANALISIS DE


VARIANZA
Los
datos
panel
proporcionan
informacin
sobre
comportamiento individual a travs del tiempo (t) y los
individuos (i)24.
Para cada regresin lineal, el anlisis de datos panel estndar
utiliza un rango mucho ms amplio de modelos y estimadores
que en el caso de datos de corte transversal, por ejemplo.
Suponga se tiene observaciones muestrales de caractersticas de N individuos sobre T periodos con K variables explicativas denotados por yit,
xkit i=1,,N, t=1,..,T, k=1,,K. Convencionalmente, las observaciones de la variable, y, son asumidas como resultados aleatorios de algn
experimento con una distribucin de probabilidad condicionada sobre vectores de caractersticas x y un nmero fijo de parmetros , f(y|x,).
Cuando los datos panel son utilizados, una de sus principales objetivos es utilizar toda la informacin para efectuar inferencia sobre el vector de
parmetro . Por ejemplo, un modelo puede postular a la variable, y, es una funcin lineal de x. Sin embargo, para ejecutar una regresin por
mnimos cuadrados con NxT observaciones se necesita asumir que los parmetros de la regresin toman valores iguales a todas las unidades
individuales para todos los periodos. Si este supuesto no es vlido, las estimaciones agrupadas (pooled) pueden conducir a una falsa inferencia ya
que sus resultados no son consistentes.
24

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

187

Un modelo muy general para datos panel permite que varen los
coeficientes asociados con el intercepto () y las pendientes ()
sobre el individuo (i) y el tiempo (t), es decir:

Donde yit es una variable dependiente escalar, xit, es un vector de


Kx1 variables independientes, uit es un trmino de perturbacin
estocstica, uit.
Sea el siguiente modelo para individuos (i) y tiempo (t), con las
siguientes caractersticas:

Este modelo es demasiado general en la medida que existen ms


parmetros, NT(K+1) ms el nmero caracterizando el trmino
de error, uit, que la disponibilidad de grados de libertad, NxT.
Adems, deben incluirse restricciones adicionales en la medida
que parmetros de intercepto (it) y pendiente (it) varan
respecto a los individuos (i), el tiempo (t). Por tal motivo, es
necesaria una estructura de restricciones que debe ser impuesta
sobre la ecuacin anterior, antes de efectuar cualquier
inferencia.
El primer paso de la exploracin de datos parte de probar si los
parmetros que caracterizan el comportamiento aleatorio de la

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

188

variable endgena, yit, permanecen constante a travs de los


individuos (i) y el tiempo (t).
Un procedimiento utilizado para identificar el origen de la
variacin muestral es el anlisis de varianza. El nombre anlisis
de varianza o ANOVA posee categoras particulares para
contrastar pruebas de hiptesis lineales, adems, se pueden
estipular valores esperados de una variable aleatoria, yit, y su
interaccin en la estructura de dependencia (definiendo uno o
ms factores) a la cual los individuos pertenecen25.
Por otra parte, modelos de anlisis de varianza, en algunos casos,
son de carcter mixto involucrando variables exgenas, como lo
ejecutan los modelos de regresin, y al mismo tiempo, permiten
la relacin de cada individuo yi como depende al factor al cual
pertenece.
Basado en el principio de anlisis de varianza Walpole (2003),
suponga el siguiente modelo de la forma ms general o no
restringido:
Donde it y it son vectores de parmetros de tamao 1X1 y 1XK,
xit son regresores independientes y uit es el termino de error.
Dada las caractersticas del modelo anterior, y la necesidad de
incluir restricciones, dos aspectos de los coeficientes estimados
pueden ser contrastados a travs de pruebas de hiptesis.
En el procedimiento de anlisis de varianza supone que cualquier variacin que exista entre parmetros se atribuye a dos posibles causas. La
primera, variacin en la absorcin de un factor entre observaciones (within). La segunda, la variacin entre (between) los factores.
25

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

189

El primero, la homogeneidad de todos coeficientes o las


, y la potencial combinacin con la
pendientes de regresin,
.
homogeneidad de todos los interceptos de regresin
El procedimiento de prueba tiene tres (3) pasos a seguir y
probar por medio de contrastes de hiptesis de manera
conjunta:
, son las mismas.
1. Paso 1. Las pendientes los regresores,
, son los mismos.
2. Paso 2. Los interceptos,
3. Paso 3. Las pendientes e interceptos son homogneos entre
diferentes individuos (i) a travs del tiempo (t).
Si la hiptesis de homogeneidad global no se rechaza (paso 1)
terminara en este punto.
Si la hiptesis es rechazada, es decir, no existe homogeneidad
), el segundo paso de
) e interceptos (
entre pendientes (
) son las
anlisis es decidir si las pendientes de regresin (
mismas (paso 2).
) no se
Si la hiptesis de homogeneidad de las pendientes (
rechaza entonces no es necesario el tercer paso.
Por ltimo, si se rechaza la hiptesis del paso 2, se efectu el
paso 3.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

190

Es decir, se parte de un inicio de homogeneidad en el paso 1


hasta llegar a comprobar heterogeneidad en pendiente e
intercepto.
ESTRUCTURA DE CONTRASTE DE HIPTESIS EN UN MODELO DE
DATOS PANEL

Aunque este tipo de anlisis puede ser ejecutado en varias


dimensiones, por ejemplo, individuos (i) y tiempo (t) o de dos
factores (two way), el anlisis de varianza de un solo factor (one
way) es el ms utilizado (individuos, suponiendo el factor
temporal igual a cero).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

191

CONTRASTES DE PARAMETROS ESTIMADOS Y SUMA DE


CUADRADOS DE LOS RESIDUOS RESPECTO A LOS INDIVIDUOS
Basado en la estructura anterior de contrastes de hiptesis del
grafico anterior para encontrar heterogeneidad en un modelo de
regresin, se asumen los parmetros del intercepto constantes
sobre el tiempo (t) pero varan a travs de los individuos.
De esta forma, se definir el CASO 0, como un modelo de
regresin para cada individuo (i) en cada periodo de tiempo (t),
o modelo no restringido, de la forma:
Tres (3) tipos de restricciones pueden ser impuestas sobre el
modelo anterior asociados a los pasos iniciales:
CASO 1. H01 : Asociado al paso 1. Los coeficientes de pendiente de
, son los mismos y los interceptos no lo son
la regresin,
i, es decir:

CASO 2. H02 : Asociado al paso 2. Los coeficientes de interceptos


, son los mismos y las pendientes no lo
de la regresin,
i, es decir:
son
CASO 3. H03 : Asociado al paso 3 de homogeneidad del modelo. Los
coeficientes de interceptos y pendientes son los mismos,
es decir:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

192

El CASO 0 es el modelo no restringido. El CASO 1 es el modelo de


media individual.
Dado que tiene poco significado preguntar si los interceptos son
los mismos cuando las pendientes cambian se ignorara el CASO
2.
El CASO 3 es la regresin agrupada (pooled). Sean los promedios
aritmticos de los individuos (i) a travs del tiempo (t) para los
regresores x, y la variable dependiente, y, respectivamente, se
tiene que:
Estimacin del modelo no restringido. Las estimaciones de
mnimos cuadrados de y en el modelo no restringido, CASO
0, estn dadas por:
En la terminologa del anlisis de varianza, la ecuacin anterior,
se conoce como estimacin entre grupos (within group
estimates). Dnde:

La suma de cuadrado de los residuos (RSSi) se define como:


La suma de cuadrados del modelo no restringido, o CASO 0, es:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

193

Estimacin de caso 1. La regresin del modelo de media


individual, es decir, los coeficientes de las pendientes de la
, son las mismos y los interceptos no lo son
i, tiene
regresin,
los siguientes parmetros estimados:

Dnde:
Sea Wyy=
=1 , la suma de cuadrados de los residuos del
CASO 1, o el modelo de media individual, se define como:
Estimacin de CASO 3. El modelo ms restrictivo es un modelo
agrupado (pooled) donde se especifican coeficientes de
pendiente e intercepto constantes. El supuesto usual para
anlisis de corte transversal, indica que:
La regresin por mnimos cuadrados agrupada (pooled
estimation) para el CASO 3, o los coeficientes de interceptos y
pendiente son los mismos y tienen los siguientes parmetros
estimados:
Dnde:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

194

La suma de cuadrados de los residuos para este modelo son:


Si este modelo es correctamente especificado, y los regresores
estn no correlacionados con el trmino de error (que determina
la utilizacin de efectos fijos o aleatorios), entonces puede ser
estimado consistentemente utilizando OLS agrupados (pooled).
Sin embargo, el trmino de error, en la mayora de los casos, se
encuentra correlacionado a travs del tiempo para un individuo
(i).
Adems, el proceso de estimacin por OLS no es recomendable
en la medida que pueden generar sesgos importantes26.
CONSTRUCCIN DE LAS PRUEBAS DE HIPTESIS
Bajo el principio de anlisis de varianza, y utilizando la suma de
cuadrados de residuos de la regresin calculados en cada uno de
los casos anteriores, definidos como:
26

El estimador OLS agrupado (pooled) es inconsistente si el modelo de efectos fijos es apropiado.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

195

S1: suma de cuadrados del residuo (SSR) del modelo no


restringido, o CASO 0
S2: suma de cuadrados del residuo (SSR) del modelo de
media individual, o CASO 1
S3: suma de cuadrados del residuo (SSR) del modelo
agrupado (pooled), o CASO 3
Bajo el supuesto adicional que el termino de error, uit, es una
vaiid y normal distribuida sobre los individuos (i) y en tiempo
(t) con media cero y varianza 2 , es posible efectuar una prueba
F que puede ser utilizada para contrastar las restricciones sobre
los modelos para el CASO 1, los coeficientes de pendiente de la
, son los mismos y los interceptos no lo son
i y el
regresin,
CASO 3 los coeficientes de interceptos y pendiente son los
mismos.
El CASO 1 y CASO 3 pueden ser observados como el CASO 0, o
modelo no restringido, sujeto a restricciones lineales. Por
ejemplo, la hiptesis de interceptos heterogneos pero
pendientes homogneas (CASO 1) puede ser reformulado en una
prueba de hiptesis sobre el modelo no restringido, CASO 0,
sujeto a (N-1)K restricciones lineales donde se plantea la
siguiente prueba de hiptesis sobre los dejando libres a los
interceptos:

La hiptesis de interceptos () y pendientes () homogneas,


CASO 3, tambin puede ser estructurada en un modelo no
restringido, CASO 0, con (K+1)(N-1) restricciones lineales, es
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

196

decir, restringiendo en una prueba de hiptesis interceptos () y


pendientes () de la forma:

De este modo, las pruebas utilizadas en el analisis de varianza


(ANOVA) es equivalente a pruebas de hipotesis ordinarias, H0,
fundamentada en la estimacin de modelos no restringidos y el
clculo de la suma de cuadrados de los residuos (SSR) que
pueden incorporar restricciones lineales y efectuar las pruebas
de hipotesis correspondientes.
El calculo del estadistico para determinar la prueba de hiptesis,
H03 , o que los coeficientes de interceptos y pendientes son los
mismos, se divide en dos partes.
La primera, define la suma de cuadrados de los residuos (SSR)
del modelo no restringido, CASO 0 o S1, dividido entre la varianza
de los terminos de error del modelo agrupado (pooled), S1/2 ,
que se distribuye 2 con NT-N(K+1) grados de libertad.
La segunda, mide el efecto de los individuos en el modelo y se
calcula como la diferencia entre la suma de cuadrados de los
residuos del modelo agrupado (S3) menos la suma de cuadrados
de los residuos del modelo no restringido (S1) o (S3-S1).
Es decir, lo que no explica el modelo agrupado (pooled) menos el
no restringido corresponde a la suma de cuadrados debido al
efecto de los individuos (i).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

197

La razn (S3-S1)/2 se distribuye 2 con (N-1)(K+1) grados de


libertad. Se asume que (S3-S1)/2 es independiente de S1/2 . La
divisin de las dos distribuciones 2 es una distribucin F de la
forma:

El estadstico para efectuar la prueba de contraste de interceptos


y pendientes comunes es F con (N-1)(K+1) y N(T-K-1) grados de
libertad.
El contraste se realiza sobre una distribucion F con (N-1)(K+1)
y N(T-K-1) grados de libertad y un nivel de confianza de (1-),
(F(N-1)(K+1) y N(T-K-1)).
Si no es significativo, se agrupan los datos y estima una sola
ecuacin, o el CASO 3, o mejor, no se puede rechazar la hiptesis
nula de interceptos y pendientes comunes, 03 , bajo el estadstico
de prueba F3.
Si el estadstico F3 es significativo se encontr no homogeneidad,
o se rechaza la hiptesis nula de homogeneidad (03 ), que puede
ser atribuida a dos causas. La primera, pendientes heterogneas.
La segunda, interceptos heterogneos.
El calculo del estadistico para determinar la prueba de hiptesis
H01 , o que los interceptos () son heterogneos pero las
pendientes () son homogneas, de divide en dos partes.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

198

La primera, define la suma de cuadrados de los residuos del


modelo de media individual, S2, dividido por la varianza del
termino del error del modelo agrupado (pooled), S2/2 , que se
distribuye 2 con N(T-1)-K grados de libertad.
La segunda, mide el efecto del intercepto en el modelo y se
calcula como la diferencia entre la suma de cuadrados de los
residuos del modelo de media individual, CASO 1, (S2) menos la
suma de cuadrados de los residuos del modelo no restringido
(S1) o (S2-S1).
Es decir, los residuos del modelo, S2, hacen explcito el
componente de intercepto individual, i , si se le resta el efecto
del modelo no restringido el resultado es el efecto del intercepto.
Por lo tanto, la razn (S2-S1)/2u se distribuye 2 con (N-1)K
grados de libertad27. Se asume que (S2-S1)/2u es independiente
de S1/2u .
El estadstico F, como combinacin de distribuciones
independientes 2, para contrastar H01 , o los coeficientes de
pendiente de la regresin son los mismos y los interceptos no lo
son, est dado por:

El contraste se realiza sobre una distribucion F con (N-1)K y NTN(K+1) grados de libertad y un nivel de confianza de (1-), (F(N1)K y NT-N(K+1)).
La diferencia de la diferencia de (S2-S1) pueden ser deducidos sus grados de libertad dado que S1 tiene [NT-N(K+1)] y para S2 tiene [ N(T-1)-K].
La resta es (N-1)K grados de libertad
27

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

199

Si es significativo, es decir, no se puede rechazar la hipotesis nula


donde las pendientes de la regresin son las mismas y los
interceptos no lo son.
Si el estadistico F1 no es significativo, se puede rechazar la
hipotesis nula donde las pendientes de la regresin son las
mismas y los interceptos no lo son.
Por otra parte, se puede determinar el grado de no
homogeneidad en los interceptos. Si la hiptesis de interceptos
heterogneos no se rechaza, conociendo de antemano que
existen pendientes homogneas, H01 , CASO 1, se pueden aplicar
pruebas condicionadas para interceptos homogneos, es decir:
dado

En este caso, dada la restriccin sobre los parmetros de


pendiente (), la suma de cuadrados del modelo de media
, son los
individual (coeficientes de pendiente de la regresin,
i) se convierte en el modelo
mismos y los interceptos no lo son
no restringido, S2, y como su versin restringida la suma de
cuadrados del modelo agrupado (pooled), S3.
La diferencia entre la suma de cuadrados de los residuos entre el
modelo agrupado (pooled) y el modelo de interceptos
heterogneos pero pendientes homogneas, revela su semejanza
estadstica, es decir, (S3-S2).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

200

Si la diferencia tiende a cero los dos modelos son equivalentes, si


la diferencia se incrementa existe un efecto significativo de los
individuos (i) en el modelo de media individual respecto al
modelo agrupado (pooled).
Bajo la hiptesis nula H4, la suma de cuadrados del residuo del
modelo agrupado o restringido, S3, dividido por el termino del
error del modelo no restringido, S3/2u , tiene una distribucin 2
con NT-(K+1) grados de libertad y la suma de cuadrados del
residuo del modelo de modelo de interceptos heterogneos pero
pendientes homogneas, S2/2u , tiene una distribucin 2 con
N(T-1)-K grados de libertad. La resta de los grados de libertad de
(S3-S2)/2u , tiene una distribucin 2 con N-1 grados de libertad28.
Dado que S2/2u es independiente de (S3-S2)/2u , la cual se
distribuye 2 con N-1 grados de libertad su puede construir una
prueba F para H4 de la siguiente forma:

El contraste se realiza sobre una distribucion F con (N-1) y T(N1)-K grados de libertad y un nivel de confianza de (1-), (F(N-1) y
T(N-1)-K;(1-)).
CONTRASTES DE PARAMETROS ESTIMADOS Y SUMA DE
CUADRADOS DE LOS RESIDUOS RESPECTO AL TIEMPO
Alternativamente, es posible asumir que los coeficientes son
constantes a traves de los individuos en un periodo dado, pero
28

La diferencia de grados de libertad se puede calcular como: [NT-(K+1)]-[N(T-1)+K]=N-1

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

201

pueden variar sobre el tiempo tanto el intercepto (t ) como las


pendientes (t).
Es posibe efectuar una regresion separada para cada corte
trasnversal durante cada periodo de tiempo, de la forma:

Donde, de nuevo, se asume que uit es una vaiid con media cero y
varianza constante, 2u .
De forma analoga al analisis de varianza (ANOVA), puede ser
ejecutado un metodo para contrastar la heterogeneidad de los
parametros de corte transversal sobre el tiempo.
De este modo, se puede probar la homogeneidad del intercepto y
las pendientes a traves del tiempo sobre la siguiente prueba de
hipotesis:

Efecutando la diferencia entre la suma de cuadrados del residuo


del modelo agrupado (S3) menos la suma de cuadrados del
residuo del modelo de coeficientes constantes a traves de los
individuos pero pueden variar sobre el tiempo tanto en el
intercepto (t ) como en las pendientes (t), S1 , se tiene el
siguiente estadistico distribuido F:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

202

El contraste se realiza sobre una distribucion F con (T-1)(K+1) y


NT-T(K+1) grados de libertad y un nivel de confianza de (1-),
(F(T-1)(K+1) y NT-T(K+1);(1-)), donde se define el calculo de la suma de
cuadrados del residuo del modelo con coeficientes constantes a
traves de los individuos pero pueden variar sobre el tiempo
tanto en el intercepto (t ) como en las pendientes (t), S1 , de la
siguiente forma:

De manera similar, se puede contrastar la hipotesis de


interceptos heterogeneos en el tiempo (t ), pero pendientes
homogeneas (t) en el tiempo, bajo la siguiente prueba de
hipotesis:

Se calcula la diferencia entre la suma de cuadrados del residuo


del modelo con coeficientes constantes a traves de los individuos
pero pueden variar sobre el tiempo, S1 , menos la suma de
cuadrados del residuo del modelo de media individual
modificado, en vez del promedio de los individuos el promedio
del tiempo para cada individuo, S2 , donde:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

203

Utilizando el siguiente estadistico F, una modificacion a F1 o la


prueba que contrastaba si los interceptos () son heterogneos
pero las pendientes () son homogneas entre individuos.
Ahora realiza la misma prueba sobre el tiempo en vez de los
individuos. El estadstico F es:

El contraste se realiza sobre una distribucion F con (T-1)K y NTT(K+1) grados de libertad y un nivel de confianza de (1-), (F(T1)K y NT-T(K+1);(1-)).
Tambien, dentro de estos contrastes temporales, es posible
contrastar la hipotesis de homogeneidad de los interceptos (t )
condicionada sobre pendientes homogeneas (t), es decir:
Se realiza la difencia entre la suma de cuadrados del residuo del
modelo agrupado menos la suma de cuadrados del residuo del
modelo de media individual modificado, en vez del promedio de
los individuos, el promedio del tiempo para cada individuo, S2 .
Con estos resultados se tiene el estadstico de contraste
distribuido F de la forma:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

204

El estadistico efectua un contraste con una distribucion F con (T1) y T(N-1)-K grados de libertad y un nivel de confianza de (1), (F(T-1),T(N-1)-K;(1-)).
En general, a menos que se efectuen las pruebas en ambas
secciones, es decir, corte trasnversal y serie de tiempo, e
indiquen el no rechazo de la homogeneidad de los coeficientes
de regresion de pendientes e intercepto, el agrupamiento no
condicionado (es decir, el modelo pooled o una sola regresion
por OLS utilizando todas las observaciones de corte transversal a
traves del tiempo) puede conducir a un serio sesgo dentro del
proceso de estimacion.
RESUMEN DE PRUEBAS DE HIPOTESIS Y CONTRASTES DE
HIPOTESIS

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

205

Pueden existir sutuaciones incomodas en los proceso de


contrastes de hipotesis.
Una posibilidad existe en el contraste de parametros e intercepto
comunes con variacion de los individuos y constante el tiempo
(F3) o contraste de parametros e intercepto comunes con
variacion del tiempo y constantes los indivuduos (F3 ) se pueden
encontrar resultados opuestos con pruebas de hipotesis donde
no se rechaze la hipotesis de pendientes e interceptos
heterogeneos donde varian los individuos y es constante el
tiempo (F1) o varian el tiempo y estan constantes los individuos
(F1 ).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

206

Dada las hipotesis nula y alternativa que son de algun modo


diferente en los dos casos.
Peor aun, se puede rechazar la hipotesis sobre el supuesto de
homogeneidad utilizanto la razon F3 (F3 ), pero entonces
encontrar a F1 (F1 ) y F4 (F4 ) que no pueden ser rechazadas en
sus hipotesis nulas, de modo que la existencia de heterogeneidad
indicada por F3 (F3 ) no se puede salvar.
Este resultado es bastante apropiado en un nivel estadistico
formal, aunque en el menos formal pero nivel importante de
interpretacion de las pruebas estadisticas puede ser molesto.
V. CONTRASTES DE HIPTESIS EN DATOS DE PANEL
Los modelos de datos panel se clasifican en dinmicos o estticos
segn incluyan o no en sus ecuaciones variables pertenecientes a
diferentes periodos temporales. En la especificacin esttica, el
modelo de regresin de un solo factor (one way) supone que el
error aleatorio se descompone en uit=i+it. Donde cada i es el
efecto individual (no observado) de cada individuo de corte
transversal, invariante en el tiempo29. El modelo a estimar es el
siguiente:

Yit=i+xit+uit
La presencia del efecto fijo (FE) en esta ecuacin hace que una
estimacin de por OLS no sea consistente y sea sesgada. Los
Los interceptos para cada uno de los individuos, i~(0,2 ), son variables aleatorias independiente e idnticamente distribuidas (vaiid) sobre los
individuos (i). El termino estocstico puro, it~(0,2 ), son variables aleatorias independiente e idnticamente distribuidas (vaiid) sobre los
individuos (i) y el tiempo (t), donde existe una condicin de exogeneidad entre ellos, es decir, E[it|i]=0 i,j,t.
29

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

207

mtodos que se utilizan para solventar ese problema son la


estimacin de efectos fijos (FE) o entre grupos (within groups) y
la estimacin de efectos aleatorios (RE) por Mnimos Cuadrados
Generalizados factibles (FGLS). La estimacin de efectos fijos
(FE) puede llevarse a cabo transformando el modelo anterior en
otro en trminos de las medias de grupo, es decir:

Y estimando por OLS, o tambin, mediante una estimacin por


mnimos cuadrados de variables ficticias (LSDV), i. En este
contexto, pueden plantearse los siguientes contrastes.
CONTRASTE DE EFECTOS INDIVIDUALES EN MODELOS DE
COMPONENTES DE ERROR DE UN SOLO FACTOR (ONE WAY)
La significancia conjunta de las variables ficticias en un modelo
de componentes de error de un factor (one way), debe
demostrar que todos los coeficientes asociados con el intercepto,
, son iguales a cero, o mejor, no existe diferencia entre los N
individuos visto a travs de sus diferencia en el intercepto, de
forma que puede ser contrastada mediante la hiptesis nula y
alternativa construida de la siguiente manera:
H0: 1=2=3==N=0
H1: i 0
El estadstico de contraste es el siguiente:

Donde el RSSR es la suma de cuadrados de residuos (Residual


Sum of Squares) de la regresin que se obtiene de la estimacin
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

208

OLS en el modelo agrupado (within groups) y el RSSU es la suma


de cuadrados de los residuos de la estimacin por mnimos
cuadrados de variables dummy (LSDV).
La distribucin, con sus correspondientes grados de libertad,
para efectuar el contraste de la hiptesis nula, H0, converge a una
FN-1,N(T-1)-K.
CONTRASTE DE EFECTOS INDIVIDUALES Y DE TIEMPO EN
MODELOS DE COMPONENTES DE ERROR DE DOS FACTORES
(TWO WAY)
Un modelo de regresin de componentes de error de dos
factores (two way) incluye, adems de un efecto individual
invariante en el tiempo, i, un efecto comn a todos los
individuos
el
cual
captura
efectos
temporales
o
macroeconmicos no observables, t, en el componente de error
uit30. El modelo de regresin, es por tanto:
yit=i+xit+t+it
El modelo de estimacin entre grupos (within groups) conlleva
tomar promedios aritmticos en la ecuacin anterior, tanto en
los individuos como en el tiempo, y transformar el modelo
anterior en:
yit-yi-yt+y=(xit-xi-xt+x)t+(it-i-t-)
En este modelo de componentes de error de dos factores (two
way) puede tambin contrastar la significancia conjunta de las
variables dummies ejecutadas en la estimacin por mnimos
cuadrados de variables dummy (LSDV), de forma similar a como
El componente de intercepto para los individuos i y el componente estocstico puro, it, tienen los mismos supuestos que en el modelo de un
solo factor (one way), adems, t~(0,2 ) es una vaiid para todo t y i, t y it son independientes para todo i,j,t.
30

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

209

se indic para los modelos de un solo factor (one way), para dos
los grupos de variables no observadas, individuos (i) y tiempo
(t). De este modo, la prueba de hiptesis del modelo de dos
factores (two way) se puede expresar como:
H0: 1=2=3==k=0 y 1=2=3==T=0
H1: i 0 iN o j 0 donde jT
El estadstico de contraste para este caso es:

Donde el RSSR es la suma de cuadrados de residuos (Residual


Sum of Squares) de la regresin que se obtiene de la estimacin
OLS en el modelo agrupado y el RSSU es la suma de los cuadrados
de los residuos de la regresin entre grupos (within groups)
sobre la ecuacin transformada por promedios aritmticos.
La distribucin, con sus correspondientes grados de libertad,
para efectuar el contraste de la hiptesis nula, H0, converge a una
FN+T-2,(N-1)(T-1)-K.
Dada la estructura anterior de contraste de hiptesis, es posible,
adems, efectuar pruebas de no tener efectos individuales
(i=0), dada la existencia de efectos temporales (t), es decir:
H0: 1=2=3==k=0 tal que j0 donde jT
H1: i 0 iN o j 0 donde jT

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

210

En este caso, la suma de cuadrados de residuos de la regresin,


RSSR, incluye nicamente los componentes no observados
temporales en la regresin:
yit-yi-yt+y=(xit-xi-xt+x)t+(it-i-t-)
Mientras que la suma de cuadrados residuales de la regresin
within, RSSU. La distribucin, con sus correspondientes grados
de libertad, para efectuar el contraste de la hiptesis nula, H0,
converge a una F(N-1),(N-1)(T-1)-K.
Obsrvese la diferencia entre la construccin de las pruebas de
hiptesis nula, contrastando efectos individuales en los modelos
de un solo factor (one way) y dos factores (two way):
H0: i=0 i=1,2,,N
suponiendo que t=0
para
t=1,2,.,T
(One way)
H0: i=0 i=1,2,,N
sabiendo que
t=0
para
t=1,2,.,T
(Two way)
Mientras en el primero caso realiza una prueba de
heterogeneidad entre los individuos a travs del intercepto
(i=0) donde supone un efecto temporal, en el segundo caso
sabe de la existencia del efecto del tiempo (t) dentro de la
estructura de datos panel.
Esta es una diferencia radical en la construccin y el contraste de
la prueba hiptesis.
De forma anloga, se puede efectuar el contraste de hiptesis de
la significancia de efectos temporales (t) conociendo de

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

211

antemano la existencia de efectos de heterogeneidad individual


(i0), donde se puede plantear la prueba:
H0: 1= 2== T= 0 sabiendo que i0
H1: j0
Donde la suma de cuadrados de residuos de la regresin, SSRR,
est dado por la regresin de la forma yit-yit-1=(xit-xit-1)t+(it-it1) y suma de cuadrados residuales de la regresin entre grupos
(within groups) procede de la regresin yit-yi-yt+y=(xit-xixt+x)t+(it-i-t-).
La distribucin, con sus correspondientes grados de libertad,
para efectuar el contraste de la hiptesis nula, H0, converge a una
F(T-1),(N-1)(T-1)-K.
MULTIPLICADORES DE LAGRANGE PARA CONTRASTAR
PRUEBAS DE EFECTOS ALEATORIOS
La prueba de Breusch y Pagan consiste en identificar la
existencia de autocorrelacin residual entre los trminos de
error de un modelo estimado en distintos momentos del tiempo
equivalente a probar la existencia de efectos constantes en el
trmino de error.
La hiptesis nula en la prueba LM propuesta por Breusch y
Pagan (1980)31 para efectos aleatorios trata de demostrar como
las varianzas, a travs de los individuos, o su heterogeneidad es
cero.

31

Paquetes estadsticos como STATA trabajan con las modificaciones efectuadas sobre esta prueba por Baltagi and Li (1990).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

212

Es decir, no existe diferencia significativa a travs de los


individuos (o no existe efecto panel). Puede ser escrito en
trminos de pruebas de hiptesis como:
H0: 2 =0
H0: 2 0
Trabajando a partir de estimaciones por mxima verosimilitud a
partir de la ecuacin, yit=i+xit+t+it, se construye el
estadstico LM=LM1+LM2. Dnde se pueden construir los
siguientes estadsticos:

Siendo los residuos de la estimacin OLS de la ecuacin


yit=i+xit+t+it, IN e IT son matrices identidad de tamao N y
T, las matrices JT y JN son de tamaos T y N respectivamente.
El objetivo de la prueba es decidir entre una regresin con
efectos aleatorios (i) y una regresin por mnimos cuadrados
(OLS) o regresin agrupada (pooled regression).
La distribucin, con sus correspondientes grados de libertad,
para efectuar el contraste de la hiptesis nula, H0, converge a una
12 .
De manera anloga, es posible decidir a travs de un contraste
entre la regresin con efectos temporales (t) o una regresin
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

213

por mnimos cuadrados (OLS) o regresin agrupada (pooled


regression). El estadstico de contraste es LM2, bajo la prueba de
hiptesis:
H0: 2 =0
H1: 2 0
La distribucin, con sus correspondientes grados de libertad,
para efectuar el contraste de la hiptesis nula, H0, converge a una
12 .
Cuando el valor del estimador sea mayor a aquel reportado en la
tabla de valores crticos de la distribucin 2 con un (1) grado de
libertad, bajo el nivel de significancia deseado, se rechaza la
hiptesis nula.
En ese caso se confirma la existencia de un componente fijo en el
error, y es necesario aplicar efectos aleatorios (RE) o alguna
metodologa de efectos fijos (FE). Si por el contrario no es
posible rechazar la hiptesis nula, se asume que no existe un
trmino fijo en el error y se utiliza OLS.
ELECCIN DEL MTODO: EFECTOS FIJOS O EFECTOS
ALEATORIOS?
El modelo de efectos fijos (FE) tiene la atraccin de permitir
utilizar datos panel para establecer causacin bajos supuestos
dbiles en comparacin con aquellos donde se utilizan supuestos
fuertes para establecer causalidad como corte transversal,
modelos de datos panel sin efectos fijos, tal como modelos
agrupados (pooled) y modelo de efectos aleatorios (RE).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

214

En algunos estudios la causalidad es clara, de este modo los


efectos aleatorios (RE) es apropiada. En otros casos, determinar
esta causalidad puede ser insuficiente para utilizar un modelo de
efectos aleatorios (RE), y por tanto, para medir la correlacin y
determinar una relacin de causalidad, de este modo, permite
utilizar otras aproximaciones.
El modelo de efectos fijos (FE) tiene varias debilidades prcticas.
La estimacin de los coeficientes de cualquier regresor
invariante en el tiempo, xi, tales como la variable gnero, no es
posible absorbela dentro de algn efecto especifico en particular.
Los coeficientes de regresin que varan en el tiempo son
estimables, pero las estimaciones pueden ser imprecisas si la
variacin en el modelo panel su mayora corresponde al
componente de corte transversal (efecto between) sobre las
variables de tiempo.
La prediccin de la media condicional no es posible. nicamente
cambios en la media condicional causados por cambios en
regresores que cambien en el tiempo, xit, pueden ser
pronosticados. Regresores de coeficientes que varan en el
tiempo pueden ser difcil o tericamente imposible de identificar
en modelos no lineales con efectos fijos, por esta razn utilizan
efectos aleatorios, de igual manera si la interpretacin causada
pueda ser no garantizada.
La decisin acerca de la estructura apropiada para el anlisis
sobre una base de datos panel, es decir, efectos fijos (FE) o
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

215

efectos aleatorios (RE) depende en parte de los siguientes


aspectos:
1. Objetivos del estudio. Si se desea hacer inferencia con
respecto a la poblacin, es decir, trabaja con una muestra
aleatoria, lo mejor es utilizar una especificacin del tipo
aleatorio. En caso, si el inters es limitado a una muestra
que se ha seleccionado a conveniencia, o bien, que se est
trabajando con la poblacin, la estimacin de efectos fijos
ser la correcta.
Adicionalmente, si el inters particular est puesto en los
coeficientes de las pendientes () de los parmetros, y no
tanto en las diferencias individuales, se debera elegir un
mtodo que relegue estas diferencias y tratar la
heterogeneidad no observable como aleatoria.

2.

El modelo de efectos fijos se ve como un caso en que hace


inferencia condicionada a los efectos que ve en la muestra.
El modelo de efectos aleatorios hace inferencia condicional
o marginal respecto a una poblacin. Se deja al investigador
que decida si hace inferencia con respecto a las
caractersticas de una poblacin o solo respecto a los efectos
que estn en la muestra.
El contexto de los datos, es decir, cmo fueron obtenidos y
el entorno de donde provienen. Con el mtodo de efectos
fijos (FE) la heterogeneidad no observable se incorpora en
el intercepto del modelo, mientras con el modelo de efectos
aleatorios (RE) se incorporan en el trmino de error, por lo
cual, modifica la varianza del modelo.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

3.

216

Emplear un modelo de efectos fijos (FE) o aleatorios (RE)


genera diferencias en las estimaciones de los parmetros en
los casos en que se cuenta con ventanas de tiempo acotadas
o t pequeo y un nmero de entidades o individuos cada vez
).
mayor o paneles cortos (N y T

En estos casos, debe hacerse uso ms eficiente de la informacin


para estimar esa parte de la relacin de comportamiento
contenida en las variables que difieren sustancialmente de un
individuo a otro.
PRUEBA DE HAUSMAN
Esta prueba permite determinar qu modelo es el ms adecuado
para una estructura de datos panel, si efectos fijos (FE) o efectos
aleatorios (FE).
Utiliza para ello una prueba 2 con la hiptesis nula (H0)
afirmando que el modelo de efectos aleatorios (RE) es el que
mejor explica la relacin de la variable dependiente (yit) con las
explicativas (xit), por tanto, tiene la hiptesis alternativa (H1)
que el mejor mtodo que se ajusta es el de efectos fijos (FE).
Para efectuar la prueba es necesario elegir el mtodo de
estimacin de un modelo de componentes de error de un solo
factor (one way), el cual juega un papel importante dada la
existencia de correlacin entre regresores (xit) y los trminos de
error (endogeneidad).
Por tanto resulta arriesgado suponer que tal correlacin no
existe, es decir, que E[uit|xit]=0, puesto que uit=i+it contiene
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

217

un efecto fijo no observado, que puede estar correlacionado con


los regresores xit, por tanto, conducir a estimadores
inconsistentes.
Cuando [i|xit]0 el estimador OLS para efectos fijos (FE) es
consistente. Si se desea efectuar hiptesis nula para demostrar lo
anterior se tiene que:
H0: [i|xit]=0
H1: [i|xit]0
Para este caso, tanto OLS como y FGLS son consistentes, siendo
FGLS el estimador lineal insesgado de varianza mnima.
El contraste de Hausman se utiliza para analizar la posible
correlacin entre los efectos no observados que difieren entre
los individuos (i) y los regresores, xit, de este modo, poder
decidir entre una estimacin por efectos fijos (FE) o efectos
aleatorios (RE).
La prueba de hiptesis planteada es la siguiente:
H0: [i|xit]=0 El modelo de efectos aleatorios es el que
mejor explica la relacin de la variable
dependiente con las explicativas
H1: [i|xit]0 El modelo de efectos fijos es el que mejor
explica la relacin de la variable dependiente con
las explicativas
El estadstico de Hausman tiene la siguiente forma:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

218

Como se puede observar, QFE,RE es el cociente del cuadrado de la


de los
diferencia entre los dos estimadores de los parmetros
efectos fijos (FE) y aleatorios (RE) multiplicados por la
diferencia entre las varianzas de stos.
As, bajo la hiptesis nula H0, donde existe independencia del
efecto individual no observado (i) y los regresores, tanto en el
modelo de efectos fijos (FE) como para efectos aleatorios (RE)
por estimacin FGLS son consistentes.
Por tanto, deben tender al mismo valor cuando NT, de modo
que la diferencia entre los estimadores debe ser pequea.
RE es ms eficiente que
FE, implica que
Puesto que el estimador
la varianza del primer estimador es pequea en comparacin del
segundo estimador, por tanto, la diferencia entre las varianzas
debe ser grande.
La combinacin de ambas caractersticas dar como resultado un
valor del estadstico QFE,RE cercano a cero (0), por tanto, sea
necesario rechazar la hiptesis nula.
Si, por el contrario, H0 no es cierta, es decir, no existe
independencia del efecto individual no observado (i) y los
FE, es
regresores, entonces el estimador por efectos fijos,
RE, lo es.
inconsistente pero el estimador de efectos aleatorios,

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

219

De este modo, debe existir una diferencia positiva y significativa


FE-
RE). Esto implicar
entre los valores de estos estimadores (
que el valor del estadstico QFE,RE ser alto, de este modo,
rechazando la hiptesis nula (Greene 2005).
Hausman y Taylor (1981) demostraron como la misma hiptesis
puede ser contrastada utilizando cualquier par de diferencias
FGLS-
FE o
FGLS-
BE donde
BE es el estimador de
mediante

estimacin entre grupos o between.


La distribucin de la prueba, con sus correspondientes grados de
libertad, para efectuar el contraste de la hiptesis nula, H0,
converge a una 2NT .
Para el modelo de dos factores (two way), la prueba de Hausman
se basa igualmente en la diferencia entre el estimador de efectos
RE, y el estimador de efectos fijos,
FE, con
aleatorios por FGLS,
variables dummy individuales (i) y de tiempo (t), slo que la
equivalencia de los contrastes intercambiando los estimadores
FGLS,
FE,
BE no se mantiene en este caso, aunque otro tipo de

equivalencias han sido establecidas (Baltagi 2001).


CONTRASTES DE AGRUPACIN DE DATOS
Otra cuestin que se plantea en el anlisis de datos panel es si
agrupar o no los datos, es decir, si plantear un modelo como,
yit=i+xit+uit, donde todos los coeficientes de pendiente, , son
iguales para todos los individuos y para todos los periodos
(modelo restringido)

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

220

O por el contrario, incluir un parmetro diferente para cada


individuo, i, o para cada periodo de tiempo, t, (modelo no
restringido), de modo que se tendra una ecuacin de regresin
para cada individuo i-esimo de la siguiente forma:

yit=xiti+uit
En este caso, la prueba de hiptesis radica en la decisin de
agrupar las respuestas de regresores, xit, vistos a travs de los
parmetros de pendiente, , para todos los individuos i-esimos, o
mejor, probar si las respuestas difieren entre individuos o no, de
modo que:
H0: i= i=1,2,..,N
H1: ij ij
Si el termino de error uit se distribuye N(0,2I), de esta forma
homocedastica, se puede construir el siguiente estadstico:

Donde e=(INT-X(XtX)-1Xt)y y ei=(IT-Xi( ti i )-1 ti )yi, que es


precisamente una prueba F o test de Chow extendido al caso de
N regresiones lineales.
La distribucin de la prueba, con sus correspondientes grados de
libertad, para efectuar el contraste de la hiptesis nula, H0,
converge a una F(N-1)(K+1),N(T-K-1).
Para el caso con distribucin de los errores uit heterocedastica, es
decir, cuando uit se distribuye N(0,) , el estadstico F extendido

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

221

o de Chow no sigue una distribucin F, y no es correcto utilizar


este test.
En este caso, si se puede escribir = 2, basta con
1/2
premultiplicar por
las variables en el modelo yit=xiti+uit y
aplicar al modelo transformado el test de Chow anterior.
El estadstico F para la prueba de Chow en el modelo
transformado contiene en su expresin la matriz de covarianzas
, de modo que cuando sta no es observable se deber utilizar
un estimador consistente de .
La distribucin de la prueba, con sus correspondientes grados de
libertad, para efectuar el contraste de la hiptesis nula, H0,
tambin converge a una F(N-1)(K+1),N(T-K-1).
VI. DATOS PANEL EN STATA
Se muestran las siguientes salidas con su correspondiente
anlisis en el programa STATA.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

222

Estimador de efectos fijos


Sobre cada una de las salidas para el modelo FE se hace una
breve descripcin de los conceptos y principales resultados.

Estimador de efectos aleatorios


Sobre cada una de las salidas para el modelo RE se hace una
breve descripcin de los conceptos y principales resultados.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

223

Prueba de Multiplicadores de Lagrange (LM)


La prueba LM permite decidir entre una regresin de efectos
aleatorios (RE) o por OLS. Es una prueba de Poolability.
La hiptesis nula de la prueba LM expone que las diferencias a
travs de individuos es cero. Esto es, no hay una diferencia
significativa entre unidades (es decir, no afecta el panel). Frente
a la alternativa que hay una diferencia significativa entre las
unidades (es decir, afecta el panel)

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

224

H0: 2 =0 (No existe un efecto individual no observado)


H1: 2 0 (existe un efecto individual no observado)

Prueba de Hausman
Para decidir entre FE o RE se utiliza la prueba de HAUSMAN
donde la hiptesis nula radica en que el modelo a utilizar es
efectos aleatorios (RE) contra la alternativa de efectos fijos (FE).
La prueba en el trasfondo determina estadsticamente sobre los
trminos de error (Ui) si estn correlacionados con los
regresores contra su hiptesis que no. Es una prueba de
exgeneidad entre los efectos individuales no observdos y los
trminos de error.
Para efectuarla se implementa un modelo de efectos fijos (FE) y
se almacena las estimaciones. Luego se ejecuta un modelo de
efectos aleatorios (RE) y se almacena las estimaciones. Despus
se ejecuta la prueba.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

225

H0:

Efectos individuales no observados (i) estn no


correlacionados con los regresores. Se utiliza un modelo RE
H1: Efectos individuales no observados (i) estn
correlacionados con los regresores. Se utiliza un modelo FE

Hausman demostr que la diferencia entre los coeficientes de


efectos fijos y aleatorios (FE-RE) puede ser utilizada para
probar la hiptesis nula que vi y las variables X no estn
correlacionadas.
As pues, la hiptesis nula de la prueba de Hausman parte de los
estimadores de efectos aleatorios (RE) y de efectos fijos (FE) no
difieran sustancialmente.
Si se rechaza la hiptesis nula, Ho, los estimadores difieren, y la
conclusin es efectos fijos (FE) es ms conveniente que efectos
aleatorios.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

226

Si no se puede rechazar Ho, no existe sesgo de qu preocuparse y


es preferible efectos aleatorios que, al no estimar tantas
dummies, es un modelo ms eficiente.
DIAGNSTICO Y ESPECIFICACIN DE MODELOS PANEL
STATA

EN

REGRESIN AGRUPADA (POOLED OLS)


El enfoque restringido de anlisis de datos panel es omitir las
dimensiones del espacio y el tiempo de datos agrupados y slo
calcular la regresin OLS. Este modelo se expresa:

Yit 1 X 1it it

(1)

Donde se encuentra la i-sima unidad transversal en el periodo


t-esimo. Si se trata de explicar la variable respuesta o
dependiente con las variables independientes de la forma:
reg spend dem* divgov dis1 persinc* aper* popul*

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

227

EFECTOS ALEATORIOS (RANDOM EFFECTS)


El primer modelo (ecuacin 1) supone el intercepto de la
regresin es la misma para todos los individuos. Sin embargo, es
probable que se necesite controlar el efecto individual.
El modelo RE permite suponer que cada unidad transversal tiene
un intercepto diferente. Este modelo se expresa como:

Yit i 1 X1it it

(2)

Donde i= +vi. Es decir, se supone una variable aleatoria con


un valor esperado y una desviacin vi. Sustituyendo en (2) se
obtiene:

Yit 1 X1it vi it

(3)
Stata estima el modelo de efectos aleatorios con el comando
xtreg spend dem* divgov dis1 persinc* aper* popul*, re

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

228

Si se analiza el modelo anterior (ecuacin 3), se observa que si la


varianza de vi es igual a cero, es decir, 2u =0, entonces no existe
ninguna diferencia relevante entre el modelo pooled (ecuacin
1) y el modelo de efectos aleatorios (ecuacin 3).
Cmo se puede determinar si es necesario utilizar el modelo de
efectos aleatorios (RE) o de datos agrupados (pooled)? Breusch
y Pagan formularon la prueba conocida como Prueba de
Multiplicador de Lagrange para efectos aleatorios (RE).
La prueba de Breusch y Pagan se implementa en Stata con el
comando xttest0 despus de la estimacin de RE.
xttest0

Con el p-value y la probabilidad que se encuentra en la regin de


rechazo indica que se puede rechazar la hiptesis nula Ho. Por lo
tanto, los efectos aleatorios (RE) son significativos y es
preferible utilizar este mtodo en vez del procedimiento
agrupado (pooled).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

229

EFECTOS FIJOS (FIXED EFFECTS)


Cmo se puede permitir que el intercepto vare con respecto a
cada individuo? Existen dos opciones. La primera utilizar el
estimador within con el comando xtreg.
xtreg spend dem* divgov dis1 persinc* aper* popul*, fe

La segunda, utiliza el modelo LSDV por el cual estima una


dummy para cada individuo de la siguiente manera:

Yit vi 1 X 1it eit

(4)

Stata utiliza el comando:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

230

xi: reg spend dem* divgov dis1 persinc* aper* popul* i.stcode

Cul de los modelos pooled (ecuacin 1) o de efectos fijos


(ecuacin 4) es el apropiado?

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

231

El modelo pooled (1) esta restringido, pues asume un intercepto


comn para todos los individuos. Por lo tanto, para compararlo
con un modelo de efectos fijos (FE) estimados por LSDV se
puede utilizar una prueba estadstica tipo F.
La prueba plantea la hiptesis nula como Ho: v1=v2=..=vi=0. Es
decir, todas las variables dicotmicas son iguales cero.
Si la prueba se rechaza, significa que al menos una variable
dicotmica es distinta de cero. Por tanto, es necesario utilizar el
mtodo de efectos fijos (FE).
La prueba F de significancia de los efectos fijos (FE) se reporta
automticamente con el comando xtreg, fe. Al final del output de
la estimacin de efectos fijos aparece:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

232

El p-value indica que se puede rechazar la hiptesis nula, por lo


que es preferible utilizar el mtodo de FE frente al modelo
agrupado.
EFECTOS FIJOS vs. ALEATORIOS
Las pruebas de Breusch y Pagan para efectos aleatorios, y la
prueba F de significancia de los efectos fijos indican que tanto el
modelo de efectos aleatorios (RE) como el de efectos fijos (FE)
son adecuados frente al modelo agrupado (pooled).
Pero cmo decidir cul de los dos usar? La respuesta depende
de la posible correlacin entre el componente de error individual
vi y las variables explicativas X.
La prueba de Hausman se implementa en Stata despus de la
regresin con efectos aleatorios con el comando hausman:
xtreg spend dem* divgov dis1 persinc* aper* popul*, fe
estimates store FIXED
xtreg spend dem* divgov dis1 persinc* aper* popul*, re
estimates store RANDOM
hausman FIXED RANDOM

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

233

En este ejemplo, se rechaza la hiptesis nula. Es decir, la


diferencia entre los coeficientes de efectos aleatorios (RE) y fijos
(FE) s es sistemtica. Por lo tanto, conviene utilizar el mtodo
de efectos fijos (FE).
EFECTOS TEMPORALES (TWO-WAY FIXED EFFECTS).
La incorporacin de variables dicotmicas permite modelar
caractersticas de unidades transversales que no cambian en el
tiempo pero que s afectan el resultado de inters.
Ahora bien, tambin, de forma indirecta, es posible agregar
variables dicotmicas temporales al modelo. Es decir, una para
cada ao en la muestra, que capturen eventos comunes a todas
las entidades durante un perodo u otro.
Agregando efectos temporales, la ecuacin (4) se transforma en:

Yit vi t 1 X1it it

(5)

Donde t representa un vector de variables dicotmicas para


cada ao.
Estas variables dicotmicas permitirn controlar por aquellos
eventos a los que fueron sujetos todos los individuos en un ao
dado y, al igual que los efectos fijos, pueden reducir sesgos
importantes.
En Stata se pueden incorporar efectos temporales al modelo de
efectos fijos con el comando xi.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

234

xi: xtreg spend dem1 demmaj1 demgov divgov dis1 persinc*


aper* popul* i.year, fe
(Producto omitido por tamao)
O bien, generando tanto las dummies de estado como de ao,
xi: reg spend dem1 demmaj1 demgov divgov dis1 persinc* aper*
popul* i.stcode i.year
(Producto omitido por tamao)
Al igual que con los efectos por individuos, se puede realizar una
prueba F para conocer la significancia conjunta de las variables
dicotmicas temporales en el modelo.
La hiptesis nula parte de 1= 2=..=n=0. En este ejemplo,
luego de estimar un modelo con efectos fijos por individuo y
tiempo, se indica en la ventana de comando:
testparm _Iyear_1951 - _Iyear_1989

El p-value de la prueba F indica que rechaza la hiptesis nula, Ho,


por lo que es posible afirmar que las variables dicotmicas
temporales son conjuntamente significativas y pertenecen al
modelo.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

235

PRUEBAS SOBRE LA ESTRUCTURA DEL MODELO PANEL


Es importante sealar que aun cuando se ha intentado modelar
la heterogeneidad temporal y espacial, la ecuacin (5) puede
estar mal especificada en otros aspectos.
De acuerdo con los supuestos de Gauss-Markov, los estimadores
OLS son BLUE o MELI siempre y cuando los trminos de errores,
it, sean independientes entre s y se distribuyan idnticos con
varianza constante 2.
Con frecuencia estas condiciones son violadas en datos panel.
HETEROSCEDASTICIDAD
Cuando la varianza de los errores de cada unidad transversal no
es constante, se encuentra con una violacin de supuestos
iniciales de la estructura de estimacin panel.
Una forma de saber si la estimacin tiene problemas de
heteroscedastidad es a travs de la prueba del Multiplicador de
Lagrange de Breusch y Pagan.
Sin embargo, de acuerdo con Greene (2005), sta y otras
pruebas son sensibles al supuesto sobre la normalidad de los
errores.
Afortunadamente, la prueba Modificada de Wald (WALD*) para
Heterocedasticidad funciona an cuando dicho supuesto es
violado.32
32

Para una discusin sobre esta prueba, consulta Greene, W. 2000. Econometric Analysis. Upper Saddle River, NJ: Prentice Hall, p. 598.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

236

La hiptesis nula de esta prueba parte de no existe problema de


heteroscedasticidad, es decir, 2i =2 para todo i=1N, donde N
es el nmero de unidades transversales.
Naturalmente, cuando la hiptesis nula, Ho, se rechaza, se tiene
un problema de heteroscedasticidad. Esta prueba puede
implementar en Stata con el comando xttest3 despus de estimar
el modelo de efectos fijos:
xtreg spend dem* divgov dis1 persinc* aper* popul*, fe
xttest3

La prueba indica que se rechaza la hiptesis nula, Ho, de


varianza constante y no se rechaza la hiptesis alternativa Ha de
heteroscedasticidad.
CORRELACIN CONTEMPORNEA
Las estimaciones en datos panel pueden tener problemas de
correlacin contempornea si las observaciones de ciertas
unidades estn correlacionadas con observaciones de otras
unidades en el mismo periodo de tiempo.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

237

Como se observ en la seccin sobre heterogeneidad, las


variables dicotmicas de efectos temporales se incorporan al
modelo para controlar los eventos que afectan por igual a todas
las unidades en un ao dado.
La correlacin contempornea es similar, pero con la posibilidad
de algunas unidades estn ms o menos correlacionadas que
otras.
El problema de correlacin contempornea se refiere a la
correlacin de los errores de al menos dos o ms individuos en el
mismo periodo t.
En otras palabras, se tienen errores contemporneamente
correlacionados si existen caractersticas no observables de
ciertos individuos que se relacionan con las caractersticas no
observables de otros individuos.
Por ejemplo, errores de dos individuos pueden relacionarse pero
mantenerse independientes de los errores de los dems.
El comando xttest2 de Stata ejecuta la prueba de Breusch-Pagan
para identificar problemas de correlacin contempornea en los
residuales de un modelo de efectos fijos.
La hiptesis nula, Ho, afirma la existencia de independencia
transversal (cross-sectional independence). Es decir, los errores
entre unidades son independientes entre s.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

238

La prueba de hiptesis parte de determinar la matriz de


correlacin de los residuales, obtenida sobre las observaciones
comunes a todas las unidades transversales, e identificada como
una matriz identidad de orden N, donde N es el nmero de
individuos33.
Si la hiptesis nula Ho se rechaza, entonces existe un problema
de correlacin contempornea. El comando xttest2 se
implementa despus de un modelo de efectos fijos (FE). En este
ejemplo:
xtreg spend dem* divgov dis1 persinc* aper* popul*, fe
xttest2
Breusch-Pagan LM test of independence: chi2(1081) =
4106.551, Pr = 0.0000
Based on 17 complete observations
El p-value del estadstico 2 indica que se puede rechazar la
hiptesis nula. Por tanto, tambin es necesario corregir el
problema de correlacin contempornea.
AUTOCORRELACIN
La independencia se viola cuando los errores de diferentes
individuos estn correlacionados (correlacin contempornea),
o cuando los errores dentro de cada individuo se correlacionan
temporalmente (correlacin serial) o ambos.

33

Para una discusin de esta prueba, consulta Greene, W. 2000. Econometric Analysis. Upper Saddle River, NJ: Prentice Hall, p. 601.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

239

En este ejemplo, es muy probable que el nivel de gasto (spend)


en t est asociado con el nivel de gasto (spend) en t-1.
Existen muchas maneras de diagnosticar problemas de
autocorrelacin.34
Sin embargo, cada una de estas funciona bajos ciertos supuestos
sobre la naturaleza de los efectos individuales.
Wooldridge desarroll una prueba flexible basada en supuestos
mnimos. La hiptesis nula de esta prueba parte de la no
existencia de autocorrelacin. Naturalmente, si se rechaza, se
puede concluir que sta s existe.35
El mtodo de Wooldridge (2002) utiliza los residuos de una
regresin de primeras diferencias, observando que si los
trminos de error, it, no est serialmente correlacionados,
entonces la correlacin entre los errores it diferenciados para el
periodo t y t-1 es igual a -0.5.
El comando xtserial requiere que se especifiquen la variable
dependiente e independientes del modelo. En este ejemplo:

Muchas de las pruebas que se utilizan para diagnosticar problemas de correlacin serial en series de tiempo han sido ajustadas para aplicarse a
datos tipo panel en Stata. Estas pruebas puedes bajarlas por internet del modulo PANELAUTO y PANTEST2 tecleando en la lnea de comando:
ssc install panelauto y ssc install pantest2.
35 Para una discusin ms amplia de esta prueba, consulta Wooldridge, J. M. 2002. Econometric Analysis of Cross Section and Panel Data.
Cambridge, MA: MIT Press.
34

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

240

xtserial spend dem1 demmaj1 demgov divgov dis1 persinc* aper*


popul*, output

La prueba indica que existe un problema de autocorrelacin que


es necesario corregir.
Una manera de hacerlo es a travs de un modelo de efectos fijos
(FE) con trmino () autorregresivo de grado 1 (AR1) que
controla la dependencia del tiempo( t) con respecto a su valor
rezagado (t-1).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

241

El modelo AR1 con efectos fijos se especifica de la manera:

Yit vi 1 X1it i it

Donde it=it-1+it, es decir, los errores tienen una correlacin


de primer grado, que se determina a partir del coeficiente .
Donde ||<1 y it es una vaiid con media cero y varianza 2 . La
seleccin del modelo RE o FE utiliza los mimos supuestos que
modelos anteriores sobre el componente individual no
observado (i).
El comando xtregar de STATA ajusta una regression cuando los
terminos de error tiene un componente autoregresivo de primer
orden.
Este comando ofrece un estimador within para efectos fijos (FE)
y un estimador GLS segn Baltagi-Wu36, el cual extiende el
estimador panel proporcionado en Baltagi-Li37 a un caso de
paneles desbalanceados con desigualdad de observaciones.
Ambos estimadores ofrecen distintas estimaciones del
coeficiente de correlacin . El modelo AR1 es ejecutable en
Stata de la forma:

Baltagi, B. H., and P. X. Wu. 1999. Unequally spaced panel data regressions with AR(1) disturbances. Econometric Theory 15: 814823.
Baltagi, B. H., and Q. Li. 1991. A transformation that will circumvent the problem of autocorrelation in an error-component model. Journal of
Econometrics 48: 385393.
36
37

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

242

xtregar spend dem* divgov dis1 persinc* aper* popul*, fe

CMO SOLUCIONAR LOS PROBLEMAS DE HETEROGENEIDAD,


CORRELACIN CONTEMPORNEA, HETEROSCEDASTICIDAD Y
AUTOCORRELACIN?
Los
problemas
de
correlacin
contempornea,
heteroscedasticidad y autocorrelacin examinadas pueden
solucionarse conjuntamente con estimadores de Mnimos
Cuadrados Generalizados Factibles (Feasible Generalizad Least
Squares FGLS), o con Errores Estndar Corregidos para Panel
(Panel Corrected Standard Errors PCSE).38

Para una introduccin tcnica pero fcil de entender sobre las propiedades de FGLS y PCSE, ver: Nathaniel Beck, Time-Series-Cross-Section
Data: What Have We Learned in the Past Few Years?, Annual Review of Political Science, 4: 271-93 (2001).
38

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

243

Beck y Katz (1995) demostraron que los errores estndar de


PCSE son ms precisos que los de FGLS. Desde entonces,
distintos trabajos utilizan PCSE en sus estimaciones para panel.39
En este ejemplo sobre el gasto estatal, se han detectado
problemas de heteroscedasticidad, correlacin contempornea y
autocorrelacin. Para corregir estos problemas se ejecuta:
El comando de STATA xtpcse calcula estimaciones panel
corregidas por desviacin estndar (PCSE) para modelos panel
donde los parametros son estimados por regresin de la forma
Prais-Winten. Cuando se calculan los errores estndar de la
matriz de covarianza se suponen provienen de paneles
correlacionados contemporneamente y heterocedasticos.
xi: xtpcse spend dem1 demmaj1 demgov divgov dis1 persinc*
aper* popul* i.stcode i.year, correlation(ar1)
(Producto omitido por tamao)
tambin el comando:
xi: xtgls spend dem1 demmaj1 demgov divgov dis1 persinc* aper*
popul* i.stcode i.year, panels (correlated) corr(ar1)
(Producto omitido por tamao)

Hasta la fecha, el debate entre FGLS y PCSE contina, y ya se han desarrollado algunos mtodos alternativos. Para propsitos de este curso, vale
la pena estimar ambos mtodos y comparar resultados.
39

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

244

Un Buen resumen se observa en las dos siguientes tablas. La


primera, presenta la estrucutra metodolgica de trabajo y las
pruebas estadosticas a implmentar. La segunda, expone los
comandos mas utilizados bajo distintos supuestos.
METODOLOGIA DE TRABAJO Y PRUEBAS

Stata ejecuta FGLS y PCSE con los comandos xtgls y xtpcse


respectivamente para solucionar estos problemas.
Las opciones que ofrecen estos comandos dependen de los
problemas detectados en las pruebas que se han revisado.
La siguiente Tabla presenta los comandos que se pueden
ejecutar cuando se encuentren con problemas de correlacin
contempornea, heteroscedasticidad, autocorrelacin y sus
combinaciones.
Por ejemplo, si las pruebas slo detectaron problemas de
heteroscedasticidad, entonces los comandos son:
xtgls []
, p(h)
xtpcse []
, het.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

245

Si existen problemas de heterocedasticidad y correlacin


contempornea, entonces los comandos son:
xtgls []
, p(c)
xtpcse []
COMANDOS DE STATA APLICABLES

Estos comandos no calculan automticamente efectos fijos (FE),


por lo que en caso de ser necesario, se debe incluir variables
dummy con el comando xi.
MODELOS DE DATOS PANEL NO LINEALES
Los mtodos de estimacin e inferencia de panel de datos, dadas
sus caractersticas, son ms complicados que los modelos de
corte transversal o series temporales. Los errores estndar en
las estimaciones de paneles de datos necesitan ser ajustados
debido a que cada periodo de tiempo adicional no es
independiente del periodo anterior, y por tanto, requieren el uso
de modelos ms ricos y mtodos de estimacin ms potentes.
PANEL DINMICO BINOMIAL NEGATIVA
En algunos casos sobre datos de conteo se demuestra que la
varianza excede la media (Cameron and Trivedi 2005). Para
modelos de datos de conteo panel el propsito es modelar la
sobredispersin a travs de la distribucin binomial negativa y

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

246

un estimador asociado de los parmetros. El estimador de


Mxima verosimilitud no es consistente cuando las variables
explicativas estn en un contexto dinmico o en modelos de
datos panel con variables de conteo como estrictamente
exgenas. Su principal aplicacin recae en economa de la salud y
modelos de patentes. En la literatura acadmica, aunque existen
desarrollos y aproximaciones, en la actualidad no existe una
metodologa clara de implementacin de modelos paneles
dinmicos sobre datos de conteo modelados binomiales
negativos.
PANEL DINMICO TOBIT
La metodologa TOBIT trabaja sobre modelos censurados y
truncados de regresin. Este tipo de modelos generalmente
aplica cuando la variable explicativa es continua pero la masa de
probabilidad tiene uno o ms puntos restringidos. Dentro de la
literatura se reconocen modelos truncados, cuando las
observaciones se encuentran fuera del rango especfico y estn
totalmente perdidas dentro de la seleccin de la muestra, los
modelos censurados, por otra parte, dentro del espacio muestral
se encuentran representado de alguna manera dentro de alguna
de las variables explicativas. La representacin de la variable
dependiente es de la siguiente forma:
y si y > 0
y={
0 si y 0
La metodologa de estimacin generalmente utiliza tcnicas por
mxima verosimilitud (MLE), sin embargo, tiene deficiencias
sobre efectos individuales y observaciones iniciales.
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

247

Adicionalmente, tiene una alta complejidad que en algunos casos


lo hace inmanejable (HSIAO Pag. 259). Otros autores Arellano
Bowe, Labeaga (1999) han desarrollado metodologas
alternativas pero no han alcanzado una importante acogida
dentro de la comunidad acadmica por su complejidad
computacional.
PANEL DINMICO POISSON
La metodologa XTDINAMPOISSON es un programa que estima
modelos dinmicos de datos de conteo utilizando regresiones de
Poisson en un ambiente agrupado. En el modelamiento de datos
de conteo, donde existe una naturaleza no lineal producida por
resultados de su variable dependiente como discreta y no
negativa (y=m>0), el mtodo generalizado de momentos GMM
es implementado40. Su aplicacin principalmente se destina a
las aplicaciones hacia economa de la salud y riesgo operativo.
Esta modelo, con el objetivo de incluir estructuras panel, realiza
el agrupamiento o clustering para la estimacin de los
parmetros. Se asume que las observaciones sobre los
individuos provienen de la misma familia (cluster) y estn
correlacionados con otros individuos, pero no existe agrupacin
entre diferentes clusters. En un contexto panel se puede asumir
que las observaciones sobre el mismo individuo son las mismas
en dos periodos distintos de tiempo. Adicionalmente, se incluye
una estructura panel sobre instrumentos GMM con la seleccin
de rezagos, en este caso un periodo. Los resultados son
estimadores consistentes en una estructura agrupada. Aunque
esta metodologa desarrollada por Hansen (1982) es potente en
40

El estimador de Variables Instrumentales (IV) es un caso especial del Mtodo Generalizado de Momentos (GMM)

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

248

sus resultados, en algunos casos puede generar sesgo, en


particular con muestras pequeas, regresores altamente
persistentes en su estructura dinmica y cuando los
instrumentos GMM son predictores dbiles de las variables
endgenas. Algunos autores resaltan el efecto positivo de el
feedback dinmico sobre el problema de inflacin de ceros, y por
tanto, colaborar en la solucin de la sobredispersin (Cameron &
Trivedi).
Dentro del programa se incluye una prueba de identificacin y el
estadstico de Wald. En relacin al primero, en el Contexto GMM,
las restricciones de sobreidentificacin pueden ser probadas
empleando el estadstico J de Hansen (1982) que evala la
idoneidad del modelo. Rechazar la hiptesis nula implica que los
instrumentos seleccionados no satisfacen las condiciones de
ortogonalidad requeridas para su empleo, con el siguiente
estadstico:

PANEL PROBIT MULTINOMIAL ORDENADO


La metodologa REGOPROB es un programa que estima
MODELOS GENERALIZADOS PROBIT ORDENADOS CON
EFECTOS ALEATORIOS. La caracterstica de estos modelos parte
de tomar en la variale dependiente un ordenamiento donde
valores mas altos corresponde a un mayor resultado, es decir, si
se tiene una escala de 1 a 5, 5 es mayor que 4, 4 mayor que 3, y
as sucesivamente. Aplicaciones de estos modelos se encuentran
en medicin de bienestar o modelos de riesgo de crdito. El
modelo generalizado relaja el supuesto de regresiones
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

249

paralelas41 sobre modelos probit estndar al soportar


restricciones lineales y permite parcialmente especificar
variables independientes (nl) o de todas las variables
explicativas (pl). La funcin de verosimilitud para cada unidad
utiliza un mtodo de optimizacin numrica por cuadratura
Gauss-Hermite42, regoprob es una generalizacin de goprobit.
VII. VENTAJAS Y DESVENAJAS DEL MODELO DE DATOS
PANELES
La tcnica de datos panel presenta una serie de ventajas y
desventajas en comparacin con los modelos de series de tiempo
y de corte transversal. Las ms relevantes son las siguientes
ventajas:
1. Permite disponer de un mayor nmero de observaciones
incrementando los grados de libertad y reduciendo la
colinealidad entre las variables explicativas y, en ltima
instancia, mejorando la eficiencia de las estimaciones
economtricas.
2. Permite capturar la heterogeneidad no observable ya sea
entre unidades individuales de estudio, como en el tiempo.
Con base en lo anterior, la tcnica permite aplicar una serie
de pruebas de hiptesis para confirmar o rechazar dicha
heterogeneidad y cmo capturarla.
3. Los datos panel suponen, e incorporan en el anlisis, el
hecho que los individuos, firmas, bancos o pases son
Este supuesto parte que todas las razones de probabilidad (odds ratio) son las mismas evaluando la variable dependiente sobre cualquier valor
de m (y=m). tambin se conoce como supuesto de proporcionalidad de razones de probabilidad. En trminos prcticos, suponga un modelo con
variables de edad y escolaridad. Este supuesto indica que cambios en la edad tiene el mismo efecto sobre las razones de probabilidad que
escolaridad.
42 El mtodo de quadratura Gauss-Hermite, constituye una variante de considerable importancia en la tcnica general de interpolacin pues
permite optimizar el clculo efectivo de integrales sobre intervalos incluso infinitos. La principal funcionalidad es la solucin eficaz de integrales.
Las Cuadraturas Mecnicas o de Gauss demuestran la existencia de cuadraturas estableciendo su forma explcita para intervalos finitos de
integracin. La extensin de estos mtodos a intervalos infinitos fue realizada posteriormente por los franceses Legendre, Laguere, Hermite y
otros.
41

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

4.

5.

6.

7.

250

heterogneos. Los anlisis de series de tiempo y de corte


transversal no tratan de controlar esta heterogeneidad
corriendo el riesgo de obtener resultados sesgados.
Permite estudiar de una mejor manera la dinmica de los
procesos de ajuste. Esto es fundamentalmente cierto si se
analiza el grado de duracin y permanencia de ciertos
niveles, caractersticas o efectos (por ejemplo, medidas
regulatorias, pobreza, desempleo, etc.).
Permite elaborar y probar modelos relativamente
complejos de comportamiento en comparacin con los
anlisis de series de tiempo y de corte transversal. Un
ejemplo claro de este tipo de modelos, son los referencias a
medir niveles de eficiencia tcnica por parte de unidades
econmicas individuales (empresas, bancos, etc).
Una ventaja de la metodologa de paneles de datos es el
incremento en la precisin de estimacin. Este es el
resultado del incremento en el nmero de observaciones
combinando o agrupando (pooling) distintos periodos de
tiempo para cada individuo. Sin embargo, para validar la
inferencia estadstica se necesita controlar la probable
correlacin de errores del modelo de regresin sobre el
tiempo para un individuo. En particular, la forma usual de
estimacin por mnimos cuadrados de los errores standard
en una regresin agrupada por OLS (pooled) tpicamente
exagera las ganancias en la precisin, conduciendo a
subestimar errores estndar y t estadsticos que pueden ser
exagerados.
Los datos panel tienen la posibilidad de estimaciones
consistentes del modelo de efectos fijos, los cuales permiten
que la heterogeneidad individual no observada pueda estar

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

8.

251

correlacionada con los regresores (endogeneidad). Tal


heterogeneidad no observada conduce al sesgo por
variables omitidas que debe ser corregido por mtodos de
variables instrumentales (IV) utilizando nicamente una
sola seccin de corte transversal (t=1), pero en la prctica
es difcil obtener un instrumento vlido. Los datos panel
cortos ofrecen un camino alternativo, como se observ
anteriormente, para proceder si un efecto especifico
individual no observado es asumido e invariante en el
tiempo.
Proporcionan la posibilidad de generar pronsticos ms
acertados para resultados individuales que las series
individuales aisladas. Si el comportamiento individual es
similar sobre ciertas variables, lo datos panel proporcionan
la posibilidad de aprender el comportamiento individual,
observando el comportamiento de otros, adicionalmente, la
informacin temporal de su comportamiento individual
(variacin between y within). De esta forma, es ms
ajustada que la utilizada si existiera una descripcin del
comportamiento individual obtenida por los datos
agrupados (pooling data).

Desventajas:
1. En trminos generales, las desventajas asociadas a la tcnica
de datos panel se relacionan con los procesos para la
obtencin y el procesamiento de informacin estadstica
sobre las unidades individuales de estudio, cuando esta se
obtiene por medio de encuestas, entrevistas o utilizando
algn otro medio de levantamiento de los datos. Ejemplos
de este tipo de limitaciones son cobertura de la poblacin de
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

2.

252

inters, porcentajes de respuesta, preguntas confusas,


distorsin deliberada de las respuestas, etc., que causa
impacto en la construccin y balanceo de las bases de datos,
errores y variables omitidas.
El poder de los datos panel radica en la capacidad de aislar
efectos de acciones especficas, tratamientos o polticas.
Para cumplir con este propsito debe estar condicionado
con la estructura de datos. La informacin utilizada puede
demostrar cmo cada uno los i-esimos agentes econmicos
a travs del tiempo (t) pueden ser influenciados desde
diferentes factores, la lista puede ser infinita, de tal forma,
que es necesario permanezcan aquellos factores que se
creen tiene un impacto significativo. Sin embargo, si factores
de efectos individuales o especficos en el tiempo existen
entre los cortes transversales o las series de tiempo no son
capturadas por las variables explicativas puede conducir a
heterogeneidad en los parmetros en la especificacin del
modelo. Ignorar tal heterogeneidad conduce a estimaciones
inconsistencias o sin sentido. Esto es conocido como sesgo
de heterogeneidad. Se pueden observar desde dos puntos
de vista (HSIAO 2003).
Caso 1. Interceptos heterogneos (ij), pendientes
homogneas (i=j).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

253

Las elipses con lneas punteadas representan el punto de


dispersin (nube de puntos) para un individuo sobre el
tiempo, y la lnea recta punteada representa las regresiones
individuales. Las lneas solidas sirven para demostrar la
regresin por mnimos cuadrados (OLS) ejecutada por el
modelo de panel de datos. Cada una de las figuras 1.1, 1.2 y
1.3., expone un sesgo para la metodologa de datos
agrupados (pooled) debido a la heterogeneidad de los
interceptos. En cada uno de estos casos una regresin
agrupada (pooled) ignora la heterogeneidad de los
interceptos, y no debera ser utilizada. Adicionalmente, el
sesgo de la pendiente general estimada, o la lnea gruesa, no
puede ser determinada de forma a priori.
Caso 2. Interceptos heterogneos (ij) y pendientes
heterogneas (ij).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

254

Los puntos de dispersin, como en las figuras 1.1. y 1.2., no


se muestran y los nmeros en crculos significan las
unidades individuales (i) donde la regresin ha sido
incluida en el anlisis. Por ejemplo, en la figura 1.4., un
agrupamiento sencillo de las NT observaciones, asumiendo
parmetros idnticos para todas las unidades de corte
transversal conducira a resultados sin sentido en razn a
que representara un promedio de coeficientes que difieren
en gran medida a travs de los individuos (i). La figura 1.5.,
tampoco tiene sentido en una figura agrupada, causado por
la falsa inferencia en la relacin agrupada (pooled) ya que
su forma es curvilnea para efectuar un adecuad
agrupamiento de los individuos, de este modo, el supuesto
de homogeneidad no tiene sentido.
BIBLIOGRAFIA
Cameron, C. & P. Trivedi. Microeconometrics: Methods &
Applications, Cambridge U. Press, 2005
Hilbe, J. Negative Binomial Regression. 2006
Hsiao, C. Analysis of Panel Data. Editorial: Cambridge University
Press. 2003
Long, J. Scott. Regression Models for Categorical and Limited
Dependent Variables. 1997.
Wooldridge, J. Econometric Analysis of Cross Section and Panel
Data. 2002
Winkelmann, R. Econometric Analysis of Count Data. Springer.
2008.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

255

ANALISIS DE SERIES DE TIEMPO

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

256

En 1970, Box y Jenkins desarrollaron un cuerpo metodolgico


destinado a identificar, estimar y diagnosticar modelos dinmicos
de series temporales en los que la variable tiempo juega un papel
fundamental, conocidos como modelos ARIMA.
La metodologa de anlisis ARIMA es slo una pequea parte de
lo que se conoce normalmente como Econometra de Series
Temporales pero, sin duda alguna, una de las ms utilizadas y
germen de otros muchos desarrollos posteriores.
Esta metodologa permite que los propios datos temporales de la
variable a estudiar indiquen las caractersticas de la estructura
probabilstica subyacente y ayuden a pronosticar (su meta
principal).
Los procedimientos se han contrapuesto a la llamada
econometra estructural, es decir, a la especificacin de modelos
economtricos apoyada en las teoras subyacentes.
Sin embargo, hoy en da estos conceptos y procedimientos
constituyen una herramienta para apoyar y complementar los
conocimientos economtricos tradicionales que un modo
alternativo de hacer econometra.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

257

Por otro lado, la utilizacin de modelos ARIMA se restringe a


series largas y de alta frecuencia (meses, semanas, das,.) y su
utilidad para pronstico a corto plazo pero no para la
comprensin estructural del fenmeno o la simulacin de
escenarios.
SERIES
TEMPORALES:
COMPOSICIN
DE
PATRONES
SISTEMTICOS Y ESTOCASTICOS
El enfoque de anlisis temporal de una serie descansa siempre, en
mayor o menor medida, en la idea genrica que una serie
temporal de datos puede descomponerse en una serie de
componentes parciales que agregados conforme a un esquema de
suma o multiplicacin y configuran el aspecto global de la serie
observada.
Suele as afirmarse que cualquier serie de datos temporales
proviene de la agregacin de cuatro patrones de evolucin de sus
datos: tendencia, ciclo, estacionalidad y componente estocstico o
no sistemtico.
SERIE COMPUESTA POR TENDENCIA, ESTACIONALIDAD Y
COMPONENTE ALEATORIA

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

258

Ciclo: Patrn de evolucin que revela cierta propensin de la serie


a repetir a muy largo plazo una misma secuencia de
comportamientos tendenciales.
Por ejemplo....
Ciclos de crecimiento intertrimestral de la economa americana puede sealarse
que, a principios de 2000, el ciclo econmico de crecimiento no haba
terminado.

2000

1995

1990

1985

1980

1975

1970

10%
8%
6%
4%
2%
0%
-2%
-4%

Componente tendencial: Generalmente asociado con el cambio en


la media a lo largo del tiempo. Se identifica la tendencia con el

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

259

patrn de evolucin sostenido a medio o largo plazo por encima


de la existencia de movimientos a corto plazo
Por ejemplo....
La representacin de los ndices burstiles DOW JONES, IBEX y NIKKEI revelan
en el caso del DOW JONES e IBEX la tendencia de la cotizacin de los ndices ha
sido creciente durante los ltimos 15 aos y especialmente acelerada desde
mediados de 1995.

Estacionalidad: Patrn de evolucin de la serie que se repite de


forma ms o menos invariable en momentos similares de espacio
temporal mayor, generalmente un ao.
Por ejemplo....
Observando la serie mensual de ventas de artculos de navidad puede comprobarse
como existe una marcada estacionalidad, especialmente en el perodo de finde ao.
250000
200000
150000
100000

2000

1999

1998

1997

1996

1995

50000

Innovacin, o componente aleatorio o no sistemtico: Porcin no


sistemtica del comportamiento temporal de una serie, o al
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

260

menos movimiento que no puede catalogarse como estacional,


tendencial y/o cclico.
La idea bsica del anlisis de series consiste en que cada uno de
estos componentes puede ser analizado de forma separada para
posteriormente, agregar los anlisis parciales en un resultado
conjunto.
En ocasiones, el anlisis se centra slo en alguno de los
componentes sistemticos por separado (la tendencia, la
estacionalidad, el ciclo).
En otras ocasiones, como es el caso del modelamiento de series
de tiempo, lo que interesa es ir ms all de los componentes
cclicos, tendenciales y estacionales, estudiando el componente
no sistemtico, de carcter aparentemente aleatorio, para tratar
de identificar algn patrn de inters en su evolucin que ayude a
entender la progresin de la serie completa.
As pues, la aplicacin de modelos de series de tiempo suele
realizarse por descomposicin, analizando en primer lugar la
tendencia de la serie, pasando despus a observar la
estacionalidad y concentrndose despus en la identificacin del
componente estocstico o no sistemico.
DEFINICIONES BSICAS PARA APROXIMARSE A LOS MODELOS
AUTOREGRESIVOS INTEGRANDOS DE MEDIA MVIL (ARIMA)

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

261

Un proceso estocstico es una sucesin de variables aleatorias Yt


ordenadas, pudiendo tomar t cualquier valor entre el intervalo
abierto (-, ). Por ejemplo, la siguiente sucesin de variables
aleatorias puede ser considerada como proceso estocstico:

Y -5 , y-4 , y-3 , y-2 ,........ y3 , y4


El subndice t no tiene, en principio, ninguna interpretacin a
priori, aunque si se habla de proceso estocstico en el contexto
del anlisis de series de tiempo este subndice representar el
paso del tiempo.
Definicin. Proceso estocstico. Conjunto de variables aleatorias
(Yt)tI , donde el ndice t toma valores en un conjunto I. Llamamos
trayectoria del proceso a una realizacin del proceso estocstico.
Si I es discreto, el proceso es en tiempo discreto. Si I es continuo,
el proceso es en tiempo continuo.
SERIE DE TIEMPO Y PROCESO ESTOCSTICO
Una serie de tiempo es una realizacin de un proceso estocstico
terico con valores discretos ajustado a una serie real.
El anlisis de series de tiempo tratar, a partir de un modelo
teorico inferir las caractersticas de la estructura probabilstica
subyacente del verdadero proceso estocstico conocido como
proceso generador de datos (PGD).
Definicin. Serie de tiempo. Es la realizacin de un proceso
estocstico en tiempo discreto donde los elementos de I estn

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

262

ordenados y corresponden a instantes equidistantes del tiempo.


Es decir:
Si I = {1, . . . , n}, la serie es y1, y2, . . . , yn;
Si I = , la serie es y0, y1, y2, . . . ,;
Si I = , entonces la serie es . . . , y2, y1, y0, y1, y2....
Una serie temporal describe la evolucin aleatoria de una
variable en el tiempo.
Definicin. Funcin de medias. La funcin de medias de un
proceso estocstico (Yt)tI es una funcin de t que proporciona
las esperanzas de las variables Yt para cada t.

Definicin. Funcin de varianzas. La funcin de varianzas de un


proceso estocstico (Yt)tI es una funcin de t que proporciona
las varianzas de las Yt para cada t.
Definicin. Funcin de autocovarianzas. La funcin de
autocovarianzas de un proceso estocstico (Yt)tI es una funcin
que describe las covarianzas entre las variables del proceso en
cada par de instantes. Por ejemplo:

Definicin. Funcin de autocorrelacin. La funcin de


autocorrelacin de un proceso estocstico (Yt)tI es una funcin

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

263

de dos instantes que describe las correlaciones entre las


variables en un par de instantes ti, tjI cualesquiera.
Definicin. Funcin de autocorrelacin simple (FAS). Es la
funcin de autocorrelacin entre dos variables separadas por h
instantes para series estables en autocovarianza. Se denota por
h. Proporciona las correlaciones en funcin del rezago h.
Definicin. Funcin de autocorrelacin parcial (FAP). Mide el
aporte de las variaciones de una variable Yt frente a otra
variable, aislados los efectos de las restantes variables. Por
ejemplo, sea la variable Yt rezagada un periodo, Yt-1. La funcin
de autocorrelacin simple (FAS) ignora el hecho que parte de la
correlacin que pueda existir entre yt y yt-2, se debe a que ambas
estn correlacionadas con yt-1. Los coeficientes de
autocorrelacin parcial de los modelos tericos se denotan como
kk.
KK, y los estimados para nuestra muestra como
Definicin. Matrices de autocovarianzas y de autocorrelaciones de
orden h. Las matrices de autocovarianzas y autocorrelaciones de
orden h son:
Matriz de covarianzas

|Facultad de Economa |Carlos Mendoza Astroz|

Matriz de correlaciones

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

264

PROCESO ESTOCSTICO ESTACIONARIO EN SENTIDO FUERTE.


Suponga que cada una de las variables Yt que configuran un
proceso estocstico tendrn su propia funcin de distribucin con
sus correspondientes momentos.
As mismo, cada conjunto de variables tendrn su
correspondiente funcin de distribucin conjunta y sus funciones
de distribucin marginales de probabilidad.
Se dice que un proceso estocstico es estacionario en sentido
estricto o fuerte si las funciones de distribucin conjuntas (no
slo la esperanza, las varianzas o las autocovarianzas, sino las
funciones de distribucin completas) son constantes, o dicho con
ms propiedad, son invariantes con respecto a un desplazamiento
en el tiempo (variacin de t).
Definicin. Proceso estocstico estacionario en sentido fuerte. Un
proceso es estacionario en sentido estricto si al realizar un mismo
desplazamiento en el tiempo de todas las variables de cualquier
distribucin conjunta finita, resulta que esta distribucin no vara,
es decir:
Para todo conjunto de ndices (i1, i2, ..., ir) y todo j.
PROCESO ESTOCSTICO ESTACIONARIO EN SENTIDO DBIL
La definicin de estacionariedad en sentido estricto puede
relajarse
sustancialmente
utilizando
la
denominada
estacionariedad en sentido dbil. Se dice que un proceso
estocstico es dbilmente estacionario si:
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

a.

265

Las esperanzas matemticas de las variables aleatorias no


dependen del tiempo, son constantes:

E[ Y t ] = E[ Y t+m ] m
b.

Las varianzas no dependen del tiempo (y son finitas):

Var[ Y t ] = Var[ Y t+m ] m


c.

Las autocovarianzas entre dos variables aleatorias del


proceso correspondientes a perodos distintos de tiempo
(distintos valores de t) slo dependen del lapso de tiempo
transcurrido entre ellas:

Cov( Y t ,Y s ) = Cov( Y t+m ,Y s+m ) m


De esta ltima condicin se desprende que si un fenmeno es
estacionario sus variables pueden estar relacionadas linealmente
entre si, pero de forma que la relacin entre dos variables slo
depende de la distancia temporal k transcurrida entre ellas.
Definicin. Proceso estocstico estacionario en sentido dbil. Un
proceso estocstico es estacionario en sentido dbil existe si
mantiene constantes todas sus caractersticas de sus momentos a
lo largo del tiempo, es decir, si para todo t:

PROCESO ESTOCSTICO RUIDO BLANCO (WHITE NOISE)

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

266

En este contexto, un proceso ruido blanco es una sucesin de


variables aleatorias (proceso estocstico) con esperanza
matemtica nula (cero), varianza constante, y covarianzas nulas
para distintos valores de t. Es un caso particular de un proceso
estacionario en sentido dbil.

Definicion. Proceso estocstico ruido blanco. Es un proceso


estacionario t que cumple las siguientes caractersticas:

Se puede interpretar un proceso ruido blanco como una sucesin


de valores sin relacin alguna entre ellos, oscilando en torno a la
media cero dentro de un margen constante.
Si adems Yt es un proceso normalmente distribuido, entonces
todas las variables del proceso son independientes. En este caso,
(Yt) se llama ruido blanco normal.
En este tipo de procesos implica que conocer valores pasados no
proporciona ninguna informacin sobre el futuro ya que el
proceso es puramente aleatorio y por consiguiente carece de
memoria, tambin es conocido como procesos de memoria corta.
GRAFICO. PROCESO RUIDO BLANCO

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

267

PROCESO ESTOCSTICO PASEO ALEATORIO (RANDOM WALK)


Un paseo aleatorio est definido por:

Este es un tipo de proceso estocastico no estacionario (existen


cambios en su media y varianza a lo largo del tiempo) implica que
el efecto de cualquier suceso que ocurra en el pasado se queda
para siempre impactando la dinmica de la serie, tambin es
conocido como procesos de memoria Larga.
Esta es una diferencia clave respecto a los procesos estacionarios,
donde el impacto de lo ocurrido en el pasado remoto tiende a
desaparecer, en la medida en que los parmetros estimados se
hacen ms pequeos.
GRAFICO. PROCESO PASEO ALEATORIO

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

268

ESTRUCTURA DE MODELOS ARMA


Los modelos de series de tiempo tratarn de expresar la
evolucin de una variable Yt de un proceso estocstico en funcin
del pasado de esa variable o de impactos aleatorios que esa
variable sufri en el pasado.
Para ello, se utilizarn dos tipos de formas funcionales lineales
sencillas. La primera los modelos autorregresivos (AR). La
segunda, modelos de Medias Mviles (MA).
MODELOS AUTORREGRESIVOS AR(P)
Definimos un modelo AR (autorregresivo) como aquel en el que la
variable endgena de un perodo t es explicada por las
observaciones de ella misma correspondientes a perodos
anteriores (parte sistemtica) ms un trmino de error ruido
blanco (innovacin).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

269

Los modelos autorregresivos se abrevian con la palabra AR tras la


que se indica el orden del modelo: AR(1), AR(2),....etc.
El orden del modelo expresa el nmero de observaciones
rezagadas de la serie de tiempo analizada que intervienen en la
ecuacin. As, por ejemplo, un modelo AR(1) tendra la siguiente
expresin:

Y t = 0 + 1Y t -1 + at
La expresin genrica de un modelo autorregresivo, no ya de un
AR(1) sino de un AR(p) sera la siguiente:
Y t = 0 + 1Y t -1 + 2 Y t -2 + ......+ p Y t - p + at

Esta forma funcional se acompaa de una serie de restricciones


conectadas con importantes hiptesis analticas:
a. La correlacin entre una variable y su pasado va
reducindose a medida que nos alejamos ms en el tiempo
(proceso ergdico).
b. La magnitud de los coeficientes est limitada en valor
absoluto. As, por ejemplo, en el caso de un AR(1), el
coeficiente autorregresivo de un proceso estocstico
estacionario ha de ser inferior a 1 en valor absoluto. En el
caso de un AR(2), es la suma de los dos coeficientes la que no
puede exceder la unidad. Estas restricciones expresadas en
los coeficientes conectan con las propiedades de
estacionariedad del proceso analizado o, dicho de otro modo:
slo los modelos cuyos coeficientes que respetan una serie
de condiciones (que dependen del orden p del modelo)

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

270

representan procesos estocsticos estacionarios y, por tanto,


tienen utilidad analtica.
OPERADOR Y POLINOMIO DE REZAGOS
El operador rezago Lp aplicado al valor Yt de una determinada
serie devuelve el valor de esa serie rezagado p observaciones. Es
decir:
LpYt=Yt-p
Un polinomio de rezagos de orden p p(L) se compone de una
sucesin de p operadores de rezagos con sus respectivos
coeficientes:

p (L) = 1 - 1 L - 2 L2 - ...... - p L p
El polinomio de rezagos permite abreviar la expresin de un
modelo AR(p) escribindose:

p (L)Y t = 0 + at
La utilidad del polinomio de rezagos no es permitir una notacin
abreviada. Las caractersticas del polinomio de rezagos o, ms
concretamente, el valor de sus races caractersticas (soluciones
del polinomio) permiten analizar las propiedades de
estacionariedad del proceso estocstico que subyace al modelo
ARIMA.
Es decir, se pueden evaluar caractersticas relevantes del proceso
estocstico que se est modelando estudiando las propiedades
matemticas del polinomio de rezagos de ah su utilidad.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

271

MODELO DE MEDIAS MVILES MA(Q)


Un modelo de medias mviles (MA) es aquel que explica el valor
de una determinada variable en un perodo t en funcin de un
trmino independiente y una sucesin de trminos de error o
innovaciones correspondientes a perodos precedentes,
convenientemente ponderados.
Estos modelos se denotan normalmente con las siglas MA,
seguidos, como en el caso de los modelos autorregresivos, del
orden entre parntesis.

As, un modelo con q trminos de error MA(q) respondera a la


siguiente expresin:

Y t = + at + 1 at -1 + 2 at -2 + ....+ q at -q
Que de nuevo puede abreviarse utilizando el polinomio de
rezagos (como en el caso de los modelos AR):

Y t = q (L) at +
Qu significa que una variable aleatoria se explique en funcin
de los errores cometidos en perodos precedentes?, De dnde
proceden esos errores? Cul es la justificacin de un modelo de
este tipo?

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

272

En realidad, un modelo de medias mviles (MA) puede obtenerse


a partir de un modelo autorregresivo al realizar sucesivas
sustituciones:
Y t = Y t -1 + a t Y t -1 = Y t - 2 + a t -1
Y t = at + at -1 + Y t -2 ........
2

...........Y t = at + at -1 + at -2 + at -3 + ....+ at - j +
2

PROCEDIMIENTOS DE ANLISIS DE ESTACIONARIEDAD DE


SERIES DE TIEMPO
El estudio de la estacionariedad de las series de tiempo resulta
clave en la prctica para la construccin de un modelo
economtrico. La atencin a la estacionariedad de las series de
tiempo se ha convertido en algo indispensable por varios
motivos, entre ellos:
1. La
deteccin
de
la
no-estacionariedad
resulta
estadsticamente fundamental, ya que la misma afecta de
forma decisiva al uso correcto de muchas de distribuciones
en las etapas de identificacin, contraste y validacin de los
modelos planteados. En ese sentido, no debe olvidarse que
la mayor parte de la teora economtrica est construida
asumiendo la estacionariedad de su materia prima.
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

2.

3.
4.

273

Trata de evitar al mximo que la no estacionariedad de las


variables gue los resultados de las estimaciones de las
relaciones que las unen, provocando la obtencin de
regresiones espurias.
El anlisis de estacionariedad es bsico como etapa previa
en el anlisis de cointegracin, una de las principales
aportaciones a la tcnica economtrica de los ltimos aos.
El concepto de tendencia estocstica frente al tradicional de
tendencia determinista interesa conceptualmente a la teora
econmica y, en especial, en el contexto del anlisis
temporal de los efectos de la poltica econmica sobre las
variables macro.

TENDENCIAS DETERMINISTAS Vs TENDENCIAS ESTOCSTICAS


TENDENCIAS DETERMINISTAS
Cuando se analiza la solucin general a una ecuacin en
diferencias que representa una serie de tiempo, se admite una
descomposicin de la serie en componentes cclico, tendencia,
estacional y estocstico. La principal caracterstica que define al
componente de tendencia frente al estocstico es la presencia de
efectos permanentes sobre la serie de tiempo yt.
En un gran nmero de ocasiones, las series pueden no presentar
componente de tendencia, como es el caso de un proceso
autorregresivo puro AR(1) en el que los coeficientes cumplan las
condiciones de estacionariedad:
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

274

Como se aprecia en el grfico siguiente, este proceso flucta


alrededor del valor medio representado por una lnea horizontal
cruzndolo frecuentemente sin que ningn shock o innovacin
sobre yt se convierta en permanente para valores futuros:
Proceso AR(1) Sin tendencia

Definir la tendencia en una serie de tiempo yt utiliza el siguiente


clculo. Por ejemplo, la serie:
Presenta un patrn dominado fundamentalmente por una
tendencia sea como en los siguientes casos presentados de
formas lineales o cuadrticas:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

275

Este tipo de proceso, se clasifica dentro de aquellos que vienen


definidos por lo que se denomina una tendencia determinista.
Este patrn de evolucin parecera servir adecuadamente al
anlisis de ciertas series econmicas dado que resulta usual
encontrar magnitudes que exhiban perfiles similares a los
presentados.
Esta tendencia de tipo determinista puede combinarse con el
proceso autorregresivo para generar otra variedad de proceso
con tendencia determinista que se denomina proceso
estacionario sobre una tendencia. Su expresin sera la siguiente:
En este caso, el proceso es dominado por la componente de
tendencia sumando a un proceso estacionario, con un valor
razonable de la varianza de t.
Poder distinguir grficamente la su evolucin temporal como un
modelo de tendencia determinista con un componente
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

276

estocstico puro como el presentado en los grficos anteriores


resulta casi imposible.
TENDENCIAS ESTOCSTICAS
Si se observan algunas series en economa, se puede caer en la
tentacin de calificarlas entre aquellas con tendencias
deterministas como las observadas hasta aqu.
Sin embargo, desde la teora econmica sera muy difcil
justificar una tendencia determinista. An a pesar de existir
componentes tendenciales importantes desde el punto de vista
terico, seguramente estos no seran de naturaleza determinista.
Es muy posible, por ejemplo, que la productividad tienda a
crecer de forma natural en la medida en que con el paso del
tiempo se va incorporando mejoras tecnolgicas en procesos
productivos. Sin embargo, ambos procesos tericos no se
producirn, con total seguridad, de una manera invariable,
constante, predecible, determinista, con el paso del tiempo.
Frente a la tendencia determinista surge por tanto la necesidad
de definir un componente de tendencia, con efectos permanentes
en la evolucin de la serie analizada, pero de naturaleza
estocstica.
PASEO ALEATORIO (RANDOM WALK)
El caso ms simple de modelo con tendencia estocstica viene
determinado el paseo aleatorio simple:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

277

Con i ruido blanco. La solucin recursiva de un paseo aleatorio


corresponde a:

Esta expresin permite comprobar que un paseo aleatorio es


estacionario en media por definicin:

Su varianza, sin embargo, no es constante dado que su expresin


corresponde a:

Segn este proceso la varianza se ampla con el paso del tiempo


tendiendo a infinito a medida que t tambin lo hace.
Lo ms interesante de la ecuacin anterior puede observarse
claramente como en cada una de las innovaciones o shocks
definidas como t=(0,1,...,t-1,t) tiene sobre yt un efecto
permanente (o de tendencia) sobre yt pero siempre tratndose
de un elemento de naturaleza aleatoria.
As, la denominada esperanza condicional para yt+s, es decir, el
valor ms probable de yt+s dadas las t realizaciones anteriores
del proceso yt, es precisamente yt para todos los posibles valores
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

278

de t y s. Esto confirma que cualquier innovacin o shock de la


sucesin contenida en:

Tiene una presencia sobre yt+s de la misma intensidad que sobre


yt. Es decir, estamos ante un componente de tendencia.
Existen, en la realidad, fenmenos que se comporten como
paseos aleatorios?. Ntese que, grficamente, el paseo aleatorio
flucta ampliamente sin presentar tendencia a crecer o a
decrecer. Raramente alcanza un valor anterior y ninguna fuerza
tiende a devolverlo a su nivel de equilibrio, cualquiera que sea el
mismo. Es posible encontrar series en economa de esa
naturaleza?

Figura1: Serie SIN tendencia determinista Figura 2: Serie CON tendencia


(No Estacionaria en media )
determinista (No estacionaria en media)

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

12.0000

279

50.0000

10.0000

40.0000

8.0000
6.0000

30.0000

4.0000
2.0000

20.0000

0.0000
-2.0000

10.0000

-4.0000
-6.0000

0.0000

-8.0000

ene-05

ene-04

ene-03

ene-02

ene-01

ene-00

ene-99

ene-98

ene-97

-10.0000
ene-96

ene-05

ene-04

ene-03

ene-02

ene-01

ene-00

ene-99

ene-98

ene-97

ene-96

-10.0000

PASEO ALEATORIO CON DERIVA (TENDENCIA DETERMINISTA


MS TENDENCIA ESTOCSTICA)
El paseo aleatorio con deriva incorpora una constante a0 a la
expresin del paseo simple de la forma:

La expresin deriva se aplica ya que el proceso as definido


experimentar una variacin constante definida por el trmino
a0 dado que la solucin genrica recursiva a la ecuacin anterior
responde a la expresin:

Despus de t perodos, el valor de yt se ve impactado por todas


las innovaciones o shocks pasados y presentes a travs del
trmino de tendencia estocstica al mismo tiempo, de forma
invariable, tambin permanente pero perfectamente conocida,
por el trmino determinista a0t.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

280

A diferencia del paseo aleatorio simple la deriva incluida en este


otro modelo supone que el proceso no slo no ser estacionario
en varianza sino tampoco en media.

Para la varianza se tiene que:

Comparando un paseo aleatorio simple de otro con deriva, el


patrn grfico de evolucin de este tipo de procesos vendr
dominado por la componente tendencial determinista del
mismo. No obstante para muestras pequeas y una varianza de t
suficientemente elevada su aspecto puede confundirse con un
paseo aleatorio sin deriva.

En cualquier caso, si el paseo aleatorio con deriva resulta


grficamente muy similar al presentado al de tendencia
determinista explica como frecuentemente se califican procesos

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

281

deterministas que, probablemente, presenten un componente


con tendencia estocstica.
Solamente para muestras grandes un proceso podr ser
distinguido del otro en la medida en que, aunque el paseo
aleatorio con deriva presentar una marcada evolucin de su
tendencia, por tanto, tender a fluctuar de forma algo ms visible
sobre la lnea de tendencia de lo que lo hara un modelo
determinista puro.
LAS REGRESIONES ESPURIAS
El problema de la aparicin de regresiones espurias en los
resultados de un buen nmero de anlisis econmicos es
siempre atribuido a Granger y Newbold (1974).
Sin embargo, a finales de la dcada de los aos 20, Yule (1926)
ya haba arrojado su particular primera piedra en el Journal of
the Royal Statistical Society con un artculo con el ttulo: Why do
we sometimes get nonsense correlations between time series?
El problema de las regresiones espurias admite como buenas,
relaciones econmicas que en realidad slo se deben a aspectos
casuales.
Por regresin espuria se entiende aquellas ecuaciones de
regresin que presentan una elevada significancia conjunta,
medida en trminos del coeficiente de ajuste R2 o R2 ajustado. Sin
embargo, fuertes problemas de autocorrelacin positiva
reflejados en bajos valores del estadstico Durbin Watson.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

282

La presencia de un trmino de error fuertemente


autocorrelacionado impide efectuar un proceso de inferencia con
mnimas garantas.
La probabilidad de un error en el clculo y en la aplicacin de los
test de significancia individual convencionales es muy
importante, sin contar los problemas de no eficiencia de los
estimadores.
Este tipo de regresiones aparecen cuando se relacionan series de
tiempo no estacionarias y se agudizan cuanto estas estn ms
cercanas a la forma de un paseo aleatorio. Es decir, cuanto ms
evidente sea la presencia de tendencias estocsticas en las series.
La forma ms clara de ilustrar el problema es utilizar los
resultados del ejemplo expuesto por Newbold y Davies (1978) y
Granger y Newbold (1986). Suponga dos variables yt y xt
independientemente generadas por paseos aleatorios:

Donde 1t y 2t son procesos ruido blanco normales estndar


independientes entre s con media cero y varianza unitaria.
Dado que yt y xt estn generadas de forma independiente se debe
esperar que no existiera ninguna relacin significativa entre
ambas.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

283

Sin embargo, sobre un conjunto de 1000 muestras de yt y xt con


50 observaciones, alrededor de un 65% de las regresiones de yt
sobre xt presentan contrastes t significativos a un nivel de
significancia del 5%.
Tal y como expone Enders (1995) basta con comprender las
propiedades de la perturbacin aleatoria de la regresin de yt
sobre xt para apreciar lo inconsistente de estos resultados.
Efectivamente, en la regresin:
Es claro que, prescindiendo de la constante a0:

Por lo que imponiendo las restricciones iniciales y0=x0=0 se


tiene que:

Por tanto, se est ante una sucesin t no estacionaria en


varianza. Si esto es as, t presenta una tendencia estocstica, lo
que quiere decir que el error cometido en t no se diluye en t+1,
t+2... t+s. Es imposible que una regresin en la que los errores se
acumulan de forma permanente pueda tener algn inters.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

284

Ntese que en esta situacin se violan un buen nmero de


hiptesis bsicas asumidas en los procesos de inferencia
habituales en el contexto del Modelo Bsico de Regresin Lineal:
1. La varianza de t no es constante. Como se demostr
anteriormente la varianza se incrementa hacia el infinito a
medida que el tamao de muestra t crece.
2. Existe correlacin serial. La misma expresin para t puede
utilizarse para comprobar como la correlacin entre t y t+1
tiende a uno a medida que t se incrementa.
3. Si la serie xt no es estacionaria, no satisface la propiedad:

Dada semejante acumulacin de errores, ningn test de


significancia puede ser usado con garantas y por ello, ninguna
inferencia ser fiable.
Las regresiones espurias, no obstante, no slo se producen por la
aparicin de tendencias estocsticas en las series. Las tendencias
deterministas tambin pueden ser un problema.
Si se construye una serie yt lineal (1,2,3,4..... 50) y se hace
depender de otra xt con tendencia cuadrtica (1,4,.......502) el
resultado en trminos de R2 es 0,94 cuando en realidad el patrn
de evolucin de la serie cuadrtica acabar por divergir de forma
definitiva cuando el nmero de datos tienda a infinito.
Desde el primer momento, y an de forma intuitiva, la utilizacin
de tasas o primeras diferencias se utiliza en las series de cara a
mitigar los efectos negativos en este tipo de situaciones.
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

285

Es indudable, efectivamente, que este fenmeno sucede con


mayor facilidad cuando son utilizados series en niveles, dado que
los cambios sobre el nivel se producen de forma mucho ms
suave generando series con patrones tendenciales ampliamente
comunes y fcilmente predecibles.
El problema, no obstante, no reside en una cuestin de niveles o
tasas, sino en el concepto de estacionariedad de la serie de
tiempo.
CONCEPTO DE INTEGRACIN
Si se toma un paseo aleatorio (random walk) y es expresado en
primeras diferencias se comprueba que, adems de seguir
siendo estacionario en media, se convierte tambin en un
proceso estacionario en varianza, es decir:

En el caso de un paseo aleatorio con tendencia determinista (con


deriva) la diferenciacin permite tambin convertir la serie en
estacionaria tanto en media como en varianza:

Adems:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

286

Se puede as mismo comprobar como las covarianzas para


observaciones del proceso separadas un determinado rezago jesimo slo dependen del valor de ese rezago. Es decir, se puede
comprobar que ambos procesos diferenciados cumple con
estacionariedad en sentido dbil.
La idea de que la diferenciacin corrige los problemas derivados
de la presencia de tendencias estocsticas y deterministicas.
Puede generalizarse matemticamente del siguiente modo.
Suponga el caso general de un modelo ARIMA del tipo:
En el que se supone la presencia de una raz unitaria en el
polinomio de rezagos A(L), mientras que se mantienen las
condiciones de estacionariedad para el proceso definido sobre t
mediante el polinomio L(B), o sea, se supone que todas sus
races caen fuera del crculo unitario.
Si el polinomio A(L) tiene efectivamente una raz caracterstica
puede ser factorizado y expresarlo de la forma:
Donde ahora A(L) ser un polinomio de orden inferior en una
unidad al original A(L), es decir, p-1. La principal caracterstica
de este nuevo polinomio es que ya no contiene una raz unitaria,
por tanto, todas sus races caen fuera del crculo unitario. La
ecuacin original del modelo ARIMA quedara ahora:
O lo que es igual:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

287

Incluyendo la diferenciacin sobre la variable yt se tiene que:


Por tanto, la diferencia de un proceso con una raz unitaria es
ahora estacionaria y lo mismo ocurre cuando se esta ante dos
races unitarias, si se toman diferencias dos veces o ante d races
unitarias si se efectuan d diferencias. Por ejemplo, suponga el
siguiente proceso:
Este puede expresarse como:

Utilizando los polinomios de rezagos resulta:


El polinomio de rezagos de la parte autorregresiva contiene una
raz unitaria por lo puede escribirse como:

Es interesante observar que no es necesario que yt siga un paseo


aleatorio puro. Si en un proceso del tipo:
La perturbacin aleatoria no fuera ruido blanco sino que siguiera
un proceso autorregresivo de la forma:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

288

La primera diferencia de yt dara una serie estacionaria siempre


y cuando fuera menor que la unidad en valor absoluto.
Definicin. Serie integrada de orden d. Se dice que una serie yt no
estacionaria es integrada de orden d, se representa como
yt~I(d), cuando puede ser transformada en una serie
estacionaria diferencindola d veces. Siguiendo la definicin
dada por Engle y Granger (1987), una serie sera integrada de
orden d si admite una representacin ARMA estacionaria e
invertible despus de ser diferenciada d veces.
Un proceso ruido blanco, por ejemplo, o una serie AR(1) con
coeficiente menor que la unidad son series I(0). Una serie que
siga un paseo aleatorio es, sin embargo, una serie I(1). Granger
(1986) y Engle y Granger (1987) caracterizaron las series I(0)
frente a las I(1) de la siguiente forma:
PROCESO INTEGRADOS Vs NO INTEGRADOS

Sin embargo, la diferenciacin de una serie para convertirla en


estacionaria slo es adecuada cuando se encuentra ante
tendencias estocsticas, nunca cuando existen tendencias
deterministas.
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

289

En ese caso, el procedimiento habitual para eliminar la tendencia


terministica parte de aplicar sobre la serie original un filtro
adicional.
Se estima la regresin de la serie no estacionaria yt sobre un
trmino de tendencia determinista obtenindose una estimacin
de la serie original yt.

Es suficiente entonces con trabajar con la serie transformada:


En el grfico siguiente (en azul) puede observarse como la serie
original presenta una tendencia lineal creciente que puede ser
estimada (representada) con la lnea discontinua (tendencia).
La serie corregida (filtrada) de tendencia reproduce exactamente
las mismas variaciones que la serie original pero sin mostrar
tendencia alguna.
Estimacin de tendencia y serie filtrada de tendencia
Serie Original

Tendencia

Serie (sin) "filtrada de" tendencia

800,00
600,00
400,00
200,00
0,00
-200,00

|Facultad de Economa |Carlos Mendoza Astroz|

96

91

86

81

76

71

66

61

56

51

46

41

36

31

26

21

16

11

-400,00

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

290

GENERACIN LA SERIE FILTRADA DE TENDENCIA


Para realizar un filtro de tendencia, se asume que la tendencia
(Tt) es un componente que se agrega a la serie sin tendencia
(YSTt) generando la serie original (Yt). En el grfico anterior, la
serie original (en azul) es la suma de los valores de la serie sin
tendencia (en rojo) ms los valores de la tendencia (lnea
discontinua):

yt Tt YSTt

Para calcular los valores de la tendencia en cada perodo se


efectua una regresin simple de la serie en funcin contra una
variable de tiempo t (1,2,3,4,). El residuo de esta regresin
ser la serie filtrada de tendencia.
La nica decisin a considerar ser el tipo de funcin matemtica
que mejor ajusta la tendencia de la serie (lineal, parablica,
exponencial, etc).
SERIES
CON
DISTINTOS
TIPOS
DE
TENDENCIA:
REPRESENTACIN GRFICA Y FUNCIN MATEMTICA A
ESTIMAR
TENDENCIA Potencial
Serie Potencial

TENDENCIA Exponencial

Ajuste

Serie Exponencial

200000,00

Ajuste

80000,00
70000,00

150000,00

60000,00
50000,00

100000,00

40000,00

50000,00

30000,00
20000,00

0,00

10000,00
0,00

-50000,00

-10000,00

-100000,00

yi a tib ui

|Facultad de Economa |Carlos Mendoza Astroz|

99

92

85

78

71

64

57

50

43

36

29

22

15

99

92

85

78

71

64

57

50

43

36

29

22

15

-20000,00

yi a bt ui

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

TENDENCIA Logartmica
Serie Logartmica

291

TENDENCIA Polinomica
Tendencia Polinmica

Ajuste

40,00

100,00

35,00

80,00

30,00

Ajuste

60,00

25,00

40,00

20,00

yi a b ln( t ) ui

97

91

85

79

73

67

61

55

49

43

37

31

25

19

97

91

85

79

73

67

61

55

49

43

37

31

25

-40,00
19

-20,00

0,00

5,00

13

0,00

10,00

13

20,00

15,00

yi a b t b t 2 ui

Sobre la eleccin del modelo de tendencia se debe tener en


cuenta:
1. Debe priorizarse la sencillez en la seleccin del modelo de
tendencia. Esta debe slo centrarse en la evolucin de la
serie de modo que no es necesario que la tendencia
reproduzca exactamente cada movimiento a corto plazo. Un
comportamiento oscilante podra modelarse, por ejemplo,
con una funcin sinusoidal.
AJUSTE DE TENDENCIA

10.0000

5.0000

5.0000

0.0000

0.0000

|Facultad de Economa |Carlos Mendoza Astroz|

en
e04
en
e05

10.0000

en
e02
en
e03

15.0000

en
e00
en
e01

15.0000

en
e96
en
e97

20.0000

en
e04
en
e05

20.0000

en
e02
en
e03

25.0000

en
e00
en
e01

25.0000

en
e98
en
e99

30.0000

en
e96
en
e97

30.0000

en
e98
en
e99

Ajuste de Tendencia Correcto (serie Ajuste de Tendencia Incorrecto (tendencia


oscilante alrededor de una tendencia sobreparametrizada)
montonamente creciente)

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

2.

3.

4.

5.

292

Si existen dudas sobre el modelo de tendencia a utilizar,


pueden probarse especificaciones alternativas (lineal Vs
logartmica, potencial Vs exponencial, por ejemplo) y
utilizarse los resultados de la regresin (R2, porcentaje de
error absoluto medio, contrastes t para los trminos
incluidos en la regresin, etc) con el fin de valorar cul de las
especificaciones ajusta mejor la evolucin de la serie.
Las tendencias pueden ser compuestas, es decir, para un
determinado perodo de anlisis pueden combinarse
distintos tipos de tendencias (primero lineal creciente, luego
lineal decreciente, por ejemplo)
Algunas tendencias pueden no ser lineales por lo que su
estimacin con un modelo de regresin lineal requerir la
linealizacin previa de la funcin a estimar si no se conocen
mtodos de estimacin no lineales.
En presencia de componentes estacionales conviene
habitualmente eliminarlos antes de proceder al anlisis de
tendencia

En todo caso, una vez elegido el modelo de tendencia ms


adecuado, el procedimiento de filtrado es:
1. Se estima, conforme al modelo elegido, la regresin de la
serie en funcin del tiempo. En el ejemplo grfico, el ajuste
lineal por OLS implica estimar:

yt a bTt U t

2.

La tendencia se corresponde con la serie estimada (t) en


tanto que la serie filtrada es simplemente el residuo de esta
regresin. La serie original (yt) menos la estimacin de la
tendencia (t).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

293

Debe tenerse especial cuidado para no confundir la tendencia


determinista y estocstica, ya que entonces tanto uno como otro
mtodo resultaran incorrectos de aplicar. Por ejemplo, si se tiene
un proceso del tipo:
En el que se tiene tendencia determinista pero no estocstica. Si
se toma una primera diferencia la anterior expresin quedara:

O sea, se habra eliminado la tendencia temporal pero incluida


una raz unitaria en el proceso MA, que ahora sera no invertible.
Debe notarse que este problema tambin se plantear, por las
mismas razones, en el caso en el que sobrediferenciacion de una
serie ms all de su orden de integracin.
Se comente un error si se intentar transformar un modelo con
tendencia estocstica aplicando el filtro representado para la
eliminacin de la tendencia determinista:
1. En primer lugar, el t-estadstico de significancia individual
tiende a infinito para la variable de tendencia determinista
introducida en el filtro y es inconsistente, por lo que resulta
fcil rechazar errneamente la hiptesis de nulidad del
parmetro de tendencia.
2. El R2 converge a una distribucin no degenerada, es decir, a
medida que el tamao de la muestra se incrementa y no
converge hacia un escalar, sino hacia una variable aleatoria.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

3.

294

Un efecto adicional comentado por Durlauf y Phillips (1988)


es que, en estos casos, el estadstico DW de la errnea
regresin de la serie sobre una tendencia temporal tiende a
acercarse a cero. Este sntoma puede utilizarse como
medida de alerta cuando se encuentre en una situacin
similar.

En cualquier caso, la trascendencia de un posible error en los


resultados del modelo exige establecer un modus operandi con
ms garantas. El chequeo de la presencia de races unitarias es
insalvable, para lo cual deben conocerse extensamente los
contrastes ms habituales que permitan detectarlas.
PROCEDIMIENTOS PARA LA DETECCIN DE RACES UNITARIAS
ANLISIS DEL GRFICO TEMPORAL DE LA SERIE
Apoyndose en las caractersticas comunes de las series
integradas frente a las no integradas, resumidas en la tabla
anterior, se puede utilizar la representacin grfica de una serie
para el anlisis de su estacionariedad.
Efectivamente, uno de los mtodos que suelen proponerse como
suficientes para la deteccin de la no estacionariedad de una
serie es el del anlisis de representaciones grficas de la misma.
As, la contemplacin del grfico de evolucin temporal de la
serie es un insumo para decidir si la serie es o no estacionaria en
virtud, por ejemplo, de la pendiente que presente.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

295

Grafico de serie no estacionaria

Por otro lado, suelen aconsejarse medidas como el grfico rango


de la media para detectar la no estacionariedad en varianza.
Ambos procedimientos slo son parcialmente tiles.
Efectivamente ya se ha visto anteriormente cmo pueden
confundirse con facilidad representaciones grficas de procesos
con tendencias estocsticas de procesos con tendencias
deterministas y los efectos que tiene un error en su confisin.
Por otro lado, incluso con procedimientos tcnicamente
elaborados, resulta an ms complejo diferenciar, por ejemplo,
un proceso con una raz unitaria de otro con una raz
autorregresiva elevada.
En el grfico siguiente, por ejemplo, se han representado dos
procesos, uno estacionario y otro con una raz unitaria. En
ambos casos se ha utilizado la misma sucesin de perturbaciones
aleatorias mientras que los coeficientes utilizados en cada caso
han sido diferentes.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

296

DIFERENCIACION GRAFICA DE PROCESOS ESTACIONARIOS Y NO


ESTACIONARIOS
Modelo estacionario
Modelo I(1):

No obstante, a pesar que el anlisis grfico no puede considerase


una herramienta suficiente para el anlisis de la estacionariedad
de una serie, si ha de servir como etapa previa a la aplicacin de
contrastes ms avanzados.
Efectivamente, observar la evolucin grfica de la serie puede
permitir localizar cambios de estructura, comportamientos
estacionales o medias y tendencias de tipo determinista, lo que
permitir aplicar con mayor porcentaje de xito, las pruebas de
races unitarias.
ANLISIS DEL CORRELOGRAMA DE UNA SERIE
Un procedimiento que no requiere la aplicacin de ningn
contraste para determinar la presencia de races unitarias en las
series, es el de observar el correlograma de la misma. Es decir, la
representacin grfica de su funcin de autocorrelacin simple
(FAS) y parcial (FAP).

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

297

Distintos trabajos, en especial los presentados por Hoskin


(1989), Diebold y Rudebusch y Lo (1991), se han centrado en
analizar las variaciones de la autocorrelacin en funcin del
orden de integracin d de una serie.
En general, la regla a aplicar ser sencilla. Los valores de la FAS o
la FAP de una serie con races unitarias descienden muy
suavemente hacia el cero mientras que cuando no hay presencia
de races unitarias el descenso es exponencial.
Las imgenes que se muestran a continuacin corresponden a
series reales de tipo de cambio. La diferencia en el patrn de
evolucin sobre un correlograma.
FAS DEL TIPO DE CAMBIO EN COLOMBIA
SERIE DIFERENCIADA
SERIE NO DIFERENCIADA

La razn de este comportamiento de la FAS y FAP en uno y otro


est en funcin de las races caractersticas del polinomio de la
ecuacin en diferencias.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

298

De esta forma, si la serie no estacionaria que implica un proceso


no estacionario guarda memoria larga de las innovaciones
pasadas y recientes (precisamente por presentar un componente
de tendencia), la relacin entre dos valores separados por un
lapso de tiempo j-esimo presentarn necesariamente algn tipo
de relacin, o sea, los coeficientes de correlacin yt,yt-j tendern a
mantenerse elevados.
Efectivamente, la expresin de la solucin de una ecuacin en
diferencias de primer orden puede expresarse como:

A partir de las expresiones anteriores puede calcularse el


coeficiente de autocorrelacin yt,yt-j para cada caso. Cuando no
existe raz unitaria, el trmino a1 (menor que la unidad) fuerza a
los coeficientes de autocorrelacin a descender rpidamente
hacia el cero en una progresin geomtrica de razn a1. La
expresin de la serie de coeficientes de autocorrelacin es:

Tomando, por tanto, para el caso de raz unitaria, la forma:

El clculo de las correlaciones, sin embargo, es un trmino lineal


(t-s) (y por tanto ms lento) el que define la progresin hacia el
cero de los coeficientes de autocorrelacin. La expresin de los
coeficientes de correlacin es ahora:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

299

Si se representan las expresiones para los primeros 24 valores o


rezagos de s, se puede apreciar como el ritmo de descenso de los
coeficientes de autocorrelacin en el caso de procesos AR(1),
con distintos valores para a1, es directo y rpido, mientras que el
caso del paseo aleatorio (random walk) el descenso es muy
tenue, sobre todo para las primeras observaciones.
COEFICIENTES DE AUTOCORRELACIN PARA UN PROCESO
AR(1) Y UN PASEO ALEATORIO

La observacin del grfico de la funcin de autocorrelacin


puede completarse con el clculo de contrastes Q como los
propuestos por Box y Pierce (1970) o Ljung y Box (1978).
Q de Box-Pierce
Q de Ljung-Box

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

300

En ambos casos, la hiptesis a contrastar radica en que los p


primeros coeficientes de correlacin calculados j son iguales a
cero. El escalar T ser igual al nmero total de coeficientes de
correlacin representados en el correlograma.
H0: j =0
H1: j 0
Estos contrastes se distribuyen como una 2 con (T-k) grados de
libertad.
Su aplicacin se puede ver en dos partes. La primera, aplicarlos
sobre los residuos de un modelo ARIMA previamente estimado
para saber si se est ante un proceso ruido blanco o no, en este
caso el parmetro k toma el valor de los coeficientes estimados
de ese modelo ARIMA.
En segundo lugar, si, se estn observando las pruebas
directamente sobre una serie, no sobre los residuos de un
modelo, los grados de libertad de la 2 sern entonces p rezagos.
Si el estadstico supera el valor de tablas se rechaza la hiptesis
nula de los p primeros coeficientes son significativamente nulos.
El problema principal de la utilizacin de este mtodo es que el
comportamiento de la funcin de autocorrelacin cuando existe
una raz unitaria es extremadamente similar al del caso en el que
la raz tome un valor muy cercano a la unidad.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

301

En la imagen inferior se muestran 4 correlogramas


correspondientes a distintos valores del coeficiente a1 del
proceso terico:
Donde la sucesin t ha sido generada idntica para todos los
casos:

Puede comprobarse como el primero de los casos (paseo


aleatorio) puede confundirse con el resto aun cuando el valor de
a1 est relativamente alejado de la unidad (=0.95).
En el grfico inferior puede observarse la similitud entre el valor
del coeficiente de autocorrelacin de un AR(1) y el de un paseo
aleatorio para valores muy cercanos a la unidad e incluso, cmo
el ritmo de decrecimiento es ms lento para un =0.98 cuando,
como en este caso, el nmero de observaciones es relativamente
pequeo (30):

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

302

COMPORTAMIENTO DE UNA SERIE CON COEFICIENTES DE


CORRELACIN CERCANOS A LA UNIDAD Y UN PASEO
ALEATORIO

Este mtodo servir, al menos de forma ms precisa, para


distinguir un verdadero proceso integrado I(1) de otro que
presente una raz elevada.
CONTRASTES DE NO ESTACIONARIEDAD
PRUEBA DICKEY-FULLER
La prueba habitual a la hora de determinar la estacionariedad de
una serie de tiempo consiste en la aplicacin de la prueba de
DickeyFuller (DF). ste es una prueba de No estacionariedad el
cual contrasta la hiptesis nula como la presencia de una raz
unitaria en el proceso generador de datos de la serie analizada.
H0: existe raz unitaria (es un proceso no estacionario)
H1: No exisite Raiz unitaria (es un proceso estacionario)

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

303

Se supone inicialmente, como modelo de partida para el anlisis


de una determinada serie yt, un proceso estacionario
autorregresivo de orden uno como hiptesis nula H0:
Frente a este modelo se plantea el modelo alternativo de un
paseo aleatorio no estacionario del tipo:
Se trata, por tanto, de contrastar si el coeficiente a1 es igual a la
unidad o distinto de ella.
Para probar el coeficiente a1, no se puede utilizar el contraste
tradicional t-student sobre una estimacin por OLS del primer
modelo.
La razn radica en que la hiptesis nula que habitualmente se
contrasta a partir de la cual se deriva la expresin y propiedades
de la prueba t parte de probar (a1=0). Sin embargo, en este caso
se necesita contrastar H0: a1=1.
Si la hiptesis nula no se rechaza, ya que la varianza de yt sera
no estacionaria, dado que crecera con los valores del tamao de
muestra segn la expresin dada de la varianza de un paseo
aleatorio con deriva:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

304

En estas condiciones la estimacin del parmetro a1 sera una


estimacin inconsistente y sesgada respecto al verdadero valor
del parmetro y el uso de la distribucin t-student estndar sera
incorrecta. Efectivamente, en el modelo simple AR(1):
La estimacin de a1 ser consistente segn los valores que tome
la estimacin. Si |a1|<1, la distribucin del estimador es
asintticamente normal, o lo que es lo mismo, el estadstico
t-student converge hacia una N(0,1) cuando los grados de
libertad tienden a infinito.
En el caso de que |a1|>1, tambin puede caracterizarse la
distribucin del estimador del parmetro y de su razn de
contraste t si bien la convergencia en el lmite no se produce
hacia una normal.
El problema surge cuando |a1|=1, ya que en este caso, la
distribucin del parmetro, y por tanto, de su razn de contraste
estadstico no puede caracterizarse adecuadamente dada la
inconsistencia y sesgo de los resultados.
La distribucin del estimador es entonces funcin de
movimientos Brownianos. Segn Fuller (1976) se tiene que
N(a1-1) converge en distribucin a un cociente de integrales de
Wiener.
Por tanto, la distribucin de probabilidad asinttica del
estimador OLS del modelo AR(1) presenta una discontinuidad
cuando a1=1 y, como sustituto, debern utilizarse las
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

305

distribuciones derivadas de forma emprica mediante un


procedimiento de Montecarlo realizado por Dickey (1976).
En este experimento se generaron un elevado nmero de series
ruido banco t para construir el mismo nmero de paseos
aleatorios con deriva. La estimacin de los parmetros de inters
en cada uno de esos modelos controlados arroj las siguientes
conclusiones:
1. El 90% de los valores estimados del parmetro a1 estaban
menos alejados de 2.58 errores estndar del verdadero
valor (la unidad).
2. El 95% de los valores estimados del parmetro a1 estaban
menos alejados de 2.89 errores estndar del verdadero
valor (la unidad).
3. El 99% de los valores estimados del parmetro a1 estaban
menos alejados de 3.51 errores estndar del verdadero
valor (la unidad).
Tras este experimento de Dickey, fue Fuller (1976) quien obtuvo
la distribucin lmite apropiada y public, tabulados, toda una
batera de valores crticos, dado que el valor emprico del
contraste vara en funcin del tamao muestral.
Estas tablas de referencia, permiten prescindir de la distribucin
t-student a la hora de contrastar si el parmetro a1 es igual, o no,
a la unidad.
Ms recientemente, MacKinnon (1991) realiz un nmero
mayor de simulaciones que las tabuladas por Dickey y Fuller.
Adems, MacKinnon estim la superficie de respuesta usando los
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

306

resultados de la simulacin, lo que permite calcular los valores


crticos de la prueba DF para cualquier tamao muestral y
cualquier nmero de variables en el lado derecho de la ecuacin.
El modelo utilizado para el contraste DF no es el expuesto al
comienzo sino otro equivalente derivado de la siguiente forma:

Por tanto, la hiptesis nula inicial se transforma ahora en H0:


=0 frente a la alternativa H1: <0. Decir que es nulo es lo
mismo que a1=1, o existe una raz unitaria. Decir que es menor
que cero equivale a decir que a1 es menor que la unidad o un
proceso autorregresivo estacionario.
El procedimiento bsico para la aplicacin de la prueba DF es
aparentemente sencillo. Se estima el modelo propuesto y se
calcula el valor estimado de la t del parmetro analizado.
Una vez calculado se compara con el valor emprico de
referencia obtenido con las tablas de Dickey y Fuller o de
MacKinnon. Si el valor estimado para es superior al tabulado
dado un determinado nivel de confianza se admite la hiptesis
nula, o sea, la presencia de raz unitaria.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

307

REPRESENTACIN DE UNA PRUEBA DF EN STATA

PRUEBA DF Y PROCESO GENERADOR DE DATOS


Los valores crticos del t-estadstico de referencia para el
contraste DF no slo dependern del tamao muestral tambin
del tipo de modelo estimado, por tanto, del proceso generador de
datos supuesto.
Por tanto, antes de estimar los parmetros del modelo es
necesario decidir si el proceso generador de datos ser el simple,
presentado anteriormente, contendr una constante (a0), un
trmino de tendencia determinista (a2t) o ambas
simultneamente. Los tres modelos propuestos por DickeyFuller son por tanto:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

308

Modelo 1. Simple
Modelo 2. Constante
Modelo 3. Constante y tendencia
determinstica
Una vez decidido el modelo estadstico de referencia la manera
de efectuar el contraste ser diferente. Se nota generalmente
por las letras para el caso ms simple, para el caso del
modelo con constante y para el caso del modelo con tendencia
determinista.
Consultar correctamente el estadstico de referencia es
fundamental dado que las diferencias entre los distintos valores
de , y son importantes. Por ejemplo, para un nivel de
significancia del 95% y 100 observaciones los valores crticos
seran 1.95 para , -2.89 para y 3.45 para .
Tal y como describen Suriach (1995) los modelos 2 y 3
presentados por Dickey y Fuller son en realidad formas
reducidas de determinados modelos estructurales.
As, el modelo 2, que contrasta la hiptesis nula de paseo
aleatorio con deriva frente a una alternativa de esquema AR(1)
estacionario sin tendencia, es la forma reducida del modelo:

Bajo la hiptesis nula en el que a0=0(1-a1) con el caso de (a1=1)


el trmino constante sera nulo luego su presencia en el modelo
a estimar es irrelevante y slo se justificara para garantizar que,
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

309

en el caso que no se rechace la hiptesis alternativa, el proceso


autorregresivo tenga media no nula.
El modelo 3, que contrasta la hiptesis nula de un paseo
aleatorio con deriva frente a la alternativa de un proceso AR(1)
estacionario sobre una tendencia determinista, sera la forma
reducida del modelo:

Con a0=0(1-a1)+1a1 y a2=0(1-a1). Bajo la hiptesis de raz


unitaria (a1=1) se tiene que a0=1 y a2=0 luego, como en el caso
anterior, la presencia en este caso del parmetro a2 es
irrelevante en el caso de raz unitaria y su presencia intenta slo
garantizar la consistencia del contraste en una situacin de
hiptesis alternativa (proceso estacionario sobre tendencia
determinista).
CONTRASTE DE RACES UNITARIAS MLTIPLES
Debe ahora ponerse de manifiesto una caracterstica del
contraste DF que quiz resulte inadvertida. El contraste DF no
puede dar resultados concluyentes en una sola etapa.
Si se aplica la prueba DF sobre una serie yt y el resultado es no
rechazar la hiptesis nula (no estacionariedad o presencia de
una raz unitaria) la conclusin debe ser que, o bien yt~I(1) o
bien no es integrada de ningn orden, es decir, que no puede
transformarse en estacionaria por diferenciacin.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

310

Para decidir entre una u otra alternativa Charemza y Deadman


(1992) sugieren aplicar nuevamente la prueba DF ahora sobre la
serie en diferencias yt:

Contrastando el parmetro para que resultase nulo o menor


que cero por tanto yt fuese integrada de orden 1, entonces yt
deber ser I(0), es decir <0. Si, en cambio, la aplicacin de la
prueba DF sobre este nuevo modelo afirmara que yt tiene una
raz unitaria, entonces el proceso debera continuar ahora con
yt a fin de determinar si yt es I(2) o se est ante una serie no
integrable. Podra proseguirse ahora con yt y as
sucesivamente.
Esquema Charemza-Deadman (1992)

En cualquier caso, como se muestra al final del esquema, siempre


se debe tener presente la posibilidad que el test DF no sea capaz
de detectar la presencia de una raz unitaria para un
determinado orden de diferenciacin.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

311

Si as fuera, se corre el peligro de sobrediferenciar una serie. En


ese caso, tal y como sealan Charemza y Deadman (1992) la
prueba DF tiende a tomar un valor muy alto y positivo (en lugar
de negativo) acompaado as mismo de un valor muy elevado
del coeficiente de determinacin para el ajuste.
Dickey y Pantula (1987) proponen un procedimiento alternativo
al anterior para el contraste de ms de una raz unitaria. La idea
es realizar tambin una sucesin de contrastes pero empezando
por el nmero mximo de races unitarias que se piensa pueden
encontrarse.
As, si se piensa que un proceso tiene exactamente, y como
mucho, dos races unitarias, se platear el modelo siguiente:
Si efectivamente yt tiene dos races unitarias, 2yt debe ser
estacionaria por lo que el parmetro 1 debe ser nulo.
Se efecta el contraste de la hiptesis nula H0: 1=0, si no se
puede rechazar, se afirma que yt tiene exactamente dos races
unitarias, o sea, es I(2).
Si 1 es distinto de cero se debe plantearse entonces el modelo:
Dado que ya se sabe que no hay dos races unitarias algunos de
los dos coeficientes, o ambos, no sern nulos (sencillamente esto
sera incongruente con el resultado obtenido en la etapa
anterior).
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

312

La hiptesis nula en este caso ser que yt tenga una raz unitaria,
o sea, que yt sea estacionaria.
Para eso ser necesario que en la expresin anterior 2=0 y
1<0. Si no es as debe rechazarse la hiptesis nula (tanto 1
como 2 son no nulos), entonces yt ser estacionaria, es decir, no
tendr ninguna raz unitaria.
Este procedimiento puede utilizarse para un orden mayor r para
el caso en que se sospechen slo dos races unitarias. El caso
sera bastante excepcional pero, si se diese, el procedimiento es
el mismo que el descrito anteriormente slo que comenzando el
contraste con el modelo:

CONTRASTES CONJUNTOS DE PARMETROS EN EL MODELO


SIMPLE DF
Sobre los modelos propuestos que contienen ms de un
parmetro (modelos 2 y 3) puede adems tambin contrastarse
la hiptesis de nulidad simultnea de conjuntos de parmetros.
Dickey y Fuller (1981) plantearon la construccin de
estadsticos F clsicos para contrastar las hiptesis H0:=a0=0
(estadstico 1) en el modelo 2 y H0: =a0=a2=0 (estadstico 2)
H0: =a2=0 (estadstico 3) en el modelo 3.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

313

Los estadsticos 1,2,3 se construyen segn la expresin conocida


del test F:

Donde SCRmr y SCRmrn son las sumas de cuadrados de los


residuos de los modelos restringido (mr) y no restringido (mnr),
n es el nmero total de observaciones, k el nmero de
parmetros del modelo no restringido y r el nmero de
restricciones.
Como ya sucediera en el caso del contraste t individual, no es
posible utilizar las tablas habituales de la razn F por lo que de
nuevo debe acudirse a las tablas de Dickey-Fuller en las que se
recogen los valores generados empricamente para i.
Resulta necesario resaltar, que la aplicacin de los contrastes de
nulidad conjunta 1, 2 y 3 supone una forma alternativa a los
estadsticos individuales t de contrastar la estacionariedad de yt.
Efectivamente podra, por ejemplo, contrastarse con 2 la
hiptesis nula que yt siga un paseo aleatorio simple (no
estacionariedad) frente a un AR(1) estacionario con trmino
independiente. Este hecho, no hace sino hacer an ms compleja
la realizacin e interpretacin del contraste DF.
Por ltimo, conviene no olvidar que, an a pesar del carcter
molesto (nuisance) de algunos de los parmetros, cabe la
posibilidad de contrastar, tambin, la nulidad individual de los
mismos, supuesta, eso s, la existencia de una raz unitaria.
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

314

As, puede contrastarse en el modelo 2 la hiptesis a0=0 dado


=0 mediante el denominado contraste o en el modelo 3 las
hiptesis a0=0 dado =0 (estadstico ) y a2=0 dado =0
(estadstico ).
RESUMEN PRUEBAS DF

PRUEBA DF Y ELECCIN DE COMPONENTES


DETERMINISTAS DEL PROCESO GENERADOR DE DATOS (PGD)
El primer problema que plantea la aplicacin de la prueba DF
radica en la estructura terica del proceso generador de datos
asumida para la serie yt ya que influye decisivamente en los
resultados obtenidos.
As, no es invariante a los resultados del contraste, suponer para
yt un modelo con o sin trmino independiente, con o sin
tendencia determinista, con componente autorregresivo de
orden uno u orden superior a uno o con o sin componente de
medias mviles.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

315

El problema radica en que la mayor parte de las ocasiones, el


modelo con las caractersticas del proceso se desconoce a priori.
Ya se ha observado cmo, desde el primer momento, se ha
diferenciado claramente el caso de un modelo simple del caso de
un modelo con constante y/o tendencia determinista, dado que
los contrastes de referencia son en uno y otro caso diferentes
(, , ).
Incluso se ha visto que una misma hiptesis nula puede
contrastarse utilizando las prubas individuales i o los conjuntos
i, dependiendo del proceso generador de datos (PGD) supuesto
y de los coeficientes a incluir en el contraste en cada caso.
Las diferencias entre los estadsticos de referencia y para
una misma hiptesis nula en las tablas de Dickey-Fuller de 1976
para y 1981 para son importantes, por lo que parece
fundamental cuidar la eleccin del modelo y la hiptesis a
contrastar en cada caso, siendo en muchas ocasiones esta etapa,
decisiva de cara a la correcta aplicacin del contraste.
Qu puede ocurrir entonces si se equivoca en la identificacin del
modelo de referencia?
a. Si se toma como modelo de partida un modelo con
tendencia determinista y trmino constante, se puede estar
sobreparametrizando la estimacin lo que supone una
inmediata prdida de grados de libertad.
Pero adems, los valores crticos de referencia para no
rechazar o rechazar la hiptesis nula dependen del modelo
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

b.

316

estimado por lo que, parece algo arriesgado tomar


conclusiones de no rechazo o rechazo de la hiptesis en
cada momento con un modelo que, quiz, no sea realmente
vlido. Concretamente, para un determinado nivel de
significancia, los intervalos de confianza alrededor del valor
=0 se amplan de forma importante si se incluye una
deriva o una tendencia determinista provocando, en caso de
no ser realmente necesarios, frecuentes errores en el
rechazo de la hiptesis nula de raz unitaria. Dicho de otro
modo, la potencia del contraste decrece tanto ms cuanto
mayor sea el nmero de parmetros incluidos
incorrectamente. Esto significa que se tiende a concluir la
existencia de una raz unitaria cuando, en realidad, no la
hay.
Una posible alternativa a este esquema podra ser el
comenzar por el modelo ms restringido, es decir, ms
simple, e ir incluyendo nuevos parmetros de forma
secuencial.
Sin embargo, este procedimiento tampoco soluciona el
problema de potencia del contraste dado que la omisin del
trmino independiente o la tendencia determinista, cuando
estas son variables relevantes tambin provoca de nuevo
una estimable prdida de potencia hasta el punto de poder
incluso anularse por completo.

Campbell y Perron (1990) comprobaron empricamente que la


omisin de una variable relevante que crezca tan rpido o ms
que otra de las incluidas (trmino de tendencia determinista, por

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

317

ejemplo), provoca que la potencia del contraste se reduzca hasta


cero a medida que el tamao muestral se incrementa.
Si la variable omitida fuese la deriva, el t-estadstico sera
consistente pero, para muestras pequeas, la potencia se vera
seriamente afectada, tanto ms cuanto mayor fuera el coeficiente
de deriva omitido.
Este problema expuesto hasta aqu, admite adems ciertos
matices adicionales. En primer lugar, cuando el proceso
generador de datos contiene una tendencia o una deriva, la
varianza muestral de yt queda dominada por ellas.
As, se ha comprobado empricamente que, en esos casos, los
estadsticos t y t convergen a una distribucin normal estndar
por lo que, si se conoce la presencia real de esa tendencia o
deriva, la hiptesis nula =0 debe contrastarse usando una
distribucin normal estandarizada en lugar de las distribuciones
asintticas tabuladas por Dickey y Fuller.
Hylleberg y Mizn (1989) mostraron que los valores normales
estndar llevan frecuentemente al rechazo de la hiptesis nula,
incluso con muestras grandes, a menos que la constante sea muy
grande. Estos autores propusieron nuevos valores crticos
situados entre los clsicos tabulados por DF y los de la
distribucin normal.
A medida el tamao de la constante se reduce, estos valores se
aproximan ms a los valores DF. Por esta razn, en estas

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

318

situaciones y para muestras pequeas, se recomienda como


criterio general utilizar las tablas propuestas por Dickey y Fuller
y no las normales estandarizadas.
En la prctica, el problema de la eleccin de los regresores
deterministas a incluir en el contraste no tiene una solucin
sencilla. El principio general puede ser el de elegir aquella
especificacin que, a priori, sea ms verosmil tanto bajo la
hiptesis nula como bajo la alternativa. As, puede realizarse un
anlisis previo de la serie que ayude a determinar si cabe la
consideracin de una tendencia (determinista o estocstica), y en
ese caso incluir una constante y una tendencia en la regresin. Si
la serie no presenta tendencia pero tiene media no nula, se incluye
la deriva en el modelo y, por ltimo, si presenta media nula y
ausencia de tendencia se aplica el contraste con el modelo ms
restringido.
Dolado (1990) y Perron (1990) propusieron, entre otros autores,
seguir un proceso en etapas a fin de garantizar el xito en la eleccin
del modelo de referencia en el mayor nmero de ocasiones:
1. En primer lugar se estimara el modelo menos restringido (con
trmino constante y tendencia determinista).
2. Dado que el principal error de esta tctica inicial consistira en
la escasa potencia del contraste para el rechazo de la hiptesis
nula por inclusin de variables irrelevantes, si los valores
crticos indican rechazo (ausencia de raz unitaria), se termina el
procedimiento.
3. En el caso de no rechazarse la hiptesis nula de presencia de
una raz unitaria, es decir, en el caso en que se admite la
presencia de una raz unitaria (H0: =0) sigue ahora examinar la
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

4.

5.

6.

7.

8.

319

significancia del parmetro de tendencia determinista a2. Dado


que, en este punto, estaramos bajo la hiptesis ya admitida que
=0, se utiliza el valor de referencia de e incluso, para
mayor seguridad, tambin el contraste conjunto 3 (a2==0).
Si el trmino de tendencia resulta significativo (a20) se
contrasta de nuevo la presencia de una raz unitaria (H0: =0)
pero utilizando entonces las tablas de una normal estandarizada.
Sea cual sea el resultado del test con las nuevas tablas finalizan
el contraste admitiendo o rechazando la presencia de una raz
unitaria.
Si el trmino de tendencia es no significativo, deber
replantearse el modelo inicialmente estimado pasndose a
examinar otro con trmino constante pero sin esta tendencia
determinista. Con este modelo se vuelve a analizar la presencia
de una raz unitaria (=0).
En el caso en que, nuevamente, se sostenga la presencia de una
raz unitaria, se contrastar entonces la adecuacin del trmino
independiente a0 bien con el contraste , bien con 1. Si el
trmino independiente resulta significativo se utiliza de nuevo
las tablas de una normal para contrastar la presencia de la raz
unitaria, concluyendo de nuevo aqu el contraste.
Slo si entonces la constante a0 es no significativa se utiliza el
modelo ms simple como modelo de referencia contrastndose,
de nuevo, la presencia de raz unitaria. En este caso, no tiene
cabida el uso de la distribucin normal estandarizada.
Por ltimo, parece sensato incluir aqu como consejo la
atencin a la teora del fenmeno que se est analizando. As,
en ciertas ocasiones la teora econmica nos mostrar que no
cabe considerar una tendencia en una determinada serie o bien,

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

320

por el contrario, que no cabe la fluctuacin alrededor de un


valor medio.
Prueba DF en modelos autorregresivos de orden superior.
Contraste ADF
Hasta este momento permite contrastar la presencia de una o
ms races unitarias en una determinada serie temporal para la
que se supone un proceso AR(1). Sin embargo, muchas serie
temporales se ajustan ms adecuadamente a procesos
autorregresivos de orden superior AR(2) o AR(3).

No parece, por tanto, adecuado, contrastar la presencia de una o


ms races unitarias utilizando siempre la estructura de un
modelo AR(1) ya que las races unitarias pueden aparecer
tambin en estructuras ms complejas.
Este problema da lugar a lo que se conoce como test de races
unitarias de Dickey-Fuller Ampliado (ADF). Si se quiere
contrastar la presencia de una raz unitaria en una serie que
sigue un proceso AR(p), deber aplicarse el procedimiento
expuesto para el caso simple AR(1), pero suponiendo ahora del
modelo:

Dnde:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

321

Para entender este modelo y la hiptesis que se contrasta de


cara a detectar la presencia de una raz unitaria, veamos un caso
sencillo de una serie que presente una raz unitaria en el marco
de un modelo AR(3). Dado el modelo original:
Sumando y restando para yt-2
Calculando
Sumando y restando para yt-3

Si la serie presenta una raz unitaria en este modelo bastar con


que =0 ya que entonces:

lo que garantiza que, al menos, una raz caracterstica de la


ecuacin sea igual a uno, es decir, yt ~I(1). La nulidad del

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

322

parmetro se contrasta siguiendo el mismo procedimiento que


en el modelo simple y, por tanto, se utilizan las mismas tablas
que en el caso del contraste DF.
En este sentido, es importante sealar que el propio Fuller
demostr que la distribucin asinttica del estadstico t del
parmetro g estimado, es independiente del nmero de rezagos
de la variable diferenciada que se incluya en la especificacin del
modelo estimado.
Debe observarse cmo la aplicacin del test ADF no slo es
conceptualmente til para el contexto en el que se sospecha un
modelo AR(p), sino que, adems, se presenta como una posible
correccin a los problemas de autocorrelacin que pudieran
aparecer en el trmino de error del modelo bsico utilizado en el
test simple DF, sobre todo en series de frecuencia superior a la
anual.
Efectivamente, debe tenerse en cuenta que los valores de
referencia de la prueba se han obtenido suponiendo la ausencia
de autocorrelacin serial en et, en este sentido, la introduccin
de un nmero suficiente de rezagos de la variable dependiente
podra ser suficiente para transformar et en un ruido blanco. La
eleccin del nmero de rezagos a considerar viene determinada
por:
1. El modelo terico de referencia supuesto para yt, en la
medida en que este sea conocido por el investigador.
2. Criterios clsicos de aceptacin de variables en un modelo
como el test t- Student de significancia individual, AIC o
SBC.
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

323

Esta forma de correccin de posibles problemas de


autocorrelacin en et es lo que se denomina Solucin
Paramtrica al problema de la autocorrelacin y fue sugerida por
los propios autores del contraste, Dickey y Fuller (1981); de
hecho, debe sealarse que numerosos textos introducen
conceptualmente la prueba ADF al comentar el problema de una
posible autocorrelacin en los residuos del modelo simple DF.
Esquema de anlisis de estacionariedad previo a la identificacin y
eventuales transformaciones de la serie original segn los
resultados
Serie inicial Yt

NO

SI

Es estacionaria en media ?

Aplicar filtro de tendencia

Continuamos con la serie


inicial Yt

Continuamos con la serie filtrada


Yt(ft)

NO

Es Yt(ft) estacionaria
en varianza ?

SI

NO

Aplicar
diferencias

(1)

Continuamos con la
serie filtrada en
diferencias dYt(ft)

Es Yt estacionaria en
varianza ?

SI

Aplicar
diferencias

(2)

Continuamos con
la serie filtrada
Yt(ft)

|Facultad de Economa |Carlos Mendoza Astroz|

(3)

Continuamos con la
serie en diferencias
dYt

(4)

Continuamos con
la serie original
Yt

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

Falta:
Circulo unitario e idea de raz unitaria.
Teorema de representacin de wold
invertibilidad
Ecuaciones de yule Walker
Estimacin
Pronostico
Condiciones de invertibilidad
Estadisticl de ljung box

condicin

324

de

PROTOCOLO DE IDENTIFICACIN DE MODELOS ARIMA


En trminos generales, se conoce como identificacin del modelo
la determinacin de los ordenes p y q, de la estructura ARMA
de la transformada la variable transformada Zt de una serie
temporal yt diferenciada o con filtro de tendencia.
Antes de proponer algunas tcnicas concretas para la
identificacin de la serie Zt, conviene hacer algunas observaciones
preliminares importantes:
a. La observacin de la estructura ARMA(p,q) supone la
presencia de componentes regulares en las series, una vez
filtrada la presencia de tendencias deterministas y
estocasticas.
No todas las series presentan este tipo de componentes
regulares o, dicho de otro modo, no todas las series son
susceptibles de ser analizadas mediante un esquema ARMA.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

b.

325

A este respecto, conviene recordar que los modelos ARMA


implican estructuras de comportamiento muy sencillas que
no siempre se ajustan a la compleja evolucin de las series
reales.
Aunque tcnicas de identificacin pueden aplicarse a
cualquier variable transformada Zt de la serie original yt debe
tenerse en cuenta que el resultado del proceso de
identificacin no es independiente de las decisiones
adoptadas en el proceso de anlisis de estacionariedad
previo.
Todas las decisiones adoptadas en este proceso previo
(aplicacin de filtros de tendencia, eleccin de un filtro
frente a otro, orden de integracin y diferenciacin de la
tendencia estocastica) implican obtener diferentes
versiones, transformadas de Zt, y por tanto, alteran las
caractersticas del proceso a observar mediante la
identificacin.
Aplicar una diferencia cuando no exista una raz unitaria en
una tendencia estocastica (sobrediferenciar), no aplicar una
diferencia necesaria (infradiferenciar), elegir un filtro de
tendencia incorrecto implican errores en el proceso de
identificacin.
As, por ejemplo, en las siguientes figuras se observa como la
aplicacin incorrecta de un filtro de tendencia lineal genera
una seal filtrada sobre la variable transformada Zt
absolutamente distinta de la que se genera cuando se aplica
el filtro correcto.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

Figura 1: Serie
polinmica

Yt

con

tendencia

326

Figura 2: Serie Yt, filtro de tendencia


lineal incorrectamente aplicado y serie
filtrada Zt=yt(ft) resultante

1600000

2000000
1500000

1200000

1000000
500000

800000

400000

0
-500000

200000

400000

0
96

97

98

99

00

01

02

03

04

05

-200000
96

SERIE1

97

98

99

00

Residual

01

02

Actual

03

04

05

Fitted

Figura 3: Serie Yt, filtro de tendencia polinmico correctamente aplicado y serie


filtrada Zt=yt(ft) resultante
2000000
1500000
1000000

40000

500000
20000
0
0

-500000

-20000
-40000
96

97

98

99

00

Residual

c.

01

02

Actual

03

04

05

Fitted

La presencia de componentes estacionales en las series de


tiempo estacionarias obliga a plantearse al menos tres
preguntas previas a la identificacin:
i. Conviene preservar el componente estacional en la serie
o eliminarlo antes de identificar sus estructuras ARMA y
utilizar los resultados con fines analticos?

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

327

ii. En caso que sea de interes eliminar el componente


estacional, Cundo conviene aplicar el correspondiente
filtro para elimianr la estacionalidad?. Antes del
tratamiento de la tendencia determinista y las races
unitarias? Despus de los filtros de tendencia pero antes
del anlisis de Races Unitarias?
iii. Suponiendo que esta claro cundo conviene eliminar la
estacionalidad, existe un procedimiento estndar o ms
de uno? y, lo que es ms importante, es indiferente la
aplicacin de los distintos mtodos que existen o por el
contrario los distintos procedimientos impactan sobre la
serie filtrada resultante y, por tanto, sobre el resto de las
etapas del anlisis?
Algunas de las preguntas previas tienen una respuesta.
Empezando por el final, existen distintos mtodos para eliminar
la componente estacional y la aplicacin de cada uno de ellos
genera resultados que pueden diferir sustancialmente influyendo
en el resto de las etapas (identificacin y anlisis de
estacionariedad).
Entender distintos procedimientos pasa por comprender una
distincin muy simple de tres (3) tipos genricos de
estacionalidad.
Puramente
determinista,
Estacionalidad
estacionaria y Estacionalidad integrada.
Definicion. Estacionalidad determinista. Asume que el
componente estacional de una serie transformada Zt puede ser
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

328

pronosticado con exactitud a futuro, permaneciendo invariante


en el tiempo, y puede, por tanto, ser modelado por ejemplo
mediante la inclusin de variables dummies.
Excluida la estacionalidad determinista, el resto de mtodos
ideados para modelar la estacionalidad no determinista (X11,
X12) impactan de forma distinta, y a veces significativa, en los
resultados obtenidos para la serie filtrada y, adems, generan
resultados potencialmente distintos segn el momento elegido
para la aplicacin del filtro.
Por ltimo, conviene preguntarse adems si la estacionalidad es
siempre estacionaria o, por el contrario, del mismo modo que
aparecen races unitarias regulares es posible encontrar races
unitarias estacionales.
Efectivamente, es posible encontrar races unitarias estacionales
lo que obliga a pensar en la aplicacin de test especficos43 antes
de observar otros componentes estacionales estacionarios en la
identificacin.
Con el fin de no complicar en exceso el proceso de identificacin
yen trminos de la estacionalidad y supondremos bien que
estamos ante una serie sin componentes estacionales o, al menos,
con componentes estacionales estacionarios que, por tanto,
podrn ser filtrados previamente o bien modelados en el propio
proceso de identificacin ARMA en su componente estacional
(SARMA).
43

Existen varias propuestas al respecto: DF Estacional (Dickey Fuller) , HEGY (Hyllenerg,Engle,Granger y Loo) , CH (Canovas Hansen)

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

329

TCNICAS DE IDENTIFICACIN DE ESTRUCTURAS ARMA


CORRELOGRAMA
Tradicionalmente se ha sugerido la utilizacin del correlograma
de la serie como mtodo de identificacin de la estructura ARMA
de una serie Zt.
En este contexto, la utilizacin de un grfico para resolver la
identificacin parece una propuesta muy sugerente. Sin embargo,
como se tiene a su disposicin herramientas mucho ms potentes
para decidir qu estructura ARMA representa mejor la serie
analizada por lo que no debe sobrevalorar el correlograma y debe
considerarlo, a lo sumo, un punto de apoyo inicial, meramente
orientativo, con el que iniciar el proceso de identificacin.
El correlograma de una serie es una representacin grfica de sus
coeficientes de autocorrelacin simple y parcial. La secuencia de
coeficientes de autocorrelacin simple se denomina Funcin de
Autocorreacin Simple (FAS) y la secuencia de coeficientes
parciales Funcin de Autcorrelacin Parcial (FAP).
Un coeficiente de autocorrelacin simple de orden k (k) es un
coeficiente de correlacin simple al uso entre la serie Yt y a la
serie Yt-k.
Cov( yt , yt k )
k
DT yt DT yt k

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

330

Dado que el proceso es estacionario en varianza (DT(Yt)=DT(Ytk)):

Cov( yt , yt k )
Var y

Cuando hablamos de autocorrelacin parcial de orden k (k),


indica la correlacin entre Yt e Yt-k condicionada a los valores de
los rezagos intermedios de la propia serie.
Por ejemplo, si hablamos de la relacin entre Yt e Yt-3 se refiere a
la correlacin entre estas dos series condicionado a los valores de
Yt-1 e Yt-2.

k Corr yt , yt k yt 1 , yt 2 ,.... yt k 1

La influencia de los rezagos intermedios en los valores de Yt e Yt-k


podra calcularse el estimado de una regresin de Yt e Yt-k sobre
esos valores intermedios:
y t 1 yt 1 1 yt 1 .....1 yt k 1
y t k 1 yt k 1 yt k .....1 yt k 1
La relacin parcial ser entonces la correlacin simple exhibida
entre el residuo de ambas regresiones, es decir, entre la
proporcin de Yt e Yt-1 no condicionada a los valores de los
rezagos intermedios:
Cov( yt y t )( yt k y t k )
k
Var ( yt y t ) Var ( yt k y t k )

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

331

La representacin para una determinada serie de un nmero


suficiente de coeficientes de autocorrelacin simple y parcial
resulta indicativa de la estructura del proceso estocstico
subyacente.
La razn estriba en que, desde un punto de vista estrictamente
terico, todo proceso estocstico estacionario AR(p) presenta
funciones de autocorrelacin simple y parcial de un patrn
similar (valores de los coeficientes simples o parciales para los
diversos retardos) y lo mismo ocurre con los procesos MA(q).
En concreto, un examen tcnico detallado de las funciones de
autocorrelacin simple y parcial demuestra que:
a. Un proceso genrico AR(p) muestra un decrecimiento rpido
de los coeficientes de autocorrelacin simple junto a la
presencia
de
p
coeficientes
significativos
de
autocorrelacin parcial.
b. De forma simtrica, un proceso genrico MA(q) muestra un
decrecimiento rpido de los coeficientes de autocorrelacin
parcial junto a la presencia de p coeficientes significativos
de autocorrelacin simple.
Aunque el aspecto terico de un AR(p) o un MA(q) es sencillo
de diferenciar, cuando analizamos series temporales reales, la
representacin de correlogramas muestrales resulta siempre algo
menos evidente y, por tanto, ms confusa.
En ese sentido,
recomendaciones:

conviene

|Facultad de Economa |Carlos Mendoza Astroz|

observar

las

siguientes

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

332

a.

El anlisis de los correlogramas es slo un anlisis


preliminar que despus podr complementarse con medidas
tcnicas adicionales por lo que, en todo caso, el correlograma
deber utilizarse para realizar slo un juicio preliminares
que despus conviene refrendar con otros clculos.

b.

El patrn AR(p) exige la presencia simultnea de un


decrecimiento en la funcin simple y (p) valores
estadsticamente significativos en la funcin parcial; la
presencia aislada de una de las dos cosas no puede asociarse
a un proceso AR(p). De forma similar, los patrones de un
MA(q) deben aparecer tambin de forma simultnea.

c.

El nmero p o q de rezagos significativos en la FAP o en la


FAS puede evaluarse en trminos estadsticos44 pero en un
primer momento basta observar si los valores de los
coeficientes son grficamente significativos, es decir, si
presentan un valor evidentemente mayor que el resto de
coeficientes. Los rezagos estadsticamente significativos son
de orden limitado (de orden uno, es decir, para el primer
retardo, de orden dos o, muy rara vez, de tercer orden). Un
valor aparente significativo en un orden elevado (salvo en
los retardos estacionales), sin que previamente los
anteriores retardos parezcan significativos, suele indicar

44

Bartlett demostr que

k N 0, 1 n

Como para cualquier distribucin normal estndar, el intervalo de confianza al 95% es 1,96*DT , pueden calcularse los lmites de nulidad de los
: cualquiera que se salga de esos lmites es estadsticamente distinto de 0 (lmites que aparecen dibujados en el correlograma de E-Views)

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

333

algna atipicidad en la serie, y no un patrn de inters


analtico.
EVALUACIN ECONOMTRICA DE LAS ESPECIFICACIONES ARMA
Ms all de la utilizacin del Correlograma de la serie, conviene
utilizar los procedimientos habituales de evaluacin de una
estimacin economtrica para decidir el modelo ARIMA que
mejor ajusta la seria analizada.
En la prctica real, el nmero de estructuras ARIMA alternativas
para ajustar una serie es muy reducido dado que trminos de
orden regular45 superior a 2 son muy poco habituales. Esto
supone la mayor parte de las veces elegir entre un AR(1), un
MA(1), un AR(2), un MA(2) o alguna combinacin ARMA de
orden 1 2.
As pues, la recomendacin de orden general es comenzar
observando el correlograma y, en base a los indicios apuntados
por el mismo, valorar economtricamente las dos o tres posibles
estimaciones alternativas.
Par esa evaluacin economtrica, pueden considerarse criterios
estadsticos habituales como los siguientes:
a. Anlisis de la significancia individual de los coeficientes AR y
MA. Para ello puede utilizarse el contraste t clsico de
significacin estadstica individual al modo habitual.

Para la componente estacional ocurre algo similar. rdenes estacionales superiores a 1 (4, 12, dependiendo de la frecuencia de la serie) son
inhabituales.
45

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

334

b.

Criterios de informacin (Akaike46 y/o Schwarz47 entre


otros). Recordando que, entre modelos alternativos, se
elegir aquel con el menor valor del criterio de informacin.

c.

Evaluacin de los errores. El anlisis de errores clsico de


una regresin puede proporcionar criterios suficientes para
elegir entre posibles modelos alternativos. En este sentido,
pueden utilizarse cualesquiera medidas que resuman A
proiri el tamao (suma de errores, porcentaje medio de
error, ) y sus caractersticas (ausencia de trazas
autocorrelacionadas o heterocedsticas, capacidad de ajuste
de los puntos de cambio de tendencia, )
Oo que permitan intuir su comportamiento a posteriori
(comportamiento de los errores con enfoque de validacin
cruzada, comportamiento del ajuste hacia el final del perodo
histrico,)

EVALUACIN DE LA ESPECIFICACIN SARMA (ESTACIONALES)


Del mismo modo que se ha identificado la presencia de trminos
AR y/o MA en la componente regular, observando los
correlogramas o utilizando criterios clsicos de evaluacin

46

El coeficiente AIC: responde a la expresin:

e' e
2k n ln( L) 2k n ln
n
Para muestras pequeas, se propone la versin corregida AICc (muestras pequeas):
47

AIC

2k k 1
n k 1

El criterio de Schawrz, denominado generalmente BIC, es algo ms exigente que el AICE para la inclusin de nuevas variables y responde a la

expresin

e' e ln( n)
ln k

n n

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

335

economtrica, pueden as mismo identificarse estructuras AR y


MA para retardos estacionales.
Este tipo de estructuras SAR y/o SMA se identifican con los
mismos instrumentos especificados anteriormente.
Con relacin al correlograma, en el caso de las componentes
estacionales las estructuras SAR y SMA se identifican
grficamente con los mismos patrones sealados para la
componente regular.
Sin embargo, para evaluar en este caso un decrecimiento en la
FAP o FAS debemos fijarnos exclusivamente en los valores de los
coeficientes de autocorrelacin (simples o parciales)
correspondientes a los rezagos estacionales (por ejemplo para
una serie trimestral, se debe observar grficamente el valor de los
coeficientes de autocorrelacin para t-4, t-8, t-12etc).
Dado que habr que observar coeficientes de autocorrelacin
para rezagos estacionales, debern solicitarse correlogramas ms
extensos que par la identificacin de la componente regular.
En una serie mensual, por ejemplo, una docena de coeficientes
son suficientes para observar cualquier estructura en la
componente regular y, sin embargo, no podra observarse la
componente estacional dado que el nico coeficiente estacional
disponible sera el correspondiente a t-12.
Por lo que se refiere a la evaluacin economtrica de las
especificaciones SARMA alternativas, todos los consejos citados
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

336

para la evaluacin economtrica de la componente regular son


igualmente aplicables para evaluar la conveniencia de la inclusin
de trminos SAR y/o SMA en una especificacin.
INTRODUCCIN AL ANLISIS DE INTERVENCIN
El modelamiento economtrico ARIMA de una serie temporal
rara vez concluye con la identificacin de una estructura AR / MA.
La razn es que este tipo de estructuras ARMA regulares y/o
estacionales pueden servir como regla general de
comportamiento para la serie disponible, pero slo capturarn
aquella porcin de la variabilidad sistemtica que se observe a lo
largo de la serie completa.
Esto significa que, an utilizando una estructura ARMA pueden
quedar fuera de anlisis:
a. Ciertos componentes de variabilidad sistemtica (y por ello
previsible en gran medida) pero de carcter irregular o de
frecuencia anmala. Como componente sistemtico de
carcter puntual podemos, por ejemplo, imaginar el efecto de
la semana santa sobre la serie semanal de entrada de
turistas. Dado que la Semana Santa es un fenmeno puntual
dentro del ao (no ocurre todos los meses) y adems no
siempre cae en la misma semana natural, su efecto sobre
la serie no se puede recoger con el componente regular
ARMA previamente identificado. Otros efectos de esta
naturaleza pueden ser el efectoao bisiesto, la presencia de
fiestas de distinto carcter (internacional, nacional, regional,
local,) que afecten a la serie o a parte de ella.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

b.

337

Impactos puntuales en la serie debidos a la presencia de


observaciones atipicas, imprevisibles, no sistemticas,
relacionadas con acontecimientos extraordinarios o errores
en la manipulacin de datos (atpicos)
Ejemplos de puntos atpicos con influencia sobre cualquier
serie hay tantos como acontecimientos imprevisibles puedan
ocurrrsele a uno (un atentado, un sesmo, un cambio
legislativo, una fusin empresarial, ..)

La presencia de este tipo de componentes deficientemente


incluidos en la especificacin, pueden generar problemas en los
modelos estimados.
En primer lugar, la presencia de puntos o perodos atpicos eleva
el error de estimacin, lo que repercute en varios aspectos clave
en materia de evaluacin general del modelo (tests de
significatividad, precisin en el contraste de hiptesis, tamao de
los intervalos para los parmetros y la prediccin, etc).

En segundo lugar, la propia presencia no atendida de tramos o


puntos anmalos puede inducir errores en la identificacin de las
estructuras ARMA.
En este sentido, algunos puntos atpicos pueden tener una
elevada influencia en los resultados de las medidas y los test que
se utilizan en la tarea de especificacin.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

338

Adicionalmente, la presencia de seales atpicas en las series y su


correcta deteccin aporta en muchas ocasiones una fuente
auxiliar de conocimiento del fenmeno analizado que no conviene
desperdiciar.
En lneas generales, el anlisis de intervencin aspira a
complementar la identificacin ARMA de la componente de
variabilidad sistemtica regular de la serie, aadiendo al modelo
una componente (de tipo determinista) que recoja los efectos de
los anmalos.
Esa componente determinista puede ser, a futuro, previsible o
imprevisible en funcin, precisamente, del carcter determinista
o no sistemtico del acontecimiento incluido.
La forma que adoptar la componente determinista del anlisis
de intervencin depender del tipo y duracin fenmeno a
incorporar en el modelo.
En ocasiones se tratar de series completas de tiempo en otras de
meras variables dummy pensadas para capturar algn
acontecimiento puntual.
As, por ejemplo, en el caso del modelamiento de datos atpicos
(outliers), suelen distinguirse algunos perfiles habituales (se
muestran slo algunos ejemplos de los diversosperfiles que
podran imaginarse):
Impulso: El acontecimiento es puramente Escaln: Se produce un cambio de nivel
puntual afectando a una nica (media) en la serie a partir de un
observacin.
determinado acontecimiento.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

20

339

40
35

10

30
0

25

-10

20

-20

15

10

-30

5
-40

-50

-5
1

14

27

40

53

66

79

92

105

118

131

144

157

170

183

196

209

222

235

248

261

274

287

300

313

326

339

352

365

378

391

404

417

430

443

456

469

482

495

14

27

40

53

66

79

92

105

118

131

144

157

170

183

196

209

222

235

248

261

274

287

300

313

326

339

352

365

378

391

404

417

430

443

456

469

482

495

Meseta: Una variante del atpico de Tendencia (o rampa): El acontecimiento


escaln pero de duracin determinada
impacta progresivamente en la serie
generando una tendencia determinista.
40
35

40

30

35

25

30
25

20

20

15

15

10

10

5
0

-5

-5
1

14

27

40

53

66

79

92

105 118 131 144 157 170 183 196 209 222 235 248 261 274 287 300 313 326 339 352 365 378 391 404 417 430 443 456 469 482 495

-10
1

14

27

40

53

66

79

92

105

118

131

144

157

170

183

196

209

222

235

248

261

274

287

300

313

326

339

352

365

378

391

404

417

430

443

456

469

482

495

Los distintos acontecimientos que requieren anlisis de


intervencin pueden ser conocidos previamente por el analista
por lo que su deteccin tcnica no es necesaria.
Sin embargo, la exploracin puramente tcnica de la serie en
busca de datos atpicos puede ser tambin importante por cuanto
algunos fenmenos que impactan en la serie pueden no ser
conocidos a priori (bien por falta de atencin o estudio del
analista, bien por tratarse de cuestiones particularmente raras e
inexplicables incluso a posteriori).
En este sentido, muchos programas con mdulos especficos de
anlisis de series temporales (TRAMO-SEATS) ofrecen

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

340

mecanismos de deteccin y caracterizacin de datos atpicos que


complementan las ideas a priori del analista.
Transformaciones de Box-Cox.
La familia de transformaciones ms utilizada para resolver los
problemas de falta de normalidad y de heterocedasticidad es la
familia de Box-Cox. Si se desea transformar la variable Y, cuyos
valores muestrales se suponen positivos, en caso contrario se
suma una cantidad fija M tal que Y + M > 0. La transformacin de
Box-Cox depende de un parmetro por determinar y viene dada
por:

Si se quieren transformar los datos para conseguir normalidad, el


mejor mtodo para estimar el parmetro es utilizar la
estimacin por mxima verosimilitud y se calcula como sigue
para diferentes valores de se realiza la transformacin:

Siendo y=(y1,y2,..yn)1/n la media geomtrica de la variable Y.


Para cada , se obtiene el conjunto de valores {Ui()}i=1n. La
funcin de verosimilitud es:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

341

Se elige el parmetro que maximiza L(). En la prctica, la


transformacin mas utilizada para buscar la homocedasticidad y
normalidad en el proceso estocstico el logaritmo natural.
METODOLOGA BOX JENKINS
La publicacin de Box y Jenkins Times Series Anlisis:
Forecasting and Control en la dcada de los 70s gener un
nuevo conjunto de herramientas de prediccin, cuyo
procedimiento se llam metodologa Box- Jenkins. Tambin
tcnicamente conocida como metodologa ARIMA.
Este mtodo de prediccin se basa en el anlisis de las
propiedades probabilsticas o estocsticas de las series de
tiempo econmicas en s mismas, pues una variable Yt puede ser
expresada como una funcin de sus valores pasados, razn por la
que algunas veces se les denomina modelos sin concepcin
estructural donde no existe relacin causal alguna a diferencia
de los modelos clsicos de regresin.
El objetivo de la metodologa Box Jenkins es identificar y
estimar un modelo estadstico que puede ser interpretado como
generador de la informacin de la muestra. En este sentido, si el
modelo estimado es usado para la prediccin debe suponerse
que las caractersticas de la serie es al menos estacionaria en
estido debil. Por lo tanto, la prediccin se efecta sobre una base
vlida considerando que el modelo es estacionario o estable.
PROCEDIMIENTO
Las etapas que se deben seguir en la elaboracin de un modelo
ARIMA con fines predictivos son las siguientes:
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

342

Etapa 1. Identificacin.

Esta fase consiste en detectar el tipo de proceso estocstico que


ha generado los datos. Esto significa encontrar los valores
adecuados del la parte autoregresiva (p),el orden de integracin
(d) y el componente de mendia mvil (q) del modelo ARIMA. Las
herramientas fundamentales en la identificacin son el
correlograma muestral y el correlograma parcial muestral.
Es importante tener en cuenta que antes de usar los criterios de
identificacin sobre las funciones de autocorrelacin de FAS y
FAP se debe lograr una serie estacionaria. Para ello, se efectan
las pruebas de estacionariedad a la serie original.
En caso de que esta no sea estacionaria, la variable puede
diferenciarse d veces hasta que sta sea estacionaria. Mediante
este procedimiento se identifica el orden de integracin d del
modelo ARIMA.
A continuacin se presentan los patrones tericos de la FAS y
FAP segn el tipo de modelo, los cuales son tiles en la
identificacin de p y q del modelo ARIMA:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

343

Puesto que en la prctica no se observan la FAS y la FAP tericas,


se usan las FAS y FAP estimadas, las cuales presentan error
estadstico. El objetivo es encontrar la mayor exactitud entre la
FAS y FAP tericas y estimadas, en tanto que la identificacin del
modelo ARIMA requiere de habilidad, la cual se obtiene con la
prctica. Cabe anotar, que en el procedimiento de identificacin
de p y q,
Cabe anotar, que en el procedimiento de identificacin de p y q,
se consideran aquellos rezagos estadsticamente significativos,
por lo cual no es necesario incluir rezagos intermedios hasta p o
q si stos no son significativos.

Etapa 2. Estimacin.

En esta etapa se estiman los coeficientes de los trminos


autorregresivos y de media mvil incluidos en el modelo, cuyo
nmero de rezagos p y q ya han sido identificados en la etapa
anterior.
Algunas veces la estimacin se efecta por OLS, pero en otras se
recurre a la estimacin no lineal de los parmetros. Este ltimo

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

344

procedimiento utiliza un algoritmo para minimizar la suma de


los cuadrados de los residuos, comenzando con algn valor
inicial de los parmetros del modelo.
En general el algoritmo busca si otro vector de parmetros
mejora el valor de la funcin objetivo, produciendo iteraciones
sucesivas hasta alcanzar la convergencia. Los paquetes
estadsticos efectan este procedimiento a travs de rutinas de
computador en las que se tienen definidos los parmetros
iniciales, as como los criterios de convergencia.
Tericamente el mtodo OLS en la medida que las muestras sean
grandes posee propiedades asintticas, esto quiere decir que se
generan estimadores asintticamente consistentes y convergen a
una distribucin normal, por lo que las pruebas hiptesis
convencionales sobre los parmetros del modelo sern vlidas.
La estimacin del modelo ARMA(p,q) se efecta para la serie que
se ha comprobado es estacionaria. En la prctica los modelos
ms comunes son los autorregresivos. Sin embargo, de acuerdo
con el teorema de descomposicin de Wold, el modelo ARMA
debera ser la primera opcin, teniendo en cuenta que la
inclusin de trminos adicionales MA puede mejorar las
propiedades estadsticas de la estimacin.
Los modelos MA son poco comunes y en la prctica a todos los
modelos se les incorpora la constante o intercepto. Debido a que
en la prctica es difcil identificar con exactitud el orden p y q del
modelo ARMA, se suelen plantear dos o ms modelos plausibles,

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

345

que luego de ser estimados son tiles para la eleccin del ms


apropiado.

Etapa 3. Verificacin de Diagnstico.

En esta etapa ser busca evaluar si el modelo estimado se ajusta a


los datos en forma razonablemente buena, ya que es posible que
exista otro modelo ARMA que tambin lo haga. A esta etapa
tambin se le conoce como validacin o comprobacin de
diagnstico en la cual se efectan algunas pruebas antes de hacer
uso del modelo para la prediccin.
La validacin o verificacin incluye el anlisis de los coeficientes
o parmetros del modelo, la evaluacin de la bondad de ajuste y
anlisis de los residuos.
1. Anlisis de los coeficientes. Se desea que el modelo
ARMA(p,q) estimado cumpla con las condiciones de
estacionariedad e invertibilidad y que exista significancia
estadstica en los rezagos incorporados. Teniendo en cuenta
las propiedades asintticas de la estimacin por OLS, los
estadsticos t-student pueden utilizarse para probar
significancia individual de cada uno delos coeficientes hasta
p y q.
2. Bondad de Ajuste. Debido a que en la fase de identificacin
se postula ms de un modelo tentativo, en el diagnstico o
validacin es importante identificar cul de los modelos
presenta una mejor bondad de ajuste. Una herramienta para
ello es el R2 ajustado, el cual es corregido por los grados de
libertad resultantes de introducir parmetros adicionales en
el modelo. Por esta razn es aconsejable el R2 ajustado que
el R2, ya que el primero en cierto modo tiende a evitar o
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

3.

4.

346

castigar la sobreparametrizacin. Sin embargo, el R2


ajustado tiene validez solamente cuando se comparan
modelos en los que se han tomado el mismo nmero de
diferencias. Esto se sustenta en que la varianza total
depende del nmero de diferencias que se haya tomado.
Debido a esta limitacin del R2 se han propuesto medidas
alternativas ecomo criterios de informacin como Akaike
Information Criterion (AIC) o el Schwartz Criterion (SBC).
Estas son herramientas estadsticas tiles para elegir el
nmero adecuado de rezagos p y q del modelo ARMA.
Ambos criterios se basan en la utilizacin de la suma de los
cuadrados de los errores, buscando minimizarla a partir de
diversas combinaciones de p y q. A esta prueba se le conoce
como la prueba de parsimonia. Al efectuar el diagnstico se
desea que tanto el AIC y el SC den lo menor posible al
comparar modelos con diversas combinaciones de p y q. En
este proceso es importante considerar que los rezagos
adicionales deben ser significativos, puesto que si stos no
los son aumenta k sin que la suma de cuadrados de los
errores se reduzca.
Anlisis de los residuos. El supuesto de errores del modelo
son un proceso puramente aleatorio (media cero, varianza
constante y no correlacin serial) debe verificarse. Para ello
es posible efectuar varios anlisis:
a. Grfico de los residuos. Consiste en una grfica de los
errores en funcin del tiempo. La grfica puede revelar
a simple vista si por ejemplo es admisible la hiptesis
de varianza constante o correlacin.
b. Correlograma de los residuos y el estadstico Ljung
Box. Se evala con el correlograma que los errores del

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

5.

347

modelo son ruido blanco. En caso de no serlo, es


indicativo de que hay alguna estructura remanente del
modelo que no se logr capturar. La manera de
efectuar la prueba es mediante la inspeccin del
comportamiento del correlograma muestral a medida
que aumenta el nmero de rezagos y a travs del
estadstico LjungBox.
c. Histograma. Generalmente se acostumbra probar que
los errores del modelo siguen distribucin normal. Para
ello, se construye el histograma de frecuencias. La
prueba de normalidad se efecta con el estadstico
Jarque Bera. En caso de que el modelo cuente con
errores autocorrelacionados se volver a la etapa de
identificacin con el objeto de reformular el modelo
hasta que los errores sigan un proceso puramente
aleatorio.
Pronstico. El paso mas importante. Se pronostica un
periodo futuro a partir del modelo seleccionado. Es decir,
aquel que es el mejor resultante de las etapas anteriores,
es importante considerar si la variable original fue
diferenciada. Se hace necesario ejecutar pruebas de
backtesting e intramuestra para verificar al asertividad del
modelo.

SELECCIN DE MODELOS
Existen dos metodologas en la seleccin de modelos de
pronstico. La primera parte de los criterios de informacin. La
segunda utiliza metodologas de minimizacin del error de
pronstico.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

348

CRITERIOS DE INFORMACIN
La seleccin de modelos en el anlisis economtrico involucra
tanto consideraciones estadsticas como no estadsticas. Esto
depender de los objetivos del anlisis, de la naturaleza y
extensin de la teora econmica utilizada y de los resultados
estadsticos del modelo bajo consideracin comparado con otros
modelos economtricos.
El clculo de los valores de las funciones de criterio corresponde
a las propuestas por Akaike (1973,1974), Schwarz (1978) y
Hannan-Quinn (1979), tanto para modelos uniecuacionales como
multiecuacionales.
Estos criterios de seleccin de modelos miden el ajuste (fit) de
un modelo dado, maximizando el valor de la funcin de mxima
verosimilitud con el uso de diferentes funciones de costos
(penalty) para tomar en cuenta el hecho de que diferentes
nmeros de parmetros desconocidos pudieron haber sido
estimados para diferentes modelos bajo consideracin.
Si ln() es el valor maximizado de la funcin de mxima
es el
verosimilitud de un modelo economtrico, donde
estimador de mxima verosimilitud de , basado en una muestra
de tamao n.
Definicin. Criterio de informacin de Akaike (AIC). Para este
modelo proporciona una aproximacin para muestras pequeas.
Se define como:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

349

Definicin. Criterio de informacin Bayes-Schwarz (BIC).


Suministra una aproximacin para muestras grandes del
porcentaje de probabilidad del modelo bajo consideracin. Este
criterio se define como:

Definicin. Criterio de informacin HannanQuinn. Este criterio de


informacin fue primeramente propuesto para seleccionar el
orden autorregresivo de los modelos de promedios mviles o
vectores autorregresivos (VAR), y es definido por:

MINIMIZACIN DEL ERROR DE PRONSTICO


Si entendemos que una prediccin es mejor que otra cuando
comete menor error, los criterios de seleccin de modelos seran
el error cuadrtico medio (ECM), error absoluto medio (EAM) y
error absoluto porcentual medio (EAPM). Estos indicadores se
calcularan a perodo histrico, es decir, se calcularan los
valores que el modelo ofrece para las H ltimas observaciones y
se compararan con el valor real, del siguiente modo:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

350

Otra medida que permite analizar la bondad de la prediccin.


Est basada en la diferencia cuadrtica que existe entre las tasas
de crecimiento de la variable real y la estimada conocida como u
de Theil.
El valor de coeficiente est comprendido entre 0 y 1. El valor 0
supone una prediccin perfecta ya que coinciden ambas tasas en
todos los puntos.
El valor 1 en cambio supone mxima desigualdad, este hecho se
puede deber a predicciones nulas para valores reales distintos
de cero o viceversa.
n

y
i 1

U Theil

y i

n
n

yi
i 1

y
i 1

El valor del coeficiente se puede atribuir a tres factores:


1. Error Sistemtico: atribuido a la diferencia sistemtica entre
el promedio de las tasas reales y estimadas de la variable
dependiente. Toma valores positivos o negativos segn la
media de la tasa de crecimiento de la variable estimada sea
mayor o menor que la media de la tasa de la variable real.
2. Error de Dispersin:atribuido a la diferencia entre las
desviaciones tpicas de las tasas de crecimiento reales y
estimadas de la variable dependiente. Toma valores entre 0
y 1 -1 y 0 segn la dispersin de la tasa de crecimiento de
la variable estimada sea mayor o menor que la media de la
tasa de la variable real.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

3.

351

Error de Correlacin: Supone el que las dos series siguen


trayectorias distintas, queda reflejado en la mayor o menor
correlacin existente entre las tasas de crecimiento reales y
estimadas de la variable dependiente.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

352

PROCESOS ESTACIONALES
Durante los ltimos aos se presenta un aumento pronunciado
del inters por el anlisis de la variacin estacional de las series
cronolgicas.
Este hecho, junto con investigacin relacionada con el tema de
races unitarias de modelos autoregresivos, llev al tratamiento
de las races unitarias estacionales.
La evidencia proporcionada por estos estudios indica que,
adems de ser no estacionarias, muchas series cronolgicas
econmicas observadas con periodicidad inferior a la anual
muestran tambin variaciones estacionales que son ms grandes
y ms irregulares que lo que se crea anteriormente.
De hecho, mientras algunas variables muestran variaciones
estacionales determinsticas, otras despliegan movimientos
estacionales que cambian lentamente a travs del tiempo.
En otras palabras, algunas series cronolgicas econmicas
observadas con periodicidad trimestral o mensualmente parecen
desplegar a menudo variaciones estacionales estocsticas no
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

353

estacionarias y, en esos casos, los correspondientes procesos


generadores de los datos (PGD) son llamados estacionalmente
integrados o procesos con races unitarias estacionales.
Cuando se trabaja con datos que presentan estacionalidad, se
puede utilizar algn filtro para obtener datos estacionalmente
ajustados o puede intentar captar la estacionalidad por medio de
variables dummy estacionales lo que es equivalente a suponer
que las variaciones estacionales son puramente determinsticas.
Sin embargo, si los efectos estacionales cambian gradualmente a
travs del tiempo, el modelo de variables dummy produce una
especificacin dinmica errada.
Por esta razn, siempre que se usen datos estacionales en
econometra es aconsejable hacer la prueba de las propiedades
estacionales de las series cronolgicas utilizadas.
PROCESOS ESTACIONALES E INTEGRACIN ESTACIONAL
La teora subyacente al anlisis de series cronolgicas
estacionales considera tres clases de procesos estacionales:
1. Puramente determinsticos,
2. Estacionarios en covarianza
3. Procesos estacionales integrados.
La primera clase incluye aquellos procesos generados por
componentes puramente determinsticos como un trmino
constante, variables dummy estacionales y tendencias
determinsticas. En el siguiente ejemplo, el proceso yt es
generado solamente por dummies estacionales que afectan la
coordenada al origen:
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

354

y t i Dit t

(1)
Donde las variables Dit (i = 1,2,..., s) toman el valor 1 cuando t
corresponde a la estacin i, y cero en los otros casos, y donde t
es un conjunto de variables aleatorias idntica e
independientemente distribudas (IID). Esta ecuacin puede ser
reformulada para evitar la confusin entre los niveles de las
diferentes estaciones, de la siguiente manera:
y Di
(2)
Donde es la media del proceso y los coeficientes i* estn
sujetos a la restriccin de sumar cero. Para hacer operativa esta
restriccin las dummies Dit* (i = 1, 2,..., s) se definen de manera
tal que toman valor 1 cuando t corresponde a la estacin i, 1
cuando t representa la estacin s, y valen cero el resto de las
veces, y donde t es una serie de variables aleatrias IID.
Finalmente, la ecuacin anterior tambin puede incluir
tendencias determinsticas con coeficientes estacionales
constantes o variables, es decir,
y Di [ Di g (t )]
(3)
Donde g(t) es un polinomio determinstico en t. El segundo caso,
proceso estacional estacionario en covarianza, puede ser
ejemplificado por un modelo expresado como
yt = s yt s + t
(4)
i 1

s 1

i 1

*
i

*
t

s1

i 1

i 1

donde s < 1 y t es un conjunto de variables aleatorias IID. Si


s = 1 en la ecuacin (4), entonces tenemos un paseo aleatorio
estacional, un proceso que exhibe un patrn estacional que vara
a travs del tiempo. sta es la tercera clase de proceso estacional
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

listada anteriormente. En ese caso, la variable


como,
s yt = ytyts
(5)

s yt ,

355

definida

Es estacionaria. La diferencia principal entre estas formas de


estacionalidad es que en el modelo determinstico, si t es ruido
blanco, los shocks, o innovaciones, tienen slo un impacto
inmediato; en el caso del modelo estacional estacionario los
shocks tienen un efecto transitorio (desaparecen en el largo
plazo), mientras que tienen un efecto permanente en el modelo
integrado. Es decir, los procesos estacionalmente integrados
tienen propiedades similares a aqullas observadas en el caso
ordinario (frecuencia cero). Las series tienen buena memoria de
manera tal que los efectos de un shock permanecen para
siempre y pueden, en consecuencia, modificar el patrn
estacional de manera permanente.
Estos procesos tienen varianzas que aumentan linealmente
desde el comienzo de la serie y no estn asintticamente
correlacionados con procesos que tengan races unitarias en
otras frecuencias. La secuencia de los tests depende de la
definicin de integracin estacional adoptada. De entre las
diferentes definiciones de integracin estacional existentes
mencionamos tres de ellas: la propuesta por Osborn (1988), otra
debida a Engle (1989) y finalmente aqulla dada por Hylleberg
(1990). Se dice que una variable es integrada de rdenes (d,D),
denotado I(d,D), si la serie se transforma en estacionaria
despus de diferenciarla d veces con diferencias finitas y D veces
con diferencias estacionales, es decir, Xt ~ I(d,D) si

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

356

(1 L)d (1 Ls ) D X t d Ds X t

es estacionaria. El segundo concepto


establece que una serie cronolgica es integrada de orden d0 y ds,
denotado SI(d0,ds), si (1 L) [S ( L)] X [S ( L)] X es estacionaria,
donde la expresin polinmica S(L) se define como
S(L)=1+L+L2+L3+.Ls-1. Cuando las variables no presentan
integracin estacional ambas definiciones coinciden, es decir,
I(1,0) = SI(1,0), I(2,0) = SI(2,0), etc. Por el contrario, siempre
que una serie es estacionalmente integrada estas definiciones
difieren. Esto sucede porque s=(1-Ls) puede factorizarse como
(1-L)S(L). De esta manera, el equivalente de I(0,1) es SI(1,1);
I(1,1) = SI(2,1), y as sucesivamente. De la misma manera, el
proceso SI(0,1) no tiene equivalente. En este trabajo
utilizaremos la definicin SI. Finalmente, una tercera definicin
afirma que una serie xt es un proceso estacional integrado si
tiene una raz unitaria estacional en su representacin
autoregresiva. Ms generalmente, es integrada de orden d en la
frecuencia si el espectro de xt toma la forma
d0

ds

d0

ds

f ( ) c( ) 2d

Para prxima a . Esto es denotado convenientemente por


xt~I(d). Esta definicin resulta conveniente al discutir los
resultados de algunas pruebas.
PRUEBAS DE RACES UNITARIAS ESTACIONALES
Antes de describir las diferentes pruebas es necesario tener la
estrategia propuesta por Dickey-Pantula (1987) que sugieren
que para conservar el tamao nominal de la prueba en el caso de
ms de una raz unitaria, es conveniente comenzar la sucesin de
pruebas a partir del nmero mximo de races en consideracin.
Esto tambin es vlido cuando se trabaja con datos trimestrales

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

357

y presenta una sucesin completa de posibles pruebas que


empiezan con el caso SI(2,1), indicando las alternativas que
pueden someterse a cada prueba en cada caso. Siguiendo este
criterio en el caso que nos ocupa, comenzamos haciendo la
prueba de hiptesis de existencia de dos races unitarias.
Si una variable tiene que ser filtrada de alguna manera para que
se transforme en estacionaria, esto puede ser causado por una
raz unitaria, o por races unitarias de alguna frecuencia
estacional. Este hecho determina cual ser el modelo de
regresin que debe ser estimado para hacer la prueba dada una
hiptesis nula. La idea bsica es que cuando la hiptesis nula
establece que existe una raz unitaria en el rezago de orden 1 o
en los rezagos estacionales, los estadsticos de la prueba de
hipotesis son modificados de manera tal que, al estimarse la
regresin, se usen datos apropiadamente diferenciados (con o
s, respectivamente). Cuando la hiptesis mantenida es que
existen races unitarias en las frecuencias estacionales, deben
usarse datos estacionalmente corregidos.
PRUEBAS CON HIPTESIS NULA DE EXISTENCIA DE RACES
UNITARIAS
La prueba HEGY es una extensin del modelo Dickey-Fuller para
el caso en que la periodicidad de los datos es trimestral. ste es
el test ms comnmente usado en los trabajos empricos
recientes. La estrategia propuesta permite detectar la presencia
de races unitarias en una (o en todas) las frecuencias
estacionales as como en la frecuencia cero. Para hacer la prueba
la hiptesis nula de que las races del polinomio autoregresivo
(1-L4)=0 estn localizadas sobre el crculo unitario, versus la
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

358

alternativa de que se encuentran fuera del mencionado crculo,


los autores usan la factorizacin del polinomio basado en las
cuatro races del mismo
(1 L ) (1 L)(1 L)(1 iL)(1 iL)
(6)
4

Donde cada factor del lado derecho de la igualdad est asociado


con una raz en particular. Agrupando los factores del lado
derecho de (6) de tres maneras diferentes, obtenemos:
(1 L)(1 L)(1 iL)(1 iL) (1 L) S ( L)
(7.1)
2
3
(1 L)(1 L L L )
(7.2)
2
2
(1 L )(1 L )
(7.3)
El segundo factor en el lado derecho de las tres igualdades
anteriores, o sea S(L), (1-L+L2-L3) y (1-L2), son filtros que
transforman adecuadamente los datos originales generando tres
variables auxiliares utilizadas en la regresin de la prueba.
Cuando la hiptesis nula de la prueba establece que existen dos
races unitarias en la frecuencia cero esos filtros se aplican sobre
la primera diferencia de la variable en vez de aplicarlos sobre el
nivel de la misma. Este ltimo caso, que corresponde a la prueba
de una raz unitaria, es el que usamos a continuacin para
mostrar el procedimiento HEGY. Si denominamos yt a los precios
e yit (i = 1,2,3) a las variables auxiliares, tenemos:
Y1t=S(L)yt es la transformacin de los datos que filtra toda
la variacin estacional de la serie reteniendo la raz unitaria
asociada a la raz +1 del polinomio autoregresivo
(frecuencia cero).
Y2t=-(1-L+L2-L3)yt es la transformacin que retiene la raz
unitaria 1 del polinomio autoregresivo, la cual est

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

359

asociada con la frecuencia . El cambio de signo del filtro


tiene por objeto facilitar la manipulacin algebraica mas no
afecta la esencia de la prueba.
Y3t=-(1-L2)yt es la variable auxiliar asociada con las dos
races complejas conjugadas del polinomio autoregresivo y
que corresponde a la frecuencia /2 .
Cabe resaltar, por lo tanto, que se cumplen las siguientes
igualdades:
4 yt (1 L)(1 L L2 L3 ) yt (1 L) Y1t
4 yt (1 L)(1 L L2 L3 ) yt (1 L)Y 2t
4 yt

(1 L2 )(1 L2 ) yt

(1 L2 )Y 3t .

Despus de hacer uso de algunos resultados del lgebra, se


obtiene una expresin equivalente que facilita la prueba de
hiptesis de hiptesis. El modelo testable resultante, usado para
verificar la presencia de una raz unitaria48 en la frecuencia cero
y races unitarias en las frecuencias estacionales, est dado por
la ecuacin (8) que puede ser estimada por mnimos cuadrados
ordinarios (OLS y los estadsticos usados para realizar
inferencias, mientras que el trmino t puede contener una
constante, una tendencia determinstica y/o tres dummies
estacionales:
4 yt t 1Y1t 1 2Y2t 1 4Y3t 1
k

3Y3t 2 i 4 yt i t

(8)

i 1

48

En este caso la hiptesis nula de existencia de dos races unitarias en la frecuencia cero ya fue rechazada. El modelo usado en aquel test es
semejante a la ecuacin (8): la variable dependiente es
aplicados a

yt

en vez de

12 yt

y las auxiliares fueron obtenidas con los filtros anteriores, apenas que

yt .

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

360

La interpretacin de los resultados y los valores crticos


necesarios para realizar las pruebas pueden encontrarse en
Hylleberg (1990). El orden de los rezagos (el valor de k en la
suma) es determinado usando las pruebas de diagnstico de
manera tal que los errores del modelo estimado sean ruido
blanco. En la estimacin de la ecuacin (8), si no se rechaza la
nula de 1=0 significa que existe una raz unitaria en los datos
estacionalmente ajustados. No rechazar 2=0 implica en la
existencia de una raz unitaria en el ciclo estacional con periodo
semestral (dos ciclos por ao). Si 3 y 4 son estadsticamente
iguales a cero existe una raz unitaria en el ciclo estacional anual.
PRUEBAS CON HIPTESIS NULA DE ESTACIONARIEDAD
Puesto que las pruebas HEGY toman como nula la existencia de
races unitarias, el rechazo de su hiptesis nula implica el
resultado (fuerte) que la serie tiene un comportamiento
estacional estacionario. Sin embargo, debido a la baja potencia de
las pruebas en muestras de tamao moderado, la falta de
rechazo de la hiptesis nula no puede tomarse como evidencia a
su favor de la presencia de races unitarias. Teniendo en cuenta
este problema de baja potencia de las pruebas HEGY, un
complemento til de los procedimientos anteriores sera otra
prueba que tomase la estacionalidad estacionaria como hiptesis
nula y la no estacionaria como alternativa. En este contexto, el
rechazo de la hiptesis nula implicara el resultado (fuerte) de
que los datos son de hecho no estacionarios, una conclusin que
ni las pruebas DHF ni los de HEGY pueden proporcionar. Visto
conjuntamente con estas pruebas, el procedimiento permitira
realizar un anlisis ms completo de sus datos.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

361

El punto de partida es un modelo lineal de series cronolgicas


con estacionalidad estacionaria que puede especificarse
matemticamente de dos maneras diferentes, aunque
equivalentes. La primera es la representacin trigonomtrica
usada en la literatura de serie cronolgicas, y la segunda, es la
formulacin con variables dummy. El primer procedimiento da
lugar a dos pruebas de races unitarias en las frecuencias
estacionales, y el segundo, resulta en cuatro pruebas para la
variacin en el tiempo de los coeficientes de las variables
dummy estacionales (datos trimestrales). Estas diferentes
pruebas son obtenidas mediante la especificacin apropiada de
la hiptesis alternativa en cada caso. La regresin auxiliar usada
para realizar estas pruebas es la siguiente:
yt Zt' f t ' ut
(9)
Donde la variable Zt es un vector de tamao (kx1) de variables
'
explicativas, ut es estacionaria, f t [cos(1 , t ), sin(1 , t ),...,cos(s/2 , t),sin(s / 2, t)] ,
donde
j

2 j
s
s ( j 1, 2,.... 2)

El valor de s es el nmero de observaciones por ao. De esta


manera, ft es equivalente a un conjunto de variables dummy
estacionales representado en el dominio de la frecuencia. Si la
alternativa en consideracin es estacionalidad no estacionaria,
entonces debe hacerse una prueba simultnea de la existencia de
races unitarias en todas las frecuencias estacionales. Esto
significa que, para ejecutar la prueba de estabilidad con hiptesis
nula de estacionariedad en todas las frecuencias, el estadstico
que debe calcularse es el siguiente:
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

362

T
~ ~
~
L f T 2 Ft( f ) 1 Ft
t 1

~
~ ~
T 2 tra[( f ) 1 Ft Ft ]
t 1

~
Ft f t u~t

Donde
es una secesin de sumas parciales, u es el
conjunto de residuos en la estimacin de la ecuacin (9) por
MCO y donde
1
~
W ( k , m) f f u~ u~
T
t 1

k m

t k

t k

Es una estimacin consistente de la matriz de varianza~


covarianza de f u (llevando en cuenta la posible existencia de
heterocedasticidad y autocorrelacin), y donde W(,) es un
alisado o suavizamiento (smoothing). Si lo que interesa es hacer
la prueba de los componentes estacionales en las
correspondientes frecuencias individuales, la matriz pertinente
asume una forma diferente y el estadstico L original se reduce a
Lj (j=1,2,...,s/2) que puede computarse como un subproducto
del clculo de Lf. Cuando se usan datos trimestrales (s=4)
resultan dos estadsticos de ese tipo. stos son dados por la
forma cuadrtica
~ ~
~
L T F ( ) F
t

t 1
T

t 1

~
fj j

f
2 j 1, 2 j 1
f
2 j , 2 j 1

s
2

f
jj

jt

~
Fjt f jt u~t

donde

f
2 j 1, 2 j
f
2 j ,2 j

jt

f jt' [cos( j , t ), sin( j , t )] f s/ 2,t cos( , t ) ( 1) t

~f

Para
y donde hl es un elemento caracterstico de . La
distribucin asinttica del estadstico de la prueba es la
distribucin generalizada de Von Misses con grados de libertad
segn la dimensin del proceso de sumas parciales. Las pruebas
f

|Facultad de Economa |Carlos Mendoza Astroz|

jj

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

363

Lj son complementos tiles de la prueba conjunta Lf. Si la prueba


conjunta rechaza la hiptesis nula esto podra deberse a la
existencia de races unitarias en cualquiera de las frecuencias
estacionales.
Las pruebas Lj son aptos para descubrir exactamente en cual
frecuencia estacional especfica surge la no estacionariedad. Para
realizar el test de patrones estacionales variables se usa el
modelo ms tradicional con variables dummy estacionales,
determinando si la coordenada al origen estacional cambia a
travs del tiempo. Nuevamente, escogiendo apropiadamente la
forma de la matriz pertinente es posible definir s estadsticos La
diferentes (a=1,2,3,s) que permiten hacer la prueba de la
estabilidad de la a-sima ordenada al origen estacional. Cuando
el objetivo de la prueba es la estabilidad conjunta de las
constantes estacionales se define un estadstico Lj.
Sin embargo, ste es una prueba para inestabilidad en cualquier
ordenada al origen estacional, de manera que pueden detectarse
hasta movimientos de largo plazo. Como resultado, la hiptesis
nula puede rechazarse en consecuencia de la existencia de
inestabilidad de largo plazo en esa frecuencia, lo cual es un rasgo
indeseable de la prueba. Las modificaciones propuestas por
Canova y Hansen para resolver este problema llevaron de vuelta
al estadstico de prueba conjunta definida en el primer caso.
EJEMPLO. DESCRIPCIN DE LOS DATOS Y RESULTADOS DE LOS
TESTS

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

364

Los datos son el precio medio de exportacin, por trimestre, de


la tonelada de carne bovina argentina que cubren el periodo
19601970, estn expresados en pesos de 1960. La segunda
fuente es una publicacin donde se publica la serie mensual del
ndice del precio real del kilogramo vivo del novillo en el
Mercado de Liniers. Esta serie cubre el periodo enero de 1970
octubre de 1994.
GRFICO I. PRECIO TRIMESTRAL DEL NOVILHO EN EL
MERCADO DE LINIERS
(ndice de los precios reales; base de comparacin: 1970-I)
Periodo: 19601994
180
160
140
120
100
80
60
40
60

65

70

75

IND70NOR

80

85

90

IND70SEC

La observacin del grfico revela una acentuada disminucin del


ndice entre 1973 y 1975. Con efecto, el ndice cae de un valor de
160 en el primer trimestre de 1973 para 55 en el tercer
trimestre de 1975. Cabe resaltar que esa disminucin ocurre en
la serie de la SAGyP, lo cual elimina la posibilidad de que el
problema se origine en el encadenamiento de las series. En

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

365

consecuencia, es evidente que los datos correspondientes al


periodo 19601974 tienen un nivel medio superior al resto de la
serie. Usando la prueba de Chow en un modelo de regresin con
una dummy para la ordenada al origen y otra para la pendiente,
se detecta una ruptura estructural en la serie al final de 1974.
Por lo tanto, el ltimo trimestre de 1974 y el primero de 1975
pertenecen a dos conjuntos de datos diferentes. La primera
mitad tiene 60 observaciones y valor medio de 125,56 mientras
que la segunda, con 80 observaciones, tiene media igual a 89,96.
En el Cuadro I se presentan los estadsticos estimados y los
valores crticos necesarios para realizar las distintas pruebas
HEGY. En los tres periodos fue ajustado el modelo dado por la
ecuacin (8), con las diferencias indicadas en el cuadro, es decir,
en todos los casos se incluye una constante mientras que
solamente en el periodo completo se incluye una tendencia
determinstica. Como los coeficientes de las variables dummy
estacionales no fueron significativos tales variables fueron
eliminadas de los modelos. En ninguno de los tres casos fue
necesario incluir la variable dependiente rezagada para obtener
residuos sin autocorrelacin.
CUADRO I. Resultados de las pruebas con Hiptesis Nula de
Existencia de Races Unitarias
Prueba
Parm Estad Valor
etro
stico crtico
(5%)

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

Periodo: 19601974
Ecuacin con constante, sin
tendencia y sin dummies
estacionales. N = 60

Periodo: 19751994
Ecuacin con constante, sin
tendencia y sin dummies
estacionales. N = 80

Periodo: 19601994
Ecuacin con constante, con
tendencia y sin dummies
estacionales. N = 140

1
2
3
4
3
4
1
2
3
4
3
4
1
2
3
4
3
4

2,91
5,63
5,92
3,70
33,48

2,96
1,95
1,90
1,72
3,04

4,89
6,90
6,90
3,35
40,80

2,88
1,95
1,90
1,68
3,08

4,34
8,67
8,44
5,20
68,25

3,46
1,96
1,90
1,64
3,04

366

Exceptuando el caso del coeficiente 1 en el periodo 19601974,


en todos los otros casos se rechaza la hiptesis nula de existencia
de races unitarias al 5% de significancia. Antes de concluir que
existe una raz unitaria en la frecuencia cero de la serie del
primer periodo, recordemos las advertencias de Canova y
Hansen (1995) sobre la baja potencia de las pruebas HEGY. Si
esa raz unitaria realmente existiera eso implicara la presencia
de una tendencia en la serie. Sin embargo, cuando se incluye la
variable tendencia en el modelo el coeficiente de la misma no es

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

367

significativo pero transforma en significativo el coeficiente 1


(estadstico 3,21), rechazando la hiptesis de existencia de raz
unitaria.
CUADRO II. RESULTADOS DE LOS TESTS CON HIPTESIS NULA
DE ESTACIONARIEDAD
Caractersticas de los Valor Estadsticos
Tests
es
196 1975 1960
(Tamao
de
la Crtic 074 94 94
muestra)
os
(5%)
Y
includo como
No No
S
regressor N

60 80
140
Races en todas las 1,01 0,46 0,28 0,82
frecuencias
0,75 0,37 0,24 0,49
Raz unitaria en la 0,47 0,13 0,04 0,35
frecuencia
Raz unitaria en la
0,47 0,20 0,04 0,28
frecuencia /2
0,47 0,13 0,13 0,15
Inestabilidad
por 0,47 0,10 0,10 0,44
0,47 0,28 0,12 0,23
trimestre:
Trimestre 1
1,24 0,71 0,38 1,23
Trimestre 2
Trimestre 3
Trimestre 4
t 1

Inestabilidad en todos
los trimestres

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

368

Acerca de los resultados obtenidos con la aplicacin de la


metodologa de CH (ver Cuadro II), los tests fueron ejecutados
con la serie de los precios sin ninguna transformacin. En los dos
subperiodos no se incluy la variable dependiente retrasada
entre los regresores, pero s se lo hizo en el caso de la serie
completa debido a la presencia de la tendencia decreciente ya
comentada. Los datos del Cuadro II informan los valores de los
estadsticos necesarios para realizar el test conjunto de
existencia de races unitarias en todas las frecuencias y en cada
una de las frecuencias estacionales. Tambin se presentan
aquellos estadsticos con los cuales se hacen los tests de
estabilidad de los coeficientes de las variables dummy
estacionales trimestre por trimestre y en conjunto. Como puede
observarse, en ninguno de todos los casos se rechaza la hiptesis
nula de estacionariedad al nivel de 5% de significacin. Esto
indica que la serie es estacionaria tanto en la frecuencia cero
cuanto en las frecuencias estacionales. Estos resultados son
coherentes con aquellos obtenidos al usar el test de HEGY.
Comparando nuevamente con los resultados obtenidos en el
caso de la aplicacin de la metodologia de CH a la serie de
precios de So Paulo, Aguirre y Sans (1999) encuentran
evidencias de existencia de una raz unitaria estacional en la
frecuencia de la serie brasilea. Tales resultados contradicen
aquellos producidos para la misma serie por los tests de
HEGY. Como em ambas metodologas la hiptesis nula es
rechazada, Aguirre y Sans eliminan la posibilidad de que la
causa de esta incoherencia sea la baja potencia de los tests,
concluyendo que debe tratarse de una especificacin incorrecta
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

369

del modelo utilizado para efectuarlos. El verdadero modelo


podra ser, por ejemplo, no lineal.
BIBLIOGRAFA
1 Wooldridge, Jeffrey M. (2003).Econometric Analysis of
Cross Section and Panel Data. MIT Press.
2 Kalman, R.E., A New Approach to Linear Filtering and
Prediction Problems, Trans. ASME,J. Basic Engineering,
vol 82, March 1960, pp 94-35.
3 Hamilton, J.D. (1994) Time Series Analysis, Princeton
University Press.
4 Amemiya T.(1985), Advanced Econometrics. Harvard
University Press.
5 Greene W. (1997), Econometric Analysis. Prentice Hall,
tercera edicin.
6 White,
H.
(1984),
Asymptotic
Theory
for
Econometricians. Academic Press
7 Kydland, Finn y Prescott, Edward. (1990). "Business
Cycles: Real Facts and a Monetary Myth". En: Quarterly
Review. Federal Reserve Bank of Minneapolis.
Primavera. P.3-18.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

370

VECTORES AUTOREGRESIVOS (VAR)


La aplicacin de vectores autoregresivos (VAR) modela las
interacciones simultneas entre un grupo de variables. Un VAR
es un modelo de ecuaciones simultneas formado por un sistema
de ecuaciones de forma reducida sin restringir49. En un modelo
vectorial autoregresivo de primer orden, VAR(1), las variables
explicativas de cada ecuacin son una constante, ms un rezago
de cada una de las variables del modelo. Si el modelo pretende
explicar el comportamiento temporal de 3 variables, por
ejemplo, habra 3 variables explicativas, ms una constante en
cada ecuacin, para un total de 12 coeficientes a estimar,
siguiendo la formula n+np. Como puede verse, todas las
variables son tratadas simtricamente, siendo explicadas por su
pasado. Pueden incluirse tambin, como variables explicativas,
algunas de naturaleza determinista, como tendencias
temporales, variables dummy estacionales, que sirve para llevar
a cabo una anlisis de intervencin en el sistema. Por ltimo,
podra incluirse como explicativa una variable, incluso en valor
contemporneo, que pueda considerarse exgena respecto a las
variables que integran el modelo VAR.
El modelo VAR es til cuando existe evidencia de simultaneidad
entre un grupo de variables y la posibilidad de que sus
relaciones se transmitan a lo largo de un determinado nmero
de perodos. Al no imponer ninguna restriccin sobre la versin
estructural del modelo este incurre en errores de especificacin
que son solucionados imponiendo restricciones. De hecho, la
principal motivacin detrs de los modelos VAR es la dificultad
49Ecuaciones

de forma reducida indica que los valores contemporneos de las variables del modelo no aparecen como variables explicativas en
ninguna de las ecuaciones. El conjunto de variables explicativas de cada ecuacin est constituido por un bloque de rezagos de cada una de las
variables del modelo. Las ecuaciones no restringidas implica que en cada una de ellas exsite el mismo grupo de variables explicativas.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

371

en identificar variables como exgenas50 como se hace necesario


en el proceso de identificacion y estimacin en un modelo de
ecuaciones simultneas. En un modelo VAR todas las variables se
tratan de igual modo, el modelo tienen tantas ecuaciones como
variables, y los valores rezagados de todas las ecuaciones son
variables explicativas en todas las ecuaciones.
Una vez estimado el modelo, puede procederse a excluir algunas
variables explicativas, en funcin de su significancia estadstica.
Si se mantiene el mismo conjunto de variables explicativas en
todas las ecuaciones, la estimacin por mnimos cuadrados
ordinarios (OLS) ecuacin por ecuacin es eficiente. Sin
embargo, la presencia de bloques de rezagos como variables
explicativas hace que la colinealidad entre variables explicativas
sea relevante, lo que hace perder precisin en la estimacin del
modelo y reduce los valores numricos de los estadsticos tipo t
de Student. En un modelo VAR estimado no tiene sentido tratar
de interpretar los signos y las magnitudes de los coeficientes
individuales. Por el contrario, hay que utlizar estadsticos
globales, que traten de resumir con carcter agregado la
influencia de unas variables sobre otras que incluye estadsticos
tipo F para el contraste de significancia de un bloque de rezagos
de una determinada variable, contrastes de causalidad, funciones
de impulso respuesta y descomposiciones de la varianza del
error.
EL MODELO VAR

50

La defincion de exogeneidad estadstica se expondr con mas detalle en el documento siguiendo a Sims (1980)

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

372

En el caso ms simple, con slo dos variables y un rezago, el


modelo VAR(1) puede ser expresado como:

o, en forma matricial,

Donde los trminos de error satisfacen las siguientes


propiedades:

En el modelo VAR anterior, valores negativos de 12 y 21 tienden


a inducir correlacin negativa entre y1t e y2t si bien no la
garantizan. Una innovacion inesperada en y2t, en la forma de un
valor no nulo de la innovacin u2t, adems de afectar a y2t, influye
sobre y1t, a travs de de la correlacin entre las innovaciones de
ambas variables. En general, una sorpresa en y2t vendr
acompaada de un valor no nulo de la innovacin u1t, salvo en el
caso excepcional en que u1u2=0. Estos efectos se propagan en el
tiempo debido a la presencia de los valores rezagados como
variables explicativas. En general, un modelo VAR en trminos
de sus rezagos anteriores puede ser expresado como:
Donde Yt es un vector columna nx1, K es el orden del modelo
VAR, o nmero de rezagos en cada ecuacin, y ut es un vector
nx1 de innovaciones sin autocorrelacin, con la propiedad que
var(ut)= constante. El elemento (i,j) en la matriz As, 1sK
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

373

mide el efecto directo de un cambio en Yi en el instante t sobre


las variables explicativas al cabo de s perodos, Yj,t+s. El elemento
i-simo en ut es el componente de Yit que no puede ser previsto
utilizando el pasado de las variables que integran el vector Yt.
UN MODELO ESTRUCTURAL
Es til interpretar el modelo VAR como una forma reducida de
un modelo estructural,
Donde y1t, y2t son variables estacionarias, y 1t, 2t son
innovaciones, procesos ruido blanco con valor esperado cero y
varianzas 21, 22. Este es un modelo de ecuaciones simultneas
con sus dos variables endgenas. Una innovacin en y2t, en la
forma de un valor no nulo de la innovacin estructural 2t, afecta
directamente a y2t, pero tambin influye sobre y1t a travs de la
presencia de y2t como variable explicativa en la primera
ecuacin. Este efecto se propaga en el tiempo debido a la
presencia de los valores rezagados. Es natural pensar que los
trminos de error del modelo estructural estan no
correlacionados, puesto que la correlacin contempornea entre
y1t e y2t ya est capturada por la presencia de sus valores
contemporneos como variables explicativas en ambas
ecuaciones. Por tanto, suponemos que Cov(1t,2t)=1,2=0. De
forma resumida, la representacin matricial del modelo
estructural puede escribirse,
Con

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

374

Y si suponemos que la matriz B tiene inversa, lo cual requiere


que 1121 1, tenemos,
Donde

Con lo que supone la forma reducida del modelo VAR. Si los


trminos de error del modelo estructural eran ruido blanco,
tambin los trminos de error del modelo VAR tendrn
estructura ruido blanco. Sin embargo, las innovaciones del VAR
estarn correlacionadas entre s, puesto que,
De modo que, si los trminos de error del modelo estructural
estn no correlacionados, 12=0, las perturbaciones del modelo
VAR tendrn correlacin no nula. Es importante examinar las
relaciones entre los parmetros de ambos modelos, que son, en
el caso del modelo VAR(1), las 6 relaciones entre los parmetros
y los parmetros que aparecen en (3.3), ms las 3 relaciones
entre los elementos de las respectivas matrices de covarianzas,

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

375

IDENTIFICACIN EN UN MODELO VAR


La estimacin de un modelo VAR(1) en forma reducida
proporciona valores numricos para 10 parmetros, las dos
constantes ms los cuatro coeficientes en las variables rezagadas
y las varianzas y covarianza del vector ut. El modelo estructural
consta de 11 parmetros, las dos constantes, los 6 coeficientes, y
los 3 parmetros de la matriz de covarianzas del vector t, por lo
que no es posible recuperar los parmetros del modelo
estructural. En modelo 1 se prueba que el modelo estructural
recursivo bivariante de orden 1, de la forma:
Modelo 1. Suponga un modelo VAR con las siguientes
caracterisiticas:

El modelo anterior est exactamente identificado, es decir, sus


parmetros pueden recuperarse de forma nica a partir de las
estimaciones del modelo VAR en forma reducida. Este es un
modelo que identifica todos los parmetros del modelo
estructural a partir de las estimaciones de la forma reducida,
introduciendo la hiptesis de que la variable y1t afecta a la
variable y2t nicamente con un rezago, mientras que la direccin
de influencia de y2t hacia y1t se presenta dentro del mismo
perodo. No slo se pueden recuperar estimaciones de todos los
parmetros que aparecen en el modelo estructural, tambin las
series de tiempo de los residuos del modelo estructural pueden
recuperarse a partir de los residuos obtenidos en la estimacin
del modelo VAR, mediante, el hecho que:
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

376

Modelo 2. Supongamos un modelo con dos restricciones con un


modelo VAR(1) de la forma:
Implicara que la variable y1t no afecta ni de forma
contempornea, ni rezagada a la variable y2t, por lo que sta
puede considerarse exgena respecto de y1t. Examinando los
modelos anteriores, se puede observar que las dos restricciones
impuestas, 21=22=0 implica que en el modelo VAR, 21=0,
restriccin que puede contrastarse utilizando el estadstico tstudent sobre dicho coeficiente. Al incluirse una restriccin ms,
el modelo estructural est ahora sobreidentificado, es decir, hay
ms de una manera de recuperar valores numricos para los
parmetros de dicho modelo, a partir de las estimaciones
numricas del modelo VAR.
Modelo 3. Ahora se analizara el caso con en modelo 3, Ms
dificultades plantean el modelo,

Este modelo tambin se encuentra sobreidentificado, con varias


maneras de recuperar las estimaciones de los parmetros del
modelo estructural. Sin embargo, en este caso no hay ninguna
restriccin sencilla contrastable que permita evaluar esta
representacin ya que las que pertenecen al modelo estructural
introducen tipos no lineales para verificar los parmetros del
modelo VAR en forma reducida. Una posible estrategia consiste
en estimar el modelo VAR sujeto a restricciones no lineales
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

377

generadas por las condiciones de sobreidentificacin. Al obtener


innovaciones estructurales a partir de las del modelo VAR en
forma reducida equivale a la posibilidad de disponer de valores
numricos para los elementos de la matriz B, puesto que t=But.
Esta matriz tiene unos en la diagonal principal, pero no es
simtrica, por lo que tiene k(k1) parmetros por determinar.
Adems, se debe contar con las k varianzas de las innovaciones
estructurales que sus covarianzas son nulas. As, tenemos k2
parmetros del modelo estructural, que se necesitan recuperar a
partir de los (k2+k)/2 elementos de Var(ut). es necesario por
tanto, (k2k)/2 restricciones adicionales, si se desea tener
alguna posibilidad de identificar el modelo. En el caso de un
modelo VAR(1) con 2 variables, se debe imponer (222)/2=1
restriccin para identificar el sistema exactamente. En un
modelo con 3 variables se necesita imponer (323)/2=3
restricciones. El nmero de restricciones necesarias para
identificar el modelo es independiente del orden del modelo
VAR. Si se imponen condiciones de recursividad en un modelo
con 3 variables, tenemos,
Que implica imponer 3 restricciones sobre los elementos de la
matriz B1, por lo que el modelo estara, en principio,
exactamente identificado. La recursividad del sistema equivale a
suponer que la matriz B es triangular inferior o superior, lo que
genera exactamente k2k restricciones, precisamente el nmero
que se precisa para lograr la identificacin exacta del modelo.
Hay conjuntos alternativos de restricciones, como,

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

378

Que tambin lograra la identificacin exacta del modelo. La


representacin inversa es,

Otro tipo de restricciones consistira en imponer un


determinado valor numrico para una respuesta. Por ejemplo,
podemos pensar que la innovacin 2t tiene un efecto unitario
sobre y1t, es decir, como
Esto equivale a suponer que 11= 1. Una posibilidad diferente
consistira en identificar el modelo estructural imponiendo
restricciones sobre la matriz de covarianzas, ya sea imputando
un valor numrico para la varianza de 1t, la varianza de 2t, o la
covarianza entre ambos. Este tipo de restricciones conduce a
soluciones mltiples, por lo que el modelo estructural est en tal
caso, sobreidentificado. Por ltimo, puede conseguirse la
identificacin imponiendo restricciones razonables entre los
valores numricos de los parmetros estructurales. Por ejemplo,
puede imponerse una condicin de simetra, 11=21, o cualquier
otra que resulte adecuada en la aplicacin que se analiza. En el
caso del modelo de 2 variables est condicin de simetra de
efectos conduce asimismo a una condicin de igualdad de
varianzas para las innovaciones estructurales, lo que no ocurre
en modelos con ms de 2 variables.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

379

IDENTIFICACIN Y RESPUESTAS DEL SISTEMA


Otra manera de entender los problemas de identificacin es la
siguiente suponga que, sin considerar el posible modelo
estructural, hemos estimado un modelo VAR(1) , en el que es
necesario calcular cmo reacciona cada variable ante una
innovacin en una de ellas, lo que luego denominaremos como
funciones impulso respuesta. Sera poco adecuado, sin embargo,
calcular las respuestas a un impulso en una de las innovaciones,
u1, por ejemplo, sin que u2 experimente ningn impulso, pues
ambas innovaciones estn correlacionadas entre s. Por tanto,
hemos de transformar primero el modelo estimado en otro
modelo en que los trminos de error, siendo innovaciones, estn
no correlacionados entre s. Para ello, podramos seguir una
estrategia similar a la discutida ms arriba, proyectando por
mnimos cuadrados una de las dos innovaciones, u1t, por
ejemplo, sobre u2t,
Cuyo residuo at, definido por at=u1ttu2t, estara no
correlacionado, por construccin, con u2t. Premultiplicando el
modelo (2.1) por la matriz
Tendramos,

Un modelo en el que la variable y2 tiene efectos contemporneos


sobre y1. En este modelo, tiene sentido preguntarse por las
respuestas de ambas variables a una perturbacin en at o en u2t,
puesto que ambos estn no correlacionados, por construccin.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

380

En respuesta a un impulso en u2t, ambas variables reaccionarn


en el mismo instante, y tambin en perodos siguientes, hasta
que dichas respuestas decaigan a cero. En cambio, en respuesta a
una perturbacin en at, y1 responder en el mismo perodo y
perodos siguientes, mientras que y2 slo responder en
perodos siguientes al de la perturbacin. Este es el modelo
estructural exactamente identificado (4.1) que antes
consideramos. Una extensin a este procedimiento se basa en el
hecho conocido de que dada una matriz simtrica, definida
positiva, como es la matriz de covarianzas , existe una nica
matriz triangular inferior A, con unos en su diagonal principal, y
una nica matriz diagonal D, con elementos positivos a lo largo
de su diagonal principal, tal que admite una descomposicin,
Si consideramos la transformacin lineal del vector de error
precisamente con esta matriz, t=A-1ut, tenemos,

Por lo que, a diferencia de los componentes del vector u, los


elementos del vector estn no correlacionados entre s.
Deshaciendo la transformacin, tenemos,

Por lo que,

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

381

Si los coeficientes a1k, a2k, ..., ak1,k se obtienen mediante una


estimacin de mnimos cuadrados ordinarios de la ecuacin
(4.2), que tiene a ukt como variable dependiente, y a 1t, 2t, ...,
k1,t como variables explicativas,
Entonces
tendremos,
por
construccin,
E(kt.1t)=E(kt.2t)=...=E(kt.k1,t)=0. Dicho de otra manera, si
estimamos regresiones de cada innovacin uit sobre todas las
que le preceden dentro del vector u y nos quedamos con el
residuo de dicha regresin, llammosle it, tendremos un
componente de uit que, por construccin, estar no
correlacionado con u1t,u2t,...,ui1,t. Ntese que los espacios
generados por las variables u1t, u2t, ..., ui1,t y por las variables 1t,
2t, ..., i1,t son los mismos, es decir, que ambos conjuntos de
variables contienen la misma informacin. La nica diferencia
entre ambos es que las variables u1t, u2t,...,ui1,t tiene
correlaciones no nulas, mientras que las variables 1t, 2t,...,i1,t
estn no correlacionadas entre s.
CONDICIONES DE ESTABILIDAD
Si resolvemos recursivamente el modelo VAR(1) tenemos,

Como puede verse, para la estabilidad del sistema es preciso que


las sucesivas potencias de la matriz A1 decaigan hacia cero, pues
de lo contrario, el futuro lejano tendra efectos sobre el presente,
en contra de la convergencia temporal de efectos inherente a
todo proceso estacionario. Esto requiere que las races del

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

382

polinomio caracterstico de dicha matriz | IkA1 |=0, decrezcan


fuera del crculo unitario, condicin anloga a la que se tiene
para un proceso autoregresivo univariante. Cuando se cumplen
las condiciones de estabilidad, tomando lmites, tenemos,
Donde =E(Y) es el vector de valores esperados, que viene dado
por,
Adems,
En el caso bivariante, 1=E(u1t), 2=E(u2t), con
Siendo =(111)(122) 1221, y

VAR Y MODELOS UNIVARIANTES


Si se parte de un VAR(1), como (2.1), escrito en funcin del
operador de rezagos de la forma:

Se tiene que
Reemplazandolo en la ecuacin anterior se tiene que:

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

383

Finalmente,
Que es un proceso ARMA(2,1).
ESTIMACIN DE UN MODELO VAR
En ausencia de restricciones, la estimacin por mnimos
cuadrados, ecuacin por ecuacin, de un modelo VAR produce
estimadores eficientes a pesar de que ignora la informacin
contenida en la matriz de covarianzas de las innovaciones. Junto
con el hecho de que colinealidad entre las variables explicativas
no permite ser estricto en la interpretacin de los estadsticos t,
sugiere que es preferible mantener todas las variables
explicativas iniciales en el modelo.
El estimador es consistente siempre que los trminos de error
sean innovaciones, es decir, procesos ruido blanco, pues en tal
caso, estarn no correlacionados con las variables explicativas.
Por tanto, la ausencia de autocorrelacin en los trminos de
error de todas las ecuaciones es muy importante. Tomando
ambos hechos conjuntamente, es fcil concluir que debe
incluirse en cada ecuacin como variable explicativa, el menor
nmero de rezagos que permita eliminar la autocorrelacin
residual en todas las ecuaciones. Existen contrastes del tipo de
razn de verosimilitud sobre el nmero de rezagos a incluir en el
modelo.
Un modelo VAR no se estima para hacer inferencia acerca de
coeficientes de variables individuales. Precisamente la baja
precisin en su estimacin no aconseja cualquier anlisis de

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

384

coeficientes individuales. Tiene mucho sentido, por el contrario,


el anlisis conjunto de los coeficientes asociados a un bloque de
rezagos en una determinada ecuacin. Bajo hiptesis de
normalidad del vector de innovaciones, el logaritmo de la
funcin de verosimilitud es,
Siendo la matriz de covarianzas estimada del vector de
innovaciones u,
Una matriz simtrica, definida positiva, por construccin.
CONTRASTACIN DE HIPTESIS Y CONTRASTES DE
ESPECIFICACIN
Uno de los contrates ms habituales en un modelo VAR es el
relativo al nmero de rezagos que deben incluirse como
variables explicativas. Es importante dentro de este anlisis
tener en cuenta que en cada ecuacin entra un bloque de rezagos
de todas las variables del vector y. Si, por ejemplo, trabajamos
con 4 variables y establecemos un orden 3 para el VAR,
tendremos 12 variables explicativas, ms el trmino constante,
en cada ecuacin, con un total de 52 coeficientes en el sistema de
ecuaciones, ms parmetros en la matriz de varianzascovarianzas de las innovaciones. El nmero de parmetros a
estimar crece rpidamente con el nmero de rezagos. Si pasamos
de 3 a 4 rezagos, tendramos 68 coeficientes ms los 10
parmetros de la matriz de covarianzas. Por eso ya comentamos
con anterioridad que debe incluirse en cada ecuacin el menor
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

385

nmero de rezagos que permita eliminar la autocorrelacin del


trmino de error de todas ellas. Existe un contraste formal de
significancia de un conjunto de rezagos, que utiliza un estadstico
de razn de verosimilitudes,
Donde |R|,|SR| denotan los determinantes de las matrices de
covarianzas de los modelos restringido y sin restringir,
respectivamente. Si queremos contrastar si un cuarto retardo es
significativo, deberamos estimar el modelo con 3 y con 4
rezagos, y construir el estadstico anterior, que tiene una
distribucin chi-cuadrado con un nmero de grados de libertad
igual al nmero de restricciones que se contrastan. Al pasar del
modelo con 3 rezagos al modelo con 4 rezagos, hay que aadir
un rezago ms de cada variable en cada ecuacin, por lo que el
nmero de restricciones es igual al incremento en el nmero de
rezagos, por el nmero de variables al cuadrado.
Sin embargo, no puede olvidarse que la eleccin del nmero de
rezagos debe tener en cuenta la eliminacin de autocorrelacin
residual. Los estadsticos anteriores no examinan este
importante aspecto y, por tanto, no deben utilizarse por s slos.
En consecuencia, una buena estrategia es comenzar de un
nmero reducido de rezagos, y examinar las funciones de
autocorrelacin de los residuos, junto con estadsticos del tipo
Ljung-Box o Box-Pierce para contrastar la posible existencia de
autocorrelacin, lo que requerira aumentar el nmero de
rezagos y con ello, el nmero de parmetros a estimar.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

386

Lamentablemente, sin embargo, es muy poco probable que


pueda eliminarse la autocorrelacin residual con menos de 4
rezagos cuando se trabaja con datos trimestrales, o con menos
de 12 rezagos, cuando se trabaja con datos mensuales. Una
estrategia distinta para encontrar el orden del modelo VAR
consiste en examinar los denominados criterios de Informacin,
que son determinadas correcciones sobre el valor muestral de la
funcin logaritmo de Verosimilitud. Los ms conocidos son los
de Akaike y Schwartz,

Siendo n= k(d+pk) el nmero de parmetros estimados en el


modelo VAR. El parametro d es el nmero de variables exgenas,
p el orden del VAR, y k el nmero de variables. En ocasiones, se
ignora el trmino constante, y los criterios anteriores se
aproximan por,
Siendo N el nmero de parmetros que se estima, y la matriz
de covarianzas de los residuos. Estos estadsticos se calculan
para una sucesin de modelos con distinto nmero de rezagos y
se comparan, seleccionando aqul modelo que produce un
menor valor del estadstico. Un estadstico de razn de
verosimilitudes como el antes descrito puede utilizarse para
contrastar cualquier tipo de hiptesis, y no slo la significancia
de grupos de variables, siempre que el modelo restringido est
anidado dentro del modelo sin restringir.
CONTRASTES DE CAUSALIDAD

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

387

Un contraste especialmente interesante se conoce como de


causalidad en el sentido de Granger. Supongamos que estamos
explicando el comportamiento de una variable y utilizando su
propio pasado. Se dice que una variable z no causa a la variable y
si al aadir el pasado de z a la ecuacin anterior no aade
capacidad explicativa. El contraste consiste en analizar la
significancia estadstica del bloque de rezagos de z en la ecuacin
mencionada, y la hiptesis nula es que la variable z no causa, en
el sentido de Granger, a la variable y.
La propuesta inicial de Granger haca referencia a que la
prediccin de y basada en el pasado de las dos variables y y z, sea
estrictamente mejor (es decir, con menos error) que la
prediccin de y basada exclusivamente en su propio pasado. As,
se dira que la variable z no causa a la variable y si se tiene,
Sin embargo, esta propiedad no suele analizarse; se contrasta
exclusivamente la significancia del bloque de rezagos de z en la
ecuacin de y, si dicho bloque de variables es significativo,
contribuir a mejorar la prediccin de la variable y. Esta manera
de proceder se basa en que, analticamente, es evidente que la
presencia del bloque de rezagos de z en la ecuacin de y hace
que el valor esperado condicionado de y en el pasado de las dos
variables, y y z, sea distinta del valor esperado condicionado de y
en su propio pasado exclusivamente. Si bien esta propiedad
terica no siempre se manifiesta en resultados prcticos, y es
bien sabido que un buen ajuste no necesariamente conduce a
una buena prediccin.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

388

El contraste puede llevarse a cabo utilizando el estadstico F


habitual en el contraste de significancia de un bloque de
variables, o mediante el estadstico de razn de verosimilitudes.
Con ms de dos variables, existen posibles contrastes de
causalidad y en algunos casos, el estadstico de razn de
verosimilitudes puede resultar ms til que el estadstico F, al
permitir contrastar la exclusin de algn bloque de rezagos en
varias ecuaciones simultneamente. Asimismo, el contraste de
causalidad o, lo que es lo mismo, el contraste de significancia de
un bloque de rezagos puede llevarse a cabo mediante un
estadstico de razn de verosimilitudes, en el que el modelo
restringido excluye un grupo de rezagos de una ecuacin.
REPRESENTACIN MA DE UN MODELO VAR
Todo modelo VAR admite una representacin de medias mviles
(VMA),
La recursividad de Yts en (2.2). La representacin VMA puede
obtenerse asimismo en funcin de las innovaciones
estructurales. Esta representacin permite resumir las
propiedades de las relaciones cruzadas entre las variables que
componen el vector yt, que queda representado como una
combinacin lineal de valores actuales y pasados del vector de
innovaciones. La simultaneidad vuelve a quedar palpable en
sentido que cualquier innovacin uit afecta a todas las variables
Yj,t+s. Si volvemos al modelo de dos variables de orden 1,
tenemos,

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

389

Que, como vimos, puede escribirse,


y, en trminos de las innovaciones del modelo estructural,

Donde,
Existe un procedimiento recursivo para obtener las matrices de
coeficientes de la representacin de medias mviles,que utiliza
la relacin,
De modo que tenemos,
Que conduce a,

Que pueden utilizarse para calcular recursivamente las matrices


de coeficientes de la representacin de medias mviles.
FUNCIONES DE IMPULSO RESPUESTA
La ecuacin (9.1) es la representacin de medias mviles del
modelo VAR(1) bivariante. Los coeficientes de la sucesin de
matrices (s) representan el impacto que, a lo largo del tiempo,

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

390

tienen sobre las dos variables del modelo y1t e y2t una
perturbacin en las innovaciones 1t, 2t. Por ejemplo, los
coeficientes 12(s) reflejan el impacto que en los distintos
perodos s, s1, tiene sobre y1 una perturbacin del tipo impulso
en 2. Es decir, consideramos que 2 est en su valor de
equilibrio, cero, excepto en un perodo, en que toma un valor
igual a 1; como reaccionan, y dicha respuesta se extiende a
varios perodos, hasta que las sucesin 12(s) se hace cero. La
sucesin de valores numricos {12(s)} se conoce como la
respuesta de y1 a un impulso en 2. El efecto, multiplicador o
respuesta a largo plazo es la suma
=0 12 (). Esta suma existe
si las variables son estacionarias, pues en tal caso ha de
cumplirse |
=0 12 ()|<. El problema al que nos enfrentamos
al tratar de calcular las funciones de impulso respuesta es que, si
bien contamos con estimaciones numricas de los parmetros ij
con i,j=1,2, desconocemos los parmetros 11 y 21 que aparecen
en (9.2). En el modelo recursivo que antes vimos, se tiene 21=0.
Adems, se prueba en el ejercicio 1 que en este modelo el
parmetro 11 puede recuperarse mediante 1=u1u2/2u2. En
ese caso, u2t=2t y u1t = 1t+112t=1t+11u2t.
Las funciones de impulso respuesta slo puden obtenerse bajo
restricciones de este tipo. La que hemos descrito es la ms
habitual, y equivale a admitir que una de las dos variables afecta
a la otra slo con rezago, si bien permitimos que en la otra
direccin
haya
respuesta
contempornea.
Estaremos
caracterizando las respuestas del sistema a un impulso en cada
una de las innovaciones del modelo estructural o, lo que es lo
mismo, en la innovacin u2t y en u1t11u2t. Esta ltima es la
componente de u1t que no est explicada por u2t o, si se prefiere,
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

391

la componente de u1t que no est correlacionada con u2t. En


efecto, consecuencia, tanto y1 como y2
Que est incorrelacionado con 2t. De hecho, si 21=0, entonces
u1t11u2t es, precisamente, igual a la perturbacin estructural
1t. Como hemos visto, las funciones de impulso respuesta slo
pueden obtenerse despus de haber incluido restricciones
acerca del rezago con que unas variables inciden sobre otras.
Esta eleccin condiciona bastante, en general, el aspecto de las
funciones de respuesta, excepto si las innovaciones del modelo
VAR, u1t y u2t estn no correlacionadas, en cuyo caso, coinciden
con las innovaciones del modelo estructural.
Las funciones impulso respuesta calcula el impacto que, en cada
instante futuro tendra, sobre cada variable del modelo, un
impulso en una determinada innovacin, y ello puede repetirse
para las innovaciones en cada una de las ecuaciones. Por eso,
suele representarse en varios grficos, cada uno de los cuales
incluye las respuestas a travs del tiempo, de una determinada
variable a un impulso en cada una de las innovaciones. De este
modo, se tiene tantos grficos como variables en el modelo, cada
uno de ellos conteniendo tantas curvas como variables.
Alternativamente, pueden construirse grficos, cada uno de los
cuales representa la respuesta temporal de todas las variables
del modelo a un impulso en una de las innovaciones.
Nuevamente hay tantos grficos como variables, cada uno de
ellos conteniendo tantas curvas como variables. El inconveniente
del segundo tipo de representacin es que las respuestas de las
distintas variables dependen de sus respectivas volatilidades,

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

392

por lo que la comparacin de las respuestas de dos variables


diferentes a un determinado impulso no permite decir cul de
las variables responde ms.
Recordando que la desviacin tpica es una medida adecuada del
tamao de toda variable aleatoria de esperanza nula, debemos
dividir las respuestas de cada variable por su desviacin tpica
antes de representarlas en un mismo grfico. Tampoco un
impulso de tamao unidad tiene el mismo significado en cada
variable, por lo que conviene calcular las respuestas
normalizadas a un impulso de tamao igual a una desviacin
tpica en cada innovacin. Consideremos un VAR(1) sin
constante (es decir, las variables tiene esperanza igual a cero),

Supongamos que antes del instante t0 las innovaciones toman un


valor cero en todos los perodos, las variables estn en sus
niveles de equilibrio, y=y=0. En dicho instante, la innovacin
u1t0 toma un valor unitario, u1t0=1, y vuelve a ser cero en los
perodos siguientes. Cul es la respuesta del sistema? En el
instante t0,

Por lo que y2t0 e y3t0 estarn en sus niveles de equilibrio,


y2=y2=0,
y3=y3=0,
mientras
que
y1t0=y1+1=
1.
Posteriormente,

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

393

Que van proporcionando la primera columna de las matrices que


obtenemos calculando las sucesivas potencias de la matriz de
coeficientes A1. De este modo, tendramos las respuestas del
sistema a sorpresas en las innovaciones del modelo VAR. Si
queremos calcular las respuestas a innovaciones estructurales,
debemos utilizar la representacin,
y examinar la sucesin definida en (9.2).
DESCOMPOSICIN DE LA VARIANZA
Si utilizamos la representacin MA para obtener predicciones de
las variables y1, y2, tenemos,
Por lo que el error de prediccin es,

Cuya varianza es,


Que, inevitablemente, aumentan con el horizonte de prediccin.
La expresin anterior nos permite descomponer la varianza del

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

394

error de prediccin en dos fuentes, segn tenga a 1 o a 2 como


causa. Con ello, estamos examinando el inevitable error de
prediccin en cada variable a un determinado horizonte, y
atribuyndolo a la incertidumbre acerca de la evolucin futura
en cada una de las variables. Es, por tanto, una manera de hacer
inferencia acerca de las relaciones intertemporales entre la
variables que componen el vector y. Para ello, se expresan los
componentes de cada varianza en trminos porcentuales,
Si una variable es prcticamente exgena respecto a las dems,
entonces explicar casi el 100% de la varianza de su error de
prediccin a todos los horizontes posibles. Esto es lo ms
habitual a horizontes cortos, mientras que a horizontes largos,
otras variables pueden ir explicando un cierto porcentaje de la
varianza del error de prediccin. La descomposicin de la
varianza est sujeta al mismo problema de identificacin que
vimos antes para las funciones de impulso respuesta, siendo
necesario introducir alguna restriccin como las consideradas en
la seccin anterior.
Si la correlacin entre las innovaciones del VAR es muy pequea,
el ordenamiento que se haga de las variables del vector y o, lo
que es lo mismo, las restricciones de exclusin de valores
contemporneos que se introduzcan sern irrelevantes. Sin
embargo, tales restricciones condicionan de manera significativa
la descomposicin de la varianza resultante. De hecho, con las
restricciones de la seccin anterior, 2 explica el 100% de la
varianza del error de prediccin un perodo hacia adelante en la
variable y2. Si, en vez de dicha restriccin, excluyramos y2t de la
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

395

primera ecuacin, entonces 1 explicara el 100% de la varianza


del error de prediccin un perodo hacia adelante en la variable
y1.
IDENTIFICACIN RECURSIVA: LA DESCOMPOSICIN DE
CHOLESKY
Para eliminar la correlacin contempornea existente entre las
innovaciones ut de distintas ecuaciones, podemos transformar el
vector ut en un vector et mediante la descomposicin de
Cholesky de la matriz de covarianzas , =Var(ut). Esta
descomposicin nos proporciona una matriz triangular inferior
G tal que GGt=. Como consecuencia, G1G1t = I, y el sistema
VAR puede escribirse,
Entonces
El efecto de eit sobre Yj,t+s viene medido por el elemento (j,i) de la
matriz s. La sucesin de dichos elementos, para 1s
proporciona la respuesta dinmica de la variable Yj a una
innovacin en la variable Yi. Esto se conoce como funcin de
respuesta de Yj a un impulso no esperado en Yi. Como eit es el
error de pronostico un perodo hacia adelante en Yit, la
representacin VMA ortogonalizada, por la descomposicin de
cholesky, nos permite calcular el error de proostico de Yit, mperodos hacia adelante, en el instante tm+1, a travs del
elemento i-simo en le vector Pm1 s=0 Aesets. Su varianza, el

elemento i-simo en la diagonal de
, puede escribirse,
=1 1
(, ) (, ), siendo (, ) el elemento (i,j) de la
=0
|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |

NOTAS DE CLASE: ELEMENTOS DE ECONOMETRA Y ESTADSTICA FINANCIERA

396

matriz element . Al aumentar m, a partir de m=1, esta


descomposicin de la varianza del error de prediccin de Yit+m
entre las k variables del vector Yt se conoce como
descomposicin de la varianza de Yit. Proporciona una
estimacin de la relevancia de cada variable del sistema para
explicar los errores de prediccin de las fluctuaciones futuras en
Yit.
BIBLIOGRAFA
1 Wooldridge, Jeffrey M. (2003).Econometric Analysis of
Cross Section and Panel Data. MIT Press.
2 Kalman, R.E., A New Approach to Linear Filtering and
Prediction Problems, Trans. ASME,J. Basic Engineering,
vol 82, March 1960, pp 94-35.
3 Hamilton, J.D. (1994) Time Series Analysis, Princeton
University Press.
4 Amemiya T.(1985), Advanced Econometrics. Harvard
University Press.
5 Greene W. (1997), Econometric Analysis. Prentice Hall,
tercera edicin.
6 White,
H.
(1984),
Asymptotic
Theory
for
Econometricians. Academic Press
7 Kydland, Finn y Prescott, Edward. (1990). "Business
Cycles: Real Facts and a Monetary Myth". En: Quarterly
Review. Federal Reserve Bank of Minneapolis.
Primavera. P.3-18.

|Facultad de Economa |Carlos Mendoza Astroz|

| PERIODO 2015-I |