Académique Documents
Professionnel Documents
Culture Documents
ELEMENTOS DE
ECONOMETRÍA Y
ESTADÍSTICA
FINANCIERA
Carlos Mendoza Astroz
Tabla de contenido
PARTE I. CONCEPTOS BÁSICOS ........................................................................................................................................................ 3
1. TEORÍA ASINTÓTICA ................................................................................................................................................................. 4
3. VALORES Y VECTORES PROPIOS ........................................................................................................................................14
4. DISTRIBUCION NORMAL MULTIVARIANTE ..................................................................................................................20
PARTE II MODELOS MULTIVARIANTES......................................................................................................................................30
1. ANÁLISIS DE COMPONENTES PRINCIPALES (ACP) .....................................................................................................31
1.1. INTRODUCCIÓN ................................................................................................................................................................31
1.2 INTERPRETACIÓN GEOMETRICA ....................................................................................................................................32
1.3. RESULTADOS MATEMATICOS Y GRAFICOS DEL ACP.......................................................................................35
1.4. CÁLCULO DE LOS COMPONENTES PRINCIPALES ..............................................................................................38
1.5. PROCESO DE EXTRACCIÓN ..........................................................................................................................................41
1.6. TEOREMAS ..........................................................................................................................................................................45
1.7. COMPONENTES PRINCIPALES NORMADO O POR CORRELACIONES ........................................................52
1.8. COMPONENTES PRINCIPALES PARA MATRICES DE COVARIANZAS CON ESTRUCTURAS
ESPECIALES ......................................................................................................................................................................................61
1.9. COMPONENTES PRINCIPALES A PARTIR DE UNA MUESTRA ......................................................................65
1.10 IDENTIFICACIÓN DE LOS COMPONENTES PRINCIPALES ..................................................................................73
1.11. PRUEBAS ESTADÍSTICAS .........................................................................................................................................75
1.12. CONCLUSIONES ............................................................................................................................................................78
PARTE III. MODELOS DE DATOS PANEL LINEALES ...............................................................................................................79
INTRODUCCIÓN ..........................................................................................................................................................................80
ESPECIFICACIÓN GENERAL DE UN MODELO DE DATOS DE PANEL .....................................................................88
OVERVIEW DE MODELOS DE PANELES DE DATOS ......................................................................................................91
REGRESIÓNES AGRUPADAS, EFECTOS FIJOS Y ALEATORIOS ..................................................................................97
VARIACION BETWEEN-WITHIN...........................................................................................................................................99
CARACTERISTICAS ADICIONALES DE DATOS PANEL .............................................................................................. 103
SUPUESTOS DE TRABAJO EN METODOLOGIAS DE DATOS PANEL ..................................................................... 107
METODOLOGIAS DE ESTIMACION DE MODELOS DE DATOS PANEL ................................................................. 117
COMPARATIVO DE MODELOS DE ESTIMACIÓN PANEL .......................................................................................... 169
INFERENCIA ESTADÍSTICA CON METODOLOGÍAS ROBUSTAS............................................................................. 174
ESTRUCTURA DE PRUEBAS DE HIPOTESIS .................................................................................................................. 186
PRUEBA DE HAUSMAN: ¿EFECTOS FIJOS O EFECTOS ALEATORIOS? ................................................................ 203
DIAGNÓSTICO, ESTIMACIÓN Y ESPECIFICACIÓN DE MODELOS PANEL EN STATA..................................... 208
EJEMPLO. ECUACIÓN DE SALARIOS PARA LOS HOMBRES..................................................................................... 215
PRUEBAS SOBRE SUPUESTOS DEL MODELO PANEL ................................................................................................ 220
¿CÓMO SOLUCIONAR LOS PROBLEMAS DE HETEROGENEIDAD, CORRELACIÓN CONTEMPORÁNEA,
HETEROSCEDASTICIDAD Y AUTOCORRELACIÓN?.................................................................................................... 226
VENTAJAS Y DESVENAJAS DEL MODELO DE DATOS PANELES ............................................................................ 229
PARTE IV. ANALISIS DE SERIES DE TIEMPO UNIVARIADAS ........................................................................................... 235
INTRODUCCIÓN ....................................................................................................................................................................... 236
COMPOSICIÓN DE PATRONES SISTEMÁTICOS Y ESTOCÁSTICOS ....................................................................... 237
SERIE DE TIEMPO Y PROCESOS ESTOCÁSTICOS ........................................................................................................ 240
ESTRUCTURA DE MODELOS ARMA ................................................................................................................................. 246
OPERADOR Y POLINOMIO DE REZAGOS........................................................................................................................ 250
CONDICIONES DE ESTACIONAREIDAD EN SERIES DE TIEMPO ........................................................................... 251
FUNCIÓN DE AUTOCORRELACION SIMPLE (FAS) Y FUNCIÓN DE AUTOCORRELACION PARCIAL (FAP)
........................................................................................................................................................................................................ 259
1. TEORÍA ASINTÓTICA
El análisis asintótico esta interesado en varias clases de
convergencia de sucesiones de estimadores a medida que los
tamaños de muestra crecen.
Convergencia en Probabilidad
Definición 3. La variable aleatoria xn converge en probabilidad a
una constante c si
lim n para cualquier
limn n = y limn =0 2
n
Estimador Consistente
Se dice que un estimador de un parámetro θ es consistente si y
sólo
plim =θ
i
i 1
___ 1 n
1
E x E xi (n )
n i 1 n
2
___ 1 n
1
Var x 2 Var xi 2 (n 2 )
n i 1 n n
yn d
n 1 i 1
i i
n i 1
Entonces,
Convergencia en Distribución
xn converge en distribución a una variable aleatoria x con
función distribución acumulada (f.d.a) F(x) si:
limn ( F(xn) F(x) )=0
En todos aquellos puntos de continuidad de F(x). Esto se
simboliza como:
d
xn x
1. Si xn y n c x
d
2. Si xn y n cx
Donde,
1 __ d
n x N (0,1)
s
La convergencia en probabilidad implica convergencia en
distribución, pero no viceversa. Es decir, el concepto de
convergencia en probabilidad es más fuerte. En primer término,
si plim( ), entonces . Ello, porque:
n
n
d
lim n f ( n ) 1 si n
0 e.o. p..
Gráficamente,
1 1
( X T X )1 X T Y ( X T X )1 ( X T )
n n
( X T X )1 X T Y ( X T X )1 X T ( X )
1 1
( X T X )1 X T Y ( X T X )1 ( X T )
n n
Entonces,
plim = β +limn limn
1 T 1 1 T
(X X ) (X )
n n
Por las propiedades de probabilidad límite descritas en
secciones anteriores se tiene que:
n n __
1 T
( X ) xi i wi w
n i 1 i 1
II. Definiciones.
Sea una matriz simétrica Σ con de orden PxP con las siguientes
características:
12 12 1p
21 22 2p
p1 p 2 pp
Definición 1. La traza de Σ denotada por tr(Σ) se define como:
P
11 11 pp ii
i 1
b. Vectores propios
Es necesario calcular el vector propio asociado para la matriz Σ,
que para este caso corresponde al valor propio más grande
(λ1=7) por lo tanto se construye el siguiente sistema de
ecuaciones:
Σe=λe
6 2 e e
0 1 0 1=70e 1
2 3 e
Construyendo un sistema de ecuaciones se llega a que:
6e1+2e2=7e1
2e1+3e2=7e2
Resolviendo y dejándolo en términos de vectores se tiene que:
2e 7e 6e 2e e
[ ]=[ ][ ]=02e 1
3e 7e 2e 4e
Existen infinitas soluciones. De manera que cualquier vector
propio de tamaño 2X1 que tenga su primer elemento igual al
doble del segundo será el vector propio de Σ asociado con el
primer valor propio λ1.
√x x =√,2 1- 021=√5
1
El vector propio normalizado de Σ correspondiente al primer
valor propio 𝛌1=7, corresponde a:
2/√5 0.8944
e1= [ ]=0 1
1/√5 0.4472
Programación en STATA
matrix input A = (6,2\2,3)
matrix symeigen Vectores Valores = A
matrix list Valores
matrix list Vectores
Propiedades
1. La distribución marginal de X es N(µ1,ς1)
2. La distribución marginal de Y es N(µ2,ς2)
3. La distribución de Y condicionada por X = x0 se puede
representar como:
i 1
normal multivariada
n
f ( Z1 ,.....Z n ) f ( z ) (2 ) 1 / 2 | |-1e 2zi
2
i 1
n 2
f ( Z1 ,.....Z n ) f ( z ) 2 n / 2
| | e zi
-n 1
2
i 1
f (Z1 ,.....Z n ) f ( z ) 2 n / 2 | |- n e 12 Z T Z
Donde ZT=(Z1,...,Zt) es un vector transpuesto de v.a.i.i.d.
normales. Ahora suponga la transformación X=AZ+B donde A es
una matriz no singular de tamaño nxn y B es un vector es un
vector nX1 de constantes. Es posible realizar la siguiente
transformación:
g ( z ) 2 n / 2 | A |1 e12 Z T Z pero Z=A-1(X-B)
g ( z ) 2 n / 2 | A |1 e 12 A1 ( X B) A
T 1
( X B)
g ( z ) 2 n / 2 | A |1 e 12 ( X B)T At )( A1 ( X B) )
Puesto que E[Z]=0, entonces E[X]=B y la propiedad de
independencia que implica sobre la matriz de covarianzas
cov[Z]=In, por tanto cov(X)=AAT. Estableciendo que μ=B y Σ=
AAT es posible reescribir g(x) de la forma estándar:
g ( z ) 2 n / 2 | |1 / 2 e 12 ( x )T 1 ( x ) )
La cual se conoce como distribución normal multivariada con
media μ y matriz de covarianza Σ.
Teoremas
Teorema 2. Si Σ es positiva de modo que Σ-1 existe, entonces
Σe=𝛌e implica que Σ-1 e= 1 e
X
q1 1 q 2 2
a a X a qp X p
Son distribuidos Nq(Aμ,AΣAT) . También, X+d donde d es un
vector de constantes es distribuida Nq(A+b,Σ).
X1 1 11 | 12
X
X2 21 | 22
2
Teorema 6. Si X1 y X2 son dos vectores aleatorios independientes
de orden qX1 y qX2 respectivamente, entonces
a. Las covarianzas entre dichos vectores son iguales a cero,
Cov(X1,X2)=0. La matriz de ceros es de orden q1Xq2.
b. Si es | entonces X1 y X2 son independientes si y
X1
1 11 12
N q1q 2 ,
X2 2 21 |
22
solo si Σ12=0.
c. Si X1 y X2 son independientes y distribuidas Nq1(μ1,Σ11) y
Nq2(μ,Σ) respectivamente, entonces [X1 X2] es normal
multivariante distribuido como:
1 11 | 0
N q1q 2 ,
2 0
| 11
Constrastes de multinormalidad
Para contrastar la normalidad univariada,como primer pasose
han desarrollado estrategias graficas que alertan sobre la
normalidad de un conjunto de datos. Al estrategia mas usada
consiste en graficar cuantilas de datos frente a cuantilas de
distribución univariada, estos graficos se conocen como QxQ
plot. Las cuantilas son similares a los percentiles, un grafico QxQ
plot se obtiene:
1. Se ordenan las observaciones de mayor a menor. Así la
cuartila muestral xi es la cuartila i/n.
2. Se ubican los pares y se examina la linealidad resultante.
-1
-2
-3
-4
-4 -3 -2 -1 0 1 2 3 4
Valor observado
1 Se puede probar que es una matriz definida positiva, es decir, la forma cuadrática asociada a ella tiene todas sus raíces positivas.
O de forma matricial:
yj = aTx (2)
1.6. TEOREMAS
Los resultados anteriores se pueden expresar de una manera
sintética y con el formalismo necesario en los siguientes
teoremas.
1 2 0
Σ=[ 2 5 0]
0 0 2
O mejor
Var(y1)=Var(-0.383X1+0.924X2)
Var(y1)=(0.383)2Var(X1)+(0.924)2Var(X2)-2(0.383)(0.924)
. .
VEC1= = = =0.7286
.
∑ Var(Y ) = ∑ Var(Z ) = p
CORRELACIONES COVARIANZAS
a. Matriz de covarianzas
Los valores y vectores propios de la matriz de covarianzas, Σ, se
tienen que:
λ1=100.16 =[0.04, 0.99]
λ2= 0.84 =[0.99,-0.04]
b. Matriz de correlaciones
Los valores y vectores propios de la matriz de correlaciones, ρ, se
tiene que:
λ1=1+ρ=1.4 =[0.707, 0.707]
λ2=1-ρ= 0.6 =[0.707,-0.707]
Adicionalmente:
Varianza total muestral =∑ S = λ̂ +λ̂ +…….+λ̂
X1 X2 X3 X4 X5
̅t = 4.47 3.96 71.42 26.91 1.64
Variable Total Grado Edad por Empleado del Valor medio
poblacional profesional empleado gobierno de vivienda
Medida Cientos (porcentaje) (porcentaje) (porcentaje) Cientos
Tabla 2
Valor propio
PRUEBA KMO
Definicion. Coeficiente de correlacion parcial. Permite conocer el
valor de la correlación entre dos variables A y B, si la variable C
permance constante para la serie de observaciones
consideradas.
1.12. CONCLUSIONES
Los resultados encontrados por el método de análisis de
componentes principales pueden resumirse en las siguientes
conclusiones:
1. La varianza total es igual a la suma de los valores propios de
Σ. Es decir, la varianza total es la misma con las variables
originales que con las variables transformadas, Fi.
2. Las componentes principales son variables aleatorias no
correlacionadas entre sí obtenidas mediante
transformaciones lineales ortogonales de las variables
originales centradas. Esto es: Fj=ajX=aj1X1+ aj2X2+….+ aj2X2
para j=1,2,….p
3. Si todas las variables originales Xi son normalmente
distribuidas entonces todas las componentes principales
son normales.
INTRODUCCIÓN
En el análisis de información (financiera, económica,
empresarial, comercial, etc.) pueden existir diferentes
dimensiones sobre las cuales se podría estar interesado en la
estimación de modelos que traten de extraer relaciones de
causalidad o comportamiento.
2Si se deseara utilizar variables rezagadas sobre una variable endógena, por ejemplo, considere el siguiente modelo de rezagos distribuidos de
Almon:
Donde xt es una variable exógena y ut es un término de perturbación estocástica. En general, las variables rezagadas x t y xt-1 son cercanas.
Adicionalmente, si se desea observar el cambio de la variable x en el tiempo entonces se tiene que x t-1+∆xt-1= xt-1+(xt-1- xt-2)=2xt-1-xt-2. Esta
estructura expone un alto componente de colinealidad entre variables. En general, no existe suficiente información para efectuar una estimación
precisa sin supuestos a priori.
Método de estimación
Efecto no observado
OVERVIEW DE MODELOS DE PANELES DE DATOS
Distintas caracteristicas en la construcción de modelos de datos
panel se pueden configurar según la disponibilidad de las
observaciones individuales, asi como de sus intervalos de tiempo
y estructura de los errores o innovaciones. Por ejemplo, se
pueden observar los siguientes casos:
Modelo C:
Individuo 2
Variacion Between
Individuo 1
Variación Within
ithinetween
PROMEDIOS:
Total: 1
x̅ = ∑∑x
NT
En el grupo (WITHIN): 1
x̅ = ∑x
T
Entre grupos (BETWEEN): x̅ =(x̅ x̅)
DESVIACIÓN ESTÁNDAR MUESTRAL
En el grupo (WITHIN) o
s =√ ∑ ∑ (x x̅ )
entorno a la media individual:
Entre grupos (BETWEEN) o
∑ (x̅
entorno al promedio de s =√ x̅ )
individuos respecto al total:
Total o entorno a la media total:
1
s =√ ∑ ∑(x x̅)
NT 1
1. Sesgo de heterogeneidad
2. Variables omitidas y efectos no observados
3. Autocorrelación serial por efectos constantes en el
término de error
4. Problema de parametros incidentales
SESGO DE HETEROGENEIDAD
Al incluir efectos between y within dentro del análisis y observar
la significancia de la interacción entre individuos y tiempo entre
variables e individuos surge la pregunta ¿que ocurre si este
efecto se omite?
ANALISIS BETWEEN-WITHIN-OVERALL
OLS/FGLS
Overall
5En la práctica es difícil encontrar buen un instrumento para le calulo del estimador de variables instrumentales ya que debe tener caracterisitcas
a veces incompatibles como que revele información similar a la variable a reemplazar dentro del modelo de regresion y adicionalmente sea
exógena frente a los regresores.
Por ejemplo, si los regresores zit=zi para todo t (es decir, los
valores de la variable no observada, z, permanecen constantes a
traves del tiempo pero cambia a traves de los individuos), es
posible tomar la primera diferencia de las observaciones
individuales sobre el tiempo y se obtiene:
METODOLOGÍAS DE ESTIMACIÓN
1. MODELO AGRUPADO
El modelo más restrictivo es el modelo agrupado (pooled model)
especifica coeficientes constantes, el supuesto usual para
estimaciones de corte trasversal (cross section) es el siguiente:
yit=α+Xitβ+εit
Si este modelo se encuentra correctamente especificado y los
regresores no están correlacionados con el término de error
(exogeneidad fuerte).
Por tanto, no existen efectos individuales no observados,
entonces es consistente y eficientemente estimado por OLS y la
inferencia pueden proceder de forma fiable.
̂=ς
𝚺 ̂ +ς
̂ =
𝚺 …
Ω =[ 𝚺 … ]=In⊗𝚺
… 𝚺
Donde se definen los vectores como wit=[1 xit] y δ=,μ β]t. Los
efectos específicos individuales, αi, se asumen como una
realización de vaiid con una distribución [α,ς ], de la misma
manera, el termino de error εit es una vaiid [0,ς ].
ςeΩ-1/2= P+ Q
Multiplicando para encontrar un modelo transformado:
y*= [ςeΩ-1/2]y=[Q+(ςe/ς1)P]y
Pero Q=I-P, entonces:
8Sin embargo, estos parametros muchas veces resultan utiles en informacion industrial, laboral, ambiental,entre otros por ejemplo véase
McClellan, M. and Staiger, D. Comparing Hospital Quality at For-Profit and Not-for-Profit Hospitals in The Changing Hospital Industry: Comparing
Not-for-Profit and For-Profit Institutions, (eds.). Cutler, David M. pp.93-112, The University of Chicago Press, 2000. Tambien, Murdock, J. 2006.
Handling unobserved site characteristics in random utility models of recreation demand. Journal of Environmental Economics and
Management,51, 1-25.
Para paneles cortos con efectos fijos (FE) resulta en una varianza
donde se incluye efectos en el tiempo para periodos
contemporáneos (t=s) y no contemporáneos (t≠s) de la forma:
DERIVACION MATRICIAL
Se comenzará con un modelo para los i-esimos individuos de la
forma:
Una estimación por OLS del modelo de efectos fijos (FE) ajustado
por la matriz Q resulta en el estimador ̂ con una matriz de
covarianzas, asumiendo independencia de los individuos, igual a:
Entonces:
9 Sea A una matriz cuadrada o rectangular, se dice que una matriz G es una g-inversa (o inversa generalizada) de A cuando AGA=A . Naturalmente
que G ha de ser de tipo n×m en el caso de ser A del tipo m×n . Si A es cuadrada e invertible, entonces es fácil comprobar que la inversa A 1 es (la
única) g-inversa de A , de manera que el concepto de g-inversa es una generalización del concepto de inversa
10 Sin embargo, QtQ-Q=QtQ puesto que QtQ-Q=Q, para una inversa generalizada, y Q=QQt dado que Q es idempotente. Reemplazando QtQ-Q=Q por
Suponga que yit está condicionada sobre los regresores xit y los
parámetros αi, β y 𝛔2 son vaiid con distribución normal
O de forma equivalente:
Para obtener la fórmula del estimador OLS resulta útil dividir las ecuaciones normales XtXβ̂= Xty
Este sistema puede resolverse en dos etapas. Primero obteniendo una expresión para β̂2 de la forma Sustituyendo en la
primera ecuación permite obtener Agrupando términos se puede obtener que
13 Chamberlain (1980) ofrece una discusión detallada de los supuestos y pruebas de exogeneidad para datos panel.
15El teorema del sandwich es utilizado en la determinación del límite de una función. Este teorema enuncia que si dos funciones tienden al mismo
límite en un punto, cualquier otra función que pueda ser acotada entre las dos anteriores tendrá el mismo límite en el punto.
16 En STATA los errores estándar de panel robustos calculados por V ̂[̂OLS] pueden utilizar estimaciones por OLS y ajustarles una metodología de
términos de error con cluster robusto seleccionando individuos como variable de cluster.
17 Es un método de simulación por remuestreo (resampling) que esencialmente es un experimento de simulación de Montecarlo donde la muestra
observada es tratada como la población. En otras palabras, cada iteración, de tamaño N, efectua una muestra con remplazamiento para
posteriormente obtener el cálculo de los estimadores. Este proceso se efectua K veces. Calculando el promedi de los estimadores permite calcular
el sesgo de cualquier estimador. Puede ser utilizado para obtener errores estándar, intervalos de confianza y p-values ara pruebas estadísticas.
18Se debe efectuar un remuestreo por bootstrap únicamente sobre los individuos (i) no sobre los individuos (i) y el tiempo (t).
19Para una introducción técnica pero fácil de entender sobre las propiedades de FGLS y PCSE, ver: Nathaniel Beck, “Time-Series-Cross-Section
Data: What Have We Learned in the Past Few Years?”, Annual Review of Political Science, 4: 271-93 (2001).
20La mayoría de las ocasiones, la correlación de los términos de error en modelos paneles lineales se considera el problema más importante,
debido a que por lo general tiene un mayor impacto en los errores estándar y en la eficiencia de los estimadores del que tiene la
heterocedasticidad.El método de Estimación de Prais-Winsten (PW) estima un modelo de regresión lineal múltiple con errores AR(1) y variables
explicativas estrictamente exógenas, adicionalmente estima la ecuación para el primer periodo de tiempo.
NOTAS COMPUTACIONALES:
1. Es importante observar frecuentemente y con cuidado los
comandos de datos panel en programas econométricos
donde calcula por defecto el término de error asumiéndolos
como una vaiid conduciendo a inferencias erróneas.
2. Errores estándar para paneles robustos pueden ser
calculados utilizando un comando usual para OLS, si la
opción del comando cluster robusto existe. Puesto que la
opción clustering selecciona al identificador de individuos
(i) como variable de cluster.
21 Suponga se tiene observaciones muestrales de características de N individuos sobre T periodos con K variables explicativas denotados por y it,
xkit i=1,…,N, t=1,…..,T, k=1,…,K. Convencionalmente, las observaciones de la variable, y, son asumidas como resultados aleatorios de algún
experimento con una distribución de probabilidad condicionada sobre vectores de características x y un número fijo de parámetros Θ, f(y|x,Θ).
Cuando los datos panel son utilizados, una de sus principales objetivos es utilizar toda la información para efectuar inferencia sobre el vector de
parámetro Θ. Por ejemplo, un modelo puede postular a la variable, y, es una función lineal de x. Sin embargo, para ejecutar una regresión por
mínimos cuadrados con NxT observaciones se necesita asumir que los parámetros de la regresión toman valores iguales a todas las unidades
individuales para todos los periodos. Si este supuesto no es válido, las estimaciones agrupadas (pooled) pueden conducir a una falsa inferencia ya
que sus resultados no son consistentes.
23 Paquetes estadísticos como STATA trabajan con las modificaciones efectuadas sobre esta prueba por Baltagi and Li (1990).
24La diferencia de la diferencia de (S2-S1) pueden ser deducidos sus grados de libertad dado que S1 tiene [NT-N(K+1)] y para S2 tiene [ N(T-1)-K].
La resta es (N-1)K grados de libertad
yit=xitβi+uit
En este caso, la prueba de hipótesis radica en la decisión de
agrupar las respuestas de regresores, xit, vistos a través de los
parámetros de pendiente, β, para todos los individuos i-esimos.
LA PRUEBA ESTADISTICA
Esta prueba permite determinar qué modelo es el más adecuado
para una estructura de datos panel, si efectos fijos (FE) o efectos
aleatorios (FE).
modo, poder decidir entre una estimación por efectos fijos (FE) o
efectos aleatorios (RE).
Puesto que el estimador ̂RE es más eficiente que ̂FE, implica que
la varianza del primer estimador es pequeña en comparación del
segundo estimador, por tanto, la diferencia entre las varianzas
debe ser grande.
PRUEBA DE HAUSMAN
Para decidir entre FE o RE se utiliza la prueba de HAUSMAN
donde la hipótesis nula radica en que el modelo a utilizar es
efectos aleatorios (RE) contra la alternativa de efectos fijos (FE).
Código STATA:
xtreg y x1 x2 x3, fe
estimates store FIXED
xtreg y x1 x2 x3, re
estimates store RANDOM
hausman FIXED RANDOM
En este ejemplo, se rechaza la hipótesis nula. Es decir, la
diferencia entre los coeficientes de efectos aleatorios (RE) y fijos
(FE) es sistemática. Por lo tanto, es conviene utilizar el método
de efectos fijos (FE).
̂
Theta = ̂λ = [1 ]
√̂ ̂
PRUEBA DE HAUSMAN
PRESENTACIÓN SALIDA STATA
CONTRASTE DE HAUSMAN:
Hipotesis nula: Los estimadores son consistentes
Estadıstico de contraste asintótico: χ( ) = 31.45 con
p-value = 0.00000. Conclusión: Se rechaza la
hipotesis nula de efectos aleatorios (RE).
HETEROSCEDASTICIDAD
Cuando la varianza de los errores de cada unidad transversal no
es constante, se encuentra con una violación de supuestos
iniciales de la estructura de estimación panel.
Homocedasticidad Heterocedasticidad
27 Para una discusión sobre esta prueba, consulta Greene, W. 2000. Econometric Analysis. Upper Saddle River, NJ: Prentice Hall, p. 598.
CORRELACIÓN CONTEMPORÁNEA
El problema de correlación contemporánea se refiere a la
correlación de los errores de al menos dos o más individuos en el
mismo periodo t.
No existe dependencia
dependencia transversal
28 Para una discusión de esta prueba, consulta Greene, W. 2000. Econometric Analysis. Upper Saddle River, NJ: Prentice Hall, p. 601.
AUTOCORRELACIÓN
La independencia se viola cuando los errores de diferentes
individuos están correlacionados (correlación contemporánea),
o cuando los errores dentro de cada individuo se correlacionan
temporalmente (correlación serial) o ambos.
ó también el comando:
31 Para una introducción técnica pero fácil de entender sobre las propiedades de FGLS y PCSE, ver: Nathaniel Beck, “Time-Series-Cross-Section
Data: What Have We Learned in the Past Few Years?”, Annual Review of Political Science, 4: 271-93 (2001).
32 Hasta la fecha, el debate entre FGLS y PCSE continúa, y ya se han desarrollado algunos métodos alternativos. Para propósitos de este curso, vale
33Baltagi, B. H., and P. X. Wu. 1999. Unequally spaced panel data regressions with AR(1) disturbances. Econometric Theory 15: 814–823.
34Baltagi, B. H., and Q. Li. 1991. A transformation that will circumvent the problem of autocorrelation in an error-component model. Journal of
Econometrics 48: 385–393.
Desventajas:
1. En términos generales, las desventajas asociadas a la técnica
de datos panel se relacionan con los procesos para la
obtención y el procesamiento de información estadística
sobre las unidades individuales de estudio, cuando esta se
obtiene por medio de encuestas, entrevistas o utilizando
algún otro medio de levantamiento de los datos. Ejemplos
de este tipo de limitaciones son cobertura de la población de
interés, porcentajes de respuesta, preguntas confusas,
distorsión deliberada de las respuestas, etc., que causa
impacto en la construcción y balanceo de las bases de datos,
errores y variables omitidas.
2. El poder de los datos panel radica en la capacidad de aislar
efectos de acciones específicas, tratamientos o políticas.
Para cumplir con este propósito debe estar condicionado
con la estructura de datos. La información utilizada puede
demostrar cómo cada uno los i-esimos agentes económicos
a través del tiempo (t) pueden ser influenciados desde
diferentes factores, la lista puede ser infinita, de tal forma,
que es necesario permanezcan aquellos factores que se
creen tiene un impacto significativo. Sin embargo, si factores
de efectos individuales o específicos en el tiempo existen
entre los cortes transversales o las series de tiempo no son
capturadas por las variables explicativas puede conducir a
heterogeneidad en los parámetros en la especificación del
modelo. Ignorar tal heterogeneidad conduce a estimaciones
BIBLIOGRAFIA
Cameron, C. & P. Trivedi. Microeconometrics: Methods &
Applications, Cambridge U. Press, 2005
Hsiao, C. Analysis of Panel Data. Editorial: Cambridge University
Press. 2003
Wooldridge, J. Econometric Analysis of Cross Section and Panel
Data. 2002
INTRODUCCIÓN
En 1970, Box y Jenkins desarrollaron un cuerpo metodológico
destinado a identificar, estimar y diagnosticar modelos dinámicos
de series temporales en los que la variable tiempo juega un papel
fundamental, conocidos como modelos ARIMA.
Por ejemplo....
Ciclos de crecimiento intertrimestral de la economía americana puede señalarse que,
a principios de 2000, el ciclo económico de crecimiento no había terminado.
10%
8%
6%
4%
2%
0%
-2%
-4%
1970
1975
1980
1985
1990
1995
2000
Definición. Tendencia. Generalmente asociado con el cambio en la
media a lo largo del tiempo. Se identifica la tendencia con el
patrón de evolución sostenido a mediano o largo plazo por
encima de la existencia de movimientos a corto plazo.
Por ejemplo....
La representación de los índices bursátiles DOW JONES, IBEX y NIKKEI revelan en el
caso del DOW JONES e IBEX la tendencia de la cotización de los índices ha sido creciente
durante los últimos 15 años y especialmente acelerada desde mediados de 1995.
Por ejemplo....
Observando la serie mensual de ventas de artículos de navidad puede comprobarse
como existe una marcada estacionalidad, especialmente en el período de finde año.
250000
200000
150000
100000
50000
1995
1996
1997
1998
1999
2000
Procesos estocasticos
Un proceso estocástico es una sucesión de variables aleatorias Yt
ordenadas, donde puede tomar t cualquier valor entre el intervalo
abierto (-, ).
MODELOS AUTORREGRESIVOS-AR(P)
Se define un modelo autorregresivo (AR) como aquel en el que la
variable endógena de un período t es explicada por las
observaciones de ella misma correspondientes a períodos
anteriores (parte sistemática) más un término de error ruido
blanco (innovación puramente aleatoria).
Y t = Y t -1 + t Y t -1 = Y t -2 + t -1
Y t = t + t -1 + Y t -2 ........
2
Y t = t + t -1 + t -2 + t -3 + ....+ t - j +
2 3 j
O lo que es lo mismo:
y = μ + ε + ∑ϕ y + ∑θ ε
COMPARACION DE METODOLOGIAS
Un proceso AR(P) puede reexpresarse a través de la matriz ℱ. Se
determina su estacionareidad si la solución de la ecuación
característica |F-λI| implica que cada una de las raices
caacteristicas es inferior a la unidad (λ<1).
CIRCULO UNITARIO
Suponga un modelo AR(p) descrito de la forma:
FUNCIONES DE AUTOCORRELACION
Definición. Función de medias. La función de medias de un
proceso estocástico (Yt)t∈I es una función de t que proporciona
las esperanzas de la serie de tiempo, yt, para cada periodo t.
ECUACIONES DE YULE-WALKER
Sea el modelo AR(p) donde se omite la constante por simplicidad
en la exposición:
ˆ k N 0, 1 n
Como para cualquier distribución normal estándar, el intervalo de confianza al 95% es 1,96*DT , pueden calcularse los límites de nulidad de los
“ρ”: cualquiera que se salga de esos límites es estadísticamente distinto de “0” (límites que aparecen dibujados en el correlograma de STATA)
Q de Ljung-Box:
La AC o FAS muestra la La PAC o FAP muestra la El estadístico de prueba Ljung- Grafica la AC la cual Grafica la PAC la cual no
correlación entre el valor correlacion entre el valor Box (QLB) parte de la hipótesis demuestra un lento muestra picos después del
corriente de unemp y el valor 3 corriente de unemp y su nula que todos los coeficientes decaimiento en la segundo rezago lo cual
trimestres atrás es 0.8045. AC o valor tres trimestres atrás es de correlación superiores al muestra que los otros
tendencia, siguiriendo no
FAS puede ser utilizado para 0.1091 sin el efecto de los rezago P son iguales a cero, estacionareidad dentro rezagos son espejos del
definir el modelo MA(q) Esta serie muestra
dos periodos previos. PAC o del proceso estocastico. segundo rezago.
únicamente si la serie es autocorrelación significativa en
estacionaria. FAP puede ser utilizado para
definir el modelo AR(p) el valor Prob>Q el cual en
únicamente en series cualquiera es menor que 0.05,
estacionarias por lo tanto, se rechaza la
hipótesis nula que todos los
rezagos estan no
correlacionados.
ESTACIONAREIDAD E INVERTIBILIDAD
La distribución teórica de un proceso generador de datos (DGP)
utiliza la FAS y FAP como aproximación su comportamiento que
asume un proceso estocástico {yt} es estacionario. Además, los t-
estadísticos y el estadístico de Q de Ljung-Box también asumen
estacionareidad.
y =∑ ε +
36Sin embargo, si εt esta no correlacionada pero no es un proceso independiente, entonces el modelo lineal existe pero no es la unica
representacion dinamica de la serie. En este caso es posible que el modelo lineal no sea útil y la posibilidad de trabajar con modelos no lineales es
posible.
D Yt Ds Log Yt
De forma general:
TRANSFORMACION BOX-COX
La igual que lo ocurrido con la media, en el segundo momento o
varianza, las series de tiempo económicas tampoco cumple con
las caractesristicas necesarias para satisfacer las condiciones de
un proceso estacionario en sentido débil.
TENDENCIAS DETERMINISTAS
Cuando se observa la solución general a una ecuación en
diferencias, que representa una serie de tiempo, se admite una
descomposición de la serie en componentes cíclico, tendencia,
estacional y estocástico.
600,00
400,00
200,00
0,00
-200,00
-400,00
1
6
11
16
21
26
31
36
41
46
51
56
61
66
71
76
81
86
91
96
En el gráfico (en azul) puede observarse como la serie original
puede ser modelada por una tendencia lineal creciente que puede
ser estimada con una regresión líneal (línea discontinua roja
muestra la tendencia).
AJUSTE DE TENDENCIA
Ajuste de tendencia Correcto (serie Ajuste de Tendencia Incorrecto (tendencia
oscilante alrededor de una tendencia sobreparametrizada)
monótona creciente)
30.0000 30.0000
25.0000 25.0000
20.0000 20.0000
15.0000 15.0000
10.0000 10.0000
5.0000 5.0000
0.0000 0.0000
96
97
98
99
00
01
02
03
04
05
96
97
98
99
00
01
02
03
04
05
e-
e-
e-
e-
e-
e-
e-
e-
e-
e-
e-
e-
e-
e-
e-
e-
e-
e-
e-
e-
en
en
en
en
en
en
en
en
en
en
en
en
en
en
en
en
en
en
en
en
8
15
22
29
36
43
50
57
64
71
78
85
92
99
15
22
29
36
43
50
57
64
71
78
85
92
99
yi a tib ui yi a bt ui
TENDENCIA Logarítmica TENDENCIA Polinomica
Serie Logarítmica Ajuste Tendencia Polinómica Ajuste
40,00 100,00
35,00 80,00
30,00
60,00
25,00
40,00
20,00
20,00
15,00
10,00 0,00
5,00 -20,00
0,00 -40,00
1
7
13
19
25
31
37
43
49
55
61
67
73
79
85
91
97
1
7
13
19
25
31
37
43
49
55
61
67
73
79
85
91
97
yi a b ln(t ) ui yi a b t b t 2 ui
TENDENCIAS ESTOCÁSTICAS
La tendencia de una serie, comprendida como la variación de la
media del proceso, puede ocurrir debido a un comportamiento
de tendencia determinística (constante a través del tiempo) o
tendencia estocástica (en función de la permanencia de las
innovaciones pasadas).
10.0000
40.0000
8.0000
6.0000
30.0000
4.0000
2.0000
20.0000
0.0000
-2.0000 10.0000
-4.0000
-6.0000 0.0000
-8.0000
-10.0000
-10.0000
ene-96
ene-97
ene-98
ene-99
ene-00
ene-01
ene-02
ene-03
ene-04
ene-05
ene-96
ene-97
ene-98
ene-99
ene-00
ene-01
ene-02
ene-03
ene-04
ene-05
yt =
∆yt =
∆yt = εt
E,∆yt] = 0
Y su varianza:
RESUMEN PRUEBAS DF
Calculando:
Por ejemplo, suponga que se tiene una serie de tiempo, yt, donde
se sospecha que el orden de integración es I(2) se efectúan los
siguientes pasos para determinar el orden de integración:
PRUEBA KPSS
Otra posibilidad de investigar las propiedades de integración de
una serie de tiempo, yt, es probar la hipotesis nula que un
proceso generador de datos (DGP) es estacionario (H0: yt∼I(0))
contra la alternativa que el proceso es integrado I(1) (H1:
yt∼I(1)).
NO SI
¿Es estacionaria en media ?
PRUEBAS DE RAÍZ UNITARIA
Aplicar
Aplicar BOX-COX Aplicar
Aplicar BOX-COX
diferencias diferencias
(1) Continuamos con la (2) Continuamos con (3) Continuamos con la (4) Continuamos con
serie filtrada en la serie filtrada serie en diferencias la serie original
diferencias “dYt(ft)” “Yt(ft)” “dYt” “Yt”
ESTIMACIÓN
Los parámetros del modelo ARMA pueden estimarse por Máxima
Verosimilitud (ML) asumiendo una distribución condicional
concreta para la serie de interés. Aunque las observaciones no
son mutuamente independientes, la verosimilitud puede
obtenerse mediante la siguiente función de verosimilitud:
Prueba Objetivo
Grafica Análisis descriptivo de los residuos.
LM Prueba para determinar efecto ARCH,
varianza constante o no condicionada.
Q-Ljung-Box Estacionariedad y autocorrelación de
los residuos.
Prueba de Contraste de ruido blanco sobre los
Pormanteau residuos
Normalidad Jarque-Bera
Prueba de estabilidad Test de Chow
ANÁLISIS DESCRIPTIVO DE LOS RESIDUOS
Graficando la serie de residuos de un modelo estimado de series
de tiempo es un camino para detectar posibles deficiencias. Por
ejemplo, datos atípicos, varianzas no homogéneas, o cambios
estructurales mostrarse en las series analizadas.
PRUEBA DE PORTMANTEAU
La prueba de Pormanteau verifica la hipótesis nula que no existe
correlación permanente en los residuos desde el rezago 1 hasta el
rezago h-esimo contra la alternativa que al menos una de las
autocorrelaciones no es cero.
O mejor:
En otras palabras la prueba de hipótesis es:
H0: todas las autocorrelaciones son cero.
H1: existe al menos una autocorrelación distinta de cero.
PRUEBAS DE NORMALIDAD
Lomnicki (1961) y Jarque & Bera (1987) han propuesto pruebas
para determinar la normalidad de los residuos basadas en el
tercer y cuarto momento de la distribución de los términos de
error, en otras palabras, la asimetría y kurtosis de la distribución.
Dónde:
: es una media de asimetría de la distribución
: es una media de apuntamiento de la distribución.
PRUEBA ARCH
En la mayoría de análisis sobre los residuos se asume la
normalidad y varianza constante. Sin embargo, es posible
encontrar varianzas heterocedasticas que pueden ser capturadas
a través de modelos de volatilidad condicionada heterocedastica
o modelos ARCH.
PRONOSTICO
Si se ha encontrado un modelo adecuado para el proceso
generador de datos (DGP) de una serie de tiempo puede ser
utilizada para pronosticar la variable en estudio.
yˆ yi
2
i
i 1
U Theil n
n n
yˆ y
2 2
i i
i 1
i 1
n n
CRITERIOS DE INFORMACIÓN
La búsqueda de un criterio de parsimonia utiliza el cálculo de los
criterios de información que corresponde a las propuestas por
Akaike (1973,1974), Schwarz (1978) y Hannan-Quinn (1979)
tanto para modelos uniecuacionales como multiecuacionales.
PROCEDIMIENTO
Las etapas que se deben seguir en la elaboración y construcción
de un modelo ARIMA basados en la metodología Box–Jenkins
parten de los siguientes principios.
METODOLOGÍA BOX-JENKINS
MODELOS ESTACIONALES
Existen dos caminos para responder estas preguntas. El primero,
los efectos estacionales se incorporan en la metodologia Box-
Jenkins. El segundo, modelar la tendencia utilizando técnicas de
desestacionalizacion.
ANÁLISIS DE ESTACIONALIDAD
Incorporar efectos estacionales describe un componente que
modela la media del proceso estacionario a través de su parte
autoregresiva (p), media móvil (q) con un orden de integración
(d) expresado como (p, d, q). De aquí en adelante será conocida
como parte regular.
Regular+Estacional SARIMA(p,d,q)(P,D,Q,S)
Graficos,
FAS/FAP,
Pruebas Raiz Unitaria
Criterios Pantula/CD
Diferenciacion
Box-Cox
Maxima verosimilitud
Residuos:
Grafico (outliers-tendencias)
ARCH-LM
Pormanteau
Q-Ljung-BOX
ECM
Criterios de información
TÉCNICAS DE DESESTACIONALIZACION
Descartar el componente estacional, implica utilizar una serie de
metodologías de suavizamiento exponencial estacional como
Holt-Winters multiplicativo y aditivo o trabajar con técnicas de
desestacionalizacion como X11, X12, TRAMO/SEATS o filtros de
tendencia de largo plazo tipo Hodrick & Prescott o Baxter & King.
t
4 8 12 4
-1
En la práctica, la identificación de un proceso estacional no es tan
sencilla por el hecho que patrones estacionales interactúan con
patrones no estacionales en el proceso generador de datos (DGP).
La FAS y FAP para procesos estacionales/no estacionales no
necesariamente reflejan ambos elementos.
Una sucesión finita x1,...,xT (que puede ser una serie temporal, es
decir, una realización de un proceso estocástico) puede
escribirse como suma de senos y cosenos de la forma siguiente:
CASO 1 CASO 2
INTEGRACIÓN ESTACIONAL
Al igual que para series estacionarias sin componente estacional,
para este tipo de procesos estacionales deberá determinarse el
grado de integración regular (d).
39No se puede olvidar que también es posible utilizar algún filtro para obtener datos estacionalmente ajustados como los mencionados en la
sección anterior.
ESTACIONALIDAD DETERMINÍSTICA
Caso 1 Caso 3
ESTACIONALIDAD ESTACIONARIA
ESTACIONALIDAD NO ESTACIONARIA
Por lo tanto, estas tres raíces (1, -1, ±i) se denominan raíces
unitarias estacionales. La raíz para z=1 se refiere a raíz unitaria
de frecuencia cero (ω=0), o de su componente regular, para
distinguirla de demás raíces.
REGRESIONES ESPURIAS
El problema de la aparición de regresiones espurias en los
resultados de un buen número de análisis económicos es
siempre atribuido a Granger y Newbold (1974).
Efectivamente, en la regresión:
20 40
35
10
30
0
25
-10 20
-20 15
10
-30
5
-40
0
-50 -5
1 14 27 40 53 66 79 92 105 118 131 144 157 170 183 196 209 222 235 248 261 274 287 300 313 326 339 352 365 378 391 404 417 430 443 456 469 482 495 1 14 27 40 53 66 79 92 105 118 131 144 157 170 183 196 209 222 235 248 261 274 287 300 313 326 339 352 365 378 391 404 417 430 443 456 469 482 495
BIBLIOGRAFÍA
1 Wooldridge, Jeffrey M. (2003).Econometric Analysis of
Cross Section and Panel Data. MIT Press.
2 Kalman, R.E., A New Approach to Linear Filtering and
Prediction Problems, Trans. ASME,J. Basic Engineering,
vol 82, March 1960, pp 94-35.
3 Hamilton, J.D. (1994) “Time Series Analysis”, Princeton
University Press.
4 Amemiya T.(1985), Advanced Econometrics. Harvard
University Press.
5 Greene W. (1997), Econometric Analysis. Prentice Hall,
tercera edición.
6 White, H. (1984), Asymptotic Theory for
Econometricians. Academic Press
7 Kydland, Finn y Prescott, Edward. (1990). "Business
Cycles: Real Facts and a Monetary Myth". En: Quarterly
Review. Federal Reserve Bank of Minneapolis.
Primavera. P.3-18.
41Ecuaciones de forma reducida indica que los valores contemporáneos de las variables del modelo no aparecen como variables explicativas en
ninguna de las ecuaciones. El conjunto de variables explicativas de cada ecuación está constituido por un bloque de rezagos de cada una de las
variables del modelo. Las ecuaciones no restringidas implica que en cada una de ellas exsite el mismo grupo de variables explicativas.
42 La defincion de exogeneidad estadística se expondrá con mas detalle en el documento siguiendo a Sims (1980)
EL MODELO VAR
En el caso más simple, con sólo dos variables y un rezago, el
modelo VAR(1) puede ser expresado como:
o, en forma matricial,
UN MODELO ESTRUCTURAL
Es útil interpretar el modelo VAR como una forma reducida de
un modelo estructural,
Con
Donde
Tendríamos,
Por lo que,
CONDICIONES DE ESTABILIDAD
Si resolvemos recursivamente el modelo VAR(1) tenemos,
Además,
Se tiene que
Finalmente,
CONTRASTES DE CAUSALIDAD
Un contraste especialmente interesante se conoce como de
causalidad en el sentido de Granger. Supongamos que estamos
explicando el comportamiento de una variable y utilizando su
propio pasado. Se dice que una variable z no causa a la variable y
si al añadir el pasado de z a la ecuación anterior no añade
capacidad explicativa. El contraste consiste en analizar la
significancia estadística del bloque de rezagos de z en la ecuación
mencionada, y la hipótesis nula es que la variable z no causa, en
el sentido de Granger, a la variable y.
Donde,
Que conduce a,
DESCOMPOSICIÓN DE LA VARIANZA
Si utilizamos la representación MA para obtener predicciones de
las variables y1, y2, tenemos,
Entonces
BIBLIOGRAFÍA
1 Wooldridge, Jeffrey M. (2003).Econometric Analysis of
Cross Section and Panel Data. MIT Press.