Vous êtes sur la page 1sur 32

Correlación Serial

Clase 7
Series de tiempo
• Uno de los supuestos básicos del modelo de regresión
lineal múltiple es que las observaciones no están
correlacionadas unas con otras.
• Esto se cumple cuando se toma una muestra aleatoria,
usando datos de corto transversal.
• Ese supuesto no se cumple muchas veces cuando se toman
observaciones en intervalos temporales regulares.
• Ese tipo de datos se denomina series de tiempo, los cuales
tienen una estructura implícita en la cual el tiempo es un
componente importante.
• Si el modelo de regresión no recoge adecuadamente esa
estructura temporal, el residuo se reflejará en el término de
error y esto produciría que los errores esten
correlacionados.
¿Por qué ocurre la correlación serial?
• Inercia de las series de tiempo
• Sesgo de específicación: caso de variables
excluidas
• Sesgo de específicación: forma funcional
incorrecta
• Rezagos de la variable dependiente no
incluidos
Serie de tiempo estacionaria
Seire de tiempo no estacionaria
Serie de tiempo no estacionaria
y con tendencia
Errores autorregresivos de primer orden

yt  1  2 xt  et
et  et 1  vt
E ( vt )  0 var( vt )  v2 cov( vt , vs )  0 for t  s
1    1

E ( et )  0
 2
var( et )  e2  v

1  2
cov  et , et  k   e2 k k 0
Errores autorregresivos de primer orden

cov( et , et  k ) cov( et , et  k ) e2k


corr( et , et  k )    2  k
var( et )var  et  k  var( et ) e

corr( et , et 1 )  
Errores autorregresivos de primer orden
T


cov( xt , yt )  ( xt  x )( yt  y )
rxy   t 1
  T T
var( x )var(
t y) t
 ( xt  x ) 2
 t
( y  y ) 2

t 1 t 1


cov( et , et 1 )  eˆt eˆt 1
r1   t 2
 T
var( e)
t  t 1
ˆ
e 2

t 2
Consecuencias de la correlación serial
• Cuando los errores siguen un patrón
autorregresivo de orden 1 [AR(1)] los MICO
son insesgados y consistentes, pero ya no son
eficientes.
• Los errores estándar no son los correctos y, en
consecuencia, se obtienen resultados
estadísticamente inválidos para la prueba de
hipótesis y los intervalos de confianza.
Mínimos Cuadrados Generalizados
• El estimador MCG es el MELI porque utiliza la
información de la existencia de correlación
serial.

• Estos estimadores serán insesgados y también


tendrán varianza mínima.
Consecuencias de usar MICO
• Permitiendo la correlación serial
– Los intervalos de confianza serán
innecesariamente amplios.
– Puede concluirse que un coeficiente es
estadísticamente no significativo, aunque de
hecho puede serlo.
Consecuencias de usar MICO
• Sin tener en cuenta la correlación serial
– La varianza residual (sigma cuadrado)
probablemente subestima al verdadero sigma2.
– Es probable que se sobreestime el coeficiente de
determinación.
– Puede subestimarse la varianza de los estimadores
beta.
– Las pruebas t y F dejan de ser válidas.
Detección de la autocorrelación
• Método gráfico
– Graficar los residuos contra el tiempo
– Graficar los residuos de hoy contra los del período
precedente

• Correlograma

• Método Durbin-Watson
Detección de la autocorrelación
• Uso del correlograma, el cual es una gráfica
que dibuja series de correlación entre el
residuo actual y el residuo con diferentes
retrasos temporales.
• Lo primero es estimar el modelo usando
MICO.
• Luego determinar el correlograma
Detección de la autocorrelación
• En este caso la primera autocorrelación cae fuera de los
límites y, por lo tanto, es estadísticamente diferente de cero
con un nivel de significancia de un 5%.
0.50
Autocorrelations of ehat

0.00
-0.50

0 5 10 15
Lag
Bartlett's formula for MA(q) 95% confidence bands
Durbin-Watson
• El estadístico D-W (o d) se define:
tN

  et  et 1 
2

d t 2
tN

t
e 2

t 1

• Supuestos en que se basa el D-W:


– El modelo incluye constante
– Las variables explicativas no son estocásticas
– Las perturbaciones son AR(1)
– El modelo de regresión no incluye variable endógena
rezagada
– No hay datos faltantes
Durbin-Watson
• Es difícil derivar la distribución probabilística exacta de D-W,
debido a que depende de X. Pero se encontraron límites que
permiten saber si hay o no correlación serial positiva o
negativa:
tN

  et  et 1 
2

d t 2

 e   e  2 e e
2
t
2
t 1 t t 1
tN tN

e
t 1
2
t e
t 1
2
t

Asumiendo que :
e  e
2
t
2
t 1

  et et 1 
d  2 1  2 
 2 1   

  et  

1    1  0  d  4
Durbin-Watson

• Si el valor del D-W está cercano a dos, se llega a la


conclusión de que no existe correlación serial.

• Si el valor del D-W está cercano a cero, se dice


que la correlación serial es positiva.

• Si el valor del D-W está cercano a cuatro, se dice


que la correlación serial es negativa.
Durbin-Watson: regla de decisión
• De 0 a dL: Correlación serial positiva

• De dL a dU: Zona de indecisión

• De dU a 4-dU: No correlación (se acepta Ho)

• De 4-dU a 4-dL: Zona de indecisión

• De 4-dL a 4: Correlación serial negativa


Medidas de solución
• Cuando se conoce rho se transforman las variables restando la
variable original multiplicada por rho retrasada un período y se
estima usando MICO, lo cual esquivalente a usar MCG.

• Cuando no se conoce rho, transforme el modelo a variables en


primera diferencia (rho es 1).

• Si asume que rho es -1, transforme el modelo a una regresión de


promedio móvil de dos períodos.

• Esto reduce el componente inercial, que origina relaciones espúreas


y correlación serial en los modelos de series de tiempo.
Aplicación en EViews
• Abra el archivo bangla.wf1 (datos de área
sembrada de caña de azúcar y precio del
azúcar)
• Estime el modelo: log(A) c log(P)
• Cree la serie series ehat=resid
• Grafique la serie de reisudos: View/Actual,
Fitted, Residual/Residual Graph
• Para guardarla cliquee en Freeze y luego en
Name
Modelo de caña de azúcar
yˆt  3.893  .776 xt
(se) (.061) (.277)

1
.5
Residuals

0
-.5
-1

0 10 20 30 40
time
Correlación entre et y et-1
• Haga series ehat_1= ehat(-1)
• Observe los datos de ehat y de ehat_1
• Calcule el coeficiente de correlación:
– Scalar r1 = @cor(ehat, ehat_1)
Errores estandar Newey-West
• Los errores estandar Newey-West (o HAC =
Heteroskedasticity-Autocorrelation
Consistent) son los adecuados cuando existe
correlación serial
• Para obtenerlos vaya a Options en la ventana
de estimación de ecuación y seleccione
Newey-West (estos son consistentes tanto
bajo heteroscedasticidad como bajo
autocorrelación)
Errores estandar Newey-West
• Dependent Variable: LOG(A)
• Method: Least Squares
• Date: 01/17/09 Time: 12:14
• Sample: 1 34
• Included observations: 34
• Newey-West HAC Standard Errors & Covariance (lag truncation=3)



• Variable Coefficient Std. Error t-Statistic Prob.


• C 3.893256 0.062444 62.34761 0.0000
• LOG(P) 0.776119 0.378207 2.052102 0.0484


• R-squared 0.196466 Mean dependent var 3.980680
• Adjusted R-squared 0.171355 S.D. dependent var 0.338123
• S.E. of regression 0.307793 Akaike info criterion 0.538245
• Sum squared resid 3.031571 Schwarz criterion 0.628031
• Log likelihood -7.150159 Hannan-Quinn criter. 0.568864
• F-statistic 7.824072 Durbin-Watson stat 1.168987
• Prob(F-statistic) 0.008653



Modelo con errores AR(1)
• Los componentes del modelo son:
ln  At   1   2 ln  Pt   et
et   et 1  t
Recuerde:
 e2   v2 1   2 

• La forma corta es:


– Log(a) c log(p) AR(1)
– Rho=0.42214 (coeficiente de AR(1)
– Sigma2 de v = 0.2854 (S.E. of regression)
– Note: Dado que se usa un estimador no lineal se
realizan iteraciones y a la 7 se obtiene el resultado
Modelo con errores AR(1)
• Dependent Variable: LOG(A)
• Method: Least Squares
• Date: 01/17/09 Time: 12:24
• Sample (adjusted): 2 34
• Included observations: 33 after adjustments
• Convergence achieved after 7 iterations


• Variable Coefficient Std. Error t-Statistic Prob.


• C 3.898771 0.092165 42.30197 0.0000
• LOG(P) 0.888370 0.259299 3.426048 0.0018
• AR(1) 0.422140 0.166047 2.542284 0.0164


• R-squared 0.277777 Mean dependent var 3.999309
• Adjusted R-squared 0.229629 S.D. dependent var 0.325164
• S.E. of regression 0.285399 Akaike info criterion 0.416650
• Sum squared resid 2.443575 Schwarz criterion 0.552696
• Log likelihood -3.874725 Hannan-Quinn criter. 0.462425
• F-statistic 5.769216 Durbin-Watson stat 1.820560
• Prob(F-statistic) 0.007587


• Inverted AR Roots .42



Prueba de autocorrelación
• Correlograma residual: es la secuencia de las
correlaciones r1, r2…entre et, et-1, et-2, etc.
• La fórmula que usa Eviews para computar rk es
igual a: 
T
eˆ eˆ
t  k 1 t t  k
r 
k
 eˆ
T 2

t 1 t
• Vaya a la ecuación estimada y luego haga:
View/Residual Tests/ Correlograma – Q statistics y
especifique un lag (e.g., 6)
• El resultado se presenta bajo la gráfica
Autocorrelation y bajo AC
• Corrija el modelo por AR(1) y vuelva a realizar el
correlograma…qué observa?
Prueba de Durbin-Watson
• Se reporta en la tabla de resultados de la
ecuación estimada
• Se debe verificar si existe autocorrelación
usando la regla presentada anteriormente
Prueba del multiplicador de Lagrange
• La prueba del multiplicador de Lagrange para un error
AR(1) determina la significancia de rho:
log  At   1   2 log  Pt    eˆt 1  t
O bien,
eˆt   1   2 log  Pt    eˆt 1  t

• En la ecuación estimada vaya a View/Residual Test/Serial


Correlation LM Test y seleccione lag igual a 1
• La prueba t del coeficiente de Resid(-1) permite rechazar
o no la Ho de no correlación serial
• Observe que el estadístico F = t^2

Vous aimerez peut-être aussi