La autocorrelacin se puede definir como la correlacin entre miembros de series de observaciones
ordenadas en el tiempo (informacin de series de tiempo) o en el espacio (informacin de corte de transversal). El modelo de regresin lineal supone que no debe existir autocorrelacin en los errores , es decir, el trmino de perturbacin relacionado con una observacin cualquiera no debera estar influenciado por el trmino de perturbacin relacionado con cualquier otra observacin. para todo Causas de la utocorrelacin lgunas de las causas son las siguientes ! "raba#o con datos de serie temporal! cuando se traba#a con datos de corte longitudinal (p.e.! una variable explicativa cu$as observaciones correspondan a valores obtenidos en instantes temporales sucesivos), resulta bastante frecuente que el trmino de perturbacin en un instante dado siga una tendencia marcada por los trminos de perturbacin asociados a instantes anteriores. Este %ec%o da lugar a la aparicin de autocorrelacin en el modelo. Especificacin errnea en la parte determinista del modelo (autocorrelacin espuria)! &. 'misin de variables relevantes! en tal caso, las variables omitidas pasan a formar parte del trmino de error $, por tanto, si %a$ correlacin entre distintas observaciones de las variables omitidas, tambin la %abr( entre distintos valores de los trminos de perturbacin. ). Especificacin incorrecta de la forma funcional del modelo! si usamos un modelo inadecuado para describir las observaciones (p.e.! un modelo lineal cuando en realidad se debera usar un modelo cuadr(tico), notaremos que los residuos muestran comportamientos no aleatorios (i.e.! est(n correlacionados). "ransformaciones de los datos! determinadas transformaciones del modelo original podran causar la aparicin de autocorrelacin en el trmino de perturbacin del modelo transformado (incluso cuando el modelo original no presentase problemas de autocorrelacin). "raba#o con modelos din(micos! cuando se traba#a con series temporales suele ser %abitual considerar modelos de regresin que inclu$an no slo los valores actuales sino tambin los valores retardados (pasados) de las variables explicativas. Es el caso de un modelo de retardos distribuidos de orden s o *+(s)! 'tro tipo de modelo din(mico que presentara problemas de autocorrelacin sera aquel que inclu$ese entre sus variables explicativas uno o m(s valores retardados de la variable dependiente. Este otro tipo de modelo din(mico se conoce como modelo autorregresivo de orden s o *(s)! 'tra causa com,n de la autocorrelacin es la existencia de tendencias $ ciclos en los datos. Es decir, la ma$ora de las variables econmicas no son estacionarias en media. Esto significa que si la variable endgena del modelo tiene una tendencia creciente o presenta un comportamiento cclico que no es explicado por las exgenas, el trmino de error recoger( ese ciclo o tendencia. Consecuencias de la utocorrelacin! La consecuencia m(s grave de la autocorrelacin de las perturbaciones es que la estimacin -C' de#a de ser eficiente $ la inferencia estadstica tambin se ver( afectada. Las consecuencias dependen del tipo de autocorrelacin (positiva o negativa)! &. Cuando se tiene autocorrelacin positiva, la matri. de varian.a $ covarian.a de los residuos esta subestimada, si el tipo de autocorrelacin es negativa, se tiene una sobrestimacin de la misma. ). Cuando se tiene autocorrelacin positiva, la matri. de varian.a $ covarian.a de los coeficientes (betas) esta subestimada, si el tipo de autocorrelacin es negativa, se tiene una sobrestimacin de la misma. /. Cuando se tiene autocorrelacin positiva, los intervalos de confian.a son angostos, si el tipo de autocorrelacin es negativa, se tienen intervalos de confian.a m(s amplios. 0. Cuando se tiene autocorrelacin positiva, se tiende a cometer error tipo 1 (rec%a.ar la %iptesis nula cuando es verdadera), si el tipo de autocorrelacin es negativa, se tiende a cometer error tipo 11 (no rec%a.ar la %iptesis nula cuando es falsa). 2. Los son lineales, insesgados, pero ineficientes (no tienen varian.a mnima). 3. Las pruebas $ pierden valide.. +eteccin de la utocorrelacin! 4ara anali.ar la posible presencia de autocorrelacin en el modelo se suele recurrir a dos tcnicas complementarias! (&) el an(lisis gr(fico de los residuos (obtenidos al reali.ar la regresin por -C'), $ ()) los contrastes de %iptesis especficos (test de +urbin56atson, test % de +urbin, test de 7reusc%5 8odfre$, test 9 de 7ox54ierce, etc.). n(lisis 8r(fico! l reali.ar la regresin por -C', se pueden graficar los residuos (o, alternativamente, los residuos estandari.ados, es simplemente dividir por el error estandar de la estimacin ) frente al tiempo. +ado que los residuos -C' son estimadores consistentes de los trminos de perturbacin, si se aprecian en el gr(fico anterior patrones de comportamiento sistem(tico (no aleatorio) podremos afirmar que los trminos de perturbacin presentan alg,n tipo de autocorrelacin. Contrastes! "est de +urbin56atson Es la prueba mas conocida para detectar correlacin serial: permite contrastar si el trmino de perturbacin est( autocorrelacionado. +ic%a prueba presenta algunos supuestos! Es v(lido para autocorrelacin serial de &; orden en los residuos, no aplica para modelos con variable dependiente re.agada como variable explicativa, las variables explicativas son no estoc(sticas (son fi#as en muestreo repetido), el modelo de regresin lineal debe incluir el intercepto, $ no %a$ observaciones faltantes en los datos. <na ve. %allado +6, es posible usar su valor para estimar el coeficiente de autocorrelacin simple mediante la expresin! El estadstico +6 es un valor comprendido entre = $ 0. Como se observa en el siguiente gr(fico, para valores de +6 cercanos a ) no rec%a.aremos la %iptesis nula, por el contrario, para valores de +6 ale#ados de ), s rec%a.aremos la %iptesis nula "abla de decisin! , se rec%a.a , existe autocorrelacin positiva. , se rec%a.a , existe autocorrelacin negativa. , no se rec%a.a , no existe autocorrelacin. o , el contraste no es conclu$ente. Los pasos a seguir de este contraste son! &. Estimacin por mnimos cuadrados ordinarios (-C') del modelo de regresin. ). C(lculo de los residuos -C'. /. 'btencin del estadstico d (experimental) de +urbin56atson. 0. 7,squeda de los niveles crticos del contraste. 2. plicacin de la regla de decisin. <n inconveniente que presenta este contraste es que a veces puede no ser conclu$ente, por lo que %a$ que considerar, utili.ando otros criterios, si existe o no autocorrelacin. E#emplo en >tata! >e traba#ara con la base de datos 4?1LL14>.+", la cual contiene las siguientes variables! , indica el a@o. , es la tasa de inflacin. , es la tasa de desempleo. Con el fin de reali.ar estimaciones de series de tiempo en >tata, es importante escribir el siguiente comando! tsset $ear +onde es la variable que contiene los a@os. utom(ticamente el sistema reconoce la serie de tiempo, $ muestra! time variable! $ear, &A0B to &AA3 >alida en >tata! reg inf unem >ource C >> df -> Dumber of obs E 0A 5555555555555F555555555555555555555555555555 G( &, 0H) E ).3) -odel C )2.3/3A2H2 & )2.3/3A2H2 4rob I G E =.&&)2 *esidual C 03=.3&AHA 0H A.B==0)&=H *5squared E =.=2)H 5555555555555F555555555555555555555555555555 d# *5squared E =.=/)3 "otal C 0B3.)23H0B 0B &=.&/=/0BA *oot ->E E /.&/=3 555555555555555555555555555555555555555555555555555555555555555555555555555555 inf C Coef. >td. Err. t 4ICtC JA2K Conf. 1ntervalL 5555555555555F5555555555555555555555555555555555555555555555555555555555555555 unem C .03H3)2H .)BA&)3) &.3) =.&&) 5.&&0=)&/ &.=0A)H/ Mcons C &.0)/3& &.H&A=&2 =.B/ =.0&) 5).=/03=) 0.BB&B)) 555555555555555555555555555555555555555555555555555555555555555555555555555555 <na ve. estimada la regresin, se procede a e#ecutar el siguiente comando con el cual se obtiene el estadstico +urbin56atson! estat dNatson o dNstat +urbin56atson d5statistic( ), 0A) E .B=)H==2 >i se quiere estimar el +urbin56atson por las ventanas en >tata A, la ruta a seguir es! >tatisticsOtime5seriesOtestsOtime series epecification tests after regress utom(ticamente se despliega el siguiente recuadro, en donde se muestra la opcin a seleccionar, $ le damos 'P. La ruta a seguir en >tata B.) es! >tatisticsOtime5seriesOtestsO+urbin56atson d statistics after regress utom(ticamente se despliega el siguiente recuadro, en donde se muestra la opcin a seleccionar, $ le damos 'P. "eniendo en cuenta que +6 es =.B=)H, gr(ficamente se tiene! 4or tanto se rec%a.a la %iptesis nula, %a$ autocorrelacin. 4rueba de 7reusc% Q 8odfre$ (78) sobre autocorrelacin de orden superior Este estadstico es mu$ sencillo de calcular $ resuelve los problemas del contraste de +urbin56atson: por e#emplo, los regresores incluidos en el modelo pueden contener valores re.agados de la variable dependiente, es decir, , etc. 4ueden aparecer como variables explicativas. >upngase que el termino de perturbacin es generado por el siguiente esquema autorregresivo de orden ! +onde es un trmino de perturbacin puramente aleatorio con media cero $ varian.a constante. +ado el modelo anterior, la %iptesis ser(! Do %a$ autocorrelacin de ning,n orden. +ic%a %iptesis puede ser probada de la siguiente manera! &. Estimacin por -C' del modelo de regresin $ obtencin de los residuos -C' . ). Estimacin de una regresin auxiliar de los residuos sobre p retardos de los mismos, . /. 'btencin del coeficiente de determinacin ( ) de la regresin auxiliar ( ). 0. >i el tama@o de la muestra es grande, 7reusc% $ 8olfre$ %an demostrado que! se distribu$e con con g.l. 2. >i el valor calculado excede el valor critico de al nivel de significancia seleccionado, se puede rec%a.ar la %iptesis nula, en cu$o caso, por lo menos un es significativamente diferente de cero (se admite que %a$ autocorrelacin), en caso contrario no %abra autocorrelacin. E#emplo en >tata! El comando a e#ecutar es! estat bgodfre$ o bgodfre$ 7reusc%58odfre$ L- test for autocorrelation 555555555555555555555555555555555555555555555555555555555555555555555555555 lags(p) C c%i) df 4rob I c%i) 5555555555555F5555555555555555555555555555555555555555555555555555555555555 & C &B.0H) & =.==== 555555555555555555555555555555555555555555555555555555555555555555555555555 ?=! no serial correlation +e acuerdo a la salida anterior, se puede observar que el p5valor asociado al es =.===, lo cual confirma la presencia de autocorrelacin. >i se quiere estimar la prueba 7reusc% Q 8odfre$ por las ventanas en >tata A, la ruta a seguir es! >tatisticsOtime5seriesOtestsOtime series epecification tests after regress utom(ticamente se despliega el siguiente recuadro, en donde se muestra la opcin a seleccionar, $ le damos 'P. La ruta a seguir en >tata B.) es! >tatisticsOtime5seriesOtestsO7reusc%58odfre$ L- test for autocorrelation utom(ticamente se despliega el siguiente recuadro, en donde se muestra la opcin a seleccionar, $ le damos 'P. Como solucionar la autocorrelacin Cuando es conocido! &. se tiene! (a) (b) ). -ultiplico (b) por , $ se tiene! (c) 0. >e resta (a)5(c)! 2. (d) +onde 3. Estimo (d) por -C'. Cuando desconocida! >e utili.a en algoritmo de Coc%rane 'rcutt! Considrese el siguiente modelo! (e) R supngase que , es generado por el esquema *(&)! Coc%rane 'rcutt recomienda reali.ar los siguientes pasos! &. Estimar (e) por -C' $ se obtener . ). <tili.ando los residuos estimados , reali.o las siguiente regresin! (f) /. <tili.ando obtenido en la regresin anterior, efect,ese la ecuacin en diferencia planteada en (d) por -C'. 0. 'btengo los $ los sustitu$o en (a). 2. >e estima nuevamente! : donde es la estimacin de de (f). 3. >e contin,an %aciendo estimaciones, $ se suspenden las iteraciones cuando las estimaciones consecutivas de difieren en una cantidad mu$ peque@a, es decir, en menos de =.=& o =.=2. E#emplo en >tata! 4ara e#ecutar el algoritmo de Coc%rane 'rcutt en >tat por comando, se escribe! prais inf unem, corc 1teration =! r%o E =.==== 1teration &! r%o E =.2H)H 1teration )! r%o E =.H&3= 1teration /! r%o E =.H3&& 1teration 0! r%o E =.HH&2 1teration 2! r%o E =.HH/2 1teration 3! r%o E =.HH0= 1teration H! r%o E =.HH0= 1teration B! r%o E =.HH0= 1teration A! r%o E =.HH0& 1teration &=! r%o E =.HH0& Coc%rane5'rcutt *(&) regression 55 iterated estimates >ource C >> df -> Dumber of obs E 0B 5555555555555F555555555555555555555555555555 G( &, 03) E 0.// -odel C )).0HA=3B2 & )).0HA=3B2 4rob I G E =.=0/= *esidual C )/B.3=0==B 03 2.&BH=0/32 *5squared E =.=B3& 5555555555555F555555555555555555555555555555 d# *5squared E =.=33) "otal C )3&.=B/=H3 0H 2.220A2A=H *oot ->E E ).)HH2 555555555555555555555555555555555555555555555555555555555555555555555555555555 inf C Coef. >td. Err. t 4ICtC JA2K Conf. 1ntervalL 5555555555555F5555555555555555555555555555555555555555555555555555555555555555 unem C 5.332//23 ./&A3=/2 5).=B =.=0/ 5&./=B330 5.=))==H& Mcons C H.2B/02B )./B=2/ /.&A =.==/ ).HA&H &)./H2)) 5555555555555F5555555555555555555555555555555555555555555555555555555555555555 r%o C .HH0=2&) 555555555555555555555555555555555555555555555555555555555555555555555555555555 +urbin56atson statistic (original) =.B=)H== +urbin56atson statistic (transformed) &.2A/3/0 En la salida anterior, se puede observar el numero de iteraciones que reali. el algoritmo (en este caso fueron &=), la regresin transformada, $ el +6 del modelo original $ el +6 del modelo corregido. >e puede concluir, con el nuevo +6E&.2A, que $a no existe autocorrelacin, pues dic%o valor se encuentra mu$ cerca de ). 8r(ficamente se tiene! >i se quiere e#ecutar el algoritmo por las ventanas en >tata, la ruta a seguir es! >tatisticsOtime5seriesOtestsOprais5Ninsten regression utom(ticamente se despliega el siguiente recuadro, en donde se selecciona la variable dependiente $ las independientes, seleccionamos Corc%rane5'rcutt transformation, $ le damos 'P.