Académique Documents
Professionnel Documents
Culture Documents
Modelos ARIMA
Los modelos ARIMA o modelos de promedio mvil autorregresivo integrado son un tipo general de los modelos de Box-Jenkins para series de tiempo estacionarias.
Recuerde que una serie histrica estacionaria es aquella cuyo valor promedio no cambia a travs del tiempo.
Modelos ARIMA
Este grupo incluye a:
los modelos AR slo con trminos autorregresivos, los modelos MA slo con trminos de promedio mvil y los modelos ARIMA que comprenden tanto trminos autorregresivos como de promedio mvil.
Modelos ARIMA
Para efectuar la seleccin del modelo apropiado:
Se compara la distribucin de los coeficientes de autocorrelacin de la serie histrica que se est ajustando, con las distribuciones tericas para los distintos modelos.
Modelos AR
Los modelos autorregresivos se presentaron cuando se toc el tema de las series de tiempo. Sin embargo, las ecuaciones que se plantearn ahora difieren en varias formas importantes.
Antes los coeficientes de regresin se estimaban mediante el mtodo lineal de mnimos cuadrados. Ahora los coeficientes de regresin se encuentran por medio de un mtodo de mnimos cuadrados no lineal.
Modelos AR
Por lo regular el mtodo de mnimos cuadrados no lineal utiliza una tcnica de solucin iterativa para calcular los parmetros en vez de usar un clculo directo.
Se emplean estimaciones preliminares como puntos iniciales. Luego estas estimaciones se mejoran sistemticamente hasta encontrar valores ptimos.
Modelos AR
Adems, ahora las varianzas para las ecuaciones se calculan de una forma distinta,
que toma el hecho de que las variables independientes estn relacionadas entre s. Por ltimo, ahora las ecuaciones pudieran o no contener un trmino constante.
Modelos AR
La modelizacin ARIMA o Box-Jenkins parte de considerar que el valor observado de una serie (un dato de una variable econmica) en un momento determinado de tiempo t es una realizacin de una variable aleatoria yt definida en dicho momento de tiempo.
Por tanto, una serie de t datos es una muestra de un vector de t variables aleatorias ordenadas en el tiempo al que denominamos proceso estocstico.
Modelos AR
En ocasiones pretendemos predecir el comportamiento de una variable y en un momento futuro t, a partir del comportamiento que la variable tuvo en un momento pasado, por ejemplo, en el perodo anterior, yt-1.
Formalmente notaramos que yt = f(yt-1) es decir, que el valor de la variable y en el momento t es funcin del valor tomado en el perodo t-1.
Modelos AR
Puesto que en el comportamiento de una variable influyen ms aspectos, debemos incluir en la relacin anterior un trmino de error, et.
Este et es una variable aleatoria a la que suponemos ciertas caractersticas estadsticas apropiadas.
Modelos AR
Ahora debemos elegir una forma funcional concreta para esta expresin.
Por ejemplo, una forma lineal como donde 0 es un trmino independiente y 1 es un parmetro que multiplica al valor de la variable y en el perodo t-1.
yt = 0 + 1yt-1 + et
Modelos AR
Utilizando mtodos estadsticos adecuados podemos estimar los parmetros 0 y 1 de forma que estos cumplan propiedades estadsticas razonables y sean una buena (la mejor posible) estimacin.
Con ello obtendramos una expresin que utilizaramos a efectos de prediccin.
Modelos AR
Esta es la esencia de los modelos autorregresivos (o modelos AR). Se realiza una regresin de la variable yt sobre s misma (autorregresin).
Es decir, se realiza una regresin sobre los valores que la variable tom en el perodo o periodos anteriores.
Modelos AR
Un aspecto importante es el orden del modelo AR.
Por ejemplo, el modelo
yt = 0 + 1yt-1 + et
es de orden 1, y se denota como AR(1).
Si se toma en el modelo como explicativas los valores de la variable y en los 2 perodos anteriores, es decir: yt = 0 + 1yt-1 + 2yt-2 + et
entonces se ha especificado un AR(2).
Modelos AR
De igual forma un AR(3) vendra dado por yt = 0 + 1yt-1 + 2yt-2 + 3yt-3 +et En general, un AR(p) viene dado por yt = 0 + 1yt-1 + 2yt-2 + + pyt-p +et
Es frecuente encontrarnos con Modelos AR con un bajo orden (1 o 2). En series con componente estacional es habitual que el desfase sea coincidente con la periodicidad de los datos.
En ese caso hablamos de modelos SAR.
Modelos AR en Gretl
Suponga que se tiene la siguiente serie de datos: 25, 28, 36, 34, 29, 20, 17, 21, 19, 28, 32, 25 Y que se desea emplear un modelo AR(1) para efectuar un pronstico de la serie.
Modelos AR en Gretl
Primero se introduce la serie de datos. Es til observar la grfica de los datos.
Men: Variable Time series plot
36
34
32
30
28
Yt
26
24
22
20
18
Modelos AR en Gretl
ARMA estimates using the 12 observations 1950:1-1952:4 Estimated using Kalman filter (exact ML) Dependent variable: Yt VARIABLE VALUE const phi_1 COEFFICIENT 25,9867 0,522529 STDERROR T STAT P-
2,69424 0,225317
Modelos AR en Gretl
Para efectuar pronsticos:
En la ventana del resultado del modelo:
Men: Analysis Forecast Seleccionar periodos del pronstico
Modelos AR en Gretl
For 95% confidence intervals, z(.025) = 1,96 Obs interval Yt prediction std. error 95% confidence
4,839
15,99 -
34,96
36
34
32
30
28
26
24
22
20
18
16
Modelos SAR
Cuando se modela una serie con estacionalidad,
por ejemplo, la tasa de variacin mensual de inflacin, con 12 datos al ao,
la comparacin adecuada no solo debe ser, por ejemplo, de la inflacin de junio de 2004 con mayo y abril de 2004, sino con el mismo mes (junio) de los aos anteriores, en nuestro ejemplo 2003 y 2002.
Modelos SAR
La formulacin sera la siguiente:
Un modelo SAR(1), tambin denotado como ARs(1) viene dado por:
yt = 0 + 1yt-s + et
donde s=4, si la serie a modelar es de frecuencia trimestral, o s=12, si la serie es mensual.
yt = 0 + 1yt-s + 2yt-2s + et
Modelos MA
Una alternativa de modelizacin pasa por tratar de explicar el comportamiento de una variable y, no en funcin de los valores que tom en el pasado (modelos AR)
sino a travs de los errores al estimar el valor de la variable en los perodos anteriores.
Modelos MA
Por ejemplo, un modelo MA(1) viene dado por la expresin yt = + et + 1et-1
donde es el valor constante alrededor del cual se mueve la variable, y ha de ser estimado igualmente con los coeficientes .
Modelos MA en Gretl
Se introducen los datos.
Men: Model Time series ARIMA MA order: 1
Modelos MA en Gretl
ARMA estimates using the 12 observations 1950:1-1952:4 Estimated using Kalman filter (exact ML) Dependent variable: Yt VARIABLE VALUE const theta_1 COEFFICIENT 26,1191 1,00000 STDERROR T STAT P-
Modelos MA
En general un modelo MA(q) viene dado por la expresin: yt = + et + 1et-1 + + qet-q
Al igual que ocurra con los modelos AR, en series con componente estacional es frecuente que el retardo coincida con la periodicidad de los datos.
Modelos SMA
En series con componente estacional (periodicidad inferior a la anual) es frecuente que en los modelos MA los retardos se establezcan no con los perodos inmediatamente anteriores,
sino que sean coincidentes con la periodicidad de los datos.
Modelos SMA
As, un modelo SMA(1),o MAs(1) vendra dado por: yt = + et + 1et-s
donde s=4, si la serie a modelar es de frecuencia trimestral, o s=12, si la serie es mensual.
Modelos ARMA
Entre los modelos AR y los Modelos MA existe una relacin que, bajo ciertas condiciones, es til conocer. Los modelos ARMA integran a los modelos AR y a los modelos MA en una nica expresin.
Por tanto, la variable y queda explicada en funcin de los valores tomados por la variable en perodos anteriores y los errores cometidos en la estimacin.
Modelos ARMA
Una expresin general de un modelo ARMA (p, q) viene dada por
yt = + 1yt-1 + + pyt-p + et + 1et-1 + + qet-q que, es la unin de un modelo AR(p) y un modelo MA(q). Obviamente, los modelos AR(p) se corresponden con modelo ARMA(p,0), mientras que los modelos MA(q) se corresponden con ARMA(0,q).
Modelos ARIMA
Para la obtencin de estimaciones con propiedades estadsticas adecuadas de los parmetros de un modelo ARMA, es necesario que la serie muestral que utilizamos para la estimacin sea estacionaria en media y varianza. En un sentido laxo del trmino diramos que precisamos que la serie:
no tenga tendencia, y que presente un grado de dispersin similar en cualquier momento de tiempo.
Modelos ARIMA
A efectos prcticos, el cumplimiento de esta propiedad pasa por tomar logaritmos y diferenciar adecuadamente la serie original objeto de estudio. Con la serie ya tratada para convertirla en estacionaria ya es posible estimar un Modelo ARMA.
Modelos ARIMA
Un Modelo Autorregresivo-Integrado de Medias Mviles de orden p, d, q
abreviadamente ARIMA(p,d,q),
Modelos ARIMA
Por lo tanto, la expresin general de un modelo ARIMA(p,d,q) viene dada por
dyt = 1dyt-1 + + pdyt-p + et + 1et-1 + + qet-q donde dyt , expresa que sobre la serie original yt, se han aplicado d diferencias.
Modelos ARIMA
Por lo tanto, sobre una serie integrada de orden 2, necesitara una doble diferenciacin, lo cual se expresa como:
2yt = (yt) = (yt - yt-1) - (yt-1 - yt-2) Observe que en la expresin del ARIMA(p.d.q) desaparece el trmino independiente, justamente por la aplicacin de las diferencias sucesivas.
Modelos ARIMA
Cuando la estimacin del modelo ARMA se haya realizado con una serie diferenciada, a efectos de prediccin, es necesario recalcularla integrando nuevamente la serie.
Por ejemplo, si mediante un modelo ARMA (1,1) se obtuviera unos valores de prediccin yt, se obtendr la prediccin final mediante:
yt = yt-1 + yt
Modelos ARIMA
En la estimacin de los modelos ARIMA el problema principal parte de identificar el modelo que mejor describe el fenmeno (la serie econmica) a predecir Esto es, la clave de una buena prediccin pasa por determinar el ms adecuado de los rdenes del autorregresivo, de la media mvil, y el orden de integrabilidad.
Modelos ARIMA
Para la determinacin del orden de integrabilidad,
esto es, para determinar el nmero de veces que ser necesario diferenciar la serie para hacerla estacionaria en media, existen dos procedimientos fundamentales de deteccin del nmero de races unitarias,
aparte de la simple representacin grfica, que no es ms que un mtodo intuitivo.
Modelos ARIMA
Estos mtodos para determinar el orden de integrabilidad son:
Test Dickey-Fuller o Test Dickey-Fuller Aumentado (abreviadamente DF o ADF respectivamente) y el Test de Phillips-Perron (Test PP).
Modelos ARIMA
Para la obtencin del orden (p,q) se realiza una comparacin entre:
1. las caractersticas que dos importantes funciones estadsticas presentan para los distintos modelos ARIMA tericos y 2. las caractersticas que tales funciones, presentan en la serie objeto de estudio pero a nivel muestral.
Modelos ARIMA
Tales funciones estadsticas son:
la funcin de autocorrelacin (fac), y la funcin de autocorrelacin parcial (facp).
Estas son los dos instrumentos bsicos en la fase de identificacin del ARIMA, al permitirnos inferir el verdadero mecanismo subyacente que han generado los datos.
Modelos ARIMA
La fac y la facp estimadas para nuestra serie siempre se alejarn de cualquiera de las funciones de los modelos tericos.
La clave est en la mayor aproximacin de nuestra serie a uno u otro modelo.
Una vez identificado el modelo que subyace a nuestra serie, ya es posible la estimacin de los parmetros del modelo.
Autocorrelaciones parciales
Al principio, el analista pudiera no darse cuenta del orden apropiado del proceso autorregresivo para ajustarlo a una serie histrica.
A este mismo tipo de problema se enfrent al decidir el nmero de variables independientes a incluir en un modelo de regresin mltiple.
Autocorrelaciones parciales
Las autocorrelaciones parciales se emplean para ayudar a identificar el grado de relacin entre los valores reales de una variable y valores anteriores de la misma.
Esto mientras que se mantienen constantes los efectos de las otras variables (perodos retrasados).
Distribuciones tericas de los coeficientes de autocorrelacin y autocorrelacin parcial para algunos de los modelos ARIMA ms comunes
Las figuras siguientes muestran las ecuaciones de un modelo AR(1), AR(2), MA(1), MA(2) y ARIMA(1,1). Se ilustra el comportamiento de las funciones tericas de autocorrelacin y autocorrelacin parcial para estos modelos.
Distribuciones tericas de los coeficientes de autocorrelacin y autocorrelacin parcial para algunos de los modelos ARIMA ms comunes
AR(1): yt = 0 + 1yt-1 + et 1 1
-1
-1
Autocorrelacin
Autocorrelacin parcial
Distribuciones tericas de los coeficientes de autocorrelacin y autocorrelacin parcial para algunos de los modelos ARIMA ms comunes
AR(1): yt = 0 + 1yt-1 + et 1 1
-1
-1
Autocorrelacin
Autocorrelacin parcial
Distribuciones tericas de los coeficientes de autocorrelacin y autocorrelacin parcial para algunos de los modelos ARIMA ms comunes
AR(2): yt = 0 + 1yt-1 + 2yt-2 + et 1 1
-1
-1
Autocorrelacin
Autocorrelacin parcial
Distribuciones tericas de los coeficientes de autocorrelacin y autocorrelacin parcial para algunos de los modelos ARIMA ms comunes
AR(2): yt = 0 + 1yt-1 + 2yt-2 + et 1 1
-1
-1
Autocorrelacin
Autocorrelacin parcial
Distribuciones tericas de los coeficientes de autocorrelacin y autocorrelacin parcial para algunos de los modelos ARIMA ms comunes
MA(1): yt = W0 + et - W1et-1 1 1
-1 Autocorrelacin
-1 Autocorrelacin parcial
Distribuciones tericas de los coeficientes de autocorrelacin y autocorrelacin parcial para algunos de los modelos ARIMA ms comunes
MA(1): yt = W0 + et - W1et-1 1 1
-1 Autocorrelacin
-1 Autocorrelacin parcial
Distribuciones tericas de los coeficientes de autocorrelacin y autocorrelacin parcial para algunos de los modelos ARIMA ms comunes
MA(2): yt = W0 + et - W1et-1 W2et-2 1 1
-1 Autocorrelacin
-1 Autocorrelacin parcial
Distribuciones tericas de los coeficientes de autocorrelacin y autocorrelacin parcial para algunos de los modelos ARIMA ms comunes
MA(2): yt = W0 + et - W1et-1 W2et-2 1 1
-1 Autocorrelacin
-1 Autocorrelacin parcial
Distribuciones tericas de los coeficientes de autocorrelacin y autocorrelacin parcial para algunos de los modelos ARIMA ms comunes
ARIMA(1,1): yt = 0 + 1yt-1 + et - W1et-1 1 1
-1
-1
Autocorrelacin
Autocorrelacin parcial
Distribuciones tericas de los coeficientes de autocorrelacin y autocorrelacin parcial para algunos de los modelos ARIMA ms comunes
ARIMA(1,1): yt = 0 + 1yt-1 + et - W1et-1 1 1
-1
-1
Autocorrelacin
Autocorrelacin parcial
Distribuciones tericas de los coeficientes de autocorrelacin y autocorrelacin parcial para algunos de los modelos ARIMA ms comunes
ARIMA(1,1): yt = 0 + 1yt-1 + et - W1et-1 1 1
-1
-1
Autocorrelacin
Autocorrelacin parcial
Distribuciones tericas de los coeficientes de autocorrelacin y autocorrelacin parcial para algunos de los modelos ARIMA ms comunes
ARIMA(1,1): yt = 0 + 1yt-1 + et - W1et-1 1 1
-1
-1
Autocorrelacin
Autocorrelacin parcial
Distribuciones tericas de los coeficientes de autocorrelacin y autocorrelacin parcial para algunos de los modelos ARIMA ms comunes
FAC MA(q) Se anula para retardos superiores a q Decrecimiento rpido sin llegar a anularse
FAP Decrecimiento rpido sin llegar a anularse Se anula para retardos superiores a p
AR(p)
Decrecimiento ARMA(p,q) Decrecimiento rpido sin llegar a rpido sin llegar a anularse anularse
Distribuciones tericas de los coeficientes de autocorrelacin y autocorrelacin parcial para algunos de los modelos ARIMA ms comunes
Al seleccionar un modelo, recuerde que las distribuciones que se muestran son tericas y que es muy improbable que las autocorrelaciones de datos reales sean exactamente idnticas a cualquiera de las distribuciones tericas.
Se debe, mediante prueba y error, poder ubicar en forma adecuada.
1 0,5597 * 0,5597 * 4,7850 [0,029] 2 0,0015 -0,4541 4,7851 [0,091] 3 -0,3550 -0,1871 7,1370 [0,068] 4 -0,5475 * -0,3489 13,4311 [0,009] 5 -0,3335 0,1742 16,1010 [0,007] 6 -0,0761 16,2631 [0,012] 7 0,1301 16,8320 [0,019] 8 0,1463 17,7312 [0,023] 9 -0,0071 17,7341 [0,038] 10 -0,0218 17,7741 [0,059] 11 0,0033 17,7760 [0,087]
ACF for Yt 1 0.5 0 -0.5 -1 0 2 4 6 lag PACF for Yt 1 0.5 0 -0.5 -1 0 1 2 3 lag 4 5 6 +- 1,96/T^0,5 8 10 12 +- 1,96/T^0,5
-1
-1
Autocorrelacin
Autocorrelacin parcial
2,30529 11,326 <0,00001 *** 0,285451 0,325 0,74551 0,297745 3,359 0,00078 ***
Ejercicio
La tabla muestra los 55 promedios de cierre diario de un ndice burstil. Analice el comportamiento de los datos a travs de la metodologa expuesta en esta presentacin.
PCierre
PCierre
PCierre
PCierre
1
2 3 4 5 6 7 8 9 10 11
222,34
222,24 221,17 218,88 220,05 219,61 216,4 217,33 219,69 219,32 218,25
15
16 17 18 19 20 21 22 23 24 25
223,07
225,36 227,6 226,82 229,69 229,3 228,96 229,99 233,05 235 236,17
29
30 31 32 33 34 35 36 37 38 39
246,74
248,73 248,83 248,78 249,61 249,9 246,45 247,57 247,76 247,81 250,68
43
44 45 46 47 48 49 50 51 52 53
249,8
251,7 253,4 252 248,8 247,8 249,3 248 251,4 254,7 258,6
12
13 14
220,3
222,54 223,56
26
27 28
238,31
241,14 241,48
40
41 42
251,8
251,07 248,05
54
55
259,3
261,5
Solucin
El anlisis puede iniciar observando el comportamiento de la serie a travs de una grfica. En Gretl:
Abrir datos. Seleccionar PCierre Variable Time series plot
265
260
255
250
245
240
235
230
225
220
215 0 10 20 30 40 50
Solucin
La grfica parece mostrar una cierta tendencia en los datos. El primer paso para identificar un modelo tentativo es observar los coeficientes de autocorrelacin de los datos. En Gretl:
Seleccionar PCierre Variable Correlogram Maximum lag: 24
Autocorrelation function for PCierre LAG 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 ACF PACF Q-stat. [p-value] 52,4554 [0,000] 100,3587 [0,000] 143,6242 [0,000] 182,5157 [0,000] 217,5930 [0,000] 249,6182 [0,000] 277,9149 [0,000] 302,6734 [0,000] 324,1034 [0,000] 341,8805 [0,000] 355,7054 [0,000] 366,2879 [0,000] 374,2958 [0,000] 380,1772 [0,000] 383,8016 [0,000] 385,6470 [0,000] 386,3626 [0,000] 386,4900 [0,000] 386,4959 [0,000] 386,7486 [0,000] 387,6090 [0,000] 389,6631 [0,000] 393,3107 [0,000] 398,8153 [0,000]
0,9505 *** 0,9505 *** 0,8999 *** -0,0376 0,8471 *** -0,0488 0,7954 *** -0,0171 0,7480 *** 0,0159 0,7075 *** 0,0441 0,6582 *** -0,1194 0,6092 *** -0,0269 0,5608 *** -0,0178 0,5051 *** -0,1020 0,4405 *** -0,1350 0,3810 *** 0,0028 0,3275 ** 0,0346 0,2773 ** -0,0178 0,2150 -0,1968 0,1515 -0,0612 0,0931 0,0459 0,0388 -0,0096 -0,0083 -0,0025 -0,0531 -0,0389 -0,0966 0,0037 -0,1470 -0,1314 -0,1930 -0,0355 -0,2333 * 0,0417
ACF for PCierre 1 0.5 0 -0.5 -1 0 5 10 lag PACF for PCierre 1 0.5 0 -0.5 -1 0 5 10 lag 15 20 25 +- 1,96/T^0,5 15 20 25 +- 1,96/T^0,5
Solucin
Al observarse que las primeras 12 autocorrelaciones parecen descender a cero, entonces podra decirse que la apreciacin inicial de que existe tendencia era correcta. Para resolver este problema puede diferenciarse la serie.
Solucin
En Gretl:
Seleccionar PCierre Add First differences of selected variables
Despus graficar:
Seleccionar PCierre Variable Time series plot
Analizar autocorrelograma:
Seleccionar PCierre Variable Correlogram Maximum lag: 24
-1
-2
-3
-4 0 10 20 30 40 50
Autocorrelation function for d_PCierre LAG ACF PACF Q-stat. [p-value] 1,9594 [0,162] 2,0707 [0,355] 2,5801 [0,461] 3,6955 [0,449] 4,4408 [0,488] 5,0036 [0,543] 5,7846 [0,565] 6,2898 [0,615] 8,8690 [0,449] 9,1961 [0,514] 9,3214 [0,592] 9,4633 [0,663] 9,4698 [0,737] 10,1493 [0,751] 10,1961 [0,807] 10,7810 [0,823] 11,0359 [0,855] 17,0604 [0,519] 22,3434 [0,268] 23,0019 [0,289] 23,8475 [0,301] 24,4252 [0,325] 26,6587 [0,271] 27,0283 [0,303]
1 0,1853 0,1853 2 -0,0437 -0,0809 3 0,0927 0,1214 4 0,1358 0,0944 5 -0,1099 -0,1506 6 -0,0945 -0,0382 7 0,1102 0,1081 8 -0,0877 -0,1477 9 -0,1959 -0,1045 10 0,0690 0,1251 11 -0,0422 -0,1495 12 -0,0444 0,0797 13 -0,0093 0,0095 14 0,0948 0,0064 15 0,0246 0,0538 16 -0,0857 -0,0823 17 -0,0558 -0,1180 18 -0,2678 ** -0,2786 ** 19 -0,2473 * -0,1496 20 -0,0860 -0,0536 21 -0,0961 -0,0718 22 -0,0782 0,0047 23 -0,1513 -0,1472 24 0,0606 0,0616
ACF for d_PCierre 1 0.5 0 -0.5 -1 0 5 10 lag PACF for d_PCierre 1 0.5 0 -0.5 -1 0 5 10 lag 15 20 25 +- 1,96/T^0,5 15 20 25 +- 1,96/T^0,5
Solucin
La grfica de las autocorrelaciones de los datos diferenciados muestra que los datos son estacionarios. En consecuencia se puede aplicar la metodologa Box Jenkins para modelar los datos.
Solucin
ARIMA estimates using the 11 observations 1950:2-1952:4 Estimated using Kalman filter (exact ML) Dependent variable: (1-L) Yt VARIABLE VALUE const phi_1 theta_1 COEFFICIENT 8,31905 -0,387307 1,00000 STDERROR T STAT P-