Vous êtes sur la page 1sur 8

Modelos ARIMAX

1. Variables Endgenas y Exgenas

Denicin. 1. Una variable Yj se dice endgena dentro del modelo causal M si su valor
es determinado o inuenciado por una o ms variables independientes Xj (excluyendo
Yj mismo).

Por ejemplo, supongamos una planta manufacturera de azcar.


La cantidad de producto (azcar) es la variable endgena y depende de otras variables,
por ejemplo: el clima, las plagas, el precio del combustible, etc.

Denicin. 2. En Econmetra, el problema de la endogeneidad se presenta cuando


una variable explicativa est correlacionada con el trmino del error

Corr(Xj , u) 6= 0

Denicin. 3. Se denomina exgena a las variables que no son afectadas por otras en
el sistema.

2. Modelos ARIMAX

Los modelos ARIMAX incorporan informacin de una o ms variables exgoneas


para explicar el comportamiento de una variable (Yt )tZ que se comporta como una serie
temporal y pueden ser vistos como un modelo de regresin lineal mltiple con uno o ms
trminos autorregresivos y uno o ms trminos media mvil.
El trmino ARIMAX proviene del Ingls: Autoregressive Integrated Moving Average
with eXogenous variables.
En Economtra los modelos ARIMAX forman parte de los denominados Modelos
Dinmicos.

Series Temporales 1
2.1 Algunos ejemplos de modelos dinmicos 2 MODELOS ARIMAX

Denicin. 4. Los sistemas dinmicos (equivalentemente modelos dinmicos) son sis-


temas cuyo estado evoluciona con el tiempo. Son tiles para modelizar el efecto que
tienen las variables explicativas sobre una variable endgena, cuando el efecto sobre esta
variable endgena no se limita a uno instantneo sino que se distribuye a lo largo del
tiempo.

2.1. Algunos ejemplos de modelos dinmicos

2.1.1. Modelo ARX(p)


Son modelos en los que existen p retardos de la variable endgena (Yt )tZ (estacionaria)
y adems k variables explicativas sin retardos. El modelo se puede expresar de la siguiente
forma:
Yt = 0 + 1 Yt1 + . . . + p Ytp + 1 X1,t + . . . + k Xk,t + ut

2.1.2. Modelo con retardos distribuidos nitos


En estos modelos, la varible (Yt ) es explicada por k variables exgenas (X1,t ), . . . , (Xk,t )
(estacionarias), cada una con r1 , . . . , rk retardos respectivamente. Por ejemplo un modelo
con una variable explicativa con dos retardos se puede expresar de la siguiente forma:

Yt = 0 + 0 Xt + 1 Xt1 + 2 Xt2 + ut

2.1.3. Modelos AD
Los modelos autoregresivos con retardos distribuidos nitos o modelos AD, combinan
los dos modelos anteriores; es decir, se tiene una variable endgena (Yt )tZ (estacionaria)
con p retardos y adems k variables explicativas con r1 , . . . , rk retardos respectivamente.
Por ejemplo, un modelo AD con p retardos de la variable endgena y una variable
exgena con r retardos puede escribirse de la siguiente forma:

p (B)Yt = 0 + r (B)Xt + ut

donde B es el operador de retardo. La expresin anterior ser estacionaria si las races


de los polinomios p (z) y r (z) se encuentran fuera del crculo unitario.

2.1.4. Modelos ARMAX


Son modelos ARMA que incorporan la informacin de una o ms variables exgenas.
Estas variables exgenas pueden ser determinsticas o pueden tambin tener la estructura
de una serie temporal.
Por ejemplo, un modelo ARMA(1,1) con una variable exgena que tiene dos retardos
se puede escribir de la siguiente forma:

Yt = 0 + 1 Yt1 + 1 ut1 + 0 Xt + 1 Xt1 + 2 Xt2 + ut

Series Temporales 2
3 CONSTRUCCIN Y VALIDACIN DE UN MODELO ARIMAX

2.1.5. Modelos ARIMAX


Son modelos ARIMA que incorporan la informacin de una o ms variables explica-
tivas. De igual forma, estas variables explicativas tambin pueden ser series temporales.

3. Construccin y validacin de un modelo ARIMAX

El enfoque ARIMAX para la modelacin de series temporales combina la regresin


lineal mltiple con la modelacin ARIMA. Esto signica que debemos vericar que se
cumplan los supuestos para la modelacin de Series Temporales y para la Regresin
Lineal Mltiple. Bsicamente son seis las suposiciones que se debe vericar:

1. Suponemos que las series son estacionarias. De no ser as, se debe aplicar un es-
quema de diferenciacin.

2. La serie de los residuos no debe exhibir correlacin serial signicativa. Si esto no


se cumple, se puede reducir esta correlacin serial aadiendo trminos AR y MA.

3. Los coecientes estimados para las variables exgenas deben ser signicativamente
diferentes de cero.
Notar que el clculo de los estadsticos t de student (pvalores) para estos coe-
cientes se basa en el supuesto de que los residuos se comportan como un ruido
blanco, por eso es importante vericar las dos primeras suposiciones.

4. No debe existir causalidad reversa (causalidad simultnea) en ninguna de variable


exgena. Es decir, las variables exgenas deben causar a la variable endgena y
no al revs. Si existen problemas de causalidad reversa con alguna de las variables
exgenas candidatas, esta debe ser removida.

5. Los signos de las variables explicativas deben ser razonables. Esto se puede exami-
nar a priori revisando los signos de los coecientes de correlacin de las variables
exgenas que muestren correlacin signicativa con la variable dependiente.

6. Las variables exgenas sobrevivientes no deben presentar un grado signicativo de


multicolinealidad.
La multicolinealidad se presenta cuando dos o ms variables explicativas son com-
binacin lineal de otras, es decir, existe una fuerte correlacin entre ellas.
La multicolinealidad puede detectarse utilizando en factor de inacin de varianza:
1
F IV (i ) =
1 Rx2 i

donde Rx2 i se obtiene al realizar la regresin lineal entre las variables explicativas
analizadas. Si el F IV es mayor a 10, entonces se puede decir que existe un alto
grado de multicolinealidad.

Series Temporales 3
4 EJEMPLO

4. Ejemplo

Vamos a estudiar el efecto de exencin personal de impuestos en la tasa de fertilidad de


los Estados Unidos. Se cuenta con observaciones anuales de la Tasa General de Fertilidad
(gfr) y el valor promedio real en dlares de la exencin personal de impuestos (pe)
desde 1913 a 1984, con un total de 71 observaciones. Adicional se ha considerado una
variable binaria (pill) que toma el valor de 1 a partir del ao 1963, cuando la pldora
anticonceptiva se puso a disposicin para controlar la natalidad.
La tasa general de fertilidad es el nmero de nios nacidos por cada 1000 mujeres en
edad reproductiva (15-44 aos). La exencin personal de impuestos es la liberacin por
disposicin legal de pagar contribuciones al Estado (impuestos). Los datos provienen del
artculo de Whittington, Alm, and Peters (1990).
Para iniciar la construccin del modelo primero se hace un anlisis exploratorio de las
variables exgenas, en este caso se tiene dos y solamente una, pe, se comporta como una
serie temporal. La variable pill es de binaria determinista.
Primero, al realizar el Test DF, se encontr que la serie temporal (pet ) posee una
raz unitaria, entonces se le aplic una diferenciacin no estacional. Luego, utilizando las
FAC y FACP se determin que los residuos de (pet ) presentaban correlacin serial, la
misma que fue reducida incluyendo un trmino media mvil de rden 4. Estos resultados
se pueden comprobar en el Cuadro (1)

Null Hypothesis: D(PE) has a unit root


Exogenous: Constant, Linear Trend
Lag Length: 0 (Automatic - based on SIC, maxlag=11)

t-Statistic Prob.*

Augmented Dickey-Fuller test statistic 6,599935 0,0000


Test critical values: 1 % level 4,094550
5 % level 3,475305
10 % level 3,165046

*MacKinnon (1996) one-sided p-values.

Cuadro 1: Test DF para (pet ) en primera diferencia.

Ahora se verica si la variable (gf rt ) tiene races unitarias. Al realizar el Test DF se
encontr que efectivamente posee races unitarias. Luego de realizar una diferenciacin
no estacional la serie (gf rt ) ya no posee races unitarias como se puede comprobar en el
Cuadro (2)
Ahora que se han aplicado los esquemas de diferenciacin adecuados para las series,
se procede a buscar un modelo de regresin estadstica y lgicamente vlido.
Luego de probar con varios modelos, se obtuvo un ARIMA con coecientes AR(1)

Series Temporales 4
4 EJEMPLO

Null Hypothesis: D(GFR) has a unit root


Exogenous: Constant, Linear Trend
Lag Length: 0 (Automatic - based on SIC, maxlag=11)

t-Statistic Prob.*

Augmented Dickey-Fuller test statistic 6,114322 0,0000


Test critical values: 1 % level 4,094550
5 % level 3,475305
10 % level 3,165046

Cuadro 2: Test DF para (gf rt ) en primera diferencia.

y AR(4) para gf rt que no presenta correlacin serial signicativa. Los resultados se


muestran en los siguientes cuadros:

Dependent Variable: D(GFR)


Method: ARMA Maximum Likelihood (OPG - BHHH)

Variable Coecient Std. Error t-Statistic Prob.

D(PE) 0,051771 0,020399 2,537862 0,0138


PILL 2,774874 2,136623 1,298719 0,1990
AR(1) 0,214587 0,091811 2,337266 0,0228
AR(4) 0,239290 0,138016 1,733787 0,0881
SIGMASQ 14,93085 2,806470 5,320154 0,0000

Cuadro 3: Estadsticas de los coecientes.

Como se puede observar en la Figura (1), el modelo es adecuado, ahora se eliminan la


variable pillt cuyo coeciente es estadsticamente igual a cero.
En el cuadro (4) se puede vericar que todos los coecientes son estadsticamente
signicativos.
Por tanto, el modelo ARIMAX obtenido se puede expresar como:

Yt = 0,27644Yt1 + 0,27068Yt4 0,04937Xt + ut

dnde
Yt = gf rt = grft gf rt1 y Xt = pet = pet pet1

Series Temporales 5
4 EJEMPLO

Figura 1: FAC y FACP para el ARIMAX

Series Temporales 6
4 EJEMPLO

Dependent Variable: D(GFR)


Method: ARMA Maximum Likelihood (OPG - BHHH)
Date: 02/16/17 Time: 16:30
Sample: 1914 1978
Included observations: 65
Convergence achieved after 15 iterations
Coecient covariance computed using outer product of gradients

Variable Coecient Std. Error t-Statistic Prob.

D(PE) 0,049375 0,019912 2,479696 0,0159


AR(1) 0,276447 0,096043 2,878362 0,0055
AR(4) 0,270683 0,134807 2,007936 0,0491
SIGMASQ 15,54449 2,987614 5,202977 0,0000

R-squared 0,196471 Mean dependent var 0,910769


Adjusted R-squared 0,156953 S.D. dependent var 4,432555
S.E. of regression 4,069864 Akaike info criterion 5,711193
Sum squared resid 1010,392 Schwarz criterion 5,845001
Log likelihood 181,6138 Hannan-Quinn criter. 5,763989
Durbin-Watson stat 2,018562

Inverted AR Roots .80 .07-.71i .07+.71i -.66

Cuadro 4: Estadsticas de los coecientes.

Series Temporales 7
Referencias Referencias

Referencias

[1] ANDREWS B, DEAN M, SWAIN R, COLE C, Building ARIMA and ARIMAX


Models for Predicting Long-Term Disability Benet Application Rates in the Pu-
blic/Private Sectors, University of Southern Maine, Society of Actuaries, 2013.
http://www.afriheritage.org/TTT/4%20Building%20ARIMA%20and%20ARIMAX%
20Model.pdf
[2] Kongcharoen C, Kruangpradit T. Autoregressive Integrated Moving Average with
Explanatory Variable (ARIMAX) Model for Thailand Export ,
https://forecasters.org/wp-content/uploads/gravity_forms/
7-2a51b93047891f1ec3608bdbd77ca58d/2013/07/Kongcharoen_Chaleampong_
ISF2013.pdf
[3] Wooldridge Jerey, Introductory Econometrics: A Modern Approach, Quinta Edi-
cin, South-Western, USA, 2013
INTERNET
http://www.statisticshowto.com/endogenous-variable/
https://en.wikipedia.org/wiki/Endogeneity_(econometrics)
https://en.wikipedia.org/wiki/Autoregressive%E2%80%93moving-average_
model#Autoregressive.E2.80.93moving-average_model_with_exogenous_
inputs_model_.28ARMAX_model.29
http://www.eviews.com/help/helpintro.html#page/content/
series-Automatic_ARIMA_Forecasting.html

Series Temporales 8

Vous aimerez peut-être aussi