Académique Documents
Professionnel Documents
Culture Documents
Estimac
ao
No captulo anterior foram estudados modelos probabilsticos que podem ser uti-
lizados para descrever dados de series temporais. Neste captulo sera discutido o
problema de ajustar um modelo aos dados observados. A inferencia sera baseada
na funcao de autocorrelacao.
Para um processo estacionario {Xt } (t = 1, . . . , n), a funcao de densidade de
probabilidade conjunta de X1 , . . . , Xn pode ser sempre fatorada como
Y
n
p(x1 , . . . , xn |) = p(x1 , . . . , xp |) p(xt |xt1 , . . . , x1 , )
t=p+1
Yn
= p(x1 , . . . , xp |) p(xt |xt1 , . . . , xp , ). (4.1)
t=p+1
39
40 CAPITULO 4. ESTIMAC
AO
p(x|)p()
p(|x) = p(x|)p().
p(x)
4.1 Autocovari
ancia e autocorrela
cao
O coeficiente de autocovariancia amostral de ordem k foi definido na Secao 2.4
como
X
nk
ck = (xt x)(xt+k x)/n
t=1
Interpretando o correlograma
No Captulo 2 foram vistos alguns exemplos de correlogramas associados a ca-
ractersticas de series temporais observadas. O correlograma e u til tambem na
identificacao do tipo de modelo ARIMA que fornece a melhor representacao de
uma serie observada. Um correlograma como o da Figura 2.7 por exemplo, aonde
os valores de rk decaem para zero de forma relativamente lenta, indica nao esta-
cionariedade e a serie precisa ser diferenciada. Para series estacionarias o corre-
lograma e comparado com as autocorrelacoes teoricas de varios processos ARMA
para auxiliar na identificacao daquele mais apropriado. Por exemplo, se r1 e sig-
nificativamente diferente de zero e todos os valores subsequentes r2 , r3 , . . . sao
proximos de zero entao um modelo MA(1) e indicado ja que sua funcao de au-
tocorrelcao teorica se comporta assim. Por outro lado, se r1 , r2 , r3 , . . . parecem
estar decaindo exponencialmente entao um modelo AR(1) pode ser apropriado.
4.2. AJUSTANDO PROCESSOS AUTOREGRESSIVOS 41
Xt = 1 (Xt1 ) + + p (Xtp ) + t ,
X
n
S= [(xt ) 1 (xt1 ) p (xtp )]2
t=p+1
Xt x = 1 (Xt1 x) + + p (Xtp x) + t ,
r1 = 1 + 2 r1 + + p rp1
r2 = 1 r1 + 2 + + p rp2
..
.
rp = 1 rp1 + 2 rp2 + + p
ou equivalentemente,
r1 1 r1 ... rp1 1
r2 r1 1 ... rp2 2
.. = .. .. .. ..
. . . . .
rp rp1 rp2 . . . 1 p
0.0
ACF
0
x
0.2
2
0.4
0.6
4
0 50 100 200 5 10 15 20
Time Lag
y = X + , (4.2)
1 X 2
n
2 = e.
n p t=p+1 t
log(L(, 2 )) 2 (y X)0 (y X)
=
2
2 (20 X 0 y + 0 X 0 X)
=
2
2
= (2X 0 y + 2X 0 X).
2
44 CAPITULO 4. ESTIMAC
AO
log(L(, 2 ))
= 0 = (X 0 X)1 X 0 y.
=
0
P
Lembrando que (y X )
(y X ) = nt=p+1 e2t segue que
" #
2 ))
log(L(, 1 Xn
= (n p) log(2 ) + 2 e2t
2 2 2 t=p+1
" #
1 Xn
= (n p)2 4 e2t
2 t=p+1
2 )) 1 X 2
n
log(L(,
2 2 = 0 = n p
2 et .
2 = t=p+1
Exemplo 4.2 : Para um modelo AR(1) com erros normais a matriz X tem
somente uma coluna e nao e difcil verificar que
X
n X
n
0 0
XX= x2t1 e Xy= xt xt1 .
t=2 t=2
Exemplo 4.3 : Novamente para o modelo AR(1) com erros normais o EMV
incondicional e obtido maximizando-se da funcao de verossimilhanca exata. A
expressao (4.1) com p = 1 fica
Y
n
p(x1 , . . . , xn |, 2 ) = p(x1 |, 2 ) p(xt |xt1 , , 2 ).
t=2
Maximizar esta expressao (ou seu logaritmo) em relacao a requer algum algo-
ritmo de otimizacao numerica (por exemplo metodos de Newton-Raphson).
Exemplo 4.4 : Foram gerados 200 valores de um processo AR(1) com parametros
= 0.8 e 2 = 1.
0.8
4
0.6
2
0.4
0
ACF
x
0.2
2
0.0
4
0 50 100 200 5 10 15 20
Time Lag
Para representar a informacao a priori sobre pode-se fazer por exemplo, p() =
p(|2 )p(2 ) com |2 N (0, 2 I p ) ou p() = p()p(2 ) com N (0, I p ).
Nos dois casos comumente assume-se que 2 tem distribuicao Gama Inversa, i.e.
2 Gama Inversa(a, b) ou equivalentemente 2 Gama(a, b).
Exemplo 4.5 : No modelo AR(1) com erros normais vamos atribuir as seguintes
distribuicoes a priori, N (0, 1) e 2 Gama Inversa(1, 1). Portanto,
p() exp
2
2 2 1
p( ) ( ) exp 2
2
1
p(, |x) exp
2 2 2
( ) exp 2 (1 2 )1/2 (2 )n/2
2
( !)
1 X n
exp 2 (1 2 )x21 + (xt xt1 )2
2 t=2
Xt = + t + 1 t1 + + q tq
4.3. AJUSTANDO PROCESSOS MEDIAS
MOVEIS 47
et = xt 1 t1 q tq
e1 = x1
e2 = x2 1 e1 = x2 1 x1 + 1
e3 = x3 1 e2 2 e1
..
.
Y
n
1 2
L(, , 2 ) = (22 )1/2
exp 2 et
2
t=1
( )
1 Xn
(2 )n/2 exp 2 e2t .
2 t=1
(1 B)2 Xt = (1 B)t .
Call:
arima(x = x, order = c(1, 0, 1), include.mean = F)
Coefficients:
ar1 ma1
0.2087 -0.3410
s.e. 0.4881 0.4641
Note como as estimativas dos coeficientes estao muito diferentes dos valores ver-
4.5. MODELOS SAZONAIS 49
e tera variabilidade menor do que a primeira diferenca nao sazonal Oxt = xt xt1 ,
sendo portanto mais facil de identificar e estimar.
Em geral, uma diferenca sazonal e denotada por Os onde s e o perodo sazonal.
A D-esima diferenca sazonal e entao denotada por OD s . Combinando-se os dois
tipos de diferenciacao obtem-se o operador O Os . Por exemplo, tomando-se 1
d D
Box & Jenkins (1970) generalizaram o modelo ARIMA para lidar com sazon-
alidade e definiram um modelo ARIMA sazonal multiplicativo, denominado
SARIMA, dado por
(B)(B s )Wt = (B)(B s )t (4.3)
onde
(B) = (1 1 B p B p )
(B s ) = (1 s B s P B P s )
Wt = O d O D
s Xt
(B) = (1 + 1 B + + q B q )
(B s ) = (1 + s B s + + Q B Qs ).
(B s ) = (1 s B s )
4.6 Adequac
ao do Modelo
Todos os modelos sao errados mas alguns sao u
teis (George Box)
4.6.1 An
alise dos Resduos
Apos um modelo ter sido ajustado a uma serie temporal deve-se verificar se ele
fornece uma descricao adequada dos dados. Assim como em outros modelos
estatsticos a ideia e verificar o comportamento dos resduos onde
Para os modelos vistos aqui o valor ajustado e a previsao 1 passo a frente de modo
que o resduo fica definido como o erro de previsao 1 passo a frente. Por exemplo,
em um modelo AR(1) se e a estimativa do coeficiente autoregressivo entao o
valor ajustado no tempo t e xt1 e o resduo correspondente e et = xt
xt1 .
Se o modelo tiver um bom ajuste espera-se que os resduos se distribuam
aleatoriamente em torno de zero com variancia aproximadamente constante e se-
jam nao correlacionados. Se a variancia dos resduos for crescente uma transfor-
macao logartmica nos dados pode ser apropriada. O fenomeno de nao constan-
cia na variancia e denominado de volatilidade na literatura de series temporais
e pode ser tratado atraves de transformacoes nos dados (e.g. transformacoes de
Box-Cox)1 .
Alem disso, em modelos de series temporais os resduos estao ordenados no
tempo e e portanto natural trata-los tambem como uma serie temporal. E partic-
ularmente importante que os resduos de um modelo estimado sejam serialmente
(i.e. ao longo do tempo) nao correlacionados. Evidencia de correlacao serial nos
resduos e uma indicacao de que uma ou mais caractersticas da serie nao foi
adequadamente descrita pelo modelo.
Consequentemente, duas maneiras obvias de verificar a adequacao do modelo
consistem em representar graficamente os resduos e o seu correlograma. O grafico
temporal podera revelar a presenca de dados discrepantes, efeitos de autocorre-
lacao ou padroes cclicos enquanto que o correlograma permite uma analise mais
detalhada da estrutura de autocorrelacao indicando possveis termos faltantes no
modelo.
Ou seja, assim como em outros modelos estatsticos, a ideia e que os resduos
poderao identificar caractersticas que nao foram adequadamente modeladas. Por
exemplo, autocorrelacoes residuais significativas nas defasagens 1 ou 2, ou em
defasagens sazonais (e.g. 12 para dados mensais) sao uma indicacao de que mais
termos medias moveis devem ser incluidos no modelo. Por outro lado, um valor
de rk ligeiramente fora dos limites de confianca em defasagens sem significado
obvio (e.g. k=5) nao e indicacao suficiente para se rejeitar o modelo. O mesmo
comentario vale para as autocorrelacoes parciais dos resduos no que diz respeito
`a inclusao de termos autoregressivos (sazonais e nao sazonais).
1
Uma tendencia mais recente no entanto consiste em tentar modelar simultaneamente a
media e a vari
ancia ao inves de usar transformacoes.
52 CAPITULO 4. ESTIMAC
AO
H0 : (1) = = (m) = 0
H1 : (k) 6= 0, para algum k {1, . . . , m}.
X
m
Q=n rk2 .
k=1
Na pratica o n
umero m de autocorrelacoes amostrais e tipicamente escolhido
entre 15 e 30. Se o modelo ajustado for apropriado entao Q tera distribuicao
aproximadamente qui-quadrado com mpq graus de liberdade. Assim, valores
grandes de Q fornecem indicacao contra a hipotese de que as autocorrelacoes sao
todas nulas, em favor da hipotese de que ao menos uma delas e diferente de zero.
O teste de Box-Pierce nao tem bom desempenho em amostras pequenas ou
moderadas no sentido de que a distribuicao se afasta da qui-quadrado. Varios
testes alternativos foram sugeridos na literatura e o mais conhecido e o teste de
Ljung-Box, aonde a estatstica de teste e dada por
X
m
rk2
Q = n(n + 2) .
k=1
nk
No de passageiros
0.4 0.8
6.0
FAC
5.0
0.2
1950 1954 1958 0 5 10 15 20 25 30 35
Anos defasagem
1.0
Variacao mensal
0.2
0.4
FAC
0.0
0.2
0.2
Anos defasagem
1.0
Variacao anual
0.2
FAC
0.4
0.0
0.2
Anos defasagem
Figura 4.3
1X
n
mj = (Xt X)j
n t=1
54 CAPITULO 4. ESTIMAC
AO
0.15
0.00
0.15
Anos
0.8
ACF
0.2
0.4
0 5 10 15 20 25 30 35
Lag
Figura 4.4: Grafico da serie com 1 diferenca simples e 1 sazonal mais o correlo-
grama da serie diferenciada.
Standardized Residuals
3
1
3 1
Time
ACF of Residuals
0.4 0.8
ACF
0.2
Lag
0.4
0.0
2 4 6 8 10
lag
Histogram of z
12
Density
8
4
0
Normal QQ Plot
Sample Quantiles
0.05
Teste de ShapiroWilk
pvalor= 0.1674
0.10
2 1 0 1 2
Theoretical Quantiles
Figura 4.6: Histograma com curva normal superposta e normal plot dos residuos
no Exemplo 4.7.
4.6. ADEQUAC DO MODELO
AO 57
Exerccios
1. A partir de 100 observacoes do processo Xt = 1 Xt1 + 2 Xt2 + t foram
calculadas as seguintes autocorrelacoes amostrais r1 = 0.8, r2 = 0.5 e r3 =
0.4. Obtenha estimativas para 1 e 2 .
3. Faca um esboco do correlograma para uma serie com estrutura MA(Q) pu-
ramente sazonal, i.e. nao existe dependencia dentro de um perodo sazonal.