Académique Documents
Professionnel Documents
Culture Documents
Joo Nicolau
ISEG/UTL e CEMAPRE
Abril 2011
(Verso preliminar e incompleta)
Notas Prvias
Comentrios so bem vindos (nicolau@iseg.utl.pt). Neste documento abordam-se mtodos
economtricos relevantes para finanas. Veremos algumas aplicaes financeiras, mas a nfase deste documento est na componente economtrica. A leitura deste documento supe
conhecimentos sobre inferncia estatstica e o modelo de regresso linear mltiplo, no que
diz respeito estimao e inferncia estatsticas sob as hipteses clssicas.
Notao e Convenes
Escreve-se f (x) para designar a funo densidade de probabilidade (fdp) de uma varivel
aleatria X. Quando esto em causa duas variveis aleatrias X e Y; escreve-se, geralmente,
fx e fy para designar, respectivamente, as fdp de X e Y (f (x) e f (y) , em princpio,
incorrecto). O uso simultneo das notaes f (x) (fdp de X) e f (x; y) (fdp conjunta de
(X; Y )) conflituoso, pois f ou uma aplicao de R em R+ ou uma aplicao de R2
em R+ (e, portanto, f no poder designar simultaneamente ambas as aplicaes). A rigor
dever escrever-se fx e fx;y : No entanto, se no existir perigo de confuso, opta-se pela
notao mais simples e habitual f (x) e f (x; y). Escreve-se tambm f (yj x) ou fyjx para
designar a fdp condicionada de Y dado X = x: Em suma, nesta verso do documento,
adoptam-se as notaes que se entendem necessrias e convenientes de forma a no causar
confuso. Por exemplo, num certo contexto, pode escrever-se f (x; y) e, noutro diferente,
pode escrever-se fy;x :
O processo estocstico fyt ; t = 1; 2; :::g escreve-se indiferentemente como fyt g ou y:
a := b significa, a igual a b por definio. Por exemplo, se quisermos identificar a letra
como a mdia de X; escrevemos
usam
E (X) :
Em sries temporais usamos os termos amostra grande (ou amostra pequena) para
identificar sries temporais longas (ou curtas).
cia em distribuio).
EE - Estritamente estacionrio.
EDF - Equao s diferenas Finitas.
EQM - Erro Quadrtico Mdio.
ESO - Estacionrio de segunda ordem ou Estacionaridade de Segunda Ordem.
FAC - Funo de Autocorrelao.
FACP - Funo de Autocorrelao Parcial.
fdp - Funo Densidade de Probabilidade.
HC- Heterocedasticidade Condicional.
IC - Intervalo de Confina (ou de previso, consoante o contexto).
i.i.d. - Independente e Identicamente Distribudo.
RB - Rudo Branco.
v.a. - Varivel Aleatria.
Contedo
I
Introduo
13
15
Preos e Retornos
17
2.1
Retornos Discretos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18
2.1.1
Retorno Simples . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
2.1.2
Retorno Multi-Perodos . . . . . . . . . . . . . . . . . . . . . . .
19
2.1.3
Retornos de Portfolios . . . . . . . . . . . . . . . . . . . . . . . .
20
2.1.4
22
2.1.5
22
2.1.6
Retornos Anualizados . . . . . . . . . . . . . . . . . . . . . . . .
23
Retornos Contnuos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
2.2.1
Retorno Multi-Perodos . . . . . . . . . . . . . . . . . . . . . . .
26
2.2.2
Retornos de Portfolio . . . . . . . . . . . . . . . . . . . . . . . . .
27
2.2.3
27
2.2.4
27
2.2.5
Retornos Anualizados . . . . . . . . . . . . . . . . . . . . . . . .
28
30
31
32
2.2
2.3
2.B.1
32
2.B.2
r e R: Srie de Taylor . . . . . . . . . . . . . . . . . . . . . . . .
32
33
3.1
33
3.1.1
34
3.2
3.1.2
3.1.3
35
Negativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
3.1.4
37
3.1.5
43
3.1.6
Efeitos de Calendrio . . . . . . . . . . . . . . . . . . . . . . . . .
44
3.1.7
47
3.1.8
54
55
3.2.1
55
3.2.2
Volatility Clustering . . . . . . . . . . . . . . . . . . . . . . . . .
58
3.2.3
60
3.2.4
Efeito Assimtrico . . . . . . . . . . . . . . . . . . . . . . . . . .
62
3.2.5
64
3.2.6
64
67
4.1
67
4.2
68
4.3
72
4.4
77
4.4.1
77
4.4.2
Estacionaridade . . . . . . . . . . . . . . . . . . . . . . . . . . . .
79
4.4.3
Fraca Dependncia . . . . . . . . . . . . . . . . . . . . . . . . . .
83
87
4.5.1
Definies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
87
4.5.2
96
4.5.3
Estabilidade em EDF . . . . . . . . . . . . . . . . . . . . . . . . .
99
4.5.4
100
4.5.5
104
Demonstraes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
106
4.5
4.A
II
5
Modelos
109
O Problema da Especificao
111
5.1
111
5.2
113
5.2.1
113
5.2.2
115
5.3
116
5.4
Distribuio de Condicional . . . . . . . . . . . . . . . . . . . . . . . . .
116
119
6.1
Definies Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . .
120
6.1.1
120
6.1.2
120
6.1.3
122
123
6.2.1
123
6.2.2
Processos Autoregressivos . . . . . . . . . . . . . . . . . . . . . .
127
6.2.3
Processos ARMA . . . . . . . . . . . . . . . . . . . . . . . . . . .
135
139
6.3.1
No Estacionaridade na Mdia . . . . . . . . . . . . . . . . . . . .
139
6.3.2
No Estacionaridade na Varincia . . . . . . . . . . . . . . . . . .
146
6.4
Modelao ARMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
150
6.5
154
6.5.1
Inconsistncia do Estimador . . . . . . . . . . . . . . . . . . . . .
154
6.5.2
Inconsistncia do Teste-t . . . . . . . . . . . . . . . . . . . . . . .
156
6.5.3
=0 . . . . . . . . . . . . . . . .
156
6.5.4
157
6.5.5
Concluso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
159
Previso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
160
6.6.1
Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
160
6.6.2
Previso Pontual . . . . . . . . . . . . . . . . . . . . . . . . . . .
162
6.6.3
Intervalos de Previso I . . . . . . . . . . . . . . . . . . . . . . . .
168
6.2
6.3
6.6
6.6.4
ARMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
174
6.6.5
177
6.6.6
Qualidade da Previso . . . . . . . . . . . . . . . . . . . . . . . .
180
6.6.7
188
190
. . .
191
192
195
198
199
203
204
UE + UV + UC = 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
206
6.I
7
207
7.1
Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
207
7.2
210
7.2.1
211
7.2.2
217
7.2.3
Pontos Peridicos . . . . . . . . . . . . . . . . . . . . . . . . . . .
227
7.3
7.4
. . . . . . . . . . .
234
7.3.1
Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
234
7.3.2
Solues Peridicas . . . . . . . . . . . . . . . . . . . . . . . . .
236
7.3.3
Estacionaridade . . . . . . . . . . . . . . . . . . . . . . . . . . . .
240
7.3.4
241
7.3.5
Estimao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
242
7.3.6
Inferncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
245
Modelo Markov-Switching . . . . . . . . . . . . . . . . . . . . . . . . . .
248
7.4.1
Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
248
7.4.2
7.4.3
cretos finito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
249
Modelos Markov-Switching . . . . . . . . . . . . . . . . . . . . .
254
7.4.4
255
7.4.5
256
7.4.6
Estacionaridade . . . . . . . . . . . . . . . . . . . . . . . . . . . .
260
7.4.7
Estimao e Inferncia . . . . . . . . . . . . . . . . . . . . . . . .
263
7.4.8
Previso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
265
7.4.9
Aplicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
266
269
8.1
Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
269
8.1.1
269
8.1.2
Processos Multiplicativos . . . . . . . . . . . . . . . . . . . . . .
272
8.1.3
273
8.1.4
274
274
Modelo ARCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
275
8.2.1
277
8.2.2
Representao AR de um ARCH . . . . . . . . . . . . . . . . . . .
277
8.2.3
278
8.2.4
279
8.2.5
280
8.2.6
Momentos e Distribuio de y . . . . . . . . . . . . . . . . . . . .
282
8.2.7
Volatilidade: Definies . . . . . . . . . . . . . . . . . . . . . . .
283
Modelo GARCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
284
8.3.1
284
8.3.2
286
Modelo IGARCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
288
8.4.1
Persistncia na Varincia . . . . . . . . . . . . . . . . . . . . . . .
290
8.4.2
293
8.4.3
294
8.5
Modelo CGARCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
297
8.6
Modelo GJR-GARCH . . . . . . . . . . . . . . . . . . . . . . . . . . . .
298
8.7
Modelo GARCH-M . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
300
8.1.5
8.2
8.3
8.4
8.8
301
8.9
Estimao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
303
8.9.1
304
8.9.2
309
8.9.3
312
313
316
8.11 Previso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
320
321
324
327
329
331
333
335
339
9.1
Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
339
9.2
Densidade e Verosimilhana . . . . . . . . . . . . . . . . . . . . . . . . .
341
9.3
342
9.4
346
9.5
Modelo BEKK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
348
9.6
349
9.7
Modelo DCC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
351
9.8
Modelo Triangular . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
352
9.8.1
352
9.8.2
Estimao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
357
9.8.3
359
9.8.4
Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
360
GARCH Ortogonal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
362
9.9
10
III
368
371
10.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
371
371
10.2.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
371
10.2.2 Propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
373
10.2.3 Escolha de h . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
374
376
382
10.A Demonstraes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
382
Aplicaes
389
391
391
392
394
395
400
401
12 Seleco de Portfolios
405
405
406
411
413
417
13.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
417
419
422
. . . . . . . . . . . . . . . . . . . . .
424
425
11
426
431
432
433
437
438
12
Parte I
Introduo
13
Pgina em branco
14
Captulo 1
Objecto e Mtodo da Econometria
Financeira
(ltima actualizao: 11/2009)
Entende-se que Financial econometrics is simply the application of econometric tools to
financial data (Engle, 2001). A econometria financeira , portanto, uma disciplina economtrica
(baseada em mtodos estatsticos e matemticos) vocacionada para analisar dados financeiros. Esta anlise serve de suporte a variadssimos estudos como por exemplo,
avaliao do risco (por exemplo, atravs do Value at Risk);
avaliao de obrigaes, opes, etc.;
previso da volatilidade;
gesto de portfolios;
anlise da previsibilidade e eficincia dos mercados, etc.
Sendo a econometria financeira a aplicao de mtodos economtricos adequados a dados financeiros, todos os mtodos estatsticos que de uma forma ou outra se apliquem a dados
financeiros, interessam econometria financeira. De todo o modo, a rea proeminente em
econometria financeira a das sries temporais. Estuda-se, por exemplo, a evoluo temporal das cotaes, taxas de cmbio, taxas de juro, etc. Por esta razo, este documento analisa
essencialmente mtodos economtricos para sries temporais, sobretudo os mtodos que de
alguma forma se adequam s caracterstica prprias das sries financeiras (como sejam, a
no linearidade e a no normalidade).
15
16
Captulo 2
Preos e Retornos
(ltima actualizao: 2/2011)
O ponto de partida para a anlise estatstica normalmente uma srie de preos (por
exemplo, a srie das cotaes de fecho do Banco XYZ num certo intervalo de tempo). De
uma forma geral, o preo pode ser, por exemplo, o valor a que um intermedirio financeiro
informa estar disposto a pagar pela compra de um determinado activo, opo ou futuro (bid
price), o valor a que um intermedirio financeiro informa estar disposto a receber pela venda
de um determinado activo, opo ou futuro (ask price), o valor final da transaco, o valor
definido num mercado de futuros, entre outros.
O intervalo de tempo entre dois preos consecutivos uma varivel aleatria com valores
em R+ . Isto significa que se poderia considerar uma sucesso de preos fPt1 ; Pt2 ; :::; Ptn g
com
= ti
ti
uma periodicidade fixa. Por exemplo, se anlise emprica de certo fenmeno aconselha o
tratamento dirio dos preos, a sucesso pertinente passar a ser fP1 ; P2 ; :::; Pn g onde Pt
representa habitualmente o valor de fecho no dia t: O tratamento estatstico do caso em que
i
= ti
ti
17
60
Preos Microsoft
50
40
30
20
10
Jan-04
Jan-06
Jan-06
Jan-02
Jan-00
Jan-98
Jan-96
Jan-04
0.2
Jan-94
Jan-92
Jan-90
Jan-88
Retornos Microsoft
0.15
0.1
0.05
0
-0.05
-0.1
-0.15
Jan-02
Jan-00
Jan-98
Jan-96
Jan-94
Jan-92
Jan-90
Jan-88
-0.2
2.1
Retornos Discretos
Taxas de cmbio real e taxas de juro podem ser analisadas nos nveis e no nas primeiras diferenas, se
existir evidncia de estacionaridade.
18
2.1.1
Retorno Simples
Pt
Pt
Pt
Pt
Pt 1
(2.1)
como
(1 + Rt ) :
e vendido por Pt : Se Pt
1, a taxa de rendibilidade
(1 + Rt ) ,
Pt K = Pt 1 K (1 + Rt ).
2.1.2
Retorno Multi-Perodos
Suponha-se que fP1 ; P2 ; :::; Pn g a sucesso de preos dirios. Podemos estar interessados,
por exemplo, no retorno semanal e, para o efeito, basta considerar
Rt (5) =
Pt
Pt
Pt
(admitindo que se observam cinco preos por semana). De uma forma geral,
Rt (m) =
Pt
Pt
Pt
Pt
Pt m
1:
(2.2)
Para calcular Rt (m) basta atender expresso (2.2). Suponhamos, no entanto, que Pt e
Pt
Rt (m) =
Pt
Pt
Pt
t
Y
j=t m+1
19
(1 + Rj )
1:
2.1.3
Retornos de Portfolios
! A ; investido em B: Desta
Rp;t =
= ! A RA;t + ! B RB;t :
Com m activos, tem-se ! 1 + ::: + ! m = 1 e
Rp;t = ! 1 R1;t + ! 2 R2;t + ::: + ! m Rm;t
m
X
=
! i Ri;t :
(2.3)
i=1
Conclui-se portanto que o retorno de um portfolio igual a uma mdia ponderada dos vrios
retornos do portfolio.
A varincia do retorno de um portfolio tende a ser inferior varincia dos retornos do
portfolio. Para analisar esta questo, considere-se
m
X
! i Ri;t
i=1
= ! 2i
m
X
m
X
Var (! i Ri;t ) + 2
i=1
Var (Ri;t ) + 2
i=1
m
X1
m
X1
m
X
Cov (! i Ri;t ; ! i j Ri
j;t )
j=1 i=j+1
m
X
!i!i
Cov (Ri;t ; Ri
j;t ) :
j=1 i=j+1
Simplifique-se esta expresso. Admita-se que os retornos tm varincia igual, Var (Ri;t ) =
2
e que os pesos so iguais, ! i = 1=m (estas hipteses significam que se tomam ttulos com
^=
Pm
1
j=1
Pm
20
a covarincia mdia, isto , a mdia aritmtica dos valores de todas as covarincias distintas
(que so em nmero de m (m
Var (Rp;t ) =
+2
1 ^ N (m
m2
2
1)
^ (m 1)
:
m
Nestas circunstncias, fcil verificar que Var (Rp;t ) < Var (Ri;t ) equivalente a
> ^.
Assim, se a variabilidade dos activos (tomados isoladamente) for superior mdia aritmtica
dos valores de todas as covarincias distintas, o retorno do portfolio apresenta menor varin2
(iii) as covarincias so iguais. Resulta por construo que a Var (Rp;t ) < Var (Ri;t ) : Com
efeito, comece-se por observar que Cov (Ri;t ; Ri j;t ) =
P 1 Pm
2
= 2 m (m
Nestas condies vem m
i=j+1
j=1
2
Var (Rp;t ) =
+2
1
m2
( o coeficiente de correlao).
1) =2 e, portanto,
m (m
2
1)
menor do que 1, a desigualdade Var (Rp;t ) < Var (Ri;t ) verifica-se sempre, sob as hipteses
assumidas. Claro que, na prtica, nenhuma das hipteses (i), (ii) e (iii) se verifica de forma
exacta, mas seguro dizer-se que, em condies gerais, a diversificao (i.e. m > 1) baixa a
variabilidade do portfolio.
21
2.1.4
Pt
Rt =
onde (Pt
Pt 1 ) =Pt
1
1
Dt
Pt 1
como dividend
yield.
2.1.5
At agora considermos retornos nominais. Em certos estudos, sobretudo de carcter macroeconmico, tem interesse analisar o retorno real. Para obtermos este retorno, necessrio
expurgar do ganho de capital o efeito do crescimento geral de preos. Suponhamos que
a inflao foi de 4% e o retorno (anualizado) foi de 3%. Houve ganho real no investimento
realizado? Se atendermos ao efeito crescimento geral de preos a resposta negativa.
tentador dizer que a perda real de 1%. Efectivamente quase 1%, mas no chega, como
se mostra a seguir. Para obtermos o retorno real, Rtreal (ajustado, portanto, da inflao),
considera-se
Rtreal =
Ptreal Ptreal1
;
Ptreal1
Ptreal =
Pt
IP Ct
sendo IP Ct o ndice de preos ao consumidor (ndice construdo pelo INE, Instituto Nacional de Estatstica). Observe-se que Ptreal o preo deflacionado ou simplesmente o preo
real do activo. Simples lgebra, permite concluir que
Rtreal =
onde
t
= (IP Ct
Ptreal Ptreal1
Pt IP Ct 1
=
real
Pt 1 IP Ct
Pt 1
1=
Rt
t
+1
= 0:04; logo,
Rtreal =
0:03 0:04
=
0:04 + 1
0:0096
isto , os retornos reais caiem aproximadamente 1%, para sermos mais exactos, caiem 0.96%.
Quando a inflao relativamente baixa (por exemplo, se Rtreal so retornos reais mensais)
22
vlida a aproximao,
Rtreal ' Rt
t:
2.1.6
Retornos Anualizados
Para compararmos, por exemplo, o retorno dirio do investimento A com o retorno mensal
do investimento B, necessrio converter as diferentes taxas de rendibilidades a um mesmo
perodo. Toma-se normalmente como perodo de referncia o ano pelo que, as taxas de
rendibilidade depois de convertidas em rendibilidades anuais dizem-se anualizadas. Suponhamos que um certo investimento de valor P0 foi realizado no momento 0. Ao fim de T anos
(T pode ser por exemplo 0.5, isto , 6 meses) o mesmo investimento vale Pn : A questo que
deveremos colocar a seguinte: qual a taxa de rendibilidade anual, RA ; tal que, aplicada
a um investimento P0 permite ao fim de T anos obter o investimento Pn ? Ou seja, qual o
valor RA que resolve a equao
P0 (1 + RA )T = Pn ?
Tomando RA como incgnita, facilmente se obtm
RA =
Pn
P0
1
T
1:
(2.4)
Se os preos P0 ; P1 ; :::Pn so dirios e se admitirmos que num ano se observam 250 preos,
ento T = n=250 (por exemplo, com n = 500 observaes dirias, o perodo de investimento
corresponde a dois anos, T = 500=250 = 2). Nestas condies, a frmula (2.4) pode-se
reescrever na forma
RA =
Pn
P0
250
n
1:
Em termos gerais, se num ano se observam N preos (por exemplo, N = 12 se as observaes so mensais) e dispomos de n observaes sobre os preos, ento T = n=N e
RA =
Pn
P0
23
N
n
1:
(2.5)
RA;1 =
1:9
1:5
RA;2 =
121
105
1 = 0:0766
e,
12
50
1 = 0:034;
2.2
Retornos Contnuos
Rs
2
1+
Rs
2
= P0 1 +
Rs
2
0.4
0.3
0.2
0.1
R
r
0
-0.1
-0.2
Jul-05
Jan-05
Jul-04
Jan-04
Jul-03
Jan-03
Jul-02
Jan-02
Jul-01
Jan-01
Jul-00
Jan-00
-0.3
Como limn!1 1 +
r n
n
r
n
log P0 :
Considere-se agora uma sucesso de preos fP1 ; P2 ; :::; Pn g : Define-se a taxa de rendibilidade instantnea ou simplesmente o retorno contnuo de um certo investimento no momento
t como
rt = log Pt
log Pt 1 :
log Pt
= log
Pt
Pt
= log 1 +
Pt 1
Pt 1
= log (1 + Rt ) :
Para dados dirios, semanais ou mensais pode assumir-se rt ' Rt (ver apndice 2.B.2). Na
figura 2-2 as diferenas entre Rt e rt so relativamente pequenas. Se os dados fossem dirios
as diferenas seriam ainda mais pequenas.
25
2.2.1
Retorno Multi-Perodos
Suponha-se que fP1 ; P2 ; :::; Pn g a sucesso de preos dirios. Podemos estar interessados,
por exemplo, no retorno semanal e, para o efeito, basta considerar
rt (5) = log
Pt
Pt 5
(admitindo que se observam cinco preos por semana). De uma forma geral,
rt (m) = log
Pt
Pt m
= log (Pt )
log (Pt
m) :
r1 = log P1
log P0
retorno 3a feira
r2 = log P2
log P1
retorno 4a feira
r3 = log P3
log P2
retorno 5a feira
r4 = log P4
log P3
retorno 6a feira
r5 = log P5
log P4
log P0 = r1 + r2 + ::: + r5
A tabela anterior sugere que o retorno da semana igual soma dos retornos da semana.
Com efeito,
log P5
r4
r3
r1
26
+ ::: + rt
m+1 :
2.2.2
Retornos de Portfolio
Pode imaginar-se o retorno contnuo do portfolio como sendo o valor rp;t tal que, aplicado
ao capital inicial K (i.e., Kerp;t ) permite obter o valor do portfolio calculado atravs dos m
P
P
ri;t
ri;t
retornos (i.e., K m
). Assim, rp;t tal que K m
= Kerp;t : Resolvendo
i=1 ! i e
i=1 ! i e
P
ri;t
esta equao em funo de rp;t obtm-se rp;t = log ( m
) : Tendo em conta que
i=1 ! i e
P
ri;t = log (1 + Ri;t ) e m
i=1 ! i = 1; podemos ainda escrever
rp;t = log
m
X
! i eri;t
i=1
m
X
= log
! i (1 + Ri;t )
i=1
= log 1 +
m
X
! i Ri;t
i=1
= log (1 + Rp;t ) :
constitui uma desvantagem da verso contnua dos retornos. No entanto, quando Rp;t no
muito alto, rp;t
2.2.3
Rp;t :
Pt + Dt
Pt 1
= log (Pt + Dt )
log (Pt 1 ) :
Note-se tambm:
rt = log (1 + Rt ) ;
2.2.4
Rt =
Pt + Dt
Pt
Pt
Pt =IP Ct
Pt 1 =IP Ct
= log
1
Pt
Pt 1
definida como
log
= rt
27
IP Ct
IP Ct 1
2.2.5
Retornos Anualizados
Tal como no caso dos retornos discretos, tambm no caso dos retornos contnuos possvel
obter uma taxa de rendibilidade (agora instantnea) anualizada ou simplesmente retorno anualizado, rA . Pode comear-se por perguntar: qual a taxa de rendibilidade anual, rA ; tal
que, aplicada a um investimento P0 permite ao fim de T anos (de valorizao contnua) obter
o investimento Pn ? Ou seja, qual o valor rA que resolve a equao
P0 erA T = Pn ?
Tomando rA como incgnita, facilmente se obtm
rA =
1
log
T
Pn
P0
(2.6)
rA = log (1 + RA ) = log 1 +
Pn
P0
1
T
= log
Pn
P0
1
T
1
log
T
Pn
P0
250
log
n
Pn
P0
Em termos gerais, se num ano se observam N preos (por exemplo, N = 12 se as observaes so mensais) e dispomos de n observaes sobre os preos, ento T = n=N e
rA =
N
log
n
Pn
P0
28
Uma questo interessante consiste em obter rA como funo de r: Tendo em conta que
P
log (Pn =P0 ) = ni=1 ri tem-se
N
rA =
log
n
Pn
P0
n
NX
=
ri = N r:
n i=1
X = log PN
log P0 =
N
X
rt :
t=1
Supondo E (r1 ) = E (r2 ) = ::: = E (rN ) ; tem-se que o retorno mdio anual dado por
E (X) = N E (rt ) :
Logo, uma estimativa de E (X) , precisamente, rA = N r : Por outro lado, suponha-se que
a sucesso frt g no autocorrelacionada e que Var (rt ) =
N
X
rt
t=1
=N
(2.7)
Resulta da equao (2.7) a famosa square root of time rule segundo a qual, a volatilidade
p
anual de um activo, obtm-se a partir da regra N onde o desvio padro associado
a um medida intra anual (assume-se o desvio padro como medida da volatilidade). Por
p
exemplo, se os dados so dirios, a regra estabelece 250 d ( d o desvio padro associado
p
aos dados dirios); se os dados so mensais, vem 12 m ( m o desvio padro associado
aos dados mensais). A informao anualizada pode ser dada em percentagem:
Nr
p
N
100%;
100%:
100) = N E (rt )
Note-se, finalmente, que o retorno anualizado na verso discreta uma funo do retorno
29
2.3
Neste documento d-se preferncia anlise dos retornos contnuos. Por vrias razes:
A esmagadora maioria dos investigadores usa rt : Se queremos que os nossos resultados
sejam comparveis devemos usar rt :
Como vimos, os retornos contnuos multi-perodos so aditivos (por exemplo, o retorno contnuo entre o perodo 5 e 0 igual soma dos retornos contnuos entre o
perodo 5 e 0). J os retornos discretos multi-perodos no so. Em certas aplicaes
necessrio modelar retornos multi-perodos a partir do conhecimento das distribuies
de r ou R: Neste caso, prefere-se interpretar o retorno na sua verso contnua, pois a
modelao de uma soma
log Pt
log P0 =
t
X
ri
i=1
P0
P0
Pt
i=1 ri
t
Y
(1 + Rj )
1:
j=1
O facto dos retornos discretos no ser aditivos pode conduzir a concluses erradas.
Considere-se o seguinte exemplo (veja-se a tabela 2.1). No momento t = 0 um certo
activo vale 100, depois em t = 1 vale 110 e, finalmente, em t = 2 volta a valer 100.
P0 )=P0 ou log P2
Pt
0
1
2
media
100
110
100
Rt =
Pt Pt
Pt 1
rt = log Pt
0.10 (10%)
-0.0909 (-9.09%)
>0
log Pt
0.0953
-0.0953
=0
1: Por exemplo, se R1 =
1:05) P0 =
0:05
100 =
1:05 tem-se
5:
2.A
Outra Interpretao de rt
Pt ) =Pt = r
(r a
Pt
= rPt
! 0; o lado esquerdo da
31
(2.8)
que estabelece a forma como Pt evolui em tempo contnuo. Pode-se provar que a soluo
geral de (2.8)
Pt = cert ;
c2R
log P0 .
2.B
Notas Tcnicas
2.B.1
Como calcular Rt (m) a partir dos retornos simples em t = 1; 2; ...? Basta considerar
Rt (m) =
=
=
=
=
Pt
Pt
Pt m
Pt Pt 1 Pt m+1
:::
1
Pt 1 Pt 2
Pt m
Pt
Pt 1
Pt m+1
1+
1
1+
1 ::: 1 +
Pt 1
Pt 2
Pt m
(1 + Rt ) (1 + Rt 1 ) ::: (1 + Rt m+1 ) 1
t
Y
(1 + Rj ) 1:
j=t m+1
2.B.2
r e R: Srie de Taylor
1 2 1 3
R + R
2 t 3 t
::: ( 1)n
Rtn
+ :::
n
Este desenvolvimento em srie de potncia de Rt vlido para todo o Rt tal que jRt j <
1. Quando Rt relativamente pequeno, os termos Rt2 ; Rt3 ; etc., so ainda mais pequenos
(por exemplo, Rt = 0:005 implica Rt2 = 2:5
10 5 , Rt3 = 1:25
nestas circunstncias, Rt2 ' 0; Rt3 ' 0; etc., e, assim, rt ' Rt : Se os dados so dirios,
semanais ou mensais as rendibilidades R so geralmente pequenas (quando comparadas com
as rendibilidades anuais). Assim, para este tipo de rendibilidades, pode assumir-se rt ' Rt :
32
Captulo 3
Factos Empricos Estilizados de Sries
Temporais Financeiras
(ltima actualizao: 2/2011)
Vrios estudos empricos tm documentado que h um conjunto de regularidades empricas que so partilhadas por um leque grande de sries temporais financeiras observadas
com frequncia elevada (diria ou semanal). Essas regularidades tm a ver com caractersticas das distribuies marginais e condicionais que so comuns a muitas sries temporais
financeiras.
3.1
= E (r) ;
p
E (r
= Var (r); sk =
)3
3
; k=
)4
E (r
4
Para simplificar, admite-se que f homognea com respeito ao tempo, i.e., no depende de t. Desta forma,
f (rt ) = f (rt 1 ) = ::: = f (r1 ). Como consequncia indiferente escrever f (rt ) ou simplesmente f (r) (e,
por um raciocnio similar, indiferente escrever E (rt ) ou simplesmente E (r)).
33
podem ser estimados de forma consistente (sob certas condies de regularidade), respectivamente, pelos estimadores
s
Pn
r)2
r
t
t=1 (rt
t=1
; ^=
;
r =
n
n
Pn
Pn
3
1
1
n
(r
r)
n
t
t=1
t=1 (rt
c =
sk
; k^ =
3
^
^4
Pn
r)4
3.1.1
De acordo com a teoria financeira o valor esperado do retorno de um investimento no mercado de capitais deve exceder, no longo prazo, o retorno do investimento sem risco. A essa
diferena designa-se prmio de risco (Equity Risk Premia). Este prmio deve ser positivo
pois, caso contrrio, no haveria motivao para aceitar um investimento com retornos incertos, quando a alternativa um retorno garantido.
A estimao do prmio de risco deve envolver um perodo relativamente longo (o retorno
de um investimento no mercado de capitais estvel no mdio/longo prazo, mas instvel
no curto prazo - pode at ser fortemente negativo em curtos perodos de tempo). Dimson, Marsh e Staunton (2002) fizeram o seguinte exerccio, com base em dados financeiros
norte-americanos: se tivesse sido investido 1 dlar em aces norte americanas (digamos,
num ndice representativo do mercado de aces norte-americano) e 1 dlar em bilhetes do
tesouro (investimento sem risco), ambos no incio do ano 1900, quais seriam os retornos
desses investimentos ao fim de 101 anos (i.e. se fossem levantados no final do ano 2000).
Os resultados apurados mostram que o investimento de 1 dlar em aces seria vendido
por 16797 dlares em 2000 (apesar das inmeras crises econmicas e financeiras durante
o sculo, como por exemplo, as duas guerras mundiais, a grande depresso, os choques
34
rA %
^A%
c
sk
k^
P^ (jrt rj>3^ )
P (jZj>3)
Cotaes de Aces
Microsoft (01-88 a 7-05)
23.9% 36.3% -.097
6.8
3.85
Coca-Cola (11-86 a 12-05) 7.2% 33.2% -0.97 18.1
4.53
PT (6-95 a 12-05)
12.3% 33.2% -0.06 6.39
5.02
ndices Bolsistas
Dax (11-90 a 11-05)
8.4% 22.1% -0.196 6.66
5.79
CAC40 (03-90 a 11-05)
5.7% 20.5% -0.101 5.77
5.61
Nikkei225 (01-84 a 11-05) 1.6% 20.5% -0.116 10.77
3.71
FTSE100 (04-84 a 11-05)
7.3% 15.8% -0.545 11.12
2.44
PSI20 (01-93 a 03-06)
8.6% 15.8% -0.61 10.9
5.99
Taxas de Cmbio
USD/EUR(12-98 a 11-05) 0.1% 7.9% -0.05 4.86
4.55
YEN/USD (1-71 a 7-05)
-3.4% 9.4% -0.78 p
14.2
1.67
Na ltima coluna assume-se que Z N (0; 1) ; ^ A % = 250^ 100%
Tabela 3.1: Estatsticas Descritas de Algumas Aces, ndices e Taxas de Cmbio
petrolferos, etc.), enquanto os bilhetes de tesouro seriam vendidos por 119 dlares. Os
retornos anualizados (usando a frmula RA ) seriam de 10.1% para as aces, i.e.
1
1 100% = 10:1%
3.1.2
A tabela 3.1 mostra que os activos com maior variabilidade (e, portanto com maior risco
associado) so os ttulos de empresas, seguidos dos ndices bolsistas e taxas de cmbio (bilhetes do tesouro - resultados no apresentados - apresentam a menor variabilidade). No
mbito dos ttulos de aces, vrios estudos indicam (ver por exemplo, Taylor, 2005) que a
variabilidade dos retornos tende a diminuir medida que a dimenso das empresas aumenta
(ttulos de empresas pequenas apresentam maior variabilidade).
3.1.3
acentuadas do que as variaes positivas fortes. Quando assim sucede, os desvios negativos
P
(rt r)3 < 0 tendem a dominar os desvios positivos (rt r)3 > 0 na soma (rt r)3 e,
a varivel observada (por exemplo, se multiplicarmos r por 100, para termos uma medida
c no sofre alterao).
em percentagem, sk
A tabela 3.1 mostra que as distribuies empricas das rendibilidades de aces e ndice
Z1 =
c
p sk
np
6
tem distribuio assimpttica N (0; 1) : A hiptese nula H0 : sk = 0 pode ser testada a partir deste resultado2 . Mas as hipteses de partida, normalidade e homocedasticidade, so
relativamente severas. Na prtica, isto significa que a rejeio de H0 pode dever-se ausncia de normalidade e/ou homocedasticidade e no necessariamente falha de simetria da
distribuio. Desta forma, necessrio ter algum cuidado na interpretao dos resultados
quando H0 rejeitada.
c por vezes criticado por no ser robusto face presena de valores
O estimador sk
extremos. Na verdade, em certos casos, a ocorrncia de apenas uma nica variao negativa
para sk negativo). Por esta razo, aconselhvel usar-se medidas de assimetria robustas
2
A nica hiptese nula possvel H0 : sk = 0: Por exemplo, no faria sentido testar H0 : sk = 1 porque
a estatstica de teste obtida sob a hiptese de normalidade e sk = 1 claramente incompatvel com essa
hiptese.
36
contra a presena de outliers. Uma medida nestas condies proposta por Groeneveld and
Meeden (1984)
skGM =
E (r) q0:5
E (jr q0:5 j)
onde q0:5 o quantil de ordem 0.5, o que significa que q0:5 a mediana. O parmetro
E (jr
q0:5 j) fornece uma medida de disperso dos dados. Esta medida tem a vantagem
1 < skGM < 1: Sob certas condies, skGM pode ser estimado
r m
P
n 1 nt=1 jrt
mj
E (r)
q0:5
Note-se, finalmente, que para as taxas de cmbio no h razo especial para esperar
sk > 0 ou sk < 0: Com efeito, suponha-se que St a taxa de cmbio do Dlar/Euro e
rt = log (St =St 1 ) : Se a distribuio de rt assimtrica negativa ento a distribuio dos
retornos associados taxa de cmbio do Euro/Dlar, 1=St (seja r~t esse retorno) assimtrica
positiva, pois
r~t = log
1=St
1=St 1
log
St
St 1
rt
positiva). Assim a assimetria positiva ou negativa nas taxas de cmbio depende da forma
como a taxa de cmbio est definida (no podendo, portanto, inferir-se qualquer regularidade
emprica).
3.1.4
O achatamento de uma distribuio normalmente aferida atravs do coeficiente de achatamento k (tambm designado por kurtosis ou curtose). Diz-se que a distribuio f mesocrtica se k = 3; platicrtica se k < 3 e leptocrtica se k > 3: O valor de referncia 3 o
que resulta da distribuio normal (assim, a distribuio normal ou Gaussiana mesocrtica). Valores altos de k^ (acima de 3) indicam que certos valores da amostra se encontram
muitos afastados da mdia, comparativamente aos demais valores da amostra. Observe-se
37
1.5
1.0
0.5
0.0
-0.5
-1.0
-1.5
-2.0
1
5
Y1
Y2
Figura 3-1: Qual das duas sries tem kurtosis estimada mais alta?
que os desvios (rt
y1
y1
^ y1
z2 =
y2
y2
^ y2
Na figura 3-2 ambas as sries possuem a mesma varincia, mas agora claro o valor extremo
da srie y1
Observa-se para a generalidade das sries financeiras que os retornos muitos altos e muito
baixos ocorrem com maior frequncia do que seria de esperar se os retornos seguissem uma
distribuio normal. Uma forma de confirmar esta ideia consiste em comparar a estimativa
do coeficiente de kurtosis (curtose) dos retornos com o valor 3, que o valor de kurtosis da
distribuio normal.
Na generalidade dos casos o coeficiente k estimado vem quase sempre (bastante) acima
de 3, o que sugere que a distribuio dos retornos (de cotaes, ndice, taxas de cmbio e
mesmo taxas de juro) leptocrtica. Nas figuras 3-3 e 3-4 (esta ltima uma ampliao
da figura 3-3) mostra-se a diferena entre uma distribuio mesocrtica (k = 3) e uma
38
-1
-2
1
Z1
Z2
Z1 =
^
p k 3
n p
24
! N (0; 1) :
Por exemplo, para a Microsoft (tabela 3.1) e sabendo que no perodo considerado se obser0.5
0.4
0.3
Normal
0.2
Leptoc.
0.1
0
-7
-4.5
-2
0.5
5.5
p
(6:8
4415 p
3)
24
= 51:54:
0.01
0.008
0.006
Normal
0.004
Leptoc.
0.002
0
-7
-4.5
-2
0.5
5.5
(3.1)
P (jrt
(observe-se que (rt
ser aproximadamente igual a um. No entanto, a tabela 3.1 mostra que esse rcio tende a ser
significativamente superior a um. Isto sugere que os retornos muitos altos e muito baixos
tendem a ocorrer com maior frequncia do que seria de esperar se a varivel seguisse uma
distribuio normal.
Observao 3.1.1 Como estimar a probabilidade P (jrt E (rt )j = > 3)? Primeiro subp
stitumos E (rt ) e = Var (rt ) pelas respectivas estimativas consistentes, r e : Depois,
calculamos a proporo de vezes (na amostra) em que ocorre jrt
assim uma estimativa para P (jrt
rj =
P^ (jrt
onde Ifjrt
rj= >3g
= 1 se ocorre jrt
rj= >3g
> 3. Obtm-se
.2
20
.1
10
.0
-.1
-10
-.2
-20
-.3
Bandas (-3,3)
-30
30
40
50
60
70
80
90
00
10
30
40
50
60
70
80
90
00
10
Figura 3-5: Painel Esquerdo: retornos dirios do Dow Jones no perodo 02/10/1928 a
3/02/2011 (20678 observaes). Painel direito retornos estandardizados, zt = (rt r) =^
Apresenta-se a seguir mais um exemplo envolvendo o rcio (3.1). No painel esquerdo
da figura 3-5 apresentam-se os retornos dirios do Dow Jones no perodo 02/10/1928 a
3/02/2011 (20678 observaes). No painel direito da mesma figura apresentam-se os retornos estandardizados juntamente com as rectas -3 e 3. Se os retornos seguissem uma
distribuio normal seria de esperar que zt = (rt
r) =^ excedesse os limiares 3 e
3 em
cerca de 0.27% das vezes, tendo em conta, como j vimos, que P (jZj > 3) = 0:0027;
supondo Z
P^ (jrt rj > 3^ )
0:017
=
= 6:29
P (jZj > 3)
0:0027
^
B k
2
2
Z1 + Z2 = n @
3
24
c C d
sk
A !
6
2
(2)
Grfico QQ-Plot
Outra forma de compararmos a distribuio normal com a distribuio dos retornos consiste
em analisar o grfico QQ-plot. O grfico QQ-plot o grfico dos pares ordenados
f(q ; q~ ) ;
41
2 (0; 1)g
Quantis Normal
-4
-8
-12
-12
-8
-4
da distribuio Z
rt
isto
q
: P (Z < q ) = ;
q~
: P~ (xt < q~ ) = ;
xt :
N (0; 1)
q~ e o grfico f(q ; q~ ) ;
2 (0; 1)g
uma recta de 45o . Se, pelo contrrio, as distribuies de xt e Z so diferentes o grfico afasta-se da recta de 45o (poderamos tambm comparar a distribuio de xt com outra
qualquer). A figura 3-6 permite concluir que a distribuio dos retornos leptocrtica e assimtrica. O grfico sugere, por exemplo, que P (Z <
8). A distribuio
42
r
Retornos Dirios
Frankfurt
Hong Kong
Londres
Nova York
Paris
Tquio
Retornos Semanais
Frankfurt
Hong Kong
Londres
Nova York
Paris
Tquio
0.00035
0.00057
0.00041
0.00049
0.00026
0.00005
c
sk
k^
8.09
18.25
15.54
11.25
9.16
4.897
3.1.5
Diz-se que a frequncia das observaes aumenta quando, se passa, por exemplo, de observaes mensais para observaes semanais ou destas para dirias. A tabela 3.2 mostra que o
coeficiente de kurtosis aumenta quando se passa de observaes semanais para observaes
dirias. Assim, a distribuio marginal dos retornos dirios apresenta um maior afastamento
face distribuio normal. possvel fazer um raciocnio inverso: a diminuio da frequncia das observaes (por exemplo, quando se passa de observaes dirias para observaes
semanais ou mensais) atenua o afastamento da distribuio dos retornos relativamente distribuio normal. Uma possvel explicao terica para este facto descrita a seguir.
Sejam P0 ; P1 ; P2 ; ::: os preos dirios. Se a frequncia de observaes baixa, passamos
a observar P0 ; Ph ; P2h ; ::: sendo h um inteiro maior do que 1. Por exemplo, se passarmos
para dados semanais (h = 5) passamos a observar P0 ; P5 ; P10 ; ::: (imagine-se que t = 0
uma segunda-feira; passados 5 dias observa-se a segunda-feira seguinte que corresponde a
t = 5). Neste caso, os retornos semanais so:
log Ph log P0 ; log P2h log Ph ; ::: com h = 5
|
{z
} |
{z
}
retorno 1a semana
retorno 2a semana
43
log P0 = r1 + r2 + ::: + rh =
h
X
ri
i=1
(ri so os retornos dirios). Mesmo que ri no tenha distribuio normal, o retorno associados a uma frequncia de observao mais baixa, r~ (h) ; tender a ter distribuio normal pelo
teorema do limite central. Com efeito, sob certas condies (relacionadas com a varincia
de ri e a memria temporal de r) tem-se
Ph
i=1 ri
Ph
i=1 ri
r
Ph
Var
i=1 ri
! N (0; 1)
ri
i=1
h
X
ri
i=1
; Var
h
X
ri
i=1
!!
Assim, espera-se que a diminuio da frequncia amostral atenue a no normalidade observada nas sries de retornos de alta frequncia.
3.1.6
Efeitos de Calendrio
Ph
i=1 ri
= n E (ri ) e Var
d
Ph
i=1 ri
=h
44
detectem essa anomalia vendem o ttulo da empresa ABC s teras-feiras s 14h. Como
resultado o preo da empresa ABC tenderia a cair por volta dessa hora e a anomalia desaparecia. De uma forma geral, se os investidores so racionais e dispem de toda a informao
passada sobre o mercado, as anomalias relacionadas com as rendibilidades dependentes do
calendrio, tendem a desaparecer, logo que sejam detectadas. Na prtica, subsistem certas
anomalias que no desaparecem mas que, em geral, no permitem obter rendibilidades anormais, depois de deduzidos os custos de informao e transaco. Podem assim permanecer
no mercado anomalias ou ineficincias para as quais o benefcio de explorar essas ineficincias no compensa os custos adicionais associados.
Dia da Semana
partida espera-se que os retornos segunda-feira sejam um pouco mais altos face aos
demais dias da semana, pois a posse de ttulos segunda-feira representa um investimento
de 72 horas face ltima sexta-feira, tendo em conta que o mercado fecha aos fins-desemana. Analiticamente observe-se que se o retorno dirio rt tem mdia
ento, para um
rt + rt+1 + rt+2 ; tem varincia igual a 3 2 : Portanto, espera-se que s segundas feiras o
retorno apresente maior variabilidade. No entanto, argumenta-se que a (verdadeira) varincia
associada aos retornos de segunda-feira no pode ser to alta como o valor 3
sugere, pois
45
1 tert
2 quat
3 quit
4 sext
+ ut
(3.2)
onde ter; qua; etc. so variveis dummy que assumem o valor um se t corresponde, respectivamente, a uma tera-feira, quarta-feira, etc. (note-se que o grupo base a segundafeira). Sendo o grupo base a segunda-feira,
(E (rt j segt = 1) =
i,
0:01 e
0:01 ento o
feira).
O ensaio H0 :
= ::: =
nas mdias dos retornos dos vrios dias da semana. A estatstica habitual para o caso em
anlise (em que H0 estabelece a nulidade de todos os parmetros com excepo do termo
constante)
F =
R2 = (k 1)
(1 R2 ) =(n k)
onde k o nmero de regressores (incluindo o termo constante) e R2 o coeficiente de determinao. Sob H0 (homocedasticidade e ausncia de autocorrelao) a estatstica F tem
distribuio F (k
1; n
ais so invlidos. Uma soluo para este problema consiste na estimao da equao (3.2)
atravs dos modelos da famlia ARCH (veremos este aspecto no captulo 8). Outra soluo
passa pela utilizao de erros padro robustos (ou da estatstica F robusta) contra a presena
de heterocedasticidade5 .
Em Taylor (2005) descrevem-se outras anomalias associadas ao calendrio.
5
d ^
Erros padro (de White) robustos contra heterocedasticidade obtm-se a partir da matrix Var
(X0 X)
X0 WX (X0 X)
d ^ R0
RVar
R^
r ;e
46
3.1.7
Distribuio t-Student
bem conhecida a distribuio t-Student com v graus de liberdade, t (v) : A fdp
f (x) = p
Como se sabe, se X
3 + 6= (v
v+1
2
v
2
v+1
2
x2
1+
v
2), sk = 0 e k =
4) : Como k > 3 conclui-se que a distribuio t (v) tem caudas pesadas. Por
vezes tem interesse trabalhar com uma varivel aleatria " com distribuio t-Student de
mdia zero mas varincia igual a um. Se X
"=X
p
(v
g (x) = p
1
(v
2)
2) =v:
6
:
v 4
v+1
2
v
2
1+
v+1
2
x2
v
Quando mais baixo for o nmero de graus de liberdade mais pesadas so as caudas. No
caso v = 4 o momento de ordem 4 no existe e, portanto, tambm no existe o coeficiente
R
de kurtosis (quer dizer, neste caso, o integral imprprio R x4 g (x) dx no finito porque a
expresso x4 g (x) no tende para zero com suficiente rapidez).
Mistura de Normais
Considere-se uma distribuio mistura de normais:
N ( 2;
2
2) :
100% de N ( 1 ;
2
1)
e (1
) % de
seguinte forma: atira-se uma moeda ao ar. Se cair caras simula-se uma varivel X1 com
distribuio N ( 1 ;
2
1) ;
2
2) :
De uma
forma geral, a varivel X; que representa a mistura de normais, pode escrever-se da seguinte
forma:
X = U X1 + (1
U ) X2 ;
47
f(x)
0.010
0.009
0.008
0.007
0.006
0.005
0.004
0.003
0.002
0.001
-8
-7
-6
-5
-4
-3
-2
-1
v = 30)
P1
u=0
distribuio de X dado U = u imediata, tendo em conta que uma soma de normais ainda
uma normal:
XjU = u
onde
E (XjU = u) = u
Var (XjU = u) = u2
+ (1
2
1
+ (1
u)
u)2
2
1
+ 2u (1
u) Cov (X1 ; X2 )
) fxju (xj1) ; 0
2
1)
2
2 ).
conduz a uma distribuio no normal. Em particular a mistura pode ser assimtrica e leptocrtica. Com efeito, pode-se mostrar que,
E (X) =
Var (X) =
+ (1
2
1
+ (1
2;
2
2
(1
)(
48
2)
f(x) 1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
-5
-4
-3
-2
-1
E (X))
3 (1
)(
2 +(1
1
=
2
1
(1
)(
2)
(1
2 )(
2)
2 2
2
2 2
2
)
> 3 supondo, para simplificar, que
)
= 0:5;
1;
+ 3(
= 1;
2
1
2
2)
= 0:
= 1=5;
= 5: A
( +1)
y > c:
primeira vista pode parecer que esta distribuio no serve pois o nosso objectivo modelar os retornos e o espao de estados desta varivel claramente R (os retornos podem assumir qualquer valor em R). Ora, sucede que g apenas est definida para y > c (e, portanto,
no atribui probabilidades quando y < c). No entanto, o que procuramos neste momento
caracterizar probabilisticamente os eventos extremos, i.e. os eventos que se encontram
bem afastados da mdia. Estamos, portanto, concentrados nas abas da distribuio e, para o
efeito, o que relevante o que se passa para y > c:
Diz-se que uma fdp f (y) tem distribuio com caudas de Pareto (mesmo que no seja
uma distribuio de Pareto) se
f (y)
Cy
( +1)
49
>0
fdp
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0.00
2.0
2.5
3.0
3.5
4.0
4.5
5.0
y!1
( +1)
= 1:
Esta ltima equao diz-nos que para valores grandes de y, f (y) praticamente igual a
Cy
( +1)
(no limite igual). Para valores pequenos de y, f (y) pode ser completamente
diferente de Cy
( +1)
mais gerais, baseadas em funes slowly varying at 1). Pode-se concluir que f (y) tem um
decaimento polinomial para zero (decaimento lento para zero) e, portanto, caudas pesadas. J
a distribuio normal tem um decaimento exponencial (recorde-se que no caso Gaussiano,
f (y) = C exp f y 2 =2g) e a fdp tende para zero muito rapidamente quando y tende para
1. A figura 3-9 compara uma cauda Gaussiana com uma cauda de Pareto.
Uma vez que a fdp com caudas pesadas do tipo f (y)
Cy
( +1)
no tende rapidamente
50
E jyt j
jyjk f (y) dy
ZD1
Zc 1
= C
jyjk f (y) dy
jyjk Cy
1
1+k >
se
1; ou seja, se
jyj
( +1)
1+k
dy
dy = 1
Cy
( +1)
< 2:
um estimador para ; admita-se um cenrio mais simples: f (y) tem distribuio (exacta) de
Pareto, y
c
+1
y > c:
Assuma-se que fyt ; t = 1; 2; :::; ng uma sucesso de v.a. i.i.d. com distribuio de P areto ( ; c) :
A funo de log-verosimilhana corresponde expresso
log L ( ; c) =
n
X
( + 1)
t=1
n
X
log (yt ) :
t=1
^ = Pn
n=
(3.3)
n (^ n
onde
I(
0)
@ 2 log f (yt )
@ 2
1
2
Cy
( +1)
Embora a derivada da funo log L (c; ) com respeito a c no se anule (verifique), pode-se concluir que no
intervalo de valores admissveis de c, isto , c mint=1;:::;n fyt g ; a funo log L (fixado ) atinge o mximo
em c^ = mint=1;:::;n fyt g :
51
(supondo que y tem distribuio com caudas de Pareto, mas no segue essa dis-
tribuio), devemos aparar a amostra fyt ; t = 1; 2; :::; ng ; por exemplo, considerando apenas
os dados yt tais que yt > q (onde q pode ser interpretado como um quantil de y; geralmente
um quantil de ordem superior a 0.95). Analisa-se, portanto, o comportamento de y apenas
para os valores muitos altos (ou muito baixos) de y.
O estimador de ; designado por estimador de Hill, para a aba direita da distribuio
n (q)
;
t=1 log (yt =q) Ifyt >qg
^ (q) = Pn
n (q) =
n
X
t=1
Ifyt >qg
(3.4)
onde Ifyt >qg = 1 se yt > q e Ifyt >qg = 0 no caso contrrio. Pode-se pensar neste estimador
como se fosse o estimador (3.3), mas aplicado apenas aos valores da amostra que verificam
yt > q:
O estimador de
pois de se substituir Ifyt >qg por Ifyt <qg , sendo q agora um quantil de ordem 0.05 ou inferior.
Pode-se mostrar
p
n (q) (^ (q)
(q)) ! N 0;
=n (q) : Como
desconhecido podemos tomar como estimador de Var (^ (q)) a expresso ^ 2 =n (q) : Estes
resultados assimptticos so obtidos num contexto i.i.d. Kearns e Pagan (1997) mostram
todavia que a varincia assimpttica de ^ aumenta consideravelmente na presena de dependncia.
Exemplo 3.1.1 Resulta do quadro seguinte que ^ (0:01) = 3=5:193 = 0:577
yt
Ifyt >0:01g
-0.110
0.090
2.197
0.100
2.303
-0.100
0.020
0.693
0.005
P
5.193
versus varincia:
se q alto a estimao de ^ (q) baseada em poucas observaes, i.e., n (q) baixo,
pelo que a varincia de ^ (q) alta (observe-se Var (^ (q)) =
se q baixo, perde-se a hiptese f (y)
Cy
( +1)
=n (q));
Cy
( +1)
).
Exemplo 3.1.2 Na tabela seguinte apresentam-se estimativas do ndice da cauda de retornos bolsistas sectoriais do mercado norte-americano no perodo 03/1/1994 a 21/01/2011
(4292 observaes).
Aba Esquerda
Aba Direita
^ (q0:0:025 )
^ (q0:975 )
Retorno
Volat.
108
108
Anualiz.
Anualiz.
Petrleo e Gs
2.29
3.16
9.45%
Matrias-Primas
2.81
3.15
Indstria
2.91
Consumo (bens)
Skew.
Kurt.
25.79%
-0.25
13.98
6.77%
25.90%
-0.29
10.32
3.00
7.42%
21.90%
-0.25
8.441
3.37
2.93
2.34%
19.82%
-0.15
9.025
Sade
2.90
3.52
7.12%
17.29%
-0.08
11.44
Comunicaes
3.10
3.26
1.37%
22.31%
0.09
9.962
Utilities
3.06
2.78
1.86%
19.10%
0.04
14.19
Financeiras
2.68
2.37
5.02%
29.02%
-0.10
15.58
Tecnologia
3.77
3.07
9.42%
30.44%
0.16
7.065
Fonte: Datastream
53
3.1.8
A forma mais simples de estimar f (x) consiste em obter o histograma das frequncias relativas. Existem, no entanto, estimadores preferveis. Uma estimativa no paramtrica de f (x)
pode ser dada por
1 X
f^ (x) =
K
nh i=1
n
xi
h
onde K (u) uma fdp (ver detalhes no ponto 10.2). Sob certas condies, incluindo h !
p
0; n ! 1; nh ! 1 pode-se provar f^ (x) ! f (x) : Na figura 3-10 apresenta-se uma es-
timativa no paramtrica da fdp marginal dos retornos do Dow Jones no perodo Out/1988Jan/2010 (na verdade, esto representadas vrias estimativas: f (x1 ) ; f (x2 ) ; :::; f (xk ) ;
sendo fxk g uma sucesso de valores igualmente espaado no intervalo ( 0:07; 0:06) - vejase o eixo das abcissas da figura 3-10). Na figura representa-se tambm a fdp da N r; ^ 2
onde r e ^ 2 so as estimativas dos dois primeiros momentos dos retornos do Dow Jones no
perodo considerado.
Comparando f^ com a densidade normal, conclui-se que f^ atribui maior massa de probabilidade na vizinhana da mdia emprica e nos intervalos associados aos valores extremos
da amostra, e atribui reduzida massa de probabilidade no intervalo dos valores moderados da
54
3.2
3.2.1
1:
O coeficiente mede o grau de associao linear entre Y e X. Quanto mais alto for j j maior
a relao entre X e Y: Podemos tambm medir a associao linear entre yt e yt
yt e yt
ou entre
etc.
s
Como
Cov (yt ; yt s )
=p
Var (yt ) Var (yt s )
(FAC) (ou ACF em ingls). Se assumirmos Var (yt ) = Var (yt s ) vem
Cov (yt ; yt s )
Cov (yt ; yt s )
Cov (yt ; yt s )
=p
= q
=
.
Var (yt )
Var (yt ) Var (yt s )
(Var (yt ))2
^s =
O coeficiente
n s
Pn
y) (yt s
t=s+1 (yt
Pn
1
y)2
t=1 (yt
n
y)
s yt s
55
+ ut
permite ensaiar H0 :
=0
d
^k
1 1
;p
n n
p
Rejeita-se H0 ao n.s. de (aprox.) 5% se j^k j > 2= n (supondo 1=n
Teste Ljung-Box H0 :
= ::: =
0).
=0
Qm = n (n + 2)
m
X
k=1
1
n
^2k !
2
(m)
para simplificar a anlise, que E (rt ) = 0. Se o retorno hoje positivo, amanh o retorno
tender a ser negativo e vice-versa. Nestas circunstncias, se o retorno hoje alto vende-se
56
hoje e compra-se amanh. Existe, portanto, uma forte possibilidade de ganho (arbitragem)
com base na observao passada dos preos. Se outros participantes do mercado compram
e vendem com base neste padro de autocorrelao, o processo de arbitragem reduzir rapidamente a correlao (se o retorno hoje alto e positivo muitos participantes vendem hoje e
compram amanh; como consequncia o preo tender a diminuir hoje e aumentar amanh
e a correlao tender a esbater-se). Portanto, no credvel, supor-se
0:9:
Retome-se a figura 3-11. A coluna Q-Stat fornece os valores de Qm para m = 1; :::; 20:
Fixe-se por exemplo, m = 20: Tem-se Q20 = 36:613: O valor-p associado zero, isto ,
P (Q20 > 36:613) = 0:013: Logo existe evidncia contra a hiptese nula H0 :
20
= ::: =
rt =
r
^t
onde ^ t uma estimativa da volatilidade no momento t (rt pode ser encarado como os retornos expurgados de heterocedasticidade). Como obter ^ t ? Discutiremos esta questo com
alguma profundidade no captulo 8. suficiente agora usar uma especificao relativamente
simples (mas subptima):
^ 2t = (1
) rt2
+ ^ 2t 1 ;
= 0:96
Na figura 3-12 apresentam-se os coeficientes de autocorrelao de rt : Observa-se que os coeficientes de autocorrelao continuam muitos baixos mas agora no existe evidncia contra
a a hiptese
= ::: =
20
= 0:
57
3.2.2
Volatility Clustering
J vimos que valores muitos altos e muito baixos ocorrem frequentemente (com maior frequncia do que seria de esperar se as variveis seguissem uma distribuio normal). Este
valores extremos no ocorrem isoladamente: tendem a ocorrer de forma seguida (volatility
clustering). Na figura 3-14 representam-se os retornos dirios associados ao ndice Dow
Jones (1926-2006). Na figura 3-15 apresentam-se os mesmos retornos mas agora dispostos
por ordem aleatria no tempo. Algumas estatsticas destas duas sucesses so obviamente
iguais (mdia, desvio padro, coeficientes de assimetria e de achatamento). No entanto existem diferenas significativas. S no verdadeiro cronograma (figura 3-14) aparece uma
das propriedades mais importantes dos retornos: fortes (baixas) variaes so normalmente
seguidas de fortes (baixas) variaes em ambos os sentidos (volatility clustering)
Se fortes (baixas) variaes so normalmente seguidas de fortes (baixas) variaes em
58
Figura 3-13: Funes de autocorrelao de yt = log (GN Pt =GN Pt 1 ) onde GNP o PIB
dos EUA (dados trimestrais de 1947 a 2003).
0.2
0.15
0.1
0.05
0
-0.05
-0.1
-0.15
-0.2
-0.25
Jan-04
Jun-00
Apr-93
Nov-96
Sep-89
Jul-82
Feb-86
Dec-78
Oct-71
May-75
Mar-68
Jan-61
Aug-64
Jun-57
Apr-50
Nov-53
Sep-46
Jul-39
Feb-43
Dec-35
Oct-28
May-32
-0.3
0.2
0.15
0.1
0.05
0
-0.05
-0.1
-0.15
-0.2
-0.25
-0.3
Figura 3-15: Retornos dirios do Dow Jones dispostos por ordem aleatria
59
Figura 3-16: Funes de autocorrelao dos quadrados dos retornos (Dow JOnes)
ambos os sentidos, ento rt2 deve estar correlacionado7 com rt2 i (i = 1; 2; :::).
A figura 3-16, onde se apresentam as funes de autocorrelao de rt2 ; onde r o retorno
associado ao ndice Dow Jones, confirma esta ideia.
Nesta seco identifica-se o quadrado do retorno com a volatilidade. No inteiramente
correcta esta analogia, embora seja admissvel associar-se momentos de grande (baixa) volatilidade a valores altos (baixos) de rt2 : De qualquer forma, a principal concluso mantm-se:
fortes (baixas) variaes so normalmente seguidas de fortes (baixas) variaes em ambos
os sentidos e identificamos este fenmeno como volatility clustering.
3.2.3
Nos pontos precedentes observmos o seguinte: (1) valores muitos altos e muito baixos
ocorrem frequentemente e (2) estes valores extremos aparecem de forma seguida (volatility
clustering). Neste ponto refora-se a ideia de volatility clustering: no s os valores extremos
tendem a aparecer de forma seguida como tambm h alguma persistncia neste fenmeno.
7
Esta correlao poderia, em princpio, dever-se presena de uma mdia condicional no constante. Por
exemplo, se rt seguisse um MA(1), rt = rt 1 + ut ; onde ut um rudo branco, ento, por construo,
ter-se-ia Corr rt2 ; rt2 1 > 0: Se fosse este o caso, a melhor forma de continuarmos com o nosso argumento
seria centrar rt ; usando a mdia condicional, i.e. tomaramos r~t = rt
~t2 ; r~t2 1 = 0 se
t : Viria agora Corr r
2 2
rt fosse genuinamente um MA(1); no caso contrrio, se Corr r~t ; r~t 1 > 0; teramos evidncia em favor do
nosso argumento. Todavia, a centragem r~t = rt
t desnecessria, pois em sries financeiras de aces ou
de ndices de aces a mdia condicional , geralmente, aproximadamente igual a uma constante.
60
0.2
0.15
0.1
0.05
0
-0.05
-0.1
Oct-28
Apr-31
Oct-33
Apr-36
Oct-38
Apr-41
Oct-43
Apr-46
Oct-48
Apr-51
Oct-53
Apr-56
Oct-58
Apr-61
Oct-63
Apr-66
Oct-68
Apr-71
Oct-73
Apr-76
Oct-78
Apr-81
Oct-83
Apr-86
Oct-88
Apr-91
Oct-93
Apr-96
Oct-98
Apr-01
Oct-03
-0.15
500 j
Cak ;
61
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
1
76
151
226
301
376
451
526
601
676
751
826
901
976
Figura 3-18: FAC de jrt j onde rt o retorno dirio do Dow Jones (Jan. 1928 a Fev. 2006)
Rho
1.0
0.8
0.6
0.4
0.2
0.0
0
10
20
30
40
50
60
70
80
90
100
0:5
= 1=k (
C jkj
>0
3-19).
3.2.4
Efeito Assimtrico
o perodo seguinte. Se tomarmos como proxy da volatilidade a varivel jrt j ou rt2 devemos
62
d (rt 1 ; rt2 )
Corr
-0.049
-0.095
-0.081
-0.199
ndices Bolsistas
Amesterdo
Frankfurt
Hong Kong
Nova York
Taxas de Cmbio
Libra Britnica
Dlar Canadiano
Yen
Franco Suo
0.074
0.041
-0.008
0.014
= 0 contra H1 :
1 rt 1
+ ut
(3.5)
0.
Como a heterocedasticidade est invariavelmente presente nas sries temporais financeiras, convm empregar erros padro robustos contra heterocedasticidade (uma possibilidade neste sentido a utilizao da matriz de White). Recorda-se que, sob condies gerais,
a heterocedasticidade no afecta a consistncia do estimador OLS (afecta sim, como vimos,
os erros padro).
O efeito assimtrico , por vezes identificado como leverage effect depois de Black em
1976 ter notado que a volatilidade aumenta quando o mercado cai e o rcio de endividamento
(leverage ratio) aumenta. No entanto, vrios autores tm salientado que o leverage muito
reduzido quando comparado com o efeito assimtrico. Vrias explicaes tm sido propostas
para o efeito assimtrico.
63
Uma explicao designada por volatility feedback effect baseia-se na seguinte ideia.
Quando a volatilidade de uma activo aumenta, o risco agrava-se, e a rendibilidade
exigida para esse activo aumenta. Isto significa que o activo menos atractivo e,
portanto, a sua procura diminui, fazendo cair o respectivo preo. Esta explicao pressupe que o aumento da volatilidade precede a queda do preo (isto , esquematicamente, "
2
t 1
)"
2
t
(a diminuio do preo
3.2.5
Vrios estudos indicam que os coeficientes de autocorrelaes de rt2 e de jrt j tendem a aumentar com o aumento da frequncia das observaes.
3.2.6
CAC
DAX
7000
9000
8000
6000
7000
5000
6000
4000
5000
4000
3000
3000
2000
2000
1000
1000
1990 1992 1994 1996 1998 2000 2002 2004 2006
DJ EURO STOXX 50
FTSE 100
6000
7000
5000
6000
4000
5000
3000
4000
2000
3000
1000
2000
1000
1990 1992 1994 1996 1998 2000 2002 2004 2006
PSI20
S&P 500
16000
1600
14000
1400
12000
1200
10000
1000
8000
800
6000
600
4000
400
2000
200
1990 1992 1994 1996 1998 2000 2002 2004 2006
DAX
DJ EURO 50
FTSE 100
PSI 20
S&P 500
1
0.89
0.70
0.50
0.47
1
0.81
0.57
0.46
1
0.47
0.41
1
0.25
Tabela 3.4: Matriz de correlaes dos retornos dirios (Jan 90-Nov 06)
movimento de rendibilidade). A tabela 3.4, onde se apresentam os coeficientes de correlao
(marginal) dos retornos dirios, corrobora o co-movimento de rendibilidade. A figura 3-21
mostra que os perodos de alta e baixa volatilidade so aproximadamente coincidentes (comovimento de volatilidade). A tabela 3.5, onde se apresentam os coeficientes de correlao
(marginal) dos retornos ao quadrado, corrobora o co-movimento de volatilidade.
65
CAC
DAX
.08
.08
.04
.04
.00
.00
-.04
-.04
-.08
-.12
-.08
1990 1992 1994 1996 1998 2000 2002 2004 2006
DJ EURO STOXX 50
FTSE 100
.08
.06
.04
.04
.02
.00
.00
-.02
-.04
-.04
-.06
-.08
1990 1992 1994 1996 1998 2000 2002 2004 2006
PSI20
S&P 500
.08
.06
.04
.04
.02
.00
.00
-.02
-.04
-.04
-.08
-.06
-.12
-.08
1990 1992 1994 1996 1998 2000 2002 2004 2006
CAC
CAC
1
DAX
0.74
DJ EURO 50 0.91
FTSE 100
0.77
PSI 20
0.39
S&P 500
0.38
DAX
DJ EURO 50
FTSE 100
PSI 20
S&P 500
1
0.85
0.66
0.39
0.44
1
0.78
0.43
0.41
1
0.30
0.35
1
0.21
Tabela 3.5: Matriz de correlaes dos retornos dirios ao quadrado (Jan 90-Nov 06)
66
Captulo 4
Processos Estocsticos: Revises
(ltima actualizao: 04/2010)
4.1
Um processo estocstico um modelo matemtico para descrever, em cada momento, depois de um instante inicial, um fenmeno aleatrio. Este fenmeno definido num espao de probabilidade ( ; F; P ), onde,
e P uma proba-
Ft
Ft =
(ys ; s
4.2
(xs ; ys ; s
1 +ut ;
t) : Ento
E (yt j Ft 1 ) = E (xt yt 1 j Ft 1 ) = yt
Note-se que yt
E (xt j Ft 1 ) :
mas xt no (Ft
desconhece os
Em termos tcnicos, o evento (ou cenrio de mercado) ! 2 que determinou yt que pertence a Ft .
Para simplificar, assume-se Ft = fyt ; yt 1 ; :::; y1 g ou Ft = fyt ; yt 1 ; :::g e, neste caso, j pode-se dizer yt
pertence a Ft :
68
Com efeito,
E (XY j X = x) =
xyfyjx (yj x) dy = x
yfyjx (yj x) dy = x E (Y j X = x) :
R e Y uma v.a.
g (E (yj G)) :
E (g (Y )j G)
g (E (Y j G)) :
Se g cncava ento
(4.1)
g (a) + g 0 (a) (x
8x; a 2 B:
a) ;
g (E (Y )) + g 0 (E (Y )) (x
E (Y ))
g (Y )
g (E (Y )) + g 0 (E (Y )) (Y
E (Y )) :
ou
0
E (g (E (Y )) + g (E (Y )) (Y
E (Y ))) = g (E (Y )) :
g (E (Y )) ;
g cncava ) E (g (Y ))
g (E (Y )) :
69
g (x)
Conc./Conv.
Desigualdade
x2
convexa
E (Y 2 )
1
x
,x>0
convexa
log x, x > 0
cncava
Tambm se conclui E (Y 2 )
(E (Y ))2
1
Y
E (log (Y ))
1
E(Y )
log (E (Y ))
0:
Proposio 4.2.3 (Lei do Valor Esperado Iterado I) Suponha-se E (jY j) < 1. Ento
E (Y ) = E (E (Y j G)) :
Tambm se tem
E (Y ) = E (E (Y j X)) .
Com efeito, identificando fx ; fy ; fyjx e fy;x como as funes de densidade de probabilidade,
respectivamente de X; Y , Y jX e (Y; X) ; tem-se,
E (E (Y j X)) =
Exemplo 4.2.4 Suponha-se que Y dado X tem distribuio condicional de Poisson de parmetro
= X: Suponha-se ainda que X tem distribuio do Qui-Quadrado com um grau de liberdade. Logo, pela proposio 4.2.3, vem
E (Y ) = E (E (Y j X)) = E ( X) = :
Exemplo 4.2.5 Considere-se o modelo yt = xt + ut : Seja FtX = fxt ; xt 1 ; :::g : Suponha-
70
E (yt ) = E E
xt j FtX
= E E
=
+ E E ut j FtX
E (xt ) :
ado iterado,
E (yt ) = E (E (yt j Ft 1 ))
Logo E (yt ) = a +
+ ut j Ft 1 ))
E (E (a + xt yt
E (a + E (xt yt 1 j Ft 1 ) + E (ut j Ft 1 ))
E (a + yt
E (a + yt
1 x)
a+
E (xt j Ft 1 ) + 0)
E (yt 1 ) = a +
E (yt ) ) E (yt ) = a= (1
E (yt )
x) :
H.
Ento
E (Y j G) = E ( E (Y j H)j G) :
Exemplo 4.2.7 Considere-se yt = a + yt
71
Ft
; tem-se
E (yt j Ft 2 ) = E ( E (yt j Ft 1 )j Ft 2 )
=
E (a + yt 1 j Ft 2 )
a + E (a + yt
a + (a + E (yt 2 j Ft 2 ))
a + (a + yt 2 )
= a+ a+
yt
= a + yt
+ ut 1 )
+ ut 1 j Ft 2 )
4.3
1)
= E (E ( E ( E (yt j Ft 1 )j Ft 2 )j Ft 3 ) :::) :
1:
e yt ; para todo o
(trata-se de uma forma de dependncia temporal) e (2) yt reverte para zero, E (yt ) = 0.
Suponha-se ainda que y estacionrio. A fdp marginal constante ao longo do tempo.
No entanto, as densidades condicionais variam. Considere-se a fdp f (y2 j F1 ) traada na
2
1)
como f ( yt j yt
72
1 ; yt 2 ; :::; y1 ).
f (y 6 F5 )
8
f (y 2 F1 )
6
4
2
0
1
-2
-4
-6
= E (yt j Ft 1 ) =
yt f (yt j Ft 1 ) dyt
Z
2
= Var ( yt j Ft 1 ) =
(yt
t ) f (yt j Ft 1 ) dyt :
E (yn+1 j Fn ))
E (yn
g (Fn ))2
onde g (Fn ) um qualquer outro previsor Fn mensurvel (i.e. que usa tambm toda a
informao disponvel at ao momento n).
73
Dem. Tem-se
E (yn
g (Fn ))2
= E (yn
E (yn+1 j Fn ) + E (yn+1 j Fn )
= E (yn
E (yn+1 j Fn ))
+ E [(yn
g (Fn ))2
g (Fn ))2
+ E (E (yn+1 j Fn )
E (yn+1 j Fn )) (E (yn+1 j Fn )
g (Fn ))]
Como o terceiro termo zero (deixa-se como exerccio essa demonstrao) vem
E (yn
g (Fn ))2
+ E (E (yn+1 j Fn )
= E (yn
E (yn+1 j Fn ))
E (yn
E (yn+1 j Fn ))
g (Fn ))2
O valor E (yn+1 ) tambm um previsor no enviesado de yn+1 mas, como no usa a informao disponvel Ft 1 ; pode demonstrar-se que bastante menos preciso do que o previsor
E (yn+1 j Fn ).
Pode-se tambm provar
E (yn+h
E (yn+h j G))
E (yn+h
E (yn+h j H))
G.
Esta desigualdade resulta do facto de em G existir mais informao. natural esperar que
um previsor que use mais informao face a um outro, tenha um EQM inferior. Tm-se ainda
os seguintes casos limites quando o previsor um valor esperado condicionado.
G = F = F 1 ) E (yn+h
E (yn+h j G))
= E (yn+h
yn+h )2 = 0
H =? ) E (yn+h
E (yn+h j H))
= E (yn+h
E (yn+h ))
Exemplo 4.3.1 Considere: A) Tem-se uma sucesso de retornos do PSI20 e retira-se aleatoriamente um elemento da sucesso. Suponha-se que a mdia e a varincia desse retorno so
conhecidas. B) Suponha que os retornos do PSI20 registaram hoje uma forte quebra e
uma forte volatilidade. Q1: Qual a informao mais relevante se o objectivo prever os
retornos do PSI20 e a volatilidade para o dia de amanh? A ou B? Q2: Neste caso, qual
a fdp que interessa estudar? f (yt j Ft 1 ) ou f (yt )? Q3: Qual a informao relevante se o
objectivo conhecer as caractersticas gerais da srie dos retornos (ou prever os retornos e
74
a volatilidade para um horizonte de vrios anos)? Q4: Neste caso, qual a fdp que interessa
estudar? f (yt j Ft 1 ) ou f (yt )?
Considere o modelo de sries temporais,
yt = c + yt
j j<1
+ ut ;
) : Determine-se a dis-
N (E (yt j Ft 1 ) ; Var ( yt j Ft 1 ))
onde
E (yt j Ft 1 ) =
c + yt
Var (yt j Ft 1 ) =
E (yt
1
2
E (yt j Ft 1 )) Ft
= E u2t Ft
Assim,
yt j Ft
N c + yt 1 ;
(4.2)
c
1
Var (yt ) =
2:
c
1
+ ut + ut
ut
+ :::
imediatamente se conclui que y tem distribuio marginal normal (uma soma de v.a. normais tem distribuio normal). Tambm se conclui, a partir da representao MA(1), que
3
A forma mais intuitiva de obter este resultado, consiste em aplicar o mtodo recursivo (iterando yt ad
infinitum). Por exemplo, yt = c + yt 1 + ut = c + (c + yt 2 + ut 1 ) + ut ; e assim sucessivamente.
75
E (yt ) = c= (1
) e Var (yt ) =
yt
1 se observou yt
= 1
(4.3)
+ ut ; onde ut
1
1
yt j Ft
N (0; 5:26)
N ( 1:8; 1) :
2) = 0:0359.
1 registou-se yt
2:
Exemplo 4.3.3 Retome-se o exemplo 4.3.2 e suponha-se que se tm n observaes e se pretende obter uma previso para o perodo n + 1: Podemos usar uma infinidade de previsores,
mas analisem-se apenas os seguintes:
E (yn+1 j Fn ) = 0:9yn
E (yn+1 ) = 0:
De acordo com a discusso anterior, o previsor E (yn+1 j Fn ) mais preciso do que
E (yn+1 ) : A preciso aqui aferida atravs do erro quadrtico mdio (EQM) e, com efeito,
observa-se que
E (yn+1
E (yn+1 j Fn ))
= 1 < E (yn+1
76
E (yn+1 ))
= 5:263
B
5
40
30
20
10
0
-10
-20
-30
-40
-50
3
1
-1
-3
-5
1
26
51
76
26
51
76
30
15
25
10
20
15
10
5
-5
-10
-5
-15
1
26
51
76
26
51
76
4.4
4.4.1
E (ut us ) = 0; 8s 6= t
Procure identificar o processo rudo branco na figura 4-2.
4
77
ut e us so independentes 8s 6= t
Se adicionalmente ut
N (0;
+ ut
e ut um RB. yt diz-se um processo passeio aleatrio com deriva (random walk with drift)
78
120
1200
100
1000
80
800
60
40
RW
600
20
Var
400
0
-20
101
201
301
401
501
601
701
801
901
-40
d (yt ) = Pt (yi
Figura 4-3: Processo RW e Var
i=1
se
200
yt = yt
yt )2 =t
6= 0:
+ + ut ;
E (yt ) = E (y0 ) ;
t;
E (yt yt k ) =
d (yt ) = Pt (yi
Na figura 4-3 apresenta-se um processo RW e Var
i=1
4.4.2
(t
k) :
yt )2 =t:
Estacionaridade
Var (yt ) =
Cov (yt ; yt
h)
(no depende de t)
;
(no depende de t)
(h)
f(x) 0.3
0.2
0.1
-4
-3
-2
-1
1
.
(1 + x2 )
jxj f (x) dx =
jxj
1
dx
(1 + x2 )
no converge e, portanto, E (jut j) no est definido (i.e. no existe). Na figura 4-4 traa-se
a funo f (x) : Como a fdp tem abas muitos pesadas atribui uma massa de probabilidade
considervel para valores muito afastados da mdia. Isto significa que embora o centro de
gravidade da fdp seja zero, valores muito afastados de zero podem ocorrer com probabilidade
no nula (veja-se a figura 4-5).
Definio 4.4.6 y um processo estritamente estacionrio (EE) se a distribuio conjunta
de (y1 ; y2 ; :::; ys ) igual distribuio conjunta de (yk+1 ; yk+2 ; :::; yk+s ) ; para qualquer
s 2 N e k 2 Z.
80
800
600
400
200
0
-200
-400
-600
-800
-1000
-1200
-1400
1
101
201
301
401
501
601
701
801
Figura 4-5: Uma trajectria simulada do processo yt = 10 + ut , onde fut g uma sucesso
de v.a. i.i.d. com distribuio de Chauchy
Na seco 4.5 discute-se com maior profundidade este conceito.
Observao 4.4.1 Um processo estritamente estacionrio deve verificar, em particular, a
seguinte condio:
fy1 (x) = fy2 (x) = ::: = fyn (x) = f (x)
(4.4)
(as densidade marginais de y1 ; y2 ,..., yn so iguais para todo o t). Esta condio decorre da
aplicao da definio anterior para s = 1. Resulta de (4.4) que se E (jg (yt )j) < 1; ento
E (jg (yt )j) constante e no depende de t; pois
E (jg (yt )j) =
8t:
Ambas as definies de estacionaridade basicamente exigem que a estrutura probabilstica se mantenha constante ao longo do tempo. No entanto, enquanto a estacionaridade estrita
exige que toda a estrutura probabilstica se mantenha constante ao longo do tempo, a ESO
apenas faz essa exigncia para os dois primeiros momentos e para a autocovarincia.
Exemplo 4.4.1 Considere-se o processo,
yt = 0:2yt
onde
ut =
8
<
:
j j<1
+ ut ;
se t
t
k 2
t
k
81
2000
se t > 2000
(4.5)
(4.6)
sendo
iid
N (0; 1) e
iid
s
t(k) . Para t
2000
tem-se
E (ut ) = E ( t ) = 0;
Var (ut ) = Var ( t ) = 1
e para t > 2000;
E (ut ) = E
Var (ut ) = Var
2
k
2
k
!
t
= 0;
!
2
k
k
k
= 1:
marginal de ut para t > 2000 (no primeiro caso normal; no segundo t-Student). No se
cumpre assim a condio (4.4). A mesma concluso se aplica a y: ESO mas no EE. Na
figura 4-6 representa-se uma trajectria simulada a partir das equaes (4.5) e (4.6), com
k = 3 (graus de liberdade). Observe-se que a partir de t = 2000 comeam a aparecem
valores muito altos e muitos baixos (outliers) j que os erros passam a ter distribuio
t-Student com 3 graus de liberdade (embora a varincia dos erros se mantenha sempre igual
a 1). Observa-se, portanto, uma alterao da estrutura probabilstica do processo a partir
de t > 2000 que implica a no estacionaridade estrita do processo.
Alguns factos:
Se E (yt2 ) < 1 e y estritamente estacionrio (EE), ento y ESO.
Com efeito, tem-se fyt (y) = f (y) ; 8t (por hiptese) e, portanto,
E (yt ) =
Var (yt ) =
xfyt (x) dx =
(x
xf (x) dx = E (y) ;
Z
2
2
E (yt )) fyt (x) dx = (x E (y)) f (x) dx = Var (y) :
Por outro lado, fyt ;yt+h (x; y) = fys ;ys+h (x; y) ; 8t; s (por hiptese) e, portanto, a ex-
82
Z Z
Z Z
4.4.3
Fraca Dependncia
A propriedade fraca dependncia crucial para se invocar resultados limites como sejam
a lei dos grandes nmeros e o teorema do limite central. Considere-se, por exemplo, a mdia
P
emprica yn = n 1 nt=1 yt : Sob certas condies, a lei fraca dos grandes nmeros estabelece
p
yn ! E (y) : Este resultado pode ser provado da seguinte forma: se limn E (yn ) = E (y) e
83
limite yn reduz-se a uma constante) envolve a suposio de que a sucesso fyt g fracamente
dependente num sentido que precisaremos a seguir. Com efeito,
n
X
1
Var (yn ) =
Var
yt
n2
t=1
n
X
1
=
n2
Var (yt ) + 2
t=1
n 1 X
n
X
Cov (yi ; yi j ) :
j=1 i=j+1
Sem hipteses adicionais no garantido que estas duas somas convirjam. Comece-se por
assumir que fyt g ESO. Nestas condies a covarincia Cov (yi ; yi j ) s depende de j =
i (i
(j).
Vem,
1
Var (yn ) =
n2
2X
+
(j) 1
n
n j=1
2
O primeiro termo
(j)
n 1
n
X
2 X
(j)
1 ( (j) no depende de i)
n2 j=1
i=j+1
n 1
2 X
+ 2
(j) (n
n
n j=1
2
+2
j=1 i=j+1
n 1 X
n
X
n 1
j)
j
n
necessrio no s que (j) convirja para zero, mas tambm que essa convergncia seja relativamente rpida. Note-se de passagem que a estacionaridade no garante fraca dependncia.
As condies de aplicao do teorema do limite central so ainda mais exigentes. Sob
p
d
certas condies tem-se, como se sabe, n (yn E (y)) ! N (0; 2 ) ; onde 2 uma conp
p
stante finita, definida como 2 = limn Var ( n (yn E (y))) = limn Var ( nyn ) : Se fyt g
estacionrio, tem-se
Var
nyn =
+2
n 1
X
j=1
(j) 1
j
n
e, agora, comparativamente ao caso anterior, (j) tem de convergir ainda mais rapidamente
P
para zero para que a soma Sn = nj=11 (j) 1 nj convirja. Por exemplo, uma funo de
84
autocorrelao do tipo (j) = 1=j resulta numa soma Sn divergente. A soma converge se a
funo de autocorrelao for, por exemplo, do tipo (j) = aj ; com jaj < 1.
Existem vrias definies de processos fracamente dependentes envolvendo os chamados mixing coefficients ( -mixing, -mixing, -mixing entre outros) que permitem avaliar
e medir o grau de dependncia recorrendo a diferentes interpretaes do conceito de independncia. Vamos adoptar uma definio alternativa para caracterizarmos um processo
fracamente dependente baseada na definio de Wooldridge (1994):
p
Definio 4.4.7 y um processo fracamente dependente se limn Var ( nyn ) = c > 0:
Infelizmente esta definio tem a seguinte desvantagem: se y fracamente dependente
no sentido da definio 4.4.7, e g uma funo com boas propriedades, no possvel
concluir, em termos gerais, que zt = g (yt ) ainda um processo fracamente dependente. J
se yt -mixing possvel inferir, sob certas condies gerais, que zt = g (yt ) ainda
-mixing (digamos, a transformao g preserva a propriedade de fraca dependncia do
processo quando baseada no conceito dos mixing coefficients).
Comentrios Finais
Por que razo importante o estudo da estacionaridade e da fraca dependncia (em sries
temporais)? Apontam-se algumas razes:
A aplicao do teorema central e a lei dos grandes nmeros so dois pilares da inferncia estatstica. Considere-se, por exemplo,
1X
yn =
yt :
n t=1
n
Sob certas condies, a aplicao da lei dos grandes nmeros e do teorema do limite
central, permite obter, respectivamente
p
yn ! E (y) ,
y
E (y) d
pn
! N (0; 1) :
Var (yn )
***
Para terminar esta seco, tecem-se algumas consideraes crticas aos modelos de sries
temporais baseados em pressupostos estacionrios.
Sero as sries temporais financeiras e econmicas verdadeiramente estacionrias? Como
j argumentmos, a estacionaridade envolve uma determinada hiptese de estabilidade da
estrutura probabilstica do processo. Esta estrutura depende de uma mirade de factores,
como por exemplo, dos agentes econmicos (privados e pblicos) e das suas relaes, da
tecnologia, da informao, do puro acaso (entre outros factores). Apenas o puro acaso
pode ser considerado imutvel ao longo do tempo; tudo o resto evolui ao longo do tempo,
pelo que um mito supor-se que a estrutura probabilstica de uma srie temporal financeira ou econmica permanece constante ou aproximadamente constante ao longo do(s)
tempo(s). Suponha-se que se estuda a taxa de variao relativa anual do PIB portugus
(yt = log (P IBt )
cia forem alguns dezenas de anos (isto , praticamente todos os testes estatsticos disponveis,
apontariam nessa direco). Mas, se alargarmos a amostra para vrias centenas de anos
(supondo que tal era possvel), extremamente implausvel y ser estacionrio (a histria
86
4.5
Nesta seco, retomam-se alguns conceitos j abordados, relacionados com a estacionaridade, e exploram-se novas definies que sero teis no estudo dos processos no lineares. Concretamente, objectivo deste ponto estabelecer condies suficientes para que
um processo de Markov no linear seja ergdico e EE.
4.5.1
Definies
= fy1 ; :::; yt 1 g :
Considere-se, por exemplo, uma partcula suspensa num meio homogneo. Se no momento s, a posio
e a velocidade da partcula forem conhecidas, torna-se desnecessrio considerar toda a trajectria anterior da
partcula com vista a estabelecer a sua evoluo provvel a partir do momento s. Observe-se que no basta
conhecer s a posio ou s a velocidade. Por vezes sucede que determinado processo no de Markov, mas
esse processo juntamente com outro pode definir um processo de Markov. O exemplo que se apresenta a seguir
(AR(2)) tambm mostra que possvel obter a propriedade Markoviana atravs da expanso do espao de
estados.
87
1 yt 1 + 2 yt 2 +
ut ; no de Markov pois
P (yt < j y1 ; :::; yt 1 ) = P (yt < j yt 2 ; yt 1 ) 6= P (yt < j yt 1 ) :
No entanto, possvel represent-lo na forma Markoviana. Considerem-se as mudanas de
varivel
y1;t = yt ;
y2;t = yt 1 :
Assim,
y1;t =
1 y1;t 1
y2;t = y1;t
2 y2;t 1
+ ut
y1;t
ou ainda
0
@
y1;t
A = @
y2;t
| {z }
yt
yt =
yt
{z
10
A@
A+@
y2;t 1
}|
{z
}
yt
+ ut :
ut
A;
0
| {z }
ut
O processo vectorial fyt g agora de Markov. Este procedimento generaliza-se facilmente para o caso AR(p).
Tambm o processo no linear do tipo
yt = g (yt 1 ; yt 2 ; :::; yt p ) + ut
onde fut g uma sucesso de v.a. i.i.d. e independentes de yt k ; k
0
p+1 )
e
x = (x1 ; x2 ; :::; xp )0 ;
88
0
@
y1;t
A=@
y2;t
| {z }
yt
yt = @
yt
yt
A := @
y1;t
y2;t
1
A
g(yt
1)
A+@
}
ut
A:
0
| {z }
ut
Para simplificar, na discusso que se segue trabalha-se com processos estocsticos univariados Markovianos; contudo, est subjacente que se o processo y no de Markov ser
sempre possvel represent-lo na forma multivariada como um processo de Markov.
A funo de distribuio condicional a n passos de um processo de Markov
P (yn+k < yj yk )
(observe-se que desnecessrio escrever P (yn+k < yj Fk ) ; pois y um processo de Markov).
Por seu lado, a funo densidade condicional (tambm designada por densidade de transio), caso exista, dada por
fn (yj x) =
@P (yn+k < yj yk )
:
@y
(n 2 N)
para todo o k e s 2 Z:
Se y um processo homogneo, para avaliar probabilidades condicionadas do processo,
no interessa o momento em que essas probabilidades so calculadas. Por exemplo, no caso
P (yn+k < j yk = x) as probabilidades so calculadas no momento no k (ou com base na
89
+ ut ;
j j<1
N ( yt 1 ;
+ ut j yt 1 ) = yt
yt 1 )2 yt
= E u2t yt
) resulta
1
1
f1 (yj yt 1 ) = p
(y
exp
2
2 2
2
Z y
F1 (yj yt 1 ) =
f1 (uj yt 1 ) du:
yt 1 )2 ;
A notao usada para Fn ( yj x) ; sublinha que se tem uma funo de transio a n passo (da o ndice n),
que a condio inicial apenas depende de x; e que o processo homogneo (caso contrrio Fn ( yj x) deveria
depender tambm do momento em que calculada).
90
Para obter E (yt j y0 ) ; Var (yt j y0 ) e ft (yj y0 ) necessrio representar yt como funo de
y0 . Tem-se
yt =
=
yt
+ ut
( yt
+ ut 1 ) + ut =
yt
+ ut
+ ut
= :::
=
y0 +
t 1
t 2
u1 +
u2 + ::: + ut
+ ut :
E (yt j y0 ) =
y0
e
Var (yt j y0 ) = E
= E
=
yt
t 1
1+
1
1
y0
t 2
u1 +
2
y0
+ ::: +
u2 + ::: + ut
2(t 1)
+ ut
y0
(soma geomtrica)
2t
Isto ,
yt j y0
y0 ;
1
ft (yj y0 ) = p
exp
2 Var ( yt j y0 )
Z
Ft (yj y0 ) =
1
1
2t
2
1
(y
2 Var (yt j y0 )
E (yt j y0 ))
ft (uj y0 ) du:
1
91
yn+s j ys = x
x;
x;
1
1
1
1
2n
2
2n
2
yn+k = yk +
ui yk = x
N x;
ui y s = x
N x;
) : Tem-se,
i=k+1
yt+s = ys +
n+s
X
n :
i=s+1
F1 (yj u) Fn
(duj x) :
Caso exista a fdp condicionada, a equao de Chapman-Kolmogorov pode tambm ser escrita na forma
fn (yj x) =
f1 (yj u) fn
(uj x) du:
(4.7)
Gk =
jh (x)
g (x)j dx:
A definio de ergodicidade varia bastante na literatura. Usaremos a definio que se designa por ergodicidade Harris. Veja-se, por exemplo, Fan e Yao (2005).
92
Exemplo 4.5.4 Seja g a fdp associada distribuio N (0; 1) e hn a fdp associada distribuio t (n) (t-Student, com n graus de liberdade). Para n fixo, a variao total kHn
positiva, mas kHn
Gk
lugar, faa-se
n
g (x)j :
(x) = 0 (este
em R para zero, pelo que, o operador de limite pode trocar com o operador de integrao.
Assim,
lim kH
n!1
Gn k =
lim
n!1
jhn (x)
g (x)j dx
n!1
g (x)j dx
g (x)j dx
= 0:
kFn (yj x)
F (y)k ! 0
= 1 e geometricamente ergdico se
(4.8)
< 1: F
jfn (yj x)
f (y)j dy ! 0
= 1 e geometricamente ergdico se
93
(4.9)
< 1: f a
A definio adoptada de ergodicidade Harris, permite efectivamente relacionar a ergodicidade com estacionaridade estrita (Chan 1990, 1993), tal como consta da
Proposio 4.5.1 Suponha-se que y ergdico. Ento existe uma distribuio estacionria
F tal que o processo y; inicializado com a distribuio F; EE.
Dem. Apndice 4.A.
Para processos nas condies da proposio anterior, a lei forte dos grandes nmeros
verifica-se sempre:
Proposio 4.5.2 Suponha-se E (jh (y)j) < 1: Nas condies da proposio 4.5.1 verificase
1X
qc
h (yt ) ! E (h (y)) ;
n t=1
n
(qc: convergncia quase certa ou com probabilidade 1) qualquer que seja o valor inicial do
processo y.
Por exemplo, se y ergdico e EE e se E (eyt ) < 1; ento
1 X yt qc
e
! E (ey )
n t=1
n
que possvel, em certas circunstncias, provar-se (4.8) ou (4.9) de forma indirecta, atravs
de resultados auxiliares. Antes de entramos nesta questo no ponto seguinte, veja-se um caso
em que a aplicao directa de (4.9) relativamente simples.
Exemplo 4.5.5 Retome-se o exemplo 4.5.1, mas use-se agora a densidade condicional a n
passos (poderia ser tambm a t passos). Conclumos que
yn j y0 = x
x;
1
fn (yj x) = p
exp
2 Var (yn j x)
Note-se que
lim E (yn j x) =
n!1
lim Var ( yn j x) =
n!1
lim
lim
n!1
2
2
x = 0;
1
1
n!1
lim fn (yj x) = r
n!1
2
2n
1
1
2n
2
2
exp
1
8
<
2;
1
y
: 2
2
2
jfn (yj x)
9
=
;
= f (y) :
f (y)j dy ! 0: Efectiva-
mente, pode mostrar-se esse resultado e, nessas condies, y um processo EE, com distribuio estacionria dada por f (y) e momentos estacionrios E (y) = 0 e Var (y) =
2
= 1
= 0:7 e
dada por
y
0;
0:7
1 0:82
= N (0; 1:944) :
tirado ao acaso da sucesso fy10 ; y11 ; :::g ; por exemplo y100 ; tem distribuio estacionria
N (0; 1:944) : Naturalmente, se o valor anterior y99 for observado e usarmos essa informao para prever y100 ; a distribuio pertinente passa a ser a distribuio condicional
habitual (a um passo). Na figura 4-7 mostra-se a convergncia da sucesso de funes
ffn (yj x = 2) ; n = 1; 2; 3; 8g para a distribuio estacionria f (y) : A distribuio estacionria, que coincide com a distribuio marginal do processo, relevante porque mostra
95
0.6
0.5
0.4
0.3
0.2
0.1
0
-5.0
-4.0
-3.0
-2.0
Dist. Est
-1.0
0.0
n=1
1.0
2.0
n=2
3.0
n=3
4.0
5.0
n=8
4.5.2
1; com
kxk!1
e as razes do polinmio 1
b1 z
jg (x)
:::
(b1 x1 + ::: + bp xp )j
=0
kxk
bp z p esto fora do circulo unitrio.
96
jg (x)j
(c) Existe uma constante
2 (0; 1) ; c e ai
jg (x)j
1 yt 1
2 yt 2
+ ut
1 x1
2 x2 :
e b2 =
2;
as razes de
+ ut
1
x2
1 + x2
< ~ < 1;
conclui-se
jxj + ~
jg (x)j
para
97
yt =
8
<
0:5yt
: 0:5y
t
1
1
+ ut
+ ut
se yt
<0
se yt
0:
onde u um rudo branco Gaussiano. Este modelo pode ser reescrito na forma:
yt =
onde
0:5Ifyt
1 <0g
+ 0:5Ifyt
0g
t yt 1
+ "t ;
: Tem-se g (x) =
0:5Ifx<0g + 0:5Ifx
0g
x:
Vem
jg (x)j
0:5Ifx<0g + 0:5Ifx
jxj
0g
jxj
com
pode tambm escreve-se na forma yt = 0:5 jyt 1 j + "t e a aplicao da proposio 4.5.4
imediata.
Exemplo 4.5.9 Considere-se o processo
8
< 1 + 0:5y + u
t 1
t
yt =
: 1 0:5y + u
t 1
yt
yt
<0
0:
Ifx
0g
Ifx
0g
+ 0:5Ifx<0g
0:5xIfx
0:5Ifx
0g
0g
x:
Assim,
jg (x)j
1 + 0:5Ifx<0g
0:5Ifx
0g
jxj
1 + 0:5 jxj
e a proposio 4.5.4 aplica-se imediatamente com c = 1 e
um processo ergdico.
98
= 0:5 (ou
4.5.3
Estabilidade em EDF
Chamamos equao s diferenas finitas (no estocsticas) EDF (de primeira ordem, para
simplificar) equao
yt = g (yt 1 ) ;
y0 =
(condio inicial).
(4.10)
(por exemplo, g (2) (x) = g (g (x))). O estudo da funo g (t) (x) essencial na anlise qualitativa das solues. Concretamente, yt = g (t) (y0 ) fornece o valor de y no momento t como
funo do valor inicial y0 : Sabendo g (t) podemos, por exemplo, estudar a sensibilidade da
soluo face aos valores iniciais; permite tambm estudar o comportamento assimpttico
da soluo quando t ! 1: Em certos casos, a estacionaridade e ergodicidade podem ser
deduzidas a partir da anlise qualitativa das equaes s diferenas finitas determinsticas
(EDFs). Por exemplo, considere-se a proposio 4.5.4 condio (c), no caso univariado
(g : R ! R), posta na forma jg (x)j < jxj (com c = 0). Resulta,
jg (y0 )j
g (2) (y0 )
jy0 j
= jg (g (y0 ))j
jg (y0 )j
jy0 j
:::
g (t) (y0 )
jy0 j
e, portanto, yt = g (t) (y0 ) ! 0 quando t ! 1; independentemente do valor inicial. Dizse nestes casos que o valor 0 um ponto assimptoticamente estvel8 . Observe-se que a
mesma condio que assegura a estacionaridade estrita no mbito dos processos estocsticos,
assegura tambm a estabilidade assimpttica do ponto zero no mbito das EDF (veja-se o
8
um
Na verdade, a definio menos exigente: o valor zero um ponto fixo assimptoticamente estvel se existir
(t)
(y0 ) ! 0 quando t ! +1:
0 > 0 tal que a desigualdade jy0 j
0 implica g
99
ponto 7.2).
4.5.4
( t ) yt
+ ut
(4.11)
no se aplicam, pois a equao (4.11) no pode ser representada na forma yt = g (yt 1 ; yt 2 ; :::; yt p )+
ut . A teoria assimpttica est especialmente desenvolvida para a seguinte classe de modelos
AR com coeficientes aleatrios:
Definio 4.5.4 Uma equao vectorial autoregressiva de dimenso d com coeficientes aleatrios
i.i.d. no negativos uma equao da forma
y t = At y t
+ Bt
(4.12)
(R+ ) :
positivos.
Inmeros processos no lineares podem ser representados na forma (4.12), como mostra
o
Exemplo 4.5.10 Considere-se o processo ut com heterocedasticidade condicionada de ordem (2; 1) ; (GARCH(2,1))
ut =
2
t
t "t
= !+
2
1 ut 1
2
2 ut 2
2
1 t 1
2
2 t 2;
!;
i;
> 0:
Procure-se representar este processo na forma (4.12). Para o efeito, observe-se que
2
t
= !+
= !+
2
2
1 t 1 "t 1
2
1 "t 1
+
1
2
2
2 t 2 "t 2
2
t 1
100
2
2 ut 2
2
1 t 1
2
2 t 2
2
2 t 2:
Tem-se
0
B
B
B
@
2
t
2
t 1
C B
C B
C=B
A @
u2t 1
| {z }
yt
0
|
2
1 "t 1
1
"2t
{z
2
t 1
CB
CB
0 CB 2t 2
A@
u2t 2
0
}| {z
0
1
10
yt
At
!
C B C
C B C
C + B 0 C:
A @ A
0
} | {z }
Bt
+ Bt ;
+
E (log jA1 j) < 0 e E log jB1 j < 1: Ento y converge (com probabili-
+ jut j ;
Bt = jut j :
101
+et
yt
+ jut j
(4.13)
onde
+et
Bt = jut j :
Como fAt g uma sucesso positiva de v.a. i.i.d., a equao (4.13) respeita a definio
4.5.4 (e, assim, o corolrio 4.5.1 aplicvel). A condio E log+ jB1 j < 1 verificase imediatamente, tendo em conta a distribuio assumida para u: Relativamente outra
condio, vem
E (log jA1 j) = E log e
+e1
= E ( + e1 ) = :
Se
Exemplo 4.5.13 Considere-se o processo ut com heterocedasticidade condicionada de ordem (1; 1) ; (GARCH(1,1))
ut =
2
t
t "t
= !+
2
1 ut 1
2
1 t 1
!;
1;
> 0:
2
t
pode escrever-se
na forma
2
t
9
Se u
idade 2e
=!+
2
2
1 t 1 "t 1
e2y
2
2
1 t 1
=!+
2
1 "t 1
2
t 1:
102
Tem-se assim
2
1 "t 1
At =
Bt
B = !:
Verifica-se que (At ; B) uma sucesso de v.a. positivas i.i.d. Para que
2
t
admita uma
< 0:
(4.14)
Nelson (1990) obteve esta condio10 , mas sem recorrer proposio 4.5.5. Tem-se assim
2
t
que
2t
1t ; 2t )g
definido por ut =
t "t
tambm EE.
Exemplo 4.5.14 Retome-se o exemplo 4.5.10. Suponha-se que " um rudo branco com
distribuio N (0; 1) : Considerando a norma
kAk = max
1 i n
n
X
jaij j ;
j=1
tem-se
0 0
B
B
log kA1 k = log B
@
B
B
B
@
= log max
= max log
O valor esperado E log 1 "20 +
programa Mathematica permite obter
10
E log
2
1 "0
2
1 "0 +
"20
2
1 "0
2
1 "0
+j
+j
C
C
0 C
A
0
2j
+j
2j
+j
1
1
C
C
C
A
2
2 j ; 1; j"0 j
2j
; 0; log j"0 j2
er
+ log
EulerGamma
HypergeometricPFQ f1; 1g ;
A explicao destas funes pode ver-se no programa Mathematica.
103
3
2; 2
;2
N (0; 1) : O
4.5.5
2
1 "0
< 0:
x2B
(4.15)
104
kxk > K:
=!+
2
1 "t 1
2
t 1
supondo " um rudo branco Gaussiano com varincia igual a 1. A proposio 4.5.5
a mais adequada para tratar este caso. No entanto, tambm 4.5.7 pode ser invocada. O
processo obviamente aperidico, tendo em conta a distribuio de ": No fcil verificarse (4.15), pois as probabilidades de transio a n passos no so conhecidas. no entanto
pacfico assumir-se que
2
t;
g (x; u1 ) = ! +
irredutvel. Tem-se,
2
1 "1
x :
E !+
< jxj ;
jxj > K ?
Para jxj suficientemente grande, tal que jxj > K; o valor de ! irrelevante11 . Assuma-se
assim ! = 0: Vem
2
1 "1
E
se e s se E (j
2
1 "1
1 j)
<
=E
2
1 "1
x < jxj ;
jxj > K
11
Considere-se, por exemplo, j! + 0:98xj < 0:99 jxj : Esta desigualdade no se verifica para todo o x 2 R.
No entanto, para qualquer valor de !; existe certamente um K tal que jxj > K ) j! + 0:98xj < 0:99 jxj :
105
trada:
2
1 "1
E
2
1 "1
Atendendo a
< 1:
< 1:
(4.16)
2
1 "0
1 ))
< 0 (as
4.A
Demonstraes
@
F
@y n
(yj x) : Considere-
(4.17)
Por hiptese, y0 (valor inicial) tem densidade estacionria fy0 = f: Resulta de (4.17) que y1
tambm tem densidade estacionria f; pois
fy1 (y) =
Por induo, conclui-se que fyt (y) = f (y) qualquer que seja t. Por outro lado, devido
homogeneidade e propriedade de Markov, a densidade conjunta de (yn ; yn 1 ; :::; y1 ; y0 )
fyn ;yn
1 ;:::;y1 ;y0
1 ;:::;yk+1 ;yk
pois f1 (yj x) no depende do momento em que calculada (apenas depende dos argumentos
106
107
Pgina em branco
108
Parte II
Modelos
109
Pgina em branco
110
Captulo 5
O Problema da Especificao
(ltima actualizao: 1/2010)
5.1
t = :::; 1; 0; 1; :::
111
(5.1)
N (0; 1)
yt = 0:5yt
+ "t ;
t = 2; 3
alteraes no DGP ao longo do tempo (como por exemplo, variveis artificiais determinsticas, tendncias, etc.).
Este modelo encerra uma hiptese quanto fdp condicional, ft (yt j dt ; Ft 1 ; ) e, portanto, quanto aos momentos condicionais, como por exemplo E (yt j dt ; Ft 1 ; ) e Var (yt j dt ; Ft 1 ; ) :
O axioma da correcta especificao do modelo M traduz-se da seguinte forma: existe um
112
tal que
ft (yt j dt ; Ft 1 ;
0)
= ft0 (yt j Ft 1 ) :
De forma anloga, os dois primeiros momentos condicionais esto correctamente especificados se existir um
tal que
E (yt j dt ; Ft 1 ; ) =
Var (yt j dt ; Ft 1 ; ) =
Z
Z
yft0 (yj Ft 1 ) dy
y 2 ft0
(yj Ft 1 ) dy
yft0
(yj Ft 1 ) dy
0)
que esteja
5.2
5.2.1
escrevendo yt =
1+
2 xt +
yt
1 + ut ;
sendo ut o termo de erro. importante sublinhar que nada de relevante dito sobre
o modelo se no adiantarmos uma hiptese sobre o comportamento de ut : Se dissermos
que E (ut ) = 0 apenas podemos concluir que E (yt ) =
E (xt ) +
E (yt 1 ) : Se
adicionalmente dissermos que Cov (ut ; xt ) = Cov (ut ; yt 1 ) = 0 ento (pode-se provar que)
1
2 xt
+ yt
2 xt
113
condicional de yt :
Seja xt o vector das variveis explicativas. No exemplo anterior tem-se xt = (xt ; yt 1 ) ;
e pode-se verificar que E (yt j xt ) = E (yt j It ) : De uma forma geral, quando vlida a
igualdade E (yt j xt ) = E (yt j It ) diz-se que o modelo dinamicamente completo. Veja um
caso onde o modelo no dinamicamente completo. Considere-se,
yt =
2 xt
3 yt 1
+ ut ;
ut =
2 ut 2
+ "t
(5.2)
2 xt
3 yt 1
+ ut
2 xt
3 yt 1 :
no coincide com
E (yt j xt ) = E (yt j xt ; yt 1 ) =
= yt
(
2
2 xt
3 yt 1 )
2 xt 2
3 yt 3 )
2 xt
3 yt 1
+ ut
2 xt
3 yt 1
2 ut 2
2 xt
3 yt 1
1 2
2 xt
(yt
3 yt 1
+ "t
2
2 yt 2
2 xt 2
3 yt 3 ))
2 2 xt 2
+ "t
3 2 yt 3
+ "t :
2 xt
3 yt 1
4 yt 2
5 xt 2
6 yt 3
+ "t :
(5.3)
114
2 xt
3 yt 1
4 yt 2
5 xt 2
6 yt 3 :
Num modelo dinamicamente completo, o conjunto das variveis explicativas xt capta toda
a dinmica do processo, de tal forma que os erros no so autocorrelacionados (vale a pena
acrescentar que um modelo dinamicamente completo no pode ter erros autocorrelacionados).
Que diferenas existem entre os modelos (5.2) e (5.3)? O estimador OLS aplicado a
(5.3) consistente; mas aplicado a (5.2) inconsistente, pois o regressor yt
est correla-
cionado com os erros ut (E (ut j xt ) 6= 0). Claro que no modelo (5.2) deve usar-se um
mtodo de estimao consistente, como por exemplo, o mtodo FGLS ou o mtodo da mxima verosimilhana. Quando so usados mtodos de estimao apropriados, do ponto de
vista estatstico - por exemplo, previso ou ajustamento - os modelos acima discutidos so
(quase) equivalentes (e, portanto, indiferente usar-se um ou o outro). Do ponto de vista da
interpretao econmica o modelo (5.3) pode ser prefervel, pois identifica claramente todos
os regressores influentes na explicao das variaes de y: Mas, tambm pode suceder
o contrrio! Suponha-se que a teoria econmica postula para certo fenmeno a relao
yt =
2 xt
autocorrelao.
5.2.2
+ log 1 + yt2
+ ut ;
115
E (ut j Ft 1 ) = 0;
+ log 1 + yt2
uma
E (ut j Ft 1 ) = 0
+ ut ;
yt =
8
<
:
1 yt 1
+ ut
se yt
>k
2 yt 1
+ ut se yt
k:
5.3
t "t ;
1 ou, mais geralmente, uma diferena de martingala (com varincia finita igual a 1). Resulta
Var (yt j Ft 1 ) = Var (ut j Ft 1 ) = Var ( t "t j Ft 1 ) =
A tarefa do investigador a de definir uma funo adequada para
2
t:
2
t:
No ponto 8 aborda-se
5.4
Distribuio de Condicional
com ut =
t "t ;
gador "t
N (E (yt j Ft 1 ) ; Var ( yt j Ft 1 )) ;
e toda a estrutura probabilstica fica definida. No contexto do ponto 5.1, a densidade definida
para yt j Ft
117
Pgina em branco
118
Captulo 6
Modelao da Mdia: Abordagem Linear
(ltima actualizao: 3/2006)
Neste captulo vamos focar modelos lineares na mdia. Considere-se o modelo
yt =
onde ut so os erros e
+ ut
(6.1)
De acordo com a regra adoptada adiante, entende-se que o modelo (6.1) linear na mdia se
a funo g linear nos seus argumentos. Por exemplo, a especificao
linear (a funo g g (x1 ; x2 ) = x1 + x2 ) ao passo que
= yt
+ ut
= yt2 1 (g (x) = x2 ) no
linear.
Toma-se como varivel dependente y (pode ser um retorno de um ttulo, a variao
da taxa de cmbio, uma taxa de juro, etc.). Comearemos por admitir que a nica informao que dispomos sobre y a prpria srie. Como explicar yt a partir da informao
Ft
passados yt 1 ; yt 2 ; ::: a abordagem de sries temporais intil. Pelo contrrio, se existe evidncia de autocorrelao, ento os valores passados da srie podem explicar parcialmente o
movimento de y e um modelo linear na mdia pode ser apropriado. Na prtica, teremos de escolher um modelo concreto. Por exemplo, yt = c+ yt 1 +ut ou yt = c+
ou yt = c +
1 ut 1
1 yt 1 + 2 yt 2 +ut
119
6.1
6.1.1
Definies Preliminares
Autocorrelao de Ordem s (FAC)
j vimos
onde
Cov(yt ; yt s )
=p
Var (yt ) Var (yt s )
Cov(yt ; yt s ) = E ((yt
E (yt )) (yt
= E (yt yt s )
Convencione-se chamar
a Cov (yt ; yt s ) e
E (yt s )))
E (yt ) E (yt s ) :
vem
s
Cov(yt ; yt s )
=p
= ps 2 =
Var (yt ) Var (yt s )
0
6.1.2
1.
Quando se calcula a correlao entre, por exemplo, yt e yt 2 ; por vezes sucede que a correlao detectada se deve ao facto de yt estar correlacionado com yt 1 ; e yt 1 ; por sua vez,
estar correlacionado com yt 2 : Com a autocorrelao parcial procura-se medir a correlao
entre yt e yt
s+1 :
A anlise desta
< 1 e E jY j
E (yt )) (yt
120
s ))) resulta,
2
E jXj
1=2
por definio,
2
E jY j
1=2
11 yt 1
yt = c +
21 yt 1
22 yt 2
yt = c +
31 yt 1
32 yt 2
33 yt 3
s1 yt 1
s2 yt 2
+ ::: +
:::
yt = c +
ss yt s
21 yt 1
22
ii :
na regresso
22 yt 2
+ t:
(6.2)
Podemos usar o OLS para obter ^ 22 : Este coeficiente mede a relao entre yt e yt
do efeito de yt
kk
depois
P
^ kk = Pt rt;k yt
2
t rt;k
(yt 1 ; :::; yt
k+1 ) :
depois do
kk
ii
=0
Z=
p
d
n ^ kk ! N (0; 1) :
121
6.1.3
O operador diferena
bem conhecido:
yt = yt
2
yt =
yt 1 ;
( yt ) =
= yt
yt
(yt
(yt
yt 1 ) =
yt
yt 2 ) = yt
yt
2yt
+ yt 2 :
L (Lyt ) = Lyt
Lp yt =
yt p ;
Lp ut =
ut p :
= yt 2 ;
yt 1 ) = yt
yt 2 :
1 yt 1
2 yt 2
1 ut 1
+ ut
1 Lut
+ ut
na forma,
yt
1
2
2 L yt
1 Lyt
2
2L
1L
Obs.:
(L) = 1
1L
2
2L
yt =
(L) yt =
(L) = 1 +
+ (1 +
+
1L
1 L) ut
(L) ut :
sobretudo da rea das sucesses cronolgicas, preferem a letra B (backshift) para designar o
mesmo operador de atraso.
122
6.2
A decomposio de Wold fornece uma motivao para os modelos de mdias mveis (ver a
seguir). Wold mostrou que um processo y ESO pode escrever-se na forma
yt = Vt + ut +
1 ut 1
2 ut 2
P1
i=1
+ :::
2
i
(6.3)
< 1:
A decomposio destaca que qualquer processo ESO (linear ou no linear) tem uma
representao linear nos erros de regresso (podemos tambm dizer, nos erros de previso)
ocorridos no passado. No entanto, o modelo (6.3) no pode ser implementado porque existem infinitos parmetros para estimar.
Vamos procurar representaes lineares parcimoniosas, inspiradas em (6.3).
Exemplos:
y t = ut +
1 ut 1
y t = ut +
1 ut 1
(
+
2 ut 2
1;
1;
= ::: = 0)
2
2;
= ::: = 0)
+ ut
i ).
Veremos tam-
bm que a melhor aproximao linear parcimoniosa que podemos efectuar estrutura (6.3),
supondo Vt = 0; baseia-se no chamado modelo ARMA.
6.2.1
Processo M A (1)
O processo MA(1) dado por
yt =
+ ut
+ ut =
+ (1 + L) ut
onde ut um rudo branco. Este modelo representa yt como uma combinao linear de
choques aleatrios (ut
+ ut ) =
1
2 2
+ ut ) =
Covarincias e Autocorrelaes
+ ut ) ( u t
+ ut 1 ))
+ u2t
+ u t ut
ut 1 ut
2
= 0+
) (yt
))
+ ut ut
+0+0
Pode-se provar
= 0 para s > 1:
2 2
+
0 para s > 1:
0
11
+1
e (pode-se provar)
s
ss
Momentos Condicionais
124
2
2(s+1)
+1
no depende de t. Conclui-
E ( + ut
+ ut j Ft 1 ) =
2
E (yt j Ft 1 )) Ft
+ ut 1 :
= E u2t Ft
+ ut 1 ;
Invertibilidade
Considere-se um processo MA(1) (sem perda de generalidade) de mdia nula, yt =
ut
= ut
L+
L2
:::;
= ut
j j<1
L+
1
L2
yt
::: = ut
2
+ ::: + ut :
(6.4)
Diz-se neste caso, com j j < 1 que yt invertvel, isto , tem representao autoregressiva3 .
O facto do processo MA(1) (e, mais geralmente, o processo MA(q)) ter representao do
tipo (6.4) explica por que razo a funo de autocorrelao parcial
ii
i (porqu?).
A invertibilidade uma propriedade exigvel na previso: garante que a informao remota sobre o processo irrelevante. Imagine-se o caso contrrio, i.e. o processo no invertvel. Isto significa que j j > 1 e, pela equao (6.4), a informao mais atrasada tem
mais peso na previso y (a rigor a representao (6.4) no est bem definida no caso j j > 1;
3
No caso yt = + ut
1 +ut , j
125
1+
+ yt
yt
2 +:::+ut :
yt =
1 ut 1
+ (1 +
2 ut 2
+ ::: +
1L
+ ::: +
q ut q
+ ut ;
q
q L ) ut
(L) ut .
Var (yt ) =
k
kk
1+
2
1
+ ::: +
2
q
8
< =
6 0 se k = 1; 2; :::; q
=
: 0
se k = q + 1; q + 2; :::
6= 0, mas
kk
! 0;
quando k ! 1:
q
(L) = 0) so em
(L) = 0)
1=
yt =
soluo de 1 +
+
1 ut 1
2 ut 2
1L
= 0: No caso MA(2)
+ ut =
126
+ 1+
1L
2
2L
ut
>
1;
< 1;
1<
< 1:
(L) :
6.2.2
Processos Autoregressivos
Processo AR(1)
O processo AR(1) dado por
yt = c + yt
+ ut
(6.5)
onde ut rudo branco independente de yt 1 . Este modelo muito importante porque reproduz razoavelmente a dinmica de muitas sries econmicas e financeiras.
Momentos Marginais
Comece-se por calcular a mdia marginal
E (yt ) = E (c + yt
+ ut ) = c + E (yt 1 ) :
(temos uma equao recorrente em E (yt ): este valor esperado depende de E (yt 1 ) que, por
sua vez, depende de E (yt 2 ) e assim sucessivamente). Se assumirmos partida a condio
de ESO (implicando E (yt ) = E (yt 1 ) = E (y)) vem
E (y) = c + E (y) ) E (y) =
c
1
+ ut ) =
Var (yt 1 ) +
Sob a hiptese de ESO, tem-se Var (yt ) = Var (yt 1 ) = Var (y) e, portanto,
Var (yt ) =
Var (y) +
127
) Var (y) =
2:
Covarincias e Autocorrelaes
Calcule-se agora as covarincias. Como estas no dependem da mdia de yt , simplifiquese fazendo c = 0: Suponha-se j j < 1: A covarincia
dada por
= E (E (yt yt
= E (yt
jFt
E ( yt
1 ))
= E (yt
+ ut jFt
1 ))
E (yt jFt
yt2
=E
1 ))
1
2:
A covarincia de ordem k
= E (yt yt k ) = E (E (yt yt
jFt
k ))
= E (yt
E (yt jFt
k ))
yt
Ora
+ ut
( yt
yt
k):
= ::: = yt
+ ut 1 ) + ut
+ ut
k
+ ut
+ ut
k+1
k 1
+ ut
k+2
k 2
+ ::: + ut
+ ut
pelo que
E (yt j Ft 1 ) = yt
= E yt k yt
2
E yt
0:
Uma forma alternativa de obter este valor a seguinte. Multiplique-se ambos os termos da
equao (6.5) por yt
= yt 1 yt
128
+ ut yt k :
k 1:
Logo,
0;
:::
k
0:
Finalmente,
k
k
yt = c +
11 yt 1
yt = c +
21 yt 1
22 yt 2
Assim,
kk
8
<
: 0
11
22
=0
se k = 1
se k > 1
yt 1 )2 yt
+ ut j yt 1 ) = yt 1 ,
= E u2t yt
yt 1 ;
129
Invertibilidade
O processo AR sempre invertvel (por definio j tem representao autoregressiva).
Reverso para a Mdia
Processos estacionrios com mdia finita so, por vezes, designados por processos com
reverso para a mdia. Exemplifique-se com o processo AR(1)
yt = c + yt
Como
c
1
)c=
(1
j j < 1.
+ ut ;
) (note-se que
(1
) + yt
yt =
(1
)+(
= (
1) (yt
+ ut
1) yt
+ ut
) + ut
) > 0 ) E ( yt j Ft 1 ) < 0
(yt
) < 0 ) E ( yt j Ft 1 ) > 0:
) + yt
+ ut ;
=1
120
100
80
fhi=0.1
60
fhi=0.8
y
40
fhi=0.98
20
fhi=1
0
-20
1
26
51
76
101
126
151
176
Figura 6-1: Simulao de quatro processos AR(1) (choques aleatrios ut iguais e valor de
inicializao y0 = 0)
mais lento o ajustamento de y face mdia de longo prazo y: No caso
yt
t
+ ut
t 1
y0 +
t 2
u1 +
u2 + ::: + ut
+ ut
( y
t+1
= ::: 2 ut
t 1
+ u0 ) +
t 1
u0 +
+ ut
u1 +
u1 +
t 2
u2 + ::: + ut
t 2
u2 + ::: + ut
+ ut
+ ut
+ ut :
+ ut , yt (1
L) = ut , yt =
131
1
1
ut .
1
1
=1+ L+
L2 + :::
Logo
1
ut = 1 + L + 2 L2 + ::: ut
1
L
= ut + ut 1 + 2 ut 2 + :::
yt =
Processo AR(p)
Um processo AR(p) uma simples generalizao do AR(1):
yt = c +
1 yt 1
+ ::: +
p yt p
+ ut :
1L
p
pL
:::
p
yt = c + ut ; ou
(L) yt = c + ut :
E (yt ) = E c +
1 yt 1
E (y) = c +
+ ::: +
p yt p
E (y) + ::: +
+ ut = c +
E (yt 1 ) + ::: +
E (y) ) E (y) =
E (yt p )
c
1
:::
.
p
1 yt 1
+ ::: +
yt2 =
1 yt 1 yt
p yt p
+ ::: +
+ ut
p yt p yt
2
E yt
2
E yt
+ ::: +
p p
1 1
+ ::: +
p p
1 1
E (yt 1 yt ) + ::: +
132
+ ut yt
E (yt p yt ) + E (ut yt )
1 yt 1
1 yt 1 yt k
E (yt yt k ) =
k
k
+ ::: +
p yt p
+ ::: +
p yt p yt k
E (yt 1 yt k ) + ::: +
1 k 1
+ ::: +
p k p
+ ::: +
k 1
+ ut yt
E (yt p yt k ) + E (ut yt k )
k p
+ ut
1 k 1
+ ::: +
p k p
1:
(L) = 0 so
em mdulo superiores a um (ou fora do circulo unitrio no plano complexo) (apndice 6.E).
No caso AR(1) a raiz de (L) = 0 fcil de obter:
L) = 0 ) L =
(1
Devemos exigir
1
> 1 ) j j < 1:
< 1;
< 1;
1<
<1
Quase diramos que esta equao um processo AR(p) no fosse o facto de no possuir termo aleatrio.
De forma rigorosa, podemos dizer que uma equao (linear) s diferenas finitas, de ordem p (de coeficientes
constantes). Esta terminologia usada na rea dos sistemas dinmicos em tempo discreto.
133
FAC
0.5
FACP
0.5
0
0
1
11
13
15
17
19
-0.5
-0.5
-1
-1
FAC
0.5
11
13
15
17
19
13
15
17
19
13
15
17
19
13
15
17
19
FACP
0.5
0
1
11
13
15
17
19
-0.5
-0.5
-1
-1
FAC
0.5
11
FACP
0.5
0
1
11
13
15
17
19
-0.5
-0.5
-1
-1
FAC
0.5
11
FACP
0.5
0
1
11
13
15
17
19
-0.5
-0.5
-1
-1
11
Figura 6-2: FAC e FACP tericas associadas aos seguintes cenrios (de cima para baixo): (a)
1 > 0; 2 > 0; (b) 1 < 0; 2 > 0; (c) 1 > 0; 2 < 0; (d) 1 < 0; 2 < 0:
(estas condies baseiam-se evidentemente na proposio anterior).
No caso AR(p) com p > 2 no temos outra alternativa seno calcular (por exemplo,
atravs do programa Mathematica) as razes de
(L) = 0:
=
k
bvio que
kk
1 k 1
2 k 2
+ ::: +
p k p;
1 yt 1
+ ::: +
p+1;p+1
p yt p
134
= 0 porque
+ 0yt
p 1
+ ut
6.2.3
Processos ARMA
Por que no combinar os dois processos AR e MA? isso que se prope com o modelo
ARMA. No caso geral ARMA(p,q) (i.e. AR(p) + MA(q)) o modelo representa-se em qualquer uma das seguintes formas alternativas:
yt =
yt
1
1 yt 1
1 yt 1
1L
+ ::: +
:::
:::
p yt p
p yt p
p
pL
p
1 ut 1
= ut +
yt = (1 +
(L) yt =
yt =
+ ::: +
1 ut 1
1L
q ut q
+ ::: +
+ ::: +
+ ut
q ut q
qL
) ut
(L) ut
(L)
ut :
p (L)
(L) =
(L). Obtm-se
yt = ut +
1 ut 1
2 ut 2
+ :::
s esto sujeitos
tabela 6.1 apresenta-se um quadro resumo das principais propriedades do modelos AR, MA
e ARMA.
Nas figuras 6-3 e 6-4 encontram-se as FAC e FACP de vrios processos lineares simulados (n = 50000). Procure identific-los5 .
A tabela 6.2 identifica os processos simulados nas figuras 6-3 e 6-4.
5
Observe que as FAC e FACP so obtidas a partir dos processos simulados e, portanto, no correspondem
s funes tericas; por esta razo, embora alguns coeficientes populacionais sejam zero, os respectivos coeficientes estimados podem no ser iguais a zero (de facto, uma impossibilidade virem exactamente iguais a
zero). Assuma que os coeficientes estimados muito baixos no so estatisticamente significativos.
135
AR(p)
Modelo
p (L) yt = ut
em yt
Srie finita em yt
Modelo yt = p 1 (L) ut
em ut
Srie infinita em ut
Estac.
Razes p (L) = 0
fora do crc. unitr.
Invertib. Sempre
invertveis
FAC
Decaimento exponencial e/ou sinusoidal para zero
FACP
Decaimento brusco
para zero a partir de
k =p+1
MA(q)
1
p (L) yt = ut
Srie infinita em yt
yt = p (L) ut
Srie finita em ut
Sempre
estacionrios
Razes p (L) = 0
fora do crc. unitr.
Decaimento brusco
para zero a partir de
k =q+1
Decaimento exponencial e/ou sinusoidal para zero
ARMA(p,q)
1
p (L) p (L) yt = ut
Srie infinita em yt
yt = p 1 (L) p (L) ut
Srie infinita em ut
Razes p (L) = 0
fora do crc. unitr.
Razes p (L) = 0
fora do crc. unitr.
Decaimento exponencial e/ou sinusoidal para zero
Decaimento exponencial e/ou sinusoidal para zero
Tabela 6.1: Resumo das principais propriedades dos modelos AR, MA e ARMA
MA
Figura 6-3
1
2
3
4
5
6
7
Figura 6-4
1
2
3
4
5
6
AR
:4
0
:4
0
0
1
0
:4
0
0
0
0
0
0
0
:8
0
0
0
:5
0
0
0
0
0
0
Modelo
:1
0
:4
0
0
0
:5
0
0
0
0
0
0
0
0
:4
0
:4
1
0
0
0
:2
0
:2
0
0
0
0
0
0
:2
0
0
0
0
0
0
0
0
0
0
MA(3)
AR(2)
MA(3)
AR(3)
AR(1)
MA(1)
MA(3)
0
0
0
0
0
0
0
0
:8
0
0
0
0
:8
0
:4
0
:5
0
0
0
:2
0
0
0
0
0
:1
0
0
:9
0
:8
:1
0
0
AR(4)
ARMA(1,1)
ARMA(4,4)
AR(4)
RBranco
RBranco
Tabela 6.2: Solues das questes colocadas nas duas figuras anteriores
136
0.1
0.1
FAC
FACP
0
1
10
-0.1
10
10
10
10
10
10
10
-0.1
-0.2
-0.2
-0.3
-0.3
-0.4
0.6
0.6
FAC
0.5
FACP
0.5
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
1
0.2
10
0.1
FAC
0.1
-0.1
FACP
0
1
-0.1
10
-0.1
-0.2
-0.2
-0.3
-0.3
-0.4
-0.4
0.5
0.6
FAC
0.4
FACP
0.4
0.3
0.2
0.2
0
0.1
-0.2
0
1
-0.1
10
FACP
1
0.8
0.9994
0.6
0.9992
0.4
0.999
0.2
0.9988
0
1
0.6
10
-0.2
0.6
FAC
0.5
FACP
0.4
0.4
0.2
0.3
0.2
0.1
-0.2
0
1
0.5
10
-0.4
10
0.5
0.4
0.3
0.2
0.1
0
-0.1
-0.2
-0.3
FAC
0.4
0.3
0.2
0.1
0
-0.1
-0.4
0.9996
-0.1
1.2
FAC
0.9998
FACP
Figura 6-3: FAC e FACP de 7 processos simulados a partir de n = 50000 observaes. Qual
a ordem p e q dos processos? (A resposta a esta questo encontra-se na tabela 6.2)
137
FAC
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0
-0.2
FACP
0.8
0
1
10
-0.2
FAC
0.8
10
10
10
10
10
10
FACP
0.5
0.6
0.4
0.2
-0.5
0
1
10
-1
1
FAC
0.8
FACP
0.5
0.6
0.4
0.2
-0.5
0
1
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
10
-1
0.8
FAC
FACP
0.6
0.4
0.2
0
1
0.4
10
-0.2
0.4
FAC
0.2
FACP
0.2
0
1
10
-0.2
-0.2
-0.4
-0.4
0.4
0.4
FAC
0.2
FACP
0.2
0
1
10
-0.2
-0.2
-0.4
-0.4
138
6.3
6.3.1
No Estacionaridade na Mdia
yt = | {z::: }yt
d vezes
(L)
yt = c +
(L) ut
yt
ARM A (p; q) :
139
+ ut ;
(L) =
L = 0 obviamente L = 1:
yt
1+ ;
+ ut
0<
<1
Considere-se
yt = yt
< 1;
< 1;
<1
yt 1 : Tem-se
yt = (1 + ) yt
yt
yt
yt
yt =
Logo
1<
yt
yt
yt
1
2
+ ut
+ ut
+ ut :
ARIMA(1,1,0).
Este exemplo indica o caminho a seguir quando y no estacionrio. Em lugar de se analisar y; analisa-se
mas vrios resultados para y (como por exemplo a previso) podem ser facilmente recuperados a partir da especificao e estimao do modelo para
yt .
yt
+ ut ;
ut RB
yt
140
+ ut :
Logo
yt
2
Assim
2yt
= ut
yt = ut :
+ yt
yt = yt
L) (1 L)yt = c + (1 + L) ut
| {z }
(1
yt
L) (yt
y t 1 ) = c + ut + u t
yt
yt
+ yt
= c + ut + ut
yt = yt
+ yt
yt
+ c + ut + u t 1 :
+ t + ut ;
ut rudo branco.
+ t depende de t: A no estacionari-
dade nestes casos no to grave como no caso anterior (por exemplo, a varincia de y
constante). A literatura por vezes designa estes processos como estacionrios em tendncia,
pois removendo a tendncia o processo resulta estacionrio. O operador diferena tambm
estacionariza o processo. Com efeito,
yt =
+ t + ut
( + (t
1) + ut 1 ) =
+ ut
ut 1 .
141
20
10
0
-10
-20
-30
-40
500
1000
1500
2000
t;k
+ ut
=1
k
' 1:
t
Assim, se FAC (estimada) de um certo processo, apresentar, nos primeiros lags, val6
Na verdade mais do que isso: o estimador superconsistente (converge para o verdadeiro parmetro a
uma taxa mais alta do que o habitual). Por exemplo, o estimador OLS para verifica
n ^
! 0;
n3=2 ^
! N ormal:
Enquanto a varincia do estimador OLS habitual proporcional a 1=n a do estimador superconsistente acima
referido, proporcional a 1=n3 :
7
Por que no estimar logo o modelo e verificar depois se as razes do polinmio (L) = 0 satisfazem a
proposio 6.2.2? Este procedimento no aconselhvel. Como as razes so estimativas, devemos ensaiar a
hiptese subjacente proposio 6.2.2 (as razes devem ser em modulo maiores do que um para o processo
ser estacionrio). Todavia, sob H0 o processo no estacionrio e as distribuies assimptticas habituais no
so vlidas. Felizmente, existem testes adequados como, por exemplo, o teste Dickey-Fuller. Para concluir:
prefervel, na fase da estimao, termos um processo j estacionrio (ou, por outras palavras, a anlise da
estacionaridade precede a estimao do modelo).
142
Figura 6-6: FAC (e FACP) estimada do processo passeio aleatrio representado na figura
6-5.
ores muito altos (prximos de um), poderemos suspeitar que o processo no estacionrio. A figura 6-20 ilustra a ideia: apresenta-se a FAC estimada associada ao
passeio aleatrio representado na figura 6-5
Faz-se um teste de raiz unitria (por exemplo o teste ADF).
= 1 vs. H1 : j j < 1 na
+ ut se pode
escrever na forma
yt = y t
com
1; ensaiar H0 :
+ ut
= 1 equivalente a ensaiar H0 :
= 0: Observe-se ainda
que, sob H0 ; o processo y possui uma raiz unitria. Isso bvio, tendo em conta que a raiz
do polinmio AR, (L) = 1
L; igual a 1.
143
Parece bvio a construo do teste estatstico: calcula-se o rcio-t ^ =^ e depois consultase a tabela da t-Student. Este procedimento incorrecto. Com efeito, sob H0, y no
estacionrio pelo que o rcio-t ^ =^ no tem distribuio t-Student nem mesmo distribuio
assimptoticamente normal. A hiptese de estacionaridade aqui crucial. Se o processo no
estacionrio as distribuies assimptticas habituais no so vlidas8 .
Como devemos proceder? Temos de consultar os valores crticos nas tabelas apropriadas
(so construdas a partir da distribuio da estatstica de teste sob H0 que, por ser desconhecida para n finito, tem de ser obtida atravs de simulaes de Monte Carlo9 ). A maioria das
tabelas est preparada para fornecer o valor crtico da distribuio de ^ =^ (da trabalhar-se
sobretudo com a especificao
yt = y t
+ ut e no com yt = yt
+ ut ). A maioria
=0
+ yt
+ ut :
+ t + yt
=0
+ ut :
1 +:::+
branco. Assim,
(1) Teste ADF for random walk without drift H0 :
yt = y t
8
yt
+ ::: +
=0
yt
+ ut :
De facto, pode-se provar que, sob H0 ; n^ tem distribuio assimpttica igual distribuio da varivel
2
(1=2) W (1)
1
;
R1
2
W (u) du
0
144
+ yt
yt
=0
+ ::: +
yt
(3) Teste ADF for random walk with drift and trend H0 :
yt =
+ t + yt
yt
+ ::: +
+ ut :
=0
yt
+ ut :
= 0 vs. H1 :
0:01 yt 1 ;
n = 50
(0:004)
0:01=0:004 =
2:5 > vc =
+ log pt
log pt
+ ut ;
(p = 1)
pode-se concluir que se escolheu a opo (2) Teste ADF for random walk with drift H0 :
= 0
yt =
+ yt
yt
+ ut ;
(p = 1)
(note-se que a regresso envolve a constante C; equivalente ao nosso ). Deixmos o programa escolher a ordem p: Esta ordem escolhida automaticamente e baseia-se no valor
do critrio de informao SIC seguindo o princpio general-to-specific. O programa escolheu p = 1: Interessa o valor-p associado hiptese nula que 0.3078. Sendo este valor
superior a 0.05, no se pode rejeitar a hiptese
Existe, portanto, forte evidncia emprica a favor da hiptese nula (no estacionaridade).
aconselhvel diferenciar-se o processo. A diferenciao conduz ao processo frt g ; onde
rt = log Pt
145
log Pt 1 :
t-Statistic
Prob.*
-1.953504
-3.432388
-2.862326
-2.567233
0.3078
Coefficient
Std. Error
t-Statistic
Prob.
LNP(-1)
D(LNP(-1))
C
-0.000919
0.156283
0.008356
0.000470
0.018227
0.004143
-1.953504
8.574451
2.016704
0.0509
0.0000
0.0438
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.025826
0.025161
0.010559
0.326764
9190.406
1.991441
0.000320
0.010694
-6.262717
-6.256598
38.85062
0.000000
6.3.2
No Estacionaridade na Varincia
146
Var (yt ) _
Var (yt ) _
Var (yt ) _
t
2
t
4
t
h (x)
x
x2
x4
T (x)
R 1
p
p dx = 2 x
x
R 1
R x1dx = log 1x
dx = x
x2
1
p
dx.
h (x)
Para concretizar, suponha-se que Var (yt ) proporcional ao quadrado da mdia (e escrevese neste caso, Var (yt ) _
2
t ).
stante a varincia T (x) = log x e, assim, os dados devem ser logaritmizados. Como a
transformao s est definida, em geral, para certos valores de x (por exemplo, no caso
log x tem de se assumir x > 0) preciso primeiro aplicar T (x) e s depois se verifica
se necessrio diferenciar (j que uma prvia diferenciao impossibilitaria a aplicao da
transformao (veja-se o exemplo a seguir).
Na figura 6-8 representa-se a srie de preos do Dow Jones de 1969 a 2004. A varincia
(assim como a mdia) no constante.
Se se comeasse por diferenciar P; a varincia continuaria a ser uma funo de t: Vejase, com efeito, o grfico de f Pt g ( Pt = Pt
mostra claramente que a varincia aumenta com t: Assim, antes de se diferenciar o processo,
10
T ( t ) + T 0 ( t ) (yt
T 0 ( t ) (yt
T ( t)
2
T ( t ))
Assim,
t)
t ).
2
t)
(T ( t )) (yt
2
(T 0 ( t )) Var (yt ) = (T 0 ( t )) h ( t )
Var (T (yt ))
2
c
h ( t)
147
(c = 1):
P (preos)
14005
12005
10005
8005
6005
4005
2005
5
Sep-69
Sep-74
Sep-79
Sep-84
Sep-89
Sep-94
Sep-99
Sep-04
600
Preos Diferenciados
400
200
0
-200
-400
-600
-800
Jan-69
May-73
Sep-77
Jan-82
May-86
Sep-90
Jan-95
148
May-99
Sep-03
Pt = Pt
Pt 1 ; do Dow Jones
4000
1.40E+07
3500
1.20E+07
3000
1.00E+07
2500
8.00E+06
media(t)
6.00E+06
var(t)
2000
1500
4.00E+06
1000
2.00E+06
500
0
Sep-69
0.00E+00
Aug-77
Jul-85
Jun-93
May-01
Figura 6-10: Mdia e Varincia estimada ao longo do tempo da sries diria do Dow Jones
(1969 a 2004)
log(P)
10
9.5
9
8.5
8
7.5
7
6.5
6
5.5
5
Sep-69
Sep-74
Sep-79
Sep-84
Sep-89
Sep-94
Sep-99
Sep-04
b (yt ) =
E
b (yt )
E
2
t:
estacionarizar a varincia.
A figura 6-11 sugere que a varincia constante ao longo do tempo, mas no a mdia.
Faa-se ento a diferenciao da varivel log Pt :
rt = log (Pt )
log (Pt 1 )
cuja representao grfica dada na figura 6-12. interessante verificar que a srie dos
retornos deve ser estudada no s devido s razes invocadas no ponto 2.3 mas tambm
149
0.15
0.1
0.05
0
-0.05
-0.1
-0.15
-0.2
-0.25
-0.3
Sep-69
Sep-74
Sep-79
Sep-84
Sep-89
Sep-94
Sep-99
Sep-04
Etapa 1: Identificao
Etapa 2: Estimao
Escolha de um
modelo
Estimao dos
parmetros
NO
Etapa 3: Avaliao do
diagnstico
Utilizao do
modelo
Adequao do
modelo escolhido
Modelo
satisfatrio
SIM
6.4
log (Pt 1 ) :
Modelao ARMA
150
Etapa 1: Identificao
Estacionarizao da srie;
Identificao da ordem p e q atravs da FAC e FACP.
Etapa 2: Estimao
Uma vez seleccionado, na primeira etapa, o modelo ARMA(p,q), necessrio estimar os
parmetros desconhecidos (pelo mtodo da mxima verosimilhana11 ).
Etapa 3: Avaliao do Diagnstico
necessrio analisar os seguintes aspectos:
significncia estatstica dos parmetros;
invertibilidade e estacionaridade (dispensa-se este ltimo aspecto se y for um processo
estacionrio);
anlise da matriz de correlao dos estimadores;
redundncia entre as estimativas;
branqueamento dos resduos;
se existir mais do que um modelo que cumpra as condies anteriores necessrio
seleccionar o melhor ( luz de determinado critrio).
Remete-se a questo da anlise da matriz de correlao dos estimadores para Murteira et
al. (1993). A significncia estatstica dos parmetros bvia e a questo da invertibilidade
foi j tratada.
(L) e (L) partilham razes comuns. Por
0:8L) yt = (1
0:8L) ut
(6.6)
ambos os polinmio possuem a mesma raiz (1/0.8). Observe-se que os polinmios cancelam
um com o outro:
(1
11
0:8L) yt = (1
0:8L) ut , yt = ut
151
1 ut 1
+ ut :
1 ut 1
muito importante que os resduos venham branqueados, i.e. no exibam autocorrelaes; caso contrrio, parte da mdia condicional no foi modelada.
Apresentam-se de seguida, sem comentrios, os ensaios habituais os testes de significncia dos coeficientes de autocorrelao dos resduos:
Teste Kendal e Stuart H0 :
p
(^
u) = 0
d
n (^k (^
u) + 1=n) ! N (0; 1) ;
^k (^
u)
1 1
;p
n n
p
Rejeita-se H0 ao n.s. de (aprox.) 5% se j^k (^
u)j > 2= n (supondo 1=n
Teste Ljung-Box H0 :
(^
u) = ::: =
Q = n (n + 2)
m
X
k=1
(^
u) = 0
1
^2k (^
u) !
152
2
(m p q) :
0)
kk
(^
u) = 0
p
d
n ^ kk (^
u) ! N (0; 1) ;
kk
(^
u)
1
0; p
n
p
u) > 2= n
Rejeita-se H0 ao n.s. de (aprox.) 5% se ^ kk (^
Finalmente, discuta-se a ltima questo. Pode suceder que dois ou mais modelos cumpram
as condies anteriores. Como seleccionar o melhor? Se o objectivo da modelao
a previso, pode-se avaliar a qualidade preditiva dos vrios modelos concorrentes e depois selecciona-se o que apresentar melhores resultados (discutiremos esta questo no ponto
6.6.6). Outra abordagem consiste em escolher o modelo mais preciso (melhor ajustamento)
com o menor no de parmetros (parcimnia). H certamente um trade-off a resolver: maior
preciso implica menor parcimnia.
O coeficiente de determinao ajustado , provavelmente, o indicador mais utilizado.
um bom indicador no mbito do modelo de regresso linear clssico, com distribuio normal. Mais gerais so os critrios de informao de Akaike e de Schwarz porque se baseiam
no valor da funo de verosimilhana.
Seja
n
X
log Ln =
log f (yt j Ft 1 )
log Ln 2k
+ :
n
n
log Ln k
+ log n:
n
n
Tendo em conta que o modelo tanto mais preciso quanto mais alto for log Ln ; e tanto
mais parcimonioso quanto menor for o nmero de parmetros, k; conclui-se que deve dar-se
preferncia ao modelo que minimiza as estatsticas AIC e SC (note que os modelos s so
comparveis se as variveis se encontrarem na mesma unidade - por exemplo, no devemos
comparar um modelo em y e outro em log y).
Em certos casos, um modelo pode minimizar apenas um dos critrios (por exemplo, um
153
modelo A minimiza o AIC e o modelo B minimiza o SC). Como proceder nestes casos?
Vrios estudos tm revelado o seguinte:
o critrio SC, em grandes amostras tende a escolher o modelo correcto; em pequenas/mdias amostras pode seleccionar um modelo muito afastado do modelo correcto;
o critrio AIC, mesmo em grandes amostras tende a seleccionar o modelo errado,
embora no seleccione modelos muito afastados do correcto.
Como consequncia, para grandes amostras o SC pode ser prefervel.
Naturalmente, estes critrios podem clarificar a identificao da ordem p e q do modelo
ARMA. Por exemplo, suponha-se que os modelos ARMA(1,1) e AR(3) so bons luz de
vrios critrios. Os critrios de informao, podem contudo sugerir o ARMA(1,1) e, desta
forma, p = 1; q = 1:
6.5
As variveis dummy ou variveis artificiais so, como temos visto, bastante teis pois permitem estimar o impacto de certas variveis qualitativas ou de eventos sobre a varivel dependente. No entanto, h cuidados a ter no uso destas variveis.
Num modelo de previso o uso de variveis artificiais (VA) estocsticas associados a
eventos que podem ocorrer no futuro deve ser evitado se as probabilidades condicionais da
VA forem desconhecidas. Com efeito, que sentido faz especificar yt =
+ dt + ut (d
Algumas das concluses que seguem foram-me transmitidas pelo Prof. Joo Santos Silva em comunicao
privada. Veja-se tambm Hendry e Santos (2005).
154
6.5.1
Inconsistncia do Estimador
Impulse-dummies so VAs que assumem o valor 1 apenas uma vez na amostra. Para ilustrar
a situao considere-se o modelo
yt =
onde ut
i:i:d:
N (0;
Seja
6
6
6
6
6
6
6
6
6
6
6
X =6
6
6
6
6
6
6
6
6
6
4
+ dt + ut ;
t = 1; 2; :::; n
) e dt uma impulse-dummy
1 0
1
..
.
0
..
.
1 0
1 1
1
..
.
0
..
.
1 0
1 0
8
< 1 t=t
dt =
: 0 t=
6 t:
7
7
7
7
7
7
7
7
7
7
7
7;
7
7
7
7
7
7
7
7
7
5
X0 X = 4
n 1
1 1
3
2 P
n
t=1 yt 5
X0 y = 4
yt
5;
^ = 4
2
= 4
Tem-se
^
^
5=4
1 1
Pn
yt
n 1
Pn
1
t=1 yt
n 1
(X X)
yt
n 1
t=1
h i
h
^
= E (X0 X)
E
h i
Var ^ =
n 1
n
n
3 2
2 P
n
y
4 t=1 t 5 = 4
yt
3 2 Pn
n 1
1
n 1
1
n 1
n
n 1
t=1;t6=t
y
1 t
5=4
X y = E (X X)
3
2
2
1
n 1
1
n 1
1
n 1
n 1
n 1
(y
1
yt )
5:
i
X (X + u) =
5:
155
yt
3
32 P
n
y
5 4 t=1 t 5
yt
(6.7)
h
0
E (X X)
Xu =
No se verifica ^ !
porque
lim Var [^ ] = lim
n!1
n!1
6.5.2
Inconsistncia do Teste-t
conhecido)
n
n 1
(y yt )
p n
=
= p
Var [^ ]
n 1
r
yt
y
n yt
y
=
'
:
n 1
^
Ora a distribuio de
yt
gresso habitual, mesmo que os erros no tenham distribuio normal, o rcio-t para grandes
amostras tem distribuio aproximadamente normal, pelo teorema do limite central, e a inferncia habitual pode fazer-se sem problemas. No entanto, o rcio-t associado a variveis
impulse-dummies depende da distribuio dos erros. Assim, se a distribuio dos erros
desconhecida no possvel usar-se os testes t habituais. Mesmo que se possa usar o rcio-t
(por exemplo, se houver garantias que ut
i:i:d:
N (0;
6= 0) no tende para 1
156
6.5.3
=0
= 0; a distribuio do estimador
da
= 0 em favor de H1 :
+ d + u;
y=X
+"
Ento a) ^ !
+ ut e b) ^ =^"t
! 1:
157
6.5.4
Um caso que conduz a concluses incorrectas ocorre quando se usa simultaneamente impulsedummies com a matriz de White.
Para simplificar considere-se novamente o modelo
yt =
onde ut
i:i:d:
N (0;
+ dt + ut ;
t = 1; 2; :::; n
) e dt uma impulse-dummy
8
< 1 t=t
dt =
: 0 t=
6 t:
Se razovel assumir normalidade e ausncia mas no heterocedasticidade pode argumentarse que a significncia estatstica de
de White. Esta suposio incorrecta e traduz provavelmente o caso mais grave dos vrios
que analismos. Como se sabe a matriz de White tem a forma
h i
d ^ = (X0 X)
Var
X0 WX (X0 X)
2
d [^ ] = Pt=1 di d u^t :
Var
2
n
d
t=1 di
Pn
n
X
d u^2t
1
t=1 di
d
Var [^ ] = Pn
u^2t :
2 =
n
(n
1)
d
t=1
t=1 di
n
(yt
y)
^
n 1
q
q
=
=
=
P
n
1
2
d [^ ]
u
^
Var
t
t=1
n(n 1)
n p yt
y p yt
y
=
n
' n
:
n 1
^
^
158
n
n 1
(yt
q
y)
^2
n
Embora (yt
y) =^ possa ter distribuio aproximadamente N (0; 1) para amostras grandes
p
n (yt
y) =^ no tm certamente distribuio N (0; 1) : Se (yt
y) =^ tem distribuio
p
aproximadamente normal ento n (yt
y) =^ ter distribuio N (0; n) : Este resultado
sugere que se for usada a matriz de White numa amostra razoavelmente grande, qualquer
impulse-dummy sempre interpretada como significativa luz da distribuio habitual do
p
rcio-t (observe-se n (yt
y) =^ ! 1 quando n ! 1).
6.5.5
Concluso
O uso de impulse-dummies envolve vrios problemas (inconsistncia do estimador, inconsistncia do teste t, e quando usado simultaneamente com a matriz de White, os rcio-t so
inflacionados). Quer isto dizer que o uso de impulse-dummies inapropriado? A resposta
negativa. Vimos que o estimador OLS do parmetro da impulse-dummy centrado. Por
outro lado, existem procedimentos vlidos que podero ser usados para testar a significncia do parmetro da impulse-dummy. Finalmente, o uso impulse-dummy em modelos de
regresso importante quando se pretende estimar o efeito de um acontecimento isolado,
mantendo todas as demais variveis explicativas constantes.
Exemplo 6.5.1 Suponha-se que se pretende analisar o efeito de um anncio pblico no dia
t sobre as cotaes da empresa ABC. Suspeita-se que o efeito positivo sobre a empresa
ABC e nulo ou irrelevante para o mercado. Pretende-se, assim, verificar se o valor esperado
do retorno da empresa ABC no dia t positivo. Suponha-se ainda que, nesse dia t , o
mercado em geral observou uma forte queda. Para testar esse efeito uma possibilidade
consiste em considerar a regresso
rt =
+ d t + ut
venha negativo ou no
significativo. Concluir-se-a que o anncio teve um impacto negativo ou nulo sobre o retorno
da empresa ABC. Mas esta concluso pode ser errnea porque o efeito do mercado no
159
1 rt;m
+ d t + ut
6.6
6.6.1
Previso
Introduo
160
12
10
8
Observado
Previsor 1
Previsor 2
4
2
0
1
10 11 12 13 14
~ n+h;n
2
E e~ (h) = E (yn+h )
E ~ n+h;n
+(
2
~)
+2
y;~
(6.8)
O primeiro termo do lado direito mede o enviesamento, o segundo, compara a variabilidade entre y e ~ e o terceiro mede a correlao entre yn+h e ~ n+h;n (quanto mais baixa a
correlao maior o EQM). Na figura 6-14, o previsor 1, embora apresente um enviesamento elevado (i.e., E (yn+h )
2
2
~)
e2
2
~)
y;~
ponente E (yn+h )
(
E ~ n+h;n
E ~ n+h;n
1
y;~
ponderando todos os aspectos, o grfico sugere que o EQM do previsor 1 inferior ao EQM
do previsor 2.
Ser possvel definir um previsor ptimo, luz do EQM, qualquer que seja o modelo em
anlise? A resposta afirmativa.
Proposio 6.6.1 O previsor com EQM mnimo
E (yn+h j Fn )
i.e., verifica-se
E (yn+h
E (yn+h j Fn ))
161
yn+h
~ n+h;n
n+h;n
para E (yn+h j Fn ) : A proposio 6.6.1 permite concluir que o previsor E (yn+h j Fn ) minimiza os trs termos do lado direito da equao (6.8), no conjunto de todos os previsores
Fn -mensurveis; em particular, o primeiro termo zero.
Recorda-se do captulo 4 que
E (yn+h
E (yn+h j G))
E (yn+h j H))
E (yn+h
G.
6.6.2
Previso Pontual
Tendo em conta a proposio 6.6.1, vamos utilizar como previsor para yn+h a expresso
E (yn+h j Fn ) : O procedimento geral para obter a previso pontual de yn+h :
1. Definir o modelo yn+h (com base no modelo especificado).
2. Calcular E (yn+h j Fn ) :
Vamos ver alguns exemplos.
MA(2)
Previso a um passo h = 1
yn+1 =
1 un
2 un 1
1 un
+ un+1
Tem-se
E (yn+1 j Fn ) =
2 un 1
1 un+1
162
2 un
+ un+2
Tem-se
E (yn+2 j Fn ) =
2 un :
1 un+h 1
2 un+h 2
+ un+h
Tem-se
E (yn+h j Fn ) =
MA(q)
Deixa-se como exerccio verificar:
E (yn+h j Fn ) =
8
<
:
Pq
i un+h i
i=h
para h = 1; :::; q
para h = q + 1; :::
n+h;n
Previso a um passo h = 1
yn+1 = c +
n+1;n
1 yn
= E (yn+1 j Fn ) = E (c +
+ un+1
1 yn
+ un+1 j Fn ) = c +
1 yn :
n+2;n
= E (yn+2 j Fn ) = E (c +
=
c+
1 yn+1
1 yn+1
+ un+2
+ un+2 j Fn ) = c +
1 n+1;n
Previso a h passos
yn+h = c +
1 yn+h 1
163
+ un+h
E (yn+1 j Fn )
n+h;n
= E (yn+h j Fn )
= E (c +
1 yn+h 1
+ un+2 j Fn ) = c +
1 n+h 1;n
n+h;n
=c+
(6.9)
1 n+h 1;n
Observao 6.6.1 Podemos reescrever a equao (6.9) como funo do valor observado em
n: Por exemplo, a previso a dois passos (h = 2)
n+2;n
=c+
1 n+1;n :
n+1;n
= c+
1 yn
(6.10)
= c+
n+1;n
1 n;n
= c+
1 yn
podemos
escrita na forma
n+2;n
= c+
1 n+1;n
= c+
= c+c
(c +
1
1 yn )
2
1 yn :
n+3;n
= c+
1 n+2;n
= c+
= c+c
c+c
+c
2
1
2
1 yn
2
1 yn :
n+h;n
=c+c
+c
2
1
+ ::: + c
h 1
1
h
1 yn :
(6.11)
Do ponto de vista prtico irrelevante prever o modelo com base no modelo (6.9) ou com
base em (6.11), pois as expresses so equivalentes. No mbito dos modelos dinmicos,
a equao (6.9) designa-se por equao s diferenas finitas linear de primeira ordem (a
equao de juros compostos tambm uma equao do tipo) cuja soluo, dada a condio
164
inicial
n;n
1+
1+
2
1
h 1
1
+ ::: +
1
1
n+h;n
n+h;n
2
1
+ ::: +
h 1
1
h
1 yn
1
= c
1
Em suma, para obter
h
1 yn :
(6.12)
AR(2)
Previso a um passo h = 1
yn+1 = c +
n+1;n
1 yn
2 yn 1
+ un+1
= E (yn+1 j Fn )
= E (c +
1 yn
2 yn 1
+ un+1 j Fn ) = c +
1 yn
2 yn 1
n+2;n
1 yn+1
2 yn
+ un+2
= E (yn+2 j Fn )
= E (c +
= c+
1 yn+1
1 n+1;n
2 yn
+ un+2 j Fn ) = c +
E (yn+1 j Fn ) +
2 yn
1 yn+h 1
165
2 yn+h 2
+ un+h
2 yn
Dependent Variable: Y
Sample: 3 1000
Included observations: 998
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
Y(-1)
Y(-2)
10.81186
0.469309
0.314900
1.196611
0.030095
0.030098
9.035402
15.59406
10.46238
0.0000
0.0000
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.521901
0.520940
0.499762
248.5130
-722.3618
2.010668
50.10264
0.722051
1.453631
1.468378
543.0800
0.000000
= E (yn+h j Fn )
= E (c +
=
c+
1 yn+h 1
1 n+h 1;n
2 yn+h 2
+ un+2 j Fn )
2 n+h 2;n
n+h;n
=c+
1 n+h 1;n
2 yn+h 2;n :
Exemplo 6.6.1 Estimou-se um processo AR(2), cujos resultados esto apresentados na figura
6-15.
Tem-se n = 1000 e sabe-se que yn
previso para y para os perodo 1001, 1002 e 1003 (previso a um passo, a dois passos e a
trs passos).
Previso a um passo:
n+1;n
= c+
1 yn
2 yn 1
50:0207 + 0:3149
50:436 = 50:169:
50:169 + 0:3149
50:0207 = 50:108:
n+2;n
= c+
1 n+1;n
2 yn
166
n+3;n
1 n+2;n
2 n+1;n
50:108 + 0:3149
50:169 = 50:126:
AR(p)
Previso a um passo h = 1
yn+1 = c +
1 yn
+ ::: +
E (yn+1 j Fn ) = E c +
=
c+
1 yn
1 yn
p yn+1 p
+ ::: +
+ ::: +
+ un+1
p yn+1 p
+ un+1 Fn
p yn+1 p
1 yn+1
E (yn+1 j Fn ) = E c +
+ ::: +
1 yn+1
p yn+2 p
+ ::: +
+ un+2
p yn+1 p
E (yn+1 j Fn ) + ::: +
c+
c+
1 n+1;n :::
+ un+2 Fn
p yn+1 p
p yn+1 p
n+h;n
1 yn+h 1
+ ::: +
p yn+h p
+ un+h
= E (yn+h j Fn )
=
E c+
= c+
1 yn+h 1
1 n+h 1;n
+ ::: +
p yn+h p
2 yn+h 2;n
ARMA(1; 1)
167
+ un+h Fn
+ ::: +
p n+h p;n
Previso a um passo h = 1
yn+1 = c +
1 yn
+ un+1 +
1 un
= E (yn+1 j Fn )
n+1;n
E (c +
1 yn
+ un+1 +
c+
1 un
1 yn
1 un j Fn )
n+2;n
1 yn+1
+ un+2 +
1 un+1
= E (yn+2 j Fn )
=
E (c +
= c+
1 yn+1
+ un+2 +
1 un+1 j Fn )
1 n+1;n
n+h;n
6.6.3
1 yn+h 1
+ un+h +
1 un+h 1
= E (yn+h j Fn )
=
E (c +
c+
1 yn+h 1
+ un+h +
1 un+h 1 j Fn )
1 n+h 1;n
Intervalos de Previso I
168
O intervalo de confiana portanto (l1 ; l2 ) ; ou seja, yn+h estar no intervalo (l1 ; l2 ) com 0.95
de probabilidade dado Fn . Como determinar l1 e l2 ? Assuma-se que
yn+n j Fn
ou seja,
Z=
Tem-se assim,
yn+h E (yn+h j Fn )
p
Fn
Var (yn+h j Fn )
N (0; 1) :
yn+h E (yn+h j Fn )
l2 E (yn+h j Fn )
l1 E (yn+h j Fn )
p
< p
< p
Fn
Var ( yn+h j Fn )
Var ( yn+h j Fn )
Var ( yn+h j Fn )
= 0:95
e, portanto,
p
l1 E (yn+h j Fn )
p
=
1:96 ) l1 = E (yn+h j Fn ) 1:96 Var (yn+h j Fn )
Var (yn+h j Fn )
p
l2 E (yn+h j Fn )
p
= 1:96 ) l2 = E (yn+h j Fn ) + 1:96 Var ( yn+h j Fn )
Var (yn+h j Fn )
E (yn+h j Fn )
Em termos gerais, um IC a (1
) 100%
E (yn+h j Fn )
onde z1
=2
tal que P Z
p
1:96 Var ( yn+h j Fn ):
z1
=2
z1
=2
= 1
Var (yn+h j Fn )
=2 e Z
n+h;n
= E (yn+h j Fn ) ;
n+h;n
p
1:96 Var (e (h)):
169
(6.13)
Na prtica
n+h;n
lugar de
n+h;n
n+h;n
n+1;n
= c+
1 yn
a 1=n (no apndice 6.H discute-se esta questo). Para amostra grandes pode-se assumir
1=n ' 0 e, assim, podemos continuar a usar a expresso (6.13), substituindo os parmetros
desconhecidos pela respectivas estimativas consistentes. Vamos ver alguns exemplos.
MA(2)
Previso a um passo h = 1
yn+1 =
1 un
2 un 1
1 un
+ un+1
Tem-se
E (yn+1 j Fn ) =
2 un 1
E (yn+1 j Fn ) = un+1
en (1) = yn+1
Logo Var (en (1)) =
N 0;
e, assim, um IC a 95%
+
1 un
2 un 1
1 un
2 un 1
p
1:96 Var (en (1)) i.e.,
1:96
1 un+1
2 un
+ un+2
Tem-se
E (yn+2 j Fn ) =
yn+2
Logo Var (en (2)) =
E (yn+2 j Fn ) =
2
1
+1
2 un
1 un+1
+ un+2
N 0;
e, assim, um IC a 95%
2 un
q
1:96
170
2
1
+1
2
1
+1
Dependent Variable: Y
Method: Least Squares
Sample(adjusted): 1950:04 2005:05
Included observations: 662 after adjusting endpoints
Variable
Coefficient
Std. Error
t-Statistic
C
MA(1)
MA(2)
10.01857
0.373267
-0.231256
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.162759
0.160218
0.955072
601.1155
-907.4029
2.002569
Inverted MA Roots
.33
0.042397
0.037900
0.037917
Prob.
236.3054
9.848702
-6.099047
0.0000
0.0000
0.0000
10.01838
1.042205
2.750462
2.770833
64.05464
0.000000
-.70
^2 =
0:231256:
Pretende-se um intervalo de previso para 2005:6 (yn+1 ) e 2005:7 (yn+2 ) a 95%, supondo
inovaes (erros) normais. Previso a um passo:
n+1;n
^ n+1;n =
1 un
2 un 1
^ + ^1 u^n + ^2 u^n
= 10:01857 + 0:37326
0:055
0:231256
( 0:655)
= 10:191
13
O output do EVIEWS apresenta as razes invertidas do polinmio MA. Desta forma, o modelo invertvel
sse as razes invertidas so em mdulo inferiores a um. Como as razes so em mdulo inferiores a um concluise que o processo invertvel. Outra forma de chegarmos a esta concluso consiste em verificar se as seguintes
condies so vlidas:
1;
1 < 2 < 1:
1+ 2 >
1
2 < 1;
Tambm por aqui se conclui que o modelo invertvel verificando as desigualdades:
^1 + ^2
0:37326
^1
^2
<
0:231256 >
0:231256 < 1:
171
1;
13
12
11
10
9
8
7
2005:06
2005:07
YF
2 S.E.
1:96
1 un
2 un 1
1:96
n+2;n
2 un
^ n+2;n = ^ + ^2 un
= 10:01857
0:231256
0:055
= 10:005
IC para yn+2 a 95%:
q
2
2
+ 2 un 1:96
1+1
p
10:005 1:96 (0:373262 + 1)
No EVIEWS o grfico da previso a dois passos dada pela figura 6-17 (h uma ligeira
diferena entre os IC acima calculados e os IC fornecidos pelo EVIEWS. Porqu?)
MA(q)
172
E (yn+h j Fn ) =
8
<
Pq
i un+h i
i=h
para h = q + 1; :::
E (yn+h j Fn ) =
en (h) = yn+h
h 1
X
(h) =
i un+h i
= 1)
i=0
Tem-se
e2n
para h = 1; :::; q
h 1
X
2
i
(6.14)
i=0
q
X
v
u
u
1:96t
i un+h i
i=h
h 1
X
2
i
i=0
AR(1)
A determinao dos intervalos de previso no imediata nos processos AR e ARMA
em geral.
Previso a um passo h = 1
yn+1 = c +
n+1;n
1 yn
+ un+1
= E (yn+1 j Fn )
= E (c +
1 yn
+ un+1 j Fn ) = c +
1 yn
en (1) = un+1
Previso a dois passos h = 2
yn+2 = c +
n+2;n
1 yn+1
+ un+2
= E (yn+2 j Fn )
= E (c +
= c+
1 yn+1
+ un+2 j Fn ) = c +
1 n+1;n
173
E (yn+1 j Fn )
en (2) =?
Para determinar en (h) e consequentemente os IC a ideia consiste em representar yn+h
na forma MA. Precisamos, portanto, de uma frmula geral que fornea en (h) e Var (en (h))
(veremos isso a seguir).
6.6.4
yn+h =
=
(L) un+h
1
p
1
X
(L)
(L) un+h
j un+h j
(6.15)
= 1).
j=0
A expresso E (yn+h j Fn ) pode ser obtida recursivamente como vimos no caso AR(p) com
h = 2 : Agora interessa-nos representar E (yn+h j Fn ) numa outra forma equivalente para
que possamos obter en (h) :
Como
yn+h =
1
X
j un+h j
j=0
tem-se
E (yn+h j Fn )
1
X
= E
j un+h
j=0
= E
=
0 un+h
h un
Fn
1 un+h 1
h+1 un 1
+ ::: +
h 1 un+1
+ :: :
174
h un
h+1 un 1
+ ::: Fn
Logo
E (yn+h j Fn )
en (h) = yn+h
=
0 un+h
h un
=
=
0 un+h
h 1
X
1 un+h 1
+ ::: +
h+1 un 1
:::
1 un+h 1
+ ::: +
h 1 un+1
h un
h+1 un 1
+ :::
h 1 un+1
j un+h j :
j=0
Portanto,
E (en (h)) = 0
Var (en (h)) = E e2n (h) =
h 1
X
2
j;
=1
(6.16)
j=0
Coefficient
Std. Error
t-Statistic
Prob.
C
Y(-1)
Y(-2)
10.81186
0.469309
0.314900
1.196611
0.030095
0.030098
9.035402
15.59406
10.46238
0.0000
0.0000
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.521901
0.520940
0.499762
248.5130
-722.3618
2.010668
50.10264
0.722051
1.453631
1.468378
543.0800
0.000000
Vimos:
^ n+1;n = 50:169; ^ n+2;n = 50:108; ^ n+3;n = 50:126:
Sabendo que
1
0:469309L
0:31490L2
E (yn+h j Fn )
ou
p
1:96 Var (en (h))
n+h;n
ou
q
d (en (h))
1:96 Var
^ n+h;n
No caso dos modelos MA a expresso Var (en (h)) determina-se facilmente, como vimos
atrs. No caso dos modelos AR (ou ARMA) temos de usar a expresso (6.16)
h 1
X
2
j
j=0
d (en (h)) = ^ 2
ou Var
h 1
X
^2
j
j=0
^ n+1;n
Ora ^ n+1;n = 50:169 e
d (en (1)) = ^ 2
Var
1 1
X
^ 2 = ^2
j
0
X
^ 2 = ^2 ^ 2 = ^2:
0
j
j=0
j=0
Assim
^ n+1;n
50:169
p
1:96 ^ 2
1:96
0:499762:
q
d (en (2)):
1:96 Var
176
2 1
X
^ 2 = ^2 1 + ^ 2
1
j
j=0
0:4997622
1 + 0:4692 = 0:30470:
Assim
^ n+2;n
50:108
q
d (en (2))
1:96 Var
p
1:96 0:30470:
^ n+3;n
Ora ^ n+2;n = 50:126 e
d (en (2)) =
Var
^2
3 1
X
^ 2 = ^2 1 + ^ 2 + ^ 2
2
1
j
j=0
0:4997622
1 + 0:4692 + 0:5352
= 0:37619:
Assim
^ n+3;n
50:126
6.6.5
q
d (en (3))
1:96 Var
p
1:96 0:37619:
Previso de longo prazo significa tomar h muito alto. Qual a previso de yn+h quando
h ! 1? Isto , qual o valor de
lim E (yn+h j Fn )?
h!1
h!1
Outra questo tem a ver com os intervalos de previso. Vimos que os intervalos de previso
dependem da varincia do erro de previso
h 1
X
2
j
j=0
onde
yt =
1
p
(L)
(L) ut =
(L)
p
1
X
(L) ; Recorde-se,
j ut j :
j=0
lim
h!1
1
j=0
h 1
X
2
j
2
j:
j=0
Ph
P1
2
j
j=0
Vimos em que condies se estabelece a estacionaridade. Outra forma alternativa consiste em considerar
a representao MA(1) do ARMA. Vimos
yt =
1
p
(L)
(L) ut =
1
X
j ut j :
j=0
Tem-se
E (yt )
Var (yt )
0
1
X
Var @
j ut
j=0
A=
j
1
X
2
j
j=0
P1
P1
Assim se y E2O devemos ter Var (yt ) = 2 j=0 2j < 1: Logo devemos exigir j=0
P1 2
j=0 j < 1 condio necessria para que y seja estacionrio. Nestas condies
Var (en (h)) = E e2n (h) =
h
X1
j=0
178
2
j
! Var (yt ) :
2
j
< 1 e, portanto,
finito. Para que valor tende? Pode-se provar (veja-se o ltimo p-de-pgina) que
Var (en (1)) = Var (y) :
Assim, se y estacionrio e Gaussiano, um intervalo de confiana a 95% para yn+h com h
muito alto (ou h ! 1)
p
1:96 Var (y)
E (y)
+ ut +
1 ut 1 :
A previso a um passo
n+1;n
= E (yn+1 j Fn ) = yn +
1 un :
A dois passos
n+2;n
1 un+1 j Fn )
1 un
A h passos
n+h;n
= yn +
1 un :
Ph
1
j=0
L) yt = (1 + 1 L) ut ou
(1 + 1 L)
yt =
ut
1 L
179
2
j:
Temos de
Para determinar
i:
(1 + 1 L)
= 1 + 1 L + 2 L2 + :::
1 L
1 + 1 L = 1 + 1 L + 2 L2 + ::: (1
= 1
L+
= 1+(
Resulta:
8
>
>
>
>
>
>
<
0=
1L
1) L + (
1
2
>
>
0= 3
>
>
>
>
:
:::
1L
8
>
>
>
>
>
>
<
>
>
>
>
>
>
:
L)
2L
1) L
2L
2
=1+
=1+
=1+
+ :::
+ :::
:::
e, portanto,
h 1
X
2
j
j=0
1 + (1 +
1 + (h
2
1)
+ ::: + (1 +
1) (1 +
2
1)
2
1)
6.6.6
Qualidade da Previso
180
Out-of sample
forecast
evaluation period
t1
Figura 6-18: In-Samples Estimation Period vs. Out-of Sample Forecast Period
disponveis sejam y1 ; :::; yt1 ; :::; yn o modelo estimado apenas para o perodo de 1 a t1 :
Com base no modelo estimado no perodo in-sample estimation, geram-se depois as previses para o perodo out-of sample forecast e, finalmente comparam-se as previses com
os valores observados mas no utilizados na estimao. O esforo de previso no perodo
ps-estimao equivalente ao de uma previso verdadeira15 .
Seja
e (h) = et1 (h) = yt1 +h
E (yt1 +h j Ft1 )
(com t1 + h = n).
Avaliao da Previso I
Tendo-se calculado os erros e (1) ; e (2) ; :::; e (h) ; podemos agora avali-los atravs das
seguintes medidas:
Erro Mdio de Previso
1X o
(y
EM P =
h i=1 i
h
1X
=
e (h)
h i=1
h
yip )
15
Tambm se definem as previses in-sample forecast. Tratam-se de previses geradas no perodo de estimao do modelo. Por exemplo, previses a h-passos
E ( yt+h j Ft ) ;
t+h
t1 :
O esforo de previso baixo porque o modelo de previso usa estimativas ^ baseadas nas observaes
y1 ; :::; yt1 (a qualidade da previso a um passo, h = 1; pode ser avaliada atravs dos critrios habituais de
ajustamento R2 ; ^ ; etc.).
A avaliao da qualidade da previso deve basear-se nas previses out-of-sample.
181
v
u h
u1 X
p 2
e (h)2
yi ) = t
h i=1
EAM =
1X
je (h)j
h i=1
h
yip j =
EP AM =
Coeficiente de Theil
REQM
q P
;
h
p 2
1
o 2
(y
)
+
(y
)
i
i
i=1
i=1
h
U=q P
h
1
h
EQM penaliza fortemente os erros maiores. A grande maioria das previses pode ser excelente mas o EQM pode ser alto se existir uma previso m ou muito m. O EAM no
to severo neste aspecto. Se a grande maioria das previses for boa ento o EAM vem
relativamente baixo.
Relativamente ao coeficiente de Theil, quanto mais baixo U melhor a previso. O
caso U = 1 o pior cenrio (por exemplo, prever sistematicamente zero quando os valores
observados so diferentes de zero, ou prever sempre valores positivos quando os valores
observados so sempre negativos, etc.).
As estatsticas anteriores avaliam a magnitude do erro de previso e, com excepo do
EMP, no levam em conta se o erro de previso positivo ou negativo. Em certos casos, o
sinal do erro de previso importante. Para ilustrar esta situao, considere-se o seguinte
exemplo. Seja y a hora de partida do avio, y p a previso da hora de chegada ao aeroporto
(para embarcar) e e = y
e < 0 chega atrasado e perde o avio. Como poderemos avaliar o erro de previso? Funo
quadrtica do tipo EQM? (penalizar de igual forma chegar cedo ou tarde?). Uma funo de
182
8
< 999 e < 0
L (e) =
: ke e > 0;
(6.17)
k > 0:
Assim, chegar atrasado envolveria uma perca de 999 (valor que supomos muito alto), ao
passo que chegar adiantado e unidades de tempo, envolveria uma perca proporcional a e
(supondo 999 > ke). Uma estatstica de avaliao da qualidade da previso baseada em
(6.17)
1X
999Ife(i)<0g + ke (i) Ife(i)>0g :
h i=1
h
(6.18)
(6.19)
Observe-se: se a previso correcta yhp e yho apresentam o mesmo sinal e, portanto, o produto
yhp yho positivo. Uma estatstica de avaliao da qualidade da previso baseada em (6.19)
1X
I p o :
h i=1 fyi yi <0g
h
(6.20)
A equao (6.20) representa a proporo de previses com sinal incorrecto. Pode-se preferir,
todavia, trabalhar com a proporo de previses com sinal correcto:
1X
P P SC =
I p o :
h i=1 fyi yi >0g
h
Avaliao da Previso II
Os erros de previso podem devem-se, basicamente, s seguinte razes:
As previses esto quase sempre acima ou abaixo dos valores observados (exemplo:
valores observado: 10, 11, 9, 12; previses: 15, 16, 13, 16);
A variabilidade das previses diferente da variabilidade dos valores previstos (exem183
s2o
r=
1X p
=
(y
h i=1 i
h
o 2
s2p
y ) ;
1
h
Ph
i=1
(yio
y o ) (yip
s0 sp
y p )2
yp)
e defina-se
UE =
(y o y p )2
;
EQM
UV =
(so sp )2
;
EQM
UC =
2 (1 r) s0 sp
;
EQM
h
1
2
3
4
5
6
7
8
9
10
Mdia
Varincia
corr(y,ypi)
UE
UV
UC
U
Observado
y
1
2
3
2
4
5
6
7
5
9
4.4
5.64
Modelos de Previso
yp1
yp2
yp3
2
2
1
3
3
3
2
3
4
4
4
4
4
5
7
5
6
2
5
7
9
7
8
3
4
9
9
10
10
11
4.6
5.7
5.3
5.24
6.81
10.61
0.9124
0.9230
0.6567
0.0400
0.6259
0.1174
0.0074
0.0204
0.1129
0.9526
0.3537
0.7698
0.0986
0.1458
0.2341
12
10
8
y
yp1
yp2
yp3
6
4
2
0
1
10
185
Em ambos os casos, em cada iterao, faz-se sempre uma previso a 5 passos. Todavia,
com o mtodo rolling window, o perodo de estimao contm sempre 1000 observaes (o
esforo de estimao constante). Na primeira hiptese o esforo de estimao vai diminuindo media que se acrescentam mais observaes no perodo da estimao. Ao fim de
vrias iteraes temos uma amostra de valores observados e valores previstos a 5 passos,
que podemos comparar usando as estatsticas j estudadas (EQM, EAM, etc.). Em termos
re
:= E (yi+h j Y1i ) a previso a h passos usando o
formais, seja,Yki = fyk ; yk+1 ; :::; yi g ; yh;i
ro
:= E yi+h j Yii
mtodo recursive forecasting, yh;i
o mtodo rolling window e yio := yi+h os valores observados. Com base em s previses
out-of-sample, podemos calcular, por exemplo,
1X o
EQM (h) =
y
s i=1 i
1X o
EAM (h) =
y
s i=1 i
EAM re (h) =
re
1X o
y
s i=1 i
re 2
yh;i
EQM ro (h) =
re
1X o
y
s i=1 i
re
yh;i
ro
yh;i
ro
yh;i
:
REQM re (2)
EAM re (2)
:::
:::
REQM re (h)
EAM re (h)
Previso no EVIEWS
A previso no EVIEWS definida na janela forecast. Para obter previses out-ofsample necessrio, em primeiro lugar, encurtar a amostra na fase da estimao. Para
concretizar, suponha-se que esto disponveis 1100 observaes da srie y. Se o perodo
out-of-sample forecast for 1001-1100, o perodo de estimao obviamente 1-1000. Assim,
na opo de estimao deve-se escrever na caixa sample 1 1000 (veja-se a figura 6.6.6).
Depois de estimado o modelo, escolhe-se a opo forecast e na caixa Forecast sample
escreve-se 1001 1100 (veja-se a figura 6-20).
A opo Dynamic forecast faz a previso de y ignorando os valores observados de y no
perodo 1001-1100 (segue a metodologia exposta em Avaliao da Previso I). Por exemplo, no caso da previso AR(1) usa-se a frmula ^ n+h;n = c^ + ^ 1 ^ n+h
1;n .
A opo Static
forecast segue o esprito da metodologia Recursive Forecasting vs. Rolling Window para
h = 1 com a seguinte diferena: o perodo de estimao mantm sempre fixo. No exem186
187
plo em anlise o perodo de estimao sempre 1-1000. A previso AR(1) para o perodo
1001 c^ + ^ 1 y1000 ; para o perodo 1002 c^ + ^ 1 y1001 ; etc. Os parmetros estimados c^ e ^ 1
baseiam-se sempre na amostra 1-1000. Em qualquer destas opes o EVIEWS calcula vrias
estatsticas a partir dos erros de previso e (i) ; i = 1; 2; ::: Por razes bvias a previso para
alm do perodo de observao da varivel (no exemplo em estudo, 1101-) s pode fazer-se
usando a opo Dynamic forecast.
6.6.7
Mdias Mveis
Para tendncias localmente constantes a previso de y; para o perodo n + 1; n + 2; :::,
baseada na informao fy1 ; :::; yn g
p
yn+h
=
yn + yn
+ ::: + yn
N
N +1
h = 1; 2; :::
Sn =
h = 1; 2; :::
yn + (1
) Sn 1 ;
188
0<
<1
) yn
1+
)2 yn
(1
2 + ::: +
)n
(1
)n S0 : (6.21)
y1 + (1
) Sn 1 :
Dem. Uma forma de provar esta afirmao consiste em mostrar que, se yt segue um
ARIMA(0,1,1)
yt = yt
ut
+ ut ;
= yt
ut
ento, a previso para yn+1 pode-se escrever na forma da equao (6.21)17 . Uma demonstrao alternativa a seguinte. No modelo ARIMA(0,1,1) a previso para yn+1 E (yn+1 j Fn ) =
16
Com efeito,
Sn
yn + (1
) Sn
yn + (1
) ( yn
1
1
+ (1
yn + (1
) yn
yn + (1
) yn
1 + (1
=
=
=
yn + (1
) Sn
+ (1
) yn
+ (1
) yn
2)
) Sn
) ( yn
2
yn
2
2
+ (1
) Sn
3)
+ (1
) Sn
:::
yn +
(1
(1
) yn
+ ::: +
(1
n 1
y1 + (1
) S0 :
= yn
un
= yn
(yn
n)
= yn
yn +
) yn + (yn
(1
un
2)
un
(yn
(1
) yn + yn
(1
) yn + yn
(1
) yn + (1
) yn
+ un
) yn + (1
) yn
+ (1
1
1
un
3)
= :::
=
(1
yn
+ ::: + (1
n 1
y1 +
y0 :
189
n+1;n :
= yt
= yt
ut
= (1
yt
t 1
t 1:
) yt
n+1;n
ou, redefinindo, Sn =
n+1;n
= (1
=1
) yn +
; vem
Sn = yn + (1
) Sn 1 ;
6.A
s1 yt+s 1
s2 yt+s 2
+ ::: +
ss yt
t+s
Para obter
11
s1 j 1
+ ::: +
obtm-se o sistema,
j = 1; 2; :::; s:
ss j s
11 0
190
= 1).
(6.22)
Donde,
11
Para obter
22
1:
e resolve-se em ordem a
22
21
21 1
(e em ordem a
21 ).
22 1
22
obtm-se
22
2
1
:
2
1
33
6.B
2 1
2 21
2
2
3
1
2
2
2
1 2
2 21 +
2
1 3
Mostra-se a seguir que um processo no invertvel pode transformar-se num processo invertvel com funes de autocorrelao e autocorrelaes parciais iguais.
Associado a um processo MA(1) no invertvel existe sempre um outro processo MA(1)
invertvel com a mesma FAC e FACP. Por exemplo, considere-se o processo MA(1) no
invertvel.
yt = 4ut
+ ut ;
= 4:
(6.23)
Este modelo no serve para previso pois a representao autoregressiva no est bem definida.
191
42
+1
= 0 para s > 1
4
4
=
+1
17
e
=
11
ss
+1
4
17
2(s+1)
= 15
4s
1 42s+2
Ora o processo
1
y~t = u~t
4
~= 1
4
+ u~t ;
ss
=
1
~
2
~ +1
1
1 2
+1
1 2
1 2(s+1)
= 15
+1
4
17
4s
:
1 42s+2
Na prtica, qual o alcance deste resultado? Se no ocorrer invertibilidade na fase da estimao devemos definir outros valores iniciais para os parmetros. Por exemplo, se o programa fornece como estimativa ^ = 4 devemos definir outros valores iniciais at que o
software encontre a estimativa 1=4 para o parmetro do processo MA. Convm lembrar que
a estimao de processos MA envolve problemas de optimizao no linear. Por vezes, a
soluo do problema de optimizao um extremante local (e no global, como desejvel). Podero existir outros extremantes que sero detectados se definirmos outros valores
de inicializao.
6.C
0:5L + 0:1L2
(L) = 1
0:5L3 ) ut invertvel?
0:5L + 0:1L2
192
0:5L3 :
p
a2 + b 2 :
Resolvendo
seguintes razes
0:42 + 1:3i;
0:42
1:3i;
1:05
Como
j 0:42 + 1:3ij =
0:5L + 0:1L2
j1:05j > 1
da expresso
1
1
0:5L + 0:1L2
1L
0:5L + 0:1L2
0:5L + 0:1L2
1= 1
=1+
0:5L3
0:5L3
2L
+ :::
0:5L3 ) tem-se
1+
1L
2
2L
+ ::: :
8
>
>
>
<
0:5) L + (0:1
>
>
>
:
2
2) L
0:5
=0
:::
0:5L + 0:1L2
+ :::
0:5 = 0
0:1
0:5
0:5L3
e, portanto,
yt =
0:5yt
0:15yt
0:52yt
0:49yt
0:27yt
:::
1
0:5L + 0:1L2
193
0:5L3
,{L,0,5}].
i:
polinmio MA (L) = (1
(L) = 0 ) L1 = 0:25
(L) = (1
1
1
e
:
L1 L2
Quando as razes so reais bvio que jLj > 1 implica j1=Lj < 1: Quando as razes so
complexas pode-se provar que jLj > 1 , j1=Lj < 1: Com efeito, suponha-se que uma raiz
p
de (L) a + bi: Esta raiz est fora do crculo unitrio se ja + bij = a2 + b2 > 1: Se a
raiz a + bi invertida, tem-se
1
a
= 2
a + bi
a + b2
e
1
=
a + bi
a
2
a + b2
a2
b
i
+ b2
b
2
a + b2
=p
1
:
+ b2
a2
a2 + b 2 > 1 ,
1
0:25
1
1
=p
< 1:
2
a + bi
a + b2
1:56i
1
= 0:100 16
0:25 + 1:56i
194
0:624 97i:
Como
(L) ut invertvel. Em
um (ou dentro do circulo unitrio no plano complexo). Veremos ainda que as razes invertidas
do polinmio AR (L) devem tambm ser em mdulo inferiores a um (ou dentro do circulo
unitrio no plano complexo) para que o processo seja ESO.
Exemplo 6.C.2 Retome-se o exemplo 6.C.1. O programa EVIEWS em lugar de fornecer as
razes
0:42 + 1:3i;
0:42
1:3i;
1:05
0:225
0:696i;
1
= 0:952:
1:05
0:225 + 0:696i;
0:696ij <
6.D
A ESO pode ser discutida a partir de vrios conceitos. Para processos lineares relativamente
fcil estudar a ESO. Considere-se (com c = 0) o processo AR(1)
yt = yt
+ ut =
y0 +
t 1
u1 +
t 2
u2 + ::: + ut
+ ut
(6.24)
(tendo-se admitido que o processo teve incio em t0 ). Questo: para que valores de
mdia, a varincia e a covarincia no dependem de t? A mdia
E (yt ) = E (E (yt j F0 )) =
E (y0 ) :
E (y0 ) = E (y0 ) :
195
= 1 vem
E (y0 ) ! 0 quando t ! 1:
E (yt ) =
E (y0 ) = 0:
= E E yt2 F0
= E E
= E E
2t 2
y0
2t 2
y0
= E
2t
=
Se
t 1
y0 +
2(t 1) 2
u1
2(t 1) 2
2
E y0 +
2(t 1)
t 2
u1 +
u2 + ::: + ut
2(t 2) 2
u2
2(t 2) 2
+ ut
2 2
2
+ ::: +
21
1
E (y02 ) +
2
2
F0
+ u2t + :::
F0
2t
21
1
+1 :
2 2
ut 1
+ ::: +
+ ::: +
2(t 2)
E (y02 )+
2t
2
2
E yt =
2t
21
2t
(constante 8t).
: Suponha-se agora
yt = u1 + u2 + ::: + ut
196
+ ut
e, assim,
E (yt yt k ) = E (E (yt yt
jFt
k ))
= E (yt
E (yt jFt
k ))
k ))
t;k
(t
+ E (termos cruzados)
k) (depende de t)
= 1):
(t
k)
2t
k
t
=1
k
=
t
t;k
(depende de t). Coligindo todos resultados conclui-se que a mdia, a varincia e a covarincia no dependem de t se j j < 1: Em suma,
j j < 1 , yt ESO
(supondo que a condio inicial tem distribuio estacionria ou que o processo foi iniciado
num passado remoto).
Outra forma de analisar a questo em estudo a seguinte18 . Considere-se novamente o
AR(1)
yt = c + yt
+ ut
f (x) = c + x
Satisfeitas outras condies (ver Tong, 1990) o processo y EE se o ponto fixo y da EDF
y~t = c + y~t
18
Apenas para o leitor que tenha estudado o problema da estabilidade no mbito das equaes s diferenas
finitas determinsticas.
197
c
1
Como se sabe, a condio jf 0 (y)j < 1 implica que y assimptoticamente estvel. Ora
f 0 (x) = : Portanto, se j j < 1; y assimptoticamente estvel e y EE.
Pode-se tambm recorrer s proposies 4.5.1 e 4.5.4 notando que, no caso AR(1) a
funo g g (x) =
6.E
1 yt 1 +:::+ p yt p +ut
p+1 :
Tem-se
y1;t = c +
y2;t = y1;t
..
.
yp;t = yp
1 yt 1
+ ::: +
1;t:
198
p yt p
+ ut
num sistema
y1;t
C B
C B
y2;t C B
C B
.. C = B
. C B
A @
yp;t
| {z } |
yt
n 1
1
..
.
0
..
.
...
{z
0
..
.
0
..
.
10
y
CB 1;t 1
CB
CB y2;t 1
CB
CB ..
CB .
A@
yp;t 1
}|
{z
yt
C B
C B
C B
C+B
C B
C B
A @
}
ut
0
..
.
1
C
C
C
C
C
C
A
0
| {z }
gt
= diag ( 1 ; :::;
n)
a matriz dos valores prprios de A e P a matriz dos vectores prprios associados (admitemse linearmente independentes). Como se sabe da lgebra linear, verifica-se a igualdade
At = P
dulo menores do que um. S nestas condies se tem At ! O: Pode-se provar que esta
condio equivalente seguinte: o processo AR(p) estacionrio sse as razes da equao
p
6.F
Neste apndice faz-se uma breve anlise dos processos ARMA sazonais ou SARMA.
Muitas sucesses envolvem uma componente sazonal ou peridica de perodo S (nmero
de observaes por perodo). Exemplos:
199
yt
Frequncia S
Entrada de Turistas
Mensal
12
Entrada de Turistas
Trimestral
Retornos de um Ttulo
Dirios
1981
1982
1983
1984
1985
12
12
alto) yt alto
baixo) yt baixo
1 yt 12
+ ut ; ou
yt =
1 yt 12
1 yt 24
+ ut :
Processo AR(P)S
AR(1)S
yt =
1 yt S
+ ut
AR(2)S
yt =
1 yt S
AR(P)S
yt =
1 yt 12
S
1L
ut rudo branco
2 yt 2S
2 yt 2s
+ ut
+ ::: +
2S
2L
:::
P yt P s
PL
P
200
+ ut ou,
PS
yt = ut
LS yt = ut :
Para um AR(1)S , yt =
1 yt S
yt =
1
X
j
1 ut jS ;
E (yt ) = 0;
j=0
2
Var (yt ) =
1
X
2j
1
j=0
2
1
= Var (ut ) ),
1 X
1
X
j
1
i
1
E (ut
iS ut+1 jS )
=0
i=0 j=0
Donde
k
8
<
j
1
j+1
1
i=0
m
1
2
1
k = mS; m = 0; 1; 2; :::
: 0
kk
k 6= mS; m = 0; 1; 2; :::
8
<
: 0
k=S
k 6= S:
= 0:5:
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
FAC
12
24
36
48
36
48
FACP
12
24
yt =
1 ut S
+ ut ;
ut rudo branco;
201
MA(2)S
yt =
1 ut S
MA(Q)S
yt =
2 ut 2S
1 ut S
yt =
Para um MA(1)S , yt =
2 ut 2S
:::
S
1L
yt =
+ ut ;
Q ut QS
2S
2L
:::
+ ut ou,
QL
Qs
ut
LS ut
1 ut S
E (yt ) = 0;
Var (yt ) =
Tambm se pode concluir:
k
e
kk
8
<
1+
8
<
:
2
1
1+
= Var (ut ) ).
k=S
2
1
k 6= S
0
1
1+
m 1
1 (
1
2
1
k=S
)
2
1
2(m+1)
1
k 6= S:
0:5
1
FAC
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
1
12
24
36
48
36
48
FACP
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
12
24
(L)
LS y t =
202
(L)
LS ut
1L
yt =
1 yt 1
2
2L
1L
2
2L
2 yt 2
12
1L
1
+
1L
12
13
1L
1 yt 12
yt = (1 +
14
1L
1 yt 13
1 L) ut
yt = ut +
1 yt 14
1 ut 1
+ ut +
1 ut 1
6.G
+ d + u; o estimador OLS de
^ = (d0 Md)
d0 My;
= (d0 Md)
d0 M (X
+ (d0 Md)
X (X0 X)
M=I
+ d + u)
d0 Mu:
e^ !
implica ^^ !
X0
e d0 M u (note-se que
). Tem-se
d0 Md = d0 I
X (X 0 X)
= 1
x0t (X0 X)
= 1
x0t
n
X0 X
n
X0 X
n
p
!Q
p
d0 Md ! 1:
203
X0 d
d0 X (X 0 X)
= d0 d
X0 d
xt
1
xt :
X (X0 X)
d0 Mu = d0 I
= d0 u
d0 X (X0 X)
= ut
d0 X
X0 u
X0 u
1
X0 X
n
X0 u
n
d0 Md ! ut :
(6.26)
d0 Mu !
+ ut :
b) Considere-se
y=X
^"t = d0 My:
+ ";
Tem-se
^ =
XX
n
x0t
n
X0 X
n
x0t
n
xt
xt
e,
^
=
^"t
Resulta
6.H
^
^
"t
x0t
n
X0 X
n
xt
d0 My
1
^"t
!1
n+h;n
por
^ n+h;n aumenta a varincia do erro de previso numa quantidade proporcional a 1=n. Veja-se
esta questo mais em pormenor.
204
Quando
n+h;n
n+h;n )
^ n+1;n
^ n+h;n Fn
= Var yn+h
n+h;n
= Var yn+h
n+h;n
+ ^ n+h;n
n+h;n
Fn
Fn + Var ^ n+h;n
n+h;n
independente de ^ n+h;n
n+h;n
n+h;n ;
Fn
Fn
pois yn+h
n+h;n
n+h;n
n+h;n
envolve
envolve variveis at ao
q
1:96 Var (e (h)) + Var ^ n+h;n
n+h;n
n+h;n
Fn :
n+h;n
parada com Var (e (h)) e pode ser negligenciada. A quantidade Var ^ n+h;n
n+h;n
Fn
pode ser estimada a partir de uma equao auxiliar. Para exemplificar considere-se a previso
a um passo de um AR(1). A estimativa de c da equao
yt = c +
fornece uma estimativa para
n+1;h
(yt
yn ) + ut
n+1;n
Fn = Var ^ n+1;n Fn :
205
yn ) = c^:
6.I
UE + UV + UC = 1
Veja-se em primeiro lugar que o EQM pode-se decompor em vrias parcelas. Considere-se:
1X o
EQM =
(y
h i=1 i
h
1X o
(y
=
h i=1 i
yip )2
1X o
=
((yi
h i=1
yip + y p
yo + yo
y p )2
1X o
(y
=
h i=1 i
|
{z
h
2
o
y p ))2
y p ) + (y o
1X p
y ) +
(y
h i=1 i
} |
{z
h
y p )2
o 2
2
p
1X o
(y
y o ) (yip
h i=1 i
{z
|
h
y p )2
+ (y o
(yip
yo)
yp)
}
0 p
2
o
2
p
y p )2
+ (y o
0 p
= (
2
p)
+ (y o
y p )2 + 2 (1
0 p
EQM = (
2
p)
+ (y o
y p )2 + 2 (1
0 p
Assim
1 =
UV
UE
206
UC
0 p
Captulo 7
Modelao da Mdia: Abordagem No
Linear
(ltima actualizao: 04/2010)
7.1
Introduo
Ao longo das ltimas dcadas os modelos ARMA tm dominado a abordagem de sries temporais (os primeiros trabalhados datam de 1927 com os modelos autoregressivos estudados
por Yule). Existem razes para o sucesso dos modelos ARMA Gaussianos:
simplicidade: as equaes s diferenas finitas so fceis de tratar;
o modelo ARMA Gaussiano completamente caracterizado pela mdia, varincia e
pelas autocorrelaes;
so fceis de aplicar e implementar (a maioria dos programas de estatsticas possui um
mdulo para tratar os modelos ARMA);
a teoria est completamente desenvolvida: as principais questes, relacionadas com a
estimao, inferncia e previso esto resolvidas;
apesar da simplicidade so relativamente flexveis e teis na previso.
Todavia, os modelos ARMA apresentam limitaes:
no so apropriados para dados que exibam sbitas alteraes em perodos irregulares;
207
baixos, mas existir uma forte relao no linear entre yt e yt k : Por exemplo
Corr yt2 ; yt2
kk
serem
(y 2 ) =
< 1
O c
A expresso anterior estabelece que P (jyj > c) proporcional (ou menos do que proporcional) a c k . Como c
zero nas mesmas condies, e relativamente depressa se k uma valor alto. Logo, a possibilidade de jyj assumir um valor arbitrariamente grande praticamente nula. Se y possuir
apenas o primeiro ou segundo momento, P (jyj > c) continua a tender para zero, mas a uma
taxa muito mais baixa, e y pode assumir valores moderadamente altos. A existncia de
todos os momento como no caso do modelo ARMA Gaussiano, pode, em certos casos, no
ser uma propriedade desejvel, pois em ltima anlise impede que o modelo capte dados que
exibam sbitas alteraes, excluindo portanto, os casos em que y assume transitoriamente
valores muito altos ou muito baixos.
Enquanto os modelos lineares so definidos apenas pela representao ARMA, o nmero
de especificaes no lineares virtualmente infinito. Embora a literatura dos modelos no
lineares esteja ainda na sua infncia, existem j muitos modelos no lineares propostos na
literatura. Vamos apenas focar alguns modelos no lineares mais utilizados. Mas afinal, o
que um modelo no linear?
208
Uma forma simples (mas no geral) de introduzir modelos no lineares consiste em apresentar a no linearidade atravs dos momentos condicionais. Considere-se o modelo
yt =
onde "t um rudo branco,
cional de yt e
2
t
+ ut ;
ut =
t "t
t "t ,
+ log 1 + yt2
= yt
+ ut
+ ut
+ log 1 + yt2
uma funo
no linear de yt 1 : Tambm
y t = u t 1 ut
um processo no linear, pois
= ut 1 ut
Dizemos que uma funo no linear se no for uma funo linear afim, i.e., se no verificar a relao
f (x1 ; :::; xn ) = a0 + a1 x1 + ::: + an xn , onde ai 2 R:
209
ausncia de reverso para uma mdia. Outro exemplo a taxa de inflao no perodo
1974-2006 (basta verificar os nveis de inflao e volatilidade nos anos 70/80 e nos
anos 90).
Para este tipo de fenmenos, os modelos com alteraes (estocsticas) de regime (ou
regime-switching) podem ser, no essencial, de dois tipos:
a mudana de regime funo de uma varivel observvel; so exemplos, modelos
com variveis impulso (dummy), os modelos limiares ou threshold AR (TAR), os modelos onde os coeficientes associados s componentes AR so funes no lineares dos
valores passados y (STAR, smoothed transition AR), entre outros;
a mudana de regime no observada, incluindo-se, nesta classe, os modelos onde os
regimes so independentes entre si (como, por exemplo, os modelos simple switching
ou de Bernoulli) e os modelos onde existe dependncia entre os regimes (como por
exemplo, os modelos MS, Markov-Switching).
Antes de entrarmos nos processos estocsticos no lineares, faz-se, na prxima seco,
uma breve incurso sobre os sistemas autnomos do tipo
yt = g (yt 1 )
(determinsticos). O estudo da estabilidade deste tipo de sistemas relevante para um estudo
mais aprofundado dos processos estocsticos do tipo yt = g (yt 1 )+ut (ou, mais geralmente,
yt = g (yt 1 ; yt 2 ; :::; yt p ) + ut ), pois parte da dinmica subjacente ao processo estocstico
depende da funo g (ou g no caso multivariado).
7.2
210
7.2.1
Definio 7.2.1 (Ponto Fixo de f ) Um vector y designado por ponto fixo de g se g (t; y) =
y; para todo o t.
No ponto fixo o sistema dinmico discreto no varia (est em equilbrio). Com efeito,
se yt
yt 1 = g (yt 1 )
yt 1 = y
yt ; nula, i.e.,
y t = yt
y = 0:
(1
yt 1 ) : Tem-se g (x) = 2x (1
x) : Os pontos
y) = y: Os pontos fixos
so portanto y = 0 e y = 1=2:
Exemplo 7.2.2 Considere-se o sistema no linear
0
@
Tem-se, portanto
com domnio
y1t
A=@
y2t
00
g @@
x1
x2
y2t
11
y2t
y1t
AA = @
1
1
1
A:
x2
x2
x1
1
A
80
9
1
< x
=
@ 1 A 2 R2 : x1 6= 0 :
: x
;
2
x2
x2
x1
A=@
x1
x2
A:
3
O ramo da matemtica que estuda a dinmica de sistemas determsticos usa, por vezes, uma linguagem um
pouco diferente da que estamos habituados. Por exemplo, a equao yt = yt 1 designada por equao s
diferenas finitas homognas de primeira ordem linear. Mantemos a designao equao s diferenas finitas
ou sistema de equaes s diferenas finitas (consoante o caso) para identificar a equao yt = g (yt 1 ) :
211
yt
Linha 45
2
e
f(x)
d
a
-4
-2
yt-1
-2
-4
1
1
A:
como o valor inicial com respeito a y2 ; assim, poderamos colocar y1 = 2 no eixo das
abcissas. Em alternativa, o valor y1 parte da linha de 450 (ponto c) e o procedimento
repetido iterativamente. Assim, no momento 2 tem-se y2 = 0:5
2 = 1 (ponto e) e assim
(o que sucede
quando o valor inicial se encontra no intervalo (1; 1) ? E no intervalo (0; 1)? E ainda no
intervalo( 1; 0)?)
212
Figura 7-2: Grfico Teia de Aranha da Aplicao f (x) = x2 (esto traadas duas rbitas
com valores inicias -1.1 e 0.9)
Seja yt = yt (y0 ) a soluo da EDF (ou do sistema de EDF) yt = g (t; yt 1 ) ; dada a
condio inicial y0 (para simplificar admite-se, sem perda de generalidade, que t0 = 0). A
expresso yt (y0 ) define a soluo como uma funo explcita da condio inicial y0 . No
caso da EDF autnomas usual considerar-se a notao yt = g t (y0 ) em lugar de yt = yt (y0 )
onde
g t (x) := g(:::g(g (x))):
| {z }
t vezes
1
;
1+x
ento
g 2 (x) = g (g (x)) = g
1
1+x
g 3 (x) = g (g (g (x))) = g g
Dada a EDF yt =
1
1+yt
1
1 ;
1 + 1+x
1
1+x
=g
1
1
1 + 1+x
1
1+
1
1
1+ 1+x
; o valor y3 dado y0 = 1
g 3 (1) =
1
1+
1
1
1+ 1+1
3
= :
5
1
1
= ;
1+1
2
y2 =
1
1+
1
2
2
= ;
3
y3 =
1
1+
2
3
3
= :
5
(t0 ; ") tal que, para cada qualquer soluo yt (y0 ) a desigualdade
213
jy0
yj
yj
0
4
1 +c,
). No
estabilidade do ponto fixo y pode, no caso presente, ser discutida directamente a partir g t
(na generalidade dos casos no lineares no possvel obter g t ). Tem-se, com a condio
inicial y0 ; yt = g t (y0 ) = y0
g t (y0 )
g t (y0 )
Impondo jg t (y0 )
considerar um
+ c 11
y = y0
. Assim
+c
= j jt y0
1
1
c
= j jt jy0
y0
c
1
yj :
yj
> 0 nos termos da definio de ponto fixo estvel; logo y instvel. Analise-se a
t!1
t!1
y0
6= 1
1
+c
1
8
<
c
1
= y se j j < 1
1
se j j > 1
(1
214
0.6
0.4
0.2
C
-0.5
-0.25
0.25
0.5
0.75
-0.2
-0.4
(1
yt 1 ) (representados trs
s no se afasta de 1/2 como tambm converge para y = 1=2. Este ponto fixo portanto
assimptoticamente estvel. O ponto fixo zero instvel. Basta observar o que sucede quando
y inicializado no ponto C.
Considere-se um sistema de m equaes lineares yt = Ayt
e seja
r = max fj i j :
(7.1)
para t
ky0 k
1 e se a multiplicidade
algbrica de todos os valores prprios que verificam j j = 1 for igual a um ento existe uma
constante C > 0 tal que kyt k
C ky0 k para t
0:
12
10
8
6
y1
y2
2
0
0
10
11
-2
-4
y1t
y2t
1
i:
2
A=@
0:25
10
A@
y1t
y2t
A:
yt = @
Os valores prprios so
= cos
cos
sen
sen
i sin e jcos
cos
A yt 1 :
i sin j = jcos + i sin j =
cos2 + sin2 =
216
7.2.2
Linearizao
A proposio seguinte fornece um mtodo para analisar a estabilidade assimpttica no caso
escalar (EDF autnomas).
Proposio 7.2.3 Suponha-se que g : R!R tem derivada de primeira ordem contnua num
intervalo aberto contendo o ponto fixo y: Ento (a) se jg 0 (y)j < 1; y assimptoticamente
estvel; (b) se jg 0 (y)j > 1; y instvel.
Dem. (a) Dado que, por definio,
jg (x)
x!y
jx
lim
jg (x) yj
g (y)j
= lim
= jg 0 (y)j
x!y
yj
jx yj
ento existe uma vizinhana V" (y) de raio " > 0; tal que, para jg 0 (y)j <
jg (x)
yj <
jx
yj ;
< 1;
x 2 V" (y) :
Resulta que x 2 V" (y) ) g (x) 2 V" (y) (pela desigualdade anterior, constata-se que g (x)
est mais "perto"de y do que x est de y; por um factor de ordem
que g (x) 2 V" (y) ) g 2 (x) 2 V" (y) : Repetindo o argumento conclui-se g t (x) 2 V" (y) :
Logo,
g 2 (x)
y = jg (g (x))
yj <
yj <
t
jx
jg (x)
yj. Como
yj <
t
jx
yj :
toticamente estvel. (b) Utilizando argumentos idnticos conclui-se que g t (x) se afasta cada
vez mais de y medida que t ! 1:
Exemplo 7.2.8 Retome-se os exemplos 7.2.1 e 7.2.5. Com g (x) = 2x (1
2
x) tem-se g 0 (x) =
4x e, portanto, pela proposio 7.2.3, o ponto fixo 0 instvel pois jg 0 (0)j = 2 > 1 e o
@gi (y)
gi (x) = gi (y) +
(x
@xT
1
y) + (x
2
@gi2 (z)
y)
(x
@x@xT
T
y) ;
i = 1; :::; m
y) + h (x)
(7.2)
B
B
A = g (y) = B
@
0
h (x) = g (y)
@g1 (y)
@x1
@g1 (y)
@xm
..
.
..
@gm (y)
@x1
1B
B
0
g (y) y + B
2@
..
.
@gm (y)
@xm
(x
C
C
C;
A
(7.3)
@g12 (z)
y)T @x@x
T
(x
y)
2 (z)
@gm
@x@xT
(x
y)
..
.
(x
y)T
1
C
C
C
A
e A dada pela equao (7.3) tem-se, (a) se r < 1 ento y assimptoticamente estvel; (b)
se r > 1 ento y instvel.
Dem. Kelley e Peterson, (1991), p. 180.
Obviamente esta proposio generaliza a proposio 7.2.3.
218
y1t = (1 + ) y1t
y2t = (1
0:001
) y2t
g (x1 ; x2 ) := @
g1 (x1 ; x2 )
A=@
g2 (x1 ; x2 )
1:1x1
0:99x2 +
x1 x2
0:001 1+0:0001x
1
x1 x2
0:00003 1+0:0001x
1
A:
y1 = @
0
0
y2 = @
A;
344:828
103:448
A:
A = g0 (y2 ) = @
@g1 (y2 )
@x1
@gm (y2 )
@x1
@g1 (y2 )
@xm
@gm (y2 )
@xm
A=@
Os valores prprios so
1;
1:003
0:0029
= 1:00167
0:3333
1
A:
A:
0:0310466i: Donde
p
1:001672 + 0:03104662 = 1: 002;
p
0:0310466ij = 1:001672 + 0:03104662 = 1: 002;
j 1 j = j1:00167 + 0:0310466ij =
j 1 j = j1:00167
pelo que r = 1:002 > 1 e, portanto, o ponto fixo y2 instvel. A figura 7-5 ilustra o
comportamento dinmico do sistema.
219
550
450
350
y1
250
y2
150
50
-50 0
100
200
300
400
500
600
700
V (x)
em V" (y) (no confundir a funo V com a vizinhana de z de raio "; V" (z)).
Proposio 7.2.5 (Mtodo Directo de Liapunov) Seja y um ponto fixo de g e assuma-se
que g contnua numa certa vizinhana de y. Se (a)
ento a soluo y estvel; se (b)
V (x)
< ":
de y (y1 no est mais distante de y do que y0 est de y). Logo y1 2 V (y) : Seguindo o
mesmo raciocnio tem-se que V (g (y1 ))
se que yt 2 V (y)
dade estrita V (g (x)) < V (x) : Por hiptese y0 2 V" (y) e V (g (y0 )) < V (y0 ) implica
220
jg (y0 )
yj <
plica jy2
t
jg (y0 )
jy0
yj, 0 <
yj = jg (y1 )
yj <
jg (y0 )
yj <
jy0
yj <
yj ! 0 quando t ! 1:
x3
2x4 = x4 x2
x2 = x 6
2 <0
estvel.
Exemplo 7.2.11 Retome-se o exemplo 7.2.7,
0
yt = @
cos
sen
sen
Defina-se
00
V @@
y=@
x1
x2
cos
0
0
11
A yt
A:
AA = x21 + x22 :
V (x) = V @@
x1 cos + x2 sen
x1 sen + x2 cos
11
AA
00
V @@
x1
x2
11
AA
x21
x22
= 0:
Consequentemente o ponto fixo estvel.
Bacia do Escoadouro
Na literatura usual designar-se um ponto fixo assimptoticamente estvel como um escoadouro (sink) e um ponto fixo instvel como fonte (source). A designao escoadouro sugere
221
que o sistema dinmico inicializado numa vizinhana do escoadouro converge para o escoadouro. Utiliza-se tambm a designao bacia do escoadouro (basin of the skin) para definir
o conjunto de pontos W tal que se y0 2 W ento yt = gt (y0 ) ! y (onde y um escoadouro). Analiticamente escreve-se: W (y) = fy0 2 Rm : gt (y0 ) ! yg5 : No exemplo
7.2.5, onde g (x) = 2x (1
na vizinhana de 1/2 converge para 1/2. Uma inspeco da figura 7-3 sugere que a bacia do
escoadouro o conjunto (0; 1) ; i.e., W (1=2) = (0; 1) :
A proposio seguinte tem aplicao no caso de EDF autnomas (no lineares).
Proposio 7.2.6 Seja E = fx : jg (x)
tal que V"1 (y)
yj
jx
yj ; 0 <
E ento
yt = g t (y0 ) ! y
yj < jx
yj : Concretamente,
E = fx : jg (x)
yj < jx
yj ; 0 <
7.2.3 no aplicvel, pois jg 0 (1)j = 1 (admitindo que g 0 (x) existe numa vizinhana de
1). Verifica-se, no entanto, por simples inspeco grfica, que o sistema dinmico definido
por g (x) converge para y = 1 se o valor inicial pertencer a (A; 1) : Alm disso, qualquer
ponto do intervalo (1; B) tem como aplicao um ponto de (A; 1) : Ou seja, embora no se
verifique jg (x)
yj < jx
222
2.5
VI
1.5
II
0.5
A
0.5
-0.5
IV
III
1
B
1.5
f(x)
2.5
-0.5
proposio 7.2.6 aplicvel: numa vizinhana do ponto 1, a funo g (x) encontra-se nas
regies II e V; no entanto, a proposio fornece um primeiro conjunto contido em E1 ). Temse agora
E2 = fx : g (x) 2 E1 g = fx : 0 < g (x) < bg = (e; c) [ (b; d)
onde e =
2; 11569; c =
3; d =
W (1)
E3 = fx : g (x) 2 E2 g, E4 ; etc.
Exemplo 7.2.13 Considere-se g (x) = tan x;
g (0) = 0). Na figura 7-8 verifica-se que a funo g (x) no se encontra nem na regio II
nem na regio V (neste caso concreto, qualquer que seja o valor inicial, o sistema dinmico
afasta-se cada vez mais de y = 0). Assim, y = 0 no escoadouro.
Exemplo 7.2.14 Considere-se g (x) = 3x (1
2=3. Na figura 7-9 analisa-se o ponto fixo 2=3 (tendo-se representado para o efeito as
curvas x e
x + 2y =
fixo y = 2=3 pois jg 0 (2=3)j = 1: Tambm a proposio 7.2.6 no aplicvel pois embora
E = fx : jg (x)
2=3j < jx
2=3jg = (0; 2=3) no existe um " > 0 tal que V" (2=3)
E: Tambm no se pode concluir imediatamente que o intervalo (0; 2=3) pertence bacia
223
VI
V
II
a e c
b
d
III
IV
1.5
VI
1
0.5
V
-1
II
-0.5
0.5
-0.5
-1
III
IV
-1.5
224
x3 ) =2
1.5
VI
1
V
II
0.5
IV
0.2
0.4
III
0.6
0.8
-0.5
(1
x)
")
225
f 2 (2=3
") :
V (x) < 0
W (y) :
y2t
2
y1t
2
+ y2t
y2t = y1t
y1t
2
y1t
2
+ y2t
x2
x2 x21 + x22
x1 x21 + x22
+ x1
x21 + x22
= :::
x21 + x22
2 + x21 + x22
< 0
n
p
p o
no conjunto (x1 ; x2 ) : x21 + x22 < 2 = Vp2 (y)
W (y) :
yt3 1 : Resulta bvio que Vp2 (y)
W (y) :
Exemplo 7.2.17 Retome-se o exemplo 7.2.12, yt = 3yt
yt2
3x
9 2
x
4
1
=
(x
4
=
A funo
fx : jx
x2 =2 1
(x
3 3 1 4
x
x + x
2
4
4) (x
1)2 : Tem-se
1)2
1)2 x:
V (x) est representada na figura 7-11, a qual permite concluir que V1 (1) =
1j < 1g
W (1).
A terminar esta seco mostra-se que se um ponto pertence a uma certa bacia de escoadouro ento esse ponto no pode pertencer a outra bacia de escoadouro. Assim;
226
0
-0.5
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
-1
-2
-3
-4
V (x) = 14 (x
4) (x
1)2 x
y1 k < "=2 e
dades verificam-se simultaneamente para o maior dos n0 s; i.e. definindo n3 = max fn1 ; n2 g
tem-se que t
n3 vem
y2 k =
y1
gt (y0 )
y2
y1 gt (y0 ) + y2
" "
<
+ = ":
2 2
gt (y0 )
gt (y0 )
Como a distncia entre y1 e y2 menor do que " para cada " > 0; dever ter-se y1 = y2 :
7.2.3
Pontos Peridicos
Definies
Definio 7.2.3 Um vector p 2 Rm um ponto peridico de perodo k se
gk (p) = p
(7.4)
e k o menor inteiro positivo tal que (7.4) se verifica (i.e., gs (p) 6= p para s = 1; 2; :::; k
1). A rbita de valor inicial p diz-se uma rbita peridica de perodo k:
227
Mas g (p) e g2 (p) tambm se repetem de trs em trs iteraes, f::; p; g (p) ; g 2 (p) ; p; g (p) ; g 2 (p) ; p:::g :
Neste exemplo, suficiente identificar a rbita de perodo 3 atravs dos trs elementos
fp; g (p) ; g 2 (p)g (se p ponto fixo de g e, portanto, ponto peridico de perodo 1, ento a rbita peridica de perodo 1 constituda apenas pelo elemento fpg). Naturalmente,
b = g (p) e c = g 2 (p) so tambm pontos peridicos de perodo 3. A proposio seguinte
estabelece este resultado.
Proposio 7.2.9 Seja p um ponto peridico de g de perodo k: Ento
g (p) ; g2 (p) ; :::; gk
(p)
(p) , pi =
gs com s < k; caso contrrio pi no poderia ser candidato a ponto peridico de perodo k
(definio 7.2.3): Suponha-se no entanto que pi ponto fixo de gs : Viria
gs (pi ) = pi , gs gi (p) = gi (p) , gs+i (p) = gi (p)
o que significa que p repete de s em s iteraes, ou seja que p ponto fixo de gs : Esta
concluso contradiz a hiptese de p ser ponto peridico de perodo k > s (i.e., a primeira
vez que p se repete aps k iteraes). Basta agora ver que pi = gi (p) ponto fixo de gk :
Vem
gk (pi ) = gk gi (p) = gi gk (p) = gi (p) = pi :
Exemplo 7.2.18 Considere-se a equao yt = ayt
ax (1
(1
g (x)) = a (ax (1
228
x)) (1
ax (1
x)) :
(1
= a (ayt
yt 1 )
(1
yt 2 )) (1
x)) (1
(ayt
(1
ax (1
yt 2 )))
x)) : Para determinar eventu-
a + a x) 1 + a
ax
a2 x + a2 x2 = 0
x1 = 0; x2 =
x4 =
1
2
+ 21 a
1
+ 1a +
1+a
; x3 = 2 2
a
p
1
( 3 2a + a2 )
2
:
a
1
2
( 3
a
2a + a2 )
(7.5)
(7.6)
Estes valores sero pontos peridicos de perodo 2 se no forem pontos fixos de g. Ora
resolvendo
g (x) = x
sai y = 0 e y =
1+a
:
a
+ 12 a +
1
2
p
( 3
a
se a = 1; e
1
2
se a =
+ 12 a +
1
2
2a + a2 )
p
( 3
a
2a + a2 )
1+a
a
=0
1: Seguindo o
1+a
a
1:
= : 696 97; x3 = :
823 6 e x4 = : 479 43: Na figura 7-12 evidente que f0: 823 6; 0:47943g forma uma rbita
de perodo 2.
Outra forma (embora pouco eficiente) de confirmarmos as concluses emergentes da
figura 7-12 consiste em se calcular iterativamente a trajectria y: A tabela seguinte fornece
229
y
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
1
15
22
29
(1
36
43
yt 1 ) ; y0 = 0:1
t:
0
1
2
3
4
5
6
7
8
9
10
11
12
13
yt: 0.1000 0.2970 0.6890 0.7071 0.6835 0.7139 0.6740 0.7251 0.6577 0.7429 0.6303 0.7690 0.5863 0.8004
t:
14
15
16
17
18
19
20
21
22
23
24
25
26
27
yt: 0.5271 0.8226 0.4816 0.8239 0.4788 0.8235 0.4796 0.8236 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236
t:
28
29
30
31
32
33
34
35
36
37
38
39
40
41
yt: 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236
(1
yt 1 ) ; y0 = 0:1; t = 1; :::; 41
x1
0 0 00
x1
g2 (x) = g @g @@
x2
111
00
AAA = g @@
x2
x2
x1
11
AA = @
x2
x1
x2
x1
x2
A=@
x2
x1
1
x1
1
A
g3 (x) = g @g @g @@
x2
1111
00
AAAA = g @@
x2
x1
1
x1
11
AA = @
1
x1
1
x1
x2
x1
1
x1
A=@
1
x2
A:
Deixa-se como exrcito verificar que no existem ponto peridicos de perodo 2 e existem
trs pontos peridicos de perodo 3.
Um modelo que pode gerar pontos peridico o modelo linear por troos (ou, simplesmente, modelo limiar). Assume-se um comportamento diferenciado do sistema dinmico
consoante o estado do sistema no momento t
1; concretamente, consoante yt
230
se encontre
0.8
0.6
0.4
0.2
-0.5
-0.25
0.25
0.5
0.75
-0.2
-0.4
(1
yt 1 )
1 yt 1 ;
yt
2 yt 1 ;
yt
<
:
A funo g (x) pode no ser contnua (no limiar ), como o exemplo precedente mostra.
O modelo seguinte, com c1 =
yt =
8
<
1)
1)
+ c2 +
: c +
2
g (x) =
Logo g ( ) = c2 +
8
<
2 yt 1 ;
1)
: c +
2
e limx" g (x) =
+ c2 +
1)
+ c2 +
c2 +
2x
1x
yt
yt
1 x;
1 ) + c2
= c2 +
2:
Podemos ainda
fazendo
2
= x; Soluo: x =
c2
= x; Soluo: x =
2
231
<
x<
2 x;
1 yt 1 ;
c2
e, agora resolvendo,
2+
1
g (x) =
ou
c2
8
<
Veja-se que
2)
8
<
:
1)
(1
g (x) =
c2
2
, sai c2 =
+ (1
(1
2)
2) :
1 x;
x<
2 x;
(1
1)
1 x;
x<
(1
2)
2 x;
g( ) =
(1
Assim, tem-se
2)
e
lim g (x) =
x"
(1
1)
= :
itativa que concluses podemos tirar para os demais pontos peridicos? A proposio e a
demonstrao seguintes mostra que todos os pontos peridicos partilham das mesmas propriedades qualitativas. Desta forma pode-se falar de rbitas peridicas estveis e instveis
(em alternativa a pontos peridicos estveis e instveis).
232
Proposio 7.2.10 Seja g uma aplicao de classe C 1 em R e seja fp1 ; p2 ; :::; pk g uma rbita
peridica de perodo k: Ento fp1 ; :::; pk g assimptoticamente estvel (escoadouro) se
jg 0 (pk ) :::g 0 (p1 )j < 1
e instvel (fonte) se
jg 0 (pk ) :::g 0 (p1 )j > 1:
Dem. Nicolau (2004).
Pode-se provar que se pi um ponto peridico assimptoticamente estvel (instvel) da
rbita fp1 ; :::pk g ento pj tambm um ponto peridico assimptoticamente estvel (instvel).
Exemplo 7.2.20 Considere-se a EDF yt = 3:5x (1
x) : Utilizando-se um programa de
f0; 0:714286g
f0; 0:714286g
2
3
4
g 2 (0:428571)
g 4 (0:38282)
g 4 (0:500884)
=
=
g 2 (0:857143)
g 4 (0:826941)
233
= 1:25
=
g 4 (0:874997)
= 0:03:
f
1
0.8
0.6
0.4
0.2
0.2
0.4
0.6
0.8
(1
yt 1 )
Naturalmente esta segunda alternativa bastante mais trabalhosa. Conclui-se que todos os
pontos peridicos de perodo k = 4 so assimptoticamente estveis; todos os outros pontos
em anlise so instveis. O grfico 7-15 permite identificar um comportamento peridico
de perodo k = 4:
Tem interesse ainda observar o grfico teia de aranha do modelo g 4 (x) - ver figura 7-16.
Observe-se (talvez com alguma dificuldade) que a funo g 4 corta o eixo de 45o oito vezes
(considerando tambm o ponto zero). Este facto corrobora a primeira tabela deste exemplo
(ltima linha).
7.3
7.3.1
234
1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
8
<
:
10
20 +
11 yt 1
21 yt
1 + ut qt
= yt
+ ut qt
<
>
(7.7)
10
11 yt 1
+ ut uma
sai do
A este respeito a frmula de Taylor instrutiva. Suponha-se que f : R ! R possui derivada contnua
2
de primeira ordem. Pela frmula de Taylor tem-se f (x) = f (a) + f 0 (a) (x a) + O jx aj : Esta
frmula diz-nos que f (x) pode ser arbitrariamente bem aproximada atravs da expresso linear (em x) f (a) +
f 0 (a) (x a). Note-se que a; f (a) e f 0 (a) so constantes e o erro envolvido na aproximao de ordem
2
jx aj : Se procuramos aproximar f (x) quando x se afasta de a a aproximao piora significativamente,
tendo em conta o erro envolvido O jx
aj
repetidamente, para vrios valores de a; e assim obter boas aproximaes de f em todo o seu domnio. este
o princpio que est subjacente ao modelo TAR.
235
yt =
+
=
=
20 Ifqt
10 Ifqt
d>
+
{z
11 Ifqt
21 Ifqt
20 Ifqt
(qt d ) +
(qt d ) yt
d>
d>
0 (yt 1 )
g yt 1
g yt 1
+ ut :
+ ut :
11 Ifqt
+
{z
21 Ifqt
d>
1 (yt 1 )
yt
}
+ ut
Observa-se, assim, que o modelo TAR pode ser interpretado como um processo AR de coeficientes aleatrios com dependncia em qt d :
7.3.2
Solues Peridicas
0; i.e., y~t =
c + y~t 1 : De acordo com a definio 7.2.1, o ponto fixo da equao yt = g (yt 1 ) o valor
y tal que g (y) = y: No caso linear, g (x) = c + x; a soluo de g (y) = y y = c= (1
):
Recorda-se que se y~t for inicializado no ponto fixo, y~t permanece no valor do ponto fixo
para todo o t . Com efeito, se yt
nula, i.e.,
yt = yt
yt
= g (yt 1 )
yt
=y
yt ;
y = 0: Se a soluo no inicializada
numa vizinhana do ponto fixo, mas j j < 1, ento y~t tender para y; quando t ! 1.
Quando a equao linear (de primeira ordem) existe apenas o ponto fixo y = c= (1
),
O esqueleto da equao
8
< 1 + 0:5~
yt 1 ;
yt
y~t =
: 1 0:5~
yt 1 ; y t
236
yt
yt
<0
(7.8)
0:
<0
(7.9)
-4
-2
yt = 1 + 0.5 yt 1
yt = 1 0.5 yt 1
-2
-4
Figura 7-17: Grfico Teia de Aranha do modelo (7.9). Os valores 0.4 e -1.2 so pontos
peridicos de perodo 2
y
6
5
4
3
2
1
0
-1
-2
-3
-4
1
11
16
21
26
31
(7.10)
As figuras 7-17 e 7-18 mostram que os valores 0.4 e -1.2 so pontos peridicos8 de perodo
2. Estes pontos so assimptoticamente estveis. Qualquer que seja o valor de inicializao,
a soluo y~t atrada para a rbita f0:4; 1:2g :
No faz sentido falar-se em solues peridicas do modelo estocstico definido em (7.8).
8
237
Figura 7-19: Grfico dos pares (yt 1 ; yt ) aps se ter gerado uma trajectria do processo 7.8
(traam-se tambm as rectas 1 + :5x e 1 0:5x)
A componente estocstica impede, de facto, que yt possa oscilar entre os pontos 0.4 e -1.2.
Todavia, o comportamento peridico subjacente ao esqueleto est parcialmente presente no
modelo estocstico, tal como mostra a figura 7-19, onde se apresenta o grfico scatter (i.e. o
grfico dos pares (yt 1 ; yt )) depois de se ter simulado uma trajectria.
Como o processo EE (veja-se o exemplo 4.5.9), pode tambm indagar-se que tipo
de distribuio estacionria define o processo. A expresso analtica desta distribuio
desconhecida, mas pode estimar-se de vrias formas. Provavelmente o procedimento mais
simples consiste em gerar uma trajectria suficientemente longa e, depois de se desprezarem
os primeiros valores9 (digamos os primeiros 10), estima-se a funo de densidade marginal
f (x) atravs do estimador
n
S
1 X
f^ (x) =
K
nS h i=1
yi
h
(7.11)
A justificao: o valor incial y0 ; a partir da qual gerada a trajectria, no obtido em condies estacionrias porque estas so desconhecidas.
238
Figura 7-20: Densidade Estacionria de 7.8 estimada a partir de 50000 observaes simuladas.
x na expresso (7.11) para se ter uma ideia do comportamento de f no espao de estados
da varivel. Como ns est sob nosso controle, a funo f pode ser estimada de forma arbitrariamente precisa. Na figura 7-20 apresenta-se a densidade estacionria estimadaf^ (x) :
A existncia de duas modas acaba por no surpreender tendo em conta a estrutura do esqueleto (recorde-se a existncia de dois pontos peridicos). J a assimetria da distribuio
no clara (pelo menos primeira vista). A probabilidade de y se encontrar abaixo de zero
P
b (y) = 0:333: O grfico teia de aranha talvez possa
cerca de 0.562 ('
Ifyt 0g =n) e E
explicar estes valores. Observe-se que na estrutura determinstica, um valor negativo inferior
a
2 seguido por outro valor negativo, enquanto um valor positivo passa imediatamente
a negativo. Este facto explica por que razo a probabilidade de y se encontrar abaixo de
zero superior a 0.5 e, de certa forma, tambm explica a existncia de uma mdia marginal
negativa.
239
7.3.3
Estacionaridade
yt =
se a condio max1
8
>
>
>
<
>
>
>
:
i k
10
11 yt 1
+ ::: +
1p yt p
+ ut yt
:::
<
>
:::
k0
k1 yt 1
Pp
ji
j=1
+ ::: +
kp yt p
+ ut y t
proposio 4.5.4. Esta condio apenas suficiente, mas no necessria. Como tal,
pode ser demasiado exigente. Para certos modelos particulares so conhecidas as condies
necessrias e suficientes. o caso do modelo
yt =
8
>
>
c +
>
< 1
c2 +
>
>
>
: c +
3
1 yt 1
+ ut
2 yt 1
+ ut
3 yt 1
+ ut
yt
yt
yt
<
>
(7.12)
Proposio 7.3.1 O processo fyt g definido pelo sistema (7.12) EE sse qualquer uma das
seguintes condies se verificar:
(i)
< 1;
(ii)
= 1;
< 1;
1 3
< 1;
< 1; c1 > 0;
(iii)
< 1;
= 1; c3 < 0;
(iv)
= 1;
= 1; c3 < 0 < c1 ;
(v)
1 3
= 1;
< 1; c1 +
3 c1
> 0;
240
7.3.4
yt
yt
yt
<
>
(7.13)
2
2
yt
2)
ou
so atingidos o
processo passa a exibir reverso para uma certa mdia e, deste modo, y globalmente estacionrio e, portanto, limitado em probabilidade (ou contrrio do random walk). Na figura
7-21 apresenta-se uma trajectria simulada a partir do processo
8
>
>
0:9yt 1 + ut
>
<
yt =
y t 1 + ut
>
>
>
: 0:9y + u
t 1
yt
3
<
yt
yt
3
1
(7.14)
>3
onde fut g uma sucesso de v.a. i.i.d. com distribuio N (0; 0:22 ) :
Processos do tipo (7.14) confundem-se facilmente com passeios aleatrios. Por esta
razo, o teste Dickey-Fuller tende a no rejeitar a hiptese nula de raiz unitria quando a
alternativa um processo estacionrio do tipo (7.14); por outras palavras, o teste DickeyFuller pouco potente contra alternativas do tipo (7.14). No contexto do modelo (7.13),
pode mostrar-se que a potncia do teste Dickey-Fuller diminui quando
ou
1;
7.3.5
baixo e
alto
Estimao
yt =
8
<
:
10
20 +
11 yt 1
+ ::: +
1p yt p
+ ut qt
21 yt
+ ::: +
2p yt
+ ut qt
241
(7.15)
>
0
1
0
2
onde
i0
: Os parmetros desconheci0
:::
i1
ip
. Reescreva-se (7.15)
na forma
yt =
10
+
20
11 yt 1
+ ::: +
21 yt 1
1p yt p
+ ::: +
Ifqt
2p yt p
Ifqt
g
d>
+ ut :
Seja x0t = (1; yt 1 ; :::; yt p ) : Observe-se que cada um dos ramos pode escrever-se como
10
11 yt 1
+ ::: +
1p yt p
Ifqt
=
|
= x0t
20
21 yt 1
+ ::: +
2p yt p
Ifqt
d>
=
=
242
x0t
1 yt
::: yt
{z
x0t
1 Ifqt
1 yt
::: yt
{z
xt
2 Ifqt
d>
g:
}
}
1 Ifqt
2 Ifqt
d>
ou ainda, com xt ( )0 =
1 Ifqt
x0t Ifqt
x0t Ifqt
2 Ifqt
d>
x0t IIfq
t d>
x0t IIfq
+ x0t
t d>
yt = xt ( )0
+ ut
1
0
1
2
A + ut
+ ut :
N xt ( )0 ;
X( )y
(7.16)
^2 ( ) =
Pn
t=1
yt
xt ( )0 ^ ( )
a soma dos quadrados dos resduos. Supondo d conhecido, toma-se para estimativa de
O conjunto
o espao do parmetro
(7.17)
pode assumir). Claramente
mao (7.17) no standard. Uma forma expedita de obter a sua soluo consiste em fazer
percorrer
no conjunto
243
y(2)
:::
y(n) :
^ = arg min ^ 2 ( ) ;
2~
(7.18)
miza ^ 2 ( ). Na prtica, impe-se que cada regime possua pelo menos uma certa fraco
de observaes (efectivamente, no faz sentido, tomar ^ = y(1) ou ^ = y(n) ). Assim, deve
restringir-se o conjunto ~ ; passando a ser y((
)(n 1))
parte inteira do nmero. Neste novo conjunto ~ no fazem parte as 100% mais baixas nem
as (1
Falta-nos ainda tratar a estimao de d; que tambm no standard tendo em conta que
d 2 N: Como ^ 2 depende de d; escolhe-se d num certo conjunto D = f1; 2; :::; d g de forma
a minimizar ^ 2 : Logo,
^ ; d^ = arg min ^ 2 ( ; d)
2 ~ ;d2D
onde, agora,
2
^ ( ; d) = n
n
X
yt
xt ( ; d)0 ^ ( ; d)
t=1
^ ( ; d) = X ( ; d)0 X ( ; d)
X ( ; d) y:
dado por ^ ; d^ :
3. tomar para estimativa de , o valor ^ ^ ; d^ :
244
yt =
8
<
:
1 yt 1
+ ut se yt
2 yt 1
+ ut se yt
>
Valores de ^ 2 em funo de
d!
-1
15.5
16
-0.7
12.4
13.5
-0.1
12.1
12.3
-.001
3.5
2.5
0.0
1.2
2.4
1.2
2.5
2.8
1.5
5.5
ed
= 1:5
xn ^ ; d^ =
(o valor yn =
7.3.6
yn 1 Ifyn
0g
yn 1 Ifyn
1 >0g
0 1:5
Inferncia
Pode mostrar-se que o estimador para d super-consistente, isto , possui uma varincia proporcional a 1=n com
a 1=n). A distribuio assimpttica tambm conhecida (Hansen, 2000). Dada a superconsistncia de d^ podemos, para efeitos de inferncia estatstica sobre os demais parmetros,
assumir que d conhecido.
245
Inferncia sobre
Sob certas condies (incluindo estacionaridade estrita) tem-se
p
2
onde I ( 0 ) =
n ^ (^ )
! N 0; I ( 0 )
E (xt ( 0 ) xt ( 0 )) (
0:
(7.19)
1X
xt (^ ) xt (^ )0 :
n t=1
n
ij
resultado (7.19) permite ensaiar H0 ; no quadro do teste de Wald. Esta ideia incorrecta,
pois sob a hiptese nula o parmetro
1 yt
10
::: yt
e obter ~ n2
Veja-se mais um exemplo. No caso yt = x + ut ; x > 0; ocorre uma situao similar com H0 : = 0
ou com H0 : = 0: Por exemplo, sob a hiptese = 0; desaparece da especificao; como consequncia, a
verosimilhana deixa de depender de . J o ensaio H0 : = 0 com 0 6= 0 no levanta problemas.
246
2~
^ n2 =^ n2
6. obter Fn = n ~ n2
Fn .
A fundamentao do teste baseia-se na prova segundo a qual Fn possui a mesma distribuio assimpttica de Fn ; sob H0 . Observe-se, com efeito, que Fn construda sob a
hiptese de ausncia de threshold. Assim, existe indcio de violao da hiptese nula quando
~ 2n significativamente superior a ^ 2n ; de tal forma que Fn tende a ser geralmente alto quando
comparado com Fn : Nestas circunstncias raramente ocorre Fn
Fn (nas B simulaes) e
^ 2n ( ) ^ 2n (^ )
^ 2n (^ )
(7.20)
Fn ( 0 ) !
onde P (
x) = 1
x=2 2
2~
2. Determinar o conjunto C =
(inclui, portanto, todos os
Como P (
2C )!
: Fn ( )
mente C :
Usando a funo de distribuio de ; tem-se q0:90 = 5:94; q0:95 = 7:35 e q0:99 = 10:59:
Ilustre-se o procedimento com o seguinte exemplo artificial. Admita-se que se observam os valores da tabela 7.1. Note-se que a estimativa para
1:45g :
247
a 95% C0:95 =
Fn
1
12.2
1.1 10.2
1.15 7.35
1.2 0
1.35 6.31
1.45 7.35
1.6 15
Tabela 7.1: Intervalo de Confiana para o Threshold: Ilustrao do mtodo de Hansen
7.4
7.4.1
Modelo Markov-Switching
Introduo
1 dt
+ yt
+ ut
(7.21)
Sabemos exactamente quando o evento A ocorre. Por exemplo, o evento A pode representar segunda-feira. Trata-se de um evento obviamente determinstico. Suponhamos agora
que A no observvel. Como modelar, estimar e prever y? So estas as questes que
abordaremos ao longo deste ponto.
Para trabalharmos com alguma generalidade, admita-se que esto definidos N regimes.
Por exemplo, um modelo relativamente simples com dois regimes, N = 2;
8
< c + y +u
se yt est no regime 1
1
t 1
t
yt =
: c + + y + u se y est no regime 2
1
1
t 1
t
t
(7.22)
248
1; t
2;
:::; ento fSt g uma sucesso de v.a. i.i.d. com distribuio de Bernoulli de parmetro
p que pode ser identificado com o regime 1, isto , P (St = 1) = p. O processo y vai
saltando entre os regimes 1 e 2 de forma independente de acordo com a probabilidade
p. Num dado momento t; y est no regime 1 com probabilidade p (independentemente do
regime anterior assumido). Na prtica, a independncia entre os sucessivos valores de St no
apropriada para um grande nmero de aplicaes. Por exemplo, suponha-se que y a taxa
de crescimento do produto. Admita-se ainda que y se comporta diferentemente consoante a
economia est em expanso ou em recesso. Temos, assim dois regimes St = 1 (recesso),
St = 2 (expanso). A sucesso fSt g no provavelmente independente: se a economia, num
certo momento, est em expanso (St
= 2) > P (St = 1j St
= 2) :
Logo fSt g formado por uma sucesso de v.a. dependentes. Uma sucesso ou trajectria de
S; poder ser, por exemplo, f1; 1; 1; 1; 2; 2; 2; 2; 1; 1; 1; :::g :
7.4.2
= i; :::; S0 = i0 ) = P (St = jj St
249
= i)
P=@
P (St = 1j St
= 1) P (St = 2j St
= 1)
P (St = 1j St
= 2) P (St = 2j St
= 2)
A=@
p11 p12
p21 p22
A:
p
B 11
B .
P = B ..
@
pN 1
1
p1N
C
.. C
. C:
A
pN N
...
pij
PN
j=1
1; (i; j = 1; :::; N ) ;
P=@
0:7 0:3
0:2 0:8
A:
1; i.e., St
= 2; a probabilidade da
250
= 2) :
P (St = 1j St
= 2) =
=
=
2
X
i=1
2
X
i=1
2
X
P (St = 1; St
= ij St
= 2)
P (St = 1j St
= i; St
= 2) P (St
P (St = 1j St
= i) P (St
= ij St
= ij St
= 2)
= 2)
i=1
P:
Assim, P (St = 1j St
0:7 0:3
0:2 0:8
2
10
A@
0:7 0:3
0:2 0:8
A=@
0:55 0:45
0:3
0:7
A:
P (Sm+n = jj S0 = i) =
#E
X
P (Sm = kj S0 = i) P (Sm+n = kj Sm = j) :
k=1
(7.23)
= 2) = P (St+k = 1j St = 2) :
No interessa o momento em que a probabilidade calculada. O que relevante o desfasamento temporal entre as variveis. Na equao anterior o desfasamento k. Esta propriedade resulta de se ter uma matriz de probabilidades de transio que no depende de t.
Diz-se nestes casos que a matriz de probabilidades de transio homognea.
Em certos problemas importante obter probabilidades relacionadas com eventos a longo
prazo. No exemplo 7.4.1, interessante saber a probabilidade da economia se encontrar
em expanso (ou recesso) no longo prazo, dado que no momento presente a economia se
251
(7.24)
n!1
lim @
n!1
Observe-se
0
@
0:7 0:3
0:2 0:8
0:7 0:3
0:7 0:3
0:2 0:8
0:2 0:8
110
A
120
A
140
A
0:7 0:3
0:2 0:8
= @
1n
A :
0:40059 0:59941
0:39961 0:60039
1
0:4 0:6
A
= @
0:4 0:6
0
1
0:4 0:6
A:
= @
0:4 0:6
0
1
A
lim @
n!1
0:7 0:3
0:2 0:8
1n
A =@
0:4 0:6
0:4 0:6
A:
252
onde
n!1
= P (St = i)
satisfaz as equaes
N
X
= P;
= 1:
i=1
0:7 0:3
P=@
0:2 0:8
A:
Tem-se,
8
>
>
>
<
>
>
>
:
0:7
+ 0:2
= 0:7
+ 0:2
= 0:3
+ 0:8
=1
p11
1
p22
p11
p22
A;
0:7 0:3
0:2 0:8
2
8
>
>
>
<
>
>
>
:
0:3
+ 0:8
= 0:4
= 0:6
= 1:
Pela proposio 7.4.1 fcil concluir que as probabilidades estacionrias so dadas por
1 p22
;
2 p11 p22
253
1 p11
:
2 p11 p22
1 0:8
= 0:4;
2 0:7 0:8
1 0:7
= 0:6:
2 0:7 0:8
n
1
7.4.3
ento V
vector
Modelos Markov-Switching
8
< c +
1
yt =
: c +
1 yt 1
2 yt
1 "t
1+
se St = 1
(7.25)
2 "t se St = 2
onde St uma cadeia de Markov homognea (escondida ou latente por St no ser observvel)
com matriz de probabilidades de transio
0
P=@
p11 p12
p21 p22
A:
+(
c1 ) IfSt =2g +
2
1 ) IfSt =2gt
+(
1 ) IfSt =2g
yt
"t :
+ (St ) "t
(7.26)
onde
8
< c se S = 1
1
t
c (St ) =
;
: c se S = 2
2
t
(St ) =
8
<
:
se St = 1
se St = 2
254
(St ) =
8
<
:
se St = 1
se St = 2:
A representao (7.26) sugere que o modelo MS (7.25) pode ser escrito como um processo
AR(1) com coeficientes aleatrios (vrios outros modelos no lineares podem tambm ser
representados como um AR(1) com coeficientes aleatrios).
7.4.4
Se assumirmos "t
1 yt 1
1 "t
se St = 1
2 yt 2
2 "t
se St = 2:
(N = 2) so respectivamente
f (yt j Ft 1 ; St = 1) = p
f (yt j Ft 1 ; St = 2) = p
1
2
12
1
2
22
1
(yt
2 2
1
c1
2
1 yt 1 )
1
(yt
2 2
2
c2
2
2 yt 1 )
P (Aj Bi ) P (Bi )
(ou fx (x) =
fxjy (xj yi ) fy (yi ) no caso em que y uma v.a. discreta) tem-se que fdp
condicionada de y
f (yt j Ft 1 ) = f (yt j Ft 1 ; St = 1) P (St = 1j Ft 1 )
+f (yt j Ft 1 ; St = 2) P (St = 2j Ft 1 )
1=2
2
12
=
+
2
22
1=2
1
(yt
2 2
1
1
2
1 yt 1 )
c1
(yt
2 2
2
c2
P (St = 1j Ft 1 )
2
2 yt 1 )
P (St = 2j Ft 1 ) :
Claro que P (St = 1j Ft 1 )+P (St = 2j Ft 1 ) = 1: interessante observar que a fdp condicionada igual mdia ponderada das fdp condicionadas associadas aos vrios regimes. Os
ponderadores so naturalmente P (St = 1j Ft 1 ) e P (St = 1j Ft 1 ) (e somam 1). Por exemplo, se num determinado momento, P (St = 1j Ft 1 ) muito alto (perto de 1) a funo
f (yt j Ft 1 ) depender sobretudo de f1t e pouco de f2t :
No caso geral com N regimes, a expresso da fdp
f (yt j Ft 1 ) =
7.4.5
N
X
i=1
fit P (St = ij Ft 1 ) :
(7.27)
(7.28)
e, portanto,
f (yt j Ft 1 ) =
N
X
fit pi :
i=1
Esta hiptese conhecida pelo menos desde 1972 com os trabalhos de Goldfeld e Quandt,
entre outros.
O caso de regimes independentes um caso particular da cadeia de Markov. Notando
que
P (St = ij St
= j) = P (St = i)
para qualquer i e j 2 E; conclui-se que este caso induz uma matriz de probabilidades de
256
P (St = 1) P (St = 2)
B
B
B P (St = 1) P (St = 2)
P=B
B
..
..
B
.
.
@
P (St = 1) P (St = 2)
P (St = N )
..
C
C
P (St = N ) C
C:
C
..
C
.
A
P (St = N )
A probabilidade de atingir, por exemplo, o regime 1 sempre igual a P (St = 1) no importando o regime em que S se encontre no perodo anterior (ou seja, o evento St = 1
independente de St 1 ).
Regimes Seguem uma Cadeia de Markov
Sob esta hiptese, St dado St 1 ; no depende de Ft 1 : Isto ,
P (St = ij St
= j; Ft 1 ) = P (St = ij St
= j) = pji :
(7.29)
+P (St = 1j St
= P (St = 1j St
+P (St = 1j St
= p11 P (St
= 1; Ft 1 ) P (St
1
= 2; Ft 1 ) P (St
= 1) P (St
1
= 1j Ft 1 )
= 2) P (St
= 2j Ft 1 )
= 1j Ft 1 )
1
= 2j Ft 1 )
= 1j Ft 1 ) + p21 P (St
= 2j Ft 1 ) :
P (St = ij Ft 1 ) =
N
X
pj1 P (St
j=1
= ij Ft 1 )
(7.30)
Estas expresses envolvem uma estrutura recursiva que iremos expor a seguir. Tendo em
conta a expresso (7.30), calcule-se P (St
P (St
= 1j Ft 1 ) = P (St
= 1j yt 1 ; Ft 2 ) =
g (yt 1 ; St 1 = 1j Ft 2 )
:
f (yt 1 j Ft 2 )
g (yt 1 ; St 1 = 1j Ft 2 )
f (yt 1 j Ft 2 )
f (yt 1 j Ft 2 ; St 1 = 1) P (St 1 = 1j Ft 2 )
= PN
: (7.31)
j=1 f (yt 1 j Ft 2 ; St 1 = j) P (St 1 = jj Ft 2 )
= 1j Ft 1 ) =
pit = P (St = ij Ft 1 )
= ij Ft 2 )
pi;t
= P (St
fi;t
= f (yt 1 j Ft 2 ; St
= i) :
p1t )
onde
p1t = p11 P (St
= 1j Ft 1 ) + p21 P (St
= 2j Ft 1 )
= 1j Ft 1 ) + p21 (1 P (St 1 = 1j Ft 1 ))
f1;t 1 p1;t 1
= p11
f1;t 1 p1;t 1 + f2;t 1 (1 p1;t 1 )
f1;t 1 p1;t 1
+p21 1
:
f1;t 1 p1;t 1 + f2;t 1 (1 p1;t 1 )
= p11 P (St
(7.32a)
(7.32b)
Regimes dependentes de St
e de Ft
= 1; Ft 1 ) e
onde
P (St = 1j St
= 1; Ft 1 ) =
1 yt 1 ) ,
P (St = 2j St
= 2; Ft 1 ) =
1 yt 1 )
Pt = 4
p11t p12t
p21t p22t
5=4
(
1
0+
1 yt 1 )
1 yt 1 )
(
(
0+
1 yt 1 )
1 yt 1 )
3
5
1 yt 1 ) :
(7.33)
Esta hiptese, mais restritiva do que a precedente, simplifica consideravelmente a calculatria j que a funo densidade de probabilidade condicional pode agora expressar-se
P2
simplesmente na forma f (yt j Ft 1 ) =
i=1 fit P (St = ij Ft 1 ) = f1t ( 0 + 1 yt 1 ) +
f2t (1
1 yt 1 )) :
259
7.4.6
Estacionaridade
Considere-se
8
>
>
>
<
yt =
c1 +
>
>
>
: c +
N
11 yt 1
+ ::: +
1p yt p
+ ut se St = 1
(7.34)
:::
N 1 yt 1
+ ::: +
N p yt p
+ ut se St = N
onde ut um rudo branco e S uma cadeia de Markov estacionria com vector de probabilidades estacionrias ( 1 ;
2) :
yt = c (St ) +
(St ) yt
+ ::: +
(St ) yt
+ ut
yt
B
B
B yt 1
B
B
B yt 2
B
B
..
B
.
@
yt p+1
|
{z
yt
C B
C B
C B
C B
C B
C=B
C B
C B
C B
A @
}
1 (St )
2 (St )
p (St )
0
..
.
1
..
.
0
..
.
..
{z
10
yt
1
CB
CB
CB yt 2
CB
CB
CB yt 3
CB
CB ..
CB .
A@
yt p
}| {z
yt
At
C B
C B
C B
C B
C B
C+B
C B
C B
C B
A @
}
c (St ) + ut
0
0
0
0
{z
Ct
C
C
C
C
C
C:
C
C
C
A
}
(7.35)
Ento y EE. Alm disso, se fAt g um processo EE ento E log+ kA0 k < 0 implica
< 0:
Proposio 7.4.3 Considere-se yt = c (St ) +
jam
(St ) yt
11 j
21 j
260
E log kC0 k
q
= E log
c2 (St ) + u2t
+
1
log E c2 (St ) + E u2t
2
1
+
2
2
E log c (St ) + ut
2
< 1:
2 ),
segue-se que fAt g um processo EE, pelo que basta verificar E log+ kA0 k < 0:
e, portanto,
+
E log kA0 k
= E (log j
log j
= log (j
Segue-se que j
11 j
21 j
11 j
11 j
St = 1
21 j
St = 2
(St ) : Tem-se
(St )j)
= P (St = 1) log j
=
11 j
+
j
2
21 j
11 j
+ P (St = 2) log j
log j
2
21 j
21 j
):
P =@
0:1 0:9
0:2 0:8
1
A
(7.36)
= 2 no s no
estacionrio como explosivo (tende para mais infinito em tempo finito). No entanto, yt
EE. Com efeito, a partir de P obtm-se
= 0:1818 e
=1
= 0:8182 (conferir a
proposio 7.4.1 e o exemplo 7.4.3). Por outro lado, invocando a proposio 7.4.3, tem-se
j
11 j
21 j
N (0; 1) (10000
onde
8
>
>
>
<
c1 +
>
>
>
: c +
N
2
it
= !i +
1t "t
se St = 1
:::
N t "t
2
i ut 1
se St = N
2
i t 1:
i = 1; 2; :::; N
Proposio 7.4.4 Suponha-se: (a) f"t g uma sucesso de v.a. i.i.d. de mdia zero e varincia um, com funo de densidade contnua em R; (b)
(c)
> 0;
! 1 quando yt2
! 1: Ento y EE.
A proposio assegura que o processo retorna ao regime estvel sempre que yt tende a
assumir valores muito altos (alnea d)).
No caso especial em que as probabilidades so constantes, pit =
i;
vlido a seguinte
N
X
<1
j=1
ento EE.
7.4.7
Estimao e Inferncia
Comece-se por analisar o modelo (7.25) e seja o vector dos parmetros a estimar. Como haPn
bitualmente, o estimador de mxima verosimilhana dado por ^n = arg max
t=1 lt ( ) ;
onde
p1t )) :
Se os regimes so independentes, p1t dado pela equao (7.28); se seguem uma cadeia de
Markov, p1t dada por (7.32a); finalmente, se os regimes so Ft
! N 0; I ( 0 )
@ 2 lt ( )
@ @ 0
@lt ( ) @lt ( )
@
@ 0
B( )=E
Estimadores consistentes de A e B so
A^n =
2
^
n
1 X @ lt n
n t=1 @ @ 0
X @lt
^n = 1
B
n t=1
@
n
! A ( 0)
^n @lt ^n
@
263
! B ( 0) :
N ( i ; v^ii )
1=
2;
=n:
1
2;
H1 : H0
2
q
> LRobs
(q 1)=2
+V:LRobs
onde
: exp f LRobs g
2 q=2
:
(q=2)
(7.37)
2
q
5% pois o verdadeiro p-value inferior a 0.02. Suponhamos que P (sup LR > LRobs )
0:06: Nada se pode concluir ao n.s. de 5% pois o verdadeiro p-value pode ser 0.04 ou 0.055.
Tudo o que sabemos que inferior a 0.06.
Outro teste, designado por teste-J, proposto por Garcia e Perron (1996) e baseia-se na
264
^t
onde X
(2)
^t
eX
^ t(1) + X
^ t(2) + "t
)X
regimes.
7.4.8
Previso
Suponha-se que y segue um modelo MS com dois regimes e esto disponveis em n observaes de y; fy1 ; y2 ; :::; yn g : Usando, como previsor para yn+h a funo E (yn+h j Fn ) ;
tem-se
E (yn+h j Fn ) = E (yn+h j Fn ; Sn+h = 1) P (Sn+h = 1j Fn )
+ E (yn+h j Fn ; Sn+h = 2) P (Sn+h = 2j Fn )
onde E (yn+h j Fn ; Sn+h = i) , como j vimos, a mdia condicional do regime i (no contexto
do modelo (7.25) tem-se E (yn+h j Fn ; Sn+h = 1) = E (c1 +
1 yn+h 1 j Fn )).
A probabili-
dade P (Sn+h = ij Fn ) depende da hiptese que se tem sobre S: Se admitirmos que S segue
uma cadeia de Markov, vem
P (Sn+h = 1j Fn ) =
=
=
2
X
i=1
2
X
i=1
2
X
i=1
P (Sn+h = 1; Sn = ij Fn )
P (Sn+h = 1j Sn = i; Fn ) P (Sn = ij Fn )
P (Sn+h = 1j Sn = i) P (Sn = ij Fn ) :
265
7.4.9
f (yn j Sn = i; Fn 1 ) P (Sn = ij Fn 1 )
P (Sn = ij Fn ) = PN
:
j=1 f (yn j Sn = j; Fn 1 ) P (Sn = jj Fn 1 )
Aplicao
Analisa-se a taxa de juros FED fund13 (EUA) no perodo Julho de 1954 a Outubro de 2006
(628 observaes mensais).
A literatura dos modelos de taxas de juro (a um factor) sugere que a volatilidade da taxa
de juro depende do nvel da taxa de juro. Um dos modelos mais usados em matemtica
financeira (tempo contnuo) o processo CIR (devido a Cox, Ingersoll e Ross):
drt =
p
rt dWt ;
rt ) dt +
; ;
>0
(7.38)
conduz ao modelo,
rt = c + rt
onde c =
dt por
rt 1 "t
(7.39)
= (1
oficialmente designada por Federal funds effective rate, com maturidade overnight.
266
Mean log-likelihood
Number of cases
628
-1.07420
-0.767141
8
<
c1 +
1 yt 1
+ 1 "t
se St = 1
: c + y + py " se S = 2
2
2
t 1 t
t
2 t 1
(7.40)
cujos resultados de estimao, pelo mtodo da mxima verosimilhana, assumindo normalidade, esto apresentados na figura 7-24.
n
o
^
A figura 7-25 apresenta a sucesso das probabilidades estimadas P (St = 1j Ft 1 ) ; t = 2; :::; n :
mento t; dado Ft 1 : Podemos observar, a partir da figura 7-25, que o processo y se encontrou,
com alta probabilidade, no regime 1 durante as dcadas de 80 e 90. Durante os anos 20032005 o processo encontrou-se, com alta probabilidade no regime 2. Em 2006, o processo
no est totalmente em nenhum dos regimes.
267
268
Captulo 8
Modelao da Heterocedasticidade
Condicionada - Caso Univariado
(ltima actualizao: 3/2010)
8.1
Introduo
Vimos no captulo 3 que fortes variaes dos retornos so normalmente seguidas de fortes
variaes dos retornos em ambos os sentidos, e que baixas variaes dos retornos so normalmente seguidas de baixas variaes dos retornos, tambm, em ambos os sentidos (veja-se,
por exemplo, a figura 3-17). Este facto estilizado indica muito claramente que a volatilidade
no constante ao longo do tempo. Uma forma mais subtil de mostrar que a volatilidade
no constante consiste em constatar que a srie dos quadrados dos resduos (ou mesmo os
quadrados dos retornos) autocorrelacionada.
8.1.1
por "i;t (i = 1; :::; Nt ). Se existir uma notcia (relevante) num certo dia t; o logaritmo do preo
no dia t representado por log Pt = log Pt
Assuma-se que f"i;t ; i = 1; 2; :::; Nt g uma sucesso de v.a. i.i.d. com distribuio N (0;
rt =
Nt
X
"i;t :
(8.1)
i=1
(de acordo com este modelo, quanto maior o nmero de notcias que chegam ao mercado,
maior a volatilidade). razovel admitir-se uma distribuio de Poisson de parmetro
para a v.a. Nt ; i.e., Nt
palavras, o volume de informao tende a ser alto (baixo) em perodos seguidos. Nestas
circunstncias, passa a assumir-se Nt
P ( t ) com
= Nt
+ 1 (o nmero mdio de
notcias no dia t igual ao nmero de informaes do perodo anterior mais uma unidade)
(adiciona-se uma unidade para evitar que
= 0;
= 0:0015 e Nt
P ( t) ;
= Nt
+ 1:
Podemos observar que a trajectria simulada replica algumas das caractersticas tpicas das
sries financeiras.
Retome-se a equao (8.1). Esta equao sugere a especificao
rt =
+ ut ;
ut =
t "t :
No exemplo anterior,
2
t
= nt
2
t
Ft 1 -mensurvel (i.e.,
1)1 .
no Ft
1 -mensurvel.
271
2
t
2
t
no constante.
0.03
0.025
0.02
0.015
0.01
0.005
0
-0.005
-0.01
-0.015
-0.02
-0.025
1
101
201
301
401
501
601
701
801
901
8.1.2
= 0;
= 0:0015 e Nt
P ( t)
Processos Multiplicativos
Considere-se ut =
t "t
e as seguintes hipteses:
Ft
mensurvel.
Tem-se:
E (ut j Ft 1 ) = E ( t "t j Ft 1 ) =
Var ( ut j Ft 1 ) = E u2t Ft
E ("t j Ft 1 ) = 0
2 2
t "t
=E
t "t ,
Ft
com
2
t
2
E "t Ft
2
t:
2 2
zt 1
> 0 exgena e ut =
z t 1 "t ;
no constante.
Processos estocsticos com heterocedasticidade condicional (HC) (varincia no constante ao longo do tempo), so tambm definidos a partir de um processo multiplicativo do
tipo ut =
t "t
2
t
especificado
t
ou
2
t ? Vimos
que uma das caractersticas das sries financeiras exibir volatility clustering: fortes variaes so normalmente seguidas de fortes variaes em ambos os sentidos, devendo ocorrer,
272
portanto, Corr u2t 1 ; u2t > 0. Suponha-se, por um momento que ut representa a srie financeira. Portanto, se u2t
2
1 ut 1 ;
=!+
! > 0;
2
t
0:
(8.2)
alto )
2
t
t "t ).
2
t
2
t
! u2t !
2
t+1
! :::
+ ut
8.1.3
t)
Ft
= Var (ut j Ft 1 ) =
2
t:
Uma caracterstica muito importante dos modelos de HC o de implicar (sob certas condies)
distribuies marginais leptocrticas. Retome-se o modelo ut =
t "t
H3. Admita-se ainda que o choque aleatrio "t tem distribuio N (0; 1) : Tem-se
E (ut ) = 0
Var (ut ) = E u2t = E
3
E ut
2
t
= 0 ) skweness = 0.
273
Mostre-se que a distribuio marginal de u leptocrtica. Para o efeito, calcule-se o coeficiente de kurtosis de u;
ku =
E (u4t )
2
E (u2t )
= E
4 4
t "t
> E
2 2
t
=E
4
t
4
E "t = E
4
2
E "t = E ut
2 2
t
4
E "t
4
2
E "t = E ut
pelo que
2
E (u4t )
E (u2t ) 3
ku =
>
2
2 = 3:
E (u2t )
E (u2t )
Este resultado sugere que um modelo de HC pode ser adequado para modelar retornos, pois
acomoda uma das caractersticas mais importantes das sries financeiras que a dos retornos
seguirem uma distribuio leptocrtica.
8.1.4
seria
baixo como tambm a volatilidade de y poderia ser baixa e mesmo constante ao longo do
perodo. No entanto, vimos que a mdia condicional geralmente uma componente muito
fraca do modelo (recorde-se a questo dos mercados eficientes). Isto , se considerarmos o
modelo yt =
+ ut ; a mdia condicional
MA), uma componente pouco explicativa do modelo. Assim, quando yt2 alto, u2t tambm
alto (porque a mdia condicional no acompanha as flutuaes de yt ) e, consequentemente,
espera-se que u2t esteja fortemente correlacionado com u2t 1 .
8.1.5
Antes do artigo seminal de Engle (1982) as dependncias temporais nos momentos superiores a um eram tratadas como simples rudo. Engle mostrou que as dependncias temporais
274
t,
2
t;
pois
8.2
Modelo ARCH
+ ut ;
ut =
t "t
t "t
= !+
2
1 ut 1
+ ::: +
275
2
q ut q ;
! > 0;
volatilidade
Panel (a)
retornos
4
20
15
10
-2
volatilidade
Panel (b)
retornos
15
20
10
15
5
0
10
-5
-10
-4
0
r(t)
0
r(t)
volatilidade
Panel (c)
retornos
15
-15
sigma(t)
20
10
volatilidade
Panel (d)
retornos
30
20
20
15
sigma(t)
15
10
10
0
-5
-10
-10
10
-20
-15
0
r(t)
-30
sigma(t)
r(t)
sigma(t)
2
t
2 Ft 1 .
i:
O modelo simulado
rt = ut ;
ut =
2
t
t "t ;
= !+
= 0)
+ ::: +
(8.3)
2
8 ut 8 :
= ::: =
= 0:8;
= ::: =
= 0:3;
= 0:3;
= 0:2;
= ::: =
= 0;
276
= 0;
= 0:2;
8
= 0:1
= ::: =
= 0;
Na figura 8-2 os grficos que mais fielmente reproduzem o fenomeno de volatility clustering (volatilidades altas (baixas) so geralmente seguidas por volatilidades altas (baixas))
e exibem alguma persistncia no comportamento da volatilidade (tal como vimos nos pontos
3.2.2 e 3.2.3), correspondem aos painis (c) e (d). A simulao sugere que mais apropriado
em aplicaes empricas considerar-se um q elevado (no obstante, veremos adiante que
problemtico estimar-se um modelo com q elevado).
8.2.1
2
t
2 2
t "t
=E
2
t
2
E "t = E
2
t
(8.4)
Por outro lado, como fut g uma diferena de martingala, pois E (jut j) < 1 e E (ut j Ft 1 ) =
0; resulta pela proposio 4.4.1, que ut no autocorrelacionado, i.e. Cov (ut ; ut k ) = 0.
8.2.2
Representao AR de um ARCH
Vimos, j por vrias ocasies, que existem dependncias no segundo momento do processo.
A representao autoregressiva do processo ARCH mostra exactamente esse aspecto. Temse,
u2t +
2
t
= !+
2
1 ut 1
2
t
= !+
2
1 ut 1
+ u2t
u2t = ! +
2
1 ut 1
u2t
2
1 ut 1
2
+ u2t
| {z }t
vt
= !+
2
t j Ft 1 )
+ vt
= E (u2t j Ft 1 )
2
t
4.4.3, que fvt g (admitindo que E (jvt j) < 1) uma diferena de martingala e, portanto,
um processo no autocorrelacionado (E (vt ) = 0 e Cov (vt ; vt k ) = 0). Logo, tem-se o
importante resultado: se ut segue um modelo ARCH(1) ento u2t segue um processo AR(1).
277
Esquematicamente:
ARCH(1) ) u2t
ut
AR(1):
ut
8.2.3
AR(q):
2
1 ut 1
+ vt ;
0:
1j
1 L)
<
simplesmente,
0
< 1:
= !+
2
E ut
2
E ut
= !+
2
2
E ut ) E ut =
!
1
2
1 ut 1
+ ::: +
2
q ut q
+ vt ;
0:
+ ::: +
:::
q
qL )
< 1: Se adicion-
provar, igual a
1
1L
< 1;
278
0).
!
1
+ ::: +
q)
Observao 8.2.1 Embora a expresso Var ( ut j Ft 1 ) seja varivel, Var (ut ) constante.
Assim: ut condicionalmente heterocedstico (heterocedasticidade condicional) mas em
termos no condicionais ou marginais, ut homocedstico. De forma anloga, tambm
num processo estacionrio, a mdia condicional varivel e a no condicional constante.
Por exemplo, num processo AR(1) estacionrio, a mdia condicional varivel ao longo do
tempo e dada por
) constante.
8.2.4
u2 =
2
E ut
Vimos que se ut segue um ARCH(q), ento u2t segue um AR(q). Assim, a FAC e a FACP
tericas de u2 exibem o comportamento tpico de um AR:
no se anula e k ! 0;
8
< no se anula se k = 1; 2; :::; q
(FACP) kk =
: 0
se k = q + 1; q + 2; :::
(FAC)
k
1;
11
k
kk
1
= 0; k
2:
2
1
< 1 i.e. se
+ ut supondo
279
2
t
constante;
0.5
0.5
FAC de u^2
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
-0.1
FACP de u^2
-0.1
13
17
21
25
29
13
17
21
25
29
^ t ; t = 1; :::; n;
8.2.5
Suponha-se que "t um rudo branco Gaussiano N (0; 1) : Ento a distribuio condicional
de ut N (0;
t "t j Ft 1
) ; i.e., ut =
N (0;
2
t):
ku
N (0; 1) ; ento
kurtosis
25
20
15
10
0
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
1;
0.8
0.9
1.0
alfa 1
associada a um ARCH(1)
t "t j Ft 1
N 0;
2
t
) ut
Dist:Leptocurtica:
i.i.d.
N (0; 1) e 3
2
1
ARCH(1);
4
t
! (1 + 1 )
;
(1
3 21 )
1 ) (1
2
3 (1
6 21
E (u4t )
1)
ku =
=
=
3
+
2
1 3 21
1 3
E (u2t )
E
4
t
2
1
> 3:
Vimos que a distribuio de u tem caudas mais pesadas do que a distribuio de ": A
proposio seguinte caracteriza as caudas da distribuio marginal.
Proposio 8.2.1 Seja ut =
!+
2
1 ut 1 .
Suponha-se
t "t
2 (0; 2e ) onde
a constante de Euler,
2
t
onde
2
E Z
a funo Gama e Z
=1,
(2 1 )
p
1
2
=1
(8.5)
281
converge para
c
x
2
; c > 0:
obtm-se da resoluo da
(em funo de
1)
-a
6= 0 ou que
8.2.6
Momentos e Distribuio de y
Seja
yt =
+ ut
ut =
t "t
(assumem-se as hipteses habituais para "t ). Deixa-se como exerccio verificar que:
E (yt j Ft 1 ) =
Var ( yt j Ft 1 ) =
t;
2
t;
N ( t;
2
t);
E (yt ) = E ( t ) ;
Var (yt ) = Var (E (yt j Ft 1 )) + E (Var ( yt j Ft 1 )) = Var ( t ) + E ( 2t ) :
282
Retorno A
-1
-1
-2
-2
-3
-3
-4
Retorno B
-4
8.2.7
Volatilidade: Definies
t)
quase
frequncia alta - dados semanais ou dirios) podemos dizer (sem grande margem de erro)
que a volatilidade condicional uma medida da magnitude das variaes (ou flutuaes)
dos preos no momento t. Esta a definio usual de volatilidade do ponto de vista das
instituies financeiras:
[. . . ] practitioners often refer to the term volatility when speaking of movements
in financial prices and rates. RiskMetrics
Um ttulo A pode exibir, comparativamente a um outro ttulo B, maior volatilidade condicional em certos momentos do tempo mas, globalmente A pode ser menos voltil do que
B. Nas figuras 8-5 o retorno A exibe episdios de grande volatilidade, mas B (globalmente) mais voltil (i.e. considerando o perodo todo).
Definimos volatilidade no condicional (ou marginal) como uma medida da magnitude
das variaes (ou flutuaes) dos preos num hiato de tempo (meses ou anos) (que no so
explicadas). Pode ser medida atravs da estatstica
ou se yt
d (ut ) =
Var
ARCH(q)
d (ut ) =
Var
Pn
!
^
;
(^ 1 + ::: + ^ q )
283
t=1
u^t 2
+ ::: +
< 1):
8.3
Modelo GARCH
Tendo em conta a forte dependncia temporal da volatilidade, era usual, nas primeiras aplicaes, considerar-se um ARCH de ordem elevada. Um ARCH de ordem elevada levanta
problemas de estimao (mais concretamente, de convergncia dos algoritmos de optimizao) e, no raras vezes obtm-se mximos locais (e no globais, como desejvel). Como
consequncia, alguns das estimativas dos parmetros podem vir desprovidos de significado
(por exemplo, podem vir negativos)2 . Para superar este problema, foram tentadas vrias
solues (a maioria ad-hoc e sem muita relevncia). Contudo, a melhor soluo apareceu
com o modelo GARCH. Veremos adiante este aspecto.
Definio 8.3.1 ut segue um modelo GARCH(p,q) (ou tem representao GARCH(p,q)) se
ut =
2
t
! > 0;
t "t
2
1 ut 1
= !+
0;
2
q ut q
+ ::: +
2
1 t 1
+ :: +
2
p t p
2
t
2
1 ut 1
=!+
2
1 t 1;
8.3.1
Considere-se o GARCH(p,q):
2
t
=!+
2
1 ut 1
2
t
= ! + ( 1 L + ::: +
|
{z
+ ::: +
2
q ut q
q
2
q L )ut
A(L)
(1
B (L))
2
t
2
1 t 1
1L
+ ::: +
+ ::: +
{z
B(L)
= ! + A (L) u2t :
2
p t p
P
pL
2
t
No mtodo dos mnimos quadrados (OLS) a estimao relativamente simples e imediata, mesmo que o
nmero de parmetros a estimar seja alto. Afinal, o algoritmo de optimizao converge numa nica iterao.
J no mbito dos modelos ARCH a estimao mais complicada pois a funo a minimizar altamente no
linear e os estimadores no podem ser escritos atravs de uma frmula fechada.
284
Assim,
(1
B (L))
= ! + A (L) u2t
!
A (L)
!
=
+
u2t =
+ D (L) u2t
1 B (L) 1 B (L)
1 B (L)
!
=
+ d1 L + d2 L2 + ::: u2t
1 B (1)
1
X
!
=
+
di u2t i :
1 B (1) i=1
2
t
2
t
2
t
!
1
+ d1 u2t
:::
+ d2 u2t
+ :::
= !+
2
1 ut 1
2
t
= !+
1L
2
2 ut 2
2
1 t 1
+ 2 L2 u2t + ( 1 L) 2t :
| {z }
{z
}
B(L)
A(L)
A (L)
!
!
+
u2t =
B (1) 1 B (L)
1
+
1
1L
2
2L
1L
u2t :
Series[
3
1L
2
2L
1L
; fL; 0; 7g]:
Considere-se
,
,
1L
2
2L
A (L)
= D (L)
1 B (L)
2
q
1 L + 2 L + ::: + q L
= d1 L + d2 L2 + :::
P
1
:::
1L
pL
+ ::: +
q
qL
= d1 L + d2 L2 + :::
1L
:::
P
pL
A partir da ltima equao igualam-se os coeficientes homlogos e resolvem-se as igualdades obtidas em ordem
a di :
285
2
2L
1L
1L
1 1) L
2
1 1
L3
+(
2
2 1
3
1 1
L4 +
3
2 1
4
1 1
L5
4
2 1
5
1 1
L6 +
5
2 1
6
1 1
L7 + :::
2 1
Assim,
d1 =
Em geral di =
1;
1 di 1 ,
d2 =
1 1;
2 1
2
1 1;
etc:
i = 3; 4:::
0;
2
t
d3 =
0; i = 1; 2; :::
1;
d2 =
1 1;
di =
1 di 1
8.3.2
0;
= 0:2;
0;
0:05;
1 1
= 0:5 so admissveis).
2
t
=!+
2
1 ut 1
2
t
=!+
2
1 ut 1
286
+ u2t +
2
1 t 1;
2
1 t 1:
Some-se a ambos
2
1 ut 1
= !+
2
1 ut 1
= !+(
= !+(
2
1 t 1
2
1 t 1
2
1 ) ut 1
2
1 ) ut 1
2
+ u2t
| {z }t
vt
2
1 ut 1
u2t
{z
vt
1 vt 1
2
1 ut 1
2
t 1
+ vt :
+ vt
+ vt
pode-se mostrar
ut
GARCH(p,q) ) u2t
Por exemplo,
ut
GARCH(1,2) ) u2t
ARMA(2,1)
ut
GARCH(2,1) ) u2t
ARMA(2,2)
ut
GARCH(2,2) ) u2t
ARMA(2,2)
Em geral problemtico identificar o GARCH a partir das FAC e FACP de u2t . Por duas
razes: 1) o GARCH implica uma estrutura ARMA para u2t e, como se sabe, no ARMA,
nenhuma das funes de autocorrelao (FAC ou FACP) nula a partir de certa ordem em diante (e, esta caracterstica que facilita a identificao das ordens do AR ou do MA, mas no
do ARMA); 2) no existe uma correspondncia perfeita entre a estruturas ARMA e GARCH
(por exemplo, um ARMA(2,2) para u2t pode ser um GARCH(2,1) ou um GARCH(2,2) para
ut ). Quer isto dizer que as funes de autocorrelao no so interessantes nesta fase? De
forma alguma, por duas razes: 1) se FAC e a FACP de u2t no apresentarem coeficientes
significativos ento no existe efeito ARCH; 2) a existncia de vrios coeficientes de autocorrelao e de autocorrelao parcial significativos indcio forte da presena de efeitos
ARCH4 .
Coeficientes de autocorrelao de u2t estatisticamente significativos podem ainda dever-se a um erro de especificao do modelo (veremos isso adiante) ou presena de outros modelos no lineares, como por exemplo,
o modelo bilinear.
4
287
ut
q
X
p
X
2
i ut i +
p
X
i vt i
+ vt
i=1
i=1
i=1
maxfp;qg
= !+
2
i ut
2
i ) ut
i vt i
+ vt
i=1
i=1
B (L)) vt :
Tem-se assim
(1
B (L)) u2t = ! + (1
A (L)
B (L)) vt :
A (L)
B (L)). Conc-
0e
i=1
8.4
p
X
< 1:
i=1
Modelo IGARCH
t "t
= !+
2
1 ut 1
2
q ut q
+ ::: +
q
X
i=1
p
X
i=1
288
2
1 t 1
=1
+ :: +
2
p t p
se
s igual a um.
2
t
2
1 ut 1
=!+
2
1 t 1;
onde
= 1:
A designao Integrated GARCH resulta do facto de u2t possuir uma raiz unitria:
u2t = ! + (
|
2
1 )ut 1
+
{z
+ vt
1 vt 1
+ vt
L) u2t = !
1 vt 1
+ vt
u2t = ! + u2t
(1
1 vt 1
2
1 "t
< 0;
2) e que esta condio acaba por ser menos exigente que a condio de ESO,
Se E (log (
2
1 "t ))
< 1.
distribuio conjunta de (ut ; ut+1 ; :::; ut+k ) para todo o t e k e, em particular, as funes
densidade de probabilidade so constantes no tempo f (ut ) = f (us ) ; 8t; s; pode-se ainda
2
t
mostrar que
2
t
(!) (
exista o segundo momento). Vrios estudos mostram que os testes assimptticos habituais
permanecem vlidos6 . Para assentar ideias, suponha-se "t
se
< 1 ) ut ESO;
se
e, portanto,
2
1 "t
log E
< 1 ) log E (
2
1 "t )
2
1 "t
N (0; 1) : Ento:
= log (
1)
<0
Na proposio 4.5.5 e exemplo 4.5.13 aborda-se, do ponto de vista terico, esta questo.
Esta concluso contrasta com o processos integrados na mdia, por exemplo do tipo, yt = yt 1 + "t que,
como se sabe, no so nem estacionrios de segunda ordem nem estritamente estacionrios e onde os testes
habituais no so vlidos.
6
289
1 + 1 > 1
[ (
)]
E log 1 + t2 > 0
1 + 1 < 1
[ (
1 + 1 > 1
[ (
)]
E log 1 + t2 < 0
)]
E log 1 + t2 < 0
1
1;
1)
tambm EE;
pode-se provar que
= 1 ) E (log (
2
1 "t ))
pode ser calculado de forma exacta7 ). Como referimos, o processo IGARCH EE. A
condio de ESO acaba por ser mais exigente do que a condio de EE. A primeira
exige a existncia do momento de segunda ordem enquanto EE exige que toda a estrutura probabilstica (leia-se funo de distribuio finita) seja estvel ao longo do
tempo, independentemente dos momentos serem finitos ou no.
E (log (
2
1 "t ))
< 0 6)
<1
1;
1)
2 R2 :
1;
1)
1;
1
2 R2 :
1 ).
Na regio f(
1;
1)
2 R2 :
Persistncia na Varincia
Certos processos exibem reverso para a mdia; outros no (e.g. RW). usual chamar a estes
ltimos processos persistentes no sentido em que choques nas inovaes exercem um efeito
7
Com efeito, a varivel aleatria Z = log 1 + 1 "2 tem distribuio conhecida. Por exemplo, basta
2
fazer uma transformao de varivel e atender ao facto de "2
(1) :
290
8.4.1
<
fhi = 0.1
fhi = 0.8
120
120
115
115
110
110
105
105
100
95
100
90
90
85
85
95
80
80
1
26
51
76
26
51
fhi = 0.98
76
fhi = 1
120
120
115
110
110
105
100
100
95
90
90
80
85
80
70
1
26
51
76
26
51
76
(1
) + yt
+ "t ;
ut rudo branco
= 1 o processo persistente. Se j j <
(1
) + yt
= 0:98 e
= 0:1;
291
Existem outras medidas de persistncia. Por exemplo a half-life o valor de h tal que
1
(yt
2
j Ft )
E (yt+h
);
(supondo yt > )
Suponha-se que em t existe um desvio de y face sua mdia de longo prazo igual a yt
Questo: quantos perodos so necessrios para que metade desse desvio seja eliminado (em
mdia)? Ou, em quanto tempo o processo elimina metade do desvio yt
Para exemplificar, considere-se o processo AR(1), yt =
yt
? A resposta h:
+ ut (note-se,
= 0).
yt :
yt = 21 yt : Logo
1
log (1=2)
yt = yt ) h =
:
2
log
= 0:8; ento
h = log (1=2) = log (0:8) = 3:1 o nmero de dias necessrios para que, em mdia, metade
do desvio de y face sua mdia de longo prazo seja eliminado. Valores altos de h indicam
maior persistncia (o processo demora mais tempo a eliminar desvios face mdia de longo
!
prazo e, neste caso, o processo exibe uma reverso para a mdia mais lenta). No caso
2
t
duradouro na varincia?
Podemos tambm definir uma half-life para a varincia. Trata-se do valor de h tal que
onde
2
t+h
1
2
>
Ft
2
t
2
t
(supondo
)
= != (1
e
E
2
t+h
Ft = (
h
1)
2
t
(este resultado mostra-se no captulo da previso). Assim a half-life o valor de h tal que
292
1)
1)
2
t
(
Quando
1+ 1
) = 12 (
h
1)
2
t
2
t
) : Logo
1
2
2
t
)h=
log (1=2)
:
log ( 1 + 1 )
2
t+h
Ft no so persistentes no modo
q:c:
(!) ; i.e.
2
t
E ( 2t ) no existir).
Em muitas aplicaes empricas observa-se que a estimativa para
se encontra
muito perto de um, sugerindo que a volatilidade pode ser persistente (forte dependncia
temporal) e que Var (yt ) pode no existir. Este facto est de acordo com os factos estilizados
discutido no ponto no captulo 3.
Um modelo estacionrio mas em que a volatilidade exibe memria longa o FIGARCH
(GARCH fraccionrio).
8.4.2
ut =
t "t ;
2
t
= 0:1;
t = 1; 2; :::; 1000
= ! + u2t 1 + 2t 1 ;
8
< 0:5 t = 1; 2; :::; 500
= 0:6; ! =
: 1:5 t = 501; 502; :::; 1000
(8.6)
Este modelo foi simulado 500 vezes. Na figura 8-8 representa-se uma das 500 trajectrias
simuladas.
Em cada simulao (ou trajectria simulada) estimaram-se os parmetros. Embora o
293
10
8
6
4
2
0
-2
-4
-6
-8
1
101
201
301
401
501
601
701
801
901
= 0:7), concluiu-se
que:
em 83% das simulaes a soma dos parmetros ^ + ^ esteve acima de 0.99;
em 99.6% das simulaes a soma dos parmetros ^ + ^ esteve acima de 0.95;
em todos os casos ^ + ^ esteve acima de 0.9.
Este exerccio de simulao ilustra o impacto de alteraes de estrutura sobre os coefie : A mensagem clara: num aplicao emprica, se ^ + ^ estiver prximo de
cientes
um, convm verificar se o modelo subjacente de facto um IGARCH ou, pelo contrrio, se
existem alteraes de estrutura que causem um falso IGARCH . No obstante, quer se verifique +
8.4.3
2
t
294
+ yt2
+ ::: + yt2
0.0007
0.0006
0.0005
Vol30
0.0004
Vol60
0.0003
Vol120
0.0002
Vol240
0.0001
Jan-06
Aug-04
Mar-03
Oct-01
May-00
Dec-98
Jul-97
Feb-96
Sep-94
Apr-93
Nov-91
Jun-90
Jan-89
Figura 8-9: Estimativas da volatilidade do ndice Dow Jones ao longo do perodo, baseadas
no estimador 2 (h) para diferentes valores de h (e.g., Vol30 = 2t (30) ; Vol60 = 2t (60) ;
etc.)
(supomos E (yt j Ft 1 ) = 0).
Na figura 8-9 mostram-se vrias estimativas da volatilidade do ndice Dow Jones ao longo
do perodo, baseadas no estimador
Vol60 =
2
t
2
t
(30) ;
(60) ; etc.)
2
t
O estimador
2
t
2
t
h; t
1) tm o
1 X 2
1
(240) =
yt2
yt i =
240 i=1
240
240
2
t
+ yt2
+ ::: + yt2
240
todas as observaes tm um peso de 1/240. No entanto, seria prefervel dar mais peso
s observaes mais recentes;
o estimador
2
t
h; t
1)
h; t
essa observao sai da janela amostra, a volatilidade estimada cai depois abruptamente.
O estimador Exponential Weighted Moving Averages (EWMA, proposto pela J.P. Morgan) resolve algumas das fragilidades dos estimador acima descrito, dando mais peso s
295
= (1
= (1
1
X
i 1 2
yt i ;
i=1
yt2 1
+ yt2
0<
2 2
yt 3
<1
+ ::: :
Quanto mais alto for ; mais peso o estimador d s observaes mais antigas (o decrscimo
dos ponderadores , no entanto, sempre exponencial).
i
; somam 1,
! i = (1
) 1+
Os ponderadores, ! i = (1
1
X
+ ::: = 1
i=1
A expresso de
2
t
= (1
) yt2
= 0:5
yt2
2 2
yt 3
+ yt2
+ 0:5yt2
+ 0:25yt2
= 0:5 vem
+ :::
3
+ 0:125yt2
+ ::: :
) yt2
= (1
+ yt2
2 2
yt 4
+ :::
temos
2
t
) yt2
= (1
2
t 1:
(8.7)
= !+
2
1 ut 1
= ! + (1
2
1 t 1;
2
1 ) yt 1
t "t :
Vem
=1
2
1 t 1:
Se ! = 0 conclui-se que um IGARCH(1,1) corresponde ao modelo EWMA. Assim, o modelo EWMA um caso muito particular do IGARCH.
296
8.5
Modelo CGARCH
Considere-se o GARCH(1,1):
2
t
= !+
2
1 ut 1
= !+
u2t
(1
1
1)
u2t
2
t
2
1 t 1
2
t 1
u2t
1
2
2
t 1
2
t 1
a dinmica de ajustamento de
face constante
= qt +
2
qt =
2
onde
u2t
qt
qt
u2t
2
t 1
2
t
qt
(8.8)
2
t 1
(1
qt =
2
t 1
u2t 1
L)
)+
(1
(1
)+
(1
u2t 1
L)
2
t 1
+
= (1
2
t 1
1 ) (1
+(
(1
2
+ )
u2t
+(
2
t 1
u2t 2
L)
)+
(1
+ ) u2t
+ ((
(1
1
1)
2
t 2
+(
1
u2t 2
L)
)+
(1
2
t 2
= ::: =
1
1)
) u2t
2
t 2:
297
ESO sse
(1
(1
( (1
1)
< 1:
Nestas circunstncias,
Var (ut ) =
1 ) (1
1) +
1)
+ (qt
(verifique!). No caso q0 6=
tem-se qt !
: Se
= 0; vem
= 0 ) qt =
ou
2
t
u2t
2
t 1
: Assim, o caso
= 0;
8.6
2
t
para
2
t
Modelo GJR-GARCH
O modelo GJR-GARCH devido a Glosten, Jagannathan e Runkle. Uma das caractersticas das sries de retornos de ttulos o Leverage Effect (i.e. momentos de maior volatilidade so despoletados por variaes negativas nos preos). Vimos no ponto 3.2.4 que este
efeito pode ser detectado atravs da medida (naive) Cov (yt2 ; yt 1 ) < 0: Veremos agora uma
forma bastante mais eficiente de estimar esse efeito. Comece-se por observar que o modelo ARCH/GARCH apenas detecta o chamado efeito magnitude. Isto , a volatilidade s
responde magnitude do valor de ut . Em esquema:
" u2t
)"
2
t
(efeito magnitude)
298
=!+
Ifut
2
1 ut 1
1 <0g
+ 1 2t 1 + 1 u2t 1 Ifut
8
< 1 se u < 0
t 1
=
: 0 se u
0:
t 1
1 <0g
2
t
varia como
resposta a uma variao em ut 1 ? Uma forma de visualizar esta relao consiste em fixar
2
t 1
2
t
se por news impact curve (NIC). NIC portanto uma funo de ut 1 . No caso GARCH,
tem-se
N IC (ut 1 ) = ! +
2
1
2
1 ut 1
= const: +
2
1 ut 1
(8.9)
N IC (ut 1 ) = ! +
= const: +
Por exemplo, admita-se
= 0:2;
2
1 ut 1
2
1 ut 1
2
1 ut 1 Ifut
2
1 ut 1 Ifut
= 0:5; ! = 0:1;
1 <0g
(8.10)
1 <0g
NIC (8.9) e (8.10) esto representadas na figura 8.6. Como seria de esperar, a NIC associada
ao modelo (8.10) assimtrica e aba esquerda mais inclinada, traduzindo o facto de que a
299
< 0:
12
10
Vol(t)
NIC GARCH
GJR-GARCH
4
2
0
-4
-3
-2
-1
u(t-1)
= 0:2;
= 0:5; ! = 0:1;
= 0:4
= 0 (atravs, por
exemplo, do teste de Wald). Pode-se provar que a condio de ESO (no caso em que a
distribuio de " simtrica)
1 =2
2
t
Var (ut ) = E
+
=
!
1
1 =2
1)
8.7
Modelo GARCH-M
A teoria financeira postula uma relao entre rendimento esperado e o risco associado. Em
geral deve-se esperar que os activos com maior risco estejam associados aos activos com
maior rendimento.
yt = c + g
2
t
+ ut ;
ut =
2
t
t "t ;
=!+
2
t
t;
300
2
t
= log
2
1 ut 1
2
1 t 1:
8.8
Considere-se um modelo GARCH(1,1) (poderia ser outro modelo qualquer) com variveis
explicativas:
yt =
ut =
t "t
2
t
2
t
+ ut
= !+
2
1 ut 1
2
1 t 1
+ g (xt )
=!+
2
1 ut 1
2
1 t 1
1 St
2 Tt
a
3 Qt
u
5 Qt
2
t
> 0).
goodt
badt
=!+
2
1 ut 1
2
1 t 1
1 goodt
2 badt
8
< 1 t = so divulgados resultados da empresa ABC acima do esperado
=
: 0
0
8
< 1 t = so divulgados resultados da empresa ABC abaixo do esperado
=
: 0
0
A chamada armadilha das variveis artificiais no ocorre no exemplo (embora parea) pois as notcias
podem ser boas, ms ou simplesmente no ocorrerem (e, neste caso, vem goodt = badt = 0).
301
onde volt
volt
=!+
2
1 ut 1
2
1 t 1
1 volt 1
volt
vol
ou volt
= log (volt 1 ) ou
ume de transaces pode ser considerado como uma varivel proxy da varivel no
observada chegada de informao.
Qualquer outra varivel (estacionria) que supostamente afecte a volatilidade.
No ponto 7.4.9 vimos que o modelo em tempo discreto, compatvel com o processo CIR,
p
em tempo contnuo, drt = (
rt ) dt +
rt dWt conduz ao modelo,
rt = c + rt
ut =
2
t
+ ut
t "t
2
rt
Inspirados nesta especificao, certos autores modelam a taxa de juro em tempo discreto
combinando as caractersticas do GARCH com as caractersticas do processo de difuso
(modelo CIR):
rt = c + rt
ut =
2
t
O ensaio H0 :
= 0 vs. H1 :
+ ut
t "t
= !+
2
1 ut 1
2
t 1
+ rt 1 :
302
18
16
14
12
10
8
6
4
2
Jan-03
May-05
Sep-00
Jan-96
May-98
Sep-93
May-91
Jan-89
Sep-86
May-84
Jan-82
Sep-79
May-77
Jan-75
Sep-72
Jan-68
May-70
Sep-65
Jan-61
May-63
Sep-58
May-56
Jan-54
8.9
Estimao
Seja yt =
t +ut
onde ut =
t "t :
t-Student ou outra) de mdia zero e varincia um. O vector dos parmetros desconhecidos,
, envolve parmetros definidos na mdia condicional e na varincia condicional.
A mdia condicional
ada tambm como um vector de variveis explicativas). Por exemplo, podemos ter,
yt =
ut =
t "t ;
2
t
1 yt 1
"t
+ ut
N (0; 1)
2
1 ut 1
= !+
= ( 0;
A estimao do vector
1 xt
1;
1 ; !;
1)
0;
2
t
= !+
2
1 ut 1 ,
^2t 1
1u
1 xt
= !+
1 yt 1
2
1 ut 1
ou seja, u2t = ! +
303
2
t
+ ut :
implica
2
1 ut 1
+ vt
O procedimento acima descrito envolve estimadores consistentes mas altamente ineficientes, pois em ambos os casos os erros das equaes so heterocedsticos (no caso da
estimao ! e
1;
forte heterocedasticidade).
O mtodo de estimao mais utilizado o mtodo da mxima verosimilhana (o GMM
tambm pode ser utilizado) que se descreve a seguir.
8.9.1
Assuma-se que todos os parmetros de interesse, includos em ; apenas aparecem na densidade conjunta condicional f (Yn j Xn ; ) ; onde Yn = (yn ; yn 1 ; :::; y1 ) e Xn = (xn ; xn 1 ; :::; x1 ) :
Para simplificar a exposio, admite-se (sem perda de generalidade) que as condies iniciais Y0 so conhecidas. Tem-se assim, que a densidade relevante, para a estimao de ;
f (Yn j Y0 ; Xn ; ) :
Proposio 8.9.1 Se yt condicionalmente independente de (xn ; :::; xt+1 ) (n > t) dado
(Yt 1 ; Xt ), i.e.,
f (yt j Yt 1 ; Xn ) = f (yt j Yt 1 ; Xt ) ;
ento
f (Yn j Y0 ; Xn ; ) = f (yn j Yn 1 ; Xn ; )
:::
=
n
Y
t=1
f (yn 1 j Yn 2 ; Xn 1 ; )
f (y1 j Y0 ; x1 ; )
f (yt j Yt 1 ; Xt ; )
(8.11)
(8.12)
( )
304
( )
(8.13)
(8.14)
( )
A nova expresso (*) pode ser desenvolvida de forma similar. Coligindo as equaes (8.12)(8.14), obtm-se (8.11).
A hiptese definida na proposio anterior, estabelece que yt no depende dos valores
futuros xt+1 ; xt+2 dado It = Yt
de Yt
no depende
1 [ Xt
n
Y
t=1
f (yt j It ; )
(8.15)
n
Y
t=1
n
X
t=1
log f (yt j It ; ) :
Sob certas hipteses, incluindo, f(yt ; xt )g um processo estacionrio e fracamente dependente, o estimador de mxima verosimilhana consistente e assimptoticamente eficiente.
A sua distribuio dada por
p
n ^n
! N 0; I ( 0 )
@ 2 lt ( )
@ @ 0
B( )=E
lt ( ) = log f (yt j It ; ) :
305
@lt ( ) @lt ( )
@
@ 0
A^n =
X @lt
^n = 1
B
n t=1
@
n
! A ( 0)
^n @lt ^n
! B ( 0) :
+ ut onde ut =
t "t j It
N 0;
2
t
) yt j It
t;
t "t ;
i:i:d
2
t
a fdp f resulta
N (0; 1) : Logo,
e, portanto,
log f (yt j It ; ) =
1
log (2 )
2
1
log
2
2
t
1
(yt
2 ( )
( )
2
t
( ))2 :
(8.16)
ut =
2
t
=!+
2
1 ut 1
1 xt
t "t ;
2
1 ut 2
1 yt 1
"t
+
2
1 t 1
+ ut
N (0; 1)
+
0 segt
+ volumet
onde segt uma varivel dummy que assume 1 se t corresponde a uma segunda feira. Para
estimar o modelo no EVIEWS, atravs do mtodo da mxima verosimilhana, basta seleccionar estimate e depois ARCH"em method. Ver a figura 8-11.
Escolhendo 1 em Threshold order poderia estimar-se o GJR-GARCH.
Eficincia do Estimador de MV vs. Estimador OLS
Considere-se o modelo de regresso linear
yt = x0t + ut ;
ut = "t t ; "t
306
i:i:d
N (0; 1)
1 x1t
xkt
ased estimator). Significa que o melhor estimador? No. O estimador de MV (no linear)
para ; ^ n ; assimptoticamente mais eficiente. Pode-se provar que a matrix
Var ^ n
Var ~ n
semidefinida positiva. Isto implica, em particular, que as varincias dos estimadores OLS
so maiores ou iguais s correspondentes varincias dos estimadores de mxima verosimilhana. Para confirmarmos esta ideia, simulou-se 1000 vezes o modelo
yt =
2 xt
+ ut ; xt
1
i:i:d
= 10;
ut = "t t ; "t
2
t
i:i:d
= 0:05 + 0:2u2t
= 5;
N (0; 1)
+ 0:75
2
t 1
307
(1) OLS
0.001
Erro Quad.Mdio
(2) MV
0.0006
(4) MV
0.0006
(3)/(4)
1.833
1000
1 X ~ (i)
1
1000 i=1
(i)
e ~ 1 a estimativa OLS para
10
A tabela 8.1 sugere que o estimador ML substancialmente mais preciso do que o estimador OLS. Com base nas 1000 estimativas OLS e de MV do parmetro
2;
apresenta-se na
figura 8-12 as fdp estimadas (no parametricamente) dos estimadores OLS e de MV.
A figura 8-12 confirma a tabela 8.1: o estimador de MV mais eficiente do que o estimador OLS (i.e., mais preciso ou apresenta menor variabilidade). A figura 8-12 tambm
sugere que ambos os estimadores so asimptoticamente centrados.
Prova-se (sob as condies usuais de regularidade) que o estimador de mxima verosimilhana apresenta as propriedades habituais, isto , consistente, assimptoticamente eficiente
e tem distribuio assimpttica normal (como vimos). O estimador OLS consistente para
308
8.9.2
Na prtica, a distribuio de "t no conhecida. Podemos ainda assim supor, por exemplo,
"t
N (0; 1) ou "t
verdadeira distribuio seja desconhecida, podemos ainda assim trabalhar com a hiptese
"t
N (0; 1) ou "t
ut =
"t
n
X
t=1
log f (yt j It ; )
n
X
t=1
yh (yj It ) dy =
(y
2
t)
h (yj It ) dy =
^pmv
n
p
^pmv
!
n
d
! N 0; A ( 0 )
309
B ( 0) A ( 0)
Se, por acaso, a funo h a prpria funo f , i.e., f = h, ento o estimador de pseudo
mxima verosimilhana o estimador de mxima verosimilhana e, neste caso, tem-se
A ( 0 ) = B ( 0 ) e, portanto, A ( 0 )
B ( 0) A ( 0)
=A
( 0) :
Em suma, mesmo que a distribuio de "t no seja conhecida podemos supor, por exemplo, "t
pmv
porque ^n , ainda assim, um estimador consistente (embora no assimptoticamente efi-
ciente) e tem distribuio assimpttica normal. O nico cuidado adicional tomar como
matriz de varincias-covarincias (assimpttica) a expresso9 A ( 0 )
B ( 0) A ( 0)
no I ( 0 ) 1 .
8.9.3
dos, ^" = u^t =^ t apresentam um valor de kurtosis quase sempre acima do valor 3, i.e., k^" > 3.
Este resultado , at certo ponto, inesperado. O que habitual ter-se ku^ > 3. Quando u^t
so ponderados por ^ t seria natural esperar-se uma reduo significativa do valor da kurtosis
pois os valores muito altos e muito baixos de u^t sero ponderados por valores altos de ^ t :
Embora ocorra uma reduo do valor da estatstica de kurtosis quando se passa de u^t para
^"t = u^t =^ t ; normalmente observa-se ainda k^" > 3 (embora k^" < ku^ ). Assim, tambm a
distribuio condicional ut j Ft
(e no s a marginal) leptocrtica.
J vimos uma forma de lidar com este problema: basta tomar o estimador de pseudo
mxima verosimilhana. Uma alternativa consiste em formular uma distribuio leptocrtica
para "t tal que E ("t ) = 0 e Var ("t ) = 1. importante assegurar E ("t ) = 0 e Var ("t ) = 1:
Com efeito, suponha-se que Var ("t ) =
2
t:
2 2
t
e deix-
t-Student(v)
t-
310
2
t
Var ( ut j Ft 1 ) =
2
t v= (v
2)). A soluo
(v
6
v
Considere-se assim a distribuio t-Student T(0,1) (de mdia zero e varincia 1):
g (x) = p
v+1
2
v
2
1
(v
2)
v+1
2
x2
1+
f (yt j It ) =
yt
1
t
(v
v+1
2
v
2
2)
B
@1 +
1
log
2
+ log
Hiptese: "t
2
t
v+1
2
v
2
1
2
t
(v
2)
1
1
log
log (v 2)
2
2
v+1
1 (yt
log 1 +
2
v 2
t=1 lt
yt
B
@1 +
2
t)
2
t
v+1
2
C
A
Pn
v) onde
t
t
v+1
2
v
2
yt
( ) ; ( inclui
v+1
2
C
A
Rx
g (x) dx a respectiva funo de distribuio. Qual a fdp de
Seja g (x) a fdp de " e G (x) =
1
yt = t + t "t condicionada a Ft 1 ; sabendo que (1) a fdp de "t dada pela funo g e (2) t e t so
conhecidos dado Ft 1 (ou It )? Trata-se de um problema clssico de mudana de variveis. Comece-se por
analisar a funo de distribuio condicional
10
P ( yt
yj Ft
f ( yj Ft
1)
=P(
1) =
dP ( yt
t "t
yj Ft
1)
=P
"t
t
t
Ft
=G
t
t
yj Ft
dy
1)
=G
t
t
311
t
t
=g
t
t
1
t
g(x)
2.5
2.0
1.5
1.0
0.5
-3
-2
-1
"t v
(1=v)
funo Gama,
2=v
(1=v)
(3=v)
ut =
2
t
=!+
2
1 ut 1
1 xt
t "t ;
2
1 ut 2
1 yt 1
"t
2
1 t 1
+ ut
t (v)
+
0 segt
+ volumet
onde segt uma varivel dummy que assume 1 se t corresponde a uma segunda feira. Para
estimar o modelo no EVIEWS, atravs do mtodo da mxima verosimilhana, basta seleccionar Students t em Error distribution. Ver a figura 8.9.3. O output fornece tambm
uma estimativa para o nmero de graus de liberdade da distribuio t-Student. Esta estimativa interessante pois fornece informao sobre o achatamento da distribuio condicional.
8.10
Ensaios Estatsticos
8.10.1
Ensaios Pr-Estimao
ut =
t"
2
t
+ ut
= !+
2
1 ut 1
+ ::: +
2
q ut q .
= ::: =
=0
que
d
nR2 !
2
(q)
2
t
::: u^2t
(8.17)
rejeitada. Ento conveniente considerar o GARCH. Na verdade, pode-se provar que o teste
multiplicador de Lagrange do efeito GARCH baseia-se tambm na regresso de u^2t sobre as
variveis u^2t i :
313
2
t
+ ut supondo
constante;
2
(q)
FAC de u^2t
Como se viu, a existncia de um processo GARCH implica a correlao das variveis u2t
e u2t k : O teste Ljung-Box assimptoticamente equivalente ao teste ARCH. A sua hiptese
nula H0 :
(^
u2t ) = ::: =
(^
u2t ) = 0; sendo
(^
u2t ) o coeficiente de autocorrelao entre
m
X
i=1
1
n
^2i u^2t
2
(m k)
+ ut :
onde y so os retornos do PSI20 (Jan 93 a Out 04). O modelo foi estimado atravs da instruo y c ma(1). Uma vez estimado o modelo, o programa EVIEWS oferece a opo
ARCH LM test... em view-Residual Tests. A figura 8-14 mostra que o valor-p zero,
pelo que existe forte evidncia contra a hiptese nula; por outras palavras, existe forte evidncia da presena de efeito ARCH. O teste Ljung-Box (ver a figura 8-15) corrobora as
concluses do teste ARCH.
314
ARCH Test:
F-statistic
Obs*R-squared
23.58130
218.9822
Probability
Probability
0.000000
0.000000
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Included observations: 2925 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
RESID^2(-1)
RESID^2(-2)
RESID^2(-3)
RESID^2(-4)
RESID^2(-5)
RESID^2(-6)
RESID^2(-7)
RESID^2(-8)
RESID^2(-9)
RESID^2(-10)
5.64E-05
0.183900
0.058698
0.019230
0.040301
0.004380
0.036872
0.032363
0.109910
-0.020103
0.029723
8.24E-06
0.018517
0.018824
0.018745
0.018739
0.018741
0.018741
0.018739
0.018745
0.018824
0.018517
6.840992
9.931537
3.118322
1.025890
2.150692
0.233690
1.967414
1.727034
5.863338
-1.067965
1.605224
0.0000
0.0000
0.0018
0.3050
0.0316
0.8152
0.0492
0.0843
0.0000
0.2856
0.1086
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.074866
0.071691
0.000376
0.000413
18918.62
1.999284
0.000112
0.000391
-12.92829
-12.90579
23.58130
0.000000
315
Existem muitos outros testes para ensaiar efeitos e modelos especficos (ver por exemplo,
Franses e van Dijk, 2000). Estes testes tm como objectivo sugerir a especificao da estrutura de
2
t
alternativa, podemos discutir esses efeitos especficos (por exemplo, efeito assimtrico) na
fase da estimao, a partir dos ensaios habituais de significncia e dos critrios SC e AIC.
Por exemplo, suponha-se que se pretende ensaiar a presena do efeito assimtrico. Em
alternativa aos testes apresentados em Franses e van Dijk (2000), pode-se ensaiar a hiptese
1
2
t
8.10.2
=!+
2
1 ut 1
2
1 t 1
2
1 ut 1 Ifut
1 <0g
; Ifut
1 <0g
Ensaios Ps-Estimao
8
< 1 se u
t
=
: 0 se u
t
<0
0:
n ^n
! N (0; V0 )
(8.18)
onde
8
< I( ) 1 = A( ) 1
0
0
V0 =
: A( ) 1B( )A( )
0
0
0
316
k = 5 e H0 :
+2
= 3 tem-se q = 1 e
0
+2
B
B
B
B
B
=3, 0 0 0 1 2 B
|
{z
}B
B
B
R
@
2
3
4
5
C
C
C
C
C
3 :
C = |{z}
C
r
C
C
A
| {z }
! N (0; RV0 R0 )
e, consequentemente11 ,
n R^n
r (RV0 R0 )
R^n
2
(q) :
(8.19)
O programa EVIEWS permite aplicar de forma muito fcil o teste de Wald. No exemplo
anterior, e depois de estimado o modelo GARCH, bastaria seleccionar view-coefficient
tests-Wald e depois escrever c(4)+2*c(5)=3. possvel tambm ensaiar relaes no
lineares entre os parmetros, como por exemplo, c(4)^2+c(5)^2=1.12
Testes individuais (por exemplo, do tipo H0 :
^n
= 0) baseiam-se na relao
^0
V
0;
n
devido a (8.18) (para n finito mas suficientemente alto, ^n tem distribuio aproximadamente
igual a N ( 0 ; V0 =n)). Assim, para ensaiar, por exemplo, H0 :
t^n;2 =
= 0 considera-se o rcio-t
^n;2
se ^n;2
com distribuio N (0; 1) onde se ^n;2 o erro padro de ^n;2 ( a raiz quadrada do ele11
317
+ ut ;
ut =
t "t :
2
t
exibir autocorrelao;
(c) finalmente, se " segue uma distribuio leptocrtica ento k^" > 3:
Para analisar (a) e (b), devemos:
1. estimar um modelo ARMAX+GARCH;
2. obter os resduos u^t ;
3. obter os resduos estandardizados ^"t = u^t =^ t ;
4. (Anlise da questo (a)). Efectuar o teste Ljung-Box tomando como hiptese nula,
H0 :
(^"t ) = ::: =
m
X
i=1
1
n
^2i (^"t ) !
2
(m k)
5. (Anlise da questo (b)). Efectuar o teste Ljung-Box tomando como hiptese nula,
H0 :
^"2t = ::: =
^"2t = 0 (
m
X
i=1
1
n
^2i ^"2t
2
(m k)
onde k o nmero de parmetros estimados (McLeod e Li, 1983, sugere que k pode
ser apenas o nmero de parmetros dinmicos estimados na varincia condicional; por
exemplo, 2 no GARCH(1,1)). Evidncia contra a hiptese nula sugere que ^"2t autocorrelacionado. Neste caso necessrio rever a especificao da varincia condicional.
Taylor (2005), p. 258, aponta outros procedimentos alternativos.
Teste Alternativo
Uma forma alternativa de analisar a questo (b) atrs referida consiste em verificar a
presena de efeitos ARCH remanescentes atravs da especificao (Franses e van Dijk, 2000,
e Lundbergh e Tersvirta, 2002):
yt =
ut =
t "t
"t = e t
Sob H0 :
= ::: =
+ ut
q
1+
2
1 "t 1
+ ::: +
2
m "t m
nR2 !
2
(m)
::: ^"2t
x^t
onde
x^t =
e
1 @ ^ 2t
^t @ 0
2
t.
319
Calcule-se
@
@
2
t
0
no caso
2
t
= !+
2
1 ut 1 +
2
1 t 1:
Tem-se
@
@
Suponha-se
@ 20
@!
2
t
0
=
@
2
t
@ 2t
@!
@
@
2
t
1
@
@
2
t
= 0: Vem
@ 2t
= 1+
@!
2
t 1
@
1
= 1+
@!
+
2
1
=1+
t 1
1
+ ::: +
1+
=
@
1
t
X
2
t 2
@!
i 1
1
= ::: =
1
=
1
i=1
t
1
1 :
2
t
0
Pt
i=1
i 1
1
Pt
i=1
i 1 2
^t i
1 u
Pt
i=1
i 1 2
1 ^t i
8.11
Previso
2
t:
2
t
320
prever
2
n+1 ;
2
n+2 ; :::;
8.11.1
2
n+2 ; :::;
2
n+1 ;
Vimos que o previsor com EQM mnimo para yn+h (dada a informao em Fn ) E (yn+h j Fn ) :
De igual forma, o previsor com EQM mnimo para
2
n+h
uralmente)
E
Note-se que E u2n+h Fn = E
considere-se
2
n+h;n
Modelo ARCH(1)
2
t
2
2
n+h "n+h
2
n+h
:= E
2
n+h
Fn :
2
n+h
Fn = E
2
1 ut 1
=!+
Previso a um passo h = 1
Como
2
n+1
2
1 un
=!+
tem-se
2
n+1;n
2
n+1;n
=E !+
2
1 un
Fn = ! +
2
1 un
2
n+2
2
1 un+1
=!+
tem-se
2
n+2;n
2
n+1;n
por ! +
2
n+2;n
2
1 un :
2
1 un+1
= E !+
Fn
= !+
2
E un+1 Fn
= !+
= !+
2
1 n+1;n
2
n+1
Fn
Vem
2
n+2;n
= !+
2
1 n+1;n
= !+
!+
= ! (1 + ) +
321
2
1 un
2
1 un
Previso a h passos
2
n+h;n
= !+
2
E un+h
= !+
= !+
2
1 n+h 1;n :
Se 0
2
n+h 1
2
n+h;n
2
1 n+h 1;n
=!+
Fn
Fn
Fn
=!
h
1
1
1
h 2
1 un
< 1; conclui-se
2
n+h;n
O caso
2
1 un+h 1
= E !+
(quando h ! 1).
= Var (ut )
Modelo GARCH(1,1)
=!+
2
1 ut 1
2
1 t 1
Previso a um passo h = 1
Como
2
n+1
2
1 un
=!+
2
n+1;n
2
1 n
2
1 un
=E !+
2
n+1;n
tem-se
+
2
1 n
Fn = ! +
2
1 un
2
1 n
2
n+2
=!+
2
1 un+1
2
n+2;n
2
1 n+1
2
1 un+1
= E !+
= !+
= !+(
tem-se
+
2
1 n+1
2
E un+1 Fn +
1
1)
322
2
n+1;n
Fn
E
2
n+1
Fn
2
1 ^ n ).
Previso a h passos
2
n+h;n
2
1 un+h 1
= E !+
= !+
2
E un+h
= !+(
2
1 n+h 1
Fn +
Fn
2
n+h 1
Fn
2
n+h 1;n
1)
=!+(
2
n+h;n
Assim, no caso
2
n+h;n
No caso
1)
2
n+h 1;n
h
1)
(8.20)
! 1
=
2
n:
+(
h 1
1)
2
n+1;n
=!+
2
1 un
2
1 un
2
1 n
2
1 n)
< 1; tem-se
!
!
1
(quando h ! 1).
= Var (ut )
= 1 (IGARCH(1,1)) vem
2
n+2;n
= !+
2
n+1;n
2
n+3;n
= !+
2
n+2;n
=!+ !+
2
n+1;n
= 2! +
2
n+1;n
:::
2
n+h;n
= (h
1) ! +
2
n+1;n
e, portanto,
2
n+h;n
2
n+h;n
! 1,
2
n+1;n ,
se ! = 0
se ! > 0 (quando h ! 1).
2
n+h;n ;
323
8.11.2
Qualquer que seja o modelo para y; o previsor de yn+h com EQM mnimo, baseia-se, como
vimos, no valor esperado condicionado de y. Assim, a previso pontual de yn+h no envolve
qualquer novidade face ao que foi j exposto no ponto 6.6. Todavia, a estimao por intervalos deve agora reflectir a presena de heterocedasticidade condicional. Seja (l1 ; l2 ) o IC a
(1
l1 E (yn+h j Fn )
yn+1 E (yn+h j Fn )
l2 E (yn+h j Fn )
p
< p
< p
Fn
Var ( yn+h j Fn )
Var (yn+h j Fn )
Var (yn+h j Fn )
p
E (yn+h j Fn )) = Var ( yn+h j Fn ) e q1
=2
=1
o quantil de ordem 1
=2
q1
=2
=2
Fn = 1
q1
=2
l2 E (yn+h j Fn )
ep
= q1
Var (yn+h j Fn )
=2 :
=2
p
Var (yn+h j Fn );
l2 = E (yn+h j Fn )+q1
=2
p
Var (yn+h j Fn )
E (yn+h j Fn )
q1
=2
13
p
Var (yn+h j Fn )
Note-se que Var ( yn+h j Fn ) = Var ( en (h)j Fn ) onde en (h) = yn+h E ( yn+h j Fn ) o erro de previso
a h passos. Assim, o IC (1
) 100% pode ser tambm apresentado da seguinte forma:
p
E ( yn+h j Fn ) q1 =2 Var ( en (h)j Fn ):
324
Por exemplo, assuma-se que yn+h j Fn tem distribuio N (E (yn+h j Fn ) ; Var ( yn+h j Fn ))
e, portanto, Zn+h j Fn
E (yn+h j Fn )
1.
a previso de yt e de
limh!1 E (yn+h j Fn ) e Var (y) = limh!1 Var (yn+h j Fn ) (tratam-se afinal dos momentos
marginais da distribuio de y). O IC a (1
desta forma,
E (y)
onde
=2
o quantil de ordem 1
p
Var (y)
=2
ser estimado a partir da distribuio emprica da sucesso de valores observados fy1 ; :::; yn g :
Analise-se nesta seco apenas a previso a um passo e deixe-se o caso da previso a
h > 1 passos para o ponto 8.11.3
Exemplo 8.11.1 Considere-se o modelo AR(1)+GARCH(1,1)
yt = c + yt
2
t
Se ut j Ft
N (0;
=!+
2
1 ut 1
+ ut ;
2
t ) ento um IC a 95% para yn+1
ou seja
c + yn
p
1:96 ! +
p
E (yn+h j Fn ) 1:96 Var ( yn+h j Fn )
2
1 un
Modelo de Regresso
Considere-se o modelo de regresso
yt = x0t + ut
325
2
1 t 1:
2
1 n:
N (0;
2
t):
x0n+1
1:96
n+1;n :
Analise-se agora uma questo que normalmente descurada no mbito das sries temporais (mas no na rea da econometria). O intervalo de previso acima estabelecido assume
que
conhecido. Ao substituirmos
fonte de variabilidade, que deve ser incorporada no intervalo de previso. Para se ter em
conta a variabilidade de ^ ; necessrio obter a distribuio da varivel yn+1
x0n+1 ^ : A
representao
yn+1
^ = en (1)
0 e varincia
Var ( en (1)j Fn ; X) = Var x0n+1
^ + un+1 Fn ; xn+1
^
= x0n+1 Var
2
n+1;n
l1
x0n+1 ^
yn+1
x0n+1 ^
l2
x0n+1 ^
p
<p
<p
Fn
Var (en (1)j Fn ; xn+1 )
Var ( en (1)j Fn ; xn+1 )
Var ( en (1)j Fn ; xn+1 )
326
= 0:95:
x0n+1 ^
1:96
2
n+1;n :
(8.21)
1:96^ n dado que
x0n+1 Var ^ xn+1 aproximadamente proporcional a 1=n e, portanto, tende para zero assimptoticamente (por outras palavras, uma quantidade pequena quando comparada com
2
n+1;n ).
8.11.3
2
t
2
n+h ;
(8.22)
2
t 1:
onde " tem distribuio desconhecida de mdia nula e varincia um. O algoritmo o
seguinte:
1. Estimar o modelo (8.22) e obter
u^t
^t
c^
^=
1 ^
!
^
1
^ = c^; ^ ; !
^; ^; ^
327
2. Simular o modelo
8
>
>
y = c^ + ^ yt 1 + ut
>
< t
u t = t "t
>
>
>
: 2=!
^ + ^u 2 + ^
t
(8.23)
2
t 1
t 1
2
0
Note-se que ^ = c^ ; ^ ; !
^ ;^ ;^
j = 1; :::; h:
onde q 2 e q1
j = 1; :::; h;
n
o
(1)
(2)
(B)
so os quantis empricos da amostra yn+j ; yn+j ; :::; yn+j :
6. Um intervalo de previso a (1
) 100% para
q 2 ; q1
onde agora q 2 e q1
2
n+j
n
o
2 (1)
2 (2)
2 (B)
so os quantis empricos da amostra ^ n+j ; ^ n+j ; :::; ^ n+j
:
328
8.12
Considere o modelo
yt =
2
E ut Ft
+ ut ;
t:
constante
Ou seja prope-se
yt = mt + vt ;
onde vt tomada como a v.a. residual. Nestas condies pode existir um efeito ARCH
esprio.
Para exemplificar, suponha-se que o verdadeiro processo
yt = c + yt
+ ut ;
ut RB Gaussiano N 0;
Por erro de especificao supe-se mt = c. Nestas condies existe um efeito ARCH esprio. O modelo considerado (erradamente)
yt = c + vt ;
vt = yt
+ ut
+ ut )2 =
2 2
yt 1
+ u2t + 2 yt 1 ut
(c + vt 1 )2 + u2t + 2 yt 1 ut
2 2
c +
2cvt
2 2
vt 1
+ u2t + 2 yt 1 ut :
= c1 + c2 vt
2 2
vt 1 :
Significa que vt exibe um efeito do tipo ARCH, apesar do modelo inicial ser condicionalmente homocedstico.
329
t.
Tem-se vt =
mt +ut : Como
+ ut ;
yt = mt + vt ;
e mt pertencem a Ft
e E (ut j Ft 1 ) = 0
vem
2
E vt Ft
Se E (u2t j Ft 1 ) =
stante, pois E (
Se E (u2t j Ft 1 ) =
= E (
= E (
= E (
mt )2 + 2 (
mt )2 Ft
mt ) ut + u2t Ft
+ E u2t Ft
mt )2 Ft
2
t
mt + ut )2 Ft
no constante.
=E (
mt )2 Ft
2
t:
Com efeito,
2
t:
onde Ft
1: Como
resultado a mdia condicional que especificamente envolve quase sempre erros de especificao. A existncia do efeito ARCH pode dever-se ou acentua-se na presena desses erros
de especificao. interessante observar Engle (1982): the ARCH regression model is an
approximation to a more complex regression which has no-ARCH disturbances. The ARCH
specification might then picking up the effect of variables omitted from the estimated model.
The existence of an ARCH effect would be interpreted as evidence of misspecification.
330
8.13
8.13.1
O modelo TAR tal como foi apresentado na seco 7.3 no apropriado para sries temporais financeiras, pois assume que a varincia condicional constante ao longo do tempo.
Podemos, no entanto, generalizar o TAR de forma a acomodar heterocedasticidade condicionada. Se admitirmos o caso mais geral em que o padro de heterocedasticidade se distingue consoante o regime, o modelo a considerar, com dois regimes e um desfasamento
(veja-se Gospodinov, 2005)
yt = (
onde ut =
2
t
t "t
10
11 yt 1 ) Ifqt
+(
21 yt 1 ) Ifqt
20
d>
+ ut :
(8.24)
= !1 +
2
1 ut 1
2
1 t 1
Ifqt
+ !2 +
2
2 ut 1
2
2 t 1
Ifqt
d>
g:
(8.25)
Aborda-se a seguir a estimao do modelo. Suponha-se que " um rudo branco Gaussiano.
Assim,
yt j Ft
onde
=(
(8.25). Seja
10
11 yt 1 ) Ifqt
+(
20
t;
2
t
21 yt 1 ) Ifqt
d>
2
t
verosimilhana vem
log Ln ( ; ) =
n
X
t=1
log f (yt j It ; ; ) =
log f (yt j Ft 1 ; ; )
1
log (2 )
2
Pn
t=1
1
log
2
2
t
( ; )
2
t
1
(yt
( ; )
( ; ))2 :
mantm-se, todavia: necessrio maximizar a funo em ordem aos parmetros. A estimao dos parmetros processa-se da seguinte forma:
331
Parmetro
c
Estimativa
0.0478
0.2332
!
0.0118
0.1111
0.8812
Log-Veros.= 11439:3
Erro Padro
0.0075
0.0112
0.0015
0.0073
0.0074
esse valor.
) (dado
) em ordem a ; seja ^n ( )
):
valor.
6. A estimativa para
, naturalmente, ^n (^ n ) :
= yt 1 : Seguiram-se
que maximiza a funo de log-verosimilhana log Ln ( ; )): A figura 8-16 mostra o valor
de log Ln como funo de
(observe-se que ^ n =
^ n estimado, obtiveram-se os resultados que constam da tabela 8.3. O primeiro regime modela os retornos quando estes esto em queda, mais precisamente, quando o retorno anterior
inferior a
:1718= (1
:0563) =
:182%.
Tendo em conta este valor, h tendncia para o processo sair do regime 1, mantendo, ainda
assim, uma rendibilidade negativa. Talvez o dado mais significativo a forte persistncia
da volatilidade neste regime, associada a valores altos de volatilidade (w1 > w2 ). Este
resultado est de acordo com os factos estilizados habitualmente observados em dados financeiros, segundo os quais, a volatilidade tende a ser superior quando as cotaes esto
332
Estimativa
-0.1718
10
0.0563
11
!1
0.0233
0.0982
1
0.9776
1
0.0426
20
0.2384
21
!2
0.0175
0.0733
2
0.8575
2
Log-Veros.= 11344:5
Erro Padro
0.0312
0.0310
0.0075
0.0097
0.0152
0.0099
0.0177
0.0024
0.0073
0.0093
8.13.2
Vimos na seco 7.4 que a separao das dinmicas do processo em estudo em dois ou mais
regimes permite, na maior parte dos casos, obter diferentes valores para
(veja-se o mod-
333
das sries financeiras. O caminho est assim indicado: necessrio admitir, em cada regime,
uma especificao dinmica para a volatilidade. Entendeu-se inicialmente (e.g. Hamilton)
que os modelos Markov-switching com efeitos GARCH eram intratveis e impossveis de
serem estimados, devido dependncia da varincia condicional de toda a trajectria passada
(em ltima anlise, a estrutura que se admitia para um Markov-Switching com N regimes
obrigaria posteriormente a expandir o nmero de regimes para N n sendo n o nmero de
observaes). Gray (1996) props um modelo que resolve a dependncia da varincia condicional de toda a trajectria passada.
O modelo MS+GARCH com dois regimes
8
< c +
1
yt =
: c +
2
onde
it
1 yt 1
1t "t
se St = 1
2 yt 2
2t "t
se St = 2
2
i ut 1
= !i +
2
t 1;
(8.26)
sendo
ut = yt
2
t
E (yt j Ft 1 ) ;
= Var (yt j Ft 1 ) :
2
it
(erro no perodo t
1 associado ao regime i) e de
2
it
depende ut
2
i;t 1 .
2
t 1:
Momentos de y
Determinem-se os momentos do processo. Seja
it
= E (yt j Ft 1 ; St = i) : No contexto
E (yt j Ft 1 ; St = 2) = c2 +
1 yt 1 ;
334
2 yt 1 :
Tem-se
= E (yt j Ft 1 )
= E (yt j Ft 1 ; St = 1) P (St = 1j Ft 1 )
+ E (yt j Ft 1 ; St = 2) P (St = 2j Ft 1 )
=
1t p1t
2t p1t :
E (yt j Ft 1 ) , portanto, a mdia ponderada dos valores esperados condicionais dos regimes
1 e 2. Por outro lado,
2
t
= Var ( yt j Ft 1 ) = E yt2 Ft
(E (yt j Ft 1 ))2
= E yt2 Ft 1 ; St = 2 P (St = 1j Ft 1 )
+ E yt2 Ft 1 ; St = 2 P (St = 2j Ft 1 )
=
8.A
2
1t
2
1t
p1t +
2
2t
2
2t
p2t
2
t
2
t:
Apresenta-se uma abordagem alternativa para analisar a ESO. A ideia tomar, num primeiro
passo, os valores esperados marginais como funo de t; e verificar depois em que condies
esses valores esperados no dependem de t: Considere-se o ARCH(1). Como se sabe neste
caso tem-se
2
E ut = ! +
| {z }
u2t 1 ;
| {z }
1E
= !+
t 1
1 t 1
i.e.
:
1
335
=!+
1 t 1;
t
t
=!+
1j
6=
!
1
Se j
1j
=!
<1)
t
t
1)
(1
1
=!
t
1 0
t
1)
(1
1
(Soluo)
t
1 0
1
!
; o processo ut assimptot-
icamente estacionrio (ou ESO se o processo teve incio num passado remoto). Em suma,
se
2
E ut =
!
1
1 ))
ento
0;
2
E ut
, 8t
e o processo ut ESO.
No caso ARCH(2), tem-se
2
t
2
1 ut 1
=!+
2
2 ut 2 ;
! > 0;
0: Assim,
2
t
2
1 ut 1
2
2 ut 2
=!+
2
E ut
Donde
2
E ut = ! +
| {z }
=!+
1L
u2t 1 +
| {z }
1E
t 1
1 t 1
u2t 2 ;
| {z }
i.e.
2E
t 2
2
2L
converge se as razes de (1
2 t 2
=!
1L
2
2L )
unitrio, i.e.,
1
Como
0;
< 1;
< 1;
1<
< 1:
336
< 1:
Nestas condies, se
2
E ut = ! +
1 (
!
1+
2)
2
E ut +
2
2
E ut ) E ut =
337
!
1
2)
Pgina em branco
338
Captulo 9
Modelao da Heterocedasticidade
Condicionada - Caso Multivariado
(ltima actualizao: 3/2011)
9.1
Introduo
Vimos no ponto 3.2.6 que muitas sries financeiras (por exemplo, ndices bolsistas ou cotaes de aces) apresentam co-movimentos de rendibilidade e volatilidade, isto , quando
a rendibilidade e a volatilidade de uma srie aumenta (diminui), a rendibilidade e a volatilidade das outras tende, em geral, a aumentar (diminuir).
A estimao destes co-movimentos de rendibilidade e volatilidade deve ser naturalmente
feita no quadro da estimao multivariada (por multivariada entendemos vrias equaes).
Esta anlise relevante, por exemplo, no mbito da seleco de portfolios, da gesto do risco,
etc. Permite tambm discutir questes do tipo:
como se transmite a volatilidade de um mercado aos demais mercados? qual a magnitude do impacto da volatilidade de um mercado sobre outro?
os mercados globais influenciam a volatilidade de outros mercados (regionais ou
nacionais) sem serem por eles influenciados (contagiados)?
A volatilidade de um activo transmite-se a outro directamente (atravs da sua varincia
condicional) ou indirectamente (atravs das covarincias condicionais)?
339
1t
+ u1t ;
:::
ymt =
onde
mt
+ umt
it
1
y1t
B
C
B . C
yt = B .. C ;
@
A
ymt
1t
B
B
=B
@
..
.
mt
C
C
C;
A
1
u1t
B
C
B . C
ut = B .. C :
@
A
umt
+ ut :
lado por um VARMA (vector ARMA, ou mesmo vector ARMAX). Tem-se um modelo de
heterocedasticidade condicional multivariado se ut um processo multiplicativo do tipo,
1=2
ut = Ht "t
onde "t um vector de v.a. i.i.d. (condicionalmente homocedstico) tal que
E ("t ) = 0;
dos elementos de Ht . Ht
1=2
matriz Ht
1=2
Ht
mensurvel
1=2
Ht
= Ht : A
1=2
= Ht Var ("t j Ft 1 ) Ht
|
{z
}
= Ht :
Var("t )=Im
9.2
Densidade e Verosimilhana
N (0; Im ) : Nestas
"t
N (0; Ht ) ) yt j Ft
N(
t ; Ht ) :
m=2
jHt j
1=2
exp
1
(yt
2
0
t)
Ht 1 (yt
t)
log Ln ( ) =
n
X
t=1
log f (yt j Ft 1 )
nm
log (2 )
2
nm
log (2 )
2
1X
(yt
2 t=1
1X
log jHt j
2 t=1
n
1X
(yt
2 t=1
n
0
t)
Ht 1 (yt
1X
log jHt ( )j
2 t=1
n
( ))0 Ht 1 ( ) (yt
t)
(9.1)
( ))
(a ltima equao destaca a dependncia face a ). No caso univariado (i.e. m = 1), vem
Ht =
2
t
e de Ht . A mdia
341
9.3
B
B
A = B a21 a22 a23
@
a31 a32 a33
C
C
C:
A
O operador vech selecciona os elementos abaixo da diagonal principal (elementos dentro dos
quadrados) e passa-os para um vector-coluna:
0
B
B
B
B
B
B
vech (A) = B
B
B
B
B
B
@
a11
C
C
C
C
C
C
C:
C
C
C
C
C
A
a21
a22
a31
a32
a33
Obviamente que no se perde informao com esta operao se A uma matriz (real)
simtrica, hiptese que doravante se assume, sempre que se empregar tal operador.
O modelo VECH (ou VEC) (Engle e Kroner, 1995) prope uma estrutura GARCH(p,q)
multivariada. No caso GARCH(1,1), a matriz Ht tal que
vech (Ht ) = w + A1 vech ut 1 u0t
+ B1 vech (Ht 1 ) :
(9.2)
h
B 11;t
B
vech (Ht ) = B h12;t
@
h22;t
0
B
B
+B
@
(h11;t :=
2
1t ;
ht;22 :=
2
2t ;
w
C B 11
C B
C = B w12
A @
w22
11
12
13
21
22
23
31
32
33
h12;t :=
C B
C B
C+B
A @
10
h
C B 11;t
CB
C B h12;t
A@
h22;t
t12 ).
11
12
13
21
22
23
32
33
31
1
1
1
10
u21;t 1
CB
CB
C B u1;t 1 u2;t
A@
u22;t 1
1
C
C
C
A
C
C
C
A
342
w12 +
2
23 u2;t 1
22 u1;t 1 u2;t 1
21 h11;t 1
22 h12;t 1
23 h22;t 1
(9.3)
ij;t
hij;t
=p
;
hii;t hjj;t
i; j = 1; :::; m:
de
A1 B1 )
w:
A principal vantagem do modelo VEC a sua grande flexibilidade, pois permite que
todos os elementos de Ht dependam de todos os produtos cruzados de vech ut 1 u0t
e de
indiferente identicar ij;t como as correlaes condicionais entre os retornos ou entre os erros, pois,
por definio, ij;t = Corr ( yit ; yjt j Ft 1 ) = Corr ( uit ; ujt j Ft 1 ) : J as correlaes marginais no so
necessariamente iguais, isto , em geral, tem-se Corr (yit ; yjt ) 6= Corr (uit ; ujt ).
2
Com efeito, pode-se provar que
E ( vech (Ht )j F0 ) = I+ (A1 + B1 ) + ::: + (A1 + B1 )
t
t 1
sendo vech (H1 ) 2 F0 ). Se (A1 + B1 ) ! 0 (quando t ! 1) ento E ( vech (Ht )j F0 ) converge para o
1
t
momento estacionrio E (vech (Ht )) = (I (A1 +B1 )) : Ora, (A1 + B1 ) ! 0 sse os valores prprios de
A1 + B1 so em mdulo menores do que 1.
3
Com efeito, note-se que A1 e B1 so matrizes quadradas de ordem m (m + 1) =2 e o vector w possui
2
m (m + 1) =2 elementos. Assim, o nmero total de elementos a estimar 2 (m (m + 1) =2) +m (m + 1) =2 =
(m (m + 1) =2) (1 + (m (m + 1))) :
343
m (m (m + 1) =2) (1 + (m (m + 1)))
2
21
3
78
4
210
Tabela 9.1: Nmero de parmetros a estimar no VEC
coeficientes de correlao superiores a um e/ou varincias negativas (i.e.
ij;t
> 1 ou
y1t
y2t
A=@
11
12
22
10
A@
y1;t
y2;t
A + H1=2 "t
onde
0
h
B 11;t
B
vech (Ht ) = B h12;t
@
h22;t
0
B
B
+B
@
10
0
0 13
C B
C B 11
CB
C B
C B
CB
C = B 0 C + B 0 0 0 CB
A @
A @
A@
w22
0 0 33
10
1 0
0
0
h
volt 1
11
C B 11;t 1 C B
CB
C B
0 0 0 C B h12;t 1 C + B
0
A@
A @
0 0 33
h22;t 1
0
u21;t 1
u1;t 1 u2;t
1
u22;t
1
C
C
C
A
C
C
C
A
^ 1t = :3132u^2
h
1t
(:0466)
^ 2t = 1:25
h
Assim,
B
^1 = B
A
B
@
7)
+ :1430y2t 1 ;
y^2t = :0753y2t
(:023)
+ :0466u^22t
(:0151)
10
(5:2 10
+ :0903u^22t
(:0195)
:3132 0 :0466
0
0 :0903
(:023)
^ 1t
+ :6053h
(:0459)
C
C
C;
A
+ :0254volt
(:0062)
^ 2t 1 ;
+ :897 h
(:0227)
B
^1 = B
B
B
@
h12;t = 0:
:6053 0
0 :897
1
C
C
C
A
^1 + B
^ 1 so f0:987; 0:918; 0g : Conclui-se: (1)
Os valores prprios (estimados) da matriz A
O comportamento do ndice DJ afecta significativamente o comportamento do PSI20, quer
em termos de rendimento quer em termos de volatilidade; (2) ganhos do DJ afectam favoravelmente o PSI20; (3) aumentos ou diminuies de volatilidade do DJ afectam no mesmo
sentido o PSI20; (4) os valores prprios respeitam a condio de ESO (note-se, todavia, que
esto sujeitos a variabilidade amostral). As concluses (1)-(3) so vlidas, naturalmente,
no muito curto prazo (um, dois dias). As possibilidades de ganho so muito reduzidas,
pois grande parte das variaes dos ndices no so explicadas (alta volatilidade). Como
nota final registe-se que a hiptese h12;t = 0 no realsta, pois implica que as correlaes
condicionais so zero. Ora a literatura mostra que as correlaes condicionais entre ndices
bolsistas quase sempre significativa.
345
9.4
Podem obter-se modelos VECH com menos parmetros impondo que as matrizes A1 e B1
sejam diagonais. Por exemplo, no caso m = 2; vem
0
h
B 11;t
B
vech (Ht ) = B h12;t
@
h22;t
0
w
C B 11
C B
C = B w12
A @
w22
0
B 11
B
+B 0
@
0
22
0
C B 11
C B
C+B 0
22
A @
0
0
10
1
0
h
C B 11;t 1 C
CB
C
0 C B h12;t 1 C
A@
A
h22;t 1
33
10
u21;t 1
CB
CB
0 C B u1;t 1 u2;t
A@
u22;t 1
33
1
C
C
C
A
+ b1 Ht
h11;t h12;t
h12;t h22;t
onde a11 =
A = @
11 ;
a12 =
w11 w12
A+@
a11 a12
1 0
A @
w12 w22
a12 a22
0
1 0
b
b
h
h
@ 11 12 A @ 11;t 1 12;t
b12 b22
h12;t 1 h22;t
22 ;
a22 =
33 ,
1
3
2
4
u22;t
A+
+ b11 h11;t
u1;t 1 u2;t
u1;t 1 u2;t
u21;t 1
e B = (bij )m
5
7
6
8
346
+ b12 h12;t
+ b22 h22;t 1 :
m
5
21
12
32
Diagonal VECH elimina a possibilidade de interaco entre as diferentes varincias e covarincias condicionais. Por outro lado, a matriz Ht ; por construo, no resulta definida
positiva. H vrias formas de ultrapassar este ltimo problema no mbito da especificao
Diagonal VECH. Uma possibilidade consiste em reespecificar o modelo na forma
Ht = !
~ 1 (~
! 1 )0 + ~
a1 (~
a1 )0 ut 1 u0t
~1 b
~1
com ! = !
~ 1 (~
! 1 )0 , a1 = ~
a1 (~
a1 )0 e b1 = b
~1 b
~1
+b
Ht
~ 1 so matrizes quadradas
e!
~ 1, ~
a1 e b
do modelo yt =
2
= ~ 1 : Desta forma
~2
0
0 + 1 xt + ut tm de ser positivos.
2
~ xt + ut e assumindo que
~2
0 =
1
0
ut 1 u0t
= diag (ut 1 ) ~
a1 (~
a1 )0 diag (ut 1 ) ,
) ui;t 1 uj;t
347
+ hij;t 1 :
h
B 11;t
B
B h12;t
@
h22;t
C B
C B
C=B
A @
0
0
10
CB
CB
C B u1;t 1 u2;t
A@
u22;t 1
u21;t 1
1 0
10
0 0
h
C B
C B 11;t
C B
CB
C+B 0
0 C B h12;t
A @
A@
0 0
h22;t
1
1
1
C
C
C:
A
Existe uma reduo dramtica do nmero de parmetros a estimar (passamos para apenas 1,
qualquer que seja o nmero de equaes do modelo).
9.5
Modelo BEKK
O modelo BEKK (devido a Baba, Engle, Kroner e Kraft; veja-se Engle et al. 1993) assegura
por construo que Ht definida positiva. No caso mais simples BEEK(1,1), a matriz de
varincias-covarincias condicionais igual a
Ht = W + A01 ut 1 u0t
onde W; A1 e B1 so matrizes de tipo m
A1 + B01 Ht 1 B1
definida positiva por construo pois W definida positiva e os demais termos esto expressos como formas quadrticas definidas positivas. No caso m = 2 tem-se
0
Ht = @
0
@
w11 w12
w12 w22
11
+@
12
21
22
A+
10 0
A @
11
12
21
22
u21;t 1
u1;t 1 u2;t
u1;t 1 u2;t 1
10 0
h
h
A @ 11;t 1 12;t
h12;t 1 h22;t
u22;t 1
1
1
10
A@
10
A@
11
12
21
22
11
12
21
22
1
A
A:
2 2
11 u1;t 1
11
2
11 h11;t 1
12 u1;t 1 u2;t 1
12
2
21 u2;t 1
11
11 12 h12;t 1
348
21 u1;t 1 u2;t 1
11 21 h12;t 1
12 21 h22;t 1 :
9.6
O modelo VEC sem restries (quase) impossvel de ser implementado. O modelo BEKK
envolve ainda muitos parmetros e a maximizao da funo de verosimilhana extremamente difcil para m moderadamente elevado. A hiptese de Bollerslev (1990) consiste em
admitir correlaes condicionais constantes (i.e. iguais s correlaes marginais):
Esta hiptese reduz significativamente o nmero de parmetros a estimar. Tem-se
ij
ij;t
hij;t
=q
2 2
it jt
) ht;ij =
349
ij
it jt :
ij;t
ij :
VEC
BEEK
m+5m2
m (m (m + 1) =2) (1 + (m (m + 1)))
2
21
3
78
11
24
Correl.Const.
3m + 21 m (m
7
12
1)
Ht
B
B
B
= B
B
B
@
B
B
B
= B
B
B
@
|
2
1t
12 1t 2t
12 1t 2t
2
2t
..
.
..
.
2t
..
{z
Dt
= Dt RDt :
2
it
..
..
.
2
mt
2m 2t mt
0
..
.
Supondo que
2m 2t mt
..
.
1m 1t mt
1t
1m 1t mt
= !i +
10
CB
CB
0 CB
CB
.. CB
. CB
A@
mt
2
i ui;t 1
C
C
C
C
C
C
A
12
1m
..
.
1
..
.
1m
2m
12
}|
2m
..
..
.
{z
R
2
i i;t 1 ;
10
CB
CB
CB
CB
CB
CB
A@
}|
cada elemento
1t
0
..
.
..
.
C
C
0 C
C
.. C
. C
A
2t
..
mt
{z
Dt
2
it
envolve 3 parmetros.
log Ln ( ) =
nm
log (2 )
2
1X
log jHt j
2 t=1
n
1X
(yt
2 t=1
n
t)
Ht 1 (yt
t) :
0
t)
Ht 1 (yt
t)
= (yt
0
t)
Dt 1 R 1 Dt 1 (yt
350
t)
= vt0 R 1 vt :
vt0 = (yt
Dt 1 =
y1t
y2t
1t
1t
ymt
2t
mt
mt
2t
Assim,
log Ln ( ) =
n
X
nm
log (2 )
2
t=1
1X 0 1
v R vt :
2 t=1 t
n
n
log jRj
2
log jDt j
Pn
t=1
vt vt0
n
X
t=1
n
log
2
log jDt j
1t
+ ::: +
mt ) ;
Pn
t=1
vt vt0
1X 0
v
2 t=1 t
n
Pn
t=1
vt0 vt
vt :
mentares do clculo matricial, a expresso da funo log-verosimilhana pode ainda apresentarse na forma simplificada:
log Ln ( ) = const:
n
X
log (
1t
+ ::: +
mt )
t=1
n
X
n
log
vt vt0 :
2
t=1
P
P
Note-se que j nt=1 vt vt0 j naturalmente o determinante de nt=1 vt vt0 : Nos modelos VEC e
BEEK, necessrio inverter a matriz Ht para cada t e para cada iterao do algoritmo de
maximizao. Esta dificuldade superada com o presente modelo. A principal desvantagem
do modelo em anlise o de assumir correlaes condicionais constantes.
9.7
Modelo DCC
O modelo DCC (Dynamic Conditional Correlation), devido a Engle (2002), uma extenso
do modelo de correlaes condicionais constantes (CCC).
No modelo de CCC a matriz de varincias-covarincias definida como Ht = Dt RDt ;
351
t ) (yt
t)
Dt 1 F t
= Dt 1 Ht Dt 1 = R:
Nos modelos VEC e BEKK (entre outros) a matriz E (vt vt0 j Ft 1 ) varivel ao longo
do tempo. Este resultado decorre das hipteses formuladas para Ht (, portanto, uma consequncia da forma como Ht especificada). No modelo DCC E (vt vt0 j Ft 1 ) tambm varivel, mas este resultado decorre directamente da forma como a matriz E (vt vt0 j Ft 1 ) parametrizada. A ideia consiste em propor um modelo para Rt = E (vt vt0 j Ft 1 ) : Considere-se
0
B
B
B
Rt = B
B
B
@
Como parametrizar ou modelar
1
12;t
..
.
1m;t
12;t
1
..
.
2m;t
1m;t
2m;t
..
..
.
C
C
C
C:
C
C
A
ij;t ?
** incompleto**
9.8
9.8.1
Modelo Triangular
Introduo e Formalizao do Modelo
Diz-se, nestes casos, que y2 no causa Granger y1 : Para concretizar, suponha-se que y1t
o retorno do NASDAQ e y2t o retorno do PSI20. Dadas as dimenses relativas dos
mercados, no faz sentido, supor-se que y1 (NASDAQ) dado todo o seu passado, possa ser
influenciado pelos valores atrasados de y2 (PSI20). Tambm em termos de volatilidade,
idntica conjectura pode ser estabelecida, i.e., a varincia de y1t condicionada em Fty1 1 no
depende dos valores passados de y2 ; Fty2 1 : No entanto, y2 (PSI20) dado Fty2 1 pode depender
352
y2
y3 onde y1
y2 no influencia y1 dado Fty1 1 : Suponha-se ainda que y segue um processo VAR(1) (vector
autoregressivo de ordem 1). Sob a hiptese y1
y2
seguinte representao:
0
y
B 1t
B
B y2t
@
y3t
c
C B 1 C B
C B
C B
C = B c2 C + B
A @
A @
c3
11
21
22
31
32
10
y
C B 1;t
CB
0 C B y2;t
A@
y3;t
33
1
1
1
u
C B 1t
C B
C + B u2t
A @
u3t
C
C
C:
A
(9.5)
A matriz dos coeficientes autoregressivos triangular, porque na mdia condicional y1;t apenas depende de y1;t 1 , y2t depende de y1;t
e y2;t
e y3;t 1 :
y2
1
C B
C B
C=B a
A @
b
} |
ut
0 0
10
e
CB 1t
CB
1 0 CB e2t
A@
c 1
e3t
{z
}| {z
onde se admite que (e1t ; e2t ; e3t ) so independentes entre si, e eit j Ft
!i +
2
i ei;t 1
2
i i;t 1 :
et
1
C
C
C
A
N (0;
2
it ) ;
2
it
dos choques idiossincrsicos da primeira equao. Por seu turno, u3t depende de e3t (efeitos
idiossincrsicos) e ainda dos choques idiossincrsicos da primeira e da segunda equao. A
volatilidade que decorre dos efeitos no idiossincrsicos designa-se de volatility spillover.
A designao modelo triangular agora bvia: a equao matricial (9.5) representa-se
na forma,
yt = c +
sendo
y2
yt
et
(9.6)
y3 ; se as matrizes
353
2
it
Tendo em conta
!1
B
B
+B
@
0
2
i ei;t 1
!2
0
2
i i;t 1 ;
C B
C B
0 C+B
A @
!3
2
1 1;t 1
0
0
B 1
B
+B 0
2
@
0 0
|
{z
B
0
0
C
C
0 C
A
3
= W + A et 1 e0t
B
B
B
@
} |
+B
2
1;t 1
0
2
3 e3;t 1
C
C
C
A
C
C
C
A
e1;t 1 e2;t
e22;t 1
e2;t 1 e3;t
{z
et
0
1 et 1
2
2;t 1
0
{z
t 1
t 1
e21;t 1
B
B
B e1;t 1 e2;t
@
e1;t 1 e3;t
|
1 0
2
3;t
2
2 e2;t 1
2
3 3;t 1
C
C
0 C:
A
2
2;t
2
2 2;t 1
tem-se
2
1 e1;t
!
0 0
B 1
C
B
C
= B 0 !2 0 C
@
A
0 0 !3
0
1
0 0
B 1
C
B
C
+B 0
C
0
2
@
A
0 0
3
{z
}
|
0
2
1;t
B
B
:= Var (et j Ft 1 ) = B 0
@
0
= !i +
B
B
= B 0
@
0
0
0
2
3;t 1
1
C
C
C
A
e1;t 1 e3;t
e2;t 1 e3;t
e23;t
1
C
C
C
A
i;
respectivamente.
354
t)
e Var ( ut j Ft 1 ) (= Ht ) comece-se
et ;
et =
ut ;
et e0t =
ut u0t
1 0
e, portanto,
Ht = Var (ut j Ft 1 ) = Var ( et j Ft 1 ) =
Desta ltima relao (i.e., Ht =
Ht =
A et 1 e0t
); sai
ut 1 u0t
(B
1 0
Var ( et j Ft 1 )
1
1 0
Ht (
t 1)
) : Em suma,
0
1
Esta ltima relao escreve Ht como funo dos termos ui;t 1 uj;t
Ht
1 0
e hij;t 1 : Expandindo
a expresso anterior e depois de clculos simples mas fastidiosos obtm-se, por exemplo,
h22;t = a2 ! 1 + ! 2 + a2 (
2a
2 u1;t 1 u2;t 1
2
2 ) u1;t 1
+ a2 (
2 ) h11;t 1
2a
2 h12;t 1
2 h22;t 1
10
2
1;t
10
2
i;t :
1 0 0
0
0
1 a b
B
CB
CB
C
B
CB
C
B
C
2
= B a 1 0 CB 0
0 CB 0 1 c C
2;t
@
A@
A@
A
2
b c 1
0
0
0
0
1
3;t
0
1
2
2
2
a 1;t
b 1;t
B 1;t
C
B
C
= B a 21;t a2 21;t + 22;t
C:
ab 21;t + c 22;t
@
A
2
2
2
2 2
2 2
2
b 1;t ab 1;t + c 2;t b 1;t + c 2;t + 3;t
355
(9.7)
12;t
13;t
23;t
= q
= q
a 2
q 1;t
2
a2 21;t +
1;t
q
2
b2
1;t
2
2;t
2
1;t
2
1;t
+ c2
=q
a2
2
2;t
2
3;t
2
2
1;t + c 2;t
q
2
2
b2 21;t + c2
1;t + 2;t
= q
a2
ab
1;t
2
1;t
=q
2
2;t
2
2;t
b
2
1;t
b2
1;t
2
2;t
+ c2
2
3;t
:
2
3;t
diag @@
x1
x2
11
AA = @
x1
x2
A;
~ Vec (Ht 1 )
+B
(9.8)
onde
~ = (
W
) Vec (W) ;
~ = (
A
~ = (
B
Como a equao (9.8) est basicamente na forma da equao (9.2) deduz-se que a condio
~ +B
~ sejam, em mde ESO do processo fut g estabelece que todos os valores prprios de A
~ +B
~ so f0; 0; 0; 0; 0; 0;
dulo, menores do que um. Pode-se provar que os valores prprios de A
1;
3;
3 g:
Logo, dado
i;
< 1; i = 1; 2; 3:
356
1+
9.8.2
Estimao
Considere a representao yt = c +
onde eit j Ft
yt
y1t = c1 +
11 y1;t 1
+ e1t
y2t = c2 +
21 y1;t 1
22 y2;t 1
+ ae1t + e2t
(9.10)
y3t = c3 +
31 y1;t 1
32 y2;t 1
33 y3;t 1
(9.11)
2
i ei;t 1
2
i i;t 1 :
2
it ) ;
N (0;
2
it
= !i +
(9.9)
0
t)
Ht 1 (yt
1
1
= u0t ( 0 )
ut
t
1 2
1
=
u
+
(u2t au1t )2
1t
2
2
t)
1t
(b
2
1t
2
3t
(u3t
j = log j j2 j
= log j j2 + log (j
= log
2t
+ log
ac) u1t
t j)
2
2t
357
ac) u1t
cu2t )2
tj
+ log
cu2t =
Tem-se assim,
(b
be1t
2
3t
ce2t :
2 2 2
1t 2t 3t
log Ln ( ) =
nm
log (2 )
2
nm
log (2 )
2
1X
2 t=1
n
2
3t
1
2
1t
(u3t
1X
log jHt j
2 t=1
1X
log
2 t=1
1X
2 t=1
n
u21t +
(b
=
|
+
|
|
1
2
1t
2
2t
2
1t
2
2t
+ log
0
t)
Ht 1 (yt
2
3t
+ log
(9.13)
cu2t )2
1X
log
2 t=1
t) :
(9.12)
au1t )2
(u2t
ac) u1t
(9.14)
nm
log (2 )
2
1X
(yt
2 t=1
u21t +
2
2t
2
1t
ae1t )2 +
(u2t
1X
log
2 t=1
{z
1
2
3t
(u3t
log Ln;1
1X
log
2 t=1
1X 1
(u2t
2 t=1 22t
{z
2
2t
ae1t )
log Ln;2
1X
log
2 t=1
1X 1
(u3t
2 t=1 23t
{z
2
3t
be1t
2
1t
be1t
2
3t
+ log
1X 1 2
u
2 t=1 21t 1t
nm
log (2 ) +
2
2
2t
+ log
!
}
ce2t )2
ce2t )2
!
}
!
}
log Ln;3
A decomposio log Ln ( ) = log Ln;1 +log Ln;2 +log Ln;3 ; mostra que a estimao pode
ser feita consistentemente de acordo com os passos acima indicados. A primeira parcela,
log Ln;1 ; s depende do vector
= (c1 ;
11 ; ! 1 ;
1;
0
1)
Estes parmetros so estimados de forma consistente e eficiente maximizando (apenas) log Ln;1
(trata-se, portanto, da estimao, pelos mtodos habituais, da equao (9.9)). A segunda
parcela, log Ln;2 ; depende do vector,
= (c2 ;
21 ;
22 ; ! 2 ;
358
2;
0
2 ; a)
e ainda de
1;
pode ser feita de forma consistente, mas no eficiente, substituindo os erros fe1t g por f^
e1t g :
A estimao consistente pois f^
e1t g baseiam-se no estimador consistente ^1 ; obtido no
primeiro passo. Claro que a maximizao de log Ln;2 corresponde estimao da equao
(9.10), pelos mtodos habituais ((com f^
e1t g em lugar de fe1t g). Este raciocnio aplica-se de
forma anloga a log Ln;3 .
Como nota final, observe-se que a estimao do modelo pode ser totalmente eficiente
se a maximizao de log Ln for simultnea (confiram-se as equaes (9.12)-(9.14)). Como
se sabe, o problema da maximizao de log Ln , entre outros, o dos valores iniciais dos
parmetros a estimar. Este problema mitigado no presente contexto: basta fornecer como
valores iniciais as estimativas obtidas na estimao em trs passos, acima apresentada.
9.8.3
Considere-se novamente
8
>
>
h = 21t
>
< 11;t
h22;t = a2 21t + 22t
>
>
>
: h = b2 2 + c 2 2 +
33;t
1t
2t
8
>
>
u = e1t
>
< 1t
;
u2t = ae1t + e2t
>
>
>
: u = be + ce + e
3t
1t
2t
3t
2
3t :
Observmos que u2t depende de e2t (efeitos idiossincrsicos) e ainda dos choques idiossincrsicos da primeira equao. Por seu turno, u3t depende de e3t (efeitos idiossincrsicos) e
ainda dos choques idiossincrsicos da primeira e da segunda equao. Como referimos, a
volatilidade que decorre dos efeitos no idiossincrsicos designa-se de volatility spillover.
Desta forma, existem efeitos de volatility spillover do mercado 1 para o mercado 2 se a 6= 0
e dos mercados 1 e 2 para o mercado 3 se b 6= 0 e c 6= 0:
Pode-se ainda obter informao sobre a evoluo da transmisso da volatilidade ao longo
do tempo atravs de rcios de volatilidade. Seja RVti;j a proporo da varincia do mercado
j que causada pelo efeito de volatility spillover do mercado i (efeito do mercado i para j;
i 7! j). Tem-se
a2 21t
;
h22;t
b2 21t
=
h33;t
RVt1;2 =
RVt1;3
359
RVt2;3 =
c2 22t
:
h33;t
Dependent Variable: R1
Method: ML - ARCH
Sample (adjusted): 6/01/1993 4/09/2009
Included observations: 4055 after adjustments
Variable
Coefficient
Std. Error
z-Statistic
Prob.
C
R1(-1)
0.052202
-0.017161
0.013247
0.017808
3.940658
-0.963644
0.0001
0.3352
6.546092
13.74617
181.7812
0.0000
0.0000
0.0000
Variance Equation
C
RESID(-1)^2
GARCH(-1)
0.007049
0.066257
0.929667
0.001077
0.004820
0.005114
Coefficient
Std. Error
z-Statistic
Prob.
C
R1(-1)
R2(-1)
RES1
0.052704
0.449084
-0.179191
0.552914
0.013123
0.019369
0.015456
0.015972
4.016235
23.18547
-11.59382
34.61746
0.0001
0.0000
0.0000
0.0000
3.367632
6.497201
84.55149
0.0008
0.0000
0.0000
Variance Equation
C
RESID(-1)^2
GARCH(-1)
0.009916
0.068232
0.923938
0.002944
0.010502
0.010928
9.8.4
Exemplo
Dependent Variable: R3
Method: ML - ARCH
Sample (adjusted): 6/01/1993 4/09/2009
Included observations: 4055 after adjustments
Variable
Coefficient
Std. Error
z-Statistic
Prob.
C
R1(-1)
R2(-1)
R3(-1)
RES1
RES2
0.043610
0.222423
-0.093210
0.143101
0.233364
0.406663
0.010837
0.010966
0.012230
0.016376
0.007759
0.008429
4.024173
20.28223
-7.621611
8.738563
30.07544
48.24352
0.0001
0.0000
0.0000
0.0000
0.0000
0.0000
9.681126
16.00381
76.60615
0.0000
0.0000
0.0000
Variance Equation
C
RESID(-1)^2
GARCH(-1)
0.027709
0.158430
0.815877
0.002862
0.009900
0.010650
^b2 ^ 2
1t
;
^h33;t
c^2 ^ 22t
;
^ 33;t
h
RV _U St RV _EUt :
RV _EUt = RVt2;3 =
RV _P Tt = 1
5
As principais crises financeiras no perodo em anlise so as seguintes: Recesso do Japo, 1991; Crise do
Mxico, 1994/1995; Bolha Dot.com, 2000; Crise de 2001 (ataque s Twin Towers); Crise da Argentina, 2002;
Crise do Subprime, 2007/2008.
361
.9
.8
.7
.6
.5
.4
.3
.2
.1
94
96
98
00
PT-EU
02
04
PT-US
06
08
EU-US
9.9
GARCH Ortogonal
1.0
0.8
0.6
0.4
0.2
0.0
94
96
98
00
02
RV_EU
04
RV_PT
06
08
RV_US
yit
E (yit )
(substituir E (yit ) e
B
B
B
yt =B
B
B
@
|
0
..
.
..
.
..
{z
0
..
.
m
10
x1t
CB
CB
CB x2t
CB
CB ..
CB .
A@
xmt
}| {z
xt
C
C
C
C=
C
C
A
}
xt :
1 e W de tipo m
m nas
seguintes condies:
xt = WPt
Pt P0t diagonal.
363
(9.15)
0
E (xt xt j Ft 1 )
0
0
E (WPt Pt W j Ft 1 )
W E (Pt P0t j Ft 1 ) W0
(P 2 j F )
0
B E t1 t 1
B
B
0
E (P2t2 j Ft 1 )
0
E (Pt Pt j Ft 1 ) = B
B
..
..
B
.
.
@
0
0
conhecem as matrizes
..
0
..
.
2
j Ft 1 )
E (Pmt
W E (Pt P0t j Ft 1 ) W0
C
C
C
C:
C
C
A
? Supondo que se
cias condicionais de Pit : No temos que nos preocupar com a modelao das covarincias
condicionais! Alm disso Cov (yt j Ft 1 ) definida positiva, por construo.
Obter a matriz W
Seja X a matriz das observaes estandardizadas, X =
n
de tipo
e
0
^ =X X:
V
n
V a matriz de correlaes de yt : Por exemplo, o elemento (1; 2) de V
x0 1 x
n
=
=
Pn
1 2
Considerar
x0 1 x
n
se os momentos E (y1t ), E (y2t ),
=
1
1
n
Pn
t=1
(y1t
y1 ) (y2t
^1 ^2
y2 )
forem desconhecidos.
364
iW i;
i = 1; :::; m
Compactamente
^
VW
=W
onde W =
X = PW0 , P = X (W0 )
= XW
tem-se
P0 P = W0 X0 XW
^
= nW0 VW
= nW0 W
= n :
Portanto, se W a matriz dos vectores prprios associada a V ento P0 P uma matriz
diagonal.
Passos:
1. Estandardizar Y e obter X: Estimar
0
B
B
B
=B
B
B
@
0
..
.
..
.
0
0
..
.
..
C
C
C
C;
C
C
A
Var (yit )
^ = X0 X=n.
2. Calcular V
^
3. Calcular os vector prprios (W) de V:
4. Obter P = XW.
5. Modelar separadamente as coluna de P atravs de um GARCH.
365
m) :
Cov (yt j Ft 1 ) =
(9.16)
Como
P=
::: P
366
tem-se
B
B
B
0
P P =B
B
B
@
P 1P
0
..
.
P 2P
..
.
0
..
.
...
P0 m P
C
C
C
C
C
C
A
i:
>
> :::
2;
1;
a segunda coluna de
etc.
Cov (yt j Ft 1 )
W E Pt (Pt )0 Ft
367
(W )0
0
E Pt (Pt ) Ft
0
(P 2 j F )
B E 1t t 1
B
B
0
E (P2t2 j Ft 1 )
=B
B
..
..
B
.
.
@
0
0
0
..
0
..
.
E (Ptk2 j Ft 1 )
C
C
C
C:
C
C
A
B
B
B
=B
B
B
@
0
..
.
..
.
..
0
..
.
m
C
C
C
C;
C
C
A
Var (yit )
^ = X0 X=n.
2. Calcular V
^ (ordenam-se os valores prprios
3. Calcular os valores prprios e vector prprios de V
por ordem descendente , i.e.
>
9.10
W E Pt (Pt )0 Ft
(W )0
Testes de Diagnstico
f"t g deve ser uma sucesso de vectores i.i.d., com matriz de varincias-covaricias (contempornea) dada por Im : Naturalmente que "t desconhecido, mas pode ser estimado da
368
seguinte forma
^ t 1=2 u
^
"t = H
^t :
^ t 1=2
^
"t o vector dos resduos estandardizados (e u
^ t o vector dos resduos). A matriz H
pode obter-se a partir da decomposio Cholesky, seguindo os seguintes passos. 1) Dado
^ t ; obter uma matriz triangular H
^ 1=2
H
t ; usando a decomposio de Cholesky, i.e., obter uma
0
^ 1=2
^t = H
^ 1=2
^ t1=2
matriz H
tal que H
H
t
t
Ht = 4
2
1t
12;t
12;t
2
2t
5=4
2
1t
t 1t 2t
t 1t 2t
2
2t
5:
1=2
Ht
1=2
Ht
1=2
0
p
1
2t
1t
=4
1=2
Ht
t 2t
2
t
5:
Ht ). Assim,
=4
1t
1t
pt
2
t
2t
p1
2
t
5:
^"1t
^"2t
5=4
1
^ 1t
^t
^ 1t
1 ^2t
0
^ 2t
p1
2
t
32
54
u^1t
u^2t
1=2
1=2
ut = In ). Desta
u
^ t vale
2
5=4
u
^1t
^ 1t
^ 2t
u
^2t
p
1 ^2t
u
^1t ^t
^ 1t
1 ^2t
5:
369
Segundo passo: teste F de nulidade de todos os parmetros com excepo do do termo independente. Se existir evidncia estatstica contra a hiptese nula, podemos suspeitar que
a matriz Ht no foi convenientemente modelada. Nos passos seguintes repete-se o procedimento, tomando sucessivamente ^"2i;t i = 2; :::; m como varivel dependente na regresso
auxiliar.
Naturalmente conveniente verificar tambm se ^
"t um rudo branco. O procedimento
anterior pode ser repetido substituindo os resduos estandardizados ao quadrado simplesmente pelos resduos estandardizados e eliminando os termos cruzados.
370
Captulo 10
Regresso No Paramtrica
(ltima actualizao: 1/2010. Preliminar e incompleto)
10.1
Introduo
***
10.2
10.2.1
Introduo
1X
Ifxi :xi =xg :
f^ (x) =
n t=1
n
1X
1X
Ifxt :j xt x j< 1 g =
I
h
2
n t=1
n t=1 fxt :
n
x
x
1
< th < 21
2
371
(x
(10.1)
Tem-se assim que f^ (x) representa a proporo de observaes por unidade relativa de frequencia. Naturalmente, podemos fazer variar h: Um valor maior implica um maior alisamento da estimativa (mais observaes so consideradas), diminuindo a variabilidade de f^:
Todavia, valores muitos altos de h podem distorcer a estimativa de f (x), na medida em que
podem entrar observaes muito afastadas de x; no traduzindo, portanto, o comportamento
local de f no ponto x:
Pode-se mostrar que
f^ (x) dx = 1:
x) = F (x) =
f (u) du
1
A respectiva fdp
F (x + h)
h!0
h
F (x)
ou, equivalentemente,
f (x) = lim
F (x + h=2)
h!0
= lim
h=2)
h
h=2 < X < x + h=2)
h
X x
1
<2
h
h
P (x
h!0
= lim
F (x
h!0
Dada esta definio de f (x) ; imediato concluir que uma estimativa da ltima expresso
1
n
Pn
t=1
Ifxt :j xt x j< 1 g
h
2
h
que exactamente a expresso obtida em (10.1). Esta estimativa pode tambm ser escrita da
seguinte forma
1 X
f^ (x) =
K
nh t=1
n
372
xt
x
h
onde
8
<
1
se 1 < u < 1
1
2
K (u) = Ifu:juj<1g =
: 0 caso contrrio.
2
A funo K (u) ; designada por kernel (ou ncleo) uma funo densidade de probabilidade
(Uniforme). Resulta que outros kernels, com baseados em funes densidade de probabilidade, podem tambm ser usados. Por exemplo,
1
1 2
u
kernel Gaussiano
K (u) = p exp
2
2
1
K (u) =
Ifu:juj<1g kernel Uniforme,
2
15
K (u) =
1 u2 Ifu:juj<1g .
16
10.2.2
Propriedades
2t
C1 e
1t
R
R
A2 K uma funo simtrica em torno de zero, K (u) du = 1; uK (u) du = 0;
R 2
R
u K (u) du = 2K ; K 2 (u) du < 1; jxj K (x) ! 0 quando jxj ! 1; sup jK (x)j <
1
p 5=2
nh ! 0 quando n ! 1:
Assumam-se as hipteses A1-A4.
= f (x) +
= O
1
nh
373
h2 f 00 (x)
2
:
2
K
+ O h4
Note-se que O (h4 ) representa um termo de ordem h4 ou inferior. Por outras palavras,
O (h4 ) proporcional ou menos do que proporcional a h4 ; podendo ser, por exemplo, 2h4 :
Obviamente limh!0 O (h4 ) = 0 e limh!0 O (h4 ) =h4 uma constante.
p
Proposio 10.2.2 Tem-se f^ (x) ! f (x) :
= f (x)
n!1
= 0;
n!1
p
R
nhf^ (x) ! f (x) K 2 (u) du
nh f^ (x)
E f^ (x)
!N
0; f (x)
K 2 (u) du
10.2.3
f (x)
!N
0; f (x)
K 2 (u) du
Escolha de h
do que zero tendo em conta que h ! 0: Por outro lado, como nh = n1+ ! 1,
respeitar a relao 1 +
deve
p 5=2
nh = n1=2 (n )5=2 = n1=2 n5
=2
= n(1+5
)=2
!0
1<
<
1=5:
seleco. Existem vrios propostos na literatura, mas focaremos apenas o Mean Integrated
Squared Error:
M ISE (h) = E
f^ (x)
f (x)
dx :
f (x)2 ;
mas existe um inconveniente: queremos que f^ (x) seja uma boa estimativa para todos os
valores de x que a varivel X pode assumir, e no apenas para um x particular. Por isso
integramos o erro quadrtico no domnio ou espao de estados de X:
Fazendo a troca do operador de valor esperado com o do integral, considerando os valores
aproximados de E f^ (x) e Var f^ (x) e notando que
E f^ (x)
E f^ (x)
R
f (x) K 2 (u) du h4 (f 00 (x))2
+
=
nh
4
tem-se
Z
K 2 (u) du h4 (f 00 (x))2
+
M ISE (h) =
nh
4
R 2
Z
K (u) du h4 4K
2
=
+
(f 00 (x)) dx:
nh
4
f (x)
4
K
dx
K 2 (u) du h4 4K
+
nh
4
(f 00 (x)) dx
hopt =
4
K
K 2 (u) du
(f 00 (x))2 dx
!1=5
1=5
4
K
ainda de f 00 (x) que desconhecido. Este valor pode ser estimado no parametricamente.
Uma alternativa mais simples consiste em assumir que f (x)
N( ;
) (vrios estudos
indicam que esta escolha relativamente robusta desde que a verdadeira densidade no seja
bimodal ou excessivamente assimtrica). Com estas simplificaes obtm-se
^ opt = 1:06^ n
h
375
1=5
4
K
10.2.4
(xt ) + ut
ut =
(xt ) "t
(xt )
a varincia condicional. Os momentos condicionais dependem apenas de xt ( naturalmente possvel generalizar). Para simplificar admitiremos que xt = yt
generalizar). O problema de estimao o dos momentos condicionais
semelhana da estimao de f (x) ; a estimao de
estima-se
(x) (e
(mas possvel
(x) e
(x) :
e repete-se o procedimentos para outros pontos x e assim obtemos uma ideia do comportamento de
(x) :
Taylor de
(xt ) =
@ 2 (x ) (xt x)2
x) +
@x2
2
onde x um valor entre xt e x: Desta forma yt pode ser representado pela expresso
yt =
@ (x)
(x) +
(xt
@x0
@ 2 (x ) (xt x)2
+ ut :
x) +
@x2
2
@ (x)
@ 2 (x ) (xt x)2
=
(x) +
+ ut
(xt x) +
@x0
@x2
2
= c + x + (xt x1 ) + 0 + ut
= c + xt + u t :
Se
que se encontram perto de x: Em alternativa, pode-se usar todas as observaes mas damos
mais peso s observaes que se encontram perto de x:
Trade-off na estimao de
(x) :
no considerar todas as observaes ou no dar peso significativo a parte das observaes acarreta um custo: aumento da varincia do estimador.
considerar demasiadas observaes, diminui a varincia do estimador mas aumenta o
erro de aproximao R i.e. aumenta o enviesamento do estimador.
O peso a dar s observaes controlado pelo kernel K (u) : Seja x 2 R. Como atribuir
mais ou menos peso s observaes xt ?
1
K
h
xt
x
h
1 1
p exp
=
0:1 2
1
2
u 1
:01
@ (x)
@x0
(xt
x) + R (xt ; x) + ut e
377
2.0
1.5
1.0
0.5
-4
-3
-2
-1
1 p1
0:2 2
Figura 10-1:
exp
1
2
u 1 2
0:2
2.0
1.5
1.0
0.5
-4
-3
-2
-1
Figura 10-2:
1 p1
1 2
exp
378
1
2
u 1 2
1
assim,
^ N W (x; h) = c^ = arg min
c
wt = h1 K
xt x
h
n
X
c)2 wt
(yt
t=2
: Resolvendo obtm-se
Pn
K
c^ = Pt=2
n
t=2 K
Aproximao linear:
xt x
h
xt x
h
yt
Considera-se a aproximao
@ (x)
(xt x) + et
@x0
= c + c1 (xt x) + et
yt =
(x) +
f^
c; c^1 g = arg min
fc;c1 g
n
X
(yt
c1 (xt
x))2 wt
t=2
Notando que
n
X
=
=
(yt
t=im +1
n
X
t=im +1
n
X
(yt
c1 (xt
c
1=2
yt wt
c1 (xt
1=2
cwt
x))2 wt
1=2
x)) wt
1=2
c1 w t
(xt
x)
t=im +1
o problema de optimizao pode ser encarado como um problema de estimao OLS relativamente seguinte especificao:
1=2
yt wt
1=2
= cwt
1=2
+ c1 w t
(xt
x) + errot
379
1=2
yt wt ; wt
(xt1
x1 ) ; etc:
x) + errot
c^
c^1
Z0 (x) W (x; h) y
onde
2
1
6
6 ..
Z (x) = 6 .
4
1
2
y
6 2
6 .
y = 6 ..
4
yn
x2
x
..
.
xn
3
3
7
7
7
5
7
7
7
5
1 0
Z0 (x) W (x; h) y:
Z0 (x) W (x; h) y
(n 2) :
yt ; por exem-
plo,
yt j xt = x) =
E( \
1 0
Z0 (x) W (x; h) y
Propriedades
Vamos considerar primeiro o caso em que xt i.i.d., por ser mais fcil tratar.
2
(xt )
h2
(x)) =
(x) +
( 00 (x) f (x) + 2f 0 (x)
2f (x)
Z
2
1
(x)
1
(x)) =
K 2 (u) du + o
nh f (x)
nh
(x))
2
K
+ o h2
Proposio 10.2.7
h2 00
(x) +
(x) 2K + o h2
E (^ (x)) =
2
2
(x) 2
1
:
Var (^ (x)) =
K +o
nhf (x)
nh
Proposio 10.2.8
p
^ N W (x) !
p
^ (x) !
(x)
(x)
E (^ N W (x))) ! N
381
<1e
2
0;
K (u)2+ du < 1
R
(x) K 2 (u) du
f (x)
K 2 (u) du
nh (^ N W (x)
0;
N W (x)) ! N
f (x)
R 2
2
p
(x) K (u) du
d
nh (^ (x)
(x)) ! N 0;
f (x)
d
(x)
10.2.5
10.A
Demonstraes
E f^ (x)
= E
= E
Z
=
Z
=
Z
=
Z
=
Z
=
xt
x
h
xt x
1
K
(devido a A1)
h
h
x
1
K
f ( )d
h
h
1
K (u) f (uh + x) hdu (mudana de varivel
h
x
h
= u)
K (u) f (uh + x) du
h2 u2 00
f (x) + ::: du (invocando a frmula de Taylor)
K (u) f (x) + huf (x) +
2
Z
Z
h2 u2 00
0
K (u) f (x) du + K (u) huf (x) du + K (u)
f (x) du + :::
2
Z
h2 f 00 (x)
K (u) u2 du + :::
= f (x) +
2
h2 f 00 (x) 2K
= f (x) +
+ O h4
2
0
K (u) uk du so zero
quando k mpar. O termo O (h4 ) inclui todos os restantes termos so de ordem igual ou
inferior a h4 no seguinte sentido limh!0 O (h4 ) =h4 = constante.
382
Var f^ (x)
= Var
1
=
Var
n2
xt
x
h
1X
K
h t=1
n
xt
x
h
1
Var (w1 + w2 + ::: + wn ) (com wt = h 1 K ((xt
2
n
n
2 XX
1 X
Var
(w
)
+
Cov (wi ; wj )
=
t
n2 t=1
n2
1
2X
=
Var (wt ) +
1
n
n t=1
n 1
t
n
x) =h)
1
K
h
xt
h
xt x
h
1
Var K
h2
#
"
2
1
x
x
x
x
t
t
2
E K
E K
h2
h
h
#
"Z
Z
2
1
x
x
f ( )d
K
f ( )d
K2
h2
h
h
"Z
#
Z
2
1
K 2 (u) f (hu + x) hdu
K (u) f (hu + x) hdu
h2
Z
1
h2 u2 00
2
0
K
(u)
f
(x)
+
huf
(x)
+
f (x) + ::: hdu
h2
2
Z
2
1
h2 u2 00
0
K (u) f (x) + huf (x) +
f (x) + ::: hdu
h2
2
Z
Z
1
2
K (u) f (x) du + K 2 (u) uf 0 (x) du + :::
h
Z
Z
2
K (u) f (x) du + K (u) huf 0 (x) du + :::
Z
f (x)
K 2 (u) du + O (1)
h
(note-se que o termo de ordem O (1) definido na ltima equao inclui todos os demais
termos no presentes na equao e que so relativamente pequenos em comparao com
R
f (x) h 1 K 2 (u) du quando n grande e h pequeno).
P
Analise-se n2 nt=11 1 nt Cov (w1 ; wt+1 ). Notando que Cov (w1 ; wt+1 ) = t Var (w1 ) ;
383
2X
jCov (w1 ; wt+1 )j =
1
n t=1
n 1
t
n
t
n
j t j Var (w1 )
2 Var (w1 ) X
=
1
n
t=1
n 1
Var (w1 )
n
n 1
X
t
n
j tj
t
n
t=1
C2 e
Var (w1 )
=
O (1)
n
1
= O
(pois Var (w1 ) = O
nh
2t
1
h
(devido a A1)
).
Desta forma,
1
2X
=
1
Var (wt ) +
n
n t=1
Z
f (x)
=
K 2 (u) du + O
nh
n 1
Var f^ (x)
t
n
1
nh
Seja
2h
p1
h
n 1
X
t
n
n
X
384
t
n
J1;n
tem-se
t=1
+2h
Para 1
t=1
t
n
n 1
X
t=
n +1
t
Cov (w1 ; wt+1 )
n
{z
}
J2;n
E jw1 wt+1 j
xt+1 x
x1 x 1
K
= E K
h
h
h
Z
xt+1 x
1
x1 x
K
f1;t+1 (xt ; xt+1 ) dxt dxt+1
=
K
2
h
h
h
Z
=
K (u) K (u + v) f1;t+1 (x; x) dudv + O (h)
= O (1) :
Assim
J1;n
n
X
n)
= O (h
n)
=O
t=1
Para t >
h
p
h
=O
h = o (1) :
Var (w1 )
Z
f (x)
K 2 (u) du + O (1)
t
h
Z
t
f (x) K 2 (u) du + O (h) :
h
t
=
=
Assim,
n 1
X
J2;n = 2h
t=
n +1
n 1
X
t=
n +1
! 0
Pn
t=
1
n +1
t
n
Pn
t=
t
n
= 2 f (x)
pois
t
n
f (x)
K (u) du + O (h)
n 1
X
t=
1
n +1
K 2 (u) du + O (h)
n +1
! 0 quando n ! 1 e
385
t
n
! 1:
Seja
xt x
:
h
Tem-se
yt =
(x) +
(x) (xt
(x) + h 0 (x)
00
x) +
00
t+
(x )
(x )
h2
2
x)2
(xt
2
2
t
+ ut
+ ut :
Pn
K ( t ) yt
(x) = Pt=2
n
K ( t)
Pn t=2
K ( t ) yt
= Pt=2
n
t=2 K ( t )
P
(nh) 1 nt=2 K ( t )
=
(nh)
=
Pn
t=2
K ( t)
(x) + h 0 (x) t +
P
(nh) 1 nt=2 K ( t )
(x) + h 0 (x)
00
(x ) h 2 t + ut
00
(x ) h 2 t + ut
f^ (x)
1 Pn
0
(nh)
t=2 K ( t ) h (x) t
t=2 K ( t ) (x) + (nh)
=
+
f^ (x)
P
P
2 2
(nh) 1 nt=2 K ( t ) 00 (x ) h 2 t + (nh) 1 nt=2 K ( t ) ut
+
f^ (x)
1 Pn
(x) 1 X
(x) +
K ( t)
f^ (x) n t=2
0
(x ) 1 X
+
K ( t)
t
2f^ (x) n t=2
h
00
2
t
1 X
+
K ( t ) ut :
f^ (x) nh t=2
1
E ( ^ N W (x)j x1 ; :::; xn ) =
(x) 1 X
(x) +
K ( t)
f^ (x) n t=2
0
386
(x ) 1 X
+
K ( t)
t
2f^ (x) n t=2
h
00
2
t:
(x) +
(x)
h2
h2 2K
(
2f (x)
h2 2K
(x) +
(
2f (x)
(x) +
2 0
Kf
(x)
+ o h2
f (x)
00
00
(x ) f (x) + 2f 0 (x)
00
0
0
h2
(x )
2
2
t
2
Kf
(x)
+ o h2
f (x)
(x)) + o h2
(x)) + o h2 :
n
1 X 2
(x)j x1 ; :::; xn ) =
K ( t)
f^2 (x) n2 h2 t=2
(xt ) :
Dado que o segundo termo da expresso Var (^ N W (x)) = E (Var ( ^ N W (x)j x1 ; :::; xn )) +
Var (E ( ^ N W (x)j x1 ; :::; xn )) zero, vem
Var (^ N W (x)) = E (Var ( ^ N W (x)j x1 ; :::; xn ))
n
1
1
1 X 2
=
K ( t)
E ^2
nh
f (x) nh t=2
1 X 2
K ( t)
f^2 (x) nh t=2
1
=
E
nh
1
K ( t)
h
(xt )
Z
1
=
K2
h
Z
=
K 2 (u)
=
(x) f (x)
1 2
K ( t)
2
f^ (x) h
x
h
( )f ( )d =
K 2 (u) du + o (h) :
387
(xt )
1
=
E
nh
(xt )
(xt )
K 2 (u)
(x + uh) f (x + uh) du
Desta forma,
Var (^ N W
!
1 2
K ( t ) 2 (xt )
2
^
h
f (x)
Z
2
1
(x)
1
=
:
K 2 (u) du + o
nh f (x)
nh
1
(x)) =
E
nh
388
Parte III
Aplicaes
389
Pgina em branco
390
Captulo 11
Eficincia do Mercado de Capitais
(ltima actualizao: Maio/2010)
11.1
Introduo e Definies
O mercado de capitais diz-se eficiente se os preos dos produtos financeiros reflectirem toda
a informao disponvel. Quando libertada uma informao relevante (por exemplo, um
anncio de distribuio de dividendos de valor superior ao esperado, um anncio de fuses
ou aquisies, etc.) num mercado eficiente os agentes reagem imediatamente comprando ou
vendendo de acordo com a informao e os preos ajustam-se imediatamente.
Num mercado eficiente, supe-se que os agentes interpretam correctamente a informao. Caso contrrio o preo pode no se ajustar rapidamente e abrem-se oportunidades
para a realizao de rendibilidades anormais. Por exemplo, um investidor que compre imediatamente aces aps a divulgao de uma boa notcia pode obter um retorno anormal
se o preo de mercado se ajustar lentamente informao disponvel. Com efeito, bastar ao
investidor vender as aces depois do preo se ajustar a um nvel mais alto.
difcil imaginar um mercado completamente eficiente em todos os perodos de tempo.
Pode suceder que em certos momentos e face a determinadas notcias o mercado apresente
ineficincias que podem ser exploradas. Faz tambm sentido admitir que existem mercados
mais eficientes do que outros (mercados emergentes tendem a ser menos eficientes).
A eficincia dos mercados est intimamente relacionada com a informao disponvel.
Fama (1970) props trs formas de eficincia consoante a natureza da informao disponvel:
um mercado eficiente na forma fraca se os preos dos ttulos reflectirem toda a informao sobre os preos passados; como consequncia, as cotaes passadas no podem
391
previsvel se xt
O vector xt
pode incluir rt
nanceiras (treasury bill rates, bonds returns, dividend yield (dividendo por aco/cotao),
price-earning ratios (cotao/lucro), etc.) ou variveis macroeconmicas (produto, inflao,
etc.).
11.2
> 0 constante. Se o
para
(11.1)
Note-se que E (rt ) representa a previso de rt no baseada em qualquer informao especfica, a no ser nas caractersticas gerais do processo. Pelo contrrio, se
E (rt j Ft 1 ) 6= E (rt )
ento, a informao disponvel Ft
+ ut
sendo fut g um processo rudo branco ou, em termos mais gerais, uma diferena de martingala. Esta formalizao implica (11.1) e ainda que log Pt uma martingala,
E (log Pt j Ft 1 ) = log Pt 1 :
1
+ ut
uma vez que Pt , neste modelo, no limitado em probabilidade. Isto significa que pode assumir valores
negativos com probabilidade um quando t tende para 1: De facto, prova-se que Pt visita os estados 1 e
+1 infinitas vezes quando t ! 1: Como os preos no podem ser negativos, por definio, o preo no pode
ser um passeio aleatrio.
393
Esta formalizao contra intuitiva pois assume que o valor esperado do retorno zero
(E (rt ) = 0) e, portanto, que o prmio de risco negativo. Todavia, se o retorno for convenientemente ajustado ao risco, a propriedade de martingala deve verificar-se (vejam-se as
referncias em Campbell et al., 1997, pg. 31).
Um modelo mais natural e compatvel com (11.1) o modelo de passeio aleatrio com
deriva (positiva),
log Pt = c + log Pt
Considerando rt = log Pt
+ ut ;
c > 0:
11.2.1
Testes de Autocorrelao
Ento
E (rt ) =
c
1
E (rt j Ft 1 ) = c + rt
= 0 atravs da estatstica
Q = n (n + 2)
m
X
k=1
1
n
^2k !
2
(m)
394
11.2.2
Uma forma popular entre traders and financial professionals de definir regras de compra e
venda assenta na chamada anlise tcnica. A anlise tcnica baseia-se num conjunto de
indicadores estatsticos gerados pelo mercado, tais como preos e volume, visando estabelecer regras de compra e venda de activos cotados em bolsa2 . A generalidade dos indicadores
procura detectar tendncias de subida ou descida das cotaes. Analisam-se trs regras de
compra e venda (provavelmente as mais utilizadas e conhecidas, mas existem muitas outras regras) e discutem-se procedimentos economtricos destinados a aferir a qualidade das
regras. A previsibilidade associada s regras de compra e venda no significa necessariamente ineficincia de mercado. Para argumentar que um mercado ineficiente necessrio
demonstrar que a regra de investimento seleccionada superior a um porfolio de referncia.
Regra Mdia Mvel
Seja
Mt (k) =
Pt + P t
+ ::: + Pt
k
k+1
5e
projectar uma tendncia futura de P: Mais concretamente, se Mt (c) > Mt (l) ; os preos
mais recentes esto mais altos do que os preos mais antigos. Isto sugere que os preos
seguem uma tendncia positiva. A regra prescreve uma compra para o perodo t + 1: Se as
duas mdias so aproximadamente iguais, a tendncia futura sobre os preos no clara, e
neste caso no h lugar a compra ou venda. Esta regra pode ser melhorada, estabelecendo um
sinal de compra ou venda apenas quando a diferena entre Mt (c) e Mt (l) for significativa,
digamos acima de um certo limiar B (bandwidth): Assim, as regras de compra e venda para
2
A abordagem fundamental analysis, ao contrrio, estabele regras de compra e venda com base em factores
financeiros e econmicos. Por exemplo, analisam-se variveis financeiras (treasury bill rates, bonds returns,
dividend yield (dividendo por aco/cotao), price-earning ratios (cotao/lucro), etc.) ou macroeconmicas
(produto, inflao, etc.).
395
NASDAQ composite
2380
2280
2180
2080
1980
MM curta
1880
MM longa
1780
Jan-05
Mar-05
May-05
Jul-05
Sep-05
Nov-05
Jan-06
comprar = 1, vender = 0
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
Jan-05
Mar-05
May-05
Jul-05
Sep-05
Nov-05
Jan-06
Figura 11-1: Regra Mdia Mvel - Aplicao ao NASDAQ composite Jan-05 a Mar-06
o dia t + 1, passariam a ser: comprar se Mt (c) > Mt (l) + B; vender se Mt (c) < Mt (l)
e no transaccionar se jMt (c)
Mt (l)j
B:
Na figura 11-1 ilustra-se a regra mdia mvel ao NASDAQ composite (Jan-05 a Mar06). Fixou-se c = 10 e l = 50: Em princpio deveriamos escolher um valor de c entre 1 e
5; todavia, a escolha c = 10 permite identificar melhor graficamente a mdia mvel Mt (10)
(com c
Regra Canal
semelhana da regra mdia mvel, tambm esta regra se baseia numa hiptese sobre a
evoluo futura da tendncia dos preos. Antev-se uma subida ou descida dos preos com
base na comparao entre o valor actual do preo Pt e o valor mnimo ou mximo atingido
pelos preos nos ltimos L dias. Sejam,
mt
L) ;
Mt
L)
respectivamente os valores mnimo e mximo atingidos pelos preos nos ltimos L dias. A
ideia a seguinte: se no dia t houve uma indicao de compra e Pt significativamente
396
t+1
Comprar
t
Comprar
Vender
Neutro
Vender
Pt > (1 + B) mt
Pt > (1 + B) Mt
Pt > (1 + B) Mt
Pt < (1
Pt < (1
Pt < (1
1
1
1
Neutro
B) mt
B) Mt
B) mt
1
1
1
outros casos
outros casos
outros casos
Mar-05
May-05
Jul-05
Sep-05
Nov-05
Jan-06
comprar = 1, vender = 0
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
Jan-05
Mar-05
May-05
Jul-05
Sep-05
Nov-05
Jan-06
deve ser de compra; de igual forma, se no dia t houve uma indicao de venda e Pt significativamente inferior a Mt
397
t+1
t
Comprar
Vender
Neutro
Comprar
t+1;t
t+1;t
t+1;t
>0
>B
>B
Vender
t+1;t
t+1;t
t+1;t
< B
<0
< B
Neutro
outros casos
outros casos
outros casos
t+1;t
ARMA. Na tabela 11.2 definem-se as regras de compra e venda. A posio (1,1) na tabela
11.2, estabelece o seguinte: se no perodo t houve uma indicao de compra e
t+1;t
> 0
ento antecipa-se uma tendncia de subida dos preos e a indicao de compra para o
perodo t + 1 . A posio (2,1) estabelece o seguinte: se no perodo t houve uma indicao
de venda e
t+1;t
compra apenas se a previso do retorno for suficientemente alta, digamos, acima de B > 0:
Se
t+1;t
> 0 mas
t+1;t
de compra dado que no perodo anterior o dia foi de venda e, nestas circunstncias, o dia
considerado neutro, isto , no h lugar a venda ou compra. As demais clulas interpretam-se
de forma similar.
O parmetro B pode ser estimado com base na informao passada: selecciona-se o valor
que maximiza o lucro.
Medidas de Previsibilidade
Embora as duas primeiras regras atrs apresentadas envolvam preos, as medidas de previsibilidade, por exigirem a aplicao do teorema do limite central e a lei dos grandes
nmeros, so construdas a partir dos retornos, dado que estes so (em princpio) processos estacionrios.
Considere-se um certa regra de compra e venda e defina-se, C o conjunto dos ndices t
onde h um sinal de compra para o perodo seguinte, t + 1; e V o conjunto dos ndices t onde
h um sinal de venda para o perodo seguinte, t + 1. Por exemplo, se nos dias 3, 7 e 9 h
sinais de compra para os respectivos perodos seguintes, e nos dias 6 e 11 h sinais de venda
para os perodos seguintes ento, C = f3; 7; 9g e V = f6; 11g : Seja nC o cardinal de C; nV
398
1 X
rt+1
nC t2C
1 X
rt+1
nV t2V
rV
^C
nC
(11.2)
^ 2V
nV
na regresso
rt =
1 It 1;C
2 It 1;N
+ ut
(11.3)
(com erros padro robustos) onde It;C e It;N so variveis dummies; It;C assume o valor 1
quando no perodo t houve uma indicao de compra e It;N que assume o valor 1 quando no
399
perodo t houve uma indicao neutra. O chamado grupo base consiste na indicao de
venda. Da equao (11.3) tem-se
E (rt+1 j t 2 C) =
e, portanto, se
1;
E (rt+1 j t 2 V ) =
>0
= 0 vs.
> 0:
11.3
Pelo contrrio, se
E (rt j It 1 ) 6= E (rt )
ento, a informao disponvel It relevante para prever os retornos futuros. Nestas circunstncias, existe alguma informao sobre a tendncia provvel de rt ; e ser possvel, em
princpio, obter rentabilidades anormais, usando a informao disponvel It .
Existem inmeros procedimentos e conjuntos de informao It usados para testar a eficincia (semi-forte) de mercado. A literatura tem estudado (entre muitos outros) os seguintes
tpicos:
Efeito do tamanho da empresa. A questo : apresentaro as empresas pequenas, em
termos da sua capitalizao de mercado, rendibilidades mdias superiores s empresas
grandes, com nvel de risco semelhante?
Reaco do mercado chegada de informao. Este tpico importante na anlise da
eficincia e analisado em detalhe na seco 11.3.1.
400
+ ut :
11.3.1
Se o mercado totalmente eficiente os activos respondem imediatamente chegada de informao relevante ao mercado. A informao relevante poder ser informao especfica
sobre a empresa, como por exemplo, o anncio de lucros ou dividendos, o anncio de fuses
e aquisies, etc. Poder tambm ser o anncio de medidas de poltica econmica ou outros
eventos que tenham impacto sobre a rendibilidades dos activos financeiros.
401
rat;i = rt;i
PN
i=1
rat;i
s2t
PN
i=1
(rat;i rat )2
;
N 1
d; :::; 1; 0; 1; :::d:
Suponha-se que divulgada uma notcia boa, como por exemplo, um anncio de dividendos acima do esperado. Se as rendibilidades anormais se concentram em t = 0 no
podemos rejeitar a hiptese de o mercado ser eficiente. Pelo contrrio, se existirem rendibilidades anormais apenas para t > 0 podero existir indcios de ineficincia, sobretudo se t
medido em dias. Em geral prefervel usarem-se dados intra-dirios, por exemplo, perodos
de 5, 10 ou 15 minutos.
possvel aprofundar a anlise construindo uma sucesso frat g para todas as obser402
na regresso,
rat =
1 I0;t
2 I1;t
+ ut :
onde I0;t e I1;t so variveis dummies. I0;t assume o valor 1 quando t corresponde data de
anncio e I1;t assume o valor 1 quando t corresponde a uma data imediatamente a seguir
data de anncio . Se
1 I0;t
2 I1;t
3 rm;t
+ ut :
(11.4)
do anncio sobre a empresa ou ao efeito do mercado sobre a empresa induzido pelo anncio. Pode haver outra razo para introduzir rm;t : Suponha-se que os anncios coincidem
com movimentos de alta do mercado. Se rm;t no est no modelo os anncios no podem
distinguir-se dos movimentos de alta.
403
Pgina em branco
404
Captulo 12
Seleco de Portfolios
(ltima actualizao: 2/2010)
Vai analisar-se o problema da determinao dos pesos ptimos de uma carteira constituda por m activos com risco e um activo sem risco por parte de um investidor individual.
Os resultados principais devem-se a Markowitz (prmio Nobel 1990), James Tobin (prmio
Nobel 1981) e William Sharpe (prmio Nobel 1990). O objectivo deste captulo consiste em
apresentar a teoria bsica e ilustrar o problema da determinao dos pesos ptimos a partir
de momentos marginais e condicionais da distribuio dos retornos.
Os modelos de heterocedastiocidade multivariada so particularmente teis quando os
pesos ptimos se baseiam em momentos condicionais.
12.1
12.1.1
Para alm das hipteses anteriores suponha-se que no existe o activo sem risco, i.e., todos
os activos envolvem risco.
Estabelea-se a seguinte notao:
vector dos retornos: rt = (R1t ; :::; Rmt )0 ;
vector do valor esperado dos retornos:
Pm
i=1
! i Rit = ! 0 rt
Pm
i=1
2
p
coluna de 1s. Para simplificar, assume-se que todos os activos envolvem risco e que alguns
pesos ! i (mas no todos) podem ser negativos. Na teoria financeira um peso pode ser negativo quando h lugar a uma venda a descoberto ou short selling1 . Esta hiptese simplifica o
problema de optimizao.
Em condies normais, qualquer investidor procura dois objectivos antagnicos: maximizar o lucro (ou valor do retorno) e minimizar o risco. Os objectivos so contraditrios
porque, em geral, os activos com maior (menor) retorno (em mdia) so os que possuem
maior (menor) variabilidade. Para conciliar estes objectivos, pode-se, por exemplo, (i) fixar
um valor para o retorno esperado do portfolio e, para esse valor, procurar os activos com a
menor variabilidade possvel; ou (ii) fixar um valor para o risco do portfolio (varincia) e,
depois, procurar os activos com o maior retorno esperado possvel.
1
Venda a descoberto ocorre quando se vende um activo financeiro ou derivado que no se possui, esperando
que o preo caia para depois compr-lo e lucrar na transao. O mecanismo o seguinte: o agente A pede
(digamos) uma aco a B e promete-lhe todo o rendimento subjacente ao ttulo. A vende imediatamente a
aco a C; mais tarde, A compra no mercado a aco para a devolver a B. Se o preo da aco cair, esta
operao vantajosa para A.
406
(12.1)
L (!) = ! 0 H! +
(
!0
(1
! 0 1)
= g+ p h
(12.2)
onde
g=
=
H 1 1;
H 11
=
h= H
H 1 1;
= 10 H 1 1;
valor para
= Vp
= ! 0 H! :
Pm
i=1
! i = 1:
A funo ! 0 H! estritamente convexa se H for uma matriz definida positiva (hiptese pacfica). As
funes 1 p ! 0
e 2 (1 ! 0 1) so convexas por serem lineares (funes lineares so, por definio,
cncavas e convexas).
2
407
p.
Desta forma
partir dos valores observados. Supondo que frt g um processo estacionrio fracamente
dependente,
r
B 1 C
B .. C
^ =B . C;
@
A
rm
h i
^ ij
^
H= h
i;j=1;::;m
ri ) (rjt
rj ) :
Exemplo 12.1.1 Considere-se um portfolio constitudo pelas aces A1, A2 e A3. Vai ser
tomada uma deciso de investimento no valor de 1 milho de Euros. A questo : quanto
comprar de cada um desses activos? Com base em observaes dirias suponha-se que se
obtm3 :
5:22
B
C
B
C
^ = B 6:05 C
@
A
5:98
0:176
B
C
C
^ =B
!
^ (5:85) = g
^+ p h
B 0:104 C :
@
A
0:720
3
Estimativas baseadas nos retornos dos ndices SP500, DowJones e PSI20, no perodo 04/01/199304/09/2009.
408
0:176
0:104
1:549
0:9534
0:465
10
0:176
B
CB
C
B
CB
C
B 0:9534 2:093 1:0416 C B 0:104 C = 1:03:
@
A@
A
0:465 1:0416 1:265
0:720
0:72
p;
p;
p
p
e, aspode
varincias mnimas:
p
Vp
..
.
..
.
5:85
..
.
1:03
..
.
6:05
1:32
q
O grfico definido pelos pares ordenados
Vp
onde
torno associado varincia mnima de todos os portfolios designa-se por fronteira eficiente.
q
Na figura 12-1 traam-se todos os pontos
Vp p ; p : O ponto A representa o par
p
ordenado
Vp ( min ); min onde Vp ( min ) o valor da varincia mnima de todos os
portfolios e
min
dada pelo segmento AB. O ponto C no faz parte da fronteira eficiente, pois existe um
ponto D com igual varincia mas retorno esperado superior. Assim, s os pontos sobre a
curva AB so relevantes para o investidor e, por isso, no grfico definido pelos pares ordeq
nados
Vp p ; p s interessam os pontos onde p maior ou igual ao valor da ordeq
nada do ponto A. O investidor deve agora decidir qual o par
Vp p ; p sobre a curva
AB que mais lhe interessa, tendo em conta a sua maior ou menor averso ao risco. Se for
q
averso ao risco tender a escolher um par
Vp p ; p mais prximo do ponto A; se tiver
maior apetncia pelo risco tender a escolher uma soluo mais prxima do ponto B. Contin409
g+ p h H g+ p h ;
q
c0 + c1
=
+ c2
2;
p
d (! 0 H! )
= 0;
d p
cuja soluo
min
g0 Hh
:
h0 Hg
410
(g0 Hh)2
h0 Hh
0
min ) = g Hg
min
= 5:63 e Vp (
min )
0:919:
12.1.2
O porfolio inclui agora o activo sem risco (por exemplo, obrigaes e os ttulos do Tesouro4 ).
Tem rendibilidade certa
(e, por isso, tem varincia e covarincias nulas com os demais ac-
8
< min ! 0 H!
!i
: s.a ! 0 + (1 ! 0 1)
! 0 1)
f:
O problema de optimizao
p:
f1
p
0
=c
f
1
f1
= ! 0 H! = c
!;
! Hc
!=H
f1
! =c
2
p
! 0 H!:
Nesta formulao a composio da carteira dos activos com risco fixa, dado
quer que seja o valor
dade c
p.
f;
qual-
: Por exemplo, suponha-se que se tem dois activos com risco e ! = (0:3; 0:6)0 :
f,
Naturalmente, em condies normais, o estado no entra em falncia. No h portanto risco de incumprimento. Mas preciso notar que as obrigaes e os ttulos do Tesouro tm o risco da taxa de juro (risco da taxa
de juro subir e do preo dos ttulos descer).
411
nao linear de um portfolio constitudo apenas por activos de risco e o activo sem risco.
Este portfolio, constitudo apenas por activos de risco, designa-se por tangency portfolio. Os
pesos deste portfolio no podero ser exactamente dados por ! dado que os pesos ! 0i s no
somam um. Assim defina-se
!
! T = Pm
i=1
!i
!
:
!01
Note-se agora que a soma dos pesos do vector ! T somam um e ! = ! T ! 0 1: Podemos assim
escrever
! =c
! =c
! 0 1! T = a! T ;
a=c
! 0 1:
O retorno do portfolio pode ser escrito como uma combinao linear entre o retorno do
tangency portfolio,
=!
+ (1
! 0 1)
= a! 0T
f:
+ (1 a)
=a
+ (1
a)
f:
Por seu lado a varincia do portfolio pode tambm ser escrita em funo de ! T :
Vp
= ! 0 H! = a! 0T Ha! T = a2 ! 0T H! T = a2
=a
2
T
T
p;
j deduzidas, tem-se
p;
= a
T;a T
+ (1
a)
e, substituindo o valor de a em
espao
p;
=a
=a
)a=
+ (1
a)
p
T
f;
+ s p;
s=
b representa
T;
+ s p. O
e c representa
Figura 12-2: Fronteira Eficiente de um Portfolio com Activo Sem Risco (Recta)
12.2
recente. Desta forma os peso ! i podem variar ao longo do tempo, e as decises de investimento podem ajustar-se de acordo com as condies de mercado. Mas a percepo de que
as condies de mercado se alteram ao longo do tempo exige uma abordagem diferente.
Uma deciso de investimento tomada no momento t 1; resulta da avaliao das condies
de mercado e, em geral, da informao disponvel no momento t
no perodo t
413
disponvel at ao momento t
determinao dos pesos ptimos usando momentos condicionais assenta na ideia de que o
portfolio pode ajustar-se continuamente ao longo do tempo em funo das condies de mercado. Esta abordagem tem ainda a vantagem de contornar as criticas que se fazem s duas
primeiras hipteses definidas na seco anterior (os retornos seguem uma distribuio marginal normal multivariada, e as correlaes entre os retornos so fixas ao longo do tempo).
Como se sabe, no quadro de um modelo baseado em momentos condicionais variveis, no
s a distribuio marginal no (em condies muito gerais) normal, como tambm as correlaes (condicionais) podem ser variveis ao longo do tempo.
Na formulao que a seguir apresentaremos, a deciso de investimento tomada no momento t
1:
Pm
i=1
! it Rit = ! 0t rt
p;t :
!t = !t
p;t
414
= gt +
p;t ht
onde
gt =
t
t
1
0
t Ht 1;
Ht 1 1
t
Ht 1 ;
1
0
t Ht
ht =
t;
Ht 1
t
t
Ht 1 1
= 10t Ht 1 1;
2
t;
t t
Pesos ptimos de um portfolio com o activo sem risco, dado um determinado nvel de
retorno
p;t :
!
c
f1
p;t
0
p;t
Ht
p;
=c
p;t
+ st
f1
p;t
!t;
! t = Ht 1
f1
st =
T;t
T;t
e Ht .
e Ht so desconhecidos. necessrio
415
Pgina em branco
416
Captulo 13
Risco de Mercado e o Valor em Risco
(ltima actualizao: 2/2011)
13.1
Introduo
Em resposta aos desastres financeiros ocorridos no passado recente, a gesto do risco sofreu
uma revoluo nos ltimos anos. O valor em risco ou Value at Risk (VaR) iniciou essa
revoluo e tem ganho reconhecimento como medida fundamental na anlise e na gesto do
risco de mercado das instituies financeiras. Presentemente, muitas instituies reportam
medidas de risco relacionadas com o VaR para o pblico em geral e, em certos casos, tambm
para agncias reguladoras. Por exemplo, os bancos comerciais esto sujeitos a requisitos
mnimos de capital para cobrirem o seu risco de crdito e de mercado. O Acordo Basilia II
estabelece taxas de segurana baseadas em modelos VaR.
A literatura financeira enumera vrios tipos de risco, como por exemplo, risco de mercado, risco de crdito, risco de liquidez, risco operacional (associado ao risco de fraude,
erros de transaco e de apreamento, etc.) e risco sistmico (associado, por exemplo, a
situaes de incumprimento devido a reaces em cadeia). Neste captulo aborda-se o risco
de mercado, isto , o risco associado s variaes (inesperadas) de preos e taxas e algumas
metodologias de mensurao desse risco.
Para introduzir o VaR instrutivo, em primeiro lugar, pensar-se em anlise de cenrios.
Neste tipo de anlise, formulam-se vrios resultados possveis de acordo com a informao
disponvel e, quando tal possvel, atribuem-se probabilidades aos diversos cenrios. Em
geral, d-se especial ateno aos piores cenrios pois so estes que maior impacto tm sobre
o funcionamento normal da organizao.
417
Para avaliar os piores cenrios, podemos comear por formular a questo: Qual a
perda mxima que a organizao pode sofrer num certo perodo de tempo?. A resposta
no particularmente informativa, pois a perda mxima significa perder tudo (com probabilidade praticamente nula). Se reformularmos ligeiramente a questo, obtemos a medida VaR: Quanto que podemos perder com probabilidade
de tempo?. Impe-se que
os eventos que embora raros podem ocorrer e afectar o funcionamento normal da organizao. VaR portanto a perda que pode ocorrer num lapso de tempo determinado, com
certa probabilidade , supondo que o portfolio no gerido durante o perodo de anlise.
Em termos probabilsticos, o VaR o quantil de ordem
terica de ganhos e perdas. Para concretizar, seja
Vn+h := Vn+h
Vn a variao do
valor do capital investido no gerido durante o horizonte de risco de h dias. Por exemplo, considere-se a compra de 200,000 aces
Pn = 5 Euros. O investimento de Vn = 5
que no momento n + h o preo do ttulo passa para Pn+h = 5:5 Euros. A variao do capital de
Rn+h = (Pn+h
Pn ) =Pn = 0:1: importante notar que o retorno pode tambm ser obtido
1:
O VaR a 100 % baseado na distribuio marginal de ganhos e perdas o valor VaR tal
que
P ( Vn+h <
V aR) = :
Por seu turno, o VaR a 100 % baseado na distribuio condicional o valor VaR tal que
P ( Vn+h <
V aRj Fn ) = :
O quantil de ordem < 0:05 da distribuio de ganhos e perdas um valor negativo. Para que o VaR
represente efectivamente uma perda, considera-se esse quantil em valor absoluto.
2
Seguimos a notao anglo-saxnica: a vrgula separa os milhares.
3
Este facto relevante, pelo seguinte. Como iremos ver mais frente uma das abordagens possveis ao VaR
consiste em modelar parametricamente o processo f Vt g : Ora este processo quase sempre no estacionrio.
Para confirmar este facto, veja-se a figura 6-9, no ponto 6.3.2, onde se exibe uma trajectria tpica de Vt .
Desta forma, usando a relao Rn+h = Vn+h =Vn ; pode-se modelar Vn+h via retornos, que geralmente
um processo estacionrio.
418
e, portanto,
pode ser escrita como V aRn;n+h; : A estimao do VaR envolve princpios e procedimentos
at certo ponto similares com a da previso de
13.2
Abordagem No Paramtrica
Seja
Vn+1 =
Vn+1
Vn = Rn+1 Vn
Vn
419
P ( Vn+1 <
ou, equivalentemente,
Resulta V aRn;n+1; =
V aRn;n+1; j Fn ) =
V aRn;n+1;
<
Fn
=
Vn
P Rn+1 < q R Fn =
P (Rn+1 Vn <
Rn+1
:
da distribuio de Rn+1 dado
Fn :
Se assumirmos
P Rn+1 < q R Fn = P Rn+1 < q R
o VaR pode estimado a partir da expresso
V[
aRn;n+1; =
onde q~R o quantil emprico de ordem
q~R Vn
Vn+h
Vn = Rn+h (h) Vn
Vn
V aRn;n+h; j Fn ) =
Na literatura existem diferentes frmulas para calcular o quantil emprico de ordem : Usaremos a seguinte
conveno: o quantil emprico q~R corresponde estatstica de ordem [n ] ; sendo [x] o inteiro de x: Por
exemplo, na amostra de dimenso n = 6; f1; 4; 2; 7; 15; 0g , as estatsticas de ordem so: y(1) = 0; y(2) = 1;
y(3) = 2; y(4) = 4; y(5) = 7; y(6) = 15: O quantil de ordem = 0:9 a estatstica de ordem [0:9 6] = 5;
isto , y(5) = 7.
420
q R Vn : Se assumirmos
q~R Vn
Naturalmente, o VaR pode ser obtido a partir directamente da distribuio emprica das
variaes de capital f Vn+h ; n = 1; 2; :::g : Neste caso viria V[
aRn;n+h; =
o quantil emprico de ordem
q~
; onde q~
Se a anlise incide sobre um portfolio linear, na construo da srie histrica dos retornos
Rp;t = ! 1 R1;t + ! 2 R2;t + ::: + ! n Rn;t ;
onde ! i so os pesos do capital investido no activo i (
manecer fixos durante todo o perodo histrico.
Pn
i=1
A abordagem no paramtrica embora tenha a vantagem de ser simples, sofre dos seguinte
problemas:
Embora a distribuio no esteja especificada (por isso mesmo que o procedimento
se designa por no paramtrico) assume-se (incorrectamente) que a distribuio relevante para obter o VaR a distribuio marginal de Rn+h e no a distribuio condicional. Mas o VaR est associado a uma previso dos retornos dada (obviamente) a
informao disponvel Fn e, por isso, a distribuio condicional que nos interessa.
Assim, mesmo que no perodo n se registe, por exemplo, alta volatilidade e perdas
acentuadas, essa informao negligenciada para obter o VaR.
421
Quando
preciso. A justificao terica dada pelo seguinte resultado assimpttico. Suponhase que fXt ; t = 1; :::; ng uma sucesso de variveis i.i.d. com funo distribuio
F e funo densidade de probabilidade f e seja q = inf fx : F (x)
g : O quantil
q ) !N
0;
(1
)
2
(f (q ))
muito alto, perto de 1). Em suma, a varincia do quantil emprico alta nas abas e
baixa no centro da distribuio.
At onde coligir os dados? Considerar todo o passado disponvel? Ou s o passado recente? Esta questo mais relevante neste procedimento do que em outros,
pois a metodologia exposta atribui o mesmo peso a todas as observaes. Normalmente considera-se o passado recente pois dados muito antigos podem no reflectir
a dinmica do processo no presente e no futuro imediato (ser relevante atribuir importncia ao crash de 1929-31 para obter o VaR num futuro prximo?). Por outro lado,
tambm no convm definir janelas de observaes muitas curtas pois a eficincia do
estimador do quantil de ordem
muito baixo. Vrios estudos indicam como razovel considerar-se os ltimos dois
ou trs anos de observaes.
13.3
Abordagem Paramtrica
Vn+1
Vn = Rn+1 Vn ' rn+1 Vn :
Vn
Esta expresso mostra que a distribuio condicional de rn+1 Vn apenas depende da distribuio de rn+1 (no momento n; Vn conhecido). Podemos assim concentrar-nos apenas sobre a distribuio de rn+1 : Assuma-se rn+1 j Fn
422
n+1 ;
2
n+1
onde D uma
Tem-se
V aRn;n+1; j Fn ) =
P ( Vn+1 <
P
2
n:
e varincia
V aRn;n+1;
Vn
rn+1 <
Fn
= :
rn+1
n+1
n+1
vem
P
Zn+1 <
V aRn;n+1;
Vn
n+1
V aR
Vn
n+1
n+1
(q Z o quantil de ordem
= q Z ) V aRn;n+1; =
n+1
Fn
n+1
+ qZ
(13.1)
n+1
Vn
(13.2)
Vn+h
Vn
Vn
(rn+1 + rn+2 + ::: + rn+h ) Vn ; rn+i = log (Pn+i =Pn+i 1 )
= rn+h (h) Vn :
No por mero acaso que se passa de
de
Vn+h igual a
Rn+h (h) Vn (onde Rn+h (h) so os retornos discretos multi-perodos). O problema com esta
relao decorre do facto da distribuio de Rn+h (h) ser geralmente difcil de tratar.
Para determinar V aRn;n+h; considera-se
P (rn+h (h) Vn <
P
V aRn;n+h; j Fn ) =
V aRn;n+h;
Fn
=
Vn
423
V aRn;n+h;
Vn
E (rn+h (h)j Fn )
p
Var (rn+h j Fn )
Zn+h <
Conclui-se
Fn
= :
V aRn;n+h;
Vn
) V aRn;n+h; =
E (rn+h (h)j Fn )
p
= qZ
Var ( rn+h (h)j Fn )
p
E (rn+h (h)j Fn ) + q Z Var (rn+h (h)j Fn ) Vn
(13.3)
13.3.1
+ ut ;
N (0;
(13.4)
2
) : Assim, rn+1
N( ;
) : No caso
+ qZ
Vn
na expresso (13.1) tem distribuio N (0; 1)). No caso h > 1 necessrio deduzir-se
a distribuio condicional de rn+h (h). Como, por hiptese, rn+h (h) no depende Fn ; a
distribuio condicional coincide com a distribuio marginal. Pelas propriedades habituais
da distribuio normal vem rn+h (h) = rn+1 + rn+2 + ::: + rn+h
N (h ; h 2 ) : Assim,
Admitindo que faz sentido a estandardizazo. Veremos que no caso geral a distribuio de Wn+h
desconhecida.
424
= 0 deduz-se V aRn;n+h; =
13.3.2
h +
h q Z Vn :
hV aRn;n+1;
Modelo RiskMetrics
As hipteses de normalidade e varincia condicional constante, assumidas no modelo anterior, so, como se sabe, bastante limitativas. Um modelo relativamente simples, mas
assumindo varincia condicional no constante corresponde ao modelo RiskMetrics desenvolvido pela J.P. Morgan para o clculo do VaR. A metodologia baseia-se no modelo EWMA
(equao (8.7)):
rt =
2
t
t "t ;
= (1
) rt2
2
t 1
onde f"t g um rudo branco de mdia nula e varincia 1. O modelo assenta na hiptese
IGARCH(1,1) com termo constante nulo, ! = 0; e mdia condicional nula,
= 0. Para
obter V aRn;n+h; aplica-se uma vez mais a frmula (13.3). Para o efeito estude-se a distribuio condicional de rn+h (h) : Comece-se por verificar que
E (rn+i j Fn ) = 0;
2
n+i
2
n
Fn =
= E
= h
2
n:
425
Fn + ::: + E
2
n+h
Fn
V aRn;n+h; =
onde q Z o quantil de ordem
p
Vn
da distribuio N (0; 1) :
13.3.3
Modelo ARMA-GARCH
Assuma-se agora
(L) rt =
ut =
(L) ut
t "t ;
ut
GARCH:
A distribuio de rn+h (h)j Fn geralmente desconhecida. Mesmo no caso em que rn+1 j Fn tem
distribuio normal, rn+i j Fn para i = 2; 3; ::: no tem distibuio normal. Relembre-se que, sob certas
condies, a distribuio de rn+i j Fn quando i ! +1 converge para a distribuio marginal que geralmente
diferente da distribuio condicional. Pode-se mostrar que a funo de distribuio de rn+h (h)j Fn
Fn;h (x) =
rn (h) x
1)
h
Y1
i=1
f ( rn+i j Fn+i
1 ) drn+1 :::drn+h :
Esta expresso s conhecida no caso h = 1. Para h > 1 a expresso anterior intratvel. Neste caso a
fdp rn+h (h)j Fn pode considerar-se desconhecida (Tsay (2001), cap.7 conclui erradamente que "n Normal
) rn+h (h)j Fn Normal). Apesar destas observaes, podemos assumir
rn+h (h)j Fn
426
Tal como no caso anterior, temos de obter a distribuio de rn+h (h)j Fn : Tem-se
E (rn+h (h)j Fn ) =
onde
n+i;n
n+1;n
+ ::: +
n+h;n
disponvel no momento n: Para obter Var (rn+h (h)j Fn ) comece-se por observar que
Var ( rn+h (h)j Fn ) = E
n+1;n
+ ::: +
2
n+h;n
Fn
(13.5)
en (h) =
0 un+h
1 un+h 1
+ ::: +
h 1 un+1
h 1
X
j un+h j :
j=0
Como
en (1) = un+1 ;
en (2) = un+2 +
1 un+1 ;
:::;
en (h) = un+h +
1 un+h 1
+ ::: +
h 1 un+1
resulta
en (1) + ::: + en (h) = un+1 + (un+2 +
1 un+1 )
+ ::: +
h 1
X
j un+h j
j=0
= un+h + (1 +
1 ) un+h 1
+ ::: +
h 1
X
j=0
un+1 :
427
(13.6)
V aRn;n+h; =
p
Var (rn+h (h)j Fn ) Vn
onde E (rn+h (h)j Fn ) e Var (rn+h (h)j Fn ) so dados pelas expresses (13.5) e (13.6).
Exemplo 13.3.1 Considere-se o modelo
rt =
2
t
=!+
k 1
1)
t "t ;
2
1 rt 1
2
1 t 1:
!
1
+(
2
1 rn
2
1 n
(un = rn )
resulta
Var ( rn+h (h)j Fn ) = Var (un+h j Fn ) + Var ( un+h 1 j Fn ) + ::: + Var ( un+1 j Fn )
h
X
2
=
n+k;n
=
k=1
h
X
!
1
k=1
+(
k 1
1)
2
1 rn
2
1 n
h
1)
1
2
1 rn
h!
2
1 n
Tem-se
rn+h (h)j Fn
V aRn;n+h; =
qZ
1
1
h!
2
1 rn
2
1 n)
1)
Vn :
VaR
0.15
0.10
0.05
0.00
0
10
Figura 13-1: Value at Risk como funo de h. V aRn+h;n;0:01 trao grosso; V aRn+h;n;0:05
trao fino.
Dependent Variable: retornos do Dow JOnes
Method: ML - ARCH
Included observations: 28317 after adjusting endpoints
Coefficient
Std. Error
z-Statistic
Prob.
0.000416
4.54E-05
9.155216
0.0000
22.67097
67.38911
587.6203
0.0000
0.0000
0.0000
Variance Equation
C
ARCH(1)
GARCH(1)
1.17E-06
0.085080
0.905903
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
-0.000450
-0.000556
0.010756
3.275823
94026.27
5.17E-08
0.001263
0.001542
0.000188
0.010753
-6.640694
-6.639529
1.921149
0:0101, ^ 2n = 0:00014:
Sabe-se que rn =
onde u^n = rn
para
c^ =
= 0:01 e para
1
1
^1
0:0101
^ 1 u^2n + ^ 1
h^
!
^1 + ^1
2
n
0:000416 =
= 0:05 em funo de h.
+ ut ;
= ! + u2t 1 Ifut
429
ut =
1 <0g
t "t
2
t 1:
(13.8)
(13.9)
Tem-se,
E (rn+h (h)j Fn ) =
n+1;n
+ ::: +
n+h;n :
n+h;n
=c
1
1
yn :
Assim,
1
1
c
+
E (rn+h (h)j Fn ) =
1
yn ( 1 + )
=
1
yn + ::: + c
1
h
1+
+ c h (1
h
h
)+
2
n+h;n
(L) =
(confira-se (13.6)).
1
p
(L) = 1+ L+:::+
1+
( 1 + )2
Por outro lado, para calcular Var ( rn+h (h)j Fn ) necessrio obter
Como se sabe,
yn
Lk +
2
n+2;n
= ! + ( =2 + )
2
n
2
n+1;n
:::
2
n+h;n
Resolvendo iterativamente
2
n+h 1;n ;
= !+
2
n+h;n
2
n+h;n
como funo de
!
h 1
= =2 + :
2
n+1;n
2
n+1;n
h
X
k=1
0
@
h k
X
j=0
!2
!
1
430
h 1
2
n+1;n
!
1
A:
2
n+1;n
B
B
@
+ !+
2
1+
2
n+1;n
1+h
1)
11
1 CC
CC :
AA
1+h
! 1
+
1+
h
2+2h
1+
h! +
13.4
Obtenha-se agora o VaR supondo que o portfolio constitudo por m aces. Para simplificar
assuma-se que
rt = (R1t ; :::; Rmt )0 Ft
onde
N(
t ; Ht )
exemplo, uma alocao de 1 milho de Euros no ttulo 1 e 2 mihes no ttulo 2, traduz-se por
um investimento no valor de Vn = 3 milhes, sendo ! 1 = 1=3 desse valor investido no ttulo
1 e ! 2 = 2=3 investido no ttulo 2. A obteno do VaR similar ao do caso de um portfolio
com apenas 1 activo:
V aRn;n+1; j Fn ) =
P ( Vn+1 <
Vn+1
Vn <
Vn
P
P
Rp;n+1 <
V aRn;n+1; Fn
V aRn;n+1;
Vn
Fn
=
= :
Zn+1 <
E (Rp;n+1 j Fn )
Var (Rp;n+1 j Fn )
Rp;n+1 E (Rp;n+1 j Fn )
p
Var (Rp;n+1 j Fn )
V aRn;n+1;
Vn
E (Rp;n+1 j Fn )
p
Var (Rp;n+1 j Fn )
= q ) V aRn;n+1; =
431
Fn
q
Var (Rp;n+1 j Fn ) Vn
E (Rp;n+1 j Fn ) + q
Z
n+1
Pm
i=1
!0
n+1
p
+ q N ! 0 Hn+1 ! Vn
da distribuio N (0; 1) :
R1;n+1
R2;n+1
Tem-se para
= 0:05
V aRn;n+1;
v
u
u
u
= 1:645t
A Fn
1=3 2=3
00
N @@
0
@
0
0
0:01
1 0
A;@
0:01
0:002
0:002 0:005
0:002
0:002 0:005
10
A@
1=3
2=3
11
AA :
1
A
3 = 0:32 milhes.
13.5
A teoria dos valores extremos um ramo da estatstica que se preocupa essencialmente com
o comportamento probabilstico dos valores extremos da amostra e, portanto, centra a sua
anlise nas caudas da distribuio. Esta anlise importante em todos os fenmenos em
que a ocorrncia de valores muitos altos e muitos baixos relevante, como por exemplo,
ocorrncia de cheias, furaces, recordes desportivos, etc. A teoria dos valores extremos tem
432
tambm sido aplicada na actividade seguradora e, mais recentemente, nas rea das finanas,
no clculo do VaR.
Recorde-se a abordagem no paramtrica. Vimos que o VaR pode estimado a partir da
expresso
V[
aRn;n+1; =
onde q~r o quantil emprico de ordem
q~r Vn
(13.10)
partir de frt g). Como referimos no ponto 13.2, a estimativa q~ muito imprecisa quando
muito baixo (ou muito alto). Como iremos ver a teoria dos valores extremos tem uma
resposta para este problema. O objectivo deste ponto obter uma estimativa para qa via
teoria dos valores extremos.
13.5.1
A teoria dos valores extremos trata habitualmente os eventos extremos que ocorrerm na
aba direita da distribuio. Seguiremos esta lgica na introduo e, depois, por analogia,
focaremos a aba esquerda que a relevante para o clculo do VaR. O leitor poder consultar
o livro de Franke et. al (2008) para mais pormenores sobre a teoria.
Seja fyt ; i = 1; 2; :::; ng uma sucesso de v.a. i.i.d. e Mn = max fy1 ; y2 ; :::; yn g o mximo da amostra. Pode-se provar que se existirem constantes normalizadoras cn > 0; dn 2 R
e uma distribuio no degenerada H (isto , que no atribui toda a massa de probabilidade
d
dn ) ! H; ento H da forma
(1 + x)
1=
6= 0:
1 + x > 0;
x) ' H
para algum
2 Re
!0
H (x) = e
dn )
x) '
= 0 deve
: H designado na
433
Proposio 13.5.1 Suponha-se que fyt g uma sucesso de v.a. com funo de distribuio
F . Ento as seguintes proposies so equivalentes: 1) F 2 DM (H); 2) para alguma
funo
: R+ ! R+ ;
lim
sup
u"xF 0<x<xF
Fu (x)
; (u)
(x) = 0
(13.11)
onde
sup fx 2 R : F (x) < 1g
xF
8
< 1
(x) =
: 1
Fu (x) = P (y
1+
xj y > u)
1=
e x;
;
x
1+
> 0; x > 0 se
6= 0
se
= 0:
distribuition function. A equao (13.11) basicamente estabelece que (na classe das funes
F tais que F 2 DM (H)); para valores altos de u; Fu aproximadamente igual a G
portanto, uma estimativa para Fu pode basear-se em G
e,
Fu (x) = P (y
xj y > u) =
F (x + u)
1 F (u)
F (x + u) = (1
F (u)) (1
Fu (x))
ou (fazendo a substituio de x + u por x; passando agora x a ser definido por x > u),
1
F (x) = (1
F (u)) (1
Fu (x
u)) ;
u < x < 1:
(13.12)
Esta relao juntamente com (13.11) constitui o essencial do mtodo que se expe para a
estimao do VaR. Como F e consequentemente Fu so funes desconhecidas, a expresso
do lado direito de (13.12) pode ser estimada da seguinte forma
1
F^ (u)
434
F^u (x
u)
onde,
1X
N (u)
F^ (u) =
Ifyj >ug =
;
n j=1
n
n
F^u (x
^ ^ ^ (x
u) = G
;
u) :
F^ (u)
F^u (x
N (u)
1
u) =
n
N (u)
u) =
n
^ ^ ^ (x
G
;
x
1+^
u
^
1=^
N (u)
F (q ) =
n
N (u)
=
n
1+
^ q^
1=^
q^
1+^
1=^
Se
n
(1
N (u)
1 :
(13.14)
y (2)
:::
y (N (u))
y (n)
:::
u (nota: y (1) o valor mximo, y (2) o segundo valor mais alto etc.; relembra-
se o leitor que usmos y(1) para o mnimo, y(2) para o segundo mais baixo, etc. Resulta da
notao que y (1) = y(n) ; y (n) = y(1) ; etc.). Para estimar
435
(y) ( > 0) :
m log
1+
m
X
log 1 +
Yj :
j=1
(13.15)
m@
^
^
>
1=2 e m ! 1
00
d
A !
N @@
0
0
1 0
A;@
(1 + )
(1 + )
(1 + ) 2 (1 + )
1 11
A A:
Como escolher u?
Quando u muito alto o valor de N (u) baixo (significa que o nmero de observaes
efectivamente usadas na estimao baixo) e a varincia do estimador tende a ser alta.
Quando u baixo, a aproximao para Fu (x) ; usando a distribuio G
(x) tender a
e0
< 1;
uj Z > u) =
1+
1+
u;
0; 0
< 1:
Este resultado sugere seleccionar o limiar u de forma que a funo estimada para e (u) ;
en (v) ; para os valores v
u) ; 0g :
Para verificar se en (v) (aproximadamente) linear pode-se analisar no plano o grfico dos
pontos y(k) ; en y(k)
y(2)
:::
y(n) :
436
se yt =
com
=1
, o quantil de ordem
q^
q^r Vn = q^ Vn ;
=1
rt ;
;
3. Seleccionar u;
4. Obter ^; ^ ; maximizando (13.15);
5. Calcular q^ usando a equao (13.14);
6. Obter o V aR = q^ Vn
13.5.2
VaR Condicional
O ponto anterior assentou na hiptese de frt ; i = 1; 2; :::; ng ser uma sucesso de v.a. i.i.d.
Esta hiptese irrealista. O VaR calculado sob esta hiptese no reflecte a volatilidade corrente no momento n (seria de esperar o VaR aumentasse quando no momento n a volatilidade
alta). McNeil e Frey (2000) propem uma abordagem condicional do VaR no mbito da
teoria dos valores extremos. A ideia assenta no modelo ARMA-GARCH rt =
t+
t "t :
Se o
modelo estiver bem especificado ser de esperar que "t se comporte aproximadamente como
uma sucesso de v.a. i.i.d. Como os resultados principais da teoria dos valores extremos
se aplicam a sequncias i.i.d., prefervel aplic-los sucesso f"t g do que directamente
a frt g ; pois esta sucesso no geralmente i.i.d., devido presena de volatilidade no
constante.
Seja q^" o quantil da distribuio de "t obtido seguindo a metodologia do ponto anterior.
Tem-se assim,
rn+1
P rn+1 <
n+1
< q " Fn
+ q"
437
n+1
Fn
=
=
Em suma, uma vez apurado q^" ; o quantil da distribuio condicional de rn+1 vem igual a
qr =
n+1
+ q"
n+1 :
rt
^t
^t
13.6
Neste ponto avalia-se a qualidade da estimativa proposta para o VaR. Esta avaliao importante por vrias razes. As empresas (sobretudo bancos) que usam o VaR so pressionadas
interna e externamente (por directores, auditores, reguladores, investidores) para produzirem
VaR precisos. Um VaR preciso fundamental na gesto e controle do risco e na alocao de
capital. Por essa razo essencial que empresa teste regularmente as suas medidas de risco,
na linha das recomendaes adoptadas em acordo internacionais. Por outro lado, embora a
definio de VaR seja muito precisa e objectiva, existem diferentes mtodos de estimao do
VaR, que produzem diferentes estimativas (algumas bastante dspares); por isso, importante
identificar a melhor abordagem para o problema concreto em anlise.
Christoffersen e Diebold (2000) analisam a qualidade e a preciso dos intervalos de confiana produzidos para uma certa srie. Parte da metodologia pode ser adaptada na anlise
da qualidade do VaR. Seja V[
aRt;t
baseado na informao t
1;
Vt <
V[
aRt;t
Vt <
1;
V[
aRt;t
1;
: Intuitivamente, natural
1 no se sabe, an-
1;
ou rt <
V aRt;t 1;
Vt 1
Diz-se que a previso do VaR produz uma cobertura marginal correcta (correct uncondicional coverage) se
P (It = 1) =
, E (It ) = :
Vt <
V aRt;t
1;
exactamente este raciocnio que se estabelece a priori quando se procura definir o VaR a
100%: Interessa depois saber se, na prtica, essa desigualdade se verifica efectivamente
em 100% das vezes. Esta condio , naturalmente, necessria mas no suficiente para
identificar uma medida VaR como apropriada. Suponha-se, como habitualmente nas sries
financeiras, que se tem o fenmeno de volatility clustering. Momentos de alta (baixa) volatilidade so seguidos por momentos de alta (baixa) volatilidade. Nestas circunstncias, o VaR
deve ser alto nos momentos de alta volatilidade e baixo nos momentos de baixa volatilidade.
Se o V aRt;t
1;
propriedades da distribuio condicional) ento o VaR tender a falhar como medida de risco
em perodos consecutivos. Um VaR assim definido traz a seguinte implicao sobre fIt g: em
momentos de alta volatilidade os 10 s tendem a repetir-se (por exemplo, It = 1; It+1 = 1;
It+2 = 1; etc.), pois tender a observar-se em perodos seguidos
Vt <
V aRt;t
1;
e, em
momentos de baixa volatilidade, uma repetio de 00 s: Ou seja a sucesso It tender a apresentar dependncia temporal (ser autocorrelacionada). Mesmo neste caso, de autocorrelao de It ; poder ter-se E (It ) = : Por esta razo a cobertura marginal embora necessria
no suficiente para identificar o VaR como uma medida precisa.
Diz-se que a previso do VaR produz uma cobertura condicional correcta (correct condicional coverage) se
P (It = 1j Ft 1 ) =
, E (It j Ft 1 ) = :
Esta condio implica ausncia de autocorrelao, pois, tendo em conta a lei do valor esperado iterado,
Cov (It ; It k ) = E (It It k )
E (It ) E (It k )
= E (It
E (It j Ft k ))
E (E (Ij Ft 1 )) E (E (It k j Ft
= E (It
E ( E (It j Ft 1 )j Ft k ))
= E (It
E ( j Ft k ))
E (E (Ij Ft 1 )) E (E (It k j Ft
E( )E( ) =
439
k 1 ))
E (It k )
= 0:
k 1 ))
Existem vrias formas de testar a cobertura marginal e condicional. Por exemplo, se fIt g
uma sucesso de v.a. i.i.d. e E (It ) =
possibilidade consiste em analisar somente a cobertura condicional pois, pela lei do valor
esperado iterado, tem-se, com vimos atrs,
E (It j Ft 1 ) =
) E (It ) = E (E (It j Ft 1 )) = E ( ) = :
(X = 2)
(X = 13)
tambm podemos suspeitar algum tipo de dependncia temporal (flutuaes cclicas de perodo
curto). Sob a hiptese, H0 : fIt g uma sucesso de v.a. independentes, a distribuio de X
dado n0 e n1 conhecida. Quando n0 > 20 ou n1 > 20 mais conveniente usar-se o
resultado assimpttico. Sob H0 tem-se
X E (X) d
Z= p
! N (0; 1)
Var (X)
2 min fn0 ; n1 g
2 min fn0 ; n1 g + 1
440
se n0 = n1
se n0 6= n1 :
onde
2n0 n1
+1
n
2n0 n1 (2n0 n1 n)
:
Var (X) =
n2 (n 1)
E (X) =
O teste bilateral (afastamento hiptese nula pode dever-se quando X alto ou baixo).
Rejeita-se H0 se a probabilidade P (jZj > jzobs j) estiver abaixo do nvel de significncia
fixado.
Se a hiptese H0 no pode ser rejeitada pelos dados, pode-se assumir que fIt g uma
sucesso de v.a. i.i.d. com distribuio de Bernoulli de parmetro E (It ) : Interessa agora
P
investigar a cobertura marginal, i.e. se E (It ) coincide com : Seja Sn = ni=1 Ii = n1 a
soma dos 10 s que, como se sabe, tem distribuio Binomial de parmetros (n; E (It )) : Sob a
hiptese
H0 : E (It ) =
a estatstica de teste (rcio de verosimilhanas)
RV =
L ( j H0 )
2 log
=
L (^ )
2
(1) :
n1
(1
2 log n1
^ (1
)n0
^ )n0
= 0:01 ou
= 0:05).
Exemplo 13.6.1 Suponha-se que numa amostra de 800 observaes foi calculado o VaR a
5% (
Vt <
1;
2n0 n1
n
+1
2n0 n1 (2n0 n1 n)
n2 (n 1)
90
94:75
=
3:298
1:43:
Como o valor-p P (jZj > 1:43) ' 0:15 relativamente alto no se rejeita H0 : Considere-se
agora H0 : E (It ) = 0:05: Tem-se ^ = n1 =n = 0:0625 e
RVobs =
0:05n1 (1
2 log
^ n1 (1
441
0:05)n0
= 2:447:
^ )n0
Como o valor-p P
2
(1)
P=@
p01 p01
p11 p11
1
A
de v.a. i.i.d. (com distribuio de Bernoulli). Com efeito, sob a hiptese de independncia,
p01 = P (It = 1j It
= 0) = P (It = 1j It
= 1) = p11
0:8 0:2
0:1 0:9
Calcule-se a probabilidade de It = 1: Se It
It
A:
442
nula.
Por outro lado, sob H0 : p01 = p11 (substitua-se p01 e p11 por p1 )
RV =
2 log
L (pij j H0 )
=
L (^
pij )
2 log
(1
2
(1)
onde p^1 = (n01 + n11 ) =n. Uma variante interessante deste teste consiste em tomar como
hiptese nula H0 : p01 = p11 =
marginal, E (It ) =
2 log
(1
)n00 +n10
p^01 )n00 p^n0101 (1
(1
n01 +n11
2
(2) :
A vantagem deste teste do ponto de vista prtico clara: de uma vez s, ensaia-se a cobertura
marginal e condicional.
Estes testes, baseados no modelo da cadeia de Markov sofrem no entanto de uma limitao: baseiam-se em dependncias de primeira ordem. Ora, pode suceder que It dado
It
It =
k
X
1, t
i It i
+ x0t
+ ut
i=1
onde x0t
um vector 1
m de variveis Ft
um vector de parmetros m
1: A hiptese
= 0; :::;
= 0;
varivel I; em princpio seria mais apropriado uma regresso binria. No entanto, Sarma et
al. (2003) refere que na presena de forte assimetria dos dados (mais de 95% ou 99% dos
dados so 0s ou 1s) a regresso binria envolve problemas tcnicos. Para grande amostras
o estimador OLS apropriado.
444
Pgina em branco
445
Referncias
(referncias incompletas!)
Basrak, B., R. Davis e T. Mikosch (2002). Regular variation of GARCH processes. Stochastic Processes and their Applications 99(1), pp. 95-115.
Christiansen, C. (2007). Volatility-Spillover Effects in European Bond Markets. European
Financial Management, 13 (5), pp. 923-948.
Bauwens, L., A. Preminger e J. Rombouts (2006). Regime switching GARCH models.
Dpartement des Sciences Economiques Working Paper 2006-6.
Christoffersen, P. e F, Diebold (2000). How Relevant is Volatility Forecasting for Financial
Risk Management? Review of Economics and Statistics 82(1), pp. 12-22
Davies, (1987). Hypothesis testing when a nuisance parameter is present only under the
alternative. Biometrika 74, pp. 33-43.
Dimson E., P. Marsh e M. Staunton (2002). Triumph of the Optimists:101 Years of Global
Investment Returns, Princeton University Press.
Engle R. (1982). Autoregressive Conditional Heteroscedasticity with Estimates of the Variance of United Kingdom Inflation. Econometrica 50 pp. 987-1007.
Engle R. (2001). Financial Econometrics - a New Discipline with new Methods. Journal
of Econometrics 100, pp. 53-56.
Engle, R. (2002). Dynamic Conditional Correlation: A Simple Class of Multivariate Generalized Autoregressive Conditional Heteroskedasticity Models. Journal of Business
& Economic Statistics, 20(3), pp. 339-50.
Fama, E. (1970). Efficient Capital Markets: A Review of Theory and Empirical Work.
Journal of Finance 25 (2), pp. 383-417.
Engle R. e K. Kroner (1995). Multivariate Simultaneous Generalized ARCH. Econometric
Theory 11, pp. 122-150.
Fan, J. e Q. Yao (2005), Nonlinear Time Series, Springer Series in Statistics, New York.
446
Stelzer, R. (2009). On Markov-Switching Arma Processes? Stationarity, Existence of Moments, and Geometric Ergodicity. Econometric Theory, 25(1), pp. 43-62.
Taylor, H. e S. Karlin (1984). An Introduction to Stochastic Modeling. Academic Press,
New York.
Taylor S. (2005). Asset Price Dynamics, Volatility, and Prediction, Princeton University
Press.
Wooldridge, J. (1994). Estimation and Inference for Dependent Processes, in Handbook
of Econometrics, Vol. 4 , pp. 2641-2700., edited by Engle R.F. and McFadden D.L.
Elsevier Science B.V. , Amsterdam.
448