Académique Documents
Professionnel Documents
Culture Documents
Yves ARAGON
aragon@cict.fr
Janvier 2008
Table des matires
Rfrences bibliographiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2 ARMA - SARMA 19
2.1 Proprits de base des sries stationnaires . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.1.1 Stationnarit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.1.2 Fonction dautocovariance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.1.3 Qualit de lerreur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2 Modles de sries stationnaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2.1 Srie linaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2.2 Processus gaussien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3 Processus autorgressif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3.1 Processus autorgressif dordre 1 . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3.2 Fonction dautocorrlation partielle . . . . . . . . . . . . . . . . . . . . . . . . 28
2.4 Processus Moyenne mobile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.5 Saisonnalit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.5.1 Saisonnalit multiplicative . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.6 Modles ARIMA et SARIMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.7 Complment : non stationnarit en variance . . . . . . . . . . . . . . . . . . . . . . . . 32
2.8 Etude empirique dune srie par une modlisation ARIMA . . . . . . . . . . . . . . . . 33
2.8.1 La mthode MINIC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.9 Mise en pratique dans SAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.9.1 Modlisation du niveau du Lac Huron . . . . . . . . . . . . . . . . . . . . . . . 39
2.10 Estimation dun ARMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.10.1 Fonction de vraisemblance dun processus gaussien AR(1) . . . . . . . . . . . . 47
2.10.2 Fonction de vraisemblance dun processus gaussien MA(1) . . . . . . . . . . . . 48
2.11 Prvision dune srie temporelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.11.1 Prvision erreur quadratique minimum pour un ARMA . . . . . . . . . . . . . 49
2.11.2 Exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.12 Exemple dquations de Yule-Walker : cas de lARMA(2,1) . . . . . . . . . . . . . . . . 51
2
TABLE DES MATIRES 3
5 Contgration 92
5.1 Notions sur la rgression dune srie sur une autre srie . . . . . . . . . . . . . . . . . . 93
5.1.1 Exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
5.2 Non stationnarit dun VAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
5.2.1 Intuition de la contgration . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
5.2.2 Reprsentation en correction derreur . . . . . . . . . . . . . . . . . . . . . . . 96
5.3 Contgration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.3.1 Contgration avec terme dterministe . . . . . . . . . . . . . . . . . . . . . . 98
5.3.2 Traitement de la contgration par Johansen . . . . . . . . . . . . . . . . . . . . 100
5.4 Contgration dans SAS, proc varmax . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
5.4.1 Exemples SAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
5.5 Test de causalit au sens de Granger . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
5.5.1 Simulations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
5.6 Exemples de syntaxe de la documentation SAS . . . . . . . . . . . . . . . . . . . . . . 110
Bibliographie
[1] Box G., Jenkins, Reinsel G.C. Time Series, , 3rd Ed. Prentice Hall.
[2] Bourbonnais R. Economtrie, 3me d., 2000, Dunod.
[3] Bresson G. et Pirotte A. Economtrie des sries temporelles, 1995 PUF.
[4] Brockwell P.J., Davis R.A. Introduction to Time Series and Forecasting , 1997, Springer.
[5] Brockwell P.J., Davis R.A. Time Series : Theory and Methods, 2nd edition , 1991, Springer.
[6] Bourbonnais R., Terraza M. Analyse des sries temporelles en conomie, 1998, PUF.
[7] Charemza W., Deadman D.F.New Directions in Econometric Practice, 1992 Edward Elgar.
[8] Chan N. H. Time Series Applications to finance, 2002, Wiley.
[9] Destandau S. et Le Guen M. Analyse Exploratoire des Donnes avec SAS/INSIGHT, 1998, INSEE
Guides 7-8 .
[10] Franses P. H. Time series models for business and economic forecasting, 1998, Camridge University
Press.
[11] Gourieroux C., Monfort A. Sries temporelles et modles dynamiques, 1995, 2nd edition, Econo-
mica.
[12] Gourieroux C., Scaillet, Szafarz Econometrie de la finance. Analyses historiques, 1997, Econo-
mica.
[13] Hamilton J.D. Time Series Analysis, 1994, Princeton University Press.
[14] Jaffe J.A. Mastering the SAS System Snd ed., 1996, ITP.
[15] Kennedy P., A guide to Econometrics, Fith Edition, 2003, Blackwell.
[16] Lardic S., Mignon, V. Economtrie des sries temporelles macroconomiques et financires, 2002,
Economica.
[17] Ltkepohl H., New Introduction to Multiple Time Series, 2005, Springer.
[18] Mills T. C., The Econometric Modelling of Financial Time Series 2nd ed., 1999, Cambridge.
[19] Reinsel G. C. Elements of Multivariate Time Series Analysis, 1997, Springer.
[20] Rydberg T., Realistic statistical modelling of financial data. International Statistical Review, 2000,
68, 233-258.
[21] SAS Institute, SAS/ETS Users Guide Version 6 2nd ed., SAS Institute.
[22] Shumway R., Stffel Time Series Analysis and its Applications, 2000, Springer.
[23] Tassi Ph. Mthodes statistiques, 1989 et nombreuses ditions, Economica.
[24] Tsay R. S. Analysis of Financial Time Series, 2002, Wiley.
[25] Wei Time Series Analysis : Univariate and Multivariate Methods, 1990, Addison-Wesley.
[26] Zivot E., J. Wang Modeling financial time series with S-Plus, 2nd edition, 2006, Springer.
4
Chapitre 1
Introduction Une srie temporelle univarie est une suite de donnes quantitatives mesures inter-
valles rguliers. Dans ce chapitre on donne quelques exemples de sries temporelles et de questions
concrtes quon peut se poser devant une telle srie. On verra notamment quune mme srie peut servir
diffrents usages et donc recevoir des traitements varis. Ensuite, on introduit une srie de rfrence :
le bruit blanc (BB) et loprateur retard qui simplifie grandement lcriture des problmes de sries tem-
porelles. Enfin un exemple, le niveau du lac Huron, illustre ce que peut apporter la prise en compte de
la dynamique de lerreur dans une rgression dune variable y sur des variables x quand les observa-
tions sont indices par le temps. Ce problme est trs classique. Vous devez avoir prsent lesprit que
lquation 1.7 est un cas particulier de 1.2 avec erreur dynamique.
5
CHAPITRE 1. PRLIMINAIRES SUR LES SRIES TEMPORELLES 6
65000000
60000000
55000000
Population
50000000
45000000
40000000
dune prvision un ou deux mois de la srie, prvision qui, elle, devra videmment incorporer
les fluctuations saisonnires. La srie lisse par la mthode X11 est reprsente figure ( 1.6).
4 Le niveau du lac Huron (1.8) montre une tendance lgrement dcroissante et on observe que les rsi-
dus de lajustement dune droite au niveau, deux dates conscutives, sont corrls positivement
(Fig. 1.15).
Si lobjectif est de prdire le niveau lan prochain, il faut exploiter la fois la linarit de la
tendance et la corrlation de la srie 2 dates conscutives.
5 Le rendement du titre Alcatel (1.7) est une srie htroscdastique, cest--dire une srie dont la va-
riance nest pas constante au cours du temps, dont la variabilit change au cours du temps de faon
non vidente. Le rendement dune action est trs souvent de moyenne nulle et les rendements 2
dates conscutives souvent non corrls. Il ny a donc pas de problme de prvision du rendement
mais la prvision de sa variabilit est utile.
On voit sur ces exemples quon ne peut pas considrer une srie temporelle comme une suite dobserva-
tions indpendantes. Par consquent tous les calculs et raisonnements de statistique mathmatique bass
sur lindpendance entre les observations doivent tre revus et si ncessaire, penss autrement. Mais la
connaissance de la dpendance temporelle permet en contrepartie damliorer la prvision de la valeur
dune srie une date future connaissant le prsent et le pass.
CHAPITRE 1. PRLIMINAIRES SUR LES SRIES TEMPORELLES 7
F IG . 1.5 Nombre de morts par accident au F IG . 1.6 Srie des ventes de champagne brute
Royaume-Uni et lisse par X11
modle statique : Xt ne contient pas de valeurs passes de {Yt } et les ut sont non corrls
entre eux
modle dynamique : Xt contient des valeurs retardes de yt ou les ut sont auto-corrls. Dans
ce cas la dynamique de ces erreurs doit tre modlise.
Dans tous les cas, la fonction f() doit tre estime dans une classe de fonctions. Dans ce
cours on ne considre que des fonctions linaires mais le cours de rgression non et semi-
paramtrique propose des classes plus vastes.
Prdire La prvision de valeurs des dates futures connaissant le prsent et le pass de la srie peut tre
base sur un modle, ce que nous pratiquerons travers les modles ARMA, ARMAX ou bien
tre construite sans rfrence un modle, cas du lissage exponentiel et des ses gnralisations.
Lessentiel de ce cours est consacr la modlisation. Mais un modle ne remplace pas un graphique.
Il faut toujours essayer de comprendre un phnomne par plusieurs approches : modle et graphiques,
plusieurs modles...
yt = mt + st + Ut , o E(Ut ) = 0 ()
ou un modle multiplicatif :
yt = mt st Ut , o E(Ut ) = 1 ()
Par exemple, les sries montrant une saisonnalit qui a de plus en plus dampleur (cas des ventes de
champagne, Fig. 1.3) sont souvent mieux ajustes par un modle multiplicatif que par un modle additif.
Commentaires
CHAPITRE 1. PRLIMINAIRES SUR LES SRIES TEMPORELLES 9
Une dcomposition permettant dliminer leffet saisonnier est utile quand on veut examiner le com-
portement moyen terme dune srie. Les services de statistique officielle, les organismes qui tudient
les grandes tendances dun phnomne, travaillent sur des sries dsaisonnalises. A titre dexemple
on consultera le site de la Scurit routire :
http://www.securiteroutiere.gouv.fr/infos-ref/observatoire/conjoncture/ puis
"Les mthodes de production de lanalyse conjoncturelle".
Par contre quand cest le comportement court terme qui intresse, il faut garder laspect saisonnier.
Les gestionnaires de stocks de magasins doivent tenir compte de la saisonnalit des ventes de leurs
produits quand ils passent leurs commandes.
Le choix dun modle ou dun autre, lincorporation ou non dune composante, peuvent sapprcier
daprs le graphique de la srie et peuvent tre valids par lanalyse elle-mme.
Il ny a pas une unique faon dobtenir une dcomposition telle que (*) ou (**) pour une srie parti-
culire.
Dans R, les fonctions : decompose(), stl(), StructTS() donnent des dcompositions sai-
sonnires dune srie.
Dans SAS, les proc X11 et X12, sont des programmations des mthodologies X11 et X12. Elles
donnent notamment des outils de lissage et de dsaisonnalisation. Elles sont reconnues et appliques
par les services de statistique officielle de la plupart des pays.
On considre quune srie temporelle observe {xt , t = 1, , T } est la ralisation dun processus
alatoire {Xt , t = 1, , T }. Les Xt sont des v.a. (variables alatoires), xt est la valeur prise par Xt ,
ce qui advient la date (ou linstant dobservation) t, ces v.a. des dates diffrentes sont normalement
CHAPITRE 1. PRLIMINAIRES SUR LES SRIES TEMPORELLES 10
Dfinition 1 Un bruit blanc {Zt } est une suite de v.a. non corrles de moyenne nulle, de variance
constante Z2 .
On note {Zt } BB(0, Z2 ). {Zt } BBN (0, Z2 ) dsigne un bruit blanc gaussien, cest--dire une
suite de v.a. i.i.d. N (0, Z2 ).
Le BB est une srie de rfrence. Modliser une srie revient souvent trouver les oprations qui la
dcrivent comme transformation dun bruit blanc.
1.4 Notations
Oprateur retard. On note B(backwards) ou L (lag), loprateur qui fait passer de xt xt1 :
Bxt = xt1
On a :
B2 xt = B(Bxt ) = Bxt1 = xt2
Oprateur diffrence. La diffrence premire est :
xt = (1 B)xt = xt xt1
on a :
2 xt = (xt ) = xt 2xt1 + xt2
Oprateur diffrence saisonnire. Pour une srie mensuelle il peut tre utile dexaminer ses accroisse-
ments dune anne sur lautre (janvier sur janvier, ...). Loprateur diffrence saisonnire 12 = 1 B1 2
est utile dans ce cas.
Exemples
(a) Manipulation de loprateur retard.
Pour la fonction constante = 1 t,
de mme
1 1
1 = (1 + 0.9B + (0.9)2 B2 + )1 = 1 + 0.9 + (0.9)2 + = = 10.
1 0.9B 1 0.9
Pour la fonction = t t
de mme
1
t = (1 + 0.9B + (0.9)2 B2 + )t = t + 0.9(t 1) + (0.9)2 (t 2) + =
1 0.9B
1 1
t 0.9 = = 10t 90. (1.3)
1 0.9 (1 0.9)2
(b) Calcul de sries retarde et de sries diffrencies dans SAS.
data b;
set donn.champa2;
ven1 = lag(vente_ch);
ven12 = lag12(vente_ch);
5 d1_ven = dif1(vente_ch);
d12_ven = dif12(vente_ch);
run;
1 2.815 JAN62 . . . .
2 2.672 FEB62 2.815 . -0.143 .
3 2.755 MAR62 2.672 . 0.083 .
20 4 2.721 APR62 2.755 . -0.034 .
5 2.946 MAY62 2.721 . 0.225 .
6 3.036 JUN62 2.946 . 0.090 .
7 2.282 JUL62 3.036 . -0.754 .
8 2.212 AUG62 2.282 . -0.070 .
25 9 2.922 SEP62 2.212 . 0.710 .
10 4.301 OCT62 2.922 . 1.379 .
11 5.764 NOV62 4.301 . 1.463 .
12 7.312 DEC62 5.764 . 1.548 .
13 2.541 JAN63 7.312 2.815 -4.771 -0.274
30 14 2.475 FEB63 2.541 2.672 -0.066 -0.197
(c) Dans R.
Lecture du fichier texte champa.asc .
Conversion en srie temporelle (avec date).
Fabrication de sries retardes. Observer que la fonction lag() marche lenvers de ce quon attend !
On peut observer quelle se contente de changer la date de la srie. De plus elle ne sapplique qu un
objet de type ts. La fonction Lag() du package Hmisc est plus simple demploi.
Illustration des fonction ts.union, ts.intersection.
Fabrication de la srie retarde de faon classique.
> champagne = scan(champa.asc)
Read 105 items
CHAPITRE 1. PRLIMINAIRES SUR LES SRIES TEMPORELLES 12
Exemple de lag plot. La srie des tempratures mensuelles moyennes Nottingham est fournie avec
R (Fig. 1.12). Les diagrammes retards de 1 12 de cette srie (1.13) montrent des aspects trs typs,
CHAPITRE 1. PRLIMINAIRES SUR LES SRIES TEMPORELLES 13
Les figures (1.10 et 1.11) reprsentent une srie simule suivant le mcanisme :
et son lag plot. La valeur une date est fortement lie la valeur 12 priodes avant. On voit sur le lag
plot quil ny a pas de corrlation entre des valeurs dcales de 1, 2, ,11.
F IG . 1.10 Chronogramme dune srie simule F IG . 1.11 Lag plot de la mme srie simule
suivant (**)
Exercice 1 Examinant la figure (1.9), (1) que peut-on dire de la saisonnalit du trafic laroport de
Blagnac ? (2) Le 11 septembre a-t-il eu le mme effet sur tous les mois des annes suivantes (effets sur
janvier, sur fvrier, ...) ? (3) Que peut-on raconter de leffet du 11 septembre sur la croissance de lactivit
de laroport ?
Exercice 2 Lag plots. Les sries (1.10) et () ont toutes deux un fort comportement saisonnier. (1) Que
traduit la forme en anneau certains dcalages pour le lag plot de la temprature Nottingham ? La
rponse est, pour linstant, seulement intuitive. Il faut utiliser notre connaissance intuitive de cette srie.
(2) Commenter les similitudes et les diffrences de leurs lag plots.
65
60
55
nottem
50
45
40
35
30
Time
enfin on essaie de modliser simultanment les deux aspects : moyenne et dynamique de lerreur.
On appelle souvent un tel modle, modle ARMAX. On en rencontrera dans les modles dintervention
et en TP. On en donne un petit exemple ds maintenant.
Le graphique de la srie du niveau du lac Huron (1.8) montre une tendance lgrement dcroissante dont
la significativit doit tre teste et, autour de cette tendance, une variabilit importante dune anne
lautre. Le temps est notre variable explicative.
La 1re tape consiste donc faire une rgression linaire du niveau sur lanne par MCO :
yt = 0 + 1 t + ut , t = 1, , T (1.4)
10
20
Standard Approx
Variable DF Estimate Error t Value Pr > |t|
Attention ! La rgression a t effectue sur la date cest--dire sur des valeurs espaces de 365 ou 366
et ne commenant pas 1.
Le R2 nest pas trs lev (R2 = 0.2725) mais la rgression est significative : t Value pour 1 = 6.00
qui correspond un niveau de signification empirique < .0001. Examinons maintenant le rsidu de cet
bt = yt b0 b1 t. A-t-il une dynamique ?
ajustement : u
On constate (graphique 1.15) que le signe du rsidu est assez rgulirement alternativement positif et
ngatif sur plusieurs dates conscutives .
Examinons donc le diagramme de dispersion des (b ut1 , u
bt ), t = 2, , T (graphique 1.16). Comme on
pouvait sy attendre, on observe une corrlation linaire significative entre le rsidu une date et le rsidu
la date voisine. Cette corrlation sur les rsidus u
bt est le reflet dune corrlation sur les erreurs ut ; ut a
une dynamique.
(On comprend quon peut amliorer la prvision du niveau dune anne partir de la connaissance du
niveau les annes antrieures en prenant galement en compte de cette corrlation.) Rsum de la re tape :
nous avons estim le niveau moyen du lac et avons constat que lerreur est autocorrle, quelle a une
dynamique.
La 2e tape consiste modliser la dynamique de lerreur. Utilisant les outils du prochain chapitre,
lexamen des rsidus de lajustement par MCO suggre que lerreur une date t dpend linairement des
erreurs aux dates t 1 et t 2. Autrement dit, lerreur est un processus autorgressif dordre 2.
Sans entrer dans le dtail de cet exemple on en donne maintenant quelques aspects graphiques. On
superpose sur le graphique (1.17) : (1) la srie du niveau, (2) sa prvision lhorizon 1 sans tenir compte
de lautocorrlation des erreurs ( droite des moindres carrs) puis (3) en modlisant lerreur par un
processus autorgressif dordre 2 (AR(2)) :
ut = 1 ut1 + 2 ut2 + Zt
o Zt est un BB. On peut observer une trs nette amlioration de lajustement au prix de 2 paramtres
supplmentaires.
Ecriture synthtique du modle (xt t) :
yt = 0 + 1 xt + ut (1.5)
ut = 1 ut1 + 2 ut2 + Zt , Zt Bruit blanc (1.6)
CHAPITRE 1. PRLIMINAIRES SUR LES SRIES TEMPORELLES 16
Rsumons. Il est utile de modliser le mcanisme dvolution de lerreur ut dans cette srie pour au
moins deux raisons :
1. Si notre objectif est la prvision du niveau lanne suivante, on prdira yT +1 par :
yT +1 = b0 + b1 (T + 1) + Pred(uT +1 |b
u1 , u
b2 , , u
bT )
Dans cette expression Pred(.|.) dsigne la prvision de ce qui est avant le | sachant ce qui est aprs.
2. Si lobjectif est davoir une bonne estimation de 1 il faut modliser le mcanisme de lerreur
et estimer la rgression par Moindres Carrs Gnraliss (MCG). On montre en effet, voir par
exemple ([2], chapitre 5), que si lerreur est autocorrle, lestimateur des MCO) de nest pas
efficace.
Nous allons diviser les difficults : dans le chapitre suivant nous considrons des sries dont la moyenne
est constante (ltape 1 ci-dessus est donc trs simple) et nous prsentons les modles ARMA. Ce sont
des modles assez gnraux pour lerreur ut dans (1.7). En fin de chapitre nous traiterons en dtail la
modlisation du niveau du lac Huron comme exemple de modle ARMAX (la moyenne de la variable
dpendante est une fonction linaire de variables explicatives x et lerreur suit un processus ARMA).
CHAPITRE 1. PRLIMINAIRES SUR LES SRIES TEMPORELLES 17
nottem
nottem
40
30 50
60
nottem
nottem
nottem
50
40
30
lag 4 lag 5 lag 6
60
nottem
nottem
nottem
40
30 50
nottem
nottem
50
40
30
F IG . 1.14 Niveau du lac Huron - ajustement F IG . 1.15 Niveau du lac Huron - rsidus en
dun polynome de degr 1 fonction du temps
ARMA - SARMA
Introduction Dans ce chapitre on commence par donner la dfinition de la stationnarit (faible). En-
suite on dfinit la fonction dautocorrlation simple (ACF) dune srie stationnaire et son estimation. On
voit ensuite le test du portemanteau, cest un test de blancheur dune srie stationnaire. Il est trs utile
car si une srie est un bruit blanc (BB), elle se traite comme une suite dobservations non corrles de
variance constante. On introduit ensuite les modles ARMA. Ce sont des modles qui conviennent
beaucoup de sries stationnaires de moyenne constante. Un modle ARMA(p, q) pour une srie a deux
paramtres fixer avant toute estimation : p lordre de lautorgression (AR) et q lordre de la moyenne
mobile (MA). On introduit une autre fonction dcrivant lautocorrlation dune srie stationnaire : la
fonction dautocorrlation partielle (PACF). Or la PACF dun AR(p) est nulle partir de lordre p + 1
de mme lACF dun MA(q) est nulle partir de lordre q + 1. Etant donn une srie, dcouvrir des
valeurs possibles pour p et q sappelle identifier la srie. Or les fonctions dautocorrlation empiriques,
simple et partielle, estiment correctement ces mmes fonctions dautocorrlation thoriques. Des valeurs
possibles pour p et q sont donc suggres par les fonctions dautocorrlation empiriques. On voit enfin
comment on identifie puis estime un ARMA avec SAS.
Finalement, si une srie est stationnaire, les modles ARMA sont une classe assez vaste pour essayer de
modliser la srie. Pour vrifier que le modle est correct il faut notamment vrifier que le rsidu prdit
est un BB. Et que fait-on avec les sries non stationnaires ? Nous verrons au chapitre suivane des tests de
non stationnarit. Dautre part, si on a une srie non stationnaire il faut trouver une ou des transformations
qui la ramnent une srie stationnaire laquelle on peut appliquer les techniques du prsent chapitre.
Ce chapitre est trs important, car on retrouvera les notions quil contient dans diffrentes circonstances.
Dure : 6h sans compter le temps de manipulation de sries sur logiciel.
19
CHAPITRE 2. ARMA - SARMA 20
Remarque. On a distingu stationnarit stricte et stationnarit faible et la plupart des modles que nous
allons examiner concernent des sries normalement distribues ; pour elles, les deux notions concident.
Mais on verra que le rendement du cours dune action est souvent faiblement stationnaire sans ltre
strictement (voir le chapitre consacr aux modles htroscdastiques). La suite du chapitre concerne les
sries faiblement stationnaires.
Considrations pratiques pour apprcier la stationnarit dune srie. Il est important darriver
se faire une ide de la stationnarit dune srie par lobservation de son chronogramme. La stationnarit
dit que la moyenne et la variance de la srie sont constantes quelque soit la date. Elle implique donc que
le graphe de la srie en fonction du temps montre des fluctuations qui se ressemblent (en niveau et en
amplitude), quelque soit la date autour de laquelle on examine la srie.
A Une srie stationnaire a une moyenne constante. Considrons le cours de laction Alcatel (Figure 1.7
de lethme 1). Imaginons un intervalle dune anne environ et faisons glisser cet intervalle. De 1991
1993, le niveau moyen sur un an reste peu prs constant. On remarque la mme chose de 1995 1997.
Mais la fluctuation se fait autour dun niveau beaucoup plus faible que pour la priode prcdente. Il est
manifeste donc que pour cette srie, la moyenne dpend de t et donc la srie nest pas stationnaire. En
rsum, si le niveau dune srie fluctue peu autour dun niveau moyen sur un petit intervalle de temps
mais que ce niveau moyen change avec la position de lintervalle, on peut conclure que la srie nest pas
stationnaire.
Question Quelles sries de lethme 1 peuvent tre reconnues comme non stationnaire au seul examen
de leur niveau moyen ?
B Une srie stationnaire a une variance constante. Ce qui veut dire que lampleur de la fluctuation de
la srie reste la mme sur un petit intervalle de temps quelque soit cet intervalle. La population des
Etats-Unis entre dans cette catgorie. Mais cette srie nest pas stationnaire car sa moyenne nest pas
constante.
Question Quelles sries de lethme 1 montrent une variance non constante et ne sont donc pas station-
naires ?
C On est maintenant quip pour examiner la srie des tempratures de lair Nottingham.
Question Le chronogramme de la srie est trs rgulier. Chaleur en t, froid en hiver... La moyenne sur
6 mois conscutifs change selon que ces mois sont centrs sur lt ou sur lhiver. Rgularit veut-il dire
stationnarit ? Examiner galement le lag plot. Comment raconter le graphe pour le dcalage 3 ?
Proprit 1
(a) 0 = var(Yt ),
(b) l = l , car :
l = cov(Yt , Yt(l) ) = cov(Yt(l) , Yt ) = cov(Yt+l , Yt ) = cov(Yt+l , Y(t+l)l ) = l
Autre notation. On crit aussi Y (l), en particulier pour distinguer la fonction dautocovariance dune
srie Y , de celle dune autre srie.
CHAPITRE 2. ARMA - SARMA 21
cov(Yt , Ytl )
l = p . (2.1)
var(Yt )var(Ytl )
cov(Yt , Ytl ) l
l = = . (2.2)
var(Yt ) 0
Enfin en terme desprance mathmatique et notant que par la stationnarit : E(Yt ) = indpendant de
t, on a :
E[(Yt )(Ytl )]
l = . (2.3)
E[(Yt )2 ]
l est une mesure de la dpendance de la valeur Y en une date par rapport sa valeur une date dcale
de l intervalles de temps.
Dfinition 4 La fonction :
l l , l = 0, 1, 2, . . .
est appele fonction dautocorrlation (thorique), FAC (ou ACF en anglais) de la srie {Yt }.
Sous des conditions gnrales, voir par exemple Brockwell et Davis ([4]), bl est un estimateur convergent
de l .
Dfinition 5 La fonction :
l bl , l = 0, 1, 2, . . .
est appele fonction dautocorrlation empirique de la srie {Yt }.
Tests de normalit
Il y a plusieurs tests de normalit dune distribution. La statistique de Jarque-Bera est couramment utilise
dans les tudes conomtriques. Cest la mthode mise en uvre dans la proc autoreg de SAS.
Principe : Supposons une srie de n observations indpendantes dune v.a. Y , y1 , , yn , de moyenne 0,
de variance 1. Les 4 premiers moments empiriques sont
n
1X
m1 = yi ,
n
i=1
n
X
1
mq = (yi m1 )q , q = 2, 3, 4
n
i=1
Lasymtrie (skewness) empirique est
m3
S= 3/2
m2
et lapplatissement (kurtosis) empirique est
m4
K=
m22
Si Y suit une loi normale on peut montrer qualors :
6
S AN (0, ), K AN (3, 24
n ), S et K sont aproximativement indpendants
n
2
Ces rsultats permettent de considrer : n S6 , n (K3)
2
24 , comme statistique pour tester la normalit, sous
cette hypothse en effet, chacune suit approximativement une loi de 2 1 degr de libert.
La statistique de Jarque-Bera combine ces deux statistiques. Elle vaut :
S 2 (K 3)2
N = n{ + }
6 24
Si Y de moyenne 0, de variance 1 est normalement distribue de moyenne 0, alors N suit approximati-
vement une loi de 22 . On rejette lhypothse nulle de normalit, pour de grandes valeurs de la statistique.
Tests de non corrlation
Pour un processus linaire (voir le paragraphe suivant pour la dfinition et [5] Th. 7.2.2 pour les condi-
tions exactes) dont la FAC vrifie : (k) = 0, k > m, on a pour k > m :
Application de ce rsultat. Si {Yt } est une suite de v.a. i.i.d., de moment dordre 2 fini, E(Yt2 ) < ,
alors (2.6) se rduit
1
(k))
var(b (2.8)
T
On montre dautre part que les coefficients dautocorrlation b(l) sont approximativement indpendants
et normalement distribus (de moyenne 0, de variance 1/T ). Ce rsultat permet de tester la nullit dun
(k) particulier. De plus tant donne une ralisation y1 , , yT dune srie vrifiant (2.8),
on devrait
avoir environ 95% des coefficients dautocorrlation empirique dans lintervalle 1, 96/ T . Si la pro-
portion observe sloigne de cette valeur, on peut conclure que les observations ne sont pas indpen-
dantes.
CHAPITRE 2. ARMA - SARMA 23
Test du Portemanteau Si lon veut tester que {Yt } est un bruit blanc, on a videmment intrt
considrer simultanment la nullit de plusieurs coefficients dautocorrlation. La statistique
h
X
Q(h) = T b(j) 2 (2.9)
j=1
H0h : 1 = 2 = = h
Sous lhypothse que {Yt } est un bruit blanc, Q suit approximativement une loi de 2 h degrs de
libert. Q est appele statistique de Box-Pierce. On rejette lhypothse H0h pour les grandes valeurs de
Q(h).
Quand on veut tester la blancheur du rsidu dun ajustement on utilise la statistique de Ljung-Box :
h
X b(k)2
Q (h) = T (T + 2) .
T k
k=1
Sous H0 : (1) = = (h) = 0 Q (h) 2 (h m), m est le nombre de paramtres estims dans le
modle.
Un exemple de sortie SAS de ce test figure la sous-section(2.3.1).
Test de Durbin-Watson. Le test de Durbin-Watson est un test de blancheur de srie particulier. Il sin-
tresse la situation :
yt = xt + ut , t = 1, , T (2.10)
ut = ut1 + Zt (2.11)
o ubt est le rsidu de lajustement par moindres carrs ordinaires de yt sur xt . En dveloppant numrateur
et dnominateur on voit que
DW 2(1 b) (0, 4],
PT
t=2 u
bt1 ubt
o b = P T 2 . Les valeurs de DW proches de 0 indiquent une autocorrlation proche de 1.
t=1 u
b t
Pout le test de H0 : = 0 contre H1 : > 0, la rgion critique (RC) correspond de fortes valeurs de
DW (DW sensiblement infrieur 2, et la RC pour H1 : < 0, correspond de faibles valeurs de DW.
Pratiquement une statistique de DW 2 peut tre le signe dune mauvaise spcification du modle (par
exemple, tendance ajuste linaire alors que la tendance relle est quadratique).
Ce test tant effectu par la plupart des logiciels, que les observations soient ou ne soient pas une srie
temporelle, il ne faut pas oublier dliminer son rsultat des sorties, quand les donnes ne sont pas indi-
ces par le temps. Dans SAS il est programm ainsi que certaines extensions, dans la proc autoreg.
CHAPITRE 2. ARMA - SARMA 24
Notes.
1. Plus le dcalage l est grand, moins il y a dobservations pour estimer l dans (2.5). On sarrte
habituellement l T /4.
2. Observons que lon peut calculer (2.5) pour toute srie, stationnaire ou non. Si la srie nest pas
stationnaire, (2.5) a un usage purement empirique. On montre que pour une srie stationnaire, le
corrlogramme empirique, graphe de l b(l) dcroit exponentiellement vers 0, avec ventuelle-
ment des oscillations. Inversement, un graphe du corrlograme empirique qui ne dcroit pas trs
rapidement est lindice dune non stationnarit de la srie. Ainsi lexamen du corrlogramme em-
pirique dune srie permet de se faire une ide de sa stationnarit. Cet examen complte celui du
chronogramme.
3. Dans la formule (2.7) on ne connat pas les k . On les remplace par leurs estimations dans la
formule de la variance.
4. A partir des formules (2.6), (2.7) ou (2.8), on peut construire des intervalles autour de 0, par
exemple 95%. SAS base ces intervalles sur (2.6) et (2.7) alors que R utilise (2.8).
5. Il est trs pratique de se souvenir de Q(h) comme dune somme de h variables approximativement
indpendantes, carrs de v.a. N (0, 1) :
h
X Xh
b(j) 0 2
Q(h) = T b(j) 2 = ( p ) )
j=1 j=1
1/ (T )
or (1) le carr dune variable N(0,1) suit une loi 21 (2) la somme de deux v.a. indpendantes et
distribues suivant des lois 2n1 et 2n2 suit une loi 2n1 +n2 . La loi de Q(h) est donc bien 2 sous
lhypothse nulle.
(cf Formule de Bartlett).
6. La loi de la statistique DW dpend des variables explicatives x. Durbin et Watson ont trouv des
encadrements aux quantiles de cette loi qui ne dpendent que du nombre de variables explicatives,
en plus de la constante. Ctait trs utile dans les annes 50, quand les ordinateurs taient rares.
7. Le modle (2.10) est de mme nature que celui retenu pour le lac Huron au chapitre prcdent.
P
Si Yt est linaire et causal on obtient : EYt = , var(Yt ) = Z2 2
i=0 i Lautocovariance dordre k est :
X
X
k = cov(Yt , Ytk ) = E[ i Zti , j Ztkj ] (2.13)
i=0 j=0
X
= E( i j Zti Ztkj ) (2.14)
i,j=0
X
X
2
= j+k j E(Ztkj ) = Z2 j j+k (2.15)
j=0 j=0
Si la srie est linaire et causale et si de plus i = 0 pour i > q on dit que Yt est une moyenne mobile
dordre q (MA(q)). Une srie linaire causale est un MA().
Notes.
1. La dfinition dune srie linaire a un intrt thorique car on peut lui associer une caractrisation
de la stationnarit.
2. On peut observer que les calculs dautocovariances sont particulirement simples dans cette cri-
ture.
3. Il peut sembler peu pratique dcrire un processus laide dune infinit de paramtres mais les
modles ARMA que nous allons voir : (a) sont des cas particuliers peu de paramtres de sries
linaires et causales (b) peuvent tre de bonnes approximations de telles sries.
2.2.2 Processus gaussien
Nous admettons sans justification, la dfinition non formalise suivante. Un processus {Yt } est gaussien
si :
k, un nombre de dates,
(t1 , t2 , , tk ), un choix de k dates,
le vecteur alatoire : (Yt1 , Yt2 , . . . , Ytn ) est normalement distribu. On peut observer quun processus
linaire bruit blanc gaussien est gaussien.
Yt = 0 + 1 Yt1 + Zt , t Z (2.16)
Comme alors, 0 = (1 1 ) on a :
Yt = 1 (Yt1 ) + Zt
(1 1 B)Yt = Zt
Par substitutions successives on obtient que Yt peut tre exprim comme une moyenne mobile infinie :
pourvu que 1 < 1 < 1. Cette condition est suffisante pour que le processus soit stationnaire. Dans
ce cours nous supposerons toujours quun processus qui vrifie (2.16) est stationnaire si et seulement si
1 < < 1.
On appelle (2.17) la reprsentation MA() de Yt . Lcriture de Yt comme une somme de v.a. non corr-
les permet de calculer facilement les variance et autocovariances comme nous le voyons maintenant.
Elevons au carr les deux cts de (2.17), il vient :
var(Yt ) = Z2 (1 + 2 + 4 + . . . )
Z2
=
1 2
Enfin crivons (2.17) en t k et calculons les esprances des deux cts de :
k = k , k = 0, 1, 2, . . . (2.18)
Exemples
AR(1) simul. On a simul 150 observations de yt obissant
To Chi- Pr >
Lag Square DF ChiSq --------------------Autocorrelations---------------
Ces rsultats ont t obtenu par la syntaxe (la srie simule y est dans la table a) :
0
E(Yt ) = =
1 1 2
Yt = 1 (Yt1 ) + 2 (Yt2 ) + Zt
Nous obtenons :
On appelle (2.21), lquation de moments dun AR(2). La fonction dautocorrlation dun AR(2) est :
1
(1) = (2.22)
1 2
(l) = 1 (l 1) + 2 (l 2), l > 1
Condition de stationnarit dun AR(2) Il faut pouvoir lcrire comme un MA(). Prcisons. Un
processus qui vrifie (2.19) est stationnaire si et seulement si les racines du polynme caractristique
1 1 B 2 B2 sont > 1 en module.
Explication. Soit s1 et s2 les racines de 1 1 z 2 z 2 = 0. On a donc (1 z/s1 )(1 z/s2 ) = 0
1
et on peut dvelopper en srie 11 z 2 ssi |1/s1 | < 1 et |1/s2 | < 1.
2z
CHAPITRE 2. ARMA - SARMA 28
Processus autorgressif dordre p Une extension immdiate du modle AR(1) est le modle AR(p).
Soit {Zt } un BB. Un processus {Yt } est dit autorgressif dordre p sil scrit :
Yt = 0 + 1 Yt1 + 2 Yt2 + + p Ytp + Zt
Avec loprateur retard on peut crire cette autorgression lordre p comme :
(1 1 B 2 B2 p Bp )Yt = 0 + Zt
(B)Yt = 0 + Zt
Supposons en particulier que Xt soit autorgressif, un AR(3) pour fixer les ides, alors il est clair que
Xt4 napporte rien de plus que Xt1 , Xt2 , Xt3 pour expliquer Xt et on montre en effet que pour
un AR(3) k,k = 0, k > 3. De mme la PACF dun AR(p) est nulle partir de lordre p + 1.
Estimation de la PACF. De mme que dans la mthode des MCO les b sexpriment en fonction des
moments dordre 2 des observations, la PACF dune srie stationnaire sexprime en fonction de son ACF
(cette dpendance est dcrite par lalgorithme de Durbin-Levinson).
Dun point de vue pratique on pensera quune srie suit un AR(p) si les bk,k 0, k > p. Prcisment,
si Xt est un AR(p), on a les proprits :
bp,p converge vers p,p quand n ,
bl,l , l > p converge vers 0 quand n ,
var(bl,l ) 1/n l > p.
La PACF empirique permet donc didentifier un processus comme un AR dun certain ordre p. Mais
on peut galement identifier lordre dun processus quon sait AR, par un critre dinformation (AIC,
SBIC...).
Moments dordres 1 et 2 dun MA(1) En prenant lesprance mathmatique des deux cts de 2.23,
on voit que
E(Yt ) =
La variance de Yt est la variance dune combinaison affine de variables non corrles donc : var(Yt ) =
(1 + 2 )Z2 . De mme, cov(Yt , Yt1 ) = cov( + Zt Zt1 , + Zt1 Zt2 ) = Z2 . On voit
que cov(Yt , Ytk ) = 0, k > 1. En rsum, , le processus MA(1) dfini par (2.23) est stationnaire, de
moyenne , de fonction dautocorrlation :
1
si k = 0,
(k) = 1+2 si k = 1,
0 si k > 1
Etudiant la fonction R 1+ 2 on constate que | 1+ 2 | 0.5 ainsi :
le processus MA(1) ne peut pas dcrire des phnomnes forte autocorrlation.
Dautre part, on aimerait pouvoir exprimer le processus en fonction de son pass (observ) et pas seule-
ment en fonction dun bruit.
Inversibilit. Introduisons le processus centr, Yt = Yt , correspondant (2.23). On voit que si
|| < 1, on peut dvelopper (1 B)1 en srie entire. Ceci nous amne une dfinition.
On dit quun processus est inversible si on peut lcrire comme une autorgression infinie. Ainsi, un
MA(1) est inversible si la racine de lquation 1 z = 0 est > 1 en module. On observe que la
condition dinversibilit dun MA(1) est techniquement parallle la condition de stationnarit dun
autorgressif dordre 1.
Processus MA(q) Un processus (Yt ) est dit processus moyenne mobile dordre q (M A(q)) si :
o Zt BB(0, Z2 ).
On peut noter de faon quivalente :
Yt = + (1 1 B 2 B2 q Bq )Zt
= + (B)Zt
Proprits.
1. Un M A(q) est un processus stationnaire.
2. La fonction dautocorrlation dun processus MA(q) est nulle partir de lordre q + 1.
Cette dernire proprit est utile pour deviner (identifier) lordre de moyenne mobile convenable pour
modliser une srie. En effet, en prsence dun corrlogramme empirique non significativement diffrent
de 0 partir dun certain ordre (k), on pensera modliser la srie correspondante par un MA(k 1).
Processus ARMA(p,q) {Yt } est un processus ARMA(p,q) sil est stationnaire et obit une quation :
(1 1 B 2 B2 p Bp )Yt = 0 + (1 1 B 2 B2 q Bq )Zt ,
ou encore :
0 1 1 B 2 B2 q Bq
Yt = + Zt , (2.25)
1 1 B 2 B2 p Bp 1 1 B 2 B2 p Bp
Examinons le 1er terme du ct droit avec, pour simplifier lcriture, p = 2. Cest une fraction rationnelle
en B. Le numrateur est une constante et le polynme 1 1 B 2 B2 se factorise en termes de degr 1,
rels ou complexes : 1 1 B 2 B2 = (1 d1 B)(1 d2 B) o les di sont les inverses des racines du
polynme.
La stationnarit de Yt implique que |di | < 1, i = 1, 2. Alors (1 d1 B)1 = 1 + d1 B + d21 B2 + et
(1 1 B 2 B2 )1 = (1 + d1 B + d21 B2 + )(1 + d2 B + d22 B2 + ) et donc le processus peut scrire
comme un MA(i nf ty) et est donc est bien stationnaire.
Maintenant, si c est constante dans le temps, (1 + d1 B + d21 B2 + )c = (1 + d1 + d21 + )c =
(1/(1 d1 ))c. Finalement (2.25) revient :
0 1 1 B 2 B2 q Bq
Yt = + Zt (2.26)
1 1 2 p 1 1 B 2 B2 p Bp
2 q
11 B2 B q B
Dautre part E( 2 p Zt ) = 0, en utilisant le mme argument que ci-dessus.
11 B2 B p B
Do :
0
= E(Yt ) = .
1 1 p
La fonction dautocovariance dun ARMA(p,q) se calcule par des quations de rcurrence (voir 2.22
pour un AR(2)).
Notes
1 Les quations qui relient les paramtres AR et MA aux coefficients dautocorrlation (voir (2.21, pour
le cas dun AR(2)) sont les quations de Yule-Walker : tant donn les coefficients auto-rgressifs et de
moyenne mobile, on peut trouver les coefficients dautocorrlation. Inversement, tant donn une fonc-
tion dautocorrlation empirique et des ordres p et q, on peut obtenir par ces quations des estimations
des paramtres AR et MA. Ces estimations servent de valeurs initiales dans lestimation MV 1 des para-
mtres.
2 Un ARMA(p, q) stationnaire et inversible peut scrire comme un AR(). Mais trs souvent un AR(p )
dordre p pas trs suprieur p en donne une trs bonne approximation : les paramtres sont certes mal
estims mais la srie est bien prdite et son erreur correctement reconstitue. Cest lide quexploite la
mthode didentification MINIC que nous verrons plus loin.
3 On trouvera en annexe de ce chapitre, un exemple dquations de Yule-Walker, bien comprendre,
ainsi quune prsentation de lestimation des AR et des MA quil faut au moins parcourir pour voir que
lestimation dun MA est assez difficile.
4 On trouvera encore en annexe, une prsentation de la prvision, quil suffira de parcourir pour com-
prendre le principe, mais sur laquelle il nest pas utile de se pencher longuement.
1
MV = Maximum de Vraisemblance
CHAPITRE 2. ARMA - SARMA 31
2.5 Saisonnalit
2.5.1 Saisonnalit multiplicative
Dcrivons brivement la modlisation de la saisonnalit dans lapproche de Box-jenkins. Soit une srie
mensuelle observe (pour simplifier) sur un nombre entier dannes, partir dun mois de janvier. On
note yij lobservation du mois j de lanne i; j = 1, , 12, i = 1, , N .
Rangeons les valeurs observes en une table de Buys-Ballot : une ligne par an, une colonne par mois :
(B)Yt = c + (B)bt
Il est fort probable, si la srie prsente une saisonnalit, que le rsidu bbt ne sera pas blanc mais aura une
structure de corrlation saisonnire. On peut envisager deux traitements de cette "non blancheur". Ou
bien on ajoute des termes de retard dans les polynmes et , ou bien on modlise bt par un ARMA
dont lunit de temps est lanne :
s (Bs )
bt = zt
s (Bs )
o s dsigne la priode (ici, s= 12). Ce qui donne :
avec Zt BB, o (B), s (Bs ), (B), s (Bs ) sont respectivement des polynmes de degrs p, q en
B et P, Q en Bs . On dit que Yt est un SARMA(p, q)(P, Q)s sil vrifie (2.27) et est stationnaire.
Les conditions de
stationnarit de Yt sont : les racines des polynmes (B) et s (Bs ) sont en module > 1.
inversibilit de Yt sont : les racines des polynmes (B) et s (Bs ) sont en module > 1.
(1 (1 + 1 )B + 1 B2 3 B3 + 3 B4 )Yt = d + (1 1 B 2 B2 )Zt
il y a bien une partie autorgressive mais son polynme dautorgression a 1 comme racine et la
srie est non stationnaire. On ncrit pas que cest un AR(4,2) mais un ARIMA(3,1,2).
CHAPITRE 2. ARMA - SARMA 32
La srie diffrencie (1 B)Yt est la srie des accroissements de Yt , alors que la srie diffrencie deux
fois (1 B)2 Yt est la srie des accroissements des accroissements. Lopration inverse de la diffrencia-
tion est lintgration do le I dans "ARIMA".
Un processus Yt est un SARIMA(p, d, q)(P, D, Q)s sil obit
(1 1 B q Bq )(1 1 Bs Q BsQ )
(1 B)d (1 Bs )D Yt = c + Zt (2.28)
(1 1 B p Bp )(1 1 Bs P BsP )
(B)s (Bs )
(1 B)d (1 Bs )D Yt = c + Zt
(B)s (Bs )
o
s (Bs ) = 1 1 Bs Q BsQ
et
s (Bs ) = 1 1 Bs P BsP
Par exemple un SARIMA(0, 1, 1)(1, 1, 0)12 obit :
1 1 B
(1 B)(1 B12 )Yt = c + Zt (2.29)
1 1 B12
Nous verrons au chapitre (3), les tests de racine unit permettant de dcider sil faut diffrencier une
srie.
Yt = t + Ut
avec var(Ut ) = h2 (t ) 2 pour une certaine fonction h. Pour traiter cette situation dhtroscdasticit,
on cherche une transformation g telle que var(g(Yt )) constante. Cest la technique dite de stabili-
sation de la variance.
Par linarisation on a :
g(Yt ) g(t ) + (Yt t )g (t )
et
var(g(Yt )) [g (t )]2 var(Yt )
On cherche donc g telle que g (x) = 1/h(x). Par exemple, pour h(x) = x, g (x) = 1/x et donc
g(x) = log(x).
Soit une srie Yt qui montre la fois une croissance dans le temps : t = E(Yt ) fonction croissante de t et
une variabilit qui augmente avec t : var(Yt ) fonction croissante de t. Si on modlise ce phnomne par :
var(Yt ) = c2t on voit que la transformation en log stabilisera la variance. Cette situation est classique
dans les sries de stock. Les exemples "ventes de champagne", "ventes de vin" entrent dans ce cadre.
La srie de la consommation britannique utilise plus loin dans ce chapitre en est un autre exemple. En
prsence de telles sries on commence par les transformer en log avant de faire une modlisation ARIMA
ou autre.
tape didentification (au sens de lautomatique) Il faut, avant lestimation, choisir les paramtres p, d
et q. En examinant laspect de la FAC (Fonction dautocorrlation) empirique, on se fait une ide
de la stationnarit (atteinte ou non) de la srie. On considre quune srie est stationnaire quand sa
FAC empirique dcroit suffisamment vite vers 0, mais nous verrons dans un autre chapitre les tests
de racine unit (il y a racine unit dans lautorgression si d> 0). On exammine ensuite laspect
des ACF et PACF de la srie. On se fait ainsi une ide des ordres p et q possibles. Des mthodes
daide au choix de p et q ont t proposes. SAS en intgre plusieurs. Dans une sous-section, nous
dcrivons rapidement la mthode MINIC.
tape destimation Une fois p et q choisis, on estime le modle. On teste dabord que le rsidu Z bt est
un bruit blanc. Si on doit rejeter cette hypothse, il faut revoir le choix des ordres p et q, et de
la transformation initiale. Si on peut considrer que le rsidu est un bruit blanc, on analyse les
rsultats de lestimation suivant les mmes principes quen rgression linaire : significativit des
i et j daprs les t-statistiques, corrlations entre les estimateurs de ces paramtres.
Si on rejette la blancheur du rsidu, lexamen de son ACF ou PACF aide corriger le modle. On
en a vu un exemple avec les SARMA.
Remarque. Les logiciels qui ajustent un modle ARMA dordres p et q donns, une srie suppo-
se stationnaire, fournissent une reprsentation inversible : les racines de (B) = 0 et (B) = 0
sont > 1 en module. Quand on essaie dajuster un modle ARMA une srie non stationnaire, on
obtient souvent un message davertissement ou derreur de la part du logiciel car les procdures
CHAPITRE 2. ARMA - SARMA 34
numriques doptimisation mises en uvre pour lestimation ne convergent pas ou convergent mal
dans un tel cas.
tape de prvision On utilise enfin le modle estim pour prdire la srie. Il est recommand de nuti-
liser quune partie de la srie pour estimer le modle, de faon pouvoir comparer ensuite pour
un mme intervalle de temps, ralisations et prvisions. Ltape de prvision fournit le rsidu
Zt , t = 1, , T et si on indique un horizon h de prvision, les prvisions yT (k), k = 1, , k
et, sous lhypothse de normalit de la srie, les intervalles de prvision, bass sur des variances
derreur de prvision du type de (2.44) et un niveau quon peut choisir.
Lchec de la modlisation peut venir de causes varies dont la non stationnarit de la srie.
A Parcimonie. On ne doit pas accumuler des paramtres. Cest un principe gnral en statistique. Dans
une modlisation ARIMA il ne faut donc pas ajouter des paramtres pour capter la moindre trace dau-
tocorrlation dans les rsidus dun ajustement antrieur.
B On a rarement un modle satisfaisant ds la 1re identification. A partir dun premier modle il faut alors
chercher des voies damlioration.
Aller du simple au compliqu. On commence par capter les principales caractristiques par lexamen
des ACF et PACF. On examine ensuite les ACF et PACF des rsidus du modle ajust et on corrige le
modle estimer ... et on recommence. Cest sur cette ide quon a introduit les modles SARMA.
Simplifier. On commence par un modle avec (relativement) beaucoup de paramtres. Si on accepte la
blancheur de son rsidu, on essaie de le simplifier en examinant les t-statistiques des coefficients et la
matrice des coefficients de corrlation entre les estimateurs des paramtres (des coefficients suprieurs
0.9 indiquent souvent une mauvaise spcification).
C Toutes les sries ne se prtent pas une modlisation ARIMA et une modlisation ARIMA ne permet
pas certaines oprations telle que la mise en vidence dune composante saisonnire.
D Prvision. Le temps quon peut consacrer la prvision dune srie guide le choix des mthodes. Si
lon doit prdire quelques centaines de sries en une journe, on utilisera des mthodes de prvision
(souvent du lissage exponentiel) qui choisissent automatiquement un modle sur un critre de qualit de
la prvision un certain horizon.
Voir sur ces questions la documentation de la proc forecast de SAS ou le package forecast de
R:
www-personal.buseco.monash.edu.au/~hyndman/Rlibrary/forecast/
o Zt BB(0, Z2 ). Rappelons que Zt est le rsidu de la projection de Yt sur son pass : Yt1 , Yt1 , .
Lexpression quon peut choisir pour cette projection nen change pas la valeur.
Comme le processus est suppos inversible on peut le reprsenter comme un AR() et en choisissant
un ordre dautorgression suffisamment grand on peut toujours approcher le modle ARMA de cette
srie par un modle AR. Prcisment :
et Zt
p (B)Yt = Z (2.32)
pour p suffisamment grand, o les paramtres sont estims par les quations de Yule-Walker.
Dautre part le critre BIC (Bayesian Information Criterion) pour un ajustement dun ARMA(m,j)
gaussien vaut :
On peut observer que le BIC dpend du nombre de paramtres et, seulement indirectement, de leurs
valeurs par lintermdiaire de s2 estimation de la variance de linnovation. Comme pour lAIC rappel
un peu plus loin, entre plusieurs modles non ncessairement embots, on retient le modle de BIC
minimum.
Si on a ajust un AR dordre p suffisamment lev, la projection de Yt sur son pass est correctement
be
value et le rsidu Z t est alors une bonne prdiction de lerreur de prvision, Zt . Pour estimer alors un
ARMA(m,j) on ajuste le modle :
be be be
Yt = 1 Yt1 + 2 Yt2 + + m Ytm + 1 Z t1 2 Z t2 j Z tj + ut , (2.34)
Notes.
Parfois le BIC est dfini comme (2.33) divise par n.
Le modle AR dordre lev quon ajuste peut donner un ajusement parfait (sur ajustement) quand la
srie est courte. On souponne une telle situation si le BIC prend des valeurs trs ngatives.
Lapplication de cette mthode ne dispense pas dessayer de simplifier le paramtrage, notamment en
cas de saisonnalit.
Exemple
Simulation dun ARMA(1,2) :
z = 2*rannor( 1436 );
u = .9 *um1 +z -.1*z1+.9*z2;
if t > 0 then
do;
10 date = intnx(month, 31dec1960d,t);
format date monyy.;
output;
end;
z2=z1;
15 z1 =z;
um1=u;
end;
run;
Etape didentification avec loption minic, o on prcise les ordres extrmes des autorgressions auxi-
liaires.
5 Le Systme SAS
Une tape destimation avec les valeurs suggres p=1 et q=2, confirme ensuite (a) la blancheur du bruit
et (b) quil ny a pas de paramtre non significatif.
e p=1 q=2; run;
A moins que la srie tudie ne soit dj un BB, ce test conclut habituellement au rejet de lhypo-
thse de blancheur. La commande identify peut tre suivie de plusieurs commandes
2. estimate, on doit crire une par modle quon veut estimer sur la srie dfinie la dernire
tape identify. estimate connat d et D de ltape identify, on lui donne des valeurs
de p, q, P, Q et elle fournit les estimations des paramtres , , , et de la variance de Zt pour le
modle ainsi spcifi. Elle fournit aussi un test de blancheur de Zbt sous le titre Autocorrelation
Check of Residuals. Si lon rejette lhypothse de blancheur des rsidus il faut essayer un
autre ajustement.
Pour chaque modle estim on peut vouloir faire plusieurs prvisions dhorizons diffrents par
exemple. Do une ou des tapes
3. forecast, qui fait des prvisions sur le dernier modle estim.
En rsum, une tape forecast se base sur la dernire tape estimate , et une tape estimate sur
la dernire tape identify.
Chaque tape doit se terminer par run; et la proc arima par quit; .
Exemples de syntaxe La table serieg de la librairie SAS st contient une variable xlog et une
variable de date : ladate. (xlog est le logarithme de la Srie G de louvrage de Box-Jenkins ([1]),
transport arien mensuel de passagers de 1949 1961).
Identification de la srie. La proc arima ne faisant de diagrammes squentiels il est conseill duti-
liser simultanment le T IME S ERIES V IEWER pour visualiser les sries et leurs transformations. Menu
S OLUTIONS /A NALYSIS /T IME S ERIES V IEWER. En vue de cette visualisation il est fortement conseill
de crer une variable de date dans la table.
Dessiner lACF la PACF et lIACF
de la srie xlog :
proc arima data= st.seriesg;
identify var=xlog;
run;
de la srie des accroissements de xlog dun mois sur lautre et en nimprimant les autocorrlations que
jusquau dcalage 15 :
identify var=xlog(1) nlag=15;
run;
de la srie diffrencie 1 fois lordre 1 et 1 fois lordre 12 :
identify var=xlog(1,12) ;
run;
quitter la proc arima
quit;
La syntaxe complte de ce quon vient de faire est donc :
Estimer un ARIMA(2,1,3) sur la srie xlog par la mthode des moindres carrs inconditionnels et
obtenir dans loutput les 3 fonctions dautocorrlation des rsidus :
Aprs cette tape, estimer un SARIMA(0, 1, 1)(0, 1, 1)12 sur xlog en contraignant la constante additive
0 et par la mthode des moindres carrs conditionnels (par dfaut) :
Pour avoir les 3 fonctions dautocorrlations du rsidu il faut ajouter loption plot :
estimate q=(1)(12) noconstant plot;
Prdire la srie 2 ans et stocker les prvisions, les bornes de lintervalle de prvision ( 95% par dfaut)
et les rsidus, pour les dates o ils sont dfinis, dans la table st.previ sans les mettre dans loutput
(noprint) :
Loption interval= permet SAS dextrapoler la date. Loption id= copie la variable dsigne
ensuite, dans le fichier. Ne pas oublier quit; pour avoir accs au fichier des prvisions.
Dtails sur la commande identify Pour stocker les fonctions dautocorrlation calcules, option outcov=.
Faire un test de racine unit : statiaonarity= : pour faire un test de Dickey-Fuller sur la srie x de
la table SeriesA
Notes
1. LAIC est form de deux termes :
a) 2 log(L) qui est dautant plus faible que lajustement MV est bon,
b) 2k qui pnalise cette faible valeur par le nombre de paramtres estims.
2. Les critres dinformation, AIC, BIC ou autres ou la PACF ne suggrent pas ncessairement les mmes
ordres pour une srie donne.
3. LAIC comme le BIC permet de comparer des modles non embots, AR ou autres.
2.9.1 Modlisation du niveau du Lac Huron
Le niveau du lac Huron examin au chapitre 1 montre :
une tendance lgrement dcroissante,
une variabilit plus grande aux dates rcentes quau dbut de la srie (htroscdasticit),
enfin on observe que les rsidus de lajustement dune droite par MCO au niveau, deux dates cons-
cutives sont corrls positivement (1.15).
La srie est courte et nous nessaierons pas de modliser lhtroscdasticit.
Objectif. Prdire le niveau lhorizon 1.
Si lobjctif est de prdire le niveau lan prochain, il faut exploiter la fois la linarit de la tendance et la
corrlation de la srie 2 dates conscutives.
Rgression linaire du niveau sur lanne et stockage des rsidus de cet ajustement.
yt = 0 + 1 t + ut , t = 1, , T (2.35)
CHAPITRE 2. ARMA - SARMA 40
10 Autocorrelations
30
Partial Autocorrelations
Lag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1
35 1 0.76160 | . |*************** |
2 -0.27544 | ******| . |
3 0.05104 | . |* . |
4 -0.01301 | . | . |
5 0.02166 | . | . |
40 6 -0.04669 | . *| . |
7 0.06037 | . |* . |
8 0.05885 | . |* . |
9 0.02958 | . |* . |
10 -0.21408 | ****| . |
45 11 -0.00921 | . | . |
CHAPITRE 2. ARMA - SARMA 41
On a choisi loption noint car le rsidu tant de moyenne 0, la moyenne estime est elle-mme nulle.
5 Erreur Pr.
Paramtre Estimation standard Valeur du test t Approx. > |t| Retard
20 Correlations of Parameter
Estimates
Autoregressive Factors
Le rsidu de cet ajustement est un BB. En rsum, le modle de lerreur ajust sur les rsidus MCO est
1
ut = Zt
1 1.00826B + 0.2883B2
avec Zt BBN (0, 0.467565).
Le modle de la moyenne obtenu par MCO est dautre part :
Noter quon stocke deux rsidus : rm correspond u bt et r ou residual Zbt . De mme p= permet de
stocker la prvision lhorizon 1 de la srie, tenant compte de la dynamique de lerreur.
Le dbut du traitement commence par une rgrssion MCO. Ensuite autoreg se base sur les rsidus de
cette rgression pour estimer le modle globalement.
15 Erreur Proba.
Variable DF Estimation standard Valeur du test t Approx. > |t|
30
Preliminary MSE 0.4857
Yule-Walker Estimates
Erreur Proba.
Variable DF Estimation standard Valeur du test t Approx. > |t|
Autocorrelations
30
Autocorrelation Check for White Noise
To Chi- Pr >
Lag Square DF Khi2 ---------------Auto-corrlations--------------
35
6 0.79 6 0.9923 0.052 -0.010 0.007 0.043 0.054 -0.006
12 5.38 12 0.9441 -0.030 -0.034 0.163 -0.006 -0.097 -0.057
18 6.29 18 0.9949 -0.040 0.002 -0.025 0.032 -0.008 -0.065
24 10.59 24 0.9916 -0.010 -0.141 -0.010 0.006 0.115 0.015
40
o les xit sont des variables explicatives dterministes. Un ARMAX est, sa moyenne prs qui nest pas
constante, un ARMA.
Exercices.
(1) On a choisi dajuster un AR(2) lerreur et on a estim le modle avec loption par dfaut de
autoreg, cest--dire la mthode de Yule-Walker. Comparer les ajustements avec erreur AR(1)
ou AR(2), faire ces ajustements par maximum de vraisemblance, comparer les AIC obtenus et conclure.
Indication. A ltape model ajouter loption method= ml aprs le \.
(2) On considre le modle
1 B
Yt = a + b t + .
1 1 B 2 B2
Ecrire ce modle sans utiliser de fraction rationnelle. (Il faut multiplier gauche et droite par le dno-
minateur.)
Si lerreur a une composante MA, lestimation dun ARMAX doit se faire par la proc arima. Le
mme travail que ci-dessus sobtient alors par la syntaxe :
La syntaxe nest pas trs explicite statistiquement, ainsi loption crosscorr de la commande identify
ne fait pas rfrence ici une quelconque corrlation croise entre deux sries temporelles.
5 Erreur Pr.
Paramtre Estimation standard Valeur du test t Approx. > |t| Retard Variable
15 Paramtre Shift
MU 0
AR1,1 0
AR1,2 0
20 NUM1 0
45 To Chi- Pr >
Lag Square DF Khi2 ---------------Auto-corrlations--------------
Autoregressive Factors
60
Factor 1: 1 - 1.01092 B**(1) + 0.29015 B**(2)
Input Number 1
65
Input Variable DATE
Overall Regression Factor -0.00006
Les diffrences entre les estimations des coefficients autorgressifs entre arima et autoreg sont dues
aux algorithmes mis en oeuvre.
data b;
merge lakout armax;
by date;
run;
5
proc gplot data=b;
symbol1 v=dot i=join ;
symbol2 v= plus i=r color=black;
symbol3 v= star i=join color=red;
10 plot niveau * date = 3 forecast * date = 2 pred* date=3 / overlay;
run;
Les coefficients du temps ne sont pas du mme ordre de grandeur dans SAS et R car le temps nest pas
mesur de la mme faon.
Annexe
2.10 Estimation dun ARMA
On examine dans cette section, comment crire la fonction de vraisemblance de processus de base :
AR(1) et MA(1). Une fois obtenue la fonction de vraisemblance, son optimisation est un problme nu-
mrique. Si la fonction de vraisemblance est quadratique, on dbouche sur le problme des moindres
carrs linaires classique. Sinon on a un problme non linaire qui doit se rsoudre par un algorithme
doptimisation. Nous ntudions pas ces algorithmes dans ce cours.
2.10.1 Fonction de vraisemblance dun processus gaussien AR(1)
On a la srie yt , t = 1, 2, , T , observation de {Yt } AR(1) :
(BBN = Bruit Blanc Gaussien). Evaluation de la fonction de vraisemblance. On sait qualors Yt suit une
c 2
loi normale et on a dj calcul ses moyenne et variance : E(Yt ) = = 1 , var(Yt ) = 1 2 . Notons
2
= (c, , ) le vecteur des paramtres estimer. La fonction de densit de probabilit (f.d.p.) de Y1
est :
1 (y1 c/(1 ))2
fY1 (y1 ; ) = p exp[0.5 ]
2 2 /(1 2 ) 2 /(1 2 )
Considrons maintenant la loi conditionnelle de Y2 sachant que Y1 = y1 . Cest une loi normale de
moyenne c + y1 , de variance 2 do la f.d.p.
1 (y2 c y1 ))2
fY2 |Y1 =y1 (y2 ; ) = exp[0.5 ]
2 2 2
L() = (2.38)
T
X
1 2 1 (y1 c/(1 ))2 T 1 1 (yt c yt1 )2
ln(2 2
) 2 2
ln(2 2 )
2 1 2 /(1 ) 2 2 2
t=2
Si on nglige le log dterminant dans cette expression, sa maximisation donne lestimateur des moindres
carrs inconditionnels de .
CHAPITRE 2. ARMA - SARMA 48
On reconnat que (2.39) a la mme forme que la log vraisemblance associe lestimation de la
moyenne et de la variance dune v.a. normale, base sur T 1 observations indpendantes de cette
c et b solution de
v.a.. Drivant par rapport c et on obtient b
P 1 P
c T
P 1 y
P 2 t1 P 2y t
=
yt1 yt1 yt1
1 (y2 + z1 )2
fY2 |Y1 =y1 ,Z0 =0 (y2 ; , , 2 ) = exp(0.5 ).
2 2 2
Ensuite connaissant z1 et y2 on peut calculer z3 = y2 + z1 ... Ainsi ayant fix la valeur de Z0
(ici la moyenne) et disposant des observations y1 , , yT on peut calculer pour chaque valeur de
(, , 2 ) : z1 = y1 , z2 = y2 + z1 , , zt = yt + zt1 et la distribution conditionnelle
de Yt |Yt1 = yt1 , , Y1 = y1 , Z0 = 0. Sa f.d.p. est :
1 1
fYt |Yt1 =yt1 ,Y1 =y1 ,Z0 =0 (yt ; , , 2 ) = exp[ (yt + zt1 )2 ].
2 2 2 2
avec 0 = 1. Cest--dire, Yt scrit comme une combinaison linaire (c.l.) des valeurs Zt , Zt1 , . . . .
Considrons dautre part sur lcriture AR()
X
Yt = Zt + j Ytj
j=1
on voit que Zt scrit comme une c.l. des Yt , Yt1 , . . . . Ainsi, lespace engendr par les c.l. de Yt , Yt1 , . . .
est le mme que celui engendr par les c.l. de Zt , Zt1 , . . . . Notamment :
E(Zn+j |Yn , Yn1 , . . . ) = E(Zn+j |Zn , Zn1 , . . . ) et donc
E(Zn+j |Yn , Yn1 , . . . ) = 0 si j > 0, = Zn+j si j 0.
P le processus jusquau temps n et on veut le prdire lhorizon l, cest--dire prdire
On a observ
Yn+l = j=0 j Zn+lj partir de Yn , Ynl , . . . l > 0. La prvision est une fonction linaire de
CHAPITRE 2. ARMA - SARMA 50
Yn , Yn1 , . . . . La prvision lhorizon l tant donn lobservation jusquau temps n peut donc aussi
scrire comme une fonction linaire de Zn , Zn1 , . . . :
lEQP est minimise quand l+j = l+j , j = 0, 1, . . . donc :
Les calculs ci-dessus sont simples car tout est exprim en fonction du bruit blanc Zt , mais ils ne sont pas
directement utilisables car Zt nest pas observ. On envisage maintenant une expression plus utilisable
de la prvision.
Calcul de la prvision
Considrons le processus ARMA(p,q) centr examin prcdemment :
et
Ybn (l) = + (Ybn (l 1) ) = + l (Yn ) l1 Zn , l 2
o Zn = Yn Ybn1 (1). P
Variance de lerreur de prvision. Lcriture MA() : Yt = +
j=0 j Ztj sobtient en dvelop-
pant, (1 B)/(1 B) :
1 B
= 1 + 1 B + 2 B2 + 3 B3 + . . .
1 B
ou
(1 B)(1 + 1 B + 2 B2 + 3 B3 + . . . ) 1 B.
Identifiant les termes de mme puissance de B gauche et droite on obtient :
j = j1 ( ), j 1.
2
qui tend vers Z2 ()
12
quand l .
Notes.
1. On peut voir sur lestimation dun MA(1) ci-desssus quil y a des choix faire, notamment dans
linitialisation des rsidus. La varit des possibilits fait quil est assez difficile de trouver exac-
tement les mmes rsultats avec des logiciels diffrents.
2. Les logiciels (la proc arima de SAS ou la fonction arima() de R), font la prvision aprs
modlisation, partir dune reprsentation dtat de la srie.
1 1 z 2 z 2 = 0
sont > 1 en valeur absolue (ou en module si complexes). Ceci nous assure que la srie (Yt ) est station-
naire.
Nous admettons que
INNO cov(Zt , Ytk ) = 0, si k > 0.
= c + 1 + 2 + 0. (2.46)
Enlevons le CG (ct gauche) de (2.46) au CG de (2.45) et pareil pour les CD. Il nous reste
Yt = Yt
qui vrifie :
Multiplions les 2 cts de (2.48) par Zt . On a, par INNO et par le fait que Zt est un BB :
E(Zt Yt ) = cov(Zt , Yt ) = 1 E(Zt Yt1 ) + 2 E(Zt Yt2 ) + E(Zt Zt ) 1 E(Zt Zt1 ) (2.49)
E(Zt Yt ) = 0 + 0 + Z2 + 0 (2.50)
comme Zt est centr, ces esprances sont aussi des covariances. De mme
0 = 1 1 + 2 2 + Z2 1 (1 1 )Z2
0 = 1 1 + 2 2 + (1 1 (1 1 ))Z2 (2.54)
1 = 1 0 + 2 1 1 Z2 (2.56)
CHAPITRE 2. ARMA - SARMA 53
k = 1 k1 + 2 k2 (2.58)
2 = 1 1 + 2 0 (2.59)
Divisons (2.54), (2.56) et (2.59) par 0 . Nous obtenons des quations de Yule-Walker pour un ARMA(2,1).
Z2
1 = 1 1 + 2 2 + (1 1 (1 1 )) (2.60)
0
Z2
1 = 1 + 2 1 1 (2.61)
0
2 = 1 1 + 2
k = 1 k1 + 2 k2 , k > 1 (2.62)
Z2
1 = 1 1 + 2 2 + (2.63)
0
1 = 1 + 2 1 (2.64)
2 = 1 1 + 2 (2.65)
k = 1 k1 + 2 k2 , k = 1, 2, (2.66)
Proprit gnrale quon vient dillustrer sur un ARMA(2,1) : pour un ARMA(p,q), partir de lordre
q + 1 la fonction dautocorrlation suit la mme rcurrence que celle de lAR(p) correspondant.
Comment se sert-on des quations de Yule-Walker ?
Cas dun AR(2).
Si on en connat les paramtres , on peut calculer la fonction dautocorrlation thorique.
Si on dispose destimations des k on peut rsoudre le systme des 2 quations linaires (2.64) et
(2.65) pour trouver des estimations de 1 et 2 . Ces estimations peuvent servir de valeurs initiales
pour la mthode du maximum de vraisemblance.
Yt = 0.7Yt1 0.8Yt2 + Zt
a= polyroot(c(1,.7,.8))
Mod(a)
> Mod(a)
[1] 1.1180 1.1180
les racines sont en module > 1 donc on a bien dfini une srie stationnaire. Par les formules (2.21 et
2.22) on obtient : 0 = 1, 1 = .7/(1 + .8) = 0.38889.
Maintenant on peut utiliser la rcurrence pour calculer k , k > 1
rho = rep(NA, 11)
rho[1] =1
rho[2] = -0.38889
for( i in 3:11)
rho[i] = phi1*rho[i-1] + phi2 * rho[i-2] 5
> # FAC thorique du dcalage 0 au dcalage 10
> rho
[1] 1.000000 -0.388890 -0.527777 0.680556 -0.054168 -0.506527 0.397903 0.126690
-0.407005 0.183552 0.197118
10
Inversement, simulons une srie de 200 valeur AR(2) suivant le modle ci-dessus, et calculons la FAC
empirique correspondante.
# Simulation de 200 valeurs
sersim = arima.sim(n = 200, list(ar = c(-0.7, -0.8)), sd = sqrt(2))
# FAC empirique
acf.2 = acf(sersim, lag.max = 10, plot=FALSE, type = "correlation") 5
acf.2
Autocorrelations of series sersim, by lag
0 1 2 3 4 5 6 7 8 9 10
1.000 -0.336 -0.596 0.606 0.135 -0.552 0.169 0.328 -0.301 -0.098 0.274 10
Maintenant formons les quations de Yule-Walker pour un AR(2) ( formule 2.62 pour k = 2, 3).
2 1 1 1
= (2.67)
3 2 1 2
Dautre part nous avons une estimation des autocorrlations dordre 1, 2, On les reporte dans le
systme ci-dessus et on obtient les estimateurs de Yule-Walker de 1 et 2
# equations de Y-W pour estimer phi1 et phi2
# system lineaire
# snd membre
B = matrix( c(-0.596, 0.606), nrow=2,byrow=TRUE)
B 5
# matrice des coefficients
A = matrix(c(-0.336, 1, -0.596, -0.336),nrow=2, byrow=TRUE)
A
Phichap = solve(A,B) 10
CHAPITRE 2. ARMA - SARMA 55
Phichap
> Phichap
[,1]
[1,] -0.57236 15
[2,] -0.78831
Yt = 1 Yt1 + Zt
o donc Zt est un bruit blanc (0, Z2 )). On a vu que si 1 < 1 < 1 alors Yt est stationnaire.
Pour tester : 1 = 0 on peut estimer le coefficient par MCO (Moindres Carrs Ordinaires) et faire un test
de Student classique.
Supposons maintenant que 1 = 1. On obtient :
Yt = y0 + Z1 + Z2 + + Zt t0 (3.1)
Le processus Yt est alors appele une marche alatoire, voir la figure (3.1). (Il faut ncessairement un
point de dpart.)
Lexamen de certaines sries temporelles suggrent des extensions ce comportement. Ainsi, les rende-
ments composs des actions, dfinis par Rt = Yt Yt1 o Yt est le log du prix de laction, ressemblent
souvent un bruit blanc avec une moyenne lgrement positive. Ce qui suggre quun modle pour Yt
est :
Yt = + Yt1 + Zt .
On dit que Yt est une marche alatoire avec drive (ou drift) . En exprimant Yt1 en fonction de Yt2 ,...
on obtient :
Yt = t + y0 + Z1 + Z2 + + Zt .
Le graphique de Yt en fonction du temps est donc celui dune droite laquelle est superpose une marche
alatoire.
Proprits lmentaires
Proprits lmentaires dune marche alatoire.
E(Yt ) = y0 , var(Yt ) = tZ2 , var(Yt+1 ) = (t + 1)Z2 , cov(Yt , Yt+1 ) = tZ2 ,
limt var(Yt ) = q
t
et donc (Yt , Yt+1 ) = t+1 < 1.
56
CHAPITRE 3. PROCESSUS NON STATIONNAIRES 57
F IGURE 3.1 Marche alatoire F IGURE 3.2 ACF et PACF de la marche ala-
toire ci-contre
E(Yt ) = y0 + t , et les autres proprits de la marche alatoire sans drive restent valables.
Notes.
Une marche alatoire (dont la variance au moins nest pas constante) est videmment une srie non sta-
tionnaire. Avec notre vocabulaire sur les ARIMA, "marche alatoire" est quivalent "ARIMA(0,1,0)".
Une srie non stationnaire dont une diffrence premire, deuxime, est stationnaire est dite avoir
un trend stochastique. Les ARIMA(p,d,q) avec d > 0 sont des sries ayant un trend stochastique, on
dit que la srie est intgre dordre d, (I(d)), et la notation indique que la diffrence dede la srie est
un ARMAp, q). Les SARIMA avec Ds > 0 sont des sries saisonnalit stochastique.
Si dans une srie mensuel on est amen modliser la saisonnalit par des indicatrices de mois (indic.
de janvier = 1 pour tous les mois de janvier, = 0 sinon, indic. de fvrier = 1 pour tous les mois de
fvrier, = 0 sinon ) on choisit de modliser par une saisonnalit dterministe.
3.1.1 Illustration
Pour illustrer ces modles, on a simul une marche alatoire (Fig. 3.1) avec Y0 = 0, et dessin ses ACF
et PACF (Fig. 3.2)
Yt = Yt1 + Zt
cest--dire
Yt = Z1 + Z2 + + Zt (3.2)
puis une marche alatoire avec drive (Fig. 3.3) et dessin ses ACF et PACF (Fig. 3.4)
Yt = + Yt1 + Zt
cest--dire
Yt = t + Z1 + Z2 + + Zt (3.3)
On voit sur ces graphiques que : lACF ne dcroit jamais vers 0, une marche alatoire sans drive peut
prendre nimporte quelle valeur et donc ne peut pas tre stationnaire, une marche alatoire avec drive a
une tendance.
La question qui nous occupe maintenant est :
comment tester dans un autorgressif dordre 1, que 1 = 1 ou, comment tester que la racine du poly-
nme dautorgression 1 1 B = 0 est 1 ?
Plus gnralement, comment tester que le polynme dautorgression dun autorgressif dordre p a une
racine unit ? (Une autorgression dordre p nest appele AR(p) que si elle est stationnaire.)
CHAPITRE 3. PROCESSUS NON STATIONNAIRES 58
F IGURE 3.3 Marche alatoire avec drive F IGURE 3.4 ACF et PACF de la marche ala-
toire ci-contre
Yt est donc bien la somme dune tendance dterministe t et dun AR(1) centr 1 . Que se passe-t-il quand
1 = 1 ?
Dveloppons dabord (3.4). On obtient :
Yt = 1 + 2 t + 1 Yt1 + Zt (3.6)
o : 1 = a(1 1 ) + b1 , 2 = b(1 1 ).
Donc si 1 = 1 alors 2 = 0, 1 = b et
Yt = b + Yt1 + Zt ,
est une marche alatoire avec drive. En rsum, si Yt a un trend dterministe t , alors si 1 = 1
ncessairement, 2 = 0 ( donc on ne peut avoir la fois un trend stochastique et un trend dterministe
dans le modle (3.6)).
La dmarche suivante, qui arrive au mme rsultat, est peut-tre plus claire.
Enlevant Yt1 des deux cts de (3.4) et posant = 1 1, on obtient :
Yt = b + (Yt1 b(t 1) a) + Zt
de la forme, si < 0 :
Yt = 0 + 1 t + Yt1 + Zt (3.7)
ou, si = 0 :
Yt = b + Zt
1. Ce pourrait tre le modle du Lac Huron.
CHAPITRE 3. PROCESSUS NON STATIONNAIRES 59
et on voit directement ici que quand = 0, Yt a un trend stochastique avec drive b, et quand < 0, Yt
oscille autour de a + bt.
Cas dune autorgression dordre suprieur 1. Il est peu probable quun modle autorgressif dordre 1
suffise dcrire la dynamique. Considrons donc, en tendant ainsi (3.6), un autorgressif dordre p, pas
ncessairement stationnaire, avec tendance :
o les sexpriment en fonction des . Cette quation est la version pour un ordre p quelconque, de (3.7)
pour p = 1.
(On obtient la reprsentation 3.10 en crivant Ytp = Ytp+1 Ytp+1 , Ytp1 = Ytp+2 Ytp , ,
et en reportant dans (3.8).)
Examinons (3.10). Le ct gauche est la variation de la srie de t 1 t, lerreur en t ; elle est exprime
du ct droit comme une combinaison linaire dun trend, de la valeur de la srie la date prcdente,
des variations antrieures et de linnovation Zt ; on comprend la terminologie "modle de correction
derreur". Si la srie a une racine unit, alors le ct gauche de (3.10) qui est la srie diffrencie, est
stationnaire, donc le ct droit doit ltre aussi, au terme dterministe 1 + 2 t prs, ce qui exige
= 0 pour annuler le terme non stationnaire. Si la srie na pas de racine unit alors les deux cts sont
stationnaires et la srie peut avoir un trend linaire.
3.2 Test de non stationnarit due la prsence dune racine unit. Intro-
duction et pratique
La thorie et la pratique des tests de racine unit sont difficiles. Ces tests considrent lhypothse nulle :
"1 est racine du polynme dautorgression". (Si 1 est racine double, on doit diffrencier deux fois la
srie pour se ramener la stationnarit). Les tests de racine unit tant dlicats mettre en uvre, il est
indispensable de conduire ces tests paralllement un examen du chronogramme. Ici nous prsentons
seulement la technique du test ADF (Augmented Dickey-Fuller) et la marche suivre pour mettre en
uvre un tel test.
Principe.
Cas I : le chronogramme de la srie ne montre pas de tendance donc elle ne peut pas tre une marche
alatoire avec drive (Fig. 3.3), ni une srie avec un trend dterministe qui montrerait une volution
autour dune droite. La rgression considrer est donc
Yt = 1 + Yt1 + Zt ,
la constante 1 est l pour capter une moyenne non nulle ( = 1 / dans le cas o < 0 mais si = 0,
1 doit tre nulle puisque le graphique montre quil ny a pas de drive. Si lon sait apriori que la srie
est de moyenne nulle (dans le cas o elle serait stationnaire) ou sans drive (dans le cas o elle aurait une
racine unit), ce modle devient :
Cas II : le chronogramme de la srie montre une tendance ; celle-ci apparat si la srie est une marche
alatoire avec drive ou si elle est stationnaire un trend dterministe prs. Le test devra dcider entre
ces deux hypothses. La rgression considre est
Yt = 1 + 2 t + Yt1 + Zt , (3.14)
ou (3.10)
Yt = 1 + 2 t + Yt1 + 1 Yt1 + + p1 Ytp+1 + Zt
CHAPITRE 3. PROCESSUS NON STATIONNAIRES 61
1 et 2 sont l pour capter lventuelle tendance dterministe suggre par le chronogramme, si || < 1.
Cette approche convient aux sries ayant une tendance, comme le cours dun titre, le niveau dun agrgat
macroconomique.
Mise en pratique dans SAS.
Ce cas est not Trend par SAS et seules les sorties correspondantes sont considrer. Dabord, comme
le retard p nest pas connu, on doit choisir une srie de valeurs de p et SAS calcule les statistiques pour
chacune de ces valeurs.
Lhypothse tester est H0 : ( = 0, 2 = 0) , ou cest--dire la srie est I(1) avec drive.
La statistique de test est la statistique de Fisher F, pour tester H0 , calcule comme dans la mthode MCO
mais, ici encore, sous lhypothse nulle, cette statistique ne suit pas une loi de Fisher. Elle est note F
dans les sorties. On rejette lhypothse nulle pour de grandes valeurs de la statistique.
Si lon rejette lhypothse nulle les trois situations possibles sont :
( 6= 0, 2 = 0), cest--dire srie stationnaire sans tendance, impossible vu le chronogramme.
( = 0, 2 6= 0), cest--dire srie non stationnaire avec tendance, peu raliste.
( 6= 0, 2 6= 0)cest--dire srie stationnaire avec tendance, seul cas raliste pour lalternative.
(On peut galement tester ( = 0). La statistique de test est Tau. Cest la statistique de Student pour
tester = 0 mais qui nest pas distribue suivant un t de Student sous lhypothse nulle. La rgion
critique est de la forme , t, SAS donne la p-value. Si lhypothse nulle est rejete on conclut que la
srie est stationnaire. Si ce quon obtient nest pas cohrent avec ce qui prcde, on peut sinterroger sur
laptitude du test traiter la srie considre.)
Il peut videmment arriver que 1 soit racine multiple. On dtecte cette situation si aprs avoir diffren-
ci une premire fois la srie on conclut par un test de racine unit, la non stationnarit de la srie
diffrencie.
3.2.1 Exemples simuls
On a simul trois sries : y0, y1 et y2. Le code figure en annexe de la section.
Effectuons le test ADF de racine unit sur ces trois sries. La syntaxe est :
On comprend, et laide en ligne de la proc arima donne les dtails, que les tests ADF sont eux-mmes un
des choix de tests de racine unit (et non de stationnarit !) offerts par SAS par loption stationarity.
On a choisi des ordres assez levs, jusqu 5, pour capter lautorgression dont on ne connat pas apriori
lordre.
Name of Variable = y0
CHAPITRE 3. PROCESSUS NON STATIONNAIRES 62
Autocorrelations
Lecture de ces rsultats. On voit sur le graphique de y0, figure (3.5) quelle na pas de tendance, le
modle est (3.12) donc le paquet Trend ne la concerne pas. Sur le paquet Single Mean et quelque
soit lordre de dcalage, les p-values correspondant TAU sont leves donc on conclut quil y a une
racine unit, dans (3.12) : = 0. On examine dans le mme paquet la p-value de verb"F". Elle est leve
donc on conclut sur lexpression (3.12) que = 0 et 1 = 0. On peut examiner le bloc Zero Mean
correspondant au test de = 0 dans le modle (3.13). Les p-value pour Tau sont leves quelque soit le
dcalage ; on garde lhypothse = 0.
Srie y1, figure (3.6).
Name of Variable = y1
Name of Variable = y1
Autocorrelations
La figure (3.6) ne montre pas de tendance, la srie semble de moyenne nulle. Le graphe de lACF montre
que la srie est stationnaire.
Name of Variable = y1
Lecture des rsultats sur le bloc Single Mean. Sauf pour le retard 1, la p-value pour F est leve. On
comprend que la srie (et le code de la simulation nous le confirme) est un autorgressif dordre suprieur
1. On accepte lhypothse ( = 0, 1 = 0), srie non stationnaire, en contradiction avec lexamen de
lACF ! Examinons alors le bloc Zero Mean, ce qui est cohrent avec lallure du graphique. Les p-
values pour Tau sont assez faibles (sauf au retard 2) : on rejette lhypothse ( = 0), on conclut que
la srie est stationnaire ! ! ! Que se passe-t-il ? Si on admet que la srie est de moyenne nulle, comme le
graphique le suggre, alors on peut considrer le paquet Zero Mean comme le paquet valable et et on
conclut la stationnarit de la srie.
Srie y2.
Name of Variable = y2
Autocorrelations
Name of Variable = y2
Augmented Dickey-Fuller Unit Root Tests
Le graphique (Fig. 3.7) montre quelle a une tendance. On est dans le cadre du modle (3.10) et on doit
donc examiner le paquet Trend Par la statistique F, on rejette = 0 et 1 = 0 dans (3.10). Par contre
les p-value pour tester = 0 sont leves, donc on garde = 0. Ainsi la srie est non stationnaire et
avec tendance.
Annexe
Code de la simulation des sries y0, y1, y2. Il est fortement conseill de comprendre ce code pour voir
la nature des sries simules : stationnaire ? avec racine unit ? prsence dune drive ?
data a;
y0m2 = 0; y0m1=0; y1m2 = 0; y1m1=0; y2m2 = 0; y2m1=0;
wm1=0; um1=0; vm1=0;
do t =-50 to 250;
u = 2*rannor(34289); v= 2*rannor(13489); w = 2*rannor(134);
y0 = 1.8* y0m1 - 0.8* y0m2 + u + 0.9* um1;
y1 = .5 +0.2136752* y1m1 +0.4273504* y1m2 + v + 0.9* vm1;
y2 = 1.3*t+ 1.8* y2m1 - 0.8* y2m2 + w + 0.9* wm1;
if t >0 then output;
y0m2 = y0m1; y0m1 = y0;
y1m2 = y1m1; y1m1 = y1;
y2m2 = y2m1; y2m1 = y2;
um1 = u;
vm1 = v;
CHAPITRE 3. PROCESSUS NON STATIONNAIRES 65
wm1 = w;
end;
run;
Autocorrelations
Reprenant les tapes comme pour les sries simules, on conclut que BLACKPEPPER a une racine unit
et na pas de drive.
Part de march
On examine la part de march dun bien de consommation trs "volatile", mesure chaque semaine (Fig.
3.9).
La srie dcroit fortement, manifestement elle a une tendance (sans doute stochastique, mais nanticipons
pas !).
Le test pour Trend montre une certaine instabilit, niveaux de signification empiriques faibles aux retards
2 et 5. Les p-values des deux statistiques pour = 0 sont assez diffrentes. Aussi, voyons si la srie nest
pas la somme dune tendance dterministe et dun processus stationnaire.
data market;
infile D:\Donn\ST\franses\market.txt;
input DV mar Prix Sem;
prix100 = prix/100;
t = _n_;
run;
LACF du rsidu de la rgression de la srie sur le temps dcroit trs rapidement et le test ci-dessus Zero
Mean, conduit considrer que les rsidus sont stationnaires. Finalement la part de march semble tre
une srie forme dune tendance dterministe + une erreur stationnaire.
Commerce de la Chine
On examine le revenu national rel de la Chine par secteur, base 100 en 1952.
Le Systme SAS
1
Autocorrelations
yt = 0 + 1 t + ut
CHAPITRE 3. PROCESSUS NON STATIONNAIRES 70
o ut suit un modle ARMA (stationnaire), on diffrencie la srie ? La srie diffrencie est station-
naire, de moyenne 1 mais sa structure de corrlation est celle de ut et elle est gnralement plus
complique que celle de ut . Par exemple, si ut est un BB, alors ut est un MA(1) non inversible.
Comme il est plus expditif de diffrencier une srie et modliser la srie diffrencie que de lui ajuster
une tendance et de modliser lerreur, on est tent de diffrencier plus souvent que ncessaire.
Une structure de corrlation qui se complique aprs diffrenciation de la srie est une indication
quon a trop diffrenci.
Les tests de racine unit nont pas une puissance leve, on ne peut donc pas savoir avec beaucoup de
certitude si on doit diffrencier une srie ou lui ajuster une tendance linaire.
Sur une srie courte on peut ne pas voir un trend stochastique mais en cas dhsitation entre trend
dterministe et trend stochastique, il est prfrable dajuster un trend stochastique.
On doit toujours examiner lACF et le graphique de la srie quand on fait un test de racine unit.( Bien
quon nait pas suivi ce chemin pour les sries y0, y1, y2.)