Coursseriestemp 1

1
Sries temporelles appliques
Yves ARAGON
aragon@cict.fr
Janvier 2008
Table des matires
Rfrences bibliographiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1 Prliminaires sur les sries temporelles 5

1.1 Exemples de sries temporelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Objectifs de lanalyse dune srie temporelle . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3 Tendance. Saisonnalit. Rsidus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4 Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.5 Un exemple : le niveau du lac Huron . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2 ARMA - SARMA 19
2.1 Proprits de base des sries stationnaires . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.1.1 Stationnarit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.1.2 Fonction dautocovariance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.1.3 Qualit de lerreur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2 Modles de sries stationnaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2.1 Srie linaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2.2 Processus gaussien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3 Processus autorgressif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3.1 Processus autorgressif dordre 1 . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3.2 Fonction dautocorrlation partielle . . . . . . . . . . . . . . . . . . . . . . . . 28
2.4 Processus Moyenne mobile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.5 Saisonnalit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.5.1 Saisonnalit multiplicative . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.6 Modles ARIMA et SARIMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.7 Complment : non stationnarit en variance . . . . . . . . . . . . . . . . . . . . . . . . 32
2.8 Etude empirique dune srie par une modlisation ARIMA . . . . . . . . . . . . . . . . 33
2.8.1 La mthode MINIC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.9 Mise en pratique dans SAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.9.1 Modlisation du niveau du Lac Huron . . . . . . . . . . . . . . . . . . . . . . . 39
2.10 Estimation dun ARMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.10.1 Fonction de vraisemblance dun processus gaussien AR(1) . . . . . . . . . . . . 47
2.10.2 Fonction de vraisemblance dun processus gaussien MA(1) . . . . . . . . . . . . 48
2.11 Prvision dune srie temporelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.11.1 Prvision erreur quadratique minimum pour un ARMA . . . . . . . . . . . . . 49
2.11.2 Exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.12 Exemple dquations de Yule-Walker : cas de lARMA(2,1) . . . . . . . . . . . . . . . . 51
3 Processus non stationnaires 56

3.1 Le problme de la racine unit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.1.1 Illustration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.2 Tests de Dickey-Fuller . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2
TABLE DES MATIRES 3
3.3 Tests de Dickey-Fuller augments (ADF) . . . . . . . . . . . . . . . . . . . . . . . . . 59

3.3.1 Reprsentation en correction derreur ECM . . . . . . . . . . . . . . . . . . . . 59
3.3.2 Mise en oeuvre des tests de Dickey-Fuller augments . . . . . . . . . . . . . . . 60
3.3.3 Exemples simuls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.3.4 Sries relles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.4 Test dune nonstationnarit saisonnire . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.5 Annexe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4 Processus VAR et VARMA 74

4.1 Introduction. Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.2 Srie vectorielle stationnaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.2.1 Estimation de la fonction de corrlation croise . . . . . . . . . . . . . . . . . . 76
4.3 Exemples de processus vectoriels stationnaires . . . . . . . . . . . . . . . . . . . . . . 78
4.3.1 Bruit blanc multidimensionnel. . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.3.2 Processus VAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.3.3 Processus VMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.3.4 Processus VARMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.4 Reprsentation MA() et rponse impulsionnelle . . . . . . . . . . . . . . . . . . . . 82
4.5 Exemple dinfrence sur un VAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4.5.1 Donnes et analyse prliminaire . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4.5.2 Identification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.5.3 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.6 Simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
5 Contgration 92
5.1 Notions sur la rgression dune srie sur une autre srie . . . . . . . . . . . . . . . . . . 93
5.1.1 Exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
5.2 Non stationnarit dun VAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
5.2.1 Intuition de la contgration . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
5.2.2 Reprsentation en correction derreur . . . . . . . . . . . . . . . . . . . . . . . 96
5.3 Contgration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.3.1 Contgration avec terme dterministe . . . . . . . . . . . . . . . . . . . . . . 98
5.3.2 Traitement de la contgration par Johansen . . . . . . . . . . . . . . . . . . . . 100
5.4 Contgration dans SAS, proc varmax . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
5.4.1 Exemples SAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
5.5 Test de causalit au sens de Granger . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
5.5.1 Simulations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
5.6 Exemples de syntaxe de la documentation SAS . . . . . . . . . . . . . . . . . . . . . . 110
Bibliographie
[1] Box G., Jenkins, Reinsel G.C. Time Series, , 3rd Ed. Prentice Hall.
[2] Bourbonnais R. Economtrie, 3me d., 2000, Dunod.
[3] Bresson G. et Pirotte A. Economtrie des sries temporelles, 1995 PUF.
[4] Brockwell P.J., Davis R.A. Introduction to Time Series and Forecasting , 1997, Springer.
[5] Brockwell P.J., Davis R.A. Time Series : Theory and Methods, 2nd edition , 1991, Springer.
[6] Bourbonnais R., Terraza M. Analyse des sries temporelles en conomie, 1998, PUF.
[7] Charemza W., Deadman D.F.New Directions in Econometric Practice, 1992 Edward Elgar.
[8] Chan N. H. Time Series Applications to finance, 2002, Wiley.
[9] Destandau S. et Le Guen M. Analyse Exploratoire des Donnes avec SAS/INSIGHT, 1998, INSEE
Guides 7-8 .
[10] Franses P. H. Time series models for business and economic forecasting, 1998, Camridge University
Press.
[11] Gourieroux C., Monfort A. Sries temporelles et modles dynamiques, 1995, 2nd edition, Econo-
mica.
[12] Gourieroux C., Scaillet, Szafarz Econometrie de la finance. Analyses historiques, 1997, Econo-
mica.
[13] Hamilton J.D. Time Series Analysis, 1994, Princeton University Press.
[14] Jaffe J.A. Mastering the SAS System Snd ed., 1996, ITP.
[15] Kennedy P., A guide to Econometrics, Fith Edition, 2003, Blackwell.
[16] Lardic S., Mignon, V. Economtrie des sries temporelles macroconomiques et financires, 2002,
Economica.
[17] Ltkepohl H., New Introduction to Multiple Time Series, 2005, Springer.
[18] Mills T. C., The Econometric Modelling of Financial Time Series 2nd ed., 1999, Cambridge.
[19] Reinsel G. C. Elements of Multivariate Time Series Analysis, 1997, Springer.
[20] Rydberg T., Realistic statistical modelling of financial data. International Statistical Review, 2000,
68, 233-258.
[21] SAS Institute, SAS/ETS Users Guide Version 6 2nd ed., SAS Institute.
[22] Shumway R., Stffel Time Series Analysis and its Applications, 2000, Springer.
[23] Tassi Ph. Mthodes statistiques, 1989 et nombreuses ditions, Economica.
[24] Tsay R. S. Analysis of Financial Time Series, 2002, Wiley.
[25] Wei Time Series Analysis : Univariate and Multivariate Methods, 1990, Addison-Wesley.
[26] Zivot E., J. Wang Modeling financial time series with S-Plus, 2nd edition, 2006, Springer.
4
Chapitre 1
Prliminaires sur les sries temporelles
Introduction Une srie temporelle univarie est une suite de donnes quantitatives mesures inter-
valles rguliers. Dans ce chapitre on donne quelques exemples de sries temporelles et de questions
concrtes quon peut se poser devant une telle srie. On verra notamment quune mme srie peut servir
diffrents usages et donc recevoir des traitements varis. Ensuite, on introduit une srie de rfrence :
le bruit blanc (BB) et loprateur retard qui simplifie grandement lcriture des problmes de sries tem-
porelles. Enfin un exemple, le niveau du lac Huron, illustre ce que peut apporter la prise en compte de
la dynamique de lerreur dans une rgression dune variable y sur des variables x quand les observa-
tions sont indices par le temps. Ce problme est trs classique. Vous devez avoir prsent lesprit que
lquation 1.7 est un cas particulier de 1.2 avec erreur dynamique.
1.1 Exemples de sries temporelles

Une srie temporelle est une suite dobservations indices par le temps, la date laquelle lobservation
est faite est une information importante sur le phnomne observ.
Examinons le chronogramme de quelques sries 1 et notons leurs caractristiques les plus videntes.
1 La population de la France (Fig. 1.1) et la population des Etats-Unis (Fig. 1.2) sont des sries o le
temps explique bien le niveau de la srie. Une fonction du temps assez lisse capte une grande part
de la variabilit de la srie.
Les dmographes sont intresss par la prvision de la population 10 ans, 20 ans.
2 Le nombre mensuel de morts et blesss graves par accident de la route en Grande-Bretagne (Fig.
1.5) est une srie o la saisonnalit 2 contribue expliquer le niveau. Le niveau moyen reste stable
jusqu la fin de 1982 et il y a dimportantes fluctuations saisonnires. En fvrier 1983 une nouvelle
lgislation rend obligatoire le port de la ceinture de scurit.
Un service de sant publique peut vouloir prdire le nombre de morts chacun des 6 prochains
mois pour voir o et quand faire une campagne de prvention, mais il peut aussi vouloir une vision
synthtique de la situation, un aperu de la tendance sur lanne.
3 Les ventes de champagne (en millions de bouteilles) (Fig. 1.3) et les ventes de vin australien (Fig.
1.4) montrent une saisonnalit qui contribue expliquer le niveau mais en plus la moyenne et la
variabilit de ces sries augmentent avec le temps. Ce sont des sries htroscdastiques (cest--
dire variance non constante) dont la variance une date est fonction de la moyenne cette date.
La chambre de commerce dune rgion viticole peut tre intresse par lexamen de la tendance
des ventes dbarasse de ce qui peut se passer court-terme alors quun syndicat de transporteurs
a besoin de savoir combien de bouteilles devront partir de la rgion le mois prochain. La chambre
de commerce a besoin dune reprsentation lisse de la srie alors que le transporteur a besoin
1
On appelle chronogramme dune srie, son graphique, avec le temps en abscisse.
2
Le terme "saisonnalit" dsigne un aspect priodique plus ou moins marqu dans certaines sries. Dans ce chapitre on ne
cherche pas lui donner un sens prcis, mais seulement lidentifier graphiquement.
5
CHAPITRE 1. PRLIMINAIRES SUR LES SRIES TEMPORELLES 6
65000000
60000000
55000000
Population
50000000
45000000
40000000
1900 1920 1940 1960 1980 2000 2020

annnee
F IG . 1.1 Population franaise F IG . 1.2 Population des Etats-Unis
F IG . 1.3 Ventes de bouteilles de champagne F IG . 1.4 Ventes de vin australien
dune prvision un ou deux mois de la srie, prvision qui, elle, devra videmment incorporer
les fluctuations saisonnires. La srie lisse par la mthode X11 est reprsente figure ( 1.6).
4 Le niveau du lac Huron (1.8) montre une tendance lgrement dcroissante et on observe que les rsi-
dus de lajustement dune droite au niveau, deux dates conscutives, sont corrls positivement
(Fig. 1.15).
Si lobjectif est de prdire le niveau lan prochain, il faut exploiter la fois la linarit de la
tendance et la corrlation de la srie 2 dates conscutives.
5 Le rendement du titre Alcatel (1.7) est une srie htroscdastique, cest--dire une srie dont la va-
riance nest pas constante au cours du temps, dont la variabilit change au cours du temps de faon
non vidente. Le rendement dune action est trs souvent de moyenne nulle et les rendements 2
dates conscutives souvent non corrls. Il ny a donc pas de problme de prvision du rendement
mais la prvision de sa variabilit est utile.
On voit sur ces exemples quon ne peut pas considrer une srie temporelle comme une suite dobserva-
tions indpendantes. Par consquent tous les calculs et raisonnements de statistique mathmatique bass
sur lindpendance entre les observations doivent tre revus et si ncessaire, penss autrement. Mais la
connaissance de la dpendance temporelle permet en contrepartie damliorer la prvision de la valeur
dune srie une date future connaissant le prsent et le pass.
F IG . 1.5 Nombre de morts par accident au F IG . 1.6 Srie des ventes de champagne brute
Royaume-Uni et lisse par X11
1.2 Objectifs de lanalyse dune srie temporelle

Dcrire Quand on sintresse une srie temporelle, la premire tape, comme pour toutes donnes est
de dcrire la srie. On utilise pour ce faire un certain nombre de graphiques :
diagramme squentiel ou chronogramme (time plot)
histogramme pour avoir une ide de la distribution des valeurs
boxplot pour reprer les valeurs atypiques
histogramme des valeurs absolues pour apprcier lhtroscdasticit ventuelle (notamment
pour les sries de rendements de titres)
Lag plot (diagramme retard), cest--dire diagramme de dispersion avec en abscisse la srie
retarde de 1, 2 ou k instants et en ordonne la srie initiale, pour comprendre la dpendance de
la srie par rapport son pass. La figure (1.16) en est un exemple. La gnralisation de cette
reprsentation plusieurs dcalages conscutifs est illustre par la figure (1.13), obtenue laide
de la fonction lagplot() de R.
month plot. Il est intressant pour des donnes prsentant une saisonnalit. La figure (1.9) re-
prsente le month plot du trafic passager Blagnac de 1993 2006. Il regroupe les 12 sries de
trafic mensuel : une srie par mois, de janvier dcembre et un point par anne dobservation.
Le dcrochement correspond aux attentats du 11 septembre 2001.
On calcule aussi les statistiques descriptives usuelles : moyenne, variance, coefficients daplatisse-
ment et dasymtrie.
Comme on la not sur les exemples, une mme srie temporelle peut tre analyse de diffrentes
faons suivant lobjectif poursuivi.
Rsumer Dans certains cas on veut une vue synthtique dbarasse de dtails de court-terme ; cest sou-
vent un besoin des instituts de statistique officielle. Les mthodes qui donnent une vue densemble
de la srie nette de fluctuations de court terme sont appeles mthodes de lissage.
Modliser Expliquer le niveau ou parfois la variance du niveau, par des modles peu de paramtres
Modle sans variable explicative
Yt = f (Yt1 , Yt2 , ) + ut (1.1)
Modle avec variable explicative

Yt = f (Xt ) + ut (1.2)
o ut est une erreur
F IG . 1.7 Cours de laction Alcatel F IG . 1.8 Niveau du lac Huron
modle statique : Xt ne contient pas de valeurs passes de {Yt } et les ut sont non corrls
entre eux
modle dynamique : Xt contient des valeurs retardes de yt ou les ut sont auto-corrls. Dans
ce cas la dynamique de ces erreurs doit tre modlise.
Dans tous les cas, la fonction f() doit tre estime dans une classe de fonctions. Dans ce
cours on ne considre que des fonctions linaires mais le cours de rgression non et semi-
paramtrique propose des classes plus vastes.
Prdire La prvision de valeurs des dates futures connaissant le prsent et le pass de la srie peut tre
base sur un modle, ce que nous pratiquerons travers les modles ARMA, ARMAX ou bien
tre construite sans rfrence un modle, cas du lissage exponentiel et des ses gnralisations.
Lessentiel de ce cours est consacr la modlisation. Mais un modle ne remplace pas un graphique.
Il faut toujours essayer de comprendre un phnomne par plusieurs approches : modle et graphiques,
plusieurs modles...
1.3 Tendance. Saisonnalit. Rsidus

Il est classique de dcomposer une srie temporelle {Yt , t = 1, , n} en tendance mt (trend), effet
saisonnier st , erreur Ut . On sintresse habituellement un modle additif :
yt = mt + st + Ut , o E(Ut ) = 0 ()
ou un modle multiplicatif :
yt = mt st Ut , o E(Ut ) = 1 ()
Par exemple, les sries montrant une saisonnalit qui a de plus en plus dampleur (cas des ventes de
champagne, Fig. 1.3) sont souvent mieux ajustes par un modle multiplicatif que par un modle additif.
Commentaires
F IG . 1.9 Month plot du trafic de laroport de Toulouse-Blagnac
Une dcomposition permettant dliminer leffet saisonnier est utile quand on veut examiner le com-
portement moyen terme dune srie. Les services de statistique officielle, les organismes qui tudient
les grandes tendances dun phnomne, travaillent sur des sries dsaisonnalises. A titre dexemple
on consultera le site de la Scurit routire :
http://www.securiteroutiere.gouv.fr/infos-ref/observatoire/conjoncture/ puis
"Les mthodes de production de lanalyse conjoncturelle".
Par contre quand cest le comportement court terme qui intresse, il faut garder laspect saisonnier.
Les gestionnaires de stocks de magasins doivent tenir compte de la saisonnalit des ventes de leurs
produits quand ils passent leurs commandes.
Le choix dun modle ou dun autre, lincorporation ou non dune composante, peuvent sapprcier
daprs le graphique de la srie et peuvent tre valids par lanalyse elle-mme.
Il ny a pas une unique faon dobtenir une dcomposition telle que (*) ou (**) pour une srie parti-
culire.
Dans R, les fonctions : decompose(), stl(), StructTS() donnent des dcompositions sai-
sonnires dune srie.
Dans SAS, les proc X11 et X12, sont des programmations des mthodologies X11 et X12. Elles
donnent notamment des outils de lissage et de dsaisonnalisation. Elles sont reconnues et appliques
par les services de statistique officielle de la plupart des pays.
On considre quune srie temporelle observe {xt , t = 1, , T } est la ralisation dun processus
alatoire {Xt , t = 1, , T }. Les Xt sont des v.a. (variables alatoires), xt est la valeur prise par Xt ,
ce qui advient la date (ou linstant dobservation) t, ces v.a. des dates diffrentes sont normalement
corrles. Un cas limite est celui o ces v.a. sont i.i.d..
Bruit blanc (BB)
Dfinition 1 Un bruit blanc {Zt } est une suite de v.a. non corrles de moyenne nulle, de variance
constante Z2 .
On note {Zt } BB(0, Z2 ). {Zt } BBN (0, Z2 ) dsigne un bruit blanc gaussien, cest--dire une
suite de v.a. i.i.d. N (0, Z2 ).
Le BB est une srie de rfrence. Modliser une srie revient souvent trouver les oprations qui la
dcrivent comme transformation dun bruit blanc.
Etapes de ltude dune srie sans srie explicative associe.

On commence par enlever, si ncessaire, les effets systmatiques (par exemple, le nombre de jours
ouvrables dans une srie hebdomadaire dune production, leffet "jour de la semaine" dans une srie
quotidienne), les effets occasionnels (grves, panne de machine).
On impute des valeurs aux dates o manque lobservation de la srie.
Soit xt , t = 1, , n, la srie obtenue aprs ces corrections. Si elle prsente une tendance et une
saisonnalit, il faut les estimer ou les liminer suivant lobjectif recherch.
Enfin on prdit chaque composante de la srie puis la srie.
Notons quil y a souvent plusieurs mthodes possibles pour raliser ces tapes. De plus certaines m-
thodes comme celle Box-Jenkins, peuvent modliser la saisonnalit mais ne peuvent pas isoler une com-
posante saisonnire.
1.4 Notations
Oprateur retard. On note B(backwards) ou L (lag), loprateur qui fait passer de xt xt1 :
Bxt = xt1
On a :
B2 xt = B(Bxt ) = Bxt1 = xt2
Oprateur diffrence. La diffrence premire est :
xt = (1 B)xt = xt xt1
on a :
2 xt = (xt ) = xt 2xt1 + xt2
Oprateur diffrence saisonnire. Pour une srie mensuelle il peut tre utile dexaminer ses accroisse-
ments dune anne sur lautre (janvier sur janvier, ...). Loprateur diffrence saisonnire 12 = 1 B1 2
est utile dans ce cas.
12 xt = (1 B12 )xt = xt xt12

Ces notations simplifient lcriture des quations relatives aux sries.
Exemples
(a) Manipulation de loprateur retard.
Pour la fonction constante = 1 t,
(1 0.9B)1 = 1 0.9B1 = 1 0.9 = 0.1

de mme
1 1
1 = (1 + 0.9B + (0.9)2 B2 + )1 = 1 + 0.9 + (0.9)2 + = = 10.
1 0.9B 1 0.9
Pour la fonction = t t
(1 0.9B)t = t 0.9Bt = t 0.9(t 1) = 0.1t + 0.9
de mme
1
t = (1 + 0.9B + (0.9)2 B2 + )t = t + 0.9(t 1) + (0.9)2 (t 2) + =
1 0.9B
1 1
t 0.9 = = 10t 90. (1.3)
1 0.9 (1 0.9)2
(b) Calcul de sries retarde et de sries diffrencies dans SAS.
data b;
set donn.champa2;
ven1 = lag(vente_ch);
ven12 = lag12(vente_ch);
5 d1_ven = dif1(vente_ch);
d12_ven = dif12(vente_ch);
run;
proc print data=b (obs=14);

10 run;
Le Systme SAS 10:00 Saturday, June 18, 2005 29
15 Obs VENTE_CH DATE ven1 ven12 d1_ven d12_ven
1 2.815 JAN62 . . . .
2 2.672 FEB62 2.815 . -0.143 .
3 2.755 MAR62 2.672 . 0.083 .
20 4 2.721 APR62 2.755 . -0.034 .
5 2.946 MAY62 2.721 . 0.225 .
6 3.036 JUN62 2.946 . 0.090 .
7 2.282 JUL62 3.036 . -0.754 .
8 2.212 AUG62 2.282 . -0.070 .
25 9 2.922 SEP62 2.212 . 0.710 .
10 4.301 OCT62 2.922 . 1.379 .
11 5.764 NOV62 4.301 . 1.463 .
12 7.312 DEC62 5.764 . 1.548 .
13 2.541 JAN63 7.312 2.815 -4.771 -0.274
30 14 2.475 FEB63 2.541 2.672 -0.066 -0.197
(c) Dans R.
Lecture du fichier texte champa.asc .
Conversion en srie temporelle (avec date).
Fabrication de sries retardes. Observer que la fonction lag() marche lenvers de ce quon attend !
On peut observer quelle se contente de changer la date de la srie. De plus elle ne sapplique qu un
objet de type ts. La fonction Lag() du package Hmisc est plus simple demploi.
Illustration des fonction ts.union, ts.intersection.
Fabrication de la srie retarde de faon classique.
> champagne = scan(champa.asc)
Read 105 items
> champagne = ts(champagne,start=c(1962,1),frequency=12)

> chL1 = lag(champagne,-1)
5 > chL12 = lag(champagne,-12)
> dd = ts.union(champagne,chL1, chL12)
> dd
champagne chL1 chL12
Jan 1962 2.815 NA NA
10 Feb 1962 2.672 2.815 NA
Mar 1962 2.755 2.672 NA
Apr 1962 2.721 2.755 NA
...
Oct 1962 4.301 2.922 NA
15 Nov 1962 5.764 4.301 NA
Dec 1962 7.312 5.764 NA
Jan 1963 2.541 7.312 2.815
Feb 1963 2.475 2.541 2.672
Mar 1963 3.031 2.475 2.755
20 ...
Jul 1970 4.298 5.312 4.633
Aug 1970 1.431 4.298 1.659
Sep 1970 5.877 1.431 5.951
Oct 1970 NA 5.877 6.981
25 Nov 1970 NA NA 9.851
Dec 1970 NA NA 12.670
Jan 1971 NA NA 4.348
Feb 1971 NA NA 3.564
...
30 Aug 1971 NA NA 1.431
Sep 1971 NA NA 5.877
> dd0 = ts.intersect(champagne,chL1, chL12)

> dd0
35 champagne chL1 chL12
Jan 1963 2.541 7.312 2.815
Feb 1963 2.475 2.541 2.672
Mar 1963 3.031 2.475 2.755
...
40 Jun 1970 5.312 4.618 4.874
Jul 1970 4.298 5.312 4.633
Aug 1970 1.431 4.298 1.659
Sep 1970 5.877 1.431 5.951
>
45 > # fabrication de la srie retarde, faon classique
> c.c1 = cbind(champagne, c(NA,champagne[-1]))
> dimnames(c.c1)[[2]] = c("ventes","ventes.1")
> c.c1[1:5,]
ventes ventes.1
50 [1,] 2.815 NA
[2,] 2.672 2.672
[3,] 2.755 2.755
[4,] 2.721 2.721
[5,] 2.946 2.946
55
> # plus simplement avec la fonction Lag de Hmisc
> require(Hmisc)
[1] TRUE
> x2 = x^2
60 > x2
[1] 1 4 9 16 25 36 49 64 81 100
> diff(x2,1)
[1] 3 5 7 9 11 13 15 17 19
> diff(diff(x2,1),1)
65 [1] 2 2 2 2 2 2 2 2
> diff(x2,1,2)
[1] 2 2 2 2 2 2 2 2
> diff(x2,4)
[1] 24 32 40 48 56 64
70
Exemple de lag plot. La srie des tempratures mensuelles moyennes Nottingham est fournie avec
R (Fig. 1.12). Les diagrammes retards de 1 12 de cette srie (1.13) montrent des aspects trs typs,
notamment aux dcalages (ou retards) 1, 5, 6, 11, 12.
lag.plot(nottem, 12, layout = c(4,3), ask = NA, do.lines = FALSE,

main = "Tempratures mensuelles moyennes Nottigham, 1920-1939",
col.main = "blue")
Les figures (1.10 et 1.11) reprsentent une srie simule suivant le mcanisme :
yt = 0.9yt12 + Zt 0.7Zt1 , Zt BBN (0, 1) ()
et son lag plot. La valeur une date est fortement lie la valeur 12 priodes avant. On voit sur le lag
plot quil ny a pas de corrlation entre des valeurs dcales de 1, 2, ,11.
F IG . 1.10 Chronogramme dune srie simule F IG . 1.11 Lag plot de la mme srie simule
suivant (**)
Exercice 1 Examinant la figure (1.9), (1) que peut-on dire de la saisonnalit du trafic laroport de
Blagnac ? (2) Le 11 septembre a-t-il eu le mme effet sur tous les mois des annes suivantes (effets sur
janvier, sur fvrier, ...) ? (3) Que peut-on raconter de leffet du 11 septembre sur la croissance de lactivit
de laroport ?
Exercice 2 Lag plots. Les sries (1.10) et () ont toutes deux un fort comportement saisonnier. (1) Que
traduit la forme en anneau certains dcalages pour le lag plot de la temprature Nottingham ? La
rponse est, pour linstant, seulement intuitive. Il faut utiliser notre connaissance intuitive de cette srie.
(2) Commenter les similitudes et les diffrences de leurs lag plots.
1.5 Un exemple : le niveau du lac Huron

On a rarement tudier une srie y isole. Souvent une autre srie x non alatoire explique une partie du
niveau de y. Dans ce cas il faut :
commencer par modliser assez grossirement la dpendance de la moyenne de y par rapport x, par
MCO 3 par exemple,
examiner si le rsidu de cette modlisation a une dynamique et, si cest le cas, il faut galement
modliser cette dynamique
3
MCO = Moindres Carrs Ordinaires
65
60
55
nottem
50
45
40
35
30
1920 1925 1930 1935 1940
Time
F IG . 1.12 Temprature mensuelle moyenne Nottingham
enfin on essaie de modliser simultanment les deux aspects : moyenne et dynamique de lerreur.
On appelle souvent un tel modle, modle ARMAX. On en rencontrera dans les modles dintervention
et en TP. On en donne un petit exemple ds maintenant.
Le graphique de la srie du niveau du lac Huron (1.8) montre une tendance lgrement dcroissante dont
la significativit doit tre teste et, autour de cette tendance, une variabilit importante dune anne
lautre. Le temps est notre variable explicative.
La 1re tape consiste donc faire une rgression linaire du niveau sur lanne par MCO :
yt = 0 + 1 t + ut , t = 1, , T (1.4)
et stocker les rsidus de cet ajustement.

Pour faire ce travail on a utilis la proc autoreg. Comme la proc reg elle peut faire un ajustement
par MCO mais elle dispose en plus notamment doptions pour analyser la corrlation des rsidus au cours
du temps (leur autocorrlation).
proc autoreg data= st6.lake;

model niveau = date;
output out= lakout residual=residmc;
run;
5 Niveau du lac Huron - Residus 16:30 Sunday, June 23, 2002 9
The AUTOREG Procedure
Dependent Variable NIVEAU

10
Ordinary Least Squares Estimates
SSE 122.645511 DFE 96

15 MSE 1.27756 Root MSE 1.13029
SBC 309.266295 AIC 304.09636
Regress R-Square 0.2725 Total R-Square 0.2725
Durbin-Watson 0.4395
20
Standard Approx
Variable DF Estimate Error t Value Pr > |t|
Intercept 1 8.1208 0.1864 43.57 <.0001

25 DATE 1 -0.000066 0.0000111 -6.00 <.0001
Attention ! La rgression a t effectue sur la date cest--dire sur des valeurs espaces de 365 ou 366
et ne commenant pas 1.
Le R2 nest pas trs lev (R2 = 0.2725) mais la rgression est significative : t Value pour 1 = 6.00
qui correspond un niveau de signification empirique < .0001. Examinons maintenant le rsidu de cet
bt = yt b0 b1 t. A-t-il une dynamique ?
ajustement : u
title "Lac Huron - residu contre residu retarde";

proc gplot data=b;
symbol1 v=star i= none;
5 plot resret * residmc = 1;
run;
quit;
On constate (graphique 1.15) que le signe du rsidu est assez rgulirement alternativement positif et
ngatif sur plusieurs dates conscutives .
Examinons donc le diagramme de dispersion des (b ut1 , u
bt ), t = 2, , T (graphique 1.16). Comme on
pouvait sy attendre, on observe une corrlation linaire significative entre le rsidu une date et le rsidu
la date voisine. Cette corrlation sur les rsidus u
bt est le reflet dune corrlation sur les erreurs ut ; ut a
une dynamique.
(On comprend quon peut amliorer la prvision du niveau dune anne partir de la connaissance du
niveau les annes antrieures en prenant galement en compte de cette corrlation.) Rsum de la re tape :
nous avons estim le niveau moyen du lac et avons constat que lerreur est autocorrle, quelle a une
dynamique.
La 2e tape consiste modliser la dynamique de lerreur. Utilisant les outils du prochain chapitre,
lexamen des rsidus de lajustement par MCO suggre que lerreur une date t dpend linairement des
erreurs aux dates t 1 et t 2. Autrement dit, lerreur est un processus autorgressif dordre 2.
Sans entrer dans le dtail de cet exemple on en donne maintenant quelques aspects graphiques. On
superpose sur le graphique (1.17) : (1) la srie du niveau, (2) sa prvision lhorizon 1 sans tenir compte
de lautocorrlation des erreurs ( droite des moindres carrs) puis (3) en modlisant lerreur par un
processus autorgressif dordre 2 (AR(2)) :
ut = 1 ut1 + 2 ut2 + Zt
o Zt est un BB. On peut observer une trs nette amlioration de lajustement au prix de 2 paramtres
supplmentaires.
Ecriture synthtique du modle (xt t) :
yt = 0 + 1 xt + ut (1.5)
ut = 1 ut1 + 2 ut2 + Zt , Zt Bruit blanc (1.6)
Utilisant loprateur retard on crit

1
(1 1 B 2 B2 )ut = Zt ou ut = Zt
1 1 B 2 B2
et le modle de yt scrit :
1
yt = 0 + 1 xt + Zt . (1.7)
1 1 B 2 B2
Enfin il faut vrifier que le modle ajust est satisfaisant. En particulier il faut tester la blancheur de Zt .
Un tel test sera prsent au prochain chapitre.
Rsumons. Il est utile de modliser le mcanisme dvolution de lerreur ut dans cette srie pour au
moins deux raisons :
1. Si notre objectif est la prvision du niveau lanne suivante, on prdira yT +1 par :
yT +1 = b0 + b1 (T + 1) + Pred(uT +1 |b
u1 , u
b2 , , u
bT )
Dans cette expression Pred(.|.) dsigne la prvision de ce qui est avant le | sachant ce qui est aprs.
2. Si lobjectif est davoir une bonne estimation de 1 il faut modliser le mcanisme de lerreur
et estimer la rgression par Moindres Carrs Gnraliss (MCG). On montre en effet, voir par
exemple ([2], chapitre 5), que si lerreur est autocorrle, lestimateur des MCO) de nest pas
efficace.
Nous allons diviser les difficults : dans le chapitre suivant nous considrons des sries dont la moyenne
est constante (ltape 1 ci-dessus est donc trs simple) et nous prsentons les modles ARMA. Ce sont
des modles assez gnraux pour lerreur ut dans (1.7). En fin de chapitre nous traiterons en dtail la
modlisation du niveau du lac Huron comme exemple de modle ARMAX (la moyenne de la variable
dpendante est une fonction linaire de variables explicatives x et lerreur suit un processus ARMA).
Tempratures mensuelles moyennes Nottingham, 19201939

20 30 40 50 60 70 20 30 40 50 60 70
60
nottem
nottem
nottem
40
30 50
lag 1 lag 2 lag 3
60
nottem
nottem
nottem
50
40
30
lag 4 lag 5 lag 6
60
nottem
nottem
nottem
40
30 50
lag 7 lag 8 lag 9

60
nottem
nottem
nottem
50
40
30
lag 10 lag 11 lag 12

20 30 40 50 60 70
F IG . 1.13 Temprature Nottingham - Diagrammes retards

F IG . 1.14 Niveau du lac Huron - ajustement F IG . 1.15 Niveau du lac Huron - rsidus en
dun polynome de degr 1 fonction du temps
F IG . 1.17 Lac Huron - (1) srie, (2) ajustement

F IG . 1.16 Lac Huron - rsidu contre rsidu re- par MCO et (3) ajustement dune droite avec er-
tard reur AR(2)
Chapitre 2
ARMA - SARMA
Introduction Dans ce chapitre on commence par donner la dfinition de la stationnarit (faible). En-
suite on dfinit la fonction dautocorrlation simple (ACF) dune srie stationnaire et son estimation. On
voit ensuite le test du portemanteau, cest un test de blancheur dune srie stationnaire. Il est trs utile
car si une srie est un bruit blanc (BB), elle se traite comme une suite dobservations non corrles de
variance constante. On introduit ensuite les modles ARMA. Ce sont des modles qui conviennent
beaucoup de sries stationnaires de moyenne constante. Un modle ARMA(p, q) pour une srie a deux
paramtres fixer avant toute estimation : p lordre de lautorgression (AR) et q lordre de la moyenne
mobile (MA). On introduit une autre fonction dcrivant lautocorrlation dune srie stationnaire : la
fonction dautocorrlation partielle (PACF). Or la PACF dun AR(p) est nulle partir de lordre p + 1
de mme lACF dun MA(q) est nulle partir de lordre q + 1. Etant donn une srie, dcouvrir des
valeurs possibles pour p et q sappelle identifier la srie. Or les fonctions dautocorrlation empiriques,
simple et partielle, estiment correctement ces mmes fonctions dautocorrlation thoriques. Des valeurs
possibles pour p et q sont donc suggres par les fonctions dautocorrlation empiriques. On voit enfin
comment on identifie puis estime un ARMA avec SAS.
Finalement, si une srie est stationnaire, les modles ARMA sont une classe assez vaste pour essayer de
modliser la srie. Pour vrifier que le modle est correct il faut notamment vrifier que le rsidu prdit
est un BB. Et que fait-on avec les sries non stationnaires ? Nous verrons au chapitre suivane des tests de
non stationnarit. Dautre part, si on a une srie non stationnaire il faut trouver une ou des transformations
qui la ramnent une srie stationnaire laquelle on peut appliquer les techniques du prsent chapitre.
Ce chapitre est trs important, car on retrouvera les notions quil contient dans diffrentes circonstances.
Dure : 6h sans compter le temps de manipulation de sries sur logiciel.
2.1 Proprits de base des sries stationnaires

2.1.1 Stationnarit
La stationnarit est la clef de lanalyse des sries temporelles. Une srie {Yt } est dite strictement sta-
tionnaire si la distribution conjointe de (Yt1 , , Ytk ) est identique celle de (Yt1 +t , , Ytk +t ), quel
que soit t, k entier positif arbitraire et (t1 , , tk ) liste de k entiers positifs arbitraires. Autrement dit, la
stationnarit stricte dit que la distribution conjointe de (Yt1 , , Ytk ) est invariante quand on fait glisser
le temps. Cette condition est difficile vrifier et on utilise une version plus faible de stationnarit.
On dit quune srie temporelle {Yt } est faiblement stationnaire si la moyenne de Yt ne dpend pas de t
et si la covariance entre Yt et Ytl ne dpend que de l et non de t. Prcisment,
Dfinition 2 {Yt } est dite faiblement stationnaire si :

E(Yt ) = Y o Y est une constante indpendante de t,
cov(Yt , Ytl ) ne dpend que de l, entier et dans ce cas elle est note :
Y (l) = cov(Yt , Ytl ).
19
CHAPITRE 2. ARMA - SARMA 20
Remarque. On a distingu stationnarit stricte et stationnarit faible et la plupart des modles que nous
allons examiner concernent des sries normalement distribues ; pour elles, les deux notions concident.
Mais on verra que le rendement du cours dune action est souvent faiblement stationnaire sans ltre
strictement (voir le chapitre consacr aux modles htroscdastiques). La suite du chapitre concerne les
sries faiblement stationnaires.
Considrations pratiques pour apprcier la stationnarit dune srie. Il est important darriver
se faire une ide de la stationnarit dune srie par lobservation de son chronogramme. La stationnarit
dit que la moyenne et la variance de la srie sont constantes quelque soit la date. Elle implique donc que
le graphe de la srie en fonction du temps montre des fluctuations qui se ressemblent (en niveau et en
amplitude), quelque soit la date autour de laquelle on examine la srie.
A Une srie stationnaire a une moyenne constante. Considrons le cours de laction Alcatel (Figure 1.7
de lethme 1). Imaginons un intervalle dune anne environ et faisons glisser cet intervalle. De 1991
1993, le niveau moyen sur un an reste peu prs constant. On remarque la mme chose de 1995 1997.
Mais la fluctuation se fait autour dun niveau beaucoup plus faible que pour la priode prcdente. Il est
manifeste donc que pour cette srie, la moyenne dpend de t et donc la srie nest pas stationnaire. En
rsum, si le niveau dune srie fluctue peu autour dun niveau moyen sur un petit intervalle de temps
mais que ce niveau moyen change avec la position de lintervalle, on peut conclure que la srie nest pas
stationnaire.
Question Quelles sries de lethme 1 peuvent tre reconnues comme non stationnaire au seul examen
de leur niveau moyen ?
B Une srie stationnaire a une variance constante. Ce qui veut dire que lampleur de la fluctuation de
la srie reste la mme sur un petit intervalle de temps quelque soit cet intervalle. La population des
Etats-Unis entre dans cette catgorie. Mais cette srie nest pas stationnaire car sa moyenne nest pas
constante.
Question Quelles sries de lethme 1 montrent une variance non constante et ne sont donc pas station-
naires ?
C On est maintenant quip pour examiner la srie des tempratures de lair Nottingham.
Question Le chronogramme de la srie est trs rgulier. Chaleur en t, froid en hiver... La moyenne sur
6 mois conscutifs change selon que ces mois sont centrs sur lt ou sur lhiver. Rgularit veut-il dire
stationnarit ? Examiner galement le lag plot. Comment raconter le graphe pour le dcalage 3 ?
2.1.2 Fonction dautocovariance

La covariance l = cov(Yt , Ytl ) est appele autocovariance dordre (ou de dcalage) l (lag-l autocova-
riance). Pour chaque dcalage l, il y a une autocovariance.
Dfinition 3 La fonction : l l est la fonction dautocovariance de {Yt }.
Cette fonction a deux proprits importantes :
Proprit 1
(a) 0 = var(Yt ),
(b) l = l , car :
l = cov(Yt , Yt(l) ) = cov(Yt(l) , Yt ) = cov(Yt+l , Yt ) = cov(Yt+l , Y(t+l)l ) = l
Autre notation. On crit aussi Y (l), en particulier pour distinguer la fonction dautocovariance dune
srie Y , de celle dune autre srie.
Fonction dautocorrlation (ACF) Par dfinition, le coefficient dautocorrlation dordre l est
cov(Yt , Ytl )
l = p . (2.1)
var(Yt )var(Ytl )
Mais var(Ytl ) = var(Yt ) = 0 donc :
cov(Yt , Ytl ) l
l = = . (2.2)
var(Yt ) 0
Enfin en terme desprance mathmatique et notant que par la stationnarit : E(Yt ) = indpendant de
t, on a :
E[(Yt )(Ytl )]
l = . (2.3)
E[(Yt )2 ]
l est une mesure de la dpendance de la valeur Y en une date par rapport sa valeur une date dcale
de l intervalles de temps.
Dfinition 4 La fonction :
l l , l = 0, 1, 2, . . .
est appele fonction dautocorrlation (thorique), FAC (ou ACF en anglais) de la srie {Yt }.
De la dfinition on voit que : 0 = 1, 1 l 1.
Etant donn un chantillon yt , t = 1, , T , de {Yt } stationnaire, notons la moyenne empirique, y =

P T
t=1 yt /T . Le coefficient dautocorrlation empirique dordre 1 est :
PT
t=2 (yt y)(yt1 y)
b1 = PT (2.4)
2
t=1 (yt y)
Le coefficient dautocorrlation empirique dordre l 1 est

PT
t=l+1 (yt y)(ytl y)
bl = PT ,0 l T 1 (2.5)
2
t=1 (yt y)
Sous des conditions gnrales, voir par exemple Brockwell et Davis ([4]), bl est un estimateur convergent
de l .
Dfinition 5 La fonction :
l bl , l = 0, 1, 2, . . .
est appele fonction dautocorrlation empirique de la srie {Yt }.
2.1.3 Qualit de lerreur

Tous les modles que nous envisagerons expriment une srie temporelle yt comme la somme dune
fonction du pass (yt1 , yt2 , ) de la srie et dune erreur bruit blanc quon notera Zt . Etant donn
une srie observe : (y1 , y2 , , yT ), le statisticien cherche un modle de dpendance par rapport au
pass dans la classe des modles sa dispositon. Il ajuste le modle et se retrouve avec des rsidus :
Zb1 , Z
b2 , , Z
bT . Si le modle a t correctement choisi, cette srie doit ressembler un bruit blanc. si
ce nest pas le cas il faut corriger le modle. La normalit du rsidu doit galement tre teste. Si la
srie nest pas normale, les tests dgalit dun paramtre une valeur particulire, les intervalles de
prdiction, fournis par les logiciels ne sont pas corrects.
Tests de normalit
Il y a plusieurs tests de normalit dune distribution. La statistique de Jarque-Bera est couramment utilise
dans les tudes conomtriques. Cest la mthode mise en uvre dans la proc autoreg de SAS.
Principe : Supposons une srie de n observations indpendantes dune v.a. Y , y1 , , yn , de moyenne 0,
de variance 1. Les 4 premiers moments empiriques sont
n
1X
m1 = yi ,
n
i=1
n
X
1
mq = (yi m1 )q , q = 2, 3, 4
n
i=1
Lasymtrie (skewness) empirique est
m3
S= 3/2
m2
et lapplatissement (kurtosis) empirique est
m4
K=
m22
Si Y suit une loi normale on peut montrer qualors :
6
S AN (0, ), K AN (3, 24
n ), S et K sont aproximativement indpendants
n
2
Ces rsultats permettent de considrer : n S6 , n (K3)
2
24 , comme statistique pour tester la normalit, sous
cette hypothse en effet, chacune suit approximativement une loi de 2 1 degr de libert.
La statistique de Jarque-Bera combine ces deux statistiques. Elle vaut :
S 2 (K 3)2
N = n{ + }
6 24
Si Y de moyenne 0, de variance 1 est normalement distribue de moyenne 0, alors N suit approximati-
vement une loi de 22 . On rejette lhypothse nulle de normalit, pour de grandes valeurs de la statistique.
Tests de non corrlation
Pour un processus linaire (voir le paragraphe suivant pour la dfinition et [5] Th. 7.2.2 pour les condi-
tions exactes) dont la FAC vrifie : (k) = 0, k > m, on a pour k > m :
b(k) AN (0, var(b

(k)) AN signifie : approximativement normal (2.6)
1
(k))
var(b (1 + 2(1)2 + + 2(m)2 ) (2.7)
T
Application de ce rsultat. Si {Yt } est une suite de v.a. i.i.d., de moment dordre 2 fini, E(Yt2 ) < ,
alors (2.6) se rduit
1
(k))
var(b (2.8)
T
On montre dautre part que les coefficients dautocorrlation b(l) sont approximativement indpendants
et normalement distribus (de moyenne 0, de variance 1/T ). Ce rsultat permet de tester la nullit dun
(k) particulier. De plus tant donne une ralisation y1 , , yT dune srie vrifiant (2.8),
on devrait
avoir environ 95% des coefficients dautocorrlation empirique dans lintervalle 1, 96/ T . Si la pro-
portion observe sloigne de cette valeur, on peut conclure que les observations ne sont pas indpen-
dantes.
Test du Portemanteau Si lon veut tester que {Yt } est un bruit blanc, on a videmment intrt
considrer simultanment la nullit de plusieurs coefficients dautocorrlation. La statistique
h
X
Q(h) = T b(j) 2 (2.9)
j=1
o h est un dcalage quon choisit permet de tester :
H0h : 1 = 2 = = h
Sous lhypothse que {Yt } est un bruit blanc, Q suit approximativement une loi de 2 h degrs de
libert. Q est appele statistique de Box-Pierce. On rejette lhypothse H0h pour les grandes valeurs de
Q(h).
Quand on veut tester la blancheur du rsidu dun ajustement on utilise la statistique de Ljung-Box :
h
X b(k)2
Q (h) = T (T + 2) .
T k
k=1
Sous H0 : (1) = = (h) = 0 Q (h) 2 (h m), m est le nombre de paramtres estims dans le
modle.
Un exemple de sortie SAS de ce test figure la sous-section(2.3.1).
Test de Durbin-Watson. Le test de Durbin-Watson est un test de blancheur de srie particulier. Il sin-
tresse la situation :
yt = xt + ut , t = 1, , T (2.10)
ut = ut1 + Zt (2.11)
o : xt est un vecteur de p + 1 variables explicatives (dont la constante), Zt BB. Il teste H0 : = 0.

La statistique de Durbin-Watson est
PT
t=2 (b
ut ubt1 )2
DW = PT ,
b2t
t=1 u
o ubt est le rsidu de lajustement par moindres carrs ordinaires de yt sur xt . En dveloppant numrateur
et dnominateur on voit que
DW 2(1 b) (0, 4],
PT
t=2 u
bt1 ubt
o b = P T 2 . Les valeurs de DW proches de 0 indiquent une autocorrlation proche de 1.
t=1 u
b t
Pout le test de H0 : = 0 contre H1 : > 0, la rgion critique (RC) correspond de fortes valeurs de
DW (DW sensiblement infrieur 2, et la RC pour H1 : < 0, correspond de faibles valeurs de DW.
Pratiquement une statistique de DW 2 peut tre le signe dune mauvaise spcification du modle (par
exemple, tendance ajuste linaire alors que la tendance relle est quadratique).
Ce test tant effectu par la plupart des logiciels, que les observations soient ou ne soient pas une srie
temporelle, il ne faut pas oublier dliminer son rsultat des sorties, quand les donnes ne sont pas indi-
ces par le temps. Dans SAS il est programm ainsi que certaines extensions, dans la proc autoreg.
Notes.
1. Plus le dcalage l est grand, moins il y a dobservations pour estimer l dans (2.5). On sarrte
habituellement l T /4.
2. Observons que lon peut calculer (2.5) pour toute srie, stationnaire ou non. Si la srie nest pas
stationnaire, (2.5) a un usage purement empirique. On montre que pour une srie stationnaire, le
corrlogramme empirique, graphe de l b(l) dcroit exponentiellement vers 0, avec ventuelle-
ment des oscillations. Inversement, un graphe du corrlograme empirique qui ne dcroit pas trs
rapidement est lindice dune non stationnarit de la srie. Ainsi lexamen du corrlogramme em-
pirique dune srie permet de se faire une ide de sa stationnarit. Cet examen complte celui du
chronogramme.
3. Dans la formule (2.7) on ne connat pas les k . On les remplace par leurs estimations dans la
formule de la variance.
4. A partir des formules (2.6), (2.7) ou (2.8), on peut construire des intervalles autour de 0, par
exemple 95%. SAS base ces intervalles sur (2.6) et (2.7) alors que R utilise (2.8).
5. Il est trs pratique de se souvenir de Q(h) comme dune somme de h variables approximativement
indpendantes, carrs de v.a. N (0, 1) :
h
X Xh
b(j) 0 2
Q(h) = T b(j) 2 = ( p ) )
j=1 j=1
1/ (T )
or (1) le carr dune variable N(0,1) suit une loi 21 (2) la somme de deux v.a. indpendantes et
distribues suivant des lois 2n1 et 2n2 suit une loi 2n1 +n2 . La loi de Q(h) est donc bien 2 sous
lhypothse nulle.
(cf Formule de Bartlett).
6. La loi de la statistique DW dpend des variables explicatives x. Durbin et Watson ont trouv des
encadrements aux quantiles de cette loi qui ne dpendent que du nombre de variables explicatives,
en plus de la constante. Ctait trs utile dans les annes 50, quand les ordinateurs taient rares.
7. Le modle (2.10) est de mme nature que celui retenu pour le lac Huron au chapitre prcdent.
2.2 Modles de sries stationnaires

2.2.1 Srie linaire
Une srie Yt est dite linaire si elle peut scrire :

X
Yt = + i Zti (2.12)
i=
P
o Zt est un BB(0, Z2 ), 0 = 1 et la suite {i } est absolument sommable, cest--dire i |i | < .
On admettra quune srie linaire est stationnaire.
Une srie est dite linaire et causale si elle est linaire et i = 0, i < 0, autrement dit elle ne dpend que
du BB pass. Pour une discussion sur le sens de lcriture ci-dessus, on peut voir par exemple Hamilton
([13]), paragraphe 3.3.
P
Si Yt est linaire et causal on obtient : EYt = , var(Yt ) = Z2 2
i=0 i Lautocovariance dordre k est :
X
X
k = cov(Yt , Ytk ) = E[ i Zti , j Ztkj ] (2.13)
i=0 j=0

X
= E( i j Zti Ztkj ) (2.14)
i,j=0

X
X
2
= j+k j E(Ztkj ) = Z2 j j+k (2.15)
j=0 j=0
Si la srie est linaire et causale et si de plus i = 0 pour i > q on dit que Yt est une moyenne mobile
dordre q (MA(q)). Une srie linaire causale est un MA().
Notes.
1. La dfinition dune srie linaire a un intrt thorique car on peut lui associer une caractrisation
de la stationnarit.
2. On peut observer que les calculs dautocovariances sont particulirement simples dans cette cri-
ture.
3. Il peut sembler peu pratique dcrire un processus laide dune infinit de paramtres mais les
modles ARMA que nous allons voir : (a) sont des cas particuliers peu de paramtres de sries
linaires et causales (b) peuvent tre de bonnes approximations de telles sries.
2.2.2 Processus gaussien
Nous admettons sans justification, la dfinition non formalise suivante. Un processus {Yt } est gaussien
si :
k, un nombre de dates,
(t1 , t2 , , tk ), un choix de k dates,
le vecteur alatoire : (Yt1 , Yt2 , . . . , Ytn ) est normalement distribu. On peut observer quun processus
linaire bruit blanc gaussien est gaussien.
2.3 Processus autorgressif

Les calculs dautocovariances sont simples sur un processus linaire, mais cette criture en terme dun
bruit non observ nest pas trs pratique. On prfre avoir une expression dun processus explicitement
en fonction de son pass. Cest le cas des processus autorgressifs. Mais nous verrons aussi quelles
conditions il est possible dcrire un processus linaire comme une autorgression. Cest la notion din-
versibilit.
2.3.1 Processus autorgressif dordre 1
On dit que {Yt } est un processus autorgressif dordre 1 sil obit une quation :
Yt = 0 + 1 Yt1 + Zt , t Z (2.16)
Moments dordres 1 et 2 dun AR(1)

Supposons {Yt } dans (2.16) stationnaire alors, sa moyenne , est constante et prenant lesprance ma-
thmatique des deux cts on obtient
= 0 + 1
et si 1 6= 1 :
0
E(Yt ) = = .
1 1
Comme alors, 0 = (1 1 ) on a :
Yt = 1 (Yt1 ) + Zt
On pose Yt = Yt . Cest le processus centr. Avec loprateur retard, on a :
(1 1 B)Yt = Zt
Par substitutions successives on obtient que Yt peut tre exprim comme une moyenne mobile infinie :
Yt = Zt + 1 Zt1 + 21 Zt2 + ... (2.17)
pourvu que 1 < 1 < 1. Cette condition est suffisante pour que le processus soit stationnaire. Dans
ce cours nous supposerons toujours quun processus qui vrifie (2.16) est stationnaire si et seulement si
1 < < 1.
On appelle (2.17) la reprsentation MA() de Yt . Lcriture de Yt comme une somme de v.a. non corr-
les permet de calculer facilement les variance et autocovariances comme nous le voyons maintenant.
Elevons au carr les deux cts de (2.17), il vient :
var(Yt ) = Z2 (1 + 2 + 4 + . . . )
Z2
=
1 2
Enfin crivons (2.17) en t k et calculons les esprances des deux cts de :
Yt Ytk = (Zt + Zt1 + 2 Zt2 + ...)(Ztk + Ztk1 + 2 Ztk2 + ...)
o, Zt tant un BB, E(Zt Ztm ) = 0, m 6= 0. On obtient pour k > 0
k = (k + k+2 + k+4 . . . )Z2 = k 0
La fonction dautocorrlation de lAR(1) est :
k = k , k = 0, 1, 2, . . . (2.18)
Exemples
AR(1) simul. On a simul 150 observations de yt obissant
yt = 4 0.8 yt1 + Zt , Zt BBN (0, 1)
On a obtenu une moyenne empirique de 2.271132 et un cart-type 1.371441.
Retard FAC thorique FAC empirique

0 1 1.00000
1 -0.8 -.72267
2 0.64 0.46219
3 -0.512 -.30436
4 0.4096 0.22636
5 -0.32768 -.13674
6 0.26214 0.06958
Le test de blancheur de la srie est :

To Chi- Pr >
Lag Square DF ChiSq --------------------Autocorrelations---------------
5 6 138.90 6 <.0001 -0.723 0.462 -0.304 0.226 -0.137 0.070

12 156.79 12 <.0001 -0.136 0.168 -0.172 0.162 -0.090 -0.017
18 160.94 18 <.0001 0.067 -0.032 0.045 -0.080 0.084 -0.058
24 164.51 24 <.0001 0.067 -0.057 0.014 0.025 -0.057 0.091
Ces rsultats ont t obtenu par la syntaxe (la srie simule y est dans la table a) :
proc arima data = a; i var= y; run; quit;
Processus AR(2) Soit Yt stationnaire, obissant lquation :
Yt = 0 + 1 Yt1 + 2 Yt2 + Zt (2.19)
Prenant lesprance des deux cts on obtient :
0
E(Yt ) = =
1 1 2
pourvu que 1 6= 1 + 2 . Comme 0 = (1 1 2 ), on a :
Yt = 1 (Yt1 ) + 2 (Yt2 ) + Zt
et le processus centr : Yt = Yt vrifie :
Yt = 1 Yt1 + 2 Yt2 + Zt . (2.20)
Nous obtenons :
(l) = 1 (l 1) + 2 (l 2), l > 0 (2.21)
On appelle (2.21), lquation de moments dun AR(2). La fonction dautocorrlation dun AR(2) est :
1
(1) = (2.22)
1 2
(l) = 1 (l 1) + 2 (l 2), l > 1
Condition de stationnarit dun AR(2) Il faut pouvoir lcrire comme un MA(). Prcisons. Un
processus qui vrifie (2.19) est stationnaire si et seulement si les racines du polynme caractristique
1 1 B 2 B2 sont > 1 en module.
Explication. Soit s1 et s2 les racines de 1 1 z 2 z 2 = 0. On a donc (1 z/s1 )(1 z/s2 ) = 0
1
et on peut dvelopper en srie 11 z 2 ssi |1/s1 | < 1 et |1/s2 | < 1.
2z
Processus autorgressif dordre p Une extension immdiate du modle AR(1) est le modle AR(p).
Soit {Zt } un BB. Un processus {Yt } est dit autorgressif dordre p sil scrit :
Yt = 0 + 1 Yt1 + 2 Yt2 + + p Ytp + Zt
Avec loprateur retard on peut crire cette autorgression lordre p comme :
(1 1 B 2 B2 p Bp )Yt = 0 + Zt
(B)Yt = 0 + Zt
Condition de stationnarit dun processus autorgressif dordre p. Nous inspirant de ce quon a

obtenu pour un AR(2), on admettra quun processus autorgressif dordre p est stationnaire si les racines
de lquation : 1 1 z 2 z 2 p z p = 0 sont en module > 1.
2.3.2 Fonction dautocorrlation partielle
Considrons une srie stationnaire {Xt } et ses rgressions linaires sur son pass :
Xt = 0,1 + 1,1 Xt1 + u1t

Xt = 0,2 + 1,2 Xt1 + 2,2 Xt2 + u2t
Xt = 0,3 + 1,3 Xt1 + 2,3 Xt2 + 3,3 Xt3 + u3t
..
.
Par exemple, 0,2 + 1,2 Xt1 + 2,2 Xt2 dsigne lesprance conditionnelle linaire de Xt sachant
Xt1 , Xt2 , voir par exemple ([11] Chap. 5, ou [13]...). Les k,k , k = 1, 2, . . . forment la fonction
dautocorrlation partielle (PACF) et les estimations bk,k , k = 1, 2, . . . forment la fonction dautocor-
rlation partielle empirique. k,k a la mme interprtation que les coefficients dune rgression linaire
classique : k,k reprsente lapport dexplication de Xtk Xt tant donn quon a dj rgress sur
Xt1 , , Xtk+1 (ou toutes choses gales par ailleurs).
Supposons en particulier que Xt soit autorgressif, un AR(3) pour fixer les ides, alors il est clair que
Xt4 napporte rien de plus que Xt1 , Xt2 , Xt3 pour expliquer Xt et on montre en effet que pour
un AR(3) k,k = 0, k > 3. De mme la PACF dun AR(p) est nulle partir de lordre p + 1.
Estimation de la PACF. De mme que dans la mthode des MCO les b sexpriment en fonction des
moments dordre 2 des observations, la PACF dune srie stationnaire sexprime en fonction de son ACF
(cette dpendance est dcrite par lalgorithme de Durbin-Levinson).
Dun point de vue pratique on pensera quune srie suit un AR(p) si les bk,k 0, k > p. Prcisment,
si Xt est un AR(p), on a les proprits :
bp,p converge vers p,p quand n ,
bl,l , l > p converge vers 0 quand n ,
var(bl,l ) 1/n l > p.
La PACF empirique permet donc didentifier un processus comme un AR dun certain ordre p. Mais
on peut galement identifier lordre dun processus quon sait AR, par un critre dinformation (AIC,
SBIC...).
2.4 Processus Moyenne mobile

Processus MA(1) On dit que (Yt ) est un processus moyenne mobile dordre 1 (MA(1)), sil obit
une quation :
Yt = + Zt Zt1 (2.23)
o Zt BB(0, Z2 ). Cette quation scrit encore :
Yt = (1 B)Zt
Moments dordres 1 et 2 dun MA(1) En prenant lesprance mathmatique des deux cts de 2.23,
on voit que
E(Yt ) =
La variance de Yt est la variance dune combinaison affine de variables non corrles donc : var(Yt ) =
(1 + 2 )Z2 . De mme, cov(Yt , Yt1 ) = cov( + Zt Zt1 , + Zt1 Zt2 ) = Z2 . On voit
que cov(Yt , Ytk ) = 0, k > 1. En rsum, , le processus MA(1) dfini par (2.23) est stationnaire, de
moyenne , de fonction dautocorrlation :

1
si k = 0,

(k) = 1+2 si k = 1,

0 si k > 1

Etudiant la fonction R 1+ 2 on constate que | 1+ 2 | 0.5 ainsi :
le processus MA(1) ne peut pas dcrire des phnomnes forte autocorrlation.
Dautre part, on aimerait pouvoir exprimer le processus en fonction de son pass (observ) et pas seule-
ment en fonction dun bruit.
Inversibilit. Introduisons le processus centr, Yt = Yt , correspondant (2.23). On voit que si
|| < 1, on peut dvelopper (1 B)1 en srie entire. Ceci nous amne une dfinition.
On dit quun processus est inversible si on peut lcrire comme une autorgression infinie. Ainsi, un
MA(1) est inversible si la racine de lquation 1 z = 0 est > 1 en module. On observe que la
condition dinversibilit dun MA(1) est techniquement parallle la condition de stationnarit dun
autorgressif dordre 1.
Processus MA(q) Un processus (Yt ) est dit processus moyenne mobile dordre q (M A(q)) si :
Yt = + Zt 1 Zt1 2 Zt2 q Ztq
o Zt BB(0, Z2 ).
On peut noter de faon quivalente :
Yt = + (1 1 B 2 B2 q Bq )Zt
= + (B)Zt
Un M A(q) est une srie linaire.
Proprits.
1. Un M A(q) est un processus stationnaire.
2. La fonction dautocorrlation dun processus MA(q) est nulle partir de lordre q + 1.
Cette dernire proprit est utile pour deviner (identifier) lordre de moyenne mobile convenable pour
modliser une srie. En effet, en prsence dun corrlogramme empirique non significativement diffrent
de 0 partir dun certain ordre (k), on pensera modliser la srie correspondante par un MA(k 1).
Inversibilit dun MA(q). Un MA(q) est inversible si les racines de 1 1 z 2 z 2 q z q = 0

sont, en module, > 1.
Processus ARMA(p,q) {Yt } est un processus ARMA(p,q) sil est stationnaire et obit une quation :
Yt 1 Yt1 2 Yt2 p Ytp = 0 + Zt 1 Zt1 2 Zt2 q Ztq (2.24)

o Zt BB(0, Z2 ). Observons que (2.24) scrit aussi :
(1 1 B 2 B2 p Bp )Yt = 0 + (1 1 B 2 B2 q Bq )Zt ,
ou encore :
0 1 1 B 2 B2 q Bq
Yt = + Zt , (2.25)
1 1 B 2 B2 p Bp 1 1 B 2 B2 p Bp
Examinons le 1er terme du ct droit avec, pour simplifier lcriture, p = 2. Cest une fraction rationnelle
en B. Le numrateur est une constante et le polynme 1 1 B 2 B2 se factorise en termes de degr 1,
rels ou complexes : 1 1 B 2 B2 = (1 d1 B)(1 d2 B) o les di sont les inverses des racines du
polynme.
La stationnarit de Yt implique que |di | < 1, i = 1, 2. Alors (1 d1 B)1 = 1 + d1 B + d21 B2 + et
(1 1 B 2 B2 )1 = (1 + d1 B + d21 B2 + )(1 + d2 B + d22 B2 + ) et donc le processus peut scrire
comme un MA(i nf ty) et est donc est bien stationnaire.
Maintenant, si c est constante dans le temps, (1 + d1 B + d21 B2 + )c = (1 + d1 + d21 + )c =
(1/(1 d1 ))c. Finalement (2.25) revient :
0 1 1 B 2 B2 q Bq
Yt = + Zt (2.26)
1 1 2 p 1 1 B 2 B2 p Bp
2 q
11 B2 B q B
Dautre part E( 2 p Zt ) = 0, en utilisant le mme argument que ci-dessus.
11 B2 B p B
Do :
0
= E(Yt ) = .
1 1 p
La fonction dautocovariance dun ARMA(p,q) se calcule par des quations de rcurrence (voir 2.22
pour un AR(2)).
Notes
1 Les quations qui relient les paramtres AR et MA aux coefficients dautocorrlation (voir (2.21, pour
le cas dun AR(2)) sont les quations de Yule-Walker : tant donn les coefficients auto-rgressifs et de
moyenne mobile, on peut trouver les coefficients dautocorrlation. Inversement, tant donn une fonc-
tion dautocorrlation empirique et des ordres p et q, on peut obtenir par ces quations des estimations
des paramtres AR et MA. Ces estimations servent de valeurs initiales dans lestimation MV 1 des para-
mtres.
2 Un ARMA(p, q) stationnaire et inversible peut scrire comme un AR(). Mais trs souvent un AR(p )
dordre p pas trs suprieur p en donne une trs bonne approximation : les paramtres sont certes mal
estims mais la srie est bien prdite et son erreur correctement reconstitue. Cest lide quexploite la
mthode didentification MINIC que nous verrons plus loin.
3 On trouvera en annexe de ce chapitre, un exemple dquations de Yule-Walker, bien comprendre,
ainsi quune prsentation de lestimation des AR et des MA quil faut au moins parcourir pour voir que
lestimation dun MA est assez difficile.
4 On trouvera encore en annexe, une prsentation de la prvision, quil suffira de parcourir pour com-
prendre le principe, mais sur laquelle il nest pas utile de se pencher longuement.
1
MV = Maximum de Vraisemblance
2.5 Saisonnalit
2.5.1 Saisonnalit multiplicative
Dcrivons brivement la modlisation de la saisonnalit dans lapproche de Box-jenkins. Soit une srie
mensuelle observe (pour simplifier) sur un nombre entier dannes, partir dun mois de janvier. On
note yij lobservation du mois j de lanne i; j = 1, , 12, i = 1, , N .
Rangeons les valeurs observes en une table de Buys-Ballot : une ligne par an, une colonne par mois :
janv. fvr. mars dc.

y11 y12 y13 ... y1,12
y21 y22 y23 ... y2,12

yN 1 yN 2 x13 ... yN,12
Supposons quon modlise la dpendance dun mois sur un ou deux mois prcdents (sans soccuper de
leffet saisonnier) et quon adopte un ARMA(p,q) :
(B)Yt = c + (B)bt
Il est fort probable, si la srie prsente une saisonnalit, que le rsidu bbt ne sera pas blanc mais aura une
structure de corrlation saisonnire. On peut envisager deux traitements de cette "non blancheur". Ou
bien on ajoute des termes de retard dans les polynmes et , ou bien on modlise bt par un ARMA
dont lunit de temps est lanne :
s (Bs )
bt = zt
s (Bs )
o s dsigne la priode (ici, s= 12). Ce qui donne :
s (Bs )(B)Yt = c1 + (B)s (Bs )Zt (2.27)
avec Zt BB, o (B), s (Bs ), (B), s (Bs ) sont respectivement des polynmes de degrs p, q en
B et P, Q en Bs . On dit que Yt est un SARMA(p, q)(P, Q)s sil vrifie (2.27) et est stationnaire.
Les conditions de
stationnarit de Yt sont : les racines des polynmes (B) et s (Bs ) sont en module > 1.
inversibilit de Yt sont : les racines des polynmes (B) et s (Bs ) sont en module > 1.
2.6 Modles ARIMA et SARIMA

Un processus ARIMA(p,d,q) est un processus dont la diffrence dordre d est un ARMA(p,q). Par
exemple Yt vrifiant :
1 1 B 2 B2
(1 B)Yt = c + Zt
1 1 B 3 B3
est un ARIMA(3,1,2),
Yt vrifiant :
(1 B)2 Yt = c + (1 1 B)Zt
est un ARIMA(0,2,1).
Un ARIMA est autorgressif mais son polynme dautorgression a 1, racine d fois.
Ainsi lARIMA(3,1,2) ci-dessus, peut scrire
(1 (1 + 1 )B + 1 B2 3 B3 + 3 B4 )Yt = d + (1 1 B 2 B2 )Zt
il y a bien une partie autorgressive mais son polynme dautorgression a 1 comme racine et la
srie est non stationnaire. On ncrit pas que cest un AR(4,2) mais un ARIMA(3,1,2).
La srie diffrencie (1 B)Yt est la srie des accroissements de Yt , alors que la srie diffrencie deux
fois (1 B)2 Yt est la srie des accroissements des accroissements. Lopration inverse de la diffrencia-
tion est lintgration do le I dans "ARIMA".
Un processus Yt est un SARIMA(p, d, q)(P, D, Q)s sil obit
(1 1 B q Bq )(1 1 Bs Q BsQ )
(1 B)d (1 Bs )D Yt = c + Zt (2.28)
(1 1 B p Bp )(1 1 Bs P BsP )
(B)s (Bs )
(1 B)d (1 Bs )D Yt = c + Zt
(B)s (Bs )
o
s (Bs ) = 1 1 Bs Q BsQ
et
s (Bs ) = 1 1 Bs P BsP
Par exemple un SARIMA(0, 1, 1)(1, 1, 0)12 obit :
1 1 B
(1 B)(1 B12 )Yt = c + Zt (2.29)
1 1 B12
Nous verrons au chapitre (3), les tests de racine unit permettant de dcider sil faut diffrencier une
srie.
2.7 Complment : non stationnarit en variance

On envisage le cas dune srie {Yt } dont la moyenne, t , varie avec le temps de faon dterministe et
dont la variance dpend du niveau moyen :
Yt = t + Ut
avec var(Ut ) = h2 (t ) 2 pour une certaine fonction h. Pour traiter cette situation dhtroscdasticit,
on cherche une transformation g telle que var(g(Yt )) constante. Cest la technique dite de stabili-
sation de la variance.
Par linarisation on a :
g(Yt ) g(t ) + (Yt t )g (t )
et
var(g(Yt )) [g (t )]2 var(Yt )
On cherche donc g telle que g (x) = 1/h(x). Par exemple, pour h(x) = x, g (x) = 1/x et donc
g(x) = log(x).
Soit une srie Yt qui montre la fois une croissance dans le temps : t = E(Yt ) fonction croissante de t et
une variabilit qui augmente avec t : var(Yt ) fonction croissante de t. Si on modlise ce phnomne par :
var(Yt ) = c2t on voit que la transformation en log stabilisera la variance. Cette situation est classique
dans les sries de stock. Les exemples "ventes de champagne", "ventes de vin" entrent dans ce cadre.
La srie de la consommation britannique utilise plus loin dans ce chapitre en est un autre exemple. En
prsence de telles sries on commence par les transformer en log avant de faire une modlisation ARIMA
ou autre.
Complment. On appelle transformation de Box-Cox , la transformation :

Yt 1
Yt

o est un paramtre positif choisir. Quand 0 la transformation de Box-Cox revient la transfor-
mation en log. Ces transformations peuvent ramener des distributions vers la normalit .
2.8 Etude empirique dune srie par une modlisation ARIMA

Etant donn une srie sans saisonnalit et quon veut essayer de modliser par un ARIMA on doit choisir
3 paramtres : p, d et q puis on estime le modle enfin on prdit la srie. La validation du modle se fait
2 niveaux :
1. la fin de lestimation on doit tester la blancheur du rsidu Zbt , la significativit des coefficients
estims, voir sil y a des messages du logiciel indiquant que lalgorithme destimation na pas
converg.
2. la prvision : on dessine un intervalle de prvision pour une partie de srie observe et on regarde
si la proportion de points dans lintervalle est proche, ni trop suprieure ni trop infrieure, du niveau
choisi pour lintervalle.
Si le rsultat nest pas satisfaisant on recommence avec dautres valeurs de p, d ou q.
Pour une srie prsentant une saisonnalit, et quon veut essayer de modliser par un SARMA il y a donc
6 paramtres : p, d et q et P, D, Q choisir.
On commence toujours par examiner le diagramme squentiel de la srie.
Pour le choix de p, d et q on saide des 3 fonctions : ACF, PACF et IACF (fonction dautocorrlation
inverse). LIACF dun ARMA(p,q) est dfinie comme lACF de lARMA(q,p) de la srie obtenue en
permutant les roles des coefficients AR et MA dans son modle. SAS est un des rares logiciels fournir
cette fonction.
Fonction MA(q) AR(p) ARMA(p,q) bruit blanc
ACF Nul(q) Exp Exp 0
PACF Exp Nul(p) Exp 0
IACF Exp Nul(p) Exp 0
o :
Nul(q) veut dire, nulle partir du dcalage q+1, Exp, dcroissance exponentielle et 0, que la fonction
est nulle tous les dcalages.
TAB . 2.1 Comportement des 3 fonctions dautocorrlation, suivant le modle de la srie.
tape didentification (au sens de lautomatique) Il faut, avant lestimation, choisir les paramtres p, d
et q. En examinant laspect de la FAC (Fonction dautocorrlation) empirique, on se fait une ide
de la stationnarit (atteinte ou non) de la srie. On considre quune srie est stationnaire quand sa
FAC empirique dcroit suffisamment vite vers 0, mais nous verrons dans un autre chapitre les tests
de racine unit (il y a racine unit dans lautorgression si d> 0). On exammine ensuite laspect
des ACF et PACF de la srie. On se fait ainsi une ide des ordres p et q possibles. Des mthodes
daide au choix de p et q ont t proposes. SAS en intgre plusieurs. Dans une sous-section, nous
dcrivons rapidement la mthode MINIC.
tape destimation Une fois p et q choisis, on estime le modle. On teste dabord que le rsidu Z bt est
un bruit blanc. Si on doit rejeter cette hypothse, il faut revoir le choix des ordres p et q, et de
la transformation initiale. Si on peut considrer que le rsidu est un bruit blanc, on analyse les
rsultats de lestimation suivant les mmes principes quen rgression linaire : significativit des
i et j daprs les t-statistiques, corrlations entre les estimateurs de ces paramtres.
Si on rejette la blancheur du rsidu, lexamen de son ACF ou PACF aide corriger le modle. On
en a vu un exemple avec les SARMA.
Remarque. Les logiciels qui ajustent un modle ARMA dordres p et q donns, une srie suppo-
se stationnaire, fournissent une reprsentation inversible : les racines de (B) = 0 et (B) = 0
sont > 1 en module. Quand on essaie dajuster un modle ARMA une srie non stationnaire, on
obtient souvent un message davertissement ou derreur de la part du logiciel car les procdures
numriques doptimisation mises en uvre pour lestimation ne convergent pas ou convergent mal
dans un tel cas.
tape de prvision On utilise enfin le modle estim pour prdire la srie. Il est recommand de nuti-
liser quune partie de la srie pour estimer le modle, de faon pouvoir comparer ensuite pour
un mme intervalle de temps, ralisations et prvisions. Ltape de prvision fournit le rsidu
Zt , t = 1, , T et si on indique un horizon h de prvision, les prvisions yT (k), k = 1, , k
et, sous lhypothse de normalit de la srie, les intervalles de prvision, bass sur des variances
derreur de prvision du type de (2.44) et un niveau quon peut choisir.
Lchec de la modlisation peut venir de causes varies dont la non stationnarit de la srie.
Considrations pratiques pour la modlisation ARIMA
A Parcimonie. On ne doit pas accumuler des paramtres. Cest un principe gnral en statistique. Dans
une modlisation ARIMA il ne faut donc pas ajouter des paramtres pour capter la moindre trace dau-
tocorrlation dans les rsidus dun ajustement antrieur.
B On a rarement un modle satisfaisant ds la 1re identification. A partir dun premier modle il faut alors
chercher des voies damlioration.
Aller du simple au compliqu. On commence par capter les principales caractristiques par lexamen
des ACF et PACF. On examine ensuite les ACF et PACF des rsidus du modle ajust et on corrige le
modle estimer ... et on recommence. Cest sur cette ide quon a introduit les modles SARMA.
Simplifier. On commence par un modle avec (relativement) beaucoup de paramtres. Si on accepte la
blancheur de son rsidu, on essaie de le simplifier en examinant les t-statistiques des coefficients et la
matrice des coefficients de corrlation entre les estimateurs des paramtres (des coefficients suprieurs
0.9 indiquent souvent une mauvaise spcification).
C Toutes les sries ne se prtent pas une modlisation ARIMA et une modlisation ARIMA ne permet
pas certaines oprations telle que la mise en vidence dune composante saisonnire.
D Prvision. Le temps quon peut consacrer la prvision dune srie guide le choix des mthodes. Si
lon doit prdire quelques centaines de sries en une journe, on utilisera des mthodes de prvision
(souvent du lissage exponentiel) qui choisissent automatiquement un modle sur un critre de qualit de
la prvision un certain horizon.
Voir sur ces questions la documentation de la proc forecast de SAS ou le package forecast de
R:
www-personal.buseco.monash.edu.au/~hyndman/Rlibrary/forecast/
2.8.1 La mthode MINIC

La mthode MINIC pour "Minimum Information Criterion" aide identifier les ordres p et q pour une
srie stationnaire susceptible de recevoir une modlisation ARMA.
Principe
Soit une srie Yt , t = 1, , n, centre stationnaire et inversible suivant un modle ARMA, dordres p
et q inconnus.
1 1 B q Bq
Yt = Zt (2.30)
1 1 B p Bp
ou
p,q (B)Yt = p,q (B)Zt (2.31)

o Zt BB(0, Z2 ). Rappelons que Zt est le rsidu de la projection de Yt sur son pass : Yt1 , Yt1 , .
Lexpression quon peut choisir pour cette projection nen change pas la valeur.
Comme le processus est suppos inversible on peut le reprsenter comme un AR() et en choisissant
un ordre dautorgression suffisamment grand on peut toujours approcher le modle ARMA de cette
srie par un modle AR. Prcisment :
et Zt
p (B)Yt = Z (2.32)
pour p suffisamment grand, o les paramtres sont estims par les quations de Yule-Walker.
Dautre part le critre BIC (Bayesian Information Criterion) pour un ajustement dun ARMA(m,j)
gaussien vaut :
BIC(m, j) = n ln(s2 ) + 2(m + j) ln(n) (2.33)
o lestimation de la variance de lerreur du bruit blanc, est

n
X
1 be2
s2 = Z t.
n
t=max(m,j)
On peut observer que le BIC dpend du nombre de paramtres et, seulement indirectement, de leurs
valeurs par lintermdiaire de s2 estimation de la variance de linnovation. Comme pour lAIC rappel
un peu plus loin, entre plusieurs modles non ncessairement embots, on retient le modle de BIC
minimum.
Si on a ajust un AR dordre p suffisamment lev, la projection de Yt sur son pass est correctement
be
value et le rsidu Z t est alors une bonne prdiction de lerreur de prvision, Zt . Pour estimer alors un
ARMA(m,j) on ajuste le modle :
be be be
Yt = 1 Yt1 + 2 Yt2 + + m Ytm + 1 Z t1 2 Z t2 j Z tj + ut , (2.34)
cest un modle linaire en et et donc destimation rapide. Le rsidu u

btP
de cet ajsutement est une
2
bonne approximation de Zt et on peut donc estimer var(Zt ) par s = (1/N ) t u b2t et le BIC(2.33).
Lapplication de MINIC fonctionne donc ainsi :
Lutilisateur fixe un ordre maximum dautorgression p (loption par dfaut de SAS nest pas perti-
nente pour toutes les sries). Lajustement (2.32) est effectu.
Pour une srie de valeurs (m, j) lajustement (2.34) est effectu.
Lutilisateur retient le couple (m, j) qui minimise le BIC.
Notes.
Parfois le BIC est dfini comme (2.33) divise par n.
Le modle AR dordre lev quon ajuste peut donner un ajusement parfait (sur ajustement) quand la
srie est courte. On souponne une telle situation si le BIC prend des valeurs trs ngatives.
Lapplication de cette mthode ne dispense pas dessayer de simplifier le paramtrage, notamment en
cas de saisonnalit.
Exemple
Simulation dun ARMA(1,2) :
data st9.arma1_2 (keep= u date);

um1 = 0;
z2=0;
z1 = 0;
5 do t = -50 to 200;
z = 2*rannor( 1436 );
u = .9 *um1 +z -.1*z1+.9*z2;
if t > 0 then
do;
10 date = intnx(month, 31dec1960d,t);
format date monyy.;
output;
end;
z2=z1;
15 z1 =z;
um1=u;
end;
run;
Etape didentification avec loption minic, o on prcise les ordres extrmes des autorgressions auxi-
liaires.
proc arima data=st9.arma1_2;

i var=u minic perror=(1:11); run;
5 Le Systme SAS
The ARIMA Procedure
Critre dInformation Minimum

10
Lags MA 0 MA 1 MA 2 MA 3 MA 4 MA 5
AR 0 1.918625 1.567837 1.577507 1.587355 1.574758 1.591561

AR 1 1.706186 1.594322 1.54492 1.562619 1.575613 1.599728
15 AR 2 1.565707 1.575859 1.55939 1.577493 1.597215 1.620847
AR 3 1.579385 1.600155 1.578792 1.601501 1.619983 1.643739
AR 4 1.570294 1.595204 1.604108 1.625797 1.646315 1.669871
AR 5 1.593425 1.619477 1.627451 1.643971 1.653991 1.678334
20 Error series model: AR(9)

Minimum Table Value: BIC(1,2) = 1.54492
Une tape destimation avec les valeurs suggres p=1 et q=2, confirme ensuite (a) la blancheur du bruit
et (b) quil ny a pas de paramtre non significatif.
e p=1 q=2; run;
Question Que se passe-t-il si lon remplace dans le code ci-dessus, la ligne

u = .9 *um1 +z -.1*z1+.9*z2;
par la ligne
u = .9 *um1 +z -.1*z1-.9*z2; ?
Il nest pas ncessaire davoir un ordinateur pour rpondre cette question. Mais il est intressant dillus-
trer la rponse en programmant la modification.
2.9 Mise en pratique dans SAS

Lidentification dune srie ARMA ou ARIMA se fait pas la proc arima.
Il y a 3 commandes dans la proc ARIMA : identify ou i, estimate ou e, forecast ou f.
La mise en uvre de ces commandes est hirarchique :
1. identify dsigne la srie tudier et ventuellement la diffrencie, choix de d ou ds par luti-
lisateur. Pour la srie ventuellement transforme elle fournit la fonction dautocorrlation (ACF),
la fonction dautocorrlation partielle (PACF), la fonction dautocorrlation inverse (IACF), un
test de blancheur de la srie sous le titre Autocorrelation Check for White Noise.
A moins que la srie tudie ne soit dj un BB, ce test conclut habituellement au rejet de lhypo-
thse de blancheur. La commande identify peut tre suivie de plusieurs commandes
2. estimate, on doit crire une par modle quon veut estimer sur la srie dfinie la dernire
tape identify. estimate connat d et D de ltape identify, on lui donne des valeurs
de p, q, P, Q et elle fournit les estimations des paramtres , , , et de la variance de Zt pour le
modle ainsi spcifi. Elle fournit aussi un test de blancheur de Zbt sous le titre Autocorrelation
Check of Residuals. Si lon rejette lhypothse de blancheur des rsidus il faut essayer un
autre ajustement.
Pour chaque modle estim on peut vouloir faire plusieurs prvisions dhorizons diffrents par
exemple. Do une ou des tapes
3. forecast, qui fait des prvisions sur le dernier modle estim.
En rsum, une tape forecast se base sur la dernire tape estimate , et une tape estimate sur
la dernire tape identify.
Chaque tape doit se terminer par run; et la proc arima par quit; .
Exemples de syntaxe La table serieg de la librairie SAS st contient une variable xlog et une
variable de date : ladate. (xlog est le logarithme de la Srie G de louvrage de Box-Jenkins ([1]),
transport arien mensuel de passagers de 1949 1961).
Identification de la srie. La proc arima ne faisant de diagrammes squentiels il est conseill duti-
liser simultanment le T IME S ERIES V IEWER pour visualiser les sries et leurs transformations. Menu
S OLUTIONS /A NALYSIS /T IME S ERIES V IEWER. En vue de cette visualisation il est fortement conseill
de crer une variable de date dans la table.
Dessiner lACF la PACF et lIACF
de la srie xlog :
proc arima data= st.seriesg;
identify var=xlog;
run;
de la srie des accroissements de xlog dun mois sur lautre et en nimprimant les autocorrlations que
jusquau dcalage 15 :
identify var=xlog(1) nlag=15;
run;
de la srie diffrencie 1 fois lordre 1 et 1 fois lordre 12 :
identify var=xlog(1,12) ;
run;
quitter la proc arima
quit;
La syntaxe complte de ce quon vient de faire est donc :
proc arima data=st.seriesg;

identify var= xlog; run;
identify var= xlog(1) nlag=15; run;
identify var= xlog(1,12) ; run;
quit;
Estimer un ARIMA(2,1,3) sur la srie xlog par la mthode des moindres carrs inconditionnels et
obtenir dans loutput les 3 fonctions dautocorrlation des rsidus :
proc arima data=st.seriesg;

identify var=xlog(1) ;
run;
estimate p=2 q=3 method=uls plot;
run;
Aprs cette tape, estimer un SARIMA(0, 1, 1)(0, 1, 1)12 sur xlog en contraignant la constante additive
0 et par la mthode des moindres carrs conditionnels (par dfaut) :
identify var=xlog(1,12) nlag=15;

run;
estimate q=(1)(12) noconstant ;
run;
Pour avoir les 3 fonctions dautocorrlations du rsidu il faut ajouter loption plot :
estimate q=(1)(12) noconstant plot;
Prdire la srie 2 ans et stocker les prvisions, les bornes de lintervalle de prvision ( 95% par dfaut)
et les rsidus, pour les dates o ils sont dfinis, dans la table st.previ sans les mettre dans loutput
(noprint) :
forecast out=st.previ lead=24 id= ladate interval=month noprint;

run;
quit;
Loption interval= permet SAS dextrapoler la date. Loption id= copie la variable dsigne
ensuite, dans le fichier. Ne pas oublier quit; pour avoir accs au fichier des prvisions.
Dtails sur la commande identify Pour stocker les fonctions dautocorrlation calcules, option outcov=.
Faire un test de racine unit : statiaonarity= : pour faire un test de Dickey-Fuller sur la srie x de
la table SeriesA
proc arima data=SeriesA;

identify var=x stationarity=(adf=(5,6,7,8));
run;
Tester que lc a une racine unit saisonnire de priode 4 :
proc arima data=b ;

identify var=lc stationarity=(adf=(2,5) dlag=4);
run;
Dtails sur la commande estimate

Ajustement trous. Ajuster un ARMA(3,2) avec comme seuls coefficients non nuls : 1 , 3 et 2 , on
crira la commande :
estimate p=(1,3) q=(2);
bt dun modle dont on a fix les paramtres pralablement, option
Calculer et stocker les rsidus Z
noest. Par exemple, calculer les rsidus du modle
1 .7B
yt = 0.5 + Zt
1 + .9B
proc arima data=a;
identify var=y ;
run;
estimate p=1 q=1 ar=(-.9) ma=(.7) mu= .5 noest;
run;
forecast out=b1 lead=0 noprint ;
run;
Critre dinformation dAkaike. LAIC (Akaikes Information Criterion) est :

AIC = 2 log(L) + 2k
o L est la fonction de vraisemblance value en les estimations des paramtres et k est le nombre de
paramtres estims. (On rencontre aussi une expression de lAIC divise par n.) Si on a suppos le
processus AR(p) gaussien, de bruit blanc N (0, Z2 ), lAIC prend la forme :
2 ) + 2p
AIC(p) = n ln(b
o b2 est lestimation MV de Z2 . Pour utiliser ce critre, on calcule lAIC pour diffrentes valeurs de p
et on retient lordre donnant lAIC le plus faible.
Notes
1. LAIC est form de deux termes :
a) 2 log(L) qui est dautant plus faible que lajustement MV est bon,
b) 2k qui pnalise cette faible valeur par le nombre de paramtres estims.
2. Les critres dinformation, AIC, BIC ou autres ou la PACF ne suggrent pas ncessairement les mmes
ordres pour une srie donne.
3. LAIC comme le BIC permet de comparer des modles non embots, AR ou autres.
2.9.1 Modlisation du niveau du Lac Huron
Le niveau du lac Huron examin au chapitre 1 montre :
une tendance lgrement dcroissante,
une variabilit plus grande aux dates rcentes quau dbut de la srie (htroscdasticit),
enfin on observe que les rsidus de lajustement dune droite par MCO au niveau, deux dates cons-
cutives sont corrls positivement (1.15).
La srie est courte et nous nessaierons pas de modliser lhtroscdasticit.
Objectif. Prdire le niveau lhorizon 1.
Si lobjctif est de prdire le niveau lan prochain, il faut exploiter la fois la linarit de la tendance et la
corrlation de la srie 2 dates conscutives.
Rgression linaire du niveau sur lanne et stockage des rsidus de cet ajustement.
yt = 0 + 1 t + ut , t = 1, , T (2.35)
proc autoreg data=st6.lake;

model niveau = date;
output out= lakout residual=residmc pm= pred ;
run;
Examen du rsidu de cet ajustement. Le rsidu u bt = yt b0 b1 t. de lajustement par les MCO

est stock dans residmc. On a dj constat au chapitre 1 que le signe du rsidu est assez rgulirement
alternativement positif et ngatif. En rsum, nous avons estim le niveau moyen du lac et avons constat
que lerreur est autocorrle.
Identification du modle de lerreur. Sur la srie des rsidus u

bt on essaie de dcouvrir le mcanisme
dautocorrlation des ut .
proc arima data=lakout;
identify var= residmc minic perror=(8:11); run;
The ARIMA Procedure
Name of Variable = residmc
5 Mean of Working Series 1.47E-15

Standard Deviation 1.118698
Number of Observations 98
10 Autocorrelations
Lag Covariance Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1
0 1.251485 1.00000 | |********************|

15 1 0.953128 0.76160 | . |*************** |
2 0.581134 0.46436 | . |********* |
3 0.326760 0.26110 | . |***** . |
4 0.175465 0.14021 | . |*** . |
5 0.100643 0.08042 | . |** . |
20 6 0.042525 0.03398 | . |* . |
7 0.029330 0.02344 | . | . |
8 0.065770 0.05255 | . |* . |
9 0.110970 0.08867 | . |** . |
10 0.027184 0.02172 | . | . |
25 11 -0.088782 -.07094 | . *| . |
...
"." marks two standard errors
30
Partial Autocorrelations
Lag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1
35 1 0.76160 | . |*************** |
2 -0.27544 | ******| . |
3 0.05104 | . |* . |
4 -0.01301 | . | . |
5 0.02166 | . | . |
40 6 -0.04669 | . *| . |
7 0.06037 | . |* . |
8 0.05885 | . |* . |
9 0.02958 | . |* . |
10 -0.21408 | ****| . |
45 11 -0.00921 | . | . |
Vu la PACF, on choisit dajuster un AR(2) au rsidu (MINIC suggre autre chose.).
proc arima data= lakout;

i var= residmc; run;
e p=2 noint plot; run;
On a choisi loption noint car le rsidu tant de moyenne 0, la moyenne estime est elle-mme nulle.
The ARIMA Procedure
Conditional Least Squares Estimation
5 Erreur Pr.
Paramtre Estimation standard Valeur du test t Approx. > |t| Retard
AR1,1 1.00826 0.09819 10.27 <.0001 1

AR1,2 -0.28830 0.09996 -2.88 0.0048 2
10
Variance Estimate 0.467565

Std Error Estimate 0.683787
AIC 205.59
15 SBC 210.7599
Number of Residuals 98
* AIC and SBC do not include log determinant.
20 Correlations of Parameter
Estimates
Parameter AR1,1 AR1,2
25 AR1,1 1.000 -0.768

AR1,2 -0.768 1.000
Autocorrelation Check of Residuals

30
To Chi- Pr >
Lag Square DF Khi2 ---------------Auto-corrlations--------------
6 0.58 4 0.9653 0.016 -0.035 -0.008 0.036 0.051 -0.010

35 12 5.32 10 0.8686 -0.034 -0.038 0.167 -0.005 -0.097 -0.053
18 6.14 16 0.9865 -0.034 0.007 -0.022 0.037 -0.003 -0.060
24 10.36 22 0.9827 -0.002 -0.141 -0.007 0.006 0.115 0.007
Model for variable residmc

40
No mean term in this model.
Autoregressive Factors
45 Factor 1: 1 - 1.00826 B**(1) + 0.2883 B**(2)
Le rsidu de cet ajustement est un BB. En rsum, le modle de lerreur ajust sur les rsidus MCO est
1
ut = Zt
1 1.00826B + 0.2883B2
avec Zt BBN (0, 0.467565).
Le modle de la moyenne obtenu par MCO est dautre part :
yt = 8.1208 0.000066 datet + ut

avec var(ut ) = 1.27756. Voir chapitre prcdent.
Estimation simultane de la moyenne et de la structure dautocovariance de lerreur.

proc autoreg data=st6.lake;

model niveau = date/nlag=2;
output out= lakout residual=residbb rm = residmoy p= pred ;
run;
Noter quon stocke deux rsidus : rm correspond u bt et r ou residual Zbt . De mme p= permet de
stocker la prvision lhorizon 1 de la srie, tenant compte de la dynamique de lerreur.
Le dbut du traitement commence par une rgrssion MCO. Ensuite autoreg se base sur les rsidus de
cette rgression pour estimer le modle globalement.
The AUTOREG Procedure
Dependent Variable NIVEAU

5
Ordinary Least Squares Estimates
SSE 122.645511 DFE 96

MSE 1.27756 Root MSE 1.13029
10 SBC 309.266295 AIC 304.09636
15 Erreur Proba.
Variable DF Estimation standard Valeur du test t Approx. > |t|
Intercept 1 8.1208 0.1864 43.57 <.0001

DATE 1 -0.000066 0.0000111 -6.00 <.0001
20
Estimations des auto-corrlations
Retard Covariance Corrlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1

25
0 1.2515 1.000000 | |********************|
1 0.9531 0.761598 | |*************** |
2 0.5811 0.464356 | |********* |
30
Preliminary MSE 0.4857
Estimations des paramtres autorgressifs

35
Erreur
Retard Coefficient standard Valeur du test t
1 -0.971372 0.099152 -9.80

40 2 0.275439 0.099152 2.78
Yule-Walker Estimates
45 SSE 44.8531319 DFE 94

MSE 0.47716 Root MSE 0.69077
SBC 220.882938 AIC 210.543068
50
Erreur Proba.
Variable DF Estimation standard Valeur du test t Approx. > |t|
55 Intercept 1 8.2289 0.3631 22.66 <.0001

DATE 1 -0.000060 0.0000213 -2.80 0.0062
Enfin, on vrifie que le rsidu est bien un BB.
proc arima data= lakout;

i var= residbb; run;
The ARIMA Procedure

5
Name of Variable = residbb
Mean of Working Series 0.001795

10 Number of Observations 98
Autocorrelations
15 Lag Covariance Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1
0 0.457682 1.00000 | |********************|

1 0.023577 0.05151 | . |* . |
2 -0.0044736 -.00977 | . | . |
20 3 0.0030108 0.00658 | . | . |
4 0.019645 0.04292 | . |* . |
5 0.024921 0.05445 | . |* . |
6 -0.0027022 -.00590 | . | . |
7 -0.013830 -.03022 | . *| . |
25 8 -0.015511 -.03389 | . *| . |
9 0.074605 0.16301 | . |***. |
...
30
Autocorrelation Check for White Noise
To Chi- Pr >
35
6 0.79 6 0.9923 0.052 -0.010 0.007 0.043 0.054 -0.006
12 5.38 12 0.9441 -0.030 -0.034 0.163 -0.006 -0.097 -0.057
18 6.29 18 0.9949 -0.040 0.002 -0.025 0.032 -0.008 -0.065
24 10.59 24 0.9916 -0.010 -0.141 -0.010 0.006 0.115 0.015
40
Le modle est satisfaisant.

En rsum le modle quon a ajust est :
niveaut = 8.2289 0.000060 datet + ut (2.36)

ut = 0.971372ut1 0.275439ut2 + Zt (2.37)
(attention aux signes dans autoreg !) ou
1
niveaut = 8.2289 0.000060 datet + Zt
1 0.971372B + 0.275439B2
\t ) = 0.47716.
avec var(Z
On devrait galement vrifier la normalit de Zt .
Cest un exemple de modle ARMAX dont la forme gnrale est :

1 1 B q Bq
Yt = 0 + 1 x1t + + m xmt + Zt Zt BBN (0, Z2 )
1 1 B p Bp
o les xit sont des variables explicatives dterministes. Un ARMAX est, sa moyenne prs qui nest pas
constante, un ARMA.
Exercices.
(1) On a choisi dajuster un AR(2) lerreur et on a estim le modle avec loption par dfaut de
autoreg, cest--dire la mthode de Yule-Walker. Comparer les ajustements avec erreur AR(1)
ou AR(2), faire ces ajustements par maximum de vraisemblance, comparer les AIC obtenus et conclure.
Indication. A ltape model ajouter loption method= ml aprs le \.
(2) On considre le modle
1 B
Yt = a + b t + .
1 1 B 2 B2
Ecrire ce modle sans utiliser de fraction rationnelle. (Il faut multiplier gauche et droite par le dno-
minateur.)
Si lerreur a une composante MA, lestimation dun ARMAX doit se faire par la proc arima. Le
mme travail que ci-dessus sobtient alors par la syntaxe :
proc arima data=st6.lake;

identify var= niveau CROSSCORR= date noprint ; run;
estimate input= date p=2 ; run;
forecast out=armax id= date ; run;
5 quit;
La syntaxe nest pas trs explicite statistiquement, ainsi loption crosscorr de la commande identify
ne fait pas rfrence ici une quelconque corrlation croise entre deux sries temporelles.
The ARIMA Procedure
5 Erreur Pr.
Paramtre Estimation standard Valeur du test t Approx. > |t| Retard Variable
MU 8.25482 0.39196 21.06 <.0001 0 NIVEAU

AR1,1 1.01092 0.09911 10.20 <.0001 1 NIVEAU
10 AR1,2 -0.29015 0.10108 -2.87 0.0051 2 NIVEAU
NUM1 -0.0000569 0.00002128 -2.67 0.0089 0 DATE
15 Paramtre Shift
MU 0
AR1,1 0
AR1,2 0
20 NUM1 0
Constant Estimate 2.304953

Variance Estimate 0.476508
25 Std Error Estimate 0.690296
AIC 209.3835
SBC 219.7234
Number of Residuals 98
* AIC and SBC do not include log determinant.
30
Correlations of Parameter Estimates
Variable NIVEAU NIVEAU NIVEAU DATE

35 Parameter MU AR1,1 AR1,2 NUM1
NIVEAU MU 1.000 -0.010 0.095 0.796

NIVEAU AR1,1 -0.010 1.000 -0.768 -0.007
NIVEAU AR1,2 0.095 -0.768 1.000 0.095
40 DATE NUM1 0.796 -0.007 0.095 1.000
Autocorrelation Check of Residuals
45 To Chi- Pr >
6 0.65 4 0.9573 0.018 -0.039 -0.007 0.034 0.056 -0.008

12 5.42 10 0.8614 -0.031 -0.034 0.168 -0.006 -0.097 -0.056
50 18 6.25 16 0.9852 -0.036 0.006 -0.024 0.033 -0.006 -0.062
24 10.71 22 0.9787 -0.003 -0.147 -0.007 0.009 0.115 0.008
Model for variable NIVEAU

55
Estimated Intercept 8.254817
Autoregressive Factors
60
Factor 1: 1 - 1.01092 B**(1) + 0.29015 B**(2)
Input Number 1
65
Input Variable DATE
Overall Regression Factor -0.00006
Les diffrences entre les estimations des coefficients autorgressifs entre arima et autoreg sont dues
aux algorithmes mis en oeuvre.
Attention ! Les de la proc autoreg sont les de la proc arima.

Superposition des sries.
data b;
merge lakout armax;
by date;
run;
5
proc gplot data=b;
symbol1 v=dot i=join ;
symbol2 v= plus i=r color=black;
symbol3 v= star i=join color=red;
10 plot niveau * date = 3 forecast * date = 2 pred* date=3 / overlay;
run;
Code R de cette estimation

# lecture des donnes
niveau = scan(D:/Donn/brocdave/lake.dat)
# conversion en srie temporelle
niveau = ts(niveau,start=1876,frequency=1)
5 # estimation MCO du niveau
#
temps = 1:length(niveau)
regmco = lm(niveau ~ temps)
# examen des rsidus. Si on ne sait o ils sont dans lobjet regmco, taper
10 # str(regmco)
plot(temps, regmco$residuals, type="l")

# ACF et PACF
# Il existe une fonction acf mais la variante acf2.R par Shumway est plus agrable
source("acf2.R")
15 acf2( regmco$residuals)
# ajustement dun AR(2) aux rsidus
ajustar = arima(regmco$residuals, order = c(2, 0, 0),include.mean = FALSE)
ajustar$coef
# examen de lACF des rsidus
20 acf2(ajustar$residuals)
# test de blancheur
help(tsdiag)
tsdiag(ajustar)
# ajustement simultan de la moyenne et de la structure de covariance par maximum de vraisemblance
25 ajustsim = arima(niveau, order = c(2, 0, 0),xreg = temps, method="ML")
Les coefficients du temps ne sont pas du mme ordre de grandeur dans SAS et R car le temps nest pas
mesur de la mme faon.
Obtenir de laide dans SAS ou dans R.

Les documentations sont trs abondantes et mme si on les tlcharge, elles ne sont pas facilement
utilisables. Voici quelques trucs qui marchent bien.
Dans R Utiliser les fonctions help et help.search.
Si on connat le nom de la fonction quon veut employer mais quon ne sait plus les arguments,
utiliser help.
Par exemple, on ne sait plus comment fonctionne matrix(), on tape help(matrix) dans
la fentre de commande et on obtient la syntaxe de cette fonction ainsi que des exemples duti-
lisation.
Si on ne sait pas le nom de la fonction qui permet de faire une certaine tche, utiliser help.search.
Par exemple, on ne sait pas quelle fonction permet destimer un arima, on tape
help.search("arima")
et on rcupre la liste de toutes les fonctions o ce mot est cit avec le nom du package auquel
appartient la fonction. La recherche est faite parmi les packages installs sur la machine o lon
travaille.
Dans SAS Pour avoir une aide sur une proc, cliquer sur son nom dans la fentre dition et enfoncer
la touche F1.
Pour avoir des exemples dune proc, activer dans le Menu Aide / Aide SAS et documentation.
On trouve des exemples des proc, rangs par module.
Sur Internet Avec un moteur de recherche les mots
proc arima forecast example
donnent des milliers de rfrences le plus souvent pertinentes.
Pour R, on tapera
arima CRAN example
Annexe
2.10 Estimation dun ARMA
On examine dans cette section, comment crire la fonction de vraisemblance de processus de base :
AR(1) et MA(1). Une fois obtenue la fonction de vraisemblance, son optimisation est un problme nu-
mrique. Si la fonction de vraisemblance est quadratique, on dbouche sur le problme des moindres
carrs linaires classique. Sinon on a un problme non linaire qui doit se rsoudre par un algorithme
doptimisation. Nous ntudions pas ces algorithmes dans ce cours.
2.10.1 Fonction de vraisemblance dun processus gaussien AR(1)
On a la srie yt , t = 1, 2, , T , observation de {Yt } AR(1) :
Yt = c + Yt1 + Zt , Zt BBN (0, 2 ), t N,
(BBN = Bruit Blanc Gaussien). Evaluation de la fonction de vraisemblance. On sait qualors Yt suit une
c 2
loi normale et on a dj calcul ses moyenne et variance : E(Yt ) = = 1 , var(Yt ) = 1 2 . Notons
2
= (c, , ) le vecteur des paramtres estimer. La fonction de densit de probabilit (f.d.p.) de Y1
est :
1 (y1 c/(1 ))2
fY1 (y1 ; ) = p exp[0.5 ]
2 2 /(1 2 ) 2 /(1 2 )
Considrons maintenant la loi conditionnelle de Y2 sachant que Y1 = y1 . Cest une loi normale de
moyenne c + y1 , de variance 2 do la f.d.p.
1 (y2 c y1 ))2
fY2 |Y1 =y1 (y2 ; ) = exp[0.5 ]
2 2 2
on en dduit la f.d.p. conjointe du couple (Y1 , Y2 ) :
fY1 ,Y2 (y1 , y2 ; ) = fY1 (y1 ; )fY2 |Y1 =y1 (y2 ; )
On observe dautre part que Yt ne dpend explicitement que de yt1 :
1 (yt c yt1 ))2

fYt |Yt1 =yt1 ,Yt2 =yt2 , ,Y1 =y1 (yt ; ) = fYt |Yt1 =yt1 (yt ; ) = exp[0.5 ].
2 2 2
La f.d.p. conjointe des observations est donc :

T
Y
fY1 , ,YT (y1 , , yT ; ) = fY1 (y1 ; ) fYt |Yt1 =yt1 (yt ; ).
t=2
Do on obtient la (fonction) log vraisemblance
L() = (2.38)
T
X
1 2 1 (y1 c/(1 ))2 T 1 1 (yt c yt1 )2
ln(2 2
) 2 2
ln(2 2 )
2 1 2 /(1 ) 2 2 2
t=2
Si on nglige le log dterminant dans cette expression, sa maximisation donne lestimateur des moindres
carrs inconditionnels de .
Si on travaille conditionnellement la premire valeur y1 . Alors la log vraisemblance se simplifie en

la log vraisemblance conditionnelle :
T
X (yt c yt1 )2
T 1
Lc () = ln(2 2 ) . (2.39)
2 2 2
t=2
On reconnat que (2.39) a la mme forme que la log vraisemblance associe lestimation de la
moyenne et de la variance dune v.a. normale, base sur T 1 observations indpendantes de cette
c et b solution de
v.a.. Drivant par rapport c et on obtient b
P 1 P
c T
P 1 y
P 2 t1 P 2y t
=
yt1 yt1 yt1
quon reporte dans (2.39) puis en drivant par rapport 2 :

PT b t1 )2
c2 = t=2 (yt bc y

T 1
On appelle estimateur du maximum de vraisemblance conditionnelle, la solution de ces deux qua-
tions. Si T est grand les solutions des maximisations de ( 2.38) et ( 2.39) sont proches.
Si dans (2.39) on nglige le log dterminant on obtient lestimateur des moindres carrs conditionnels
de c et .
2.10.2 Fonction de vraisemblance dun processus gaussien MA(1)
Soit un processus gaussien MA(1) :
Yt = + Zt Zt1
o Zt est un BBN(0, 2 ), Yt est observ sur t = 1, 2 , T .
Si on connat zt1 , la valeur de Zt1 , alors la loi de Yt sachant que Zt1 = zt1 est N( zt1 , 2 ).
Supposons que Z0 = 0, alors tant donn lobservation de Y1 on peut dduire la valeur de Z1 : z1 =
y1 . Ensuite Y2 = + Z2 z1 permet dobtenir z2 = y2 + z1 . On obtient ainsi la loi
conditionnelle de Y2 sachant que Z0 = 0, Y1 = y1 . Sa f.d.p. est :
1 (y2 + z1 )2
fY2 |Y1 =y1 ,Z0 =0 (y2 ; , , 2 ) = exp(0.5 ).
2 2 2
Ensuite connaissant z1 et y2 on peut calculer z3 = y2 + z1 ... Ainsi ayant fix la valeur de Z0
(ici la moyenne) et disposant des observations y1 , , yT on peut calculer pour chaque valeur de
(, , 2 ) : z1 = y1 , z2 = y2 + z1 , , zt = yt + zt1 et la distribution conditionnelle
de Yt |Yt1 = yt1 , , Y1 = y1 , Z0 = 0. Sa f.d.p. est :
1 1
fYt |Yt1 =yt1 ,Y1 =y1 ,Z0 =0 (yt ; , , 2 ) = exp[ (yt + zt1 )2 ].
2 2 2 2
La f.d.p. conjointe de Y1 , , YT |Z0 = 0 est :

T
Y
fY1 |Z0 =0 (y1 ; , , 2 ) fYt =yt |Yt1 =yt1 ,Y1 =y1 ,Z0 =0 (yt ; ).
t=2
La log vraisemblance est :

T
T 1 X
L(, , 2 ) = ln(2 2 ) 2 (yt + zt1 )2
2 2
t=1
2.11 Prvision dune srie temporelle

On sintresse ici la prvision aprs modlisation. Trouver un bon modle pour une srie est une
opration qui peut prendre beaucoup de temps. Or il nest pas rare davoir des milliers de sries prdire
en quelques heures. La recherche dun modle pour chaque srie nest videmment pas possible dans ce
cas. On fait alors de la prvision sans modle. Le logiciel (SAS par la proc forecast, R avec le package
forecast notamment) cherche dans une classe de modles quon lui indique le modle qui minimise
une certaine erreur, par exemple lerreur quadratique moyenne, pour lhorizon de prdiction quon lui
indique. Dans cette section, comme dans le chapitre tout entier, nous ne considrons que de la prvision
aprs modlisation.
Objectif
On veut prdire les valeurs futures Yt+1 , , Yt+h dune srie {Yt } partir des valeurs observes
{yt , yt1 , . . .} et on a estim un bon modle pour cette srie. La prvision de Yt+1 connaissant Yt , Yt1 , . . .
est lesprance conditionnelle E(Yt+1 |Yt , Yt1 , . . . ).
On suppose dans cette prsentation sommaire que le processus {Yt } est gaussien et donc quesprance
conditionnelle et esprance conditionnelle linaire concident. On considre ici le cas o {Yt } est un
ARMA(p,q) dont les paramtres sont connus. Dans la pratique le modle est estim et on applique la
mthode quon va voir en remplaant dans les expressions, les paramtres par leurs estimations.
2.11.1 Prvision erreur quadratique minimum pour un ARMA
Considrons un processus {Yt }, ARMA(p,q) :
Yt = 0 + 1 Yt1 + 2 Yt2 + + p Ytp + Zt 1 Zt1 2 Zt2 q Ztq (2.40)
o Zt BB(0, Z2 ). Avec loprateur retard cette quation scrit aussi :
(1 1 B 2 B2 p Bp )Yt = 0 + (1 1 B 2 B2 q Bq )Zt (2.41)
On suppose {Yt } stationnaire ( les racines du polynme 1 1 z 2 z 2 p z p sont en module

> 1) , et inversible (les racines du polynme 1 1 z 2 z 2 q z q sont en module > 1). Les
paramtres i , j et Z2 sont connus.
Commenons par centrer le processus. On voit sur (2.40) que = E(Yt ) vrifie :
0
= .
1 1 2 p
Nous simplifions lcriture en notant encore Yt , le processus centr Yt . Avec les hypothses de
stationnarit et inversibilit, le processus admet une reprsentation MA() :
Yt = Zt + 1 Zt1 + 2 Zt2 + . . . (2.42)
avec 0 = 1. Cest--dire, Yt scrit comme une combinaison linaire (c.l.) des valeurs Zt , Zt1 , . . . .
Considrons dautre part sur lcriture AR()

X
Yt = Zt + j Ytj
j=1
on voit que Zt scrit comme une c.l. des Yt , Yt1 , . . . . Ainsi, lespace engendr par les c.l. de Yt , Yt1 , . . .
est le mme que celui engendr par les c.l. de Zt , Zt1 , . . . . Notamment :
E(Zn+j |Yn , Yn1 , . . . ) = E(Zn+j |Zn , Zn1 , . . . ) et donc
E(Zn+j |Yn , Yn1 , . . . ) = 0 si j > 0, = Zn+j si j 0.
P le processus jusquau temps n et on veut le prdire lhorizon l, cest--dire prdire
On a observ
Yn+l = j=0 j Zn+lj partir de Yn , Ynl , . . . l > 0. La prvision est une fonction linaire de
Yn , Yn1 , . . . . La prvision lhorizon l tant donn lobservation jusquau temps n peut donc aussi
scrire comme une fonction linaire de Zn , Zn1 , . . . :
Ybn (l) = l Zn + l+1

Zn1 + l+2 Zn2 + . . .
o les i sont dterminer. Lerreur quadratique de prvision (EQP) est :

l1
X
X
E(Yn+l Ybn (l))2 = Z2 j2 + Z2
(l+j l+j )2 .
j=0 j=0

lEQP est minimise quand l+j = l+j , j = 0, 1, . . . donc :
Ybn (l) = l Zn + l+1 Zn1 + l+2 Zn2 + . . .
Erreur de prvision Lerreur de prvision est

l1
X
en (l) := Yn+l Ybn (l) = j Zn+lj .
j=0
P
On vrifie que E(en (l)) = 0, le prdicteur est sans biais. Dautre part, var(en (l)) = Z2 l1 2
j=0 j . Enfin,
ayant suppos la normalit du bruit blanc, on peut fabriquer des intervalles de prvision : les limites de
prvision (1 )100%, fix entre 0 et 1, sont :
v
u l1
u X
Ybn (l) z1/2 t1 + j2 Z .
j=1
Les calculs ci-dessus sont simples car tout est exprim en fonction du bruit blanc Zt , mais ils ne sont pas
directement utilisables car Zt nest pas observ. On envisage maintenant une expression plus utilisable
de la prvision.
Calcul de la prvision
Considrons le processus ARMA(p,q) centr examin prcdemment :
Yn+l = 1 Yn+l1 + 2 Yn+l2 + + p Yn+lp + Zn+l 1 Zn+l1 2 Zn+l2 q Zn+lq .
Prenant lesprance conditionnelle au pass Yn , Yn1 , Yn2 , . . . , nous obtenons :
Ybn (l) = 1 Ybn (l 1) + 2 Ybn (l 2) + + p Ybn (l p)

(2.43)
+Zbn (l) 1 Zbn (l 1) 2 Zbn (l 2) + q Zbn (l q).
Nous savons dautre part que :

Ybn (j) = E(Yn+j |Yn , Yn1 , . . . ), si j 1, et Ybn (j) = Ynj , si j 0.
et Zbn (j) = 0, si j 1, et Zbn (j) = Yn+j Ybn+j1 (1), si j 0. On peut donc par rcurrence calculer
les prvisions lhorizon 1, 2,
2.11.2 Exemple
Considrons un ARMA(1,1) :
(1 B)(Yt ) = (1 B)Zt .
Calcul de Ybn (l).
Yn+l = + (Yn+l1 ) + Zn+l Zn+l1 donc
Ybn (1) = + (Yn ) Zn

et
Ybn (l) = + (Ybn (l 1) ) = + l (Yn ) l1 Zn , l 2
o Zn = Yn Ybn1 (1). P
Variance de lerreur de prvision. Lcriture MA() : Yt = +
j=0 j Ztj sobtient en dvelop-
pant, (1 B)/(1 B) :
1 B
= 1 + 1 B + 2 B2 + 3 B3 + . . .
1 B
ou
(1 B)(1 + 1 B + 2 B2 + 3 B3 + . . . ) 1 B.
Identifiant les termes de mme puissance de B gauche et droite on obtient :
j = j1 ( ), j 1.
La variance de lerreur est donc :

l1
X
var(en (l)) = Z2 {1 + [j1 ( )]2 } (2.44)
j=1
2
qui tend vers Z2 ()
12
quand l .
Notes.
1. On peut voir sur lestimation dun MA(1) ci-desssus quil y a des choix faire, notamment dans
linitialisation des rsidus. La varit des possibilits fait quil est assez difficile de trouver exac-
tement les mmes rsultats avec des logiciels diffrents.
2. Les logiciels (la proc arima de SAS ou la fonction arima() de R), font la prvision aprs
modlisation, partir dune reprsentation dtat de la srie.
2.12 Exemple dquations de Yule-Walker : cas de lARMA(2,1)

Supposons (Yt ) qui obit
Yt = c + 1 Yt1 + 2 Yt2 + Zt 1 Zt1 , t = , 0, 1, 2, (2.45)
o les Zt sont i.i.d. N(0, Z2 ).

STATIO On suppose que les racines de lquation :
1 1 z 2 z 2 = 0
sont > 1 en valeur absolue (ou en module si complexes). Ceci nous assure que la srie (Yt ) est station-
naire.
Nous admettons que
INNO cov(Zt , Ytk ) = 0, si k > 0.
Maintenant prenons lesprance mathmatique des 2 cts de (2.45). Par la stationnarit on a =

E(Yt )t et donc
= c + 1 + 2 + 0. (2.46)
Par lhypothse STATIO, 1 1 2 6= 0 do

c
= .
1 1 2
Enlevons le CG (ct gauche) de (2.46) au CG de (2.45) et pareil pour les CD. Il nous reste
Yt = 1 (Yt1 ) + 2 (Yt2 ) + Zt 1 Zt1 , t = , 0, 1, 2, (2.47)
On va continuer le travail avec le processus centr
Yt = Yt
qui vrifie :
Yt = 1 Yt1 + 2 Yt2 + Zt 1 Zt1 , t = , 0, 1, 2, (2.48)
Multiplions les 2 cts de (2.48) par Zt . On a, par INNO et par le fait que Zt est un BB :
E(Zt Yt ) = cov(Zt , Yt ) = 1 E(Zt Yt1 ) + 2 E(Zt Yt2 ) + E(Zt Zt ) 1 E(Zt Zt1 ) (2.49)
E(Zt Yt ) = 0 + 0 + Z2 + 0 (2.50)
comme Zt est centr, ces esprances sont aussi des covariances. De mme
E(Zt1 Yt ) = cov(Zt1 , Yt ) = 1 E(Zt1 Yt1 ) + 2 E(Zt1 Yt2 ) + E(Zt1 Zt ) 1 E(Zt1 Zt1 )

(2.51)
E(Zt1 Yt ) = 1 Z2 1 Z2 = (1 1 )Z2 (2.52)
Ensuite on voit que
E(Ztk Yt ) = cov(Ztk , Yt ) = cov(Ztk , Yt ) = 0k > 1

1 2 3
= et= parce que Zt est centr,

1 2
= parce que la partie MA est dordre 1.
3
On peut commencer crire les quations de Yule-Walker. On note
k = cov(Yt , Ytk ) cov(Yt , Ytk ) k = k /0 .
Multiplions les 2 cts de (2.48) par Yt .
Yt Yt = 1 Yt Yt1 + 2 Yt Yt2 + Yt Zt 1 Yt Zt1 (2.53)
Prenons les esprances de chaque ct :
0 = 1 1 + 2 2 + Z2 1 (1 1 )Z2
0 = 1 1 + 2 2 + (1 1 (1 1 ))Z2 (2.54)
Multiplions les 2 cts de (2.48) par Yt1 .
Yt1 Yt = 1 Yt1 Yt1 + 2 Yt1 Yt2 + Yt1 Zt 1 Yt1 Zt1 (2.55)
et prenons les esprances de chaque ct :
1 = 1 0 + 2 1 1 Z2 (2.56)
Multiplions les 2 cts de (2.48) par Ytk o k > 1.
Ytk Yt = 1 Ytk Yt1 + 2 Ytk Ytk + Ytk Zt 1 Ytk Zt1 (2.57)
Prenons les esprances de chaque ct :
k = 1 k1 + 2 k2 (2.58)
Par exemple, pour k = 2 :
2 = 1 1 + 2 0 (2.59)
Divisons (2.54), (2.56) et (2.59) par 0 . Nous obtenons des quations de Yule-Walker pour un ARMA(2,1).
Z2
1 = 1 1 + 2 2 + (1 1 (1 1 )) (2.60)
0
Z2
1 = 1 + 2 1 1 (2.61)
0
2 = 1 1 + 2
k = 1 k1 + 2 k2 , k > 1 (2.62)
Observons que pour un AR(2), elles se rduisent
Z2
1 = 1 1 + 2 2 + (2.63)
0
1 = 1 + 2 1 (2.64)
2 = 1 1 + 2 (2.65)
k = 1 k1 + 2 k2 , k = 1, 2, (2.66)
Proprit gnrale quon vient dillustrer sur un ARMA(2,1) : pour un ARMA(p,q), partir de lordre
q + 1 la fonction dautocorrlation suit la mme rcurrence que celle de lAR(p) correspondant.
Comment se sert-on des quations de Yule-Walker ?
Cas dun AR(2).
Si on en connat les paramtres , on peut calculer la fonction dautocorrlation thorique.
Si on dispose destimations des k on peut rsoudre le systme des 2 quations linaires (2.64) et
(2.65) pour trouver des estimations de 1 et 2 . Ces estimations peuvent servir de valeurs initiales
pour la mthode du maximum de vraisemblance.
Cas dun ARMA(2,1).

Si on en connat les paramtres , et Z2 , par (2.54), (2.56), (2.58) on peut dessiner la fonction
dautocorrlation thorique.
Si on dispose destimations des k on peut trouver des estimations des paramtres . Les quations de
Y-W ne sont pas directement utilises pour trouver des estimations des paramtres dans les ARMA.
On peut voir comment SAS fait en consultant le document en ressource dans le dernier e-thme proc
arima.pdf, p. 420.
Exemple numrique. On dfinit un AR(2).
Yt = 0.7Yt1 0.8Yt2 + Zt
avec Zt BBN (0, 2 = 2)

A-t-on bien choisi un modle stationnaire ? On calcule les racines de 1 + 0.7x + 0.8x2 = 0.
a= polyroot(c(1,.7,.8))
Mod(a)
> Mod(a)
[1] 1.1180 1.1180
les racines sont en module > 1 donc on a bien dfini une srie stationnaire. Par les formules (2.21 et
2.22) on obtient : 0 = 1, 1 = .7/(1 + .8) = 0.38889.
Maintenant on peut utiliser la rcurrence pour calculer k , k > 1
rho = rep(NA, 11)
rho[1] =1
rho[2] = -0.38889
for( i in 3:11)
rho[i] = phi1*rho[i-1] + phi2 * rho[i-2] 5
> # FAC thorique du dcalage 0 au dcalage 10
> rho
[1] 1.000000 -0.388890 -0.527777 0.680556 -0.054168 -0.506527 0.397903 0.126690
-0.407005 0.183552 0.197118
10
Inversement, simulons une srie de 200 valeur AR(2) suivant le modle ci-dessus, et calculons la FAC
empirique correspondante.
# Simulation de 200 valeurs
sersim = arima.sim(n = 200, list(ar = c(-0.7, -0.8)), sd = sqrt(2))
# FAC empirique
acf.2 = acf(sersim, lag.max = 10, plot=FALSE, type = "correlation") 5
acf.2
Autocorrelations of series sersim, by lag
0 1 2 3 4 5 6 7 8 9 10
1.000 -0.336 -0.596 0.606 0.135 -0.552 0.169 0.328 -0.301 -0.098 0.274 10
Par exemple, -0.336 est une estimation de -0.388890.
Maintenant formons les quations de Yule-Walker pour un AR(2) ( formule 2.62 pour k = 2, 3).

2 1 1 1
= (2.67)
3 2 1 2
Dautre part nous avons une estimation des autocorrlations dordre 1, 2, On les reporte dans le
systme ci-dessus et on obtient les estimateurs de Yule-Walker de 1 et 2
# equations de Y-W pour estimer phi1 et phi2
# system lineaire
# snd membre
B = matrix( c(-0.596, 0.606), nrow=2,byrow=TRUE)
B 5
# matrice des coefficients
A = matrix(c(-0.336, 1, -0.596, -0.336),nrow=2, byrow=TRUE)
A
Phichap = solve(A,B) 10
Phichap
> Phichap
[,1]
[1,] -0.57236 15
[2,] -0.78831
# estimation de (-.7, -.8)

Chapitre 3
Processus non stationnaires
Rvision fvrier 2010.

On examine ici la non stationnarit associe la prsence de racines unit dans le polynme dautor-
gression.
3.1 Le problme de la racine unit

Considrons un processus autorgressif dordre 1.
Yt = 1 Yt1 + Zt
o donc Zt est un bruit blanc (0, Z2 )). On a vu que si 1 < 1 < 1 alors Yt est stationnaire.
Pour tester : 1 = 0 on peut estimer le coefficient par MCO (Moindres Carrs Ordinaires) et faire un test
de Student classique.
Supposons maintenant que 1 = 1. On obtient :
Yt = y0 + Z1 + Z2 + + Zt t0 (3.1)
Le processus Yt est alors appele une marche alatoire, voir la figure (3.1). (Il faut ncessairement un
point de dpart.)
Lexamen de certaines sries temporelles suggrent des extensions ce comportement. Ainsi, les rende-
ments composs des actions, dfinis par Rt = Yt Yt1 o Yt est le log du prix de laction, ressemblent
souvent un bruit blanc avec une moyenne lgrement positive. Ce qui suggre quun modle pour Yt
est :
Yt = + Yt1 + Zt .
On dit que Yt est une marche alatoire avec drive (ou drift) . En exprimant Yt1 en fonction de Yt2 ,...
on obtient :
Yt = t + y0 + Z1 + Z2 + + Zt .
Le graphique de Yt en fonction du temps est donc celui dune droite laquelle est superpose une marche
alatoire.
Proprits lmentaires
Proprits lmentaires dune marche alatoire.
E(Yt ) = y0 , var(Yt ) = tZ2 , var(Yt+1 ) = (t + 1)Z2 , cov(Yt , Yt+1 ) = tZ2 ,
limt var(Yt ) = q
t
et donc (Yt , Yt+1 ) = t+1 < 1.
Proprits lmentaires dune marche alatoire avec drive.
56
CHAPITRE 3. PROCESSUS NON STATIONNAIRES 57
F IGURE 3.1 Marche alatoire F IGURE 3.2 ACF et PACF de la marche ala-
toire ci-contre
E(Yt ) = y0 + t , et les autres proprits de la marche alatoire sans drive restent valables.
Notes.
Une marche alatoire (dont la variance au moins nest pas constante) est videmment une srie non sta-
tionnaire. Avec notre vocabulaire sur les ARIMA, "marche alatoire" est quivalent "ARIMA(0,1,0)".
Une srie non stationnaire dont une diffrence premire, deuxime, est stationnaire est dite avoir
un trend stochastique. Les ARIMA(p,d,q) avec d > 0 sont des sries ayant un trend stochastique, on
dit que la srie est intgre dordre d, (I(d)), et la notation indique que la diffrence dede la srie est
un ARMAp, q). Les SARIMA avec Ds > 0 sont des sries saisonnalit stochastique.
Si dans une srie mensuel on est amen modliser la saisonnalit par des indicatrices de mois (indic.
de janvier = 1 pour tous les mois de janvier, = 0 sinon, indic. de fvrier = 1 pour tous les mois de
fvrier, = 0 sinon ) on choisit de modliser par une saisonnalit dterministe.
3.1.1 Illustration
Pour illustrer ces modles, on a simul une marche alatoire (Fig. 3.1) avec Y0 = 0, et dessin ses ACF
et PACF (Fig. 3.2)
Yt = Yt1 + Zt
cest--dire
Yt = Z1 + Z2 + + Zt (3.2)
puis une marche alatoire avec drive (Fig. 3.3) et dessin ses ACF et PACF (Fig. 3.4)
Yt = + Yt1 + Zt
cest--dire
Yt = t + Z1 + Z2 + + Zt (3.3)
On voit sur ces graphiques que : lACF ne dcroit jamais vers 0, une marche alatoire sans drive peut
prendre nimporte quelle valeur et donc ne peut pas tre stationnaire, une marche alatoire avec drive a
une tendance.
La question qui nous occupe maintenant est :
comment tester dans un autorgressif dordre 1, que 1 = 1 ou, comment tester que la racine du poly-
nme dautorgression 1 1 B = 0 est 1 ?
Plus gnralement, comment tester que le polynme dautorgression dun autorgressif dordre p a une
racine unit ? (Une autorgression dordre p nest appele AR(p) que si elle est stationnaire.)
F IGURE 3.3 Marche alatoire avec drive F IGURE 3.4 ACF et PACF de la marche ala-
toire ci-contre
3.1.2 Trend stochastique, trend dterministe

Supposons un processus AR(1) avec un trend dterministe :
Yt a bt = 1 (Yt1 a b(t 1)) + Zt |1 | < 1. (3.4)
Posant t = a + bt, on voit quon peut lcrire :

Zt
Yt = t + (3.5)
1 1 B
Yt est donc bien la somme dune tendance dterministe t et dun AR(1) centr 1 . Que se passe-t-il quand
1 = 1 ?
Dveloppons dabord (3.4). On obtient :
Yt = 1 + 2 t + 1 Yt1 + Zt (3.6)
o : 1 = a(1 1 ) + b1 , 2 = b(1 1 ).
Donc si 1 = 1 alors 2 = 0, 1 = b et
Yt = b + Yt1 + Zt ,
est une marche alatoire avec drive. En rsum, si Yt a un trend dterministe t , alors si 1 = 1
ncessairement, 2 = 0 ( donc on ne peut avoir la fois un trend stochastique et un trend dterministe
dans le modle (3.6)).
La dmarche suivante, qui arrive au mme rsultat, est peut-tre plus claire.
Enlevant Yt1 des deux cts de (3.4) et posant = 1 1, on obtient :
Yt = b + (Yt1 b(t 1) a) + Zt
de la forme, si < 0 :
Yt = 0 + 1 t + Yt1 + Zt (3.7)
ou, si = 0 :
Yt = b + Zt
1. Ce pourrait tre le modle du Lac Huron.
et on voit directement ici que quand = 0, Yt a un trend stochastique avec drive b, et quand < 0, Yt
oscille autour de a + bt.
Cas dune autorgression dordre suprieur 1. Il est peu probable quun modle autorgressif dordre 1
suffise dcrire la dynamique. Considrons donc, en tendant ainsi (3.6), un autorgressif dordre p, pas
ncessairement stationnaire, avec tendance :
Yt = 1 + 2 t + 1 Yt1 + + p Ytp + Zt . (3.8)
Cette srie nest pas stationnaire si 1 est racine de 1 1 B p Bp = 0 cest--dire si =

1 + + p prend la valeur 1. Il serait utile de voir apparatre le coefficient dans (3.8). Cest ce que
permet lcriture ECM (Error Correction Model) de (3.8) :
Yt = 1 + 2 t + Yt1 + 1 Yt1 + + p1 Ytp+1 + Zt , (3.9)
ou, retranchant des deux cts Yt1 , et posant = 1 + + p 1 = 1 :
Yt = 1 + 2 t + Yt1 + 1 Yt1 + + p1 Ytp+1 + Zt (3.10)
o les sexpriment en fonction des . Cette quation est la version pour un ordre p quelconque, de (3.7)
pour p = 1.
(On obtient la reprsentation 3.10 en crivant Ytp = Ytp+1 Ytp+1 , Ytp1 = Ytp+2 Ytp , ,
et en reportant dans (3.8).)
Examinons (3.10). Le ct gauche est la variation de la srie de t 1 t, lerreur en t ; elle est exprime
du ct droit comme une combinaison linaire dun trend, de la valeur de la srie la date prcdente,
des variations antrieures et de linnovation Zt ; on comprend la terminologie "modle de correction
derreur". Si la srie a une racine unit, alors le ct gauche de (3.10) qui est la srie diffrencie, est
stationnaire, donc le ct droit doit ltre aussi, au terme dterministe 1 + 2 t prs, ce qui exige
= 0 pour annuler le terme non stationnaire. Si la srie na pas de racine unit alors les deux cts sont
stationnaires et la srie peut avoir un trend linaire.
3.2 Test de non stationnarit due la prsence dune racine unit. Intro-
duction et pratique
La thorie et la pratique des tests de racine unit sont difficiles. Ces tests considrent lhypothse nulle :
"1 est racine du polynme dautorgression". (Si 1 est racine double, on doit diffrencier deux fois la
srie pour se ramener la stationnarit). Les tests de racine unit tant dlicats mettre en uvre, il est
indispensable de conduire ces tests paralllement un examen du chronogramme. Ici nous prsentons
seulement la technique du test ADF (Augmented Dickey-Fuller) et la marche suivre pour mettre en
uvre un tel test.
Principe.
Cas I : le chronogramme de la srie ne montre pas de tendance donc elle ne peut pas tre une marche
alatoire avec drive (Fig. 3.3), ni une srie avec un trend dterministe qui montrerait une volution
autour dune droite. La rgression considrer est donc
Yt = 1 + Yt1 + Zt ,
o, si lon pense quil faut rgresser un ordre suprieur 1 :
Yt = 1 + 1 Yt1 + + p Ytp + Zt . (3.11)
La reprsentation ECM, parallle (3.10) est
Yt = 1 + Yt1 + 1 Yt1 + + p1 Ytp+1 + Zt (3.12)

la constante 1 est l pour capter une moyenne non nulle ( = 1 / dans le cas o < 0 mais si = 0,
1 doit tre nulle puisque le graphique montre quil ny a pas de drive. Si lon sait apriori que la srie
est de moyenne nulle (dans le cas o elle serait stationnaire) ou sans drive (dans le cas o elle aurait une
racine unit), ce modle devient :
Yt = Yt1 + 1 Yt1 + + p1 Ytp+1 + Zt (3.13)
On teste H0 : = 0, ou H0 : = 1, cest--dire la srie est I(1) sans drive contre H1 : < 0, ou

H1 : < 1 et la srie est I(0) avec une moyenne ventuellement non nulle. Cette situation est souvent
celles des sries financires sans tendance, telles que taux dintrt, taux de change.
Mise en pratique dans SAS.
Ce test est une option de ltape identify dans la proc arima. Dabord, comme le retard p nest
pas connu, on doit choisir une srie de valeurs de p et SAS calcule les statistiques pour chacune de ces
valeurs.
Deux sous-cas sont envisags dans la mise en uvre par SAS.
A : Si on sait apriori (examen du chronogramme,...) que lventuelle moyenne de la srie est nulle
(1 = 0 dans 3.11), qui donne le modle (3.13), on est dans le cas que SAS appelle Zero Mean et
ce sont les seules sorties de ce cas quil faut considrer. On veut tester H0 : = 0. La statistique de
test est Tau. Cest la statistique de Student pour tester = 0 mais qui nest pas distribue suivant un t
de Student sous lhypothse nulle. La rgion critique est de la forme , t, SAS donne la p-value. Si
lhypothse nulle est rejete on conclut que la srie est stationnaire de moyenne nulle.
B : Si lon na pas dinformation sur 1 , on est dans le cas que SAS note Single Mean et ce sont les
seules sorties de ce cas quil faut alors considrer. Lhypothse tester est H0 : (1 , ) = (0, 0), car
sil ny a pas de tendance sur le chronogramme, il ne peut y avoir de drive en cas de non stationnarit
= dacceptation de H0 .. La statistique de test est F. Cest la statistique de Fisher (1 , ) = (0, 0) dans
(3.12) dans la mhode des MCO mais qui ne suit pas une loi de Fisher sous H0 . On rejette lhypothse
nulle pour de grandes valeurs de la statistique. Si lhypothse nulle est rejete, la situation relle pourrait
tre : (1) (1 6= 0, = 0) ce qui indique une srie non stationnaire avec drive, cest impossible puisque
le chronogramme ne montre pas de tendance, ou (2) 6= 0 cest--dire srie stationnaire de moyenne
constante nulle ou non seul cas possible.
(On peut galement tester ( = 0). La statistique de test est Tau. Cest la statistique de Student pour
tester = 0 mais qui nest pas distribue suivant un t de Student sous lhypothse nulle. La rgion
critique est de la forme , t, SAS donne la p-value. Si ce quon obtient nest pas cohrent avec ce qui
prcde, on peut sinterroger sur laptitude du test traiter la srie considre.)
Il est donc clair que si la srie ne montre pas de tendance, cas qui nous intresse en ce moment, la
sortie Trend de SAS ne doit pas tre considre. Dautre part, sans connaissance apriori de la srie
qui permettrait daffirmer quelle est de moyenne nulle, le cas Zero Mean ne doit pas non plus tre
considr.
Cas II : le chronogramme de la srie montre une tendance ; celle-ci apparat si la srie est une marche
alatoire avec drive ou si elle est stationnaire un trend dterministe prs. Le test devra dcider entre
ces deux hypothses. La rgression considre est
Yt = 1 + 2 t + Yt1 + Zt , (3.14)
et si lautorgression est dordre suprieur 1, lcriture ECM (3.9) :
Yt = 1 + 2 t + Yt1 + 1 Yt1 + + p1 Ytp+1 + Zt ,
ou (3.10)
Yt = 1 + 2 t + Yt1 + 1 Yt1 + + p1 Ytp+1 + Zt
F IGURE 3.5 y0 F IGURE 3.6 y1 F IGURE 3.7 y2
1 et 2 sont l pour capter lventuelle tendance dterministe suggre par le chronogramme, si || < 1.
Cette approche convient aux sries ayant une tendance, comme le cours dun titre, le niveau dun agrgat
macroconomique.
Mise en pratique dans SAS.
Ce cas est not Trend par SAS et seules les sorties correspondantes sont considrer. Dabord, comme
le retard p nest pas connu, on doit choisir une srie de valeurs de p et SAS calcule les statistiques pour
chacune de ces valeurs.
Lhypothse tester est H0 : ( = 0, 2 = 0) , ou cest--dire la srie est I(1) avec drive.
La statistique de test est la statistique de Fisher F, pour tester H0 , calcule comme dans la mthode MCO
mais, ici encore, sous lhypothse nulle, cette statistique ne suit pas une loi de Fisher. Elle est note F
dans les sorties. On rejette lhypothse nulle pour de grandes valeurs de la statistique.
Si lon rejette lhypothse nulle les trois situations possibles sont :
( 6= 0, 2 = 0), cest--dire srie stationnaire sans tendance, impossible vu le chronogramme.
( = 0, 2 6= 0), cest--dire srie non stationnaire avec tendance, peu raliste.
( 6= 0, 2 6= 0)cest--dire srie stationnaire avec tendance, seul cas raliste pour lalternative.
(On peut galement tester ( = 0). La statistique de test est Tau. Cest la statistique de Student pour
tester = 0 mais qui nest pas distribue suivant un t de Student sous lhypothse nulle. La rgion
critique est de la forme , t, SAS donne la p-value. Si lhypothse nulle est rejete on conclut que la
srie est stationnaire. Si ce quon obtient nest pas cohrent avec ce qui prcde, on peut sinterroger sur
laptitude du test traiter la srie considre.)
Il peut videmment arriver que 1 soit racine multiple. On dtecte cette situation si aprs avoir diffren-
ci une premire fois la srie on conclut par un test de racine unit, la non stationnarit de la srie
diffrencie.
3.2.1 Exemples simuls
On a simul trois sries : y0, y1 et y2. Le code figure en annexe de la section.
Effectuons le test ADF de racine unit sur ces trois sries. La syntaxe est :
proc arima data =a ;

i var= y0 stationarity=(adf=(1,2,3,4,5));
run;
quit;
On comprend, et laide en ligne de la proc arima donne les dtails, que les tests ADF sont eux-mmes un
des choix de tests de racine unit (et non de stationnarit !) offerts par SAS par loption stationarity.
On a choisi des ordres assez levs, jusqu 5, pour capter lautorgression dont on ne connat pas apriori
lordre.
Examinons les rsultats pour la srie y0.
Name of Variable = y0
Mean of Working Series -101.386

Autocorrelations
0 6059.322 1.00000 | |********************|

1 6001.856 0.99052 | . |********************|
2 5915.181 0.97621 | . |********************|
3 5804.830 0.95800 | . |******************* |
4 5676.041 0.93675 | . |******************* |
5 5536.596 0.91373 | . |****************** |
6 5389.025 0.88938 | . |****************** |
7 5231.784 0.86343 | . |***************** |
8 5063.099 0.83559 | . |***************** |
9 4881.993 0.80570 | . |**************** |
10 4688.590 0.77378 | . |*************** |
11 4485.301 0.74023 | . |*************** |
12 4277.746 0.70598 | . |************** |
13 4070.092 0.67171 | . |************* |
14 3864.726 0.63781 | . |************* |
15 3663.966 0.60468 | . |************ |
16 3467.248 0.57222 | . |***********. |
17 3273.373 0.54022 | . |***********. |
18 3083.389 0.50887 | . |********** . |
19 2897.888 0.47825 | . |********** . |
20 2719.006 0.44873 | . |********* . |
21 2546.459 0.42025 | . |******** . |
22 2377.180 0.39232 | . |******** . |
23 2211.725 0.36501 | . |******* . |
24 2051.551 0.33858 | . |******* . |
Augmented Dickey-Fuller Unit Root Tests
Type Retards Rho Pr < Rho Tau Pr < Tau F Pr > F
Zero Mean 1 -4.1165 0.1625 -1.27 0.1877

2 -1.3159 0.4214 -0.68 0.4219
3 -3.4534 0.2010 -1.14 0.2324
4 -1.7328 0.3631 -0.72 0.4056
5 -3.1600 0.2214 -0.98 0.2912
Single Mean 1 -12.2769 0.0748 -2.29 0.1774 2.62 0.4025
2 -4.2332 0.5111 -1.31 0.6246 0.87 0.8483
3 -10.8673 0.1061 -2.08 0.2509 2.18 0.5142
4 -6.3124 0.3199 -1.53 0.5198 1.19 0.7663
5 -11.6175 0.0881 -2.01 0.2814 2.06 0.5450
Trend 1 -10.4493 0.3990 -1.74 0.7296 2.71 0.6359
2 -1.3028 0.9838 -0.38 0.9879 1.98 0.7813
3 -8.0922 0.5712 -1.43 0.8499 2.41 0.6959
4 -3.9374 0.8889 -0.88 0.9559 1.51 0.8765
5 -9.9474 0.4330 -1.54 0.8141 2.07 0.7636
Lecture de ces rsultats. On voit sur le graphique de y0, figure (3.5) quelle na pas de tendance, le
modle est (3.12) donc le paquet Trend ne la concerne pas. Sur le paquet Single Mean et quelque
soit lordre de dcalage, les p-values correspondant TAU sont leves donc on conclut quil y a une
racine unit, dans (3.12) : = 0. On examine dans le mme paquet la p-value de verb"F". Elle est leve
donc on conclut sur lexpression (3.12) que = 0 et 1 = 0. On peut examiner le bloc Zero Mean
correspondant au test de = 0 dans le modle (3.13). Les p-value pour Tau sont leves quelque soit le
dcalage ; on garde lhypothse = 0.
Srie y1, figure (3.6).

Autocorrelations
0 14.615594 1.00000 | |********************|

1 12.002254 0.82120 | . |**************** |

2 8.831633 0.60426 | . |************ |
3 7.131012 0.48790 | . |********** |
4 6.084211 0.41628 | . |******** |
5 5.334948 0.36502 | . |******* |
6 4.214475 0.28835 | . |****** |
7 3.737295 0.25571 | . |***** |
8 3.551456 0.24299 | . |***** |
9 3.565609 0.24396 | . |***** |
10 3.131829 0.21428 | . |****. |
11 2.225617 0.15228 | . |*** . |
12 1.772117 0.12125 | . |** . |
13 1.473019 0.10078 | . |** . |
14 0.599322 0.04101 | . |* . |
15 -0.178320 -.01220 | . | . |
16 -0.370761 -.02537 | . *| . |
17 -0.378226 -.02588 | . * | . |
18 -0.783470 -.05361 | . *| . |
19 -1.342420 -.09185 | . **| . |
20 -1.516293 -.10374 | . **| . |
21 -1.731373 -.11846 | . **| . |
22 -1.892747 -.12950 | . ***| . |
23 -2.313251 -.15827 | . ***| . |
24 -2.806362 -.19201 | . ****| . |
La figure (3.6) ne montre pas de tendance, la srie semble de moyenne nulle. Le graphe de lACF montre
que la srie est stationnaire.
Zero Mean 1 -12.5314 0.0132 -2.36 0.0181

2 -4.9888 0.1239 -1.51 0.1240
3 -10.0685 0.0268 -2.04 0.0394
4 -7.4122 0.0592 -1.76 0.0739
5 -9.8987 0.0282 -2.01 0.0430
Single Mean 1 -17.0838 0.0220 -2.80 0.0601 3.94 0.0921
2 -6.7914 0.2857 -1.78 0.3914 1.58 0.6675
3 -14.2744 0.0452 -2.47 0.1233 3.08 0.2849
4 -10.4651 0.1172 -2.12 0.2371 2.26 0.4955
5 -14.1599 0.0465 -2.40 0.1420 2.90 0.3320
Trend 1 -20.9024 0.0531 -2.86 0.1763 4.30 0.3188
2 -7.1881 0.6442 -1.62 0.7845 1.59 0.8610
3 -17.8490 0.1005 -2.54 0.3088 3.38 0.5022
4 -12.2468 0.2937 -2.06 0.5638 2.36 0.7070
5 -17.5443 0.1069 -2.40 0.3778 3.11 0.5559
Lecture des rsultats sur le bloc Single Mean. Sauf pour le retard 1, la p-value pour F est leve. On
comprend que la srie (et le code de la simulation nous le confirme) est un autorgressif dordre suprieur
1. On accepte lhypothse ( = 0, 1 = 0), srie non stationnaire, en contradiction avec lexamen de
lACF ! Examinons alors le bloc Zero Mean, ce qui est cohrent avec lallure du graphique. Les p-
values pour Tau sont assez faibles (sauf au retard 2) : on rejette lhypothse ( = 0), on conclut que
la srie est stationnaire ! ! ! Que se passe-t-il ? Si on admet que la srie est de moyenne nulle, comme le
graphique le suggre, alors on peut considrer le paquet Zero Mean comme le paquet valable et et on
conclut la stationnarit de la srie.
Srie y2.

Autocorrelations
0 3511603577 1.00000 | |********************|

1 3467712901 0.98750 | . |********************|
2 3423823929 0.97500 | . |********************|

3 3379936890 0.96251 | . |******************* |
4 3336054050 0.95001 | . |******************* |
5 3292178998 0.93751 | . |******************* |
6 3248318260 0.92502 | . |******************* |
7 3204477037 0.91254 | . |****************** |
8 3160658374 0.90006 | . |****************** |
9 3116866501 0.88759 | . |****************** |
10 3073103599 0.87513 | . |****************** |
11 3029371219 0.86267 | . |***************** |
12 2985673140 0.85023 | . |***************** |
13 2942012801 0.83780 | . |***************** |
14 2898391308 0.82538 | . |***************** |
15 2854809980 0.81296 | . |**************** |
16 2811272107 0.80057 | . |**************** |
17 2767784054 0.78818 | . |**************** |
18 2724350428 0.77581 | . |**************** |
19 2680973557 0.76346 | . |*************** |
20 2637655333 0.75113 | . |*************** |
21 2594397697 0.73881 | . |*************** |
22 2551202334 0.72651 | . |*************** |
23 2508073288 0.71422 | . |**************. |
24 2465018168 0.70196 | . |**************. |
Zero Mean 1 1.7348 0.9797 -12.04 <.0001

2 1.6879 0.9776 -3.82 0.0002
3 1.6979 0.9781 -5.25 <.0001
4 1.6714 0.9768 -3.18 0.0016
5 1.6612 0.9763 -3.54 0.0005
Single Mean 1 1.6908 0.9962 0.35 0.9803 180.74 0.0010
2 1.8316 0.9970 0.74 0.9929 25.97 0.0010
3 1.7117 0.9964 0.63 0.9902 55.61 0.0010
4 1.7254 0.9964 0.79 0.9938 27.89 0.0010
5 1.7406 0.9965 0.67 0.9913 36.22 0.0010
Trend 1 -0.0277 0.9960 -0.99 0.9419 6.94 0.0335
2 -0.0254 0.9960 -1.74 0.7325 24.17 0.0010
3 -0.0220 0.9960 -1.03 0.9369 9.75 0.0010
4 -0.0214 0.9960 -1.31 0.8836 15.65 0.0010
5 -0.0207 0.9960 -1.05 0.9345 9.63 0.0010
Le graphique (Fig. 3.7) montre quelle a une tendance. On est dans le cadre du modle (3.10) et on doit
donc examiner le paquet Trend Par la statistique F, on rejette = 0 et 1 = 0 dans (3.10). Par contre
les p-value pour tester = 0 sont leves, donc on garde = 0. Ainsi la srie est non stationnaire et
avec tendance.
Annexe
Code de la simulation des sries y0, y1, y2. Il est fortement conseill de comprendre ce code pour voir
la nature des sries simules : stationnaire ? avec racine unit ? prsence dune drive ?
Options PS=5000 LS=78 NoDate PageNo=1 NoCenter

FORMCHAR=|----|+|---+=|-/\<>*;
data a;
y0m2 = 0; y0m1=0; y1m2 = 0; y1m1=0; y2m2 = 0; y2m1=0;
wm1=0; um1=0; vm1=0;
do t =-50 to 250;
u = 2*rannor(34289); v= 2*rannor(13489); w = 2*rannor(134);
y0 = 1.8* y0m1 - 0.8* y0m2 + u + 0.9* um1;
y1 = .5 +0.2136752* y1m1 +0.4273504* y1m2 + v + 0.9* vm1;
y2 = 1.3*t+ 1.8* y2m1 - 0.8* y2m2 + w + 0.9* wm1;
if t >0 then output;
y0m2 = y0m1; y0m1 = y0;
y1m2 = y1m1; y1m1 = y1;
y2m2 = y2m1; y2m1 = y2;
um1 = u;
vm1 = v;
wm1 = w;
end;
run;
proc arima data =a ;

run;
quit;
3.2.2 Sries relles

Poivre noir
On considre la srie du prix spot mensuel moyen du poivre noir dassez bonne qualit, octobre 73, juillet
94 en $ par million de tonne.
F IGURE 3.8 Poivre noir
proc arima data = pepper;

i var = BLACKPEPPER(1)
stationarity=(adf=(2,3,4,5));
run;
The ARIMA Procedure
Name of Variable = BLACKPEPPER
Mean of Working Series 2077.022 Standard Deviation

1050.497 Number of Observations 271
Autocorrelations
Lag Covariance Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8

9 1
0 1103543 1.00000 | |********************|

1 1090271 0.98797 | . |********************|
2 1068960 0.96866 | . |******************* |
3 1044945 0.94690 | . |******************* |
4 1020629 0.92487 | . |****************** |
5 996646 0.90313 | . |****************** |

6 972702 0.88144 | . |****************** |
7 949906 0.86078 | . |***************** |
8 925115 0.83831 | . |***************** |
9 898460 0.81416 | . |**************** |
10 868510 0.78702 | . |**************** |
11 837544 0.75896 | . |*************** |
12 805021 0.72949 | . |*************** |
13 770302 0.69803 | . |************** |
14 735205 0.66622 | . |************* |
15 700673 0.63493 | . |************* |
16 665133 0.60272 | . |************ |
17 627922 0.56901 | . |***********. |
18 590406 0.53501 | . |***********. |
19 552108 0.50030 | . |********** . |
20 511853 0.46383 | . |********* . |
21 470232 0.42611 | . |********* . |
22 430102 0.38975 | . |******** . |
23 391276 0.35456 | . |******* . |
24 351535 0.31855 | . |****** . |
Type Retards Rho Pr < Rho Tau Pr < Tau F

Pr > F
Zero Mean 2 -0.8722 0.4950 -0.57 0.4694

3 -0.9398 0.4828 -0.61 0.4531
4 -0.8639 0.4965 -0.57 0.4677
5 -0.8428 0.5004 -0.56 0.4744
Single Mean 2 -6.4140 0.3127 -1.86 0.3491 1.78 0.6153
3 -6.3347 0.3186 -1.80 0.3795 1.65 0.6499
4 -6.1355 0.3337 -1.77 0.3954 1.59 0.6635
5 -6.3673 0.3161 -1.80 0.3780 1.66 0.6454
Trend 2 -6.2212 0.7237 -1.77 0.7156 1.76 0.8245
3 -6.2242 0.7234 -1.74 0.7331 1.63 0.8524
4 -5.9914 0.7422 -1.70 0.7507 1.58 0.8624
5 -6.1733 0.7275 -1.72 0.7399 1.65 0.8475
Reprenant les tapes comme pour les sries simules, on conclut que BLACKPEPPER a une racine unit
et na pas de drive.
Part de march
On examine la part de march dun bien de consommation trs "volatile", mesure chaque semaine (Fig.
3.9).
La srie dcroit fortement, manifestement elle a une tendance (sans doute stochastique, mais nanticipons
pas !).
Zero Mean 2 -1.5059 0.3927 -1.27 0.1885

3 -1.4253 0.4041 -1.38 0.1545
4 -1.4918 0.3946 -1.43 0.1412
5 -1.6954 0.3669 -1.41 0.1478
6 -1.3896 0.4093 -1.51 0.1230
7 -1.4862 0.3954 -1.77 0.0726
8 -1.7400 0.3611 -2.52 0.0122
Single Mean 2 -2.0190 0.7734 -0.85 0.7999 0.82 0.8609
3 -1.4584 0.8379 -0.71 0.8390 0.95 0.8298
4 -1.5622 0.8265 -0.75 0.8284 1.02 0.8118
5 -2.3314 0.7351 -0.95 0.7702 1.02 0.8110
6 -1.0750 0.8771 -0.59 0.8675 1.14 0.7798
7 -1.0322 0.8812 -0.63 0.8587 1.60 0.6671
8 -1.2618 0.8586 -0.94 0.7717 3.20 0.2646
F IGURE 3.9 Part de march
Trend 2 -22.4073 0.0325 -3.28 0.0749 5.48 0.0950

3 -18.2600 0.0827 -2.85 0.1829 4.13 0.3511
4 -20.7537 0.0473 -2.85 0.1845 4.09 0.3593
5 -38.2874 0.0005 -3.29 0.0730 5.45 0.0970
6 -20.6694 0.0480 -2.64 0.2644 3.53 0.4715
7 -15.6699 0.1424 -2.25 0.4582 2.53 0.6746
8 -8.6991 0.5125 -1.70 0.7426 1.54 0.8697
Le test pour Trend montre une certaine instabilit, niveaux de signification empiriques faibles aux retards
2 et 5. Les p-values des deux statistiques pour = 0 sont assez diffrentes. Aussi, voyons si la srie nest
pas la somme dune tendance dterministe et dun processus stationnaire.
data market;
infile D:\Donn\ST\franses\market.txt;
input DV mar Prix Sem;
prix100 = prix/100;
t = _n_;
run;
proc autoreg data= market;

model mar = t ;
output out= resumkt r= residmar;
run;
proc arima data= resumkt;

i var= residmar stationarity=(adf=(2,3,4,5,6,7,8));
run;
quit;

Zero Mean 2 -22.2847 0.0006 -3.29 0.0012

3 -18.0787 0.0023 -2.84 0.0048
4 -20.4861 0.0011 -2.83 0.0050
5 -37.7709 <.0001 -3.28 0.0013
6 -20.0016 0.0012 -2.59 0.0099
7 -15.1707 0.0056 -2.22 0.0261
8 -8.8211 0.0373 -1.77 0.0736
Single Mean 2 -22.2688 0.0047 -3.28 0.0186 5.45 0.0250
3 -18.0647 0.0148 -2.84 0.0571 4.09 0.0828
4 -20.4538 0.0076 -2.83 0.0585 4.05 0.0856
5 -37.6213 0.0010 -3.27 0.0189 5.39 0.0270
6 -19.9932 0.0086 -2.59 0.0982 3.42 0.1999
7 -15.1926 0.0321 -2.22 0.2006 2.49 0.4434
8 -8.8255 0.1686 -1.76 0.4002 1.54 0.6812
Trend 2 -22.4073 0.0325 -3.28 0.0749 5.48 0.0950
3 -18.2600 0.0827 -2.85 0.1829 4.13 0.3511
4 -20.7537 0.0473 -2.85 0.1845 4.09 0.3593
5 -38.2874 0.0005 -3.29 0.0730 5.45 0.0970
6 -20.6694 0.0480 -2.64 0.2644 3.53 0.4715
7 -15.6699 0.1424 -2.25 0.4582 2.53 0.6746
8 -8.6991 0.5125 -1.70 0.7426 1.54 0.8697
LACF du rsidu de la rgression de la srie sur le temps dcroit trs rapidement et le test ci-dessus Zero
Mean, conduit considrer que les rsidus sont stationnaires. Finalement la part de march semble tre
une srie forme dune tendance dterministe + une erreur stationnaire.
Commerce de la Chine
On examine le revenu national rel de la Chine par secteur, base 100 en 1952.
F IGURE 3.10 Commerce de la Chine
proc arima data= chine;

i var= COMMERCE stationarity=(adf=(2,3,4,5,6,7,8));

run;
quit;
Le Systme SAS
1
The ARIMA Procedure
Name of Variable = COMMERCE
Mean of Working Series 260.9865 Standard Deviation

173.8352 Number of Observations 37
Autocorrelations
Lag Covariance Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8

9 1
0 30218.665 1.00000 | |********************|

1 25983.261 0.85984 | . |***************** |
2 21854.031 0.72320 | . |************** |
3 18219.890 0.60293 | . |************ |
4 14625.703 0.48400 | . |********** . |
5 11878.751 0.39309 | . |******** . |
6 9529.081 0.31534 | . |****** . |
7 7568.117 0.25045 | . |***** . |
8 5614.468 0.18579 | . |**** . |
9 4255.672 0.14083 | . |*** . |
Zero Mean 2 2.9847 0.9975 2.64 0.9973

3 2.9742 0.9974 2.12 0.9903
4 3.5235 0.9990 1.53 0.9659
5 2.6937 0.9956 1.91 0.9844
6 4.3573 0.9997 1.20 0.9372
7 3.5772 0.9991 1.22 0.9390
8 6.0172 0.9999 1.06 0.9197
Single Mean 2 4.2804 0.9999 3.00 0.9999 5.56 0.0314
3 4.1307 0.9999 2.61 0.9999 4.21 0.0851
4 4.1549 0.9999 2.04 0.9998 2.48 0.4560
5 3.5531 0.9996 2.65 0.9999 4.29 0.0808
6 3.6161 0.9996 2.10 0.9998 2.43 0.4675
7 3.2116 0.9994 2.38 0.9999 3.10 0.3057
8 3.0790 0.9993 1.90 0.9997 2.05 0.5609
Trend 2 2.9106 0.9998 1.50 0.9999 5.43 0.1340
3 3.0551 0.9999 1.41 0.9999 4.11 0.3821
4 2.6393 0.9997 0.92 0.9998 3.25 0.5459
5 2.9678 0.9998 1.71 0.9999 4.00 0.4029
6 2.5565 0.9997 1.12 0.9999 3.69 0.4623
7 2.4848 0.9997 1.47 0.9999 4.36 0.3352
8 2.3521 0.9996 1.31 0.9999 3.25 0.5448
Exercice. Etudier cette srie.
Considrations pratiques sur la non stationnarit et la diffrenciation

Que se passe-t-il si, yt obissant par exemple
yt = 0 + 1 t + ut
o ut suit un modle ARMA (stationnaire), on diffrencie la srie ? La srie diffrencie est station-
naire, de moyenne 1 mais sa structure de corrlation est celle de ut et elle est gnralement plus
complique que celle de ut . Par exemple, si ut est un BB, alors ut est un MA(1) non inversible.
Comme il est plus expditif de diffrencier une srie et modliser la srie diffrencie que de lui ajuster
une tendance et de modliser lerreur, on est tent de diffrencier plus souvent que ncessaire.
Une structure de corrlation qui se complique aprs diffrenciation de la srie est une indication
quon a trop diffrenci.
Les tests de racine unit nont pas une puissance leve, on ne peut donc pas savoir avec beaucoup de
certitude si on doit diffrencier une srie ou lui ajuster une tendance linaire.
Sur une srie courte on peut ne pas voir un trend stochastique mais en cas dhsitation entre trend
dterministe et trend stochastique, il est prfrable dajuster un trend stochastique.
On doit toujours examiner lACF et le graphique de la srie quand on fait un test de racine unit.( Bien
quon nait pas suivi ce chemin pour les sries y0, y1, y2.)

Coursseriestemp 1

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Coursseriestemp 1

Transféré par

Droits d'auteur :

Formats disponibles

1

Sries temporelles appliques

1 Prliminaires sur les sries temporelles 5

3 Processus non stationnaires 56

3.3 Tests de Dickey-Fuller augments (ADF) . . . . . . . . . . . . . . . . . . . . . . . . . 59

4 Processus VAR et VARMA 74

Prliminaires sur les sries temporelles

1.1 Exemples de sries temporelles

1900 1920 1940 1960 1980 2000 2020

F IG . 1.1 Population franaise F IG . 1.2 Population des Etats-Unis

F IG . 1.3 Ventes de bouteilles de champagne F IG . 1.4 Ventes de vin australien

1.2 Objectifs de lanalyse dune srie temporelle

Yt = f (Yt1 , Yt2 , ) + ut (1.1)

Modle avec variable explicative

F IG . 1.7 Cours de laction Alcatel F IG . 1.8 Niveau du lac Huron

1.3 Tendance. Saisonnalit. Rsidus

F IG . 1.9 Month plot du trafic de laroport de Toulouse-Blagnac

corrles. Un cas limite est celui o ces v.a. sont i.i.d..

Bruit blanc (BB)

Etapes de ltude dune srie sans srie explicative associe.

12 xt = (1 B12 )xt = xt xt12

(1 0.9B)1 = 1 0.9B1 = 1 0.9 = 0.1

(1 0.9B)t = t 0.9Bt = t 0.9(t 1) = 0.1t + 0.9

proc print data=b (obs=14);

Le Systme SAS 10:00 Saturday, June 18, 2005 29

15 Obs VENTE_CH DATE ven1 ven12 d1_ven d12_ven

> champagne = ts(champagne,start=c(1962,1),frequency=12)

> dd0 = ts.intersect(champagne,chL1, chL12)

notamment aux dcalages (ou retards) 1, 5, 6, 11, 12.

lag.plot(nottem, 12, layout = c(4,3), ask = NA, do.lines = FALSE,

yt = 0.9yt12 + Zt 0.7Zt1 , Zt BBN (0, 1) ()

1.5 Un exemple : le niveau du lac Huron

1920 1925 1930 1935 1940

F IG . 1.12 Temprature mensuelle moyenne Nottingham

et stocker les rsidus de cet ajustement.

proc autoreg data= st6.lake;

The AUTOREG Procedure

Dependent Variable NIVEAU

Ordinary Least Squares Estimates

SSE 122.645511 DFE 96

Intercept 1 8.1208 0.1864 43.57 <.0001

title "Lac Huron - residu contre residu retarde";

Utilisant loprateur retard on crit

Tempratures mensuelles moyennes Nottingham, 19201939

lag 1 lag 2 lag 3

lag 7 lag 8 lag 9

lag 10 lag 11 lag 12

F IG . 1.13 Temprature Nottingham - Diagrammes retards

F IG . 1.17 Lac Huron - (1) srie, (2) ajustement

2.1 Proprits de base des sries stationnaires

Dfinition 2 {Yt } est dite faiblement stationnaire si :

Y (l) = cov(Yt , Ytl ).

2.1.2 Fonction dautocovariance

Dfinition 3 La fonction : l l est la fonction dautocovariance de {Yt }.

Cette fonction a deux proprits importantes :

Fonction dautocorrlation (ACF) Par dfinition, le coefficient dautocorrlation dordre l est

Mais var(Ytl ) = var(Yt ) = 0 donc :

De la dfinition on voit que : 0 = 1, 1 l 1.

Etant donn un chantillon yt , t = 1, , T , de {Yt } stationnaire, notons la moyenne empirique, y =

Le coefficient dautocorrlation empirique dordre l 1 est

2.1.3 Qualit de lerreur

b(k) AN (0, var(b

o h est un dcalage quon choisit permet de tester :