Vous êtes sur la page 1sur 50

I NTRODUCTION

AUX SRIES TEMPORELLES

Julien JACQUES
http://eric.univ-lyon2.fr/jjacques/

Table des matires


1 Introduction et premires dfinitions
1.1 Tendances et composantes saisonnires .
1.2 Indices descriptifs dune srie temporelle
1.2.1 Indices de tendance centrale . . .
1.2.2 Indices de dispersion . . . . . . .
1.2.3 Indices de dpendance . . . . . .
1.3 Mise en oeuvre sous R . . . . . . . . . .

.
.
.
.
.
.

5
7
8
8
8
8
10

2 TP 1 : Introduction
2.1 Donnes de varicelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Simulations de sries temporelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

11
11
11

3 Lissages exponentiels
3.1 Lissage exponentiel simple . . . . . . . . .
3.2 Lissage exponentiel double . . . . . . . . .
3.3 Mthode de Holt-Winters . . . . . . . . . .
3.3.1 Mthode non saisonnire . . . . . .
3.3.2 Mthode saisonnire additive . . . .
3.3.3 Mthode saisonnire multiplicative
3.4 Mise en oeuvre sous R . . . . . . . . . . .

.
.
.
.
.
.
.

12
12
13
13
13
14
14
15

4 TP 2 : Lissage Exponentiel
4.1 Lissage et prvision de donnes simules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Lissage et prvision de la concentration en co2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3 Lissage et prvision du CAC40 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

20
20
20
20

5 Estimation et limination de la tendance et de la saisonnalit


5.1 Bruit blanc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Processus stationnaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3 Une estimation paramtrique de la tendance (trend) . . . . . . . . . . . . . .
5.4 Estimation non paramtrique : moyenne mobile . . . . . . . . . . . . . . . .
5.5 Elimination de la tendance et de la saisonnalit par la mthode des diffrences
5.6 Test sur la srie rsiduelle . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.6.1 Comment tester si on est en prsence dun bruit blanc ? . . . . . . . .
5.7 Mise en oeuvre sous R . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.

21
21
21
21
22
25
25
27
27

6 TP 3 : Tendance et saisonnalit
6.1 Donnes AirPassengers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.2 Donnes simules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

28
28
28

7 Modlisation des sries stationnaires


7.1 Auto-corrlation partielle . . . . . . . . . . . . . . . . . . . . . . .
7.2 Les processus auto-rgressifs ARp . . . . . . . . . . . . . . . . . .
7.2.1 Exercice : cas particulier de lAR1 . . . . . . . . . . . . . .
7.2.2 Illustrations . . . . . . . . . . . . . . . . . . . . . . . . . .
7.3 Les processus en moyenne mobile M Aq . . . . . . . . . . . . . . .
7.3.1 Exercice : cas particulier du M A1 . . . . . . . . . . . . . .
7.3.2 Illustrations . . . . . . . . . . . . . . . . . . . . . . . . . .
7.4 Les processus mixtes ARM Ap,q . . . . . . . . . . . . . . . . . . .
7.4.1 Exercice : le processus ARM A1,1 . . . . . . . . . . . . . .
7.4.2 Illustrations . . . . . . . . . . . . . . . . . . . . . . . . . .
7.5 Rcapitulatif des proprits des processus M Aq , ARp et ARM Ap,q

29
29
29
30
31
31
31
31
39
39
39
41

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

7.6

Estimation, choix de modle et prvision .


7.6.1 Estimation . . . . . . . . . . . .
7.6.2 Choix de modle . . . . . . . . .
7.6.3 Prvision . . . . . . . . . . . . .

.
.
.
.

41
41
41
42

8 Processus non stationnaire : ARIMA et SARIMA


8.1 Exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.2 Les processus ARIMA et SARIMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.3 Mise en oeuvre sous R : processus ARMA, ARIMA, SARIMA . . . . . . . . . . . . . . . . . . . . .

43
43
43
44

9 TP 4 : Processus ARMA et ARIMA


9.1 Simulation de processus ARMA . . . . . . . . . . . . . . .
9.2 Identification dun processus ARMA . . . . . . . . . . . . .
9.3 Prvision dans un processus ARMA . . . . . . . . . . . . .
9.4 Prcipitations mensuelles San Fransisco entre 1932 et 1966
9.5 Taux dintrt au Royaume-Uni . . . . . . . . . . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

45
45
45
45
45
46

10 Processus ARCH et GARCH


10.1 Dfinitions . . . . . . . . . . . .
10.2 Quelques rappels de probabilits
10.3 Proprits des processus ARCH
10.4 Processus GARCH et proprits
10.5 Mise en oeuvre sous R . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

47
48
48
48
49
49

11 TP 5 : Processus ARCH et GARCH


11.1 Donnes simules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.2 Donnes relles EuStockMarkets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.3 Donnes relles : NYSE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

50
50
50
50

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

Ce document est uniquement un support de cours, et ne constitue pas lui seul un cours sur les sries temporelles.
Les diffrentes dmonstrations, applications et exercices ncessaires la comprhension des notions prsentes dans
ce document ny figurent pas (ou alors sous la forme dexercice), mais seront dvelopps en cours.
A la fin de chaque chapitre figurent les commandes R ncessaires lapplication des notions du chapitre.

1 Introduction et premires dfinitions


Une srie temporelle (ou srie chronologique) temps discret est une suite relle finie (xt )1tn , o t reprsente
le temps (en minute, jour, anne...).

9000
7000

8000

USAccDeaths

10000

11000

Voici quelques exemples de sries temporelles :


Ex. 1 : Nombre de morts accidentelles aux Etats-Unis de 1973 1978 (figure 1).

1973

1974

1975

1976

1977

1978

1979

Time

F IGURE 1 Nombre de morts accidentelles aux Etats-Unis de 1973 1978

400
300
200
100

AirPassengers

500

600

Ex. 2 : Nombre de passagers par mois (en milliers) dans les transports ariens, de 1949 1960 (figure 2).

1950

1952

1954

1956

1958

1960

Time

F IGURE 2 Nombre de passagers (en milliers) dans les transports ariens

100
0

50

sunspot.year

150

Ex. 3 : Nombre annuel de tches solaires observes la surface du soleil de 1700 1980 (figure 3).

1700

1750

1800

1850

1900

1950

Time

F IGURE 3 Nombre annuel de tches solaires


Ex. 4 : Taille de la population franaise (en milliers) de 1985 2005 (figure 4).

F IGURE 4 Population franaise de 1985 2005

3500
3000
2500
1500

2000

EuStockMarkets[, 3]

4000

Ex. 5 : Valeurs de cltures journalires du CAC40 de 1991 1998 (figure 11).

1992

1993

1994

1995

1996

1997

1998

Time

F IGURE 5 Valeurs de cltures journalires du CAC40 de 1991 1998


Except lexemple 4, ces donnes sont disponibles dans le logiciel R sous les noms : EuStockMarkets, USAccDeaths,
AirPassengers et sunspot.year.

Exercice 1. Reprer les tendances (croissance, dcroissance, linaire, quadratique...) et saisonnailits (priodicits)
de chacune de ces sries.
Un des objectifs principaux de ltude dune srie temporelle est la prvision des ralisations futures, trs souvent
pour des raisons conomiques (prvoir lvolution de la vente dun produit pour ajuster au mieux les moyens de production, prvoir lvolution dun march financier ...).
Bien entendu, aucun modle ne correspond exactement la ralit, et il est impossible de prvoir parfaitement le devenir dune srie temporelle. Lorsque cela sera possible, nous donnerons des intervalles de prvisions, afin de pouvoir
apporter une information quant la prcision de la prvision.
Pour ce faire, il existe un large choix de modle utilisable :
les modles de rgression, comme par exemple :
xt = 1 t2 + 2 t + 3 + t ,

t = 1, . . . , n.

Une fois les coefficients de ce modle estims, la prvision de xt+1 sera x


t+1 = 1 (t + 1)2 +
2 (t + 1) +
3 .
les lissages exponentiels qui sont trs simples mettre en oeuvre, et qui feront lobjet dun chapitre suivant,
les modles de type ARMA, qui consistent enlever de la srie les tendances et saisonnalits (ou priodicits)
videntes et modliser le rsidu restant. Ces mthodes sont plus sophistiques et plus lourdes numriquement
(temps de calcul) que les prcdentes, mais galement plus performantes.
Parmi les 5 exemples prcdents, celui relatif au nombre de passagers dans les transports ariens (figure 2) est une
srie assez typique de ce que lon rencontre en conomtrie, et elle donne lieu de bonnes prvisions pour toutes les
mthodes classiques. Au contraire, lvolution des marchs boursiers (figure 11) est beaucoup plus difficile prvoir.
Les dfis que nous allons devoir relever sont les suivants :
dfinir un modle avec un nombre fini de paramtres,
estimer les paramtres de ce modle,
vrifier la qualit dajustement du modle, comparer diffrents modles (partage de lchantillon dobservations
en 80% pour lapprentissage et 20% pour le test),
effectuer des prdictions.

1.1 Tendances et composantes saisonnires


On parle de tendance lorsque la srie (xt )1tn peut scrire, une erreur dajustement t prs, comme une
combinaison linaire de m fonctions du temps, choisies a priori (par exemple fonction puissance, exponentielle, logarithmique...) :
xt =

m
X

j fj (t) + t

1 t n.

j=1

Lorsque xt = t + + t la tendance est linaire (m = 1 et f (t) = t + ).


Une tendance polynomiale se traduira par xt = 1 tp + p1 tp1 + . . . + p+1 + t .
Exercice 2. Comment semble tre la tendance dans lexemple 5 ?
On parle de composante priodique lorsque la srie (xt )1tn peut se dcomposer en :
1 t n,

xt = st + t

o st est priodique, cest--dire st+T = st , avec T la priode (suppose entire).


Lorsque la priode est de 6 mois ou 1 an, on parle gnralement de composante saisonnire.
Enfin, il est frquent quune srie comporte la fois une tendance et une composante priodique (cf. exemple 2).

1.2 Indices descriptifs dune srie temporelle


1.2.1 Indices de tendance centrale
Nous utilisons comme indicateur de la tendance centrale la moyenne :
n

xn =

1X
xt .
n t=1

1.2.2 Indices de dispersion


Nous utilisons comme indicateur de dispersion la variance empirique (et sa racine carre, lcart-type empirique) :
n

n (0) =

1X
(xt x
n )2 .
n t=1

1.2.3 Indices de dpendance


Ces notions, plus spcifiques ltude de srie temporelle, renseignent sur la dpendance entre les donnes xt .
Auto-covariance Lauto-covariance empirique dordre 1 renseigne sur la dpendance entre deux donnes successives :

n (1) =

n1
1 X
(xt x
n )(xt+1 x
n ),
n 1 t=1

lauto-covariance empirique dordre 2 renseigne sur la dpendance entre deux donnes cartes de deux pas de temps :

n (2) =

n2
1 X
(xt x
n )(xt+2 x
n ),
n 2 t=1

et ainsi de suite. Pour des raisons de bon sens statistique, nous ne considrerons les covariances empiriques que jusqu
un ordre h pas trop grand.
On appelle fonction dauto-covariance (empirique) la fonction qui h associe
n (h).
Auto-corrlation Les auto-corrlations empiriques sont les quotients des covariances empiriques par la variance
empirique :
n (h) =

n (h)
.

n (0)

Ce sont les auto-corrlations empiriques que nous utiliserons pour caractriser la dpendance entre les variables.
On appelle fonction dauto-corrlation (empirique) la fonction qui h associe n (h).

Visualisation de lauto-corrlation dordre 1 La reprsentation graphique des nuages de points (xt , xt+1 ), pour
t = 1, . . . , n 1, est une bonne illustration de la valeur de lauto-corrlation dordre 1 n (1) : plus le nuage sera
arrondi, plus n (1) sera proche de 0, et plus le nuage sera allong, plus n (1) sera proche de 1. Ceci est vrai pour
toutes les auto-corrlations n (k), 1 k n.

11000

11000

7000

9000

11000

11000

x[7:length(x)]

11000

11000

9000

x[1:(length(x) 3)]

7000

7000

9000

x[6:length(x)]

11000
9000

9000

x[1:(length(x) 2)]

7000

x[5:length(x)]

x[1:(length(x) 1)]

7000

11000
7000

7000

9000

9000

9000

x[4:length(x)]

11000
7000

9000

x[3:length(x)]

11000
9000
7000

x[2:length(x)]

7000

7000

x[1:(length(x) 4)]

9000

11000

7000

x[1:(length(x) 5)]

9000

11000

x[1:(length(x) 6)]

7000

9000

11000

x[1:(length(x) 7)]

0.4

0.8
7000

0.4 0.0

ACF

9000

x[9:length(x)]

9000
7000

x[8:length(x)]

Series x

7000

9000

11000

x[1:(length(x) 8)]

0.0

0.5

1.0

1.5

Lag

F IGURE 6 Nuages de points (xt , xt+k ) pour k = 1, . . . , 8 et auto-corrlation pour la srie temporelle du nombre de
morts accidentelles aux Etats-Unis de 1973 1978

Premire analyse de la srie laide des auto-corrlations


Proposition 1. Si la srie (xt )1tn est une tendance linaire pure xt = at + b, t = 1, . . . , n, alors on a pour h fix :
n (h) 1.
n

Exercice 3. Faire la preuve.


Proposition 2. Si la srie (xt )1tn est une srie priodique pure xt = a cos 2t
T , t = 1, . . . , n, on a pour h fix :
n (h) cos
n

2h
.
T

En interprtant lauto-corrlation grce ces deux propositions, il sera possible de deviner si une srie temporelle admet une tendance (lauto-corrlation tend vers 1) ou une saisonnalit (la saisonnalit se voit sur lautocorrlation).

1.3 Mise en oeuvre sous R


Quelques fonctions R utiles ltude des sries temporelles :
Lire un fichier de donnes en sautant les k premires lignes : data=scan(file=donnee.dat,skip=k).
Crer un objet de type srie temporelle : serie <- ts (data,start,end,frequency).
data contient le vecteur des donnes (un fichier contenant les donnes peut tre mentionn en remplaant
data par file=donnees.dat), start et end mentionne les dates de dbut et de fin de la srie (ex :
start=c(1990,1) et end=c(1999,6) pour des donnes allant de janvier 90 juin 99), et enfin frequency
mentionne le nombre de donnes par unit de temps (par exemple, si les dates de dbut et de fin sont des annes,
et que les donnes sont mensuelles, il faudra indiquer frequency=12).
Reprsenter graphiquement un objet de type srie temporelle : plot.ts(serie)
La fonction
acf(x, lag.max = 10, type = c("correlation", "covariance"), plot = TRUE)
calcule (et trace si loption plot est TRUE) les lag.max premires auto-corrlations et auto-covariances.
Quelques conseils utiles pour les graphiques en R :
pour reprsenter plusieurs courbes sur le mme graphique, tracer la premire laide de la commande plot qui
cr la fentre graphique et y insre la courbe, puis tracer les autres courbes laide de la commande lines
qui trace une courbe sur une fentre graphique existante.
pour partager la fentre graphique en plusieurs (np) sous-graphes, utiliser la commande par(mfrow=c(n,p)).
prciser les limites des axes des graphiques : plot(...,xlim=c(0,10),ylim=c(-10,10)).
pour exporter les graphiques en jpeg (idem pour bmp, png), il faut lui procder de la sorte
1. jpeg(filename=nomfichier%d.jpeg),
2. raliser le graphique,
3. la commande dev.off() permet enfin de rediriger le dernier graphique trac vers le fichier nomfichier1.jpeg,
et ainsi de suite aprs chaque graphique. Le nom de fichier sera automatiquement incrment.

10

2 TP 1 : Introduction
Prliminaires
Lancer Open Office Writer et crer un fichier TP1_ST.odt. Dans ce fichier, vous rpondrez clairement aux
questions ci-dessous, en incluant vos codes R, les rsultats obtenus sous R (graphique y compris 1 ), vos interprtations,
remarques... Une fois ce TP fini, vous metterez en forme votre compte-rendu et lexporterez au format pdf.
Le jour de lexamen, la mme dmarche vous sera demande. Seul le fichier pdf sera pris en compte pour la correction.
Entrainez-vous donc ds maintenant, notamment pour lexportation des graphiques de R vers Open Office Writer.

Consignes
Dure du TP : 2h.
Indispensables pour la suite : exercices 1 et 2.

2.1 Donnes de varicelle


Rcuprer le fichier 2 contenant le nombre de cas de varicelle relevs New-York de janvier 1931 juin 1972.
1. Crer un objet de type srie temporelle contenant cette srie. Reprsenter graphiquement la srie.
2. Analyser qualitativement cette srie, cest--dire reprer dventuelles tendance et/ou saisonnalit (changer
dchelle si besoin).
3. Quel est le nombre de cas de varicelles mensuel moyen ?
4. Tracer les 25 premires auto-corrlations. Intrpreter ces rsultats. Que reprsentent les traits pointills horizontaux sur le graphique de lauto-corrlation.
5. Tracer sur un mme graphique, les volutions mensuelles du nombre de cas de varicelle pour chaque anne.
6. Tracer sur un graphique lvolution annuelle du nombre de cas de varicelle.
7. Ces deux dernires questions vous permettent-elles damliorer vos conclusions de la question 2 ?

2.2 Simulations de sries temporelles


On appelle bruit blanc gaussien une suite de variables alatoires indpendantes et identiquement distribues t de
loi normale centre rduite.
1. Quelle est la fonction dauto-corrlation dun bruit blanc ?
2. Simuler un bruit blanc gaussien de taille 100, et reprsenter le graphiquement.
3. Tracer la fonction dauto-corrlation.
4. Recommencer les deux questions prcdentes et observer la variabilit des rsultats. Jouer sur la longueur de la
srie.
5. Simuler maintenant la srie temporelle X(t) = 0.5t + 2t avec t N (0, 1) (taille 100).
6. Reprsenter graphiquement la srie et interprter-la qualitativement.

7. Faites de mme pour X(t) = 0.5t + t + 3 cos t 6 avec t N (0, 1).

1. se rfrer au document de cours, la fin du premier chapitre, pour lexportation de graphique sous R
2. les fichiers de donnes sont disponibles sur http://math.univ-lille1.fr/jacques/

11

3 Lissages exponentiels
Les mthodes de lissages exponentiels constituent un outil permettant de raliser des prvisions partir de lobservation dune srie temporelle. Ces mthodes tant relativement basiques et simples de mise en oeuvre, elles sont
souvent utilises dans lindustrie, notamment lorsque le nombre de prvisions raliser est important (par exemple,
prvisions des ventes de centaines de produits dans une grande surface).
Nous prsentons trois types de lissage exponentiel :
le lissage exponentiel simple qui consiste ajuster localement la srie temporelle une constante,
le lissage exponentiel double qui ajuste quant lui une droite,
le lissage exponentiel de Holt-Winters qui considre des fonctions plus complexes (polynomiales, priodiques...).

3.1 Lissage exponentiel simple


Disposant dune srie temporelle x1 , . . . , xn , lobjectif du lissage exponentiel est destimer la valeur xn+h non
encore observe. Nous noterons x
n,h cette prvision.
Etant donne une constante de lissage 0 < < 1, on dfinit la prvision par lissage exponentiel simple :
x
n,h =

n1
X

(1 )j xnj .

(1)

j=0

La prvision est une moyenne de toutes les observations passes, pondre de sorte que plus lobservation soit ancienne
moins elle ait dimportance.
Une constante de lissage proche de 0 ( 0.3) donne une importance significative aux observations loignes, tandis
quun proche de 1 ( 0.7) tend ngliger ces observations loignes.
Remarque : la prvision x
n,h ne dpend pas de h !
Formules rcursives de mise jour La dfinition (1) vrifiant la formule rcursive suivante
x
n,h = xn + (1 )
xn1,h ,
la prvision xn,h peut tre obtenue immdiatement partir de la connaissance de :
1- la prvision x
n1,h base sur les n 1-mes premires observations,
2- lobservation xn .
Lutilisation de cette rcurrence permet de raliser des algorithmes trs rapides destimation de la prvision par lissage
exponentiel (en initialisant x1,h = x1 ).
Exercice 4. Ecrire et interprter la valeur de xn,1 partir de lquation de rcurrence.
Exercice 5. Montrer que x
n,h dfini en (1) est solution asymptotique dun problme de moindres carrs pondrs.
Choix de la constante de lissage Pour choisir la constante de lissage, une solution pragmatique consiste tester
plusieurs valeurs et choisir celle minimisant un critre derreur minimale. Pour cela on partage lchantillon dobservations en un chantillon dapprentissage (les 80% premires observations : x1 , . . . , xm o m est par exemple lentier
8
le plus proche de 10
n) et un chantillon test (les 20% dernires : xm+1 , . . . , xn ), on estime le modle de lissage
exponentiel partir de lchantillon dapprentissage, et on value lerreur sur lchantillon test :
erreur =

nm
X

(
xt,h xt,h )2

h=1

On rpte cette opration pour plusieurs valeurs de la constante de lissage , et on choisit celle conduisant lerreur
la plus petite.

12

3.2 Lissage exponentiel double


On ajuste au voisinage de linstant n une droite dquation yt = a1 + a2 (t n).
La prvision par lissage exponentiel double est :
xn,h = a
1 (n) + a
2 (n)h
o a
1 (n) et a
2 (n) sont solution de
inf

a1 ,a2 R

n1
X

(1 )j (xnj (a1 + a2 j))2 .

j=0

Les solutions de cette quation sont


a
1 (n) = 2L1 (n) L2 (n)

et

a
2 (n) =

(L1 (n) L2 (n))


1

Pn1
Pn1
o L1 (n) = j=0 (1 )j xnj et L2 (n) = j=0 (1 )j L1 (n j) sont deux lissages exponentiels simples
successifs.
Remarque : comme pour le lissage exponentiel simple, lestimateur de la prvision est la meilleure approximation au
sens des moindres carrs pondrs.
Formules rcursives de mise jour
a
1 (n)
a
2 (n)

=
=

a
1 (n 1) + a
2 (n 1) + (2 )(xn xn1,1 ),
a
2 (n 1) + (2 )(xn xn1,1 ),

o a
1 (n) et a
2 (n) sont les estimations des paramtres a1 et a2 lorsque lon a observ la srie jusqu la n-me
ralisation. Les valeurs intiales tant a
1 (0) = x1 et a
2 (0) = x2 x1 .

3.3 Mthode de Holt-Winters


3.3.1 Mthode non saisonnire
Comme la mthode de lissage exponentiel double, celle de Holt-Winters non saisonnire revient estimer au
voisinage de linstant n une droite
yt = a1 + a2 (t n).
La prvision prend la forme
x
n,h = a
1 (n) + a
2 (n)h.
La variante par rapport la mthode de lissage exponentiel double est au niveau des formules de mise jour dans
lestimation des paramtres a1 et a2 .
Soient deux constantes de lissages 0 < < 1 et 0 < < 1. Les formules de mise jour sont :
a
1 (n)

= xn + (1 )[
a1 (n 1) + a
2 (n 1)],

a
2 (n)

= [
a1 (n) a
1 (n 1)] + (1 )
a2 (n 1).

Exercice 6. Montrer que les formules de mise jour du lissage exponentiel double sont un cas particulier de ces
dernires.
Remarque :
lintroduction de deux constantes rend la mthode plus souple que le lissage exponentiel double : la constante
joue un rle dans lestimation de lordonne lorigine de la droite, a1 , et la constante dans celle de la pente
de la droite, a2 .
si et sont petits le lissage est important car on tient compte du pass lointain.
13

3.3.2 Mthode saisonnire additive


On cherche maintenant ajuster au voisinage de linstant n une droite dquation
yt = a1 + a2 (t n) + st ,
o st est une composante priodique de priode T .
Les formules rcursives de mise jour sont :
a
1 (n) =

(xn snT ) + (1 )[
a1 (n 1) + a
2 (n 1)],

a
2 (n) =
sn =

[
a1 (n) a
1 (n 1)] + (1 )
a2 (n 1),
[xn a
1 (n)] + (1 )
snT .

Les prvisions sont de la forme :


x
n,h
x
n,h

=
=

a
1 + a
2 h + sn+hT 1 h T,
a
1 + a
2 h + sn+h2T T + 1 h 2T.

et ainsi de suite pour h 2T .


Les trois constantes de lissages, , et ont le mme effet que prcdemment, plus elles sont petites et plus limportance des donnes loignes est significative. Elles agissent respectivement sur les paramtres a1 , a2 et st .
Se rfrer Gouriroux et Monfort 1983 [5] pour les valeurs dinitialisation.
3.3.3 Mthode saisonnire multiplicative
On ajuste au voisinage de linstant n une droite dquation
yt = [a1 + a2 (t n)] st ,
o st est une composante priodique de priode T .
Les formules rcursives de mise jour sont :
a
1 (n) =
a
2 (n) =
sn

xn

+ (1 )[
a1 (n 1) + a
2 (n 1)],
snT
[
a1 (n) a
1 (n 1)] + (1 )
a2 (n 1),
xn
+ (1 )
snT .

a
1 (n)

Les prvisions sont de la forme :


x
n,h

[
a1 + a
2 h]
sn+hT

x
n,h

[
a1 + a
2 h]
sn+h2T

Se rfrer galement [5] pour les valeurs dinitialisation.

14

1 h T,
T + 1 h 2T.

3.4 Mise en oeuvre sous R


Les mthodes de lissages exponentiels sont disponibles sous R, grce la fonction HoltWinters.
Pour une srie temporelle x, cette procdure permet :
un lissage exponentiel simple :
xlisse <- HoltWinters(x,alpha=,beta=FALSE,gamma=FALSE),
un lissage de Holt-Winters sans composante saisonnire :
xlisse <- HoltWinters(x,alpha=,beta=,gamma=FALSE),
un lissage Holt-Winters additif :
xlisse <- HoltWinters(x,alpha=,beta=,gamma=,seasonal=add),
un lissage Holt-Winters multiplicatif :
xlisse <- HoltWinters(x,alpha=,beta=,gamma=,seasonal=mul).
A noter que pour un lissage de Holt-Winters avec composante saisonnire la srie temporelle x doit obligatoirement
tre un objet de type srie temporelle, dfini avec la fonction ts en prcisant la saisonnalit.
Laffichage et la visualisation des rsultats peuvent tre raliss laide des commandes :
summary(xlisse) : description de lobjet xlisse obtenu prcdemment par la procdure HoltWinters,
plot(xlisse) : reprsentation des valeurs observes et des valeurs lisses,
plot(xlisse$fitted[,1]) : reprsentation de lajustement de la srie remis jour chaque observation.
Les prvisions lhorizon h sont ralises laide de la fonction predict :
p<-predict(xlisse,n.ahead=h).
Un intervalle de confiance (dont le fondement thorique na pas t tudi dans ce cours) peut tre obtenu en validant
( TRUE) loption prediction.interval.
Remarque : lorsque les constantes de lissage sont fixes NULL (valeur par dfaut), un algorithme interne la procdure HoltWinters se charge destimer la meilleur constante possible partir de la srie des observations.

15

F IGURE 7 Lissage et prvision par lissage exponentiel double dun bruit blanc gaussien

16

F IGURE 8 Lissage et prvision par lissage exponentiel double de la srie X(t) = 0.5t + 2t avec t N (0, 1)

17


F IGURE 9 Lissage et prvision par lissage exponentiel double de la srie X(t) = 0.5t + t + 3 cos t 6 avec
t N (0, 1)

18

30
0

10

20

bb

40

50

Lissage Exponentiel Simple

10

10

10

Time

30
0

10

20

bb

40

50

Lissage Exponentiel Double, alpha=0.5

6
Time

30
0

10

20

bb

40

50

HoltWinters Seasonal

6
Time

F IGURE 10 Lissage et prvision par lissage


 exponentiel simple, double, et Holt-Winters avec composante saisonnire
de la srie X(t) = 0.5t + t + 3 cos t 6 avec t N (0, 1)
19

4 TP 2 : Lissage Exponentiel
Consignes
Dure du TP : 2h.
Indispensables pour la suite : exercices 1 et 2.

4.1 Lissage et prvision de donnes simules


Simuler les trois sries temporelles suivantes (cf. TP1), de taille 100 :
X1 (t) = t ,
X2 (t) = 0.5t + 2t ,

X3 (t) = 0.5t + t + 3 cos t 6 ,
o t N (0, 1). Les 70 premires donnes de chaque srie vont tre utilises pour prdire les 30 dernires.
1. Pour chaque srie, effectuer la prvision par lissage exponentiel simple et double. Tester diffrentes valeurs du
paramtre de lissage (4 5 valeurs), et reprsenter graphiquement la srie ainsi que la prvision. Commenter
chaque rsultat, et essayer de dterminer graphiquement le lissage le plus adapte pour chaque srie.
2. Calculer pour chaque prvision effectue la somme des carrs des erreurs, et selectionner le meilleur modle
laide de cette quantit.
3. Tester maintenant le lissage exponentiel de Holt-Winters avec composante saisonnire additive puis multiplicative.
4. Les prdictions obtenues sont-elles meilleures ?
Rq : la commande par(mfrow=c(n,p)) permet dafficher n p graphique sur la mme page.

4.2 Lissage et prvision de la concentration en co2


Le fichier de donnes co2 contenu dans R contient les concentrations en CO2 proximit du volcan Mauna Loa
(Hawa) de 1959 1997.
Aprs avoir reprsent graphiquement ces donnes, quel modle de lissage exponentiel vous semble le mieux appropri ?
Afin de valider ce modle, tester la prdiction des donnes de 1990 1997 en utilisant celles de 1959 1989. Si cela
vous semble graphiquement correct, utilisez cette mthode pour prdire les concentrations en co2 de 1997 2007.
Sinon, tester dautres mthodes de lissage exponentiel.

4.3 Lissage et prvision du CAC40

1500 2000 2500 3000 3500 4000

EuStockMarkets[, 3]

Rcuprer le fichier contenant les valeurs de cloture journalire du CAC40 de 1991 1998 (donnes R EuStockMarkets).
Essayer de prdire par lissage exponentiel les valeurs de cloture de 1998 en utilisant les valeurs de cloture de 1991
1997.

1992

1993

1994

1995

1996

1997

1998

Time

F IGURE 11 Valeurs de cloture journalires du CAC40 de 1991 1998

20

5 Estimation et limination de la tendance et de la saisonnalit


Une srie temporelle (xt )1tn est lobservation des n premires ralisations dun processus stochastique (Xt )t .
Cest ce processus que lon cherche dsormais modliser. Pour cela, la dmarche suivante doit tre adopte :
reprsenter graphiquement la srie afin de reprer les tendances et saisonnalits,
estimer et supprimer les tendances et saisonnalits (partie dterministe du processus stochastique),
choisir un modle pour les rsidus (partie alatoire du processus stochastique) et lestimer,
prdire les ralisations futures laide de ce modle.
Lobjectif de cette section est de donner quelques mthodes pour estimer et supprimer les tendances et saisonnalits.
La fin de ce cours sera concentr sur la modlisation de processus stationnaires.

5.1 Bruit blanc


Dfinition 1. Un processus de bruit blanc est une suite de variables alatoires (Xt )t indpendantes, desprance et de
variance constantes. Si lesprance est nulle, le bruit blanc est centr, et si les variables alatoires sont gaussiennes,
le bruit blanc est gaussien.

5.2 Processus stationnaire


Un processus alatoire (Xt )t est stationnaire sil est desprance constante
E[Xt ] :=

t,

et si les covariances sont stables par translation dans le temps, cest--dire, pour tout h
Cov(Xt , Xt+h ) := (h)

t.

On appelle fonction dauto-covariance du processus stationnaire la suite (h), et fonction dauto-corrlation du


processus stationnaire la suite (h) := (h)
(0) .
Exercice 7. Montrer que (h) = (h).

5.3 Une estimation paramtrique de la tendance (trend)


Nous supposons que la srie temporelle tudie soit la ralisation dun processus stochastique compos dune
tendance dterministe mt et dune partie alatoire t (suppose de moyenne nulle) :
X t = mt + t .
Une mthode simple consiste supposer que cette tendance est linaire :
mt = a + bt,
et destimer les paramtres a et b par moindres carrs.
Ainsi, si on observe la srie x1 , . . . , xn , il faut trouver a et b qui minimisent la quantit :
n
X

(xt a bt)2

t=1

Les solutions de ce problme sont :


a

b =

!
2n + 1

txt +
n
x ,
3
t=1
!
n
X
n+1
12
txt
n
x .
n(n2 1) t=1
2
6
n(n 1)

n
X

21

Exercice 8. Ecrire le problme sous forme matricielle... et le rsoudre.


Lhypothse de linairit de la tendance convient trs bien certaines sries temporelles : par exemple, celles des
figures 1, 2 (et encore...), 4... Mais ce nest pas le cas de toutes les sries : voir par exemple celle reprsentant le cours
du CAC40, figure 11.
Il est alors possible de supposer que la tendance soit de forme polynomiale :
mt = a + bt + ct2
et destimer les paramtres a, b et c par moindres carrs.
Mais il est parfois difficile destimer le degr du polynme, et lorsque le degr est trop important, le nombre de paramtres estimer devient grand et les calculs fastidieux. Dans cette situation, on a recourt une mthode destimation
non paramtrique.

5.4 Estimation non paramtrique : moyenne mobile


Tendance Supposons que la tendance mt soit linaire dans un petit intervalle [t q, t + q] autour de t. Dans ce cas,
un bon estimateur de la tendance est la moyenne sur cet intervalle :
m
t =

q
X
1
xt+k .
2q + 1
k=q

On peut donc estimer la tendance chaque temps t en calculant la moyenne sur les observations tant dans une fentre
de largeur 2q + 1 autour de t : cest ce que lon appelle une estimation par moyenne mobile.
Pour viter les problmes de bord, on suppose que xt = x1 si t < 1 et xt = xn si t > n.
Tendance et saisonnalit Supposons dsormais que le processus ne comporte pas uniquement une tendance, mais
galement une saisonnalit :
X t = mt + s t + t ,
avec st une fonction T -priodique.
Le principe destimation est (en simplifiant lgrement) le suivant : on estime la tendance moyenne sur une priode,
puis on estime la composante saisonnire en moyennant sur toutes les priodes les carts la tendance moyenne de la
priode.
Application la srie du nombre de morts accidentelles aux Etats-Unis La figure 12 reprsente la srie du
nombre de morts accidentelles aux Etats-Unis de 1973 1978 (dj prsente en introduction), la figure 13 reprsente
la tendance (estime par moyenne mobile) et la figure 14 reprsente la composante saisonnire.
La figure 15 reprsente la srie aprs limination de la tendance et la figure 16 reprsente la srie aprs limination de
la tendance et de la composante saisonnire.
La srie 16 ainsi obtenue est une srie (suppose) stationnaire, sur laquelle nous chercherons plus tard ajuster un
modle.

22

11000
10000
9000
7000

8000

USAccDeaths

1973

1974

1975

1976

1977

1978

1979

Time

8400 8600 8800 9000 9200 9400 9600

m$trend

F IGURE 12 Srie USAccDeaths : nombre de morts accidentelles aux Etats-Unis de 1973 1978

1973

1974

1975

1976

1977

1978

1979

1978

1979

Time

0
1500 1000 500

m$seasonal

500

1000 1500

F IGURE 13 Tendance de la srie USAccDeaths

1973

1974

1975

1976

1977

Time

F IGURE 14 Composante saisonnire de la srie USAccDeaths

23

2000
1000
0
2000

1000

USAccDeaths m$trend

1973

1974

1975

1976

1977

1978

1979

Time

200
0
200
400

USAccDeaths m$trend m$seasonal

400

F IGURE 15 Srie USAccDeaths aprs limination de la tendance

1973

1974

1975

1976

1977

1978

1979

Time

F IGURE 16 Srie USAccDeaths aprs limination de la tendance et de la composante saisonnire

24

5.5 Elimination de la tendance et de la saisonnalit par la mthode des diffrences


Cette mthode permet de supprimer les tendance et saisonnalit dune srie temporelle sans les estimer.
Soit T loprateur qui associe (Xt XtT ) (Xt ) :
T Xt = Xt XtT .
On note loprateur 1 , et kT loprateur T . . . T .
|
{z
}
k fois

Proposition 3. Soit un processus admettant une tendance polynomiale dordre k :


Xt =

k
X

aj tj +t .

j=0

| {z }
mt

Le processus Xt admet une tendance polynomiale dordre k 1.


Exercice 9. Faire la preuve.
Ainsi, en appliquant k fois , on limine la tendance.
Remarque : il est important de remarquer que si lon applique t quelque soit t, le rsultat est le mme quant llimination de la tendance.
Comme en pratique il nest pas vident de connatre le degr k, on appliquera loprateur jusqu ce que la moyenne
du processus soit nulle (k sera gnralement 1, 2 ou 3).
Proposition 4. Soit un processus admettant une tendance mt et une saisonnalit, de priode T :
X t = mt + s t + t .
Dans ce cas,
T Xt = (mt mtT ) + (t tT )
est un processus dsaisonnalis.
De plus, si la tendance du processus est linaire, elle est galement supprime.
Exercice 10. Faire la preuve.
Si la tendance est plus que linaire, il suffit dappliquer la procdure prcdente pour finir de supprimer la tendance, et obtenir ainsi un processus que lon supposera stationnaire.
La figure 17 illustre llimination de la tendance linaire et de la saisonnalit de la srie xt =
t N (0, 1).

t
2

+ 3 cos t
6 t avec

5.6 Test sur la srie rsiduelle


Lobjectif des techniques prsentes dans la section 5.5 est dobtenir une srie stationnaire (ou tout au moins le
plus stationnaire possible), et en particulier sans tendance ou saisonnalit. Ltape suivante consiste modliser la
srie rsiduelle obtenue. La premire chose faire est donc de tester sil y a dpendance entre les termes de cette srie.
Si ce nest pas le cas, on dit que la srie rsiduelle (stationnaire) est un bruit blanc (dfinition 1).
Si la srie rsiduelle obtenue aprs dsaisonalisation et limination de la tendance, est un bruit blanc, il nest donc pas
utile daller plus loin dans la modlisation si ce nest destimer la moyenne et variance du bruit blanc.

25

30
0

10

bb

50

Serie avec tendance lineaire et saisonnalit (priode 12)

20

40

60

80

100

Time

2
0
4

bb_diff1

Serie avec la tendance elimine par la mthode des diffrences

20

40

60

80

100

Time

6
4
2

bb_diff12

Serie avec la saisonnalit (et la tendance) elimines par la mthode des diffrences

20

40

60

80

Time

F IGURE 17 Elimination de la tendance et de la saisonnalit par la mthode des diffrences (figure du haut : srie
xt = 2t + 3 cos t
6 t avec t N (0, 1) ; figure du milieu : srie xt xt1 ; figure du bas : srie xt xt12

26

5.6.1 Comment tester si on est en prsence dun bruit blanc ?


Par ltude de la fonction dauto-corrlation empirique Lorsque n est assez grand, les auto-corrlations dun
bruit blanc sont approximativement indpendantes et de loi N (0, n1 ). Ainsi, 95% des auto-corrlations devraient se

], et en traant les 40 premires auto-corrlations il ne devrait pas y en avoir plus


trouver dans lintervalle [ 1.96
, 1.96
n
n
de 2 voir 3 en dehors de ces limites.
A noter que ces bornes sont traces lorsque lon demande R de reprsenter graphiquement les auto-corrlations.
A laide du test du portemanteau Plutt que de regarder si chaque auto-corrlation est dans les bornes de lintervalle prcdent, nous considrons la statistique dfinie par la somme des h premires auto-corrlations au carr
Q=n

h
X

2 (j).

j=1

Daprs la remarque prcdente sur la normalit des auto-corrlations, la statistique Q suit une loi du 2 h degrs de
libert. Il est donc possible de construire un test qui consistera rejeter lhypothse nulle (la srie est un bruit blanc)
si Q est suprieur au quantile 2h,1 .
Ljung et Box (1978) ont amlior ce test en considrant la statistique
QLB = n(n + 2)

h
X
2 (j)
,
nj
j=1

dont la distribution est mieux approxime que la prcdente par une loi du 2 h degrs de libert. Cest ce test qui
est implment dans la fonction Box.test de R.

5.7 Mise en oeuvre sous R


La fonction decompose permet dextraire dune srie temporelle (via la mthode de la moyenne mobile) :
serie_decomp<-decompose(serie,type=c(additive,mutliplicative))
la composante saisonnire : serie_decomp$seasonal, que lon suppose additive ou multiplicative dans
loption type,
la tendance : serie_decomp$trend,
le partie alatoire stationnaire de la srie : serie_decomp$random.
La fonction diff.ts(serie,lag=T,difference=k) permet dappliquer loprateur de diffreciation kT .
La fonction Box.test(serie,lag=H) examine lhypothse nulle de nullit des H premire auto-covariance,
laide du test du portemanteau. Par dfaut H est fix 1, et seule la nullit de lauto-covariance dordre 1 est teste.
Pour tester si la srie peut-tre apparente un bruit blanc, nous fixerons arbitrairement un H de lordre de 20 (nous
considrerons abusivement que si les 20 premires auto-corrlations sont nulles, la srie est indpendante).

27

6 TP 3 : Tendance et saisonnalit
Consignes
Dure du TP : 2h.
Indispensable pour la suite : exercice 1.

6.1 Donnes AirPassengers


Nous tudions la srie chronologique du nombre de passagers par mois (en milliers) dans les transports ariens, de
1949 1960. Cette srie est disponible sous R (AirPassengers).
1. Estimation paramtrique de la tendance
(a) Reprsenter graphiquement la srie. Ce processus vous semble-t-il stationnaire ? Prsente-t-il des tendances et saisonnalits ?
(b) Estimer les paramtres dune tendance linaire at + b.
(c) Supprimer cette tendance et reprsenter graphiquement la srie ainsi obtenue. Vrifier que la srie des
rsidus est de moyenne nulle.
(d) Calculer et reprsenter lauto-corrlation de la srie des rsidus.
2. Mthode des diffrences
(a) Appliquer la mthode des diffrences pour enlever la tendance et la saisonnalit. Prciser la priode de la
saisonnalit, le degr du polynme de tendance.
(b) La srie obtenue semble-t-elle stationnaire ?
3. Mthode des moyennes mobiles
(a) Appliquer la mthode des moyennes mobiles pour enlever la tendance et la saisonnalit.
(b) La srie obtenue semble-t-elle stationnaire ? Pourrait-on la modliser par un bruit blanc ?
Remarque : la fonction Box.test permet de tester lindpendance dune suite de variables alatoires.
Remarque : la fonction Box.test, qui permet de tester lindpendance dune suite de variable alatoire, peut tre
utilise pour

6.2 Donnes simules


Rcuprer la srie temporelle contenue dans le fichier simulation.dat. Cette srie a t simule partir dun
processus relativement simple. Essayer de le retrouver !
1. Analyser qualitativement cette srie temporelle.
2. Pouvez-vous proposer une modlisation pour cette srie (cest--dire dfinir le processus Xt qui a gnr cette
srie) ?
pi
Indication : la partie saisonnire est de la forme a cos(t pi
b ) ou a sin(t b )... vous de deviner !

28

7 Modlisation des sries stationnaires


Nous prsentons dans cette section comment modliser une srie, qui une fois tendance et saisonnalit supprimes,
est stationnaire. A noter que le seul fait de supprimer la tendance et la saisonnalit ne rend pas la srie ncessairement
stationnaire, puisque cela naffecte pas la variance et lauto-covariance, qui dovient tre constantes pour un processus
stationnaire.

7.1 Auto-corrlation partielle


Le coefficient de corrlation partielle entre les deux variables X1 et Xn dun processus stochatistique (Xt )t est
le coefficient de corrlation entre les deux variables auxquelles on a retranch leurs meilleures explications en terme
de X2 , . . . , Xn1 :
rX2 ,...,Xn1 (X1 , XN ) = corr(X1 PX2 ,...,Xn1 (X1 ), Xn PX2 ,...,Xn1 (Xn )),
o corr est le coefficient de corrlation classique (quotient de la covariance par le produit des carts-types), et o
PX2 ,...,Xn1 (X1 ) est la projection 3 de la variable X1 dans lespace vectoriel engendr par les variables X2 , . . . , Xn1 .
Ce coefficient exprime la dpendance entre les variables X1 et Xn qui nest pas due aux autres variables X2 , . . . , Xn1 .
La fonction dauto-corrlation partielle r(h) dun processus stationnaire est dfinie par :
r(h)
r(h)

= rX2 ,...,Xh (X1 , Xh+1 )


= r(h)
h 6= 0

r(1)

= (1)

h 2

Lalgorithme de Durbin-Watson, que nous ne prsentons pas ici, permet destimer les auto-corrlations partielles dun
processus stationnaire.
Dans le logiciel R, la fonction pacf permet ces estimations.

7.2 Les processus auto-rgressifs ARp


Les premiers modles que nous prsentons sont les processus auto-rgressifs, construits partir de lide que
lobservation au temps t sexplique linairement par les observations prcdentes.
Dfinition 2. On dit que (Xt ) est un processus auto-rgressif dordre p (centr) sil scrit
Xt = t +

p
X

aj Xtj ,

(2)

j=1

o t est un bruit blanc centr de variance 2 .


Lobservation Xt au temps t est alorsPla somme dun choc alatoire linstant t, t , indpendant de lhistorique,
p
et dune fonction linaire de son pass j=1 aj Xtj , qui peut tre vue comme la prdiction de Xt partir des p
dernires observations passes.
t est linnovation contenue dans le processus au temps t. On dit que (t ) est le processus dinnovation.
Les coefficients aj doivent vrifier la contrainte suivante pour assurer la stationnarit du processus : le polynme
caractristique du processus (2), A(z) = 1 a1 z . . . ap z p , ne doit avoir que des racines (relles ou complexes)
de module strictement suprieur 1. La dmonstration sort du cadre de ce cours.
Remarque 1 : en prenant lesprance de (2) et en utilisant la stationarit du processus, on obtient que lesprance du
P
processus vrifie (1 pj=1 aj ) = 0. Comme 1 ne peut tre racine du polynme A(z), on a ncessairement = 0.
Remarque 2 : dans ce cours, conformment la dfinition (2), nous ne considrons que des processus ARp centrs.
Pp
Un processus ARp non centr serait dfini par Xt = + t + j=1 aj Xtj .
3. la projection PX2 ,...,Xn1 (X1 ) = 2 X2 + . . . + n1 Xn1 peut tre interprte comme la meilleure explication linaire de X1 en
fonction de X2 , . . . , Xn1 .

29

Exercice 11. Vrifier la stationnarit et expliciter lexpression du processus autorgressif de polynme caractristique
A(z) = 1 z 21 z 2 .
Proposition 5. La variance du processus ARp dfini en (2) est :
(0) = 2 +

p
X

aj (j)

j=1

et lauto-covariance, pour tout h > 0 :


(h) =

p
X

aj (h j).

j=1

Exercice 12. Faire la dmonstration.


Lauto-covariance dun processus ARp vrifie donc la formule de rcurrence dordre p suivante :
(h) a1 (h 1) . . . ap (h p) = 0.

(3)

Le polynme caractristique de cette relation de rcurrence est :


 

a1
1
ap 
z p a1 z p1 . . . ap1 z ap = z p 1
.
. . . p = zpA
z
z
z

Les racines i de ce polynme sont les inverses des racines du polynme A, et sont donc de module strictement
infrieur 1. En supposant que A a toute ses racines distinctes, les solutions de lquation de rcurrence prcdente
sont de la forme :
p
X
ci hi .
(h) =
i=1

Ainsi, puisque |i | < 1, lauto-covariance dcroit exponentiellement avec h.


Ces rsultats stendent immdiatement lauto-corrlation dun processus ARp .

Quant lauto-corrlation partielle, elle est nulle tout ordre strictement suprieur p, et vaut ap lordre
p:
r(h)
r(p)

=
=

0
ap .

h > p,

La dmonstration de ce rsultat trs utile ne sera pas aborde dans ce cours.


7.2.1 Exercice : cas particulier de lAR1
Soit le processus AR1 (centr) suivant
Xt = aXt1 + t ,
o t est un bruit blanc centr de variance .
2

1. Quelle condition sur a doit on imposer pour que ce processus soit stationnaire ?
2. Calculer la variance de ce processus.
3. Montrer que lauto-covariance dun tel processus est
(h) = 2

ah
1 a2

4. En dduire la dcroissance vers 0 de lauto-covariance lorsque h tend vers linfini.


5. Calculer lauto-corrlation partielle.
30

7.2.2 Illustrations
Voici quelques simulations de processus ainsi que leurs auto-corrlation et auto-corrlation partielle empiriques :
AR1 avec coefficient positif puis ngatif : figures 18 et 19,
AR2 : figures 20 et 21.

7.3 Les processus en moyenne mobile MAq


La seconde catgorie de modles classiques regroupe les processus en moyenne mobile.
Dfinition 3. On appelle moyenne mobile (Moving Average) dordre q un processus de la forme
Xt = t + b1 t1 + . . . + bq tq ,
o les j pour t q j t sont des bruits blancs centrs de variance 2 .
Pq
On notera parfois Xt = j=0 bj tj en imposant b0 = 1.
A noter que pour linstant aucune condition nest ncessaire sur les bi pour que le processus stationnaire 4 .
Un processus moyenne mobile est ncessairement centr, et son auto-covariance vrifie la proposition suivante.
Proposition 6. Lauto-covariance dun processus moyenne mobile Xt = t + b1 t1 + . . . + bq tq est

qh

2X

bk bk+h h q
(h) =
o b0 = 1
k=0

0
h > q

Exercice 13. Faire la dmonstration (simple).

Lauto-corrlation est donc galement nulle au dessus de lordre q. On retrouve le mme comportement que lautocorrlation partielle dun ARp .
Lauto-corrlation partielle dun processus moyenne mobile est complique calculer, et sans grand intrt. Nanmoins, il est important de savoir quelle tend vers 0 vitesse exponentielle lorsque h tend vers linfini.
Ce comportement symtrique entre les processus moyenne mobile et auto-rgressif est du la proprit suivante :
Proposition 7. Un processus auto-rgessif est un processus moyenne mobile dordre infini, et rciproquement un
processus moyenne mobile est un processus auto-rgressif dordre infini.
Exercice 14. De la dfinition dun processus moyenne mobile, extraire la valeur de linnovation au temps t, puis
r-crire la dfinition dun M Aq en remplaant les innovations par leur valeur. Conclure.
7.3.1 Exercice : cas particulier du M A1
Calculer les coefficients dauto-corrlation dun tel processus.
7.3.2 Illustrations
Voici quelques simulations de processus ainsi que leurs auto-corrlation et auto-corrlation partielle empiriques :
M A1 avec coefficient positif puis ngatif : figures 22 et 23,
M A3 : figure 24.
4. pour des questions de prvision, nous serons amen supposer que le polynme caractristique B(z) = 1 + b1 z + . . . + bq z q a toute ses
racines de module strictement suprieurs 1.

31

4
2
0
4

ar1

200

400

600

800

1000

Time

0.4
0.0

ACF

0.8

Series ar1

10

15

20

25

30

25

30

Lag

0.4
0.0

Partial ACF

0.8

Series ar1

10

15

20

Lag

F IGURE 18 Simulation dun AR1 : Xt = 0.8Xt1 + t , auto-corrlation et auto-corrlation partielle.

32

4
2
0
4

ar1

200

400

600

800

1000

Time

0.0
0.5

ACF

0.5

1.0

Series ar1

10

15

20

25

30

25

30

Lag

0.4
0.8

Partial ACF

0.0

Series ar1

10

15

20

Lag

F IGURE 19 Simulation dun AR1 : Xt = 0.8Xt1 + t , auto-corrlation et auto-corrlation partielle.

33

6
4
2
2
6

ar2

200

400

600

800

1000

Time

0.6
0.2
0.2

ACF

1.0

Series ar2

10

15

20

25

30

25

30

Lag

0.6
0.2
0.2

Partial ACF

Series ar2

10

15

20

Lag

F IGURE 20 Simulation dun AR2 : Xt = 0.9Xt2 + t , auto-corrlation et auto-corrlation partielle.

34

5
0
5

ar2

200

400

600

800

1000

Time

0.0
0.5

ACF

0.5

1.0

Series ar2

10

15

20

25

30

25

30

Lag

0.0
0.4
0.8

Partial ACF

Series ar2

10

15

20

Lag

F IGURE 21 Simulation dun AR2 : Xt = 0.5Xt1 0.9Xt2 + t , auto-corrlation et auto-corrlation partielle.

35

4
2
0
4

ma1

200

400

600

800

1000

Time

0.5
0.0
0.5

ACF

1.0

Series ma1

10

15

20

25

30

25

30

Lag

0.1
0.3
0.5

Partial ACF

Series ma1

10

15

20

Lag

F IGURE 22 Simulation dun M A1 : Xt = t 0.8t1 , auto-corrlation et auto-corrlation partielle.

36

4
2
0
4

ma1

200

400

600

800

1000

Time

0.4
0.0

ACF

0.8

Series ma1

10

15

20

25

30

25

30

Lag

0.2
0.2

Partial ACF

0.4

Series ma1

10

15

20

Lag

F IGURE 23 Simulation dun M A1 : Xt = t + 0.8t1 , auto-corrlation et auto-corrlation partielle.

37

10
5
0
10

ma3

200

400

600

800

1000

Time

0.4
0.0

ACF

0.8

Series ma3

10

15

20

25

30

25

30

Lag

0.4
0.2
0.2

Partial ACF

Series ma3

10

15

20

Lag

F IGURE 24 Simulation dun M A3 , auto-corrlation et auto-corrlation partielle.

38

7.4 Les processus mixtes ARMAp,q


Cette classe plus gnrale de modles dfinit des processus sous la forme dune rcurrence auto-rgressive avec un
second membre de type moyenne mobile.
Dfinition 4. Un processus auto-rgressif moyenne mobile dordres p et q est de le forme :
Xt =

p
X

ak Xtk +

q
X

bj tj .

j=0

k=1

o les j pour t q j t sont des bruits blancs centrs de variance 2 .


La stationnarit dun ARM Ap,q est assure lorsque toutes les racines du polynme A(z) = 1 a1 z . . . ap z p
sont de module strictement suprieur 1. Ce polynme forme avec B(z) = 1 + b1 z + . . . + bq z p les deux polynmes
caractristiques du processus. On supposera galement que les polynmes A et B nont pas de racine commune, afin
de sassurer quil ny a pas de reprsentation plus courte.
Exercice 15. Soit le processus ARM A1,1 dfini par Xt + aXt1 = t + at1 .
Est-ce un processus stationnaire ? Existe-t-il une criture plus simple de ce processus ?
On peut crire le processus ARM Ap,q sous la forme suivante
Xt a1 Xt1 . . . ap Xtp = t + b1 t1 + . . . + bq tq .
Ainsi,
Cov(Xt+h a1 Xt+h1 . . . ap Xt+hp , Xt ) =
=

(h) a1 (h 1) . . . ap (h p)
Cov(t+h + b1 t+h1 + . . . + bq t+hq , Xt )

qui est nulle ds que h > q. Lauto-covariance dun processus ARM Ap,q volue selon la mme rcurrence quun
ARp (cf. quation (3)). Ainsi, lauto-covariance (et lauto-corrlation) dun processus ARM Ap,q vont tendre exponentiellement vers 0 lorsque h tend vers linfini, partir de lordre q + 1.
7.4.1 Exercice : le processus ARM A1,1
Considrons le processus
Xt = aXt1 + t + bt1 .
2

+2ab
1. Montrer que la variance du processus est (0) = 2 1+b
1a2 .
2

+a b
.
2. Montrer que lauto-covariance dordre 1 est (1) = 2 a+b+ab
1a2

3. En dduire les auto-corrlations (1) =

(a+b)(1+ab)
b2 +2ab+1

et (h) = ah1 (1).

7.4.2 Illustrations
Voici une simulation dun processus ARM A2,2 (figure 25) ainsi que ses auto-corrlation et auto-corrlation partielle empiriques.

39

5
0
5

arma22

200

400

600

800

1000

Time

0.0
0.5

ACF

0.5

1.0

Series arma22

10

15

20

25

30

25

30

Lag

0.0
0.4
0.8

Partial ACF

0.4

Series arma22

10

15

20

Lag

F IGURE 25 Simulation dun ARM A2,2 , auto-corrlation et auto-corrlation partielle.

40

7.5 Rcapitulatif des proprits des processus MAq , ARp et ARMAp,q


La tableau 7.5 rcapitule les principales proprits des processus M Aq , ARp et ARM Ap,q .
modle
auto-covariance

M Aq
(h) = 0 h > q

auto-corrlation

(h) = 0 h > q

auto-corrlation partielle

lim r(h) = 0

ARp
lim (h) = 0

ARM Ap,q
h > q, lim (h) = 0

lim (h) = 0

h > q, lim (h) = 0

r(h) = 0 h > p et r(p) = ap

TABLE 1 Rcapitulatif des proprits des processus M Aq , ARp et ARM Ap,q .

7.6 Estimation, choix de modle et prvision


Les principaux modles de sries temporelles ont t dfinis. A partir dune srie observe, il faut maintenant
choisir un modle, ventuellement plusieurs, estimer ses paramtres et enfin faire des prvisions pour les ralisations
futures. Dans le cas o lon hsite entre plusieurs modles, des critres de choix de modles seront utiliss pour
slectionner le meilleur dentre eux.
7.6.1 Estimation
Exemple

Considrons le processus AR2 suivant :


Xt = a1 Xt1 + a2 Xt2 + t .

On peut montrer que les auto-covariances dordre 1 et 2 sont les suivantes :


(1) =

a1
(0)
1 a2

et

(2) = a1 (1) + a2 (0).

Exercice 16. Montrez-le !


Ainsi, les paramtres du modle a1 et a2 peuvent tre xprims en fonction de la variance et des 2 premires
auto-covariance du processus :
a1 =

(1) (0)2 (0)(1)


(0) (0)2 (1)2

et

a2 =

(0)(2) (1)2
(0)2 (1)2

Exercice 17. Montrez-le galement !


En estimant les auto-covariances du processus laide des auto-covariances empiriques, on en dduit des estimateurs des paramtres du modle AR2 .
Comme de plus (0) = 2 + a1 (1) + a2 (2), il est possible dobtenir galement un estimateur de la variance du
bruit dinnovation.
Cas gnral En ralit, les estimateurs prcdents peuvent tre amliors : ainsi, dans le cas gnral, lestimation des
paramtres des modles ARMA (AR, MA) est faite par maximum de vraisemblance. Lexpression de la vraisemblance
tant gnralement trop complexe pour que lon puisse obtenir un maximum explicite, des algorithmes numriques
(type Newton) sont utiliss.
7.6.2 Choix de modle
Comme on la vu prcdemment (cf. tableau rcapitulatif 7.5) ltude des auto-covariances, auto-corrlations et
auto-corrlations partielles peut conduire certaines hypothses sur la nature du modle. Une fois quelques modles
choisis, et leur paramtres estims, des critres vont tre utiliss pour choisir le modle qui effectue le meilleur compromis entre :
41

ajustement la srie de donnes,


complexit du modle.
Il est en effet trs important de prendre en compte ce compromis, car si on ne sintressait qu coller au mieux aux
donnes, on serait tenter de choisir un modle ARM A avec un trs grand nombre de paramtres. Or, plus il y a de
paramtres, plus il faut de donnes pour les estimer. Et donc pour un nombre dobservations fix de la srie, plus le
modle sera complexe, moins bien seront estims les paramtres.
Les critres de choix de modles les plus courants sont :
le critre AIC (Akake Information Criterion), qui sera gnralement prfr si lobjectif de ltude est de faire
de la prvision, et qui est dfini par :
AIC = 2 log L() + 2,
o L(.) est la vraisemblance du modle, reprsente les paramtres du modle et le nombre de ces paramtres.
le critre BIC (Bayesian Information Criterion) sera quant lui gnralement prfr si lobjectif de ltude est
de sajuster la srie observe, et est dfini par :
BIC = 2 log L() + n
o n est le nombre dobservations de la srie.
Les modles ayant la plus petite valeur du critre devront tre choisis.
Ces deux critres conduisent donc slctionner des modles dont la vraisemblance est grande, en la pnalisant par la
complexit du modle.
7.6.3 Prvision
Lobjectif est de prvoir la valeur que va prendre la variable alatoire Xn+h , h tant appel lhorizon de la prvision, ayant observ la ralisation des variables alatoires X1 , . . . , Xn .
Dans le cadre dune modlisation ARMA, on choisit destimer Xn+h par une combinaison linaire des Xj prcdents
(1 j n) :
n,h = c1,h X1 + . . . + cn,h Xn .
X
Les coefficients cj,h sont estims de sorte quil minimise :
E[(Xn+h c1,h X1 . . . cn,h Xn )2 ].
n,h ainsi dfini nest autre que la projection de Xn+h sur lespace vectoriel engendr par les variables
Lestimateur X
X1 , . . . , Xn .
n+1 =
Exercice 18. Montrer que la prvision au rang 1 dun processus ARp dfini par lquation 2 nest autre que X
a1 Xn + . . . + ap Xn+1p . En dduire que lerreur de prvision horizon 1 est le bruit dinnovation.
Nous ne dtaillerons pas plus en dtail cette partie dans ce cours, mais nous citons nanmoins, sans dmonstrations,
deux proprits intressantes.
Proposition 8.
Lerreur de prvision horizon 1 pour un processus ARM A est le bruit dinnovation n+1 .
La variance de lerreur de prvision horizon h dans un processus ARM A crot depuis la variance du bruit
dinnovation (valeur prise pour h = 1) jusqu la variance du processus lui-mme.
Intervalle de confiance sur la prvision Enfin, si on suppose que le bruit dinnovation t est gaussien, les variables
alatoires Xt sont elles aussi gaussiennes, tout comme lerreur de prdiction. Ainsi, il sera possible de construire des
intervalles de confiances sur la prdiction, ce que permettent les fonctions du logiciel R dcrites plus loin.

42

8 Processus non stationnaire : ARIMA et SARIMA


Les modles ARMA sont destins modliser des processus stationnaires. En pratique, les sries temporelles sont
gnralement non stationnaires, et un pr-traitement est ncessaire pour supprimer les tendances et saisonnalits. Une
fois la srie stationnarise analyse, et les valeurs futures prdites, il est ensuite ncessaire de revenir la srie initiale.

8.1 Exemple
Considrons une srie temporelle (xt )1tn qui prsente une saisonnalit de priode 12. Afin de supprimer cette
saisonnalit, cest la srie suivante que nous tudions :
yt = xt xt12

pour t = 13, . . . , n

(4)

Lajustement dun modle ARMA et les prvisions sont ralises sur la srie (yt ). Il est donc ncessaire de revenir
la srie initiale, car ce sont les prvisions de (xt ) qui nous intressent.
De lquation (4) on obtient :
xt

yt + xt12

=
..
.

yt + yt12 + xt24

yt + yt12 + yt24 + . . . + yr(t)+12 + xr(t)

o r(t) est le reste de la division euclidienne de t par 12.


Puisque lon connait les xt pour t n ainsi que les prvisions yn+h , on peut en dduire les prvisions de xn+h .
Exercice 19. Ecrire pour cet exemple la prvision lhorizon 1 de la srie (xt )1tn .

8.2 Les processus ARIMA et SARIMA


Les processus ARIMA et SARIMA sont la gnralisation des modles ARMA pour des processus non stationnaires, admettant une tendance (ARIMA), ou encore une tendance et une saisonnalit (SARIMA). En pratique, et dans
le logiciel R notamment, ce sont ces processus qui sont directement utiliss.
Soit lopration de diffrenciation prcdemment dfini (section 5), qui associe au processus (Xt )tN le processus
(Xt Xt1 )tN . Nous rappelons que le processus obtenu en diffrenciant deux fois de suite, (Xt 2Xt1 +Xt2 )tN ,
est not 2 . Et ainsi de suite.
Dfinition 5. Un processus (Xt ) est un processus ARIM Ap,d,q si le processus
Yt = d Xt
est un processus ARM Ap,q .
Les processus ARIM Ap,d,q sont donc bien adapts aux sries temporelles prsentant une tendance polynmiale
de degr d 1.
Soit T loprateur prcdemment dfini (section 5), qui fait passer de (Xt ) (Xt XtT ).
Dfinition 6. Un processus (Xt ) est un processus SARIM Ap,d,q,T si le processus
Yt = T d Xt
est un processus ARM Ap,q .
Les processus SARIM Ap,d,q,T sont bien adapts aux sries temporelles prsentant une priode de longueur T et
une tendance polynmiale de degr d.
Remarque : en ralit, les processus SARIMA sont plus complexes et comportent dautres paramtres. Nous
ne considrerons que cette version SARIM Ap,d,q,T dans ce cours, se rfrer [5] pour des complments sur ces
processus.
43

8.3 Mise en oeuvre sous R : processus ARMA, ARIMA, SARIMA


La fonction arima.sim(modele,n) permet de simuler un processus ARM Ap,q dfini par
Xt

p
X

ak Xtk = t +

q
X

bj tj .

j=1

k=1

Les paramtres ak et bj du processus sont prciss dans le paramtre modele de la fonction :


modele<-list(ar=c(a1, . . . , ap ),ma=c(b1 , . . . , bq )).
Pour simuler un modle ARIM Ap,d,q il faut ajouter le composant order=c(p,d,q) dans le paramtre modele
de la fonction arima.sim.
La fonction ar permet destimer les paramtres dun processus ARp :
out<-ar(data,aic=TRUE,order.max=NULL)
Lordre p du processus auto-rgressif est choisi (infrieur order.max) laide du critre AIC (si loption aic est
valide).
La fonction arima permet destimer les paramtres :
dun ARM Ap,q : out<-arima(serie,order=c(p,0,q))
dun ARIM Ap,d,q : out<-arima(serie,order=c(p,d,q))
dun SARIM Ap,d,q,T :
out<-arima(serie,order=c(p,d,q),seasonal=list(order=c(P,D,Q),period=T))
Les paramtres P, D, Q du modle SARIMA ne sont pas abords dans ce cours, nous leur donnerons par dfaut la
valeur des paramtres p, d, q (pas trop grands).
Parmi les sorties de cette fonction, on peut obtenir :
out$coef : estimation des coefficients,
out$aic : valeur du critre AIC,
out$resid : estimation des rsidus.
La fonction p=predict(out,h) permet deffectuer une prvision lhorizon h. Parmi les sorties de cette fonction,
p$pred contient les prvisions, et p$se contient lcart-type de lerreur de prvision. Il nexiste pas de fonction
prdfinie pour calculer un intervalle de confiance sur les prvisions, mais cela peut tre fait manuellement grce ces
deux sorties de la fonction predict.

44

9 TP 4 : Processus ARMA et ARIMA


Consignes
Dure du TP : 4h.
Indispensable pour la suite : exercices 1 4.

9.1 Simulation de processus ARMA


Penser reprsenter chaque processus simul.
1. Donner la dfinition dun processus ARM Ap,q . Rappeler les conditions sur les coefficients pour que ce processus soit stationnaire.
2. A laide de la fonction arima.sim, simuler plusieurs processus ARp et M Aq (p et q pas trop grands). Avant
toute simulation, crire la dfinition mathmatique du processus simuler et veillez ce que les conditions de
stationnarit soient respectes.
3. Observer les auto-corrlations empiriques (partielles ou non). Que constatez-vous ?
4. Simuler quelques ARM Ap,q , observer et interprter les auto-corrlations empiriques (partielles ou non).
5. Faire de mme avec un modle ARIM Ap,d,q , avec un d assez petit.

9.2 Identification dun processus ARMA


Rcuprer le fichier de donnes serie1.dat.
1. Ce processus vous semble-t-il modlisable par un processus ARM A ? Pourquoi ?
2. On travaille dsormais avec la srie obtenue en appliquant la fonction diff la srie. Quelle transformation
a-t-on effectue ? Pourquoi ?
3. En observant les auto-corrlations empiriques et auto-corrlations partielles empiriques, proposer des modles
ARp et M Aq dordre faible pour modliser cette srie.
4. Estimer les paramtres des deux modles slectionns.
5. Tester la blancheur des rsidus.
6. Conclure pour choisir un modle.
7. Sinspirer de la dmarche pour modliser la srie serie2.dat.

9.3 Prvision dans un processus ARMA


Soit le processus Xt Xt1 + 12 Xt2 31 Xt3 = t avec t un bruit blanc gaussien centr rduit.
1. Aprs avoir identifi ce processus, simuler 50 ralisations de longueur 105.
2. Pour chaque simulation, extraire les 100 premires valeurs et estimer les paramtres dun AR3 .
3. Pour chaque simulation, prdire les cinq valeurs suivantes.
4. Donner une estimation de lerreur moyenne (biais) et de la variance de lerreur de prvision 1, 2, 3, 4 et 5 pas.
5. Recommencer en rallongeant la dure dobservation, et comparer aux rsultats prcdents.

9.4 Prcipitations mensuelles San Fransisco entre 1932 et 1966


Rcuprer la srie sanfran.dat.
1. La srie semble-t-elle stationnaire ? Si non faites en sorte quelle le soit.
2. Proposer un modle ARp adapt la srie stationnaris. Valider votre proposition en testant les rsidus.
3. Gardez votre ide de cot. Estimer le modle SARIM A{2,0,0,12} sur les donnes jusqu la fin de lanne 1963
(car nous allons chercher prdire les prcipitations des trois dernires annes). Que pouvez-vous dire quant
mon choix de vous demander dutiliser ce modle ? Afficher et tester les rsidus de cette modlisation.
45

4. Prvoir, partir de cette modlisation, les prcipitations de 1964, 1965 et 1966. Superposer sur un graphique
prvision et valeurs relles.
5. Reprenez votre ide, et refaites la prdiction des prcipitations de 1964 1966, laide du modle que vous
pouvez proposer lissue des deux premires questions. Faites de mme avec un lissage exponentiel de HoltWinters, avec et sans composante saisonnire.
6. Quel est, graphiquement, le meilleur modle pour prdire cette srie ?
7. Comment peut-on rpondre la question prcdente de faon moins subjective ? Comparer les rsultats lanalyse graphique.

9.5 Taux dintrt au Royaume-Uni


Le fichier UKinterestrates.dat contient le spread des taux dintrts (diffrence entre taux dintrt long
terme et court terme) pour le Royaume-Uni entre mars 1953 et dcembre 1995.
En vous inspirant des exercices prcdents, proposer une modlisation de type ARM A, ARIM A ou SARIM A.
Justifier bien votre dmarche.

46

10 Processus ARCH et GARCH

0.05
0.15

0.10

0.00

0.05

Les sries prcdemment tudies taient supposes stationnaires. Si besoin, tendances et saisonnalits taient
supprimes pour obtenir une srie rsiduelle stationnaire. Nanmoins, toutes les sries rsiduelles obtenues de la sorte
ne sont pas ncessairement stationnaires.
Cest le cas par exemple de la srie reprsente par la figure 26, qui contient les volutions journalires de la bourse
des valeurs de New-York (NYSE) du 19 octobre 1984 au 31 dcembre 1991.

500

1000

1500

2000

Index

F IGURE 26 Evolution journalire de la bourse des valeurs de New-York (1984-1991)

La figure 27 reprsente la simulation dun processus ARCH2 .

200

400

600

800

1000

Time

F IGURE 27 Simulation dun ARCH2


Comme on peut le voir, la moyenne semble constante alors que la variance change au cours du temps (on qualifie ce
comportement d htroscdastique ). De plus, les moments de grande variabilit semblent regroups. Les modles
de type ARIMA qui supposent un comportement homoscdastique (variance constante), ne sont pas adapts ce
type de srie.
Nous prsentons dans cette section des modles adapts ce type de srie : les processus ARCH (AutoRegressive
Conditionally Heteroscedastic) introduits pas Engle vers 1982, ainsi que leur gnralisation, les processus GARCH.

47

10.1 Dfinitions
Un processus ARCHp est dfini par :
Xt =
t |Xt1 , Xt2 , . . .
t2

t
N (0, t2 )
2
2
0 + 1 Xt1
+ . . . + p Xtp

La variance condionnelle dpend du temps : si les valeurs prcdentes sont grandes (en valeur absolue), la variance
sera grande, et inversement. Ainsi, si on observe un choc dans la srie (valeur anormalement grande), elle sera suivi
dune priode de haute volatilit, dont la dure dpend de lordre p du modle ARCH.
Exercice 20. Pensez-vous que cela correspond la srie NYSE (figure 26) ?

10.2 Quelques rappels de probabilits


Soit un couple de variables alatoires continues (X, Y ), de dentsit f (., .). Soit fY (.) la densit marginale de Y .
La densit conditionnelle de X sachant que Y = y est dfinie par :
fX|Y (x, y) =

f (x, y)
fY (y)

si fY (y) > 0

Lesprance conditionelle est donc lesprance par rapport cette loi :


Z
E[X|Y = y] =
xfX|Y (x, y)dx
R

La variance conditionnelle est

t2 = V(Xt |It1 ) = E[X 2 |Y = y] E[X|Y = y]

Soit Is1 = {Xs1 , Xs2 , . . .} lensemble des observations prcdant linstant s.


On a :
E[Xt |Is ] =
E[Xt |Ir ] =

Xt
t s
E[E[Xt |Is ]|Ir ]

r s

et en particulier E[Xt ] = E[E[Xt |Is ]].

10.3 Proprits des processus ARCH


Si Xt est un processus ARCH, alors :
E[Xt ] = 0
E[Xt |It1 ] = 0
V(Xt ) =

o It1 = Xt1 , Xt2 , . . .


p
X

P0p
i < 1
si
1 i=1 i
i=1

2
2
V(Xt |It1 ) = 0 + 1 Xt1
+ . . . + p Xtp
Cov(Xt , Xt+h ) = h = 0
h > 0

Cov(Xt , Xt+h |It1 ) = 0


Remarque : un processus ARCH est conditionnellement htroscdastique mais inconditionnellement homoscdastique !
Pp
Condition suffisante de stationnarit : i=1 i < 1.
On peut montrer galement, ce qui peut tre intressant pour dtecter un ARCH en pratique, que la distribution dun
processus ARCH a
un skewness nul (moment centr dordre 3) : la distribution est donc symtrique,
un kurtosis (moment centr dordre 4) suprieur 3 : la distribution est donc plus applatie quune gaussienne.
48

10.4 Processus GARCH et proprits


Un processus GARCHp,q est dfini par :
Xt

t |Xt1 , Xt2 , . . .
t2

t
N (0, t2 )
2
2
2
2
0 + 1 Xt1
+ . . . + p Xtp
+ 1 t1
+ . . . + q tq

avec 0 > 0, i 0 pour i = 1, . . . , p et j 0 pour j = 1, . . . , q.


Un processus GARCH peut tre vu comme un processus ARCH dordre infini, et peut ainsi reprsenter formellement
de faon plus parcimonieuse un processus ARCH comprenant un nombre lev de paramtres.
Remarque vidente : un GARCHp,0 est un ARCHp .
Si Xt est un processus GARCHp,q , alors :
E[Xt ] =

E[Xt |It1 ] =
Cov(Xt , Xt+h ) = h =

0
0

Cov(Xt , Xt+h |It1 ) =

h > 0

Proprit : soit Xt un processus GARCHp,q , et soit m = max(p, q). Le processus Xt2 admet une reprsentation
ARM A(m, q).
Ainsi, pour identifier un GARCHp,q , on identifiera tout dabord le processus ARM A(m, q) qui modlise Xt2 . Pour
identifier p dans le cas o m = q (p q), il faut effectuer des tests de significativit des coefficients q , . . . , 1 du
processus ARM A(m, q) (sont-ils significativement non nuls ?).

10.5 Mise en oeuvre sous R


Pour utiliser les fonctions spcifiques ltude des modles ARCH et GRACH, il faut avant tout charger le package
tseries laide de la commande library(tseries).
La fonction garch permet destimer un GARCHp,q : serie<-garch(data,order=c(q,p))
Parmi les sorties de cette fonction : coef, residuals, fitted.values.
La prdiction se fait de la mme faon que pour les modles de type ARMA.

49

11 TP 5 : Processus ARCH et GARCH


Consignes
Dure du TP : 2h.
Ncessite linstallation du package tseries. Pour cela charger le package laide de la commande library
(si le package nest pas prsent dans votre version installe de R, il sera ncessaire de linstaller grce la
commande install.packages).

11.1 Donnes simules


Soit le processus Xt dfini par :
Xt |Xt1 , Xt2 , . . . N (0, t2 )

2
2
avec t2 = 0.1 + 0.5Xt1
+ 0.2Xt2
.

1. Reconnaissez-vous ce processus ?
2. Simuler dans un vecteur x 1000 ralisations de ce processus. Reprsenter cette trajectoire graphiquement, et
analyser les moyenne, variance et auto-covariance empiriques.
3. Ajuster un processus ARCHp au vecteur x.

11.2 Donnes relles EuStockMarkets


Le fichier EuStockMarkets de R contient les valeurs de cloture des 4 principaux indices boursiers europens,
de 1991 1998. Pour chaque indice, chercher un modle ARCH ou GARCH appropri, et effectuer la prvision
30 jours. Les donnes pourront (devront ?) au pralable tre transformes.

11.3 Donnes relles : NYSE


Le fichier nyse.dat contient les volutions journalires de la bourse des valeurs de New-York (NYSE) du 19
octobre 1984 au 31 dcembre 1991. Checher un processus ARCH ou GARCH adapt, et raliser la prvision 30
jours.

Rfrences
[1]
[2]
[3]
[4]
[5]
[6]

Aragon, Y. Sries temporelles avec R. Mthodes et cas., Springer, Paris, 2011.


Bensaber A. et Bleuse-Trillon B. Pratique des chroniques et de la prvision court terme, Masson, Paris, 1989.
Bosq D. et Lecoutre J-P. Analyse et prvision des sries chronologiques, Masson, Paris, 1992.
Brockwell P.J. et Davis R.A. Introduction to Time Series and Forecasting, Springer, 2001.
Gouriroux C. et Montfort A. Cours de sries temporelles, Economica, Paris, 1983.
Shumway R.H. et Stoffer D.S. Times Series Analysis and Its Applications, With R Example, Springer, 2006.

Ce cours est en partie inspir du cours de M.-Cl. Viano disponible ladresse suivante :
http://math.univ-lille1.fr/ viano/economcours.pdf
50