Vous êtes sur la page 1sur 30

Séries temporelles – Cours 1

Introduction au cours de séries temporelles

Angelina Roche

Executive Master Statistique et Big Data

2018–2019
Séries temporelles – Cours 1

Plan du cours d’aujourd’hui

Qu’est-ce qu’une série temporelle ? Exemples

Représentations graphiques

Tendance, saisonnalité, résidus

Remarques complémentaires et déroulement du cours


Séries temporelles – Cours 1
Qu’est-ce qu’une série temporelle ? Exemples

Plan

Qu’est-ce qu’une série temporelle ? Exemples

Représentations graphiques

Tendance, saisonnalité, résidus

Remarques complémentaires et déroulement du cours


Séries temporelles – Cours 1
Qu’est-ce qu’une série temporelle ? Exemples

Définition d’une série temporelle

Définitions
I Une série temporelle est un ensemble d’observations
Xt1 , Xt2 , ... mesurées sur des temps t1 , t2 , ... distincts.

I Un processus stochastique {Xt , t ∈ T } est une famille de


variables aléatoires définies sur le même espace de probabilité.

On modélisera généralement un série temporelle comme un


processus stochastique.
Séries temporelles – Cours 1
Qu’est-ce qu’une série temporelle ? Exemples

Exemples
35
30
Consommation finale effective totale

25
20
15
10
5
0

1950 1960 1970 1980 1990 2000 2010

Année

Figure – Évolution de la consommation effective totale annuelle (en


milliards d’euros) en France de 1949 à 2017 (cf TP 2 d’analyse de
données).
Séries temporelles – Cours 1
Qu’est-ce qu’une série temporelle ? Exemples

Exemples
600
500
Nombre de passagers aériens

400
300
200
100

1950 1952 1954 1956 1958 1960

Année

Figure – Nombre mensuel de passagers aériens sur des vols


internationaux en milliers de 1949 à 1960.
Séries temporelles – Cours 1
Qu’est-ce qu’une série temporelle ? Exemples

Exemples
Statistique
Evolution de l'interêt

80
60
40
20

2005 2010 2015

Temps

BigData
100
Evolution de l'interêt

60
20
0

2005 2010 2015

Temps

Figure – Évolution de l’intérêt pour les mot-clefs ’Statistique’ et ’Big


Data’ (source : Google trends).
Séries temporelles – Cours 1
Représentations graphiques

Plan

Qu’est-ce qu’une série temporelle ? Exemples

Représentations graphiques

Tendance, saisonnalité, résidus

Remarques complémentaires et déroulement du cours


Séries temporelles – Cours 1
Représentations graphiques

Représentations graphiques usuelles

I Le chronogramme : tracé du graphique {(t, Xt ), t ∈ T } où T


est l’intervalle d’observation.

I Le lag-plot ou diagramme retardé : tracé des points


{(Xt−k , Xt ), t, t − k ∈ T }.
Objectif : détecter des corrélations pour comprendre la
dépendance de la série envers son passé.

I Le month-plot : représentation simultanée des chronogrammes


associés à chaque saison ou mois.
Séries temporelles – Cours 1
Représentations graphiques

Example : lag-plot de la consommation effective annuelle


Total.ts <- ts(t(Total),start=1949)
lag.plot(Total.ts,set.lags=c(1,2,5,10),layout=c(2,2))

0 5 10 20 30

40
68
656667 67
6566
626364 6264

30
60
5961 60 63
61
59
58
57 58
56
55
54 557
55
54 6
53 53
5052
51 552
50 1

20
4349 43 49
xy$y

xy$y
48
47
46
4442
45 4248
47
46
44
45
41
40 4041
39
38 39
38
37
36 37
36
35 35
34 34

10
33 33
32
31
30 31
30 32
29
28 29
28
27
26
25 27
26
25
21
20
1924
23
22 24
23
22
21
20
19
18
17
16
15
14 18
17
16
15
14
1813
12
11
10
7
6
5
4
239 6
5
4
3
12
13
712
11
10
9
8
0
lag 1 lag 2

40
6264

30
60 63
585961 59
5758
5557
56
54 56
55
53 5354
52
51
50 51
5052

20
43 4 9 4346
449
xy$y

xy$y

42
4446
45 4
47 8 47
4244
45 8
41
40 41
40
3938 39
38
37
36 37
36
35 35
34 34

10
33 33
32
31 32
31
2930
28
30
29
28
27
26
25 27
26
22
21
20
19
18
17
24
23 18
1720
19 22
22
21 3425
16
15
14
13
12
11
10
9
8 12
11
10
8 16
15
14
913
2
1 7
6
345 67
5
34
2
1 0

lag 5 lag 10
0 5 10 20 30
Séries temporelles – Cours 1
Représentations graphiques

Example : lag-plot du bruit blanc (pas de corrélation)


lag.plot(ts(rnorm(1000,0,1)),set.lags=c(1,5,10,100),layout=c(2,2),do.lines=FALSE)
3
1
-1
-3

0 200 400 600 800 1000


-3 -2 -1 0 1 2 3
temps
3
ts(rnorm(1000, 0, 1))

ts(rnorm(1000, 0, 1))
-2 -1 0
-3 1 2

lag 1 lag 5

3
ts(rnorm(1000, 0, 1))

ts(rnorm(1000, 0, 1))

2
1
0
-1
-2
-3

lag 10 lag 100


-3 -2 -1 0 1 2 3
Séries temporelles – Cours 1
Représentations graphiques

Example : lag-plot du nombre de passagers aériens


lag.plot(AirPassengers,lags=12,layout=c(3,4),do.lines=FALSE)

100 200 300 400 500 600 100 200 300 400 500 600
600
500
AirPassengers

AirPassengers

AirPassengers

AirPassengers
300
200
100 400

lag 1 lag 2 lag 3 lag 4

600
500
AirPassengers

AirPassengers

AirPassengers

AirPassengers

400
300
200
100
lag 5 lag 6 lag 7 lag 8
600
500
AirPassengers

AirPassengers

AirPassengers

AirPassengers
300
200
100 400

lag 9 lag 10 lag 11 lag 12


100 200 300 400 500 600 100 200 300 400 500 600
Séries temporelles – Cours 1
Représentations graphiques

Example : month-plot du nombre de passagers aériens


monthplot(AirPassengers)
AirPassengers

600
500
400
300
200
100

J F M A M J J A S O N D
Séries temporelles – Cours 1
Tendance, saisonnalité, résidus

Plan

Qu’est-ce qu’une série temporelle ? Exemples

Représentations graphiques

Tendance, saisonnalité, résidus

Remarques complémentaires et déroulement du cours


Séries temporelles – Cours 1
Tendance, saisonnalité, résidus

Tendance, saisonnalité, résidus


On décompose souvent une série temporelle {Xt , t ∈ T } de manière
additive
Xt = mt + st + Zt ,
ou multiplicative
Xt = mt st (1 + Zt ).
avec
I t 7→ mt : la tendance ou trend fonction qui varie peu (capte
l’orientation à long terme),
I t 7→ st : la composante saisonnière fonction périodique
(comportement qui se répète),
I {Zt , t ∈ T } : la composante d’erreur ou résidu, de moyenne nulle et
idéalement de faible variabilité par rapport aux deux autres.
Des combinaisons des modèles additif et multiplicatif sont aussi
envisageables. Par exemple : Xt = (mt + st )Zt .
Séries temporelles – Cours 1
Tendance, saisonnalité, résidus

Estimation de la tendance par moindres carrés

I Objectif : on suppose que Xt = mt + Zt avec mt = β0∗ + β1∗ t + ... + βd∗ t d


et l’on souhaite estimer β ∗ = (β0∗ , ..., βd∗ )t .

I Idée : estimer β par moindres carrés à partir des observations Xt1 , ..., Xtn .

1 X
βb ∈ arg minβ∈Rd+1 (Xti − mti )2 ⇒ βb = (T t T )−1 T t X ,
n i=1n

avec
t12 t1d
 
1 t1 ...
. .. .. ..  t
T =  .. . . .  et X = (Xt1 , ..., Xtn ) .
1 tn tn2 ... tnd

I On peut choisir d ensuite par des méthodes de choix de modèles (AIC,


BIC,...) ou visuellement.
Séries temporelles – Cours 1
Tendance, saisonnalité, résidus

Exemple : consommation effective annuelle, d=1


Consommation finale effective totale (en M)

30
20
5 10
0

1950 1960 1970 1980 1990 2000 2010

Année
4
Résidu du modèle

2
0
−2
−4

1950 1960 1970 1980 1990 2000 2010

Année
Séries temporelles – Cours 1
Tendance, saisonnalité, résidus

Exemple : consommation effective annuelle, d=2


Consommation finale effective totale (en M)

30
20
5 10
0

1950 1960 1970 1980 1990 2000 2010

Année
4
3
Résidu du modèle

2
1
0
−2 −1

1950 1960 1970 1980 1990 2000 2010

Année
Séries temporelles – Cours 1
Tendance, saisonnalité, résidus

Exemple : consommation effective annuelle, d=4


Consommation finale effective totale (en M)

30
20
5 10
0

1950 1960 1970 1980 1990 2000 2010

Année
3
Résidu du modèle

2
1
0
−1

1950 1960 1970 1980 1990 2000 2010

Année
Séries temporelles – Cours 1
Tendance, saisonnalité, résidus

Autres méthodes

I Moyenne mobile :
q
1 X
m
bt = xt+k .
2q + 1
k=−q

I Autres méthodes de statistique non-paramétrique : noyau,


polynômes locaux,...
Séries temporelles – Cours 1
Tendance, saisonnalité, résidus

Exemple : consommation effective annuelle


Estimation de la tendance par moyenne mobile (q = 2)
MA <- filter(Total.ts,filter=rep(1/3,3))
par(mfrow=c(2,1))
plot(Total.ts,xlab=’Année’,ylab=’Consommation finale effective totale (en M)’)
points(MA,col=’red’,type=’l’)
plot(Total.ts-MA,xlab=’Année’,ylab=’Résidu du modèle’,pch=3,type=’p’)
Consommation finale effective totale (en M)

30
20
10
5
0

1950 1960 1970 1980 1990 2000 2010

Année
0.5
Résidu du modèle

0.0
-0.5

1950 1960 1970 1980 1990 2000 2010

Année
Séries temporelles – Cours 1
Tendance, saisonnalité, résidus

Estimation de la partie déterministe (tendance et


saisonnalité)
I Il existe un grand nombre de méthodes.
I Fonctions implémentées dans R :
I fonction decompose()
Pq : estime mt par moyenne mobile
1
(mb t = 2q+1 k=−q x t+k ) puis estime st à partir de xt − m
bt
(pour le modèle additif) par moyenne mobile également :
k
1 X
sbt = (xt+jT − m
b t+jT ),
k +1
j=0

où T est la période (estimée par la fonction) et k choisi le


plus grand possible.
I fonction stl() (plus élaboré) : estimation par maximum de
vraisemblance dans un modèle additif.
Séries temporelles – Cours 1
Tendance, saisonnalité, résidus

Exemple : nombre de passagers aériens


Estimation par la fonction decompose() (modèle additif par défaut)
fit.decompose <- decompose(AirPassengers)
plot(fit.decompose)

Decomposition of additive time series


600
500
observed
400
300
200
450 100
350
trend
250
150
60
40
seasonal
20
0
−40
60
40
random
20
0
−20
−40

1950 1952 1954 1956 1958 1960

Time
Séries temporelles – Cours 1
Tendance, saisonnalité, résidus

Exemple : nombre de passagers aériens


Estimation par la fonction stl()
fit.stl <- stl(AirPassengers,s.window=12)
plot(fit.stl)
600
500
400
data
300
200
100

100
50
seasonal

0
−50
500
400
trend
300
200

40
remainder

20
0
−20
1950 1952 1954 1956 1958 1960

time
Séries temporelles – Cours 1
Tendance, saisonnalité, résidus

Exemple : nombre de passagers aériens


Estimation par la fonction decompose() (modèle multiplicatif)
fit.decompose2 <- decompose(AirPassengers,type=’multiplicative’)
plot(fit.decompose2)

Decomposition of multiplicative time series


600
500
observed
400
300
200
450 100
350
trend
250
150
1.2
1.1
seasonal
1.0
0.9
0.8
1.10
1.05
random
1.00
0.95
0.90

1950 1952 1954 1956 1958 1960

Time
Séries temporelles – Cours 1
Remarques complémentaires et déroulement du cours

Plan

Qu’est-ce qu’une série temporelle ? Exemples

Représentations graphiques

Tendance, saisonnalité, résidus

Remarques complémentaires et déroulement du cours


Séries temporelles – Cours 1
Remarques complémentaires et déroulement du cours

Étapes et objectifs de l’analyse d’une série temporelle


1. Décrire, préparer :
I Corriger la série des effets systématiques (prise en compte des
jours ouvrables, grèves, pannes,...), imputation des données
manquantes (fonction na.approx() du package zoo par
exemple),...
I Représentations graphiques : chronogramme, lag-plot,
month-plot,... Permet de détecter les valeurs atypiques,
anomalies,... que l’on peut traiter éventuellement comme des
données manquantes.

2. Modéliser : expliquer la valeur en un instant par des modèles


ayant peu de paramètres.

3. Prévoir : à partir d’un modèle ou construites à partir des


données (lissage exponentiel par exemple).
Séries temporelles – Cours 1
Remarques complémentaires et déroulement du cours

Remarques

I Le choix d’un modèle, l’incorporation d’une composante


peuvent s’apprécier d’après le graphique et tirer leur validation
de l’analyse.

I Une même série peut-être analysée de différentes façons. Rien


n’interdit de superposer plusieurs approches car
I On étudie une seule réalisation d’un même processus sur un
intervalle de temps fini (caractéristiques à long terme
éventuellement non visible).
I Une série n’est pas nécessairement modélisée par un modèle de
notre catalogue.
Box (1978) "All models are wrong but some are useful."
Séries temporelles – Cours 1
Remarques complémentaires et déroulement du cours

Déroulement du cours

I Cours 1 (20 septembre) : introduction, représentations


graphiques, tendance, saisonnalité.

I Cours 2 (18 octobre) : processus stationnaires, modèles


ARMA.

I Cours 3 (15 novembre) : lissage exponentiel.

I Cours 4 (13 décembre) : modèles non stationnaires (modèles


ARIMA et SARIMA, tests de non-stationnarité).
Séries temporelles – Cours 1
Remarques complémentaires et déroulement du cours

Quelques références

I Aragon, Y. Séries temporelles avec R.

I Site web de Arthur Charpentier :


freakonometrics.hypotheses.org.

I Brockwell, P. et Davis, R. Time Series : Theory and Methods.

I Brockwell, P. et Davis, R. Introduction to time series and


forecasting.

I Box, G. et Jenkins, G. Time Series analysis – forecasting and


control.

Vous aimerez peut-être aussi