Vous êtes sur la page 1sur 37

Analyse de séries

chronologiques

Khalid EL HIMDI

(c) K. EL HIMDI 1
1. Introduction
L’analyse des séries chronologiques est cette partie de la statistique qui a
pour but de caractériser la dépendance pouvant exister dans une série
d’observations. La plupart des techniques statistiques étudiées dans vos
cours antérieurs faisaient appel à l’indépendance des observations.
Cependant, lorsqu’on observe un phénomène dans le temps, on s’attend
en général à ce que des observations suffisamment rapprochées soient
liées entre elles. Dans une telle situation, nous ne pouvons par
conséquent appliquer des techniques statistiques faisant appel à
l’indépendance.
L’approche que nous allons considérer dans ce cours consiste à
caractériser la dépendance via un modèle et une fois que nous aurons
ajusté un modèle satisfaisant à une série chronologique, nous verrons
qu’en plus de nous permettre de mieux comprendre le phénomène étudié,
il nous servira entre autre à prédire les valeurs futures de la série.

(c) K. EL HIMDI 2
1. Introduction
L’analyse des séries chronologiques a pour but de
caractériser la dépendance via un modèle pour :
§ mieux comprendre le phénomène étudié,
§ prédire les valeurs futures de la série.

(c) K. EL HIMDI 3
1. Introduction
Les séries chronologique apparaissent dans plusieurs domaines.
§ Agriculture : production annuelle et prix .
§ Biologie et médecine : signal d’électroencéphalogramme (EEG),
d’électrocardiogramme (ECG), courbe de croissance.
§ Génie : demande horaire d’électricité dans un réseau, nombre de pannes
annuelles.
§ Economie et affaires : taux d’intérêt hebdomadaires, valeurs journalières
d’actions à la fermeture de la bourse, taux d’inflation mensuel, ventes
trimestrielles d’un magasin.
§ Météorologie : température journalière, vitesse des vents, indice de qualité de
l’air, concentration journalière moyenne d’un polluant.
§ Sciences sociales : taux de mortalité, taux de natalité, nombre d’accidents
hebdomadaires.
(c) K. EL HIMDI 4
1. Introduction
Les séries chronologiques comme les mesures EEG et ECG qui
peuvent être obtenues de façon continue dans le temps sont dites
continues.
Par contre, le volume de vente, le nombre d’accidents observés
sur différents intervalles de temps sont dits séries
chronologiques discrètes.
Dans ce cours, nous nous limitons aux séries chronologiques
discrètes dont les observations sont équidistantes dans le temps.
Notons qu’une série chronologique discrète peut être obtenue à
partir d’une série chronologique continue en échantillonnant
cette dernière à intervalles réguliers.

(c) K. EL HIMDI 5
1. Introduction
Les méthodes de prévision s’appuient sur
l’analyse de séries chronologiques, lorsque
celles-ci sont disponibles, de longueur
suffisante, de bonne qualité et pertinentes.

Qu’est-ce qu’une série chronologique ?


Ensemble d’observations qui se distinguent par le rôle particulier
que joue l’ordre (la chronologie) dans lequel elles ont été
recueillies: ce sont des observations effectuées à intervalle fixé h, au
temps t0, t0+h,…, t0+(T-1)h .
Une série chronologique obéit au schéma suivant:

(c) K. EL HIMDI 6
2. Démarche de base en SC
Quel que soit l’objectif de l’étude, il faut commencer par l’exploration de la
série.

On examine donc différents types de graphiques :

§ Chronogramme : diagramme des points (date, valeur d’observation).

§ Lag plot : permet de visualiser la dépendance entre une série et la même à des
dates antérieures,

§ month plot : aide à comprendre la saisonnalité d’une série.

§ ….

Ces graphiques permettent de comprendre la structure d’une série temporelle


(nature de la tendance, aspects saisonniers, ou encore l’existence d’une
autocorrélation dans la série) et de guider sa modélisation éventuelle.

(c) K. EL HIMDI 7
2. Démarche de base en SC
Chronogramme :
diagramme des points d’abscisse la date et d’ordonnée la valeur d’observation.

plot.ts(LakeHuron,las=1,ylab="niveau",xlab="année",type = "b",main = "Niveau du lac Huron")


(c) K. EL HIMDI 8
2.1 Exemples de séries temporelles
Exemple 1 :
§ Croissance du niveau moyen
The classic Box & Jenkins airline data. Monthly totals of qui s’accélère à partir de 1956
international airline passengers, 1949 to 1960. + augmentation de la
variabilité

§ Comparaison des mois entre


eux: utiliser month plot

(c) K. EL HIMDI 9
2.1 Exemples de séries temporelles
Exemple 2. : Lac Huron
Mesures annuelle en pieds du niveau du lac Huron de 1875 à 1972,

(c) K. EL HIMDI 10
2.1 Exemples de séries temporelles
Exemple 2. : Lac Huron

(c) K. EL HIMDI 11
2.1 Exemples de séries temporelles
Exemple 2. : Lac Huron

(c) K. EL HIMDI 12
2.1 Exemples de séries temporelles
Exemple 2. : Lac Huron

(c) K. EL HIMDI 13
2.1 Exemples de séries temporelles
Exemple 2. : Lac Huron

(c) K. EL HIMDI 14
2.2 Graphiques pour SC
Lag plot
plot.ts(nottem,las=1,ylab="Température",xlab="année")
lag.plot(nottem,12,layout=c(4,3),do.lines=FALSE,diag.col="red",col.main="blue")

(c) K. EL HIMDI 15
2.2 Graphiques pour SC
Lag plot
SARMA(0,1)(1,0)12 simulé :

(c) K. EL HIMDI 16
2.2 Graphiques pour SC
Lag plot

(c) K. EL HIMDI 17
2.2 Graphiques pour SC
Month plot

Effet saisonnier

Absence d’effet saisonnier

(c) K. EL HIMDI 18
2.2 Graphiques pour SC
Month plot
ts.plot(matrix(nottem,12,20))

Absence d’effet saisonnier

(c) K. EL HIMDI 19
2.3 Tendance, saisonnalité, résidus

(c) K. EL HIMDI 20
2.3 Tendance, saisonnalité, résidus

En général, une série chronologique s’étudie à l’aide


de trois composantes :

T (Tendance)
fonction déterministe variant
lentement dans le temps
S (Saisonnier)
fonction périodique de
période donnée
E (résidu)
doit être de moyenne
nulle et non corrélé
(c) K. EL HIMDI 21
2.3 Tendance, saisonnalité, résidus

1- La tendance T:
Evolution « moyenne » à long terme

2- La composante saisonnière S :
période généralement dépendante de la saison (hiver,
printemps, été,…), du mode d’organisation de la société
(fêtes, jours fériés, …), etc.

3-Composante résiduelle E :
Regroupe tout ce qui n’est pas pris en compte par les
composantes précédentes.

(c) K. EL HIMDI 22
2.3 Tendance, saisonnalité, résidus
Modèles de décomposition

2 modèles

Multiplicatif Additif
Xt = Tt*St*Et Xt=Tt+St+Et

(c) K. EL HIMDI 23
2.3 Tendance, saisonnalité, résidus
But de l’analyse empirique

L’analyse descriptive d’une S.C. consiste à isoler (et estimer)


les composantes de la série observée, en particulier la tendance
et la composante saisonnière.

Dans R, on peut obtenir des décompositions de série par les


fonctions : decompose( ) et stl( ). La fonction decompose( ) est
une approche très rudimentaire et la fonction stl( ), décrite dans
la référence de son aide en ligne, est basée sur la régression sur
polynômes locaux. Les packages pastecs et mFilter offrent
également de nombreuses possibilités.

(c) K. EL HIMDI 24
2.3 Tendance, saisonnalité, résidus
m=decompose(nottem)
plot(m)

(c) K. EL HIMDI 25
2.4 Etapes et objectifs de l’analyse d’une SC

(c) K. EL HIMDI 26
2.4 Etapes et objectifs de l’analyse d’une SC

(c) K. EL HIMDI 27
2.4 Etapes et objectifs de l’analyse d’une SC

(c) K. EL HIMDI 28
2.4 Etapes et objectifs de l’analyse d’une SC

(c) K. EL HIMDI 29
2.4 Etapes et objectifs de l’analyse d’une SC
La prévision
Notons h, l’horizon de prévision et N l’origine de la prévision.
On s’intéresse à la valeur future inconnue YN+h.
On distingue 2 formes de prévisions:

1. La prévision ponctuelle notée ŶN(h):


c’est une valeur unique qui représente la meilleure estimation
de YN+h sur la base des données disponibles.
2. L’intervalle de prévision : [ŶN, inf(h), ŶN, sup(h)] ∍ YN+h.
Il s’agit d’un intervalle de valeurs possibles de la variable dans
lequel la valeur future YN+h devrait se trouver avec une
probabilité donnée:
Prob([ŶN, inf(h), ŶN, sup(h)] ∍ YN+h) = 0.95 ou 0.90.
(c) K. EL HIMDI 30
2.4 Etapes et objectifs de l’analyse d’une SC
Cadre conceptuel de prévision

Théorie et/ou
Autres études

Non
Non
Spécification Estimation Vérification
Le modèle est-il Génération Le modèle
de modèle de modèle de prévisions
adéquat? Est-il stable?
Oui

Nouvelles
Données Données Oui

Mise à jour
de prévisions

Phase de construction de modèle Phase de prévision


(c) K. EL HIMDI 31
2.4 Etapes et objectifs de l’analyse d’une SC
Cadre conceptuel de prévision
1-L’évaluation basée sur l’analyse statistique des erreurs:
Erreur = Série_Actuelle – Prévision (at = Yt - Ft; Ft=Ŷt-1(1))
2- Validation par échantillon test :
• Construction du modèle : utiliser Y1,…,YN-m (N-m obs.);
• Pour valider utiliser YN-m+1,…,YN (m observations) .

Instant t 1 2 3 ….. N-m N-m+1 … N N+1 N+2 …



Série Yt Y1 Y2 Y3 YN-m YN-m+1 YN ? ?
Ajustés F1 F2 F3 FN-m
Tests FN-m+1 FN
Prévision FN+1 FN+2 ….
Résidus at a1 a2 a3 aN-m aN-m+1 ….. aN ? ?

F1, F2,…,FN-m : ajustement ou simulations


(c) K. EL HIMDI FN-m+1, …, FN : Prévisions ex post; FN+1, FN+2 … Prévisions ex ante 32
2.4 Etapes et objectifs de l’analyse d’une SC
Erreur de prévision

§ MAD = Mean Absolute Deviation


M

∑| Y
i =1
t − Ft |
, M = N ou m
MAD =
M
§ Error Ratio = Erreur Absolue/Valeur Actulelle

1 M
Yt − Ft
MAPE = ∑ , M = N ou m
M t =1 Yt

§ Variance de l’erreur

(c) K. EL HIMDI 33
2.4 Etapes et objectifs de l’analyse d’une SC
Erreur de prévision

(c) K. EL HIMDI 34
2.4 Etapes et objectifs de l’analyse d’une SC
Cadre conceptuel de prévision

(c) K. EL HIMDI 35
1. Introduction
Objectifs du cours
Le cours est conçu par étapes et doit conduire l’étudiant(e) à la compréhension des modèles de SC ainsi qu’à leur analyse détaillée. Les
étapes du cours sont les suivantes:
Introduction : Illustration des différents types de séries chronologiques et description des principaux problèmes.
Stationnarité : Définition d’un processus stationnaire, ses principales propriétés et estimation de ses paramètres.
Processus ARMA : Définition et propriétés d’une classe de processus stationnaires utiles pour la modélisation de séries chronologiques.
Non-stationnarité : Différents types de non stationnarité et description de la classe des processus ARIMA.
Prévision : L’objectif ultime de l’analyse de plusieurs séries chronologiques est la prévision des valeurs futures à partir des valeurs
présentes et passées. Nous verrons comment les modèles ARMA et ARIMA permettent de résoudre ce problème.
Identification : Différentes techniques pour déterminer les ordres d’un modèle ARIMA susceptible de décrire la série à l’étude seront
décrites.
Estimation et validation : Description des méthodes d’estimation des paramètres d’un modèle ARMA et validation du modèle estimé par
une analyse des résidus.
Saisonnalité : Un fort pourcentage des séries réelles exhibent une fluctuation saisonnière. Nous verrons comment les modèles ARIMA
permettent d’aborder cette question.
Analyse d’intervention et données aberrantes : Définition du modèle d’intervention et son utilisation pour le traitement des données
aberrantes.
Format du cours :
Le cours se compose des éléments suivants :
- Des leçons théoriques où les aspects formels seront mis en valeur.
- Des travaux dirigés et devoirs compléterons ces aspects théoriques.
- Des travaux pratiques ayant pour but de familiariser les étudiants(es) avec la théorie et la pratique des séries chronologiques. Pour ce
faire, nous utiliserons le logiciel
Format du cours

Le cours se compose des éléments suivants :


- Des leçons théoriques où les aspects formels seront mis en valeur : 1 séance de 2:30 par semaine
- Des lectures détaillées du livre de référence (Wei) et des devoirs compléterons ces aspects
théoriques.
- Des travaux pratiques à réaliser individuellement ayant pour but de familiariser les étudiants avec
la théorie et la pratique des séries chronologiques.
- Pour ce faire, nous utiliserons le logiciel libre R (ou le logiciel SPSS). La maitrise de l’un et/ou
l’autre de ces deux logiciels est requise.
Références :
Wei, W.W.S (1990) Time Series Analysis, Univariate and Multivariate Methods, Addison-Wesley.
Brockwell, P.J. & Davis, R.A. (1991) Time Series: Theory and Methods, Springer-Verlag.
Yves Aragon (2011) Séries Temporelles avec R. Méthodes et cas. Springer-Verlag.

Vous aimerez peut-être aussi