Vous êtes sur la page 1sur 103

Pratique de l’économétrie

des séries
chronologiques
à travers des exemples
Plan du cours
› Définition et présentation d’une série chronologique
› Étude des composantes d’une série chronologique
› Élimination des variations
› Analyse des composantes stochastique d’une série
› Étude des caractéristiques statistiques (stationnarité)
› Présentation de modèles (AR, MA, ARMA)
› Présentation de la méthodologie Box Jenkins
Présentation
› Une série est une suite d’observation ordonnées en fonction du temps

› Exemple :
 Effectif annuel de la population
 Chiffre d’affaire annuel de la production intérieur brute
 Niveau mensuel de l’indice des prix
 CA mensuel d’une entreprise
 Nombre de salariés d’un établissement à la fin de chaque mois
 ….
Présentation
Le champ d’application de l’économétrie dans la finance

› Déterminer le prix du risque.


› Estimer empiriquement le risque.
› Appréhender empiriquement le degré d’efficience du marché.
› Mesurer la performance du portefeuille.
› Analyser de la volatilité.
Présentation
Pour élaborer une étude d’une série chronologique :
1. Analyse statistique :
› Présentation graphique (Stat descriptives)
› Élimination des composantes (trend, saison, cycle,..)
2. Étude des les caractéristiques stochastiques (E(x) et V(x))
› Analyser et modéliser les processus générateur des données
› Étude de la stationnarité
› Estimer
› Prévoir
Présentation
Définition :
La périodicité des observations:
 Mensuelle
 Trimestrielle
 Annuelle
 Hebdomadaire
 Journalière
 Horaire
 …..
Présentation
Prérequis du cours:
› Statistiques, probabilité, et techniques quantitatives

Il faut associer une manipulation exacte des logiciels d’économétrie.


› Eviews, R, STATA, SPSS, MATLAB, …
Présentation
› Historiquement se sont les astronomes qui les premiers ont travaillé
sur les séries chronologiques. La reproduction ci-après est tiré d’un
manuscrit du dixième siècle, représentant l’inclinaison des orbites des
planètes en fonction du temps.
Présentation
Rappels:
› Une chronique est une suite finie de valeurs numériques représentant
l’évolution d’une variable aléatoire indexé par le temps.

› L’objet des séries temporelles est donc l’étude des processus


temporels.

› Le grand objectif de l’étude des séries chronologique est la


modélisation des processus afin de faire des prévisions.
Présentation
Nous allons pour cela appliquer quatre étapes importantes :

› Présenter la série chronologique.


› Modélisation de la série chronologique
› Calcul des trois composantes de la chronique
› Faire de prévisions
Présentation
En effet, le traitement des séries temporelles peut avoir plusieurs
objectifs:

› Isoler et estimer une tendance,


› Isoler et estimer une composante saisonnière, et désaisonnaliser la
série,
› Réaliser une prévision pour des valeurs inconnues manquantes, futures
ou passées,
› Construire un modèle explicatif en termes de causalité,
› Déterminer la durée d’un cycle.
Schéma d’analyse et composantes d’une série
Les composantes d’une série chronologique :
› La composante tendancielle ou tendance (trend) LT
› La composante saisonnière (saison)
› La composante aléatoire (erreur)
Les modèles de composition
› Schéma additif 𝑌𝑡 = 𝑆𝑡 + 𝐶𝑡 + 𝜀𝑡
› Schéma multiplicatif 𝑌𝑡 = 𝑆𝑡 × 𝐶𝑡 + 𝜀𝑡
› Schéma multiplicatif deuxième type 𝑌𝑡 = 𝑆𝑡 × 𝐶𝑡 × 𝜀𝑡
Schéma d’analyse

Le modèle additif : est plus approprié dans


le cas de séries dont la composante
saisonnière est constante dans le temps

Le modèle multiplicatif :
convient plus aux séries comportant une
partie saisonnière qui décroit ou croit dans
le temps
Schéma d’analyse
1er trimestre 2e trimestre 3e trimestre 4e trimestre
› Exemple : Soit la série Année 1 89,658 97,593 108,906 114,157
chronologique suivante Année 2 96,205 99,399 112,763 119,185
observée trimestriellement Année3 99,602 105,192 116,556 121,911
Année 4 103,272 109,644 121,208 126,508
pendant 6 ans: Année 5 105,637 113,428 125,641 131,147
Année 6 111,118 117,215 129,776 133
133

128

123

118

113

108

103

98 Le modèle additif
93

88
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Schéma d’analyse 1er trimestre 2e trimestre 3e trimestre 4e trimestre
Année 1 224,3705 253,2811 201,2421 248,9411
› Exemple : Soit la série Année 2 274,3802 300,1641 248,9038 298,4386
Année3 331,9657 371,4032 303,4313 365,9029
chronologique suivante Année 4 406,6326 437,9967 361,5774 444,8447
observée trimestriellement Année 5 488,4166 536,5268 435,5698 549,3614
pendant 6 ans: Année 6 598,0016 659,2896 533,2156 669,2675

651

601

551

501

451

401

351
Le modèle multiplicatif
301

251

201
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Les composantes d’une série chronologique
La tendance est un lieu géométrique simple qui peut être une droite ou
une courbe.

La détection du Trend se fait en utilisant la :


› Première méthode : On constate à partir de l’analyse graphique que la
série chronologique est oscille autour d’une droite, on conclut donc
que le trend est une droite.

› Deuxième méthode : On constate sur le dessin que les pics des


maxima et des minima peuvent s’ajuster sur une droite : donc le trend
est une droite.
Exemple illustratif

Soit la série chronologique sui correspond aux ventes enregistrés


pendant la période 2006-2009, les données sont trimestrielles (en
Milliers de DHS) sont présentées dans le tableau suivant :
Exemple illustratif
La représentation graphique de la série chronologique
45 Yt
𝑌𝑡 1≤𝑡≤𝑛 ;𝑛=16
40
C’est un modèle ou
35
un schéma
30 multiplicatif, car
25 on peut remarquer
20
que le deux droites
délimitant les
15
maxima et les
10 minima se croisent
5
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Traitons le cas où le Trend est une Droite
1. Détermination du Trend
Maintenant pour déterminer le trend, on devra le calculer par la méthode des
Moindres carrés ordinaires (MCO). Nous allons calculer la droite de trend
qui prend la forme suivante : 𝐶𝑡 = 𝑎𝑡𝑖 + 𝑏 + 𝜀𝑡
𝑐𝑜𝑣 𝑡, 𝐶𝑡
𝑎=
Avec 𝑣𝑎𝑟 𝑡
𝑏 =𝐶−𝑎×𝑡
Notre équation estimée prend la forme de : 𝐶𝑡 = 𝑎𝑡𝑖 + 𝑏

D’où: 𝐶𝑡 = 0,4647𝑡𝑖 + 20,425


Traitons le cas où le Trend est une Droite
1. Détermination du Trend
𝑌𝑡 𝐶𝑡
30 20,8897059 45

11 21,3544118 40
12 21,8191176
36 22,2838235 35

32 22,7485294 30
12 23,2132353
25
13 23,6779412
37 24,1426471 20
33 24,6073529
15
13 25,0720588
15 25,5367647 10
39 26,0014706
5
35 26,4661765
14 26,9308824 0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
17 27,3955882
41 27,8602941
Traitons le cas où le Trend est une Droite
2. Détermination des composantes saisonnières
› Remarque :
Nous disposons des données trimestrielles

› Nous avons quatre saisons en référence à une année. On les appelle,


les coefficients saisonniers et ils sont obtenus grâce à la formule
suivante :

1 𝑌𝑡
𝑠𝑖 =
𝑐𝑎𝑟𝑑 𝑇𝑖 𝐶𝑡
Traitons le cas où le Trend est une Droite
2. Détermination des composantes saisonnières
› Par exemple pour le calcul du coefficient saisonnier relatif à la
deuxième saison : 1 𝑌𝑡
𝑆2 = 𝑠 =2
𝑐𝑎𝑟𝑑 𝑇2 𝐶𝑡
› Pour les coefficients saisonniers nous avons quatre :
𝑇1 = 1;5; 9; 13
𝑇2 = 2;6; 10; 14
𝑇3 = 3;7; 11; 15
𝑇4 = 4;8; 12; 16
Donc nous avons :
𝑆𝑡 = 𝑠 2 ; 𝑡𝜖𝑇𝑖
Traitons le cas où le Trend est une Droite
2. Détermination des composantes saisonnières
› Exemple de calcul du coefficient saisonnier relatif à la deuxième
saison : 2
1 𝑌𝑡
𝑆2 = 𝑠 =
𝑐𝑎𝑟𝑑 𝑇2 𝐶𝑡
1 𝑌2 𝑌6 𝑌10 𝑌14
𝐶2 = 0,4647 × 2 + 20,425 = 21,3544118 = + + +
4 𝐶2 𝐶6 𝐶10 𝐶14
𝐶6 = 0,4647 × 6 + 20,425 = 23, 2132353
𝐶10 = 0,4647 × 10 + 20,425 = 25,0720588 𝐶𝑡 = 0,4647𝑡𝑖 + 20,425
𝐶14 = 0,4647 × 14 + 20,425 = 26,9308824

1 11 12 13 14
𝑆2 = 𝑠 2 = 0,52 = + + +
4 21,354 23,213 25,072 26,931
Traitons le cas où le Trend est une Droite
2. Détermination des composantes saisonnières
› Bien sur 𝑆14 = 𝑆10 = 𝑆6 = 𝑆2 = 𝑠 2 = 0,52
De la même manière 𝑆1 = 𝑆5 = 𝑆9 = 𝑆13 = 𝑠1 = 1,38
nous pouvons calculer
𝑆3 = 𝑆7 = 𝑆11 = 𝑆15 = 𝑠 3 = 0,58
les autres coefficients
𝑆4 = 𝑆8 = 𝑆12 = 𝑆16 = 𝑠 4 = 1,53
saisonniers
La détermination de la variable « vente » corrigée des variations
saisonnières s’effectue à partir de la relation suivante :
𝑌𝑡 Par exemple pour 𝑡 = 14
𝑌𝑐𝑣𝑠,𝑡 = ; 1≤𝑡≤𝑛
𝑆𝑡 𝑌14 14
𝑌𝑐𝑣𝑠,14 = = = 27,05
𝑆14 0,52
Traitons le cas où le Trend est une Droite
3. Détermination de la composante aléatoire
› Le Schéma retenu est un schéma multiplicatif 𝑌𝑡 = 𝑆𝑡 × 𝐶𝑡 + 𝜀𝑡

› La troisième composante est la composante aléatoire 𝜀𝑡 = 𝑌𝑡 − 𝑆𝑡 × 𝐶𝑡


Par exemple pour 𝑡 = 14

𝜀14 = 𝑌14 − 𝑆14 × 𝐶14

𝜀14 = 14 − 0,52 × 26,931 = 0,06


𝑌𝑡 𝐶𝑡 𝑆𝑡 𝜀𝑡 𝑌𝑐𝑣𝑠,𝑡
2006 1 30 20,8897059 1,38 1,24 21,7932045
2 11 21,3544118 0,52 -0,05 21,2517546
3 12 21,8191176 0,58 -0,58 20,8068107
4 36 22,2838235 1,53 1,91 23,5308615
2007 5 32 22,7485294 1,38 0,68 23,2460848
6 12 23,2132353 0,52 -0,02 23,1837323
7 13 23,6779412 0,58 -0,66 22,5407116
8 37 24,1426471 1,53 0,06 24,1844965
2008 9 33 24,6073529 1,38 -0,87 23,972525
10 13 25,0720588 0,52 0,02 25,11571
11 15 25,5367647 0,58 0,27 26,0085134
12 39 26,0014706 1,53 -0,78 25,4917666
2009 13 35 26,4661765 1,38 -1,43 25,4254053
14 14 26,9308824 0,52 0,06 27,0476877
15 17 27,3955882 0,58 1,20 29,4763152
16 41 27,8602941 1,53 -1,62 26,7990367
Traitons le cas où le Trend est une Droite
3. Détermination de la composante aléatoire
45 Yt Ct Yt cvs
40
35
30
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Traitons le cas où le Trend est une Courbe
1. Détermination de la composante saisonnière et le trend
› Nous proposant la méthode des moyennes mobiles
› Objectif : lisser et désaisonnaliser la série
› Définition : La méthode de lissage par la Moyenne Mobile est une
méthode non paramétrique qui permet de reproduire le plus
fidèlement possible la tendance, tout en éliminant le résidu.
L’avantage de cette méthode est qu’elle ne fait pas d’hypothèse sur la
tendance, qui peut avoir une forme quelconque.
› Mise en œuvre: On utilise de préférence des moyennes mobiles non-
pondérées d’ordre égal à la période.
Exemple d’ordre 7 pour des données journalières,
d’ordre 12 pour des données mensuelles.
Définition d’une moyenne mobile
› On appelle moyenne mobile de longueur 𝑝 la série 𝑌, l’opération
transformant celle-ci en une nouvelle série 𝑍 par le calcul des
moyennes successifs :
1
𝑧𝑡 = 𝑧𝑙+ 𝑝+1 /2 = 𝑦𝑙+1 + 𝑦𝑙+2 +…+𝑦𝑙+𝑝
𝑝
1 𝑝
= 𝑖=1 𝑦𝑙+𝑝 𝑙 = 0, 1 , … 𝑇 − 𝑝
𝑝
› Si 𝑝 est impair : le problème ne se pose pas
› Si 𝑝 est pair : moyenne mobile pondérée.
Exemple illustratif
› Prenons comme exemple les données suivantes, où est enregistré dans
le tableau qui suit les variations de l’indice des prix d’une marchandise
de 1980 jusqu’au 1987.
1980 1981 1982 1983 1984 1985 1986 1987
Trimestre1 295 324,7 372,9 354 333,7 323,2 304,3 312,5
Trimestre2 317,5 323,7 380,9 345,7 323,9 342,9 285,9 336,1
Trimestre3 314,9 322,5 353 319,5 312,8 300,2 292,3 295,5
Trimestre4 321,4 332,9 348,9 317,6 310,2 309,8 298,7 318,4

› Nous avons des observations périodiques faisant référence au trimestre,


donc nous avons quatre trimestres 𝑚 = 4 (qui représente un chiffre
pair).
› on utilise une moyenne mobile d’ordre impaire accordant un demi-poids
aux deux extrémités
IP MM MMC
1980 Trimestre1 295 312,2=1/4*(295+317,5+314,9+321,4)
Trimestre2 317,5
312,2
Trimestre3 314,9 315,9
319,6
Trimestre4 321,4 320,4
321,2
1981 Trimestre1 324,7 322,1
323,1
Trimestre2 323,7 324,5 322,1=1/2(321,2+323,1)
326,0
Trimestre3 322,5 332,0
338,0
Trimestre4 332,9 345,2 Chaque trimestre est affecté du même
352,3 poids, mais cette méthode
1982 Trimestre1 372,9 356,1
359,9 est moins avantageuse car la moyenne
Trimestre2 380,9 361,9 mobile est plus étendue. Donc, plus
363,9
Trimestre3 353 361,6 des données seront « perdues » aux
359,2
Trimestre4 348,9 354,8 extrémités de la série.
350,4
1983 Trimestre1 354 346,2
342,0
Trimestre2 345,7 338,1
334,2
Trimestre3 319,5 331,7
329,1
Trimestre4 317,6 326,4
323,7
1984 Trimestre1 333,7 322,8
322,0
Trimestre2 323,9 321,1
320,2
Trimestre3 312,8 318,8
317,5
Trimestre4 310,2 319,9
322,3
1985 Trimestre1 323,2 320,7
319,1
Trimestre2 342,9 319,1
319,0
Trimestre3 300,2 316,7
314,3
Trimestre4 309,8 307,2
300,1
1986 Trimestre1 304,3 299,1
298,1
Trimestre2 285,9 296,7
295,3
Trimestre3 292,3 296,3
297,4
Trimestre4 298,7 303,6
309,9
1987 Trimestre1 312,5 310,3
310,7
Trimestre2 336,1 313,2
315,6
Trimestre3 295,5
Trimestre4 318,4
Exemple illustratif
390

370

350

330

310

290

270

250
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
Exemple numérique :
traitement d’une série ayant une saisonnalité additive.
› Soit la série suivante, représentant l’évolution mensuelle des
entrées de touristes au Maroc de 1999 à 2001
Représentation graphique :
350 1999 2000 2001
JANVIER 120 143 144
300 FÉVRIER 151 170 193
MARS 191 211 228
250 AVRIL 199 254 270
MAI 172 182 209
200 JUIN 184 187 196
JUILLET 291 303 310
150 AOÛT 256 262 251
SEPTEMBRE 192 196 184
100
OCTOBRE 205 211 162
MAI

MAI

MAI
JUIN

JUIN

JUIN
AVRIL

AVRIL

AVRIL
FÉVRIER
MARS

AOÛT

FÉVRIER
MARS

AOÛT

FÉVRIER
MARS

AOÛT
JANVIER

OCTOBRE

JANVIER

OCTOBRE

JANVIER

OCTOBRE
JUILLET

JUILLET

JUILLET
NOVEMBRE

NOVEMBRE

NOVEMBRE
SEPTEMBRE

SEPTEMBRE

SEPTEMBRE
DÉCEMBRE

DÉCEMBRE

DÉCEMBRE NOVEMBRE 165 164 102


DÉCEMBRE 149 181 129
Exemple numérique :
traitement d’une série ayant une saisonnalité additive.
› Graphique des courbes superposées :
› Le graphe montre une évolution à dent de scie avec des valeurs extrême
haute (Juillet = vacances). Les données ne semblent pas présenter des
données anormales (sauf les attaques du 11/9).
300

› Pour visualiser la saisonnalité, on trace


250
le graphique des courbes superposées.
› L’amplitude constante montre qu’il 200

s’agit d’une saisonnalité additive.


150

100

1999 2000 2001


Exemple numérique :
traitement d’une série ayant une saisonnalité additive.
› Calcul de la moyenne mobile
› La calcul de la moyenne mobile sur 12 mois a été effectué sur
ordinateur 350

300

250

200

150

Yt MMC

NOVEM…

NOVEM…

NOVEM…
100

OCTOB…

OCTOB…

OCTOB…
SEPTE…

DÉCEM…

SEPTE…

DÉCEM…

SEPTE…
MARS

MARS

MARS
JUIN

JUIN

JUIN
MAI

MAI

MAI
JUILLET

JUILLET

JUILLET
AVRIL

AVRIL

AVRIL
AOÛT

AOÛT

AOÛT
JANVIER
FÉVRIER

JANVIER
FÉVRIER

JANVIER
FÉVRIER
Exemple numérique :
Traitement d’une série ayant une saisonnalité additive.
› Le calcul des coefficients saisonniers
› On calcul les différences à la moyenne mobile 𝑥𝑖𝑗 = 𝑦𝑖𝑗 − 𝑀12 𝑦𝑖𝑗 )
› On calcul la synthèse de ces écarts (deux cas soit le moyenne des
écarts, soit la valeur médiane des écarts) sont des premières
estimations des coefficients saisonniers : 𝑥𝑗 = 𝑆𝑗
› Puisque par définition la somme des coefficients saisonniers doit être
nulle.
› On calcul des estimations des coefficients saisonniers par correction
𝑒
proportionnelle des premières estimations 𝑆′𝑗 = 𝑆𝑗 −
12
Exemple numérique :
traitement d’une série ayant une saisonnalité additive.
› Etablissement de la série corrigée des variations saisonnières

› Les données corrigées sont obtenues en réduisant les données


brutes par le coefficient saisonnier du trimestre correspondant:
𝑦𝑐𝑣𝑠 = 𝑦𝑖𝑗 − 𝑆′𝑗

› Les calculs ont été réalisés sous Excel


La

graphique
représentation
300

250

200

150

100
JANVIER
FÉVRIER
MARS
AVRIL
MAI
Exemple numérique :

JUIN
1999 JUILLET
AOÛT
SEPTEMBRE
OCTOBRE
NOVEMBRE
DÉCEMBRE
JANVIER
FÉVRIER
MARS
AVRIL
MAI
JUIN
2000

JUILLET
AOÛT
SEPTEMBRE
OCTOBRE
NOVEMBRE
DÉCEMBRE
JANVIER
FÉVRIER
MARS
AVRIL
MAI
JUIN
2001

JUILLET
AOÛT
traitement d’une série ayant une saisonnalité additive.

SEPTEMBRE
Yt

OCTOBRE
NOVEMBRE
Ycvs

DÉCEMBRE
Yt
Exemple numérique :
traitement d’une série ayant une saisonnalité multiplicative
› Soit le tableau suivant de l’indice trimestriel de la production
industrielle, base 100 en 1962. 1 trimestre 2 trimestre 3 trimestre 4 trimestre
1962 110,3 102,9 88,4 107,3
Représentation graphique : 1963 101 109,8 94,1 116,1
1964 115,6 119,2 97,7 120,3
170
1965 115,1 119,5 101,1 127,4
1966 124,8 129 109,3 133,6
160 1967 129,4 131,8 110,2 136,4
150
1968 138,5 120,1 120,8 154,4
1969 149,5 157,1 130,8 166,5
140

130 La représentation graphique met en


120 évidence des variations saisonnières
110 importante, ne permet pas, telle quelle,
100 une analyse satisfaisante des tendances
90 d’évolution de la production industrielle:
80
1962 1963 1964 1965 1966 1967 1968 1969
la correction des variation saisonnières
apparaît ici indispensable.
Exemple numérique :
traitement d’une série ayant une saisonnalité multiplicative
› Graphique des courbes superposées : 170

Deux anomalies apparaissent: 160

150

Le 1er trimestre 1963 et le 2éme trimestre 140

1968 1969
130

1966
1968
120

1967 1964
110

1965

Pour le calcul de la moyenne mobile et 100 1963

les rapports saisonniers, ces données 90 1962

« anormales »ont été corrigées. 80


1 trimestre 2 trimestre 3 trimestre 4 trimestre 1 trimestre
Exemple numérique :
Traitement d’une série ayant une saisonnalité multiplicative
› Vue 3D
170

160

150

140

130

120

1969
110
1968

1967
100
1966

1965
90
1964

80 1963

1 trimestre
2 trimestre 1962
3 trimestre
4 trimestre
Exemple numérique :
Traitement d’une série ayant une saisonnalité multiplicative
Calcul de la moyenne mobile
› La calcul de la moyenne mobile sur 4 trimestres a été effectué sur
ordinateur 170 Moyenne mobile
160

150

140

130

120

110

100

90 Réel Prévision

80
1962 1963 1964 1965 1966 1967 1968 1969
Exemple numérique :
Traitement d’une série ayant une saisonnalité multiplicative
Le calcul des coefficients saisonniers
𝑦𝑖𝑗
› On calcul les rapports à la moyenne mobile 𝑟𝑖𝑗 =
𝑀4 𝑦𝑖𝑗

› On calcul la synthèse de ces rapports (deux cas soit le moyenne des


rapports, soit la valeur médiane des rapports) sont des premières
estimations des coefficients saisonniers : 𝑟𝑖𝑗 = 𝑆𝑗
› Puisque par définition la somme des coefficients saisonniers doit égale à
4 (nombre de trimestres).
› On calcul des estimations des coefficients saisonniers par correction
𝑆𝑗 ×4
proportionnelle des premières estimations 𝑆′𝑗 =
𝑒
Exemple numérique :
Traitement d’une série ayant une saisonnalité multiplicative
Etablissement de la série corrigée des variations saisonnières

› Les données corrigées sont obtenues en division les données brutes par
le coefficient saisonnier du trimestre correspondant:
𝑦𝑖𝑗
𝑦′𝑖𝑗 =
𝑆′𝑗

› Les calculs ont été réalisés sous Excel


La

graphique
représentation
160
170

150

140

130

120

110

100

90

80
1 trimestre
2 trimestre

1962
3 trimestre
Exemple numérique :

4 trimestre
1 trimestre
2 trimestre
1963

3 trimestre
4 trimestre
1 trimestre
2 trimestre
1964

3 trimestre
4 trimestre
1 trimestre
2 trimestre
1965

3 trimestre
4 trimestre
1 trimestre
2 trimestre
1966

3 trimestre
4 trimestre
1 trimestre
2 trimestre
1967

3 trimestre
4 trimestre
1 trimestre
2 trimestre
1968

3 trimestre
4 trimestre
1 trimestre
Série Brute

2 trimestre
1969

3 trimestre
Ycvs
Traitement d’une série ayant une saisonnalité multiplicative

4 trimestre
S…
Questions pour comprendre
› Soit : 𝑦𝑡 = 𝑐𝑡 1 + 𝑠𝑡 1 + 𝜀𝑡
Q? est ce que c’est un modèle additif ?
› Décomposer une série consiste a estimer, pour chaque date, les
valeurs de la composante Ct et de la composante St? Vrai / faux
› Il existe deux grandes catégories de méthodes de décomposition
utilisées:
Méthodes analytiques Vrai / faux
Méthodes empiriques Vrai / faux
Méthodes paramétriques Vrai / faux
Méthodes non paramétriques Vrai / faux
Questions pour comprendre
› Les hypothèses sur les composantes Ct et St de la méthode analytique/
paramétrique, sont : Vrai / faux
 Le mouvement saisonnier est une fonction périodique de période p
 Le mouvement conjoncturel est une fonction linéaire du temps.
› Parmi les avantages de la méthode analytique : Vrai / faux
 Elle jouit des fondements théoriques solides.
 Permet d’évaluer la variance de paramètres estimés.
 Applicable aux séries dont la tendance extra-saisonnière est
représentée par une fonction analytique : linéaire, exponentielle,
polynôme, etc.
Questions pour comprendre
› Les méthodes empiriques/non paramétriques ne supposent aucune
hypothèse sur l’allure du mouvement extra-saisonnier Vrai / faux

Pratique de l’économétrie
des séries
chronologiques
à travers des exemples
Présentation du Problème
› Introduction :

Pour présenter des concepts théoriques de l’analyse des séries


chronologiques, il est utile d’envisager à titre d’exemple plusieurs séries
temporelles macroéconomiques
TRIMESTRE PIB PDI PCE Profits Dividend TRIMESTRE PIB PDI PCE Profits Dividend
1970–I 2872,8 1990,6 1800,5 44,7 24,5 1981–I 3860,5 2783,7 2475,5 159,5 64
1970–II 2860,3 2020,1 1807,5 44,4 23,9 1981–Il 3844,4 2776,7 2476,1 143,7 68,4
1970–III 2896,6 2045,3 1824,7 44,9 23,3 1981–III 3864,5 2814,1 2487,4 147,6 71,9
1970–IV 2873,7 2045,2 1821,2 42,1 23,1 1981–IV 3803,1 2808,8 2468,6 140,3 72,4

Présentation du Problème 1971–I


1971–II
1971–III
2942,9
2947,4
2966
2073,9
2098
2106,6
1849,9
1863,5
1876,9
48,8
50,7
54,2
23,8
23,7
23,8
1982–I
1982–Il
1982–III
3756,1
3771,1
3754,4
2795
2824,8
2829
2484
2488,9
2502,5
114,4
114
114,6
70
68,4
69,2
1971–IV 2980,8 2121,1 1904,6 55,7 23,7 1982–IV 3759,6 2832,6 2539,3 109,9 72,5
1972–I 3037,3 2129,7 1929,3 59,4 25 1983–I 3783,5 2843,6 2556,5 113,6 77
1972–II 3089,7 2149,1 1963,3 60,1 25,5 1983–Il 3886,5 2867 2604 133 80,5
1972–III 3125,8 2193,9 1989,1 62,8 26,1 1983–III 3944,4 2903 2639 145,7 83,1
1972–IV 3175,5 2272 2032,1 68,3 26,5 1983–IV 4012,1 2960,6 2678,2 141,6 84,2
1973–I 3253,3 2300,7 2063,9 79,1 27 1984–I 4089,5 3033,2 2703,8 155,1 83,3
1973–II 3267,6 2315,2 2062 81,2 27,8 1984–Il 4144 3065,9 2741,1 152,6 82,2
1973–III 3264,3 2337,9 2073,7 81,3 28,3 1984–III 4166,4 3102,7 2754,6 141,8 81,7

Présentation des données : 1973–IV


1974–I
1974–II
3289,1
3259,4
3267,6
2382,7
2334,7
2304,5
2067,4
2050,8
2059
85
89
91,2
29,4
29,8
30,4
1984–IV
1985–I
1985–Il
4194,2
4221,8
4254,8
3118,5
3123,6
3189,6
2784,8
2824,9
2849,7
136,3
125,2
124,8
83,4
87,2
90,8
1974–III 3239,1 2315 2065,5 97,1 30,9 1985–III 4309 3156,5 2893,3 129,8 94,1
1974–IV 3226,4 2313,7 2039,9 86,8 30,5 1985–IV 4333,5 3178,7 2895,3 134,2 97,4
1975–I 3154 2282,5 2051,8 75,8 30 1986–I 4390,5 3227,5 2922,4 109,2 105,1
1975–II 3190,4 2390,3 2086,9 81 29,7 1986–Il 4387,7 3281,4 2947,9 106 110,7
1975–III 3249,9 2354,4 2114,4 97,8 30,1 1986–III 4412,6 3272,6 2993,7 111 112,3

Données macroéconomiques 1975–IV


1976–I
1976–II
3292,5
3356,7
3369,2
2389,4
2424,5
2434,9
2137
2179,3
2194,7
103,4
108,4
109,2
30,6
32,6
35
1986–IV
1987–I
1987–Il
4427,1
4460
4515,3
3266,2
3295,2
3241,7
3012,5
3011,5
3046,8
119,2
140,2
157,9
111
108
105,5

américaines trimestrielles. 1976–III


1976–IV
1977–I
3381
3416,3
3466,4
2444,7
2459,5
2463
2213
2242
2271,3
110
110,3
121,5
36,6
38,3
39,2
1987–III
1987–IV
1988–I
4559,3
4625,5
4655,3
3285,7
3335,8
3380,1
3075,8
3074,6
3128,2
169,1
176
195,5
105,1
106,3
109,6

Du 1970–I au 1991–IV 1977–II


1977–III
1977–IV
3525
3574,4
3567,2
2490,3
2541
2556,2
2280,8
2302,6
2331,6
129,7
135,1
134,8
40
41,4
42,4
1988–Il
1988–III
1988–IV
4704,8
4734,5
4779,7
3386,3
3407,5
3443,1
3147,8
3170,6
3202,9
207,2
213,4
226
113,3
117,5
121
1978–I 3591,8 2587,3 2347,1 137,5 43,5 1989–I 4809,8 3473,9 3200,9 221,3 124,6
1978–II 3707 2631,9 2394 154 44,5 1989–Il 4832,4 3450,9 3208,6 206,2 127,1
1978–III 3735,6 2653,2 2404,5 158 46,6 1989–III 4845,6 3466,9 3241,1 195,7 129,1
1978–IV 3779,6 2680,9 2421,6 167,8 48,9 1989–IV 4859,7 3493 3241,6 203 130,7
1979–I 3780,8 2699,2 2437,9 168,2 50,5 1990–1 4880,8 3531,4 3258,8 199,1 132,3
1979–II 3784,3 2697,6 2435,4 174,1 51,8 1990–Il 4900,3 3545,3 3258,6 193,7 132,5
1979–III 3807,5 2715,3 2454,7 178,1 52,7 1990–III 4903,3 3547 3281,2 196,3 133,8
1979–IV 3814,6 2728,1 2465,4 173,4 54,5 1990–IV 4855,1 3529,5 3251,8 199 136,2
1980–I 3830,8 2742,9 2464,6 174,3 57,6 1991–I 4824 3514,8 3241,1 189,7 137,8
1980–II 3732,6 2692 2414,2 144,5 58,7 1991–Il 4840,7 3537,4 3252,4 182,7 136,7
1980–III 3733,5 2722,5 2440,3 151 59,3 1991–III 4862,7 3539,9 3271,2 189,6 138,1
1980–IV 3808,5 2777 2469,2 154,6 60,5 1991–IV 4868 3547,5 3271,1 190,3 138,5
Présentation du Problème
› Avant de présenter les différents concepts relatifs à l’analyse des séries
chronologiques :
Exemple : soient les séries
› Le PIB
› Le Revenu Disponible des ménages (RDM)
› La consommation des Ménages (CM)
› Les profits (des sociétés après impôts )
› Les dividendes (nets des sociétés)
Données en milliards de 𝑈𝑆𝐷1987 pour la période 1970-1991
1500
2000
2500
3000
3500
4500
5000

4000
1970–I
1970–IV
1971–III
1972–II
PIB

1973–I
1973–IV
1974–III
1975–II
1976–I
RDM

1976–IV
1977–III
1978–II
1979–I
CM

1979–IV
1980–III
1981–Il
1982–I
1982–IV
1983–III
1984–Il
1985–I
1985–IV
1986–III
1987–Il
1988–I
1988–IV
1989–III
Présentation du Problème

1990–Il
1991–I
1991–IV
50

0
150
200
250

100

1970–I
1970–IV
1971–III
Il y a une tendance mais avec des fluctuations

1972–II
1973–I
1973–IV
1974–III
1975–II
1976–I
1976–IV
1977–III
1978–II
Q? qui a généré ces courbes? Et avec quel mécanisme?

1979–I
1979–IV
1980–III
1981–Il
1982–I
1982–IV
1983–III
1984–Il
1985–I
1985–IV
1986–III
1987–Il
PROFIT

1988–I
1988–IV
DIVIDENDE

1989–III
1990–Il
1991–I
1991–IV
Objectif fondamental
C’est Modéliser la partie aléatoire d’une série temporelle.
Dans la première partie du cours nous avons vu que :
𝑌𝑡 = 𝑆𝑡 × 𝐶𝑡 + 𝜀𝑡
Cette la partie aléatoire qui
nous intéresse

On aimerait maintenant aller plus loin et proposer un modèle capable de


reproduire le « comportement » des données de façon analogue

A partir de maintenant, la série résiduelle sera notée 𝑿 au lieu de 𝜺


Analyse des composantes stochastique d’une série
› Vocabulaire, et concepts :

1. Processus stochastiques 6. Modèles à processus aléatoires


2. Processus de stationnarité 7. Tendances déterministes et
3. Processus purement aléatoire stochastiques

4. Processus non stationnaires 8. Tests de racine unitaire

5. Variables non intégrées 9. Cointégration


Processus stochastique
Est une collection de variables aléatoire 𝑌𝑡 indexées dans le temps
𝑌 = 𝑌𝑡 = 𝑌1 , 𝑌2 , 𝑌3 , … 𝑌𝑇 est une réalisation du processus stochastique
𝑌𝑡 .
› Exemple : Dans quel sens pouvons-nous considérer le PIB comme un
processus stochastique?
› Considérons par exemple le PIB pour 1970-I (2,8728 trillions $). En
théorie, ce chiffre aurait pu être n'importe quel nombre, en fonction du
climat économique et politique qui prévalait. Ce chiffre est une
réalisation particulière de tous ces possibilités.
› Nous pouvons dire que le PIB est un processus stochastique et les
valeurs réelles sont des réalisations particulières de ce processus
Processus stochastique stationnaire
Définitions
1. La stationnarité est un concept clé pour la validité d’une régression
sur séries temporelles. D’un point de vue statistique, la stationnarité
suppose que le passé est comparable au présent et au futur. Ainsi, une
série chronologique est stationnaire, au sens strict, si sa distribution de
probabilité ne change pas au cours du temps.

2. Un processus est stationnaire si celui-ci n’a ni trend, ni saisonnalité


et de ce fait, fluctue autour d’une moyenne constante. Il apparait donc
que la stationnarité est une exigence qui assure l’utilisation du modèle
en dehors de la période sur laquelle il a été estimé.
Processus stochastique stationnaire
3. Un processus stochastique est dit stationnaire si sa moyenne et sa
variance sont constantes dans le temps et la valeur de la covariance entre
les deux périodes de temps ne dépend pas du temps auquel la covariance
est calculée.
› Un processus 𝑋𝑡 est dit stationnaire si :
1. Moyenne du processus est constante : 𝐸 𝑋𝑡 = µ
2. Variance est invariable dans le temps :𝑣𝑎𝑟 𝑋𝑡 = 𝐸 𝑋𝑡 − µ ² = 𝜎²
3. L’auto-covariance ne dépend que de la distance entre deux points
dans le temps et non d’une date particulière :
𝛾𝑠 = 𝐸[ 𝑋𝑡 − µ 𝑋𝑡−𝑠 − µ ]
Processus stochastique stationnaire
Exemple :
› Supposons que nous déplacions l’origine du 1970.I au 1975.I. le PIB est
dit stationnaire si la moyenne, la variance et la covariance doivent être
identiques.

› C’est-à-dire, elles ne varient pas dans le temps (pour divers retards /


échantillons).

› Si une série chronologique n’est pas stationnaire, (faible stationnarité)


elle représente une moyenne variable dans le temps, ou une variance
fluctuante dans le temps ou les deux.
Processus stochastique stationnaire

› Q? Pourquoi les séries temporelles stationnaires sont-elles aussi


importante ? (but prévisionnel : impossible de généraliser sur
d’autre périodes)

› Q? Comment savoir si une série est stationnaire ? (après examen des


tests de stationnarité; examen des graphiques)
Processus stochastique stationnaire : Bruit blanc
› Un type particulier de processus stochastiques stationnaires: processus
purement aléatoires ou processus bruit blanc.
Définition :
› Un processus est dit de bruit blanc si sa moyenne est nulle, sa variance
est constante, et si la covariance n’est pas corrélée sériellement.
Rappelons-le que le terme aléatoire du MC est supposé être un processus
de bruit blanc; noté 𝑢𝑡 ~ 𝑁𝐼𝐷 0, 𝜎²
C’est-à-dire, 𝑢𝑡 est distribué indépendamment et identiquement comme
une distribution normale avec une moyenne nulle et une variance
constante.
Processus stochastique non stationnaire
Définitions
› Ce sont des séries les plus rencontrées dans la pratique.
› Une chronique ne vérifiant pas les trois hypothèses de stationnarité, est
dite non stationnaire.
› Il faudra donc la stationnariser avant son estimation.
› La méthode de stationnarisation dépend de la source de non
stationnarité.
› Avant d’identifier cette source :
Processus stochastique non stationnaire
Exemple classique :
Le modèle de marche aléatoire (RWM).
Il est souvent dit que les prix des actifs, tels que les cours des actions ou
les taux de change, suivent une marche aléatoire; autrement dit, ils sont
non stationnaires.

› Nous distinguons deux types de marches aléatoires:


(1) Marche aléatoire sans dérive (pas de terme constant)
(2) Marche aléatoire avec dérive ( avec un terme constant)
Processus stochastique non stationnaire
Marche aléatoire sans dérive:
› Supposons que 𝑢𝑡 est un terme d'erreur bruit blanc. la série 𝑌𝑡 est dit
être une marche aléatoire sans dérive si 𝑌𝑡 = 𝑌𝑡−1 + 𝑢𝑡 .
Ce qui montre que la valeur de Y à l’instant 𝑡 est égale à sa valeur au
temps 𝑡 − 1 plus un choc aléatoire
› Exemple : Les croyants de l'hypothèse des marchés de capitaux
efficients soutiennent l’idée: que les cours des actions sont
essentiellement aléatoire et donc il n'y a pas de place pour la
spéculation rentable dans le marché boursier. Si l'on pouvait prédire le
prix de demain sur la base des prix d'aujourd'hui, nous serions tous des
millionnaires.
Processus stochastique non stationnaire
Marche aléatoire sans dérive:
Résultats:
› Si le processus commence à Y0 nous aurons 𝑌𝑡 = 𝑌0 + 𝑢𝑡
› Donc : 𝐸 𝑌𝑡 = 𝐸 𝑌0 + 𝑢𝑡 = 𝑌0
› Et : 𝑣𝑎𝑟 𝑌0 = 𝑡𝜎²

Comme 𝑡 augmente, sa variance augmente indéfiniment, violant ainsi


une condition de stationnarité.
Une marche aléatoire sans dérive est un processus stochastique non
stationnaire
Processus stochastique non stationnaire
Marche aléatoire sans dérive:
Transformation: (première différence)

𝑌𝑡 − 𝑌𝑡−1 = ∆𝑌𝑡 = 𝑢𝑡

Il est facile de montrer que, si 𝑌𝑡 est non stationnaire, sa première


différence est stationnaire.

Les premières différences d'une série chronologique de marche


aléatoire sont stationnaires.
Mais nous aurons plus à dire sur ce sujet plus tard.
Processus stochastique non stationnaire
Marche aléatoire avec dérive (avec tendance):
› Supposons que 𝑢𝑡 est un terme d'erreur bruit blanc. la série 𝑌𝑡 est dit
être une marche aléatoire avec dérive si 𝑌𝑡 = 𝛿 + 𝑌𝑡−1 + 𝑢𝑡 .
Où δ est connu comme le paramètre de la dérive (tendance).
Donc : 𝐸 𝑌𝑡 = 𝑌0 + 𝑡𝛿
Et : 𝑣𝑎𝑟 𝑌0 = 𝑡𝜎²
𝑌𝑡 − 𝑌𝑡−1 = ∆𝑌𝑡 = 𝛿 + 𝑢𝑡
› Comme 𝑡 augmente, son espérance et sa variance augmentent
indéfiniment, violant ainsi la condition de faible stationnarité.
Processus stochastique non stationnaire
› le modèle de marche aléatoire (RWM) avec ou sans dérive est un
processus stochastique non stationnaire.
Exemple numérique
› Pour donner un aperçu de la marche aléatoire avec et sans dérive, nous
avons effectué deux simulations comme suit:
1. 𝑌𝑡 = 𝑌0 + 𝑢𝑡
2. 𝑌𝑡 = 𝛿 + 𝑌0 + 𝑢𝑡
où 𝑢𝑡 est un bruit blanc.
› On génère aléatoirement 500 valeurs pour 𝑢𝑡 et on obtient des valeurs
de 𝑌𝑡 . On suppose que 𝑌0 = 0 et 𝛿 = 5 (pour le RWM avec dérive).
Processus stochastique non stationnaire
YT SANS DÉRIVE
Simulation est faite sur Excel (voir TP) 50
40
𝑌𝑡 = 𝑌0 + 𝑢𝑡
30
Processus Bruit Blanc 20
15
10
0
10
-10
5 -20
-30
0
-40
-5

yt=5+Yt-1+ut
-10
1200
-15
1000

Le modèle RWM est un 800

exemple de ce que la littérature 600

nomme processus à racine 400

200
unitaire 0
Simulation du processus stochastique non
stationnaire sous Eviews Y
RESID 25
4
20
3

15
2

1 10

0 5

-1
0
-2
-5
-3
-10
-4
50 100 150 200 250
Y1 300 350 400 450 500
50 100 150 200 250 300 350 400 450 500
3,000

2,500

2,000

1,500

1,000

500

0
50 100 150 200 250 300 350 400 450 500
Processus stochastique à racine unitaire
Soit le modèle RWM suivant : 𝑌𝑡 = 𝜌𝑌𝑡−1 + 𝑢𝑡 il rassemble à un modèle
AR.
› Si 𝜌 = 1 : le modèle devient un modèle avec marche aléatoire sans
dérive. Et nous somme en présence de ce qu’on appelle un problème de
racine unitaire, c-à-d une situation de non stationnarité.
› 𝜌 = 1 signifie : Non stationnarité = marche aléatoire = racine unitaire.
› Si 𝜌 ≤ 1 la série 𝑌𝑡 est stationnaire.

› Pratiquement, il est important de trouver si une série possède une


racine unitaire : il existe divers tests de stationnarité
Stationnarité du trend TS, et stationnarité
différentielle du processus stochastique DS
› Il est important de savoir si le trend observé est déterministe (prévisible
ou non variable) ou stochastique (imprévisible et variable).
› Soit : 𝑌𝑡 = 𝛽1 + 𝛽2 𝑡 + 𝛽3 𝑌𝑡−1 + 𝑢𝑡 où 𝑢𝑡 est un bruit blanc. On a :
Marche aléatoire pure :
𝛽1 = 0, 𝛽2 = 0, 𝛽3 = 1 : 𝑌𝑡 = 𝑌𝑡−1 + 𝑢𝑡 (Dif. Prem. Pour stationnariser).
› Donc une marche aléatoire sans dérive est un processus stationnaire
différentiel.
Marche aléatoire avec dérive:
𝛽1 ≠ 0 , 𝛽2 = 0 , 𝛽3 = 1 : 𝑌𝑡 = 𝛽1 + 𝑌𝑡−1 + 𝑢𝑡 (Dif. Prem. Pour
stationnariser)
› Donc une marche aléatoire avec tendance est non stationnaire
Stationnarité du trend TS, et stationnarité
différentielle du processus stochastique DS
Trend déterministe :
𝛽1 ≠ 0, 𝛽2 ≠ 0, 𝛽3 = 0: 𝑌𝑡 = 𝛽1 + 𝛽2 𝑡 + 𝑢𝑡
Appelé processus de Trend Stationnaire (TS).

Marche aléatoire avec dérive et Trend déterministe :


𝛽1 ≠ 0, 𝛽2 ≠ 0, 𝛽3 = 1: 𝑌𝑡 = 𝛽1 + 𝛽2 𝑡 + 𝑌𝑡−1 + 𝑢𝑡
∆𝑌𝑡 = 𝛽1 + 𝛽2 𝑡 + 𝑢𝑡
Ce qui signifie que 𝑌𝑡 n’est pas stationnaire
Stationnarité du trend TS, et stationnarité
différentielle du processus stochastique DS
Trend déterministe et composante stationnaire AR(1) :
𝛽1 ≠ 0, 𝛽2 ≠ 0, 𝛽3 < 1: 𝑌𝑡 = 𝛽1 + 𝛽2 𝑡 + 𝛽3 𝑌𝑡−1 + 𝑢𝑡
∆𝑌𝑡 = 𝛽1 + 𝛽2 𝑡 + 𝑢𝑡
Ce qui signifie que 𝑌𝑡 n’est pas stationnaire

Exemple :
› Pour saisir la différence entre les trends stochastiques et déterministes,
considérons la simulation suivante :
On généré 500 valeurs de 𝑢𝑡 à partir d’une distribution normale standard
où la valeur initiale de 𝑌 était 1.
Stationnarité du trend TS, et stationnarité
300
différentielle du processus stochastique DS
250

200

150

100

50

-50

Yt=0,5+Yt-1+Ut yt=0,5t+ut
Le phénomène de la régression fallacieuse
(Spurious Regression)
› Pour montrer pourquoi la stationnarisation est aussi importante : soient
les deux modèles de marches aléatoires suivants :
𝑌𝑡 = 𝑌𝑡−1 + 𝑢𝑡 et 𝑋𝑡 = 𝑋𝑡−1 + 𝑣𝑡
Simulation : On généré 500 valeurs de 𝑢𝑡 et de 𝑣𝑡 à partir d’une
distribution normale standard et on suppose que les valeurs initiales de 𝑌
et 𝑋 égalent à 0. Nous avons également supposé que 𝑢𝑡 et 𝑣𝑡 sont pas
corrélées.
› Ces deux séries sont non stationnaire.
› Nous allons effectuer une régression 𝑌𝑡 = a𝑋𝑡 + b + 𝜀𝑡
› Résultat attendu: R² tend vers 0 puisque les deux processus ne sont
pas corrélés
Le phénomène de la régression fallacieuse
(Spurious Regression)
Dependent Variable: Y

› Les résultats sont les suivants:


Method: Leas t Squares
Date: 12/07/15 Tim e: 16:28
Sam ple: 1 500
Included obs ervations : 500

Variable Coefficient Std. Error t-Statis tic Prob.

C 14.22577 0.676514 21.02803 0.0000


X -0.513393 0.164080 -3.128914 0.0019

R-s quared 0.019280 Mean dependent var 13.23174


Adjus ted R-s quared 0.017311 S.D. dependent var 13.47272
S.E. of regres s ion 13.35560 Akaike info criterion 8.025741
Sum s quared res id 88829.28 Schwarz criterion 8.042599
Log likelihood -2004.435 Hannan-Quinn criter. 8.032356
Commentaires : F-s tatis tic
Prob(F-s tatis tic)
9.790103
0.001857
Durbin-Wats on s tat 0.007627

› Coefficient de 𝑋 (la pente) est très significatif bien que R² est très faible.
› Donc il existe une relation statistiquement significative entre les variables,
alors qu’a priori il devrait avoir aucune.
› C’est le phénomène de régression fallacieuse
› Yule a montré que la (fausse) corrélation pourrait persister dans les séries
temporelles non stationnaires même si l'échantillon est très grande.
Test de la stationnarité
Dans la pratique, nous sommes confrontés à deux questions importantes:
› Comment pouvons-nous savoir si une série de temps donné est
stationnaire?
› Si l'on trouve qu'une série donnée est non stationnaire, est-il possible de
la rendre stationnaire?
› Bien qu’il existe de multiples tests de stationnarité, nous discuterons de
deux types tests:
(1) l'analyse graphique
(2) le test de corrélogramme
Test de la stationnarité
Analyse graphique 5000

Exemple PIB
4500

Soit la série du PIB


4000

› Sur la période de l'étude le PIB a été en


hausse, montrant une tendance à la 3500

hausse. 3000

› Ce qui suggère peut-être que la moyenne


du PIB a été en train de changer. 2500

› Cela suggère peut-être que la série du2000

PIB n’est pas stationnaire 1500

1981–Il

1984–Il

1987–Il

1990–Il
1972–II

1975–II

1978–II
1970–IV

1973–IV

1976–IV

1979–IV

1982–IV

1985–IV

1988–IV

1991–IV
1970–I

1971–III

1973–I

1974–III

1976–I

1977–III

1979–I

1980–III

1982–I

1983–III

1985–I

1986–III

1988–I

1989–III

1991–I
Test de la stationnarité
› Fonctions d’autocorrélation ACF et corrélogramme

› Un simple test de la stationnarité est basé sur la fonction


d’autocorrélation, ACF pour 𝑘 retards 𝜌𝑘 est définie par:
𝛾𝑘
𝜌𝑘 =
𝛾0
𝐶𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒 𝑎𝑢 𝑟𝑒𝑡𝑎𝑟𝑑 𝑘
𝜌𝑘 =
𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒
› La représentation graphique de cette fonction est appelée
corrélogramme
Test de la stationnarité
› Fonctions d’autocorrélation ACF et corrélogramme
Date: 12/07/15 Time: 16:40

Cas du RWM Sample: 1 500


Included observations: 500

Autocorrelation Partial Correlation AC PAC Q-Stat Prob

On généré un échantillon de 500 termes d'erreur, l'u, 1


2
0.003
0.041
0.003
0.041
0.0033
0.8662
0.954
0.648
3 0.002 0.001 0.8675 0.833
à partir de la distribution normale standard. 4
5
0.076
-0.01...
0.075
-0.01...
3.8075
3.8732
0.433
0.568
6 -0.02... -0.02... 4.1483 0.657
7 -0.04... -0.04... 5.2739 0.627

Le corrélogramme suivant est du bruit blanc (𝑢𝑡 ) 8


9
1...
-0.04...
-0.05...
0.040
-0.05...
-0.04...
0.048
6.3674
7.7629
8.5804
0.606
0.558
0.572
1... 0.044 0.056 9.5555 0.571
1... -0.01... -0.01... 9.6994 0.642
Analyse : 1...
1...
-0.01...
0.005
-0.01...
-0.00...
9.7734
9.7847
0.712
0.778
1... 0.060 0.048 11.648 0.705
1... 0.019 0.018 11.830 0.756

Pour le moment voir la colonne AC et le premier 1...


1...
1...
-0.03...
0.002
-0.07...
-0.03...
0.006
-0.07...
12.561
12.563
15.797
0.765
0.817
0.671

diagramme sur la gauche. (valeurs + : -) 2...


2...
2...
0.038
-0.02...
-0.05...
0.038
-0.01...
-0.05...
16.563
16.859
18.218
0.681
0.720
0.693
2... -0.05... -0.03... 19.893 0.648

Pour un processus bruit blanc les AC à divers 2...


2...
2...
0.012
-0.10...
-0.11...
0.014
-0.10...
-0.13...
19.968
25.266
32.389
0.699
0.448
0.181
2... -0.12... -0.12... 40.752 0.044
2... -0.04... -0.04... 41.785 0.045
Retards se situent autour de Zéro (stationnaire) 2...
3...
-0.01...
-0.06...
0.006
-0.06...
41.939
44.426
0.057
0.044
Test de la stationnarité
› Fonctions d’autocorrélation ACF et corrélogramme
Date: 12/07/15 Time: 16:59
Sample: 1 500
Cas du RWM Included observations: 500

Autocorrelation Partial Correlation AC PAC Q-Stat Prob

C’est le corrélogramme d’une RWM 1


2
3
0.995
0.989
0.985
0.995
0.019
0.037
497.60
991.05
1480.8
0.000
0.000
0.000
4 0.980 0.027 1967.1 0.000

Analyse 5
6
7
0.976
0.972
0.967
0.008
0.015
-0.02...
2450.1
2929.8
3406.2
0.000
0.000
0.000
8 0.963 0.004 3879.3 0.000
9 0.959 0.013 4349.1 0.000
La caractéristique de ce corrélogramme est que les 1...
1...
0.956
0.953
0.114
0.032
4817.0
5283.2
0.000
0.000
1... 0.950 0.023 5747.9 0.000
CA à différents retards (lags) sont très élevés, même 1...
1...
0.947
0.944
-0.04...
0.005
6210.5
6671.0
0.000
0.000
1... 0.941 -0.01... 7129.2 0.000
jusqu'à un décalage de 30 retards. 1...
1...
0.938
0.936
0.042
0.013
7585.7
8040.5
0.000
0.000
1... 0.933 -0.02... 8493.4 0.000
1... 0.929 -0.02... 8943.9 0.000
2... 0.926 0.004 9392.1 0.000
2... 0.922 -0.02... 9837.7 0.000
2... 0.919 0.012 10281. 0.000
2... 0.915 -0.04... 10722. 0.000

C’est un corrélogramme typique d’une série non 2...


2...
2...
0.911
0.907
0.903
-0.03...
-0.03...
0.034
11159.
11594.
12025.
0.000
0.000
0.000

stationnaire. 2...
2...
2...
0.899
0.895
0.892
0.024
-0.01...
0.015
12454.
12880.
13304.
0.000
0.000
0.000
3... 0.888 -0.04... 13725. 0.000
Test de la stationnarité
› Fonctions d’autocorrélation ACF et corrélogramme
Date: 12/07/15 Time: 17:26
Sample: 1970Q1 1991Q4
Cas du PIB (Exemple concret) Included observations: 88

Autocorrelation Partial Correlation AC PAC Q-Stat Prob

› Le corrélogramme du PIB montre une tendance 1


2
0.969
0.935
0.969
-0.05...
85.462
166.02
0.000
0.000

similaire à celle du RWM. 3


4
5
0.901
0.866
0.830
-0.02...
-0.04...
-0.02...
241.72
312.39
378.10
0.000
0.000
0.000
6 0.791 -0.06... 438.57 0.000

› Le coefficient AC affiche (0,969) avec un 7


8
9
0.752
0.713
0.675
-0.02...
-0.02...
0.009
493.85
544.11
589.77
0.000
0.000
0.000
1... 0.638 -0.01... 631.12 0.000

décalage égale à 1, et diminue très lentement. 1...


1...
1...
0.601
0.565
0.532
-0.02...
-0.01...
0.020
668.33
701.65
731.56
0.000
0.000
0.000
1... 0.500 -0.01... 758.29 0.000

Ainsi, il semble que la série chronologique du 1...


1...
1...
0.468
0.437
0.405
-0.02...
-0.00...
-0.04...
782.02
803.03
821.35
0.000
0.000
0.000
1... 0.375 -0.00... 837.24 0.000

PIB est non stationnaire. 1...


2...
2...
0.344
0.313
0.279
-0.03...
-0.01...
-0.06...
850.79
862.17
871.39
0.000
0.000
0.000
2... 0.246 -0.01... 878.65 0.000

Elle peut être non stationnaire en moyenne ou 2...


2...
2...
0.214
0.182
0.153
-0.00...
-0.01...
0.017
884.22
888.31
891.25
0.000
0.000
0.000
2... 0.123 -0.02... 893.19 0.000

la variance ou les deux. 2...


2...
0.095
0.068
-0.00...
-0.01...
894.38
894.99
0.000
0.000
2... 0.043 -0.00... 895.24 0.000
3... 0.019 -0.00... 895.29 0.000
Test de la stationnarité
› Fonctions d’autocorrélation ACF et corrélogramme
Deux questions pratiques peuvent être posées ici.
(1) comment pouvons-nous choisissons la Lag pour calculer l'ACF?
(2) comment décidez-vous si une coefficient de corrélation à un certain
décalage est statistiquement significative?
› Réponse :
88
› (1) Le choix se fait selon la règle du tiers des observations : ≈ 30;
3
À priori il est conseillé de commencer l’analyse par des Lags importants.
Test de la stationnarité
(2) Dans la série du PIB comment décider si le coefficient de corrélation
pour 10 retards (0,638) est statistiquement significative?
› Bartlett a montré que si une série chronologique est purement aléatoire,
les coefficients d'autocorrélation 𝜌𝑘 ~𝑁 0, 1 𝑛 .
1
› Puisque nous avons 88 observations, la variance = 88 = 0,1136

› Ensuite, suivant les propriétés de la distribution normale standard,


l'intervalle de confiance de 95% pour tout 𝜌𝑘 est : 𝜌𝑘 ± 1,96 0,1136
𝑃𝑟𝑜𝑏 𝜌𝑘 − 0.2089 ≤ 𝜌𝑘 ≤ 𝜌𝑘 + 0.2089 = 0.95
𝑃𝑟𝑜𝑏 0.4291 ≤ 𝜌𝑘 ≤ 0.8469 = 0.95
› De toute évidence cet intervalle est différents de Zéro au seuil de
signification 5%.
Test de la stationnarité
(2) Suite :
› Au lieu de tester la signification statistique de chaque 𝜌𝑘 particulier, on
peut tester l'hypothèse que tout les 𝜌𝑘 jusqu'à certains retards sont
simultanément égaux à zéro. Cela peut être fait en utilisant la statistique
Q développée par Box et Pierce, qui est définie comme :
𝑚 2
Q=n 𝜌
𝑘=1 𝑘 ²~𝜒𝑚
› Un test similaire à Q-Stat : le 2 LB-Test (Ljung–Box (LB) statistic),
𝜌𝑘
défini par: 𝐿𝐵 = 𝑛 𝑛 + 2 𝑚 2
𝑘=1 𝑛−𝑘 ~𝜒𝑚

› Bien que dans les grands échantillons les statistiques Q et LB suivent


2
une distribution de 𝜒𝑚 , la statistique de LB présente, pour les petits
échantillons, des propriétés supérieures à celle de Q-Stat.
Test de la stationnarité
(2) Suite :
L’exemple du PIB
La valeur de la statistique de LB jusqu’à 20 retards = 891,25 la
probabilité critique d’obtenir une telle valeur de LB sous l’hypothèse
nulle que la somme des 25 coefficients AC estimés et élevés au carré est
pratiquement nulle, comme l’indique la dernière colonne (Prob).
Conclusion:
On doit conclure à la non stationnarité de la série du PIB (ce qui est déjà
confirmer par l’analyse graphique).
Test de racine unitaire
Rappel:
Test de stationnarité (ou non) = test de racine unitaire
𝑌𝑡 = 𝜌𝑌𝑡−1 + 𝑢𝑡 𝑎𝑣𝑒𝑐 − 1 ≤ 𝜌 ≤ 1
› Si 𝜌 = 1 (si il y a racine unitaire), devient un RWM sans dérive, qui
est un processus stochastique non stationnaire.
› L’idée est de régresser simplement 𝑌𝑡 sur sa valeur retardée et trouver
si 𝜌 est statistiquement égal à 1; s’il l’est 𝑌𝑡 est non stationnaire.
∆𝑌𝑡 = 𝜌 − 1 𝑌𝑡−1 + 𝑢𝑡 = 𝛿𝑌𝑡−1 + 𝑢𝑡
Pratiquement on teste l’hypothèse nulle que 𝛿 = 0. si 𝛿 = 0 alors 𝜌 = 1
Il y a donc une racine unitaire, c-q-dire que la série n’est pas stationnaire
Test de racine unitaire
Problème d’inférence
› Quel test à utiliser pour savoir si le coefficient estimé est nul ou non.
› Malheureusement la valeur de 𝑡 des coefficients estimés ne suit pas une
distribution t-Student, ce qui signifie qu’il n’y a pas de distribution
normale asymptotique.
› Dickey & Fuller ont montré que la valeur estimée de 𝑡 des coefficients
suit la statistique 𝜏 (tau).
› Ils ont calculé les valeurs critiques. Puis MacKinnon a élaboré les
tables qui sont incorporées dans plusieurs logiciels d’économétrie.
› Dans la littérature 𝜏 est connu sous le nom du test de DF
Procédure et application du test de stationnarité DF
et ADF
Procédure

En examinant la nature du processus de racine unitaire.


› Un processus de marche aléatoire peut n’avoir pas de tendance
› Ou bien en avoir une
› Ou encore posséder des trends déterministes et stochastiques.
Pour prendre en compte les diverses possibilités, le test DF est estimé
sous trois formes différentes, c’est-à-dire trois hypothèses nulles
différentes.
Procédure et application du test de stationnarité DF
et ADF
Procédure
Dickey et Fuller considèrent trois modèles de base pour la série :
𝑌𝑡 , 𝑡 = 1,2,3, … 𝑇
Modèle [1] : modèle sans constante ni tendance déterministe :
∆𝑌𝑡 = 𝛿𝑌𝑡−1 + 𝜀𝑡
Modèle [2] : modèle avec constante sans tendance déterministe :
∆𝑌𝑡 = 𝛿𝑌𝑡−1 + 𝛾 + 𝜀𝑡
Modèle [3] : modèle avec constante et tendance déterministe :
∆𝑌𝑡 = 𝛿𝑌𝑡−1 + 𝛾 + 𝜃𝑡 + 𝜀𝑡
on suppose que 𝜀𝑡 est un bruit blanc, 𝑋𝑡 est la variable dont on teste la
stationnarité ; 𝛿 = 𝜌 − 1, 𝛾 et 𝜃 sont des paramètres.
Procédure et application du test de stationnarité DF
et ADF
Procédure

La règle de décision est la suivante :


› Si la valeur calculée de la t- statistique associée à 𝛿 est inférieure à la
valeur critique, on rejette l’hypothèse nulle de non stationnarité.
› Si la valeur calculée de la t- statistique associée à 𝛿 est supérieure à la
valeur critique, on accepte l’hypothèse nulle de non stationnarité.
Procédure et application du test de stationnarité DF
et ADF
Procédure
En pratique, on adopte une stratégie séquentielle en trois étapes:
Etape I : On commence par appliquer le test sur le modèle 3. On peut aboutir à
deux résultats :
› Si la tendance n’est pas significative, on passe au modèle 2.
› Si la tendance est significative, on teste l’hypothèse nulle de racine unitaire :
 Si 𝛿 n’est pas significativement différent de 0, 𝑌𝑡 est non stationnaire.
Dans ce cas, il faut la différencier et recommencer la procédure sur la
série en différence première.
 Si 𝛿 est significativement différent de 0, 𝑌𝑡 est stationnaire. Dans ce cas,
la procédure s’arrête et l’on peut directement travailler sur 𝑌𝑡 .
Procédure et application du test de stationnarité DF
et ADF
Procédure
Etape II : Cette étape ne doit être appliquée que si la tendance dans le
modèle précédent n’est pas significative. On estime le modèle 2 :
Si la constante n’est pas significative, on passe au modèle 1.
Si la constante est significative, on teste l’hypothèse nulle de racine
unitaire :
 Si 𝛿 n’est pas significativement différent de 0, 𝑌𝑡 est non
stationnaire. Dans ce cas, il faut la différencier et recommencer la
procédure sur la série en différence première.
 Si 𝛿 est significativement différent de 0, 𝑌𝑡 est stationnaire. Dans
ce cas, la procédure s’arrête et l’on peut directement travailler sur
𝑌𝑡 .
Procédure et application du test de stationnarité DF
et ADF
Procédure
Etape III : Cette étape ne doit être appliquée que si la constante dans le
modèle précédent n’est pas significative. On estime le modèle 1 :
 Si 𝛿 n’est pas significativement différent de 0, 𝑌𝑡 est non
stationnaire. Dans ce cas, il faut la différencier et recommencer la
procédure sur la série en différence première.
 Si 𝛿 est significativement différent de 0, 𝑌𝑡 est stationnaire. Dans
ce cas, la procédure s’arrête et l’on peut directement travailler sur
𝑌𝑡 .
Procédure et application du test de stationnarité DF
et ADF
› Schéma
Procédure et application du test de stationnarité DF
et ADF
Conclusion

› La stationnarité des variables représente une solide garantie


contre les régressions fallacieuses ou non cohérentes.
› Si une variable 𝑌𝑡 est stationnaire en niveau, on dira qu’elle est
intégrée d’ordre zéro. Ce qui sera noté 𝑌𝑡 ~I(0)
› De manière générale, on dit qu’une série est intégrée d’ordre
«d», s’il faut la différentier «d» fois pour qu’elle soit stationnaire.
Prévision (modélisation AR, MA, ARMA, ARIMA)
› Processus ARIMA
Méthodologie de Box & Jenkins
Identification
Estimation du modèle ARIMA
Diagnostique
Prévision

Vous aimerez peut-être aussi