Non Stationnarite Cointegration MCE

1
Cours d'Econométrie
Chapitre 4 : Non Stationnarité, Cointégration

et Modèles à Correction d'Erreur
Sessi TOKPAVI1
Master 1 Economie - Université Paris X
1
Maître de Conférences, EconomiX - Laboratoire d'Economie de Paris X - stokpavi@u-paris10.fr
Chapitre 4 : Non Stationnarité, Cointégration et Modèles à Correction d'Erreur 3
Chapitre 4 : Non Stationnarité, Cointégration et Modèles à Correction d'Erreur
Section 1 : Non stationnarité
– Dé nition de la stationnarité
– Caractérisation des processus aléatoires non stationnaires
– Tests de non stationnarité
Section 2 : Régression avec des variables non stationnaires
– Notion de régressions fallacieuses
– La cointégration
– Modèles à correction d'erreur (MCE)
1 Non stationnarité
Dans les chapitres précédents de ce cours, on s'est intéressé à l'estimation du modèle de régression
linéaire par la méthode des moindres carrés ordinaires. On s'est focalisé entre autres sur l'étude des
propriétés à distance nie et asymptotiques de l'estimateur des moindres carrés ordinaires. Cet es-
timateur sous un certain nombre d'hypothèses est sans biais, de variance minimale, convergent et
admet asymptotiquement une distribution normale.
Sans rentrer dans les détails, l'ensemble de ces propriétés, notamment celles asymptotiques ne sont
valables que sous l'hypothèse de stationnarité des variables. Il est donc nécessaire d'étudier cette hy-
pothèse et de mettre en exergue les problèmes qui peuvent émerger lors de l'estimation d'un modèle
de régression linéaire impliquant des variables non stationnaires: c'est l'objet de ce chapitre. Dans
tout le chapitre, on se place dans le cadre de données en série temporelle.
1.1 Dé nition de la stationnarité
Considérons le vecteur aléatoire (Xt+1; :::; Xt+k ) associé à la série temporelle fXt; t 2 g de réalisation
le vecteur d'observations (xt+1; :::; xt+k ). Notons f (:) la densité jointe de (Xt+1; :::; Xt+k ). L'hypothèse
de stationnarité au sens strict traduit le fait que f (:) ne dépend pas du temps, c'est-à-dire f (xt+1; :::; xt+k ) =
f (xt0+1; :::; xt0+k ). Ainsi, quel que soit l'origine du temps retenu pour observer le vecteur aléatoire, la
distribution jointe associée est la même. Il existe une forme faible de la stationnarité qui correspond à
la constance dans le temps des deux premiers moments de la série temporelle fXt; t 2 g. Formelle-
ment la série temporelle fXt; t 2 g est stationnaire au sens faible si et seulement si:
son espérance est constante dans le temps:

Z1
E (Xt) = xtf (xt) dxt = 8t avec constante, (1)
1
sa variance est constante dans le temps:

Z1
V ar (Xt) = (xt )2 f (xt) dxt = 2
8t avec 2
constante, (2)
1
Sa fonction d'autocovariance ne dépend pas du temps mais de l'intervalle séparant les deux vari-
ables aléatoires considérées. Plus précisément:
Cov (Xt; Xt k ) = E f(Xt ) (Xt k )g = (k) (3)
avec (k) ne dépendant pas de t.

De ces deux dé nitions de la stationnarité, il apparaît clair que la stationnarité au sens strict implique
la stationnarité au sens faible, l'inverse n'étant pas vrai.
1.2 Caractérisation des processus aléatoires non stationnaires
Comme précisé ci-dessus, un processus est stationnaire au sens faible si l'ensemble de ses moments
d'ordre 1 et 2 sont indépendants du temps. Par opposition, un processus non stationnaire est un
processus qui ne satisfait pas à l'une ou l'autre de ces deux conditions (ou les deux à la fois). Ainsi
l'origine de la non stationnarité peut provenir d'une dépendance du moment d'ordre 1 (espérance)
par rapport au temps et/ou d'une dépendance de la variance et des autocovariances par rapport au
temps. Il existe différentes sources de non stationnarité qu'on peut représenter par deux classes de
processus non stationnaires:
Les processus TS (Time Stationary) qui renvoient à une non stationnarité de type déterministe;
Les processus DS (Differency Stationary) qui renvoient à une non stationnarité de type stochas-
tique.
Nous présentons ci-contre ces deux classes de processus non stationnaires.

1.2.1 Les processus TS
Un processus stochastique fXt; t 2 g est dit TS (ou admet une non stationnarité de type détermin-
iste) s'il peut s'écrire sous la forme suivante:
Xt = f (t) + zt; (4)
où f (t) est une fonction déterministe du temps et zt un processus stochastique stationnaire. L'exemple
le plus simple d'un processus TS est celui d'une tendance linéaire perturbée par un bruit blanc, soit:
Xt = a0 + a1t + "t; (5)
avec a0, a1 2 R des paramètres, "t un bruit blanc de variance ".

2
On peut véri er que ce processus
est non stationnaire au sens faible. En effet, on a:
E (Xt) = E (a0 + a1t + "t)

= a0 + a1t + E ("t)
= a0 + a1t; (6)
qui dépend du temps. L'espérance du processus n'est donc pas constante dans le temps. On en dé-
duit qu'il n'est pas stationnaire. Bien évidemment, si on retire la tendance déterministe de Xt on a un
processus stationnaire. Formellement, Xt (a0 + a1t) = "t est stationnaire.
Il importe de noter qu'une des propriétés importantes des processus TS réside dans le fait que
lorsqu'ils sont affectés par un choc aléatoire, l'effet de ce choc tend à disparaître à long terme. Il
s'agit de la propriété de non persistance des chocs. Pour illustration, considérons le processus TS
suivant:
Xt = a0 + a1t + zt (7)
zt = zt 1 + "t ; (8)
avec j j < 1 et "t un bruit blanc de variance 2" . Il s'agit bien évidemment d'un processus TS comme
dé nit plus haut, car zt est stationnaire. En effet, on a:
zt = z t 1 + "t = ( z t 2 + "t 1 ) + "t (9)

2
= zt 2 + "t + "t 1 = 2 ( zt 3 + "t 2) + "t + "t 1
X1
3 2 j
= zt 3 + "t + "t 1 + "t 2 = :::: = "t j ;
j=0
et
0 1
1
X 1
X
E (zt) = E @ j
"t j A = j
E ("t j ) = 0; (10)
j=0 j=0
car "t est un bruit blanc. De même, on a:

80 129
>
< X 1 >
=
V ar (zt) = E zt = E @
2 j
"t j A (11)
>
: j=0 >
;
0 1
X1 1
X
= E@ 2j
"t j A =
2 2j
E "2t j
j=0 j=0
1
X 2
2 2j "
= " = 2:
j=0
1
On a alors E (zt) et V ar (zt) qui sont des constantes (indépendants du temps), et donc le processus zt
est stationnaire au sens faible, et Xt est bien un processus TS. On peut donc le réécrire comme suit:
1
X
j
Xt = a0 + a1t + "t j : (12)
j=0
Supposons maintenant qu'à la date T , on ait une réalisation d'un choc "T . La question est de savoir
quel est l'effet de ce choc sur le processus Xt, k périodes après. On a à la date T + k; k > 0:
1
X
j
XT +k = a0 + a1 (T + k) + "T +k j (13)
j=0
2 k
= "T +k + "T +k 1 + "T +k 2 + ::: + "T + :::
et on peut déduire que:
XT +k k
lim = lim = 0: (14)
k!1 "T k!1
En conclusion, l'impact d'un choc initial (à l'instant T ) sur le processus tend à décroître et à s'annuler
lorsque le temps passe. On assiste donc à une absence de persistance des chocs, ou absence de
phénomène d'hystérèse.
1.2.2 Les processus DS
Un processus stochastique fXt; t 2 g est dit DS (ou non stationnaire de type stochastique) d'ordre
d, si le processus ltré dé ni par (1 L)d Xt est stationnaire, avec L l'opérateur de retard. On dit alors
que fXt; t 2 g est un processus intégré d'ordre d, et on note Xt I (d), ou encore que le processus
admet d racines unitaires. Précisons que l'opérateur de retard L est dé nit par LXt = Xt 1. Il vient
donc que:
pour d = 1, on a:
(1 L)d Xt = (1 L) Xt = Xt Xt 1 = Xt: (15)
pour d = 2, on a:
(1 L)d Xt = (1 L)2 Xt = (1 L) (1 L) Xt (16)

= (1 L) Xt = Yt Yt 1 = Yt;
avec Yt = Xt:
Par conséquent, un processus Xt est intégré d'ordre 1, si sa différence première Xt = Xt Xt 1

est stationnaire. De même, un processus Xt est intégré d'ordre 2, si la différence première de sa dif-
férence première est stationnaire.
Le processus DS le plus simple est la marche aléatoire (Random Walk) ou martingale. Ce processus
s'écrit:
Xt = Xt 1 + "t ; (17)
avec "t un bruit blanc. Ce processus est intégré d'ordre 1. En effet, on a Xt = Xt Xt 1 = "t qui
est stationnaire car "t est un bruit blanc. On peut démontrer facilement que la marche aléatoire est un
processus non stationnaire. En effet, on a:
Xt = Xt 1 + "t = (Xt 2 + "t 1) + "t (18)

= Xt 3 + "t + "t 1 + "t 2
Pt
= :::: = X0 + j=1 "j :
On remarquera que:
Pt
E (Xt) = X0 + j=1 E ("j ) = X0; (19)
car "t est un bruit blanc. De même, on obtient:

Pt 2 nP o
t 2
V ar (Xt) = E j=1 "j =E j=1 "j (20)
Pt 2 2
= j=1 E "j = t " :
La variance de Xt n'est donc pas constante car dépendant de t et la marche aléatoire est un proces-
sus non stationnaire. Le terme "marche aléatoire" provient du fait que la réalisation du processus à la
date t part de l'endroit où s'était arrêté le processus à t 1 et va dans une direction totalement aléatoire
et caractérisée par la valeur du choc à l'instant t ("t). Dans ce contexte, le processus DS caractérise
l'évolution de processus pour lesquels la meilleure prévision pour l'instant t + 1 est la valeur courante,
soit Xt. Un exemple est celui des cours des actions qui suivent (sous l'hypothèse d'ef cience des
marchés) une marche aléatoire.
Il est aisé de démontrer que contrairement aux processus TS, les processus DS sonst caractérisés par
un phénomène d'hystérèse ou de persistance des chocs. En effet, dans le cas de la marche aléatoire,
si on suppose un choc à l'instant T ("T ), on a comme précédemment:
PT +k
XT +k = X0 + j=1 "j = X0 + "1 + "2 + ::: + "T + "T +1 + ::: + "T +k ; (21)
avec:
XT +k
lim = 1: (22)
k!1 "T
On remarque donc que contrairement à un processus TS, l'impact du choc initial "T ne disparaît pas
T + k périodes plus loin.
Notons que lorsqu'on inclut une constante dans la spéci cation de la marche aléatoire, on parle de
marche aléatoire avec dérive, soit:
Xt = Xt 1 + a + "t : (23)
Dans le cas où un trend déterministe est inclus en complément de la constante, on parle de marche
aléatoire avec dérive et trend:
Xt = Xt 1 + a + bt + "t: (24)
Il y a alors dans cette dernière spéci cation, une coexistence à la fois d'une non stationnarité de type
déterministe et stochastique.
1.3 Tests de non stationnarité
Pour des processus de type TS, tester la non stationnarité n'exige pas une procédure particulière,
puisqu'une simple inspection graphique peut permettre de se rendre compte de l'existence d'une ten-
dance (linéaire ou quadratique). Les tests de non stationnarité sont donc construits pour détecter la
non-stationnarité de type stochastique, c'est-à-dire la présence d'une racine unitaire. Le test le plus
usité dans la littérature empirique est celui de Dickey-Fuller ou test DF.
1.3.1 Test de Dickey-Fuller (DF)
Le test de Dickey-Fuller (test DF) exploite les équations (17, 23, 24) pour tester la présence d'une
racine unitaire dans le processus stochastique Xt. Plus précisément, les équations considérées sont:
Xt = Xt 1 + "t ; (25)
Xt = Xt 1 + a + "t : (26)
Xt = Xt 1 + a + bt + "t: (27)
ou écrit autrement:
Xt = ( 1) Xt 1 + "t ; (28)
Xt = ( 1) Xt 1 + a + "t ; (29)
Xt = ( 1) Xt 1 + a + bt + "t; (30)
Pour chacune de ces équations le jeu d'hypothèses est le suivant2:

H0 : =( 1) = 0
:
H1 : =( 1) < 0
Pour chacune des équations, l'hypothèse nulle lorsqu'elle est véri ée induit la présence d'une racine
unitaire (marche aléatoire sans dérive, avec dérive, avec dérive et trend) et donc la non stationnarité.
Les statistiques de test sont généralement noté b, b et b et correspondent dans chacune des équa-
tions (28, 29, 30) à la statistique de student traditionnelle b=bb . Cependant il convient de noter tout
de suite qu'elles n'admettent pas la même distribution sous H0. De plus ces distributions ne sont pas
standards (distribution de student) car sous l'hypothèse nulle, le coef cient est celui d'un régresseur
non stationnaire (à savoir Xt 1) et l'inférence traditionnelle du modèle de régression linéaire n'est plus
adaptée. Des valeurs critiques tabulées (table de Dickey-Fuller) qu'on retrouve généralement en an-
nexe des ouvrages d'économétrie permettent de conclure. Ces valeurs critiques dépendent du type
de spéci cation retenue (28, 29 ou 30), du risque de première espèce = 1%; 5% et de la taille de
l'échantillon. Dans chacun des trois cas, on rejette l'hypothèse nulle lorsque la statistique de test est
inférieure au seuil critique. Notons en n que l'hypothèse nulle correspond à la non-stationnarité. Ainsi,
en cas de rejet de H0 le processus est stationnaire.
2
Notons qu'on exclut sous l'hypothèse alternative > 0 car ceci conduit à des processus explosifs qu'on rencontre très rarement en
économie.
Les valeurs critiques tabulées par Dickey-Fuller correspondent à des valeurs spéci ées pour la taille
de l'échantillon ce qui conduit dans la pratique à de très grandes approximations. MacKinnon (1991)
a généré des seuils critiques tabulés pour le test DF et qui peuvent être inférés pour n'importe quelle
taille d'échantillon et qui sont plus précis que ceux de Dickey-Fuller notamment en petits échantillons.
Notons en n que puisque les statistiques de test ainsi que les seuils critiques tabulés dépendent de
la spéci cation retenue (équations 28, 29, 30), une stratégie de test est nécessaire a n de choisir la
spéci cation la meilleure pour l'inférence. Généralement la stratégie adoptée est séquentielle et con-
siste à "évoluer" de la spéci cation la plus générale à la plus simple. Plus formellement les étapes
suivantes doivent être suivies pour la mise en oeuvre du test DF:
Etape 1 : On considère dans un premier temps la spéci cation la plus complète, à savoir celle de
l'équation (30):
Xt = Xt 1 + a + bt + "t; (31)
Avant toute chose, il s'agit de s'assurer de la bonne spéci cation de ce modèle, notamment la
présence ou non d'un trend déterministe. Le jeu d'hypothèses est le suivant:
H0 : b = 0
: (32)
H1 : b 6= 0
La statistique de test est celle de Student traditionnelle qui sous l'hypothèse nulle suit une loi de
Student à T 3 degrés de libertés. Deux con gurations sont alors possibles:
– En cas de rejet de l'hypothèse nulle du test (32), la spéci cation (30) est donc appropriée et on
conclut quant à la stationnarité ou non du processus stochastique via un test DF dont on rappelle
que le jeu d'hypothèses est le suivant:
H0 : =0
:
H1 : <0
– En cas de non rejet de l'hypothèse nulle du test (32), la spéci cation (30) n'est pas appropriée
et on ne peut pas conclure quant à la stationnarité ou non du processus stochastique via un test
DF. Il s'agit alors de retenir une autre spéci cation qui exclut la présence d'un trend déterministe,
soit donc le modèle (29). Ceci est traité à l'étape 2.
Etape 2 : On s'intéresse à la spéci cation (29):
Xt = Xt 1 + a + "t ; (33)
Un test de bonne spéci cation de ce modèle passe par la présence ou non de la constante. Le jeu
d'hypothèses est le suivant:

H0 : a = 0
: (34)
H1 : a 6= 0
Ici également, la statistique de test suit sous l'hypothèse nulle une loi de Student à T 2 degrés de
libertés. Deux con gurations sont possibles:
– En cas de rejet de l'hypothèse nulle du test (34), la spéci cation (29) est appropriée et on conclut
quant à la stationnarité ou non du processus stochastique via un test DF.
– Dans le cas contraire, la spéci cation (29) n'est pas appropriée et on ne peut pas conclure quant
à la stationnarité ou non du processus stochastique via un test DF. On passe alors à l'étape 3
dans laquelle un test DF est mis en oeuvre au travers de la spéci cation (28).
Précisons que dans chacune des trois spéci cations (28, 29, 30) on a supposé que "t est un bruit
blanc. En conséquence, quelle que soit l'étape de la démarche séquentielle ci-dessus où on s'arrête
pour conclure quant à stationnarité ou non du processus, il importe de s'assurer que "t est un bruit
blanc. On peut utiliser les tests usuels d'autocorrélation des résidus pour répondre à la question (test
de Breusch-Godfrey). Cependant, le test le plus adapté dans ce contexte est celui de Box-Pierce, et
son extension à savoir celui de Ljung-Box. Le jeu d'hypothèses du test de Box-Pierce est le suivant:
H0 : 1 = 2= ::: = m =0
: (35)
H1 : 9! j 6= 0
avec j l'autocorrélation d'ordre j pour "t, et m généralement xé à T =4 avec T la taille de l'échantillon.
Sous l'hypothèse nulle toutes les autocorrélations sont nulles et "t est un bruit blanc. La statistique de
test notée QBP (m) est égale à:
P
QBP (m) = T m 2
j=1 bj (36)
avec bj l'autocorrélation empirique d'ordre j calculée sur la série des résidus b "t. Sous l'hypothèse
nulle, QBP (m) suit une loi de chi-deux à m p degrés de liberté, avec p le nombre de paramètres
(constante excluse) estimés dans la régression où b "t est récupérée, et la règle de décision habituelle
suit. Notons que pour le modèle (30) p = 2, pour le modèle (29), p = 1, et en n pour le modèle (28),
p = 1. Le test de Box-Pierce semble être peu puissant sur de petits échantillons. Une extension de
ce test plus performante à distance nie est celle de Ljung-Box. Le jeu d'hypothèse est le même
(équation 35) et la statistique de test notée QLB (m) est dé nie par:
Pm b2j
QLB (m) = T (T + 2) j=1 (37)
T j
qui sous l'hypothèse nulle suit la même distribution que la statistique de Box-Pierce.
A ce niveau la question d'intérêt est la suivante: Quelle démarche adopter si à l'étape de la démarche
séquentielle où on s'est arrêté (pour conclure à la stationnarité ou non du processus), le processus "t
n'est pas un bruit blanc. Dans ce cas on ne peut plus utliliser le test DF, mais une version augmenté
du test DF appelée test ADF (Augmented Dickey-Fuller).
1.3.2 Test de Dickey-Fuller Augmenté (ADF)
Si on considère les équations (28, 29 et 30), il s'agit en cas d'autocorrélation dans "t de le blanchir en
supposant que:
k
X
"t = j Xt j+1 + vt ; (38)
j=2
avec vt un bruit blanc. On obtient alors:

k
X
Xt = Xt 1 + j Xt j+1 + vt ; (39)
j=2
k
X
Xt = Xt 1 +a+ j Xt j+1 + vt ; (40)
j=2
k
X
Xt = Xt 1 + a + bt + j Xt j+1 + vt : (41)
j=2
Pour chacune de ces équations l'hypothèse de non-stationnarité peut être testée comme suit:
H0 : =0
:
H1 : <0
Comme pour le test DF, les statistiques de tests sont à comparer avec les valeurs critiques tabulées
(seuils de MacKinnon), et ceci en fonction de l'équation retenue, du risque de première espèce et de
la taille de l'échantillon3. La règle de décision est la même que celle du test DF.
Notons pour nir que de nombreuses extensions des tests DF et ADF ont été proposées dans la
littérature. On peut citer entre autres, le test de Phillips-Perron (test PP), le test de Kitawoski-Phillips-
Schmidt-Shin (test KPSS), etc.
3
Notons que la signi cativité des paramètres j peut être testée via des tests traditionnels de student.
2 Régression avec des variables non stationnaires
Les relations entre variables économiques issues de la théorie économique sont généralement abor-
dées en économétrie au travers du modèle de régression linéaire multiple et ses extensions (voir
chapitres précédents). Dans ce cadre les données collectées par l'économiste appliqué peuvent être
en coupe instantanées (plusieurs individus observés à un moment donné du temps) ou se présen-
ter sous forme de série temporelle. Cette section traite des problèmes qui peuvent apparaître lorsque
le modèle de régression linéaire multiple est estimé sur données temporelles. Le principal problème
qui retiendra notre attention est celui de la non-stationnarité des variables incluses dans le modèle
de régression. Ce problème se rencontre très souvent dans la pratique car de nombreuses variables
économiques (macroéconomiques, nancières) sont générées par des processus intégrées et sont
donc non-stationnaires. Ces variables lorsqu'elles sont impliquées dans des modèles de régression
conduisent à des relations estimées fortement signi catives et ceci même si ces relations n'existent
pas en réalité. On parle alors en utilisant la terminologie de Granger et Newbold (1974) de régressions
fallacieuses (ou en anglais, spurious regression).
2.1 Notion de régressions fallacieuses
De façon formelle, considérons deux processus stochastiques Xt et Yt respectivement I (1) et in-

dépendemment distribués. Soit le modèle de régression linéaire
Yt = Xt + ut: (42)
Les deux processus étant indépendants, il ne devrait pas y avoir de relation systématique entre Xt et
Yt et l'estimation de l'équation de régression (42) par MCO devrait conduire en terme d'inférence à la
nullité du coef cient et un coef cient de détermination R2 nul. Cependant, ceci n'est généralement
pas le cas à cause de la présence de trends stochastiques dans les processus Xt et Yt. Une dé ni-
tion plus précise de la régression fallacieuse est donnée ci-contre:
Dé nition: Soit deux processus stochastiques respectivement I (1) indépendants et générés par:
Xt = Xt 1 + "t ; (43)
Yt = Y t 1 + et; (44)
avec "t iid 0; 2

" et et iid 0; 2
e où "t et et sont indépendants. Soit la régression
Yt = Xt + ut: (45)
Alors, pour T ! 1,
L'estimateur MCO b ne converge pas vers la vraie valeur 0;
La statistique de student pour tester la nullité de diverge vers 1.
Dans ce contexte, il est important d'être précautionneux quant à la conclusion à tirer, lorsque pour un
modèle de régression sur données temporelles, on observe des ratios de student très élevés, un co-
ef cient de détermination élevé, mais aussi une faible valeur pour la statistique de Durbin-Watson.
La régression fallacieuse mise en exergue par Granger et Newbold (1974) au travers de simulations
de monte carlo est analytiquement expliquée par Phillips (1986) qui démontre que le ratio de student
pour le coef cient dans (45) ne suit pas une distribution de student et tend vers l'in ni lorsque T
augmente. Ceci a pour conséquence le rejet de l'hypothèse nulle = 0 pour de grands échantillons.
A l'évidence, une solution pour éviter la régression fallacieuse serait de différencier les séries et de
procéder à la régression sur les séries différenciées
Yt = Xt + wt:
Néanmoins comme on le verra ci-dessous, cette solution conduit à une mauvaise spéci cation si les
deux variables I(1) sont cointégrées.
2.2 La Cointégration
De manière générale, la combinaison de deux processus stochastiques Xt et Yt respectivement I (d)

et I (d0) est I (max (d; d0)). Ainsi, la combinaison de deux variables intégrées d'ordre 1 est générale-
ment elle-même intégrée d'ordre 1. Cependant, il arrive que la combinaison de deux variables inté-
grées d'ordre 1 soit intégrée d'ordre 0, c'est-à-dire stationnaire. On dit alors que les deux variables
sont cointégrées.
Dé nition: (Engle et Granger ): Les composantes du vecteur zt = (z1t; :::; znt) sont cointégrées d'ordre
d, b, zt CI (d; b) si:
Toutes les composantes sont intégrées d'ordre d;
Il existe = ( 1; :::; n) tel que zt est intégré d”ordre d b > 0. est le vecteur de cointégration.
Remarques:
Le vecteur de cointégration n'est pas unique. En effet si = ( 1; :::; n) est le vecteur de coin-
tégration, alors pour 6= 0, ( 1; :::; n) est aussi un vecteur de cointégration. Dans ce contexte,
on procède généralement à une normalisation en xant 1 = 1, soit = 1= 1 ce qui conduit à
(1; 2= 1:::; n= 1).
Si zt a n composantes, il y a au plus n 1 relations de cointégrations linéairement indépendantes.
La plupart des séries économiques et nancières sont CI(1; 1) :
Pour bien comprendre la notion de cointégration, limitons-nous au cas de deux variables I (1) Xt et
Yt. Chacun de ces deux processus peut être considéré comme la somme d'une marche aléatoire et
d'une composante stationnaire, soit
Xt = Xt + "Xt
Yt = Yt + " Yt
avec Xt et Yt représentant les trends stochastiques, "Xt et "Yt les composantes stationnaires. Si les
deux séries sont cointégrées, il existe à une normalisation près un vecteur de paramètres (1; ) tel
que
Yt Xt I (0)
c'est-à-dire
Yt + " Yt Xt + "Xt I (0)
Yt Xt + ("Yt "Xt ) I (0) (46)
Or ("Yt "Xt ) est stationnaire par dé nition. Il vient donc que pour que l'équation (46) soit valable, il
faut que le terme Yt Xt ne compte pas. Une condition nécessaire et suf sante pour ceci est que
Yt Xt = 0;
ou encore
Yt = Xt :
On peut donc conclure qu'une condition nécessaire et suf sante pour que les deux processus Xt et
Yt soient cointégrées est qu'ils aient à un facteur près le même trend stochastique.
Pour résumer si on note et = Yt Xt il vient donc que si Xt et Yt sont cointégrées, alors et est sta-
tionnaire et il existe une relation d'équilibre de long-terme entre ces variables résumée par la relation
et = 0, soit
Yt Xt = 0:
La variable et correspond alors à la déviation de la relation d'équilibre de long-terme et est appelée
erreur d'équilibre (equilibrium error ). Puisque et est stationnaire, la déviation n'est donc pas perma-
nente, mais temporaire. L'évolution de chacune des deux variables est donc in uencée par le fait que
l'on soit à l'équilibre ou non. En effet en cas de déséquilibre par rapport à la relation de long terme, si
le système doit retourner à l'équilibre, au moins une des variables doit répondre à la magnitude de la
déviation. Il y a donc une dynamique de court terme qui permet l'ajustement vers la relation d'équilibre
de long terme: on parle alors de modèle à correction d'erreur.
2.3 Modèle à correction d'erreur
On peut alors écrire pour la variable4 Yt:
Yt = Yt 1 + et 1 + Xt + vt
4
De manière symétrique la même équation peut être écrite pour la variable Xt :
soit
Yt = e t 1 + Xt + vt: (47)
Cette spéci cation (équation (47)) correspond au modèle à correction d'erreur dans sa forme la plus
simple. Elle indique que la variation de Yt à savoir Yt peut être expliquée par la valeur passée de
l'erreur d'équilibre et la variation de Xt, soit Xt. Pour bien comprendre le sens de l'équation (47),
faisons abstraction du terme Xt et supposons que et 1 > 0, ce qui signi e que la valeur de Yt en
t 1 est située au-dessus de sa valeur d'équilibre. Dans ce cas pour restaurer l'équilibre en t, doit
être négatif. Notons que est appelé paramètre de long-terme (long run parameter) et paramètre
de court-terme (short-run parameter). Le paramètre mesure quant à lui la vitesse d'ajustement vers
la relation de long terme. Il mesure la proportion de l'erreur d'équilibre de la période précédente qui
est corrigée à la période suivante.
On peut introduire plus de dynamique en incluant les valeurs décalées de Xt et Yt dans l'équation
(47), soit
Xp 1 Xq 1
Yt = e t 1 + j Yt j + j Xt j + vt : (48)
j=1 j=0
Cette spéci cation est plus complète en ce sens que la dynamique de court-terme est plus riche.
2.4 Test de cointégration et estimation du modèle à correction d'erreur
Engle et Granger (1987) ont introduit une méthodologie pour tester si deux processus stochastiques
I (1) sont cointégrés, en recourrant aux tests de stationnarité (tests DF et ADF). Il s'agit d'une méthodolo-
gie en deux étapes. La première étape consiste à estimer le terme d'erreur d'équilibre qui correspond
au résidu dans le modèle de régression
Yt = Xt + et;
soit ebt = Yt bXt. Dans la deuxième étape, on applique le test de Dickey-Fuller Augmenté (ADF) à
la série des résidusfb etgTt=1 pour tester si elle est stationnaire ou non. En cas de rejet de l'hypothèse
nulle de non stationnarité, on conclut alors à la stationnarité de fb etgTt=1 et les deux séries Yt et Xt sont
cointégrées. Il importe ici de préciser que puisque le test de stationnarité porte sur une série estimée,
les seuils critiques sont différents de ceux utilisés pour tester la stationnarité de séries observées (voir
chapitre précédent). Les valeurs critiques à utiliser sont fournies par MacKinnon (1991) et dépendent
du nombre de variables incluses dans la relation de cointégration.
Une fois qu'on est assuré que les deux séries sont cointégrées, le modèle à correction d'erreur dans
sa forme complète (équation 48) peut être estimé par moindres carrés ordinaires, en remplaçant et
par ebt, soit

Xp 1 Xq 1
Yt = ebt 1 + j Yt j + j Xt j + vt : (49)
j=1 j=1
3 Quelques exercices
3.1 Exercice 1:
Sur des données constituées par les moyennes mensuelles du taux d'intérêt Euribor à 1 mois ob-
servées sur la période allant de janvier 1999 à septembre 2007, on a réalisé successivement les trois
régressions suivantes :
6
X
it = bit 1 + it j + ut (50)
j=1
6
X
it = a0 + bit 1 + it j + ut (51)
j=1
6
X
it = a0 + ct + bit 1 + it j + ut (52)
j=1
avec it = it it 1 .
Un résumé des résultats obtenus vous est donné dans le tableau ci-après. Dans celui-ci, la quan-
tité Q correspond à la statistique de Ljung-Box calculée au moyen des 12 premiers coef cients
d'autocorrélation de la série des résidus empiriques u
bt. Entre parenthèses gure l'écart-type estimé.
(50) (51) (52)
b
a0 0:112 0:156
(0:048) (0:073)
bb 0:00032 0:033 0:040
(0:0039) (0:015) (0:017)
b
c 0:004
(0:017)
Q 10:057 7:504 6:852
Quelle conclusion pouvez-vous en tirer ? Par ailleurs, si parmi les trois versions du test de Dickey-
Fuller vous ne deviez en retenir qu'une seule, quel serait votre choix ?
3.2 Exercice 2 :
On procède à un test de Dickey-Fuller Augmenté sur la série de la masse monétaire (M3) en France
pour la période 1978 :4-2000 :2 (en fréquence trimestrielle).
Question 1 : Expliquez les différences du test de Dickey-Fuller Augmenté par rapport au Dickey-Fuller
standard.
Le tableau qui suit reproduit les résultats obtenus. Apparaissent, dans l'ordre, (1) le nombre de retard,
(2) la p-value associée au test de Ljung-Box, (3) la p-value associée au test de student du dernier dé-
calage de M3 en différence, et (4) la statistique calculée de DF.
Question 2 : Quel est le nombre de retard retenu pour tester la stationnarité de la variable M3 dans
le cadre du test ADF?
Question 3 : La masse monétaire est-elle stationnaire à 5%?
Avec constante Avec constante et trend

(1) (2) (3) (4) (1) (2) (3) (4)
12 0.81993 0.20398 1.92446 12 0.81579 0.21241 0.87886
11 0.44524 0.33500 1.64869 11 0.45435 0.36084 0.90213
10 0.61509 0.07044 1.47757 10 0.62589 0.09123 0.98871
9 0.65896 0.19548 1.15702 9 0.66486 0.25193 1.16431
8 0.69968 0.46649 0.98069 8 0.69253 0.40418 1.27215
7 0.69824 0.97446 1.10861 7 0.68610 0.93556 1.24601
6 0.69593 0.59093 1.12702 6 0.69143 0.60654 1.25302
5 0.68742 0.34794 1.07427 5 0.68605 0.37039 1.24183
4 0.56154 0.00056 0.98576 4 0.55041 0.00054 1.23908
3 0.34256 0.00145 1.13675 3 0.54678 0.00056 1.27865
2 0.24577 0.00675 1.27658 2 0.49278 0.00034 1.42786
1 0.25677 0.00098 1.12786 1 0.44526 0.00027 1.56754
0 0.20986 1.09876 0 0.27897 1.21080
3.3 Exercice 3 :
On dispose des réalisations (moyennes mensuelles) du taux d'intérêt au jour le jour sur le marché in-
terbancaire de la zone euro et du taux d'intérêt sur les valeurs d'Etat à 5 ans, notés respectivement iSt
et iLt pour les mois de janvier 2005 à mai 2009, soit 53 observations au total sur chaque série.
Au moyen de cette base de données, on a réalisé par OLS les six ajustements dont les résultats vous
sont donnés ci-après, sachant que l'on note m le nombre d'autocorrélations sur la série résiduelle
considérées dans le calcul de la statistique de Ljung-Box appelée QLB (m) et que l'opérateur est
dé ni par = (1 L), où L est l'opérateur de décalage habituel, Lj xt = xt j :
iSt = 0:1028 0:0355iSt 1 + 0:6856 iSt 1 + 0:3659 iSt 2

0:3307 iSt 3
(0:0081) (0:025) (0:142) (0:169) (0:154)
R2 = 0:66; QLB (12) = 10:999. (53)
iLt = 0:3390 0:0915iLt 1 + 0:5108 iLt 1

0:0868 iLt 2 + 0:4124 iLt 3
(0:0228) (0:062) (0:155) (0:0171) (0:171)
0:1709 iLt 4
0:0554 iLt 5 + 0:2254 iLt 6
0:2922 iLt 7
(0:0171) (0:0171) (0:0165) (0:0167)
R2 = 0:38; QLB (12) = 3:670. (54)
2 2 2
iS t = 0:0076 0:2631 iSt 1
0:0657 iSt 1 + 0:3165 iS t 2
(0:0020) (0:079) (0:0150) (0:143)
R2 = 0:22; QLB (12) = 9:311. (55)
2 2 2 2
iLt = 0:0065 0:9282 iLt 1 + 0:4122 iLt 1 + 0:2768 iLt 2 + 0:4452 iL t 3
(0:0028) (0:287) (0:0271) (0:0244) (0:213)
2 2 2
+0:2217 iLt 4 + 0:1446 iLt 5 + 0:3357 iL t 6
(0:0215) (0:0183) (0:167)
R2 = 0:45; QLB (12) = 6:478. (56)
iLt = 1:8821 bt
0:5603iSt + u
(0:123) (0:039)
R2 = 0:80; QLB (12) = 53:921. (57)

bt =
u bt
0:4387 u 1 bt
+ 0:4291 u 1 bt
+ 0:1153 u 2 bt
+ 0:1749 u 3 + vbt
(0:124) (0:142) (0:0146) (0:0147)
R2 = 0:26; QLB (12) = 10:254. (58)
Quelles sont vos conclusions. Pensez à indiquer les nombres de degrés de liberté des statistiques
que vous utilisez ?

Non Stationnarite Cointegration MCE

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Non Stationnarite Cointegration MCE

Transféré par

Droits d'auteur :

Formats disponibles

1

Chapitre 4 : Non Stationnarité, Cointégration

Master 1 Economie - Université Paris X

Chapitre 4 : Non Stationnarité, Cointégration et Modèles à Correction d'Erreur

Section 1 : Non stationnarité

– Caractérisation des processus aléatoires non stationnaires

– Tests de non stationnarité

Section 2 : Régression avec des variables non stationnaires

– Notion de régressions fallacieuses

– Modèles à correction d'erreur (MCE)

1.1 Dé nition de la stationnarité

son espérance est constante dans le temps:

sa variance est constante dans le temps:

Cov (Xt; Xt k ) = E f(Xt ) (Xt k )g = (k) (3)

avec (k) ne dépendant pas de t.

1.2 Caractérisation des processus aléatoires non stationnaires

Nous présentons ci-contre ces deux classes de processus non stationnaires.

1.2.1 Les processus TS

Xt = f (t) + zt; (4)

Xt = a0 + a1t + "t; (5)

avec a0, a1 2 R des paramètres, "t un bruit blanc de variance ".

E (Xt) = E (a0 + a1t + "t)

processus stationnaire. Formellement, Xt (a0 + a1t) = "t est stationnaire.

zt = z t 1 + "t = ( z t 2 + "t 1 ) + "t (9)

car "t est un bruit blanc. De même, on a:

1.2.2 Les processus DS

(1 L)d Xt = (1 L) Xt = Xt Xt 1 = Xt: (15)

(1 L)d Xt = (1 L)2 Xt = (1 L) (1 L) Xt (16)

Par conséquent, un processus Xt est intégré d'ordre 1, si sa différence première Xt = Xt Xt 1

Xt = Xt 1 + "t = (Xt 2 + "t 1) + "t (18)

car "t est un bruit blanc. De même, on obtient:

marchés) une marche aléatoire.

aléatoire avec dérive et trend:

1.3 Tests de non stationnarité

1.3.1 Test de Dickey-Fuller (DF)

Pour chacune de ces équations le jeu d'hypothèses est le suivant2:

Etape 2 : On s'intéresse à la spéci cation (29):

d'hypothèses est le suivant:

1.3.2 Test de Dickey-Fuller Augmenté (ADF)

avec vt un bruit blanc. On obtient alors:

2 Régression avec des variables non stationnaires

2.1 Notion de régressions fallacieuses

De façon formelle, considérons deux processus stochastiques Xt et Yt respectivement I (1) et in-

avec "t iid 0; 2

L'estimateur MCO b ne converge pas vers la vraie valeur 0;

La statistique de student pour tester la nullité de diverge vers 1.

procéder à la régression sur les séries différenciées

De manière générale, la combinaison de deux processus stochastiques Xt et Yt respectivement I (d)

Toutes les composantes sont intégrées d'ordre d;

Si zt a n composantes, il y a au plus n 1 relations de cointégrations linéairement indépendantes.

La plupart des séries économiques et nancières sont CI(1; 1) :

Yt + " Yt Xt + "Xt I (0)

Yt Xt + ("Yt "Xt ) I (0) (46)

2.3 Modèle à correction d'erreur

On peut alors écrire pour la variable4 Yt:

2.4 Test de cointégration et estimation du modèle à correction d'erreur

par ebt, soit

Question 3 : La masse monétaire est-elle stationnaire à 5%?

Avec constante Avec constante et trend

iSt = 0:1028 0:0355iSt 1 + 0:6856 iSt 1 + 0:3659 iSt 2

R2 = 0:66; QLB (12) = 10:999. (53)

iLt = 0:3390 0:0915iLt 1 + 0:5108 iLt 1

R2 = 0:38; QLB (12) = 3:670. (54)