Vous êtes sur la page 1sur 80

Chapitre 2. UFR Economie Applique. Cours de C.

Hurlin

U.F.R. Economie Applique


Matrise dEconomie Applique
Cours de Tronc Commun

Economtrie Applique
Sries Temporelles

Christophe HURLIN

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

Chapitre 2
Tests de Non Stationnarit
et Processus Alatoires Non Stationnaires

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

Dans le premier chapitre, nous avons vu quune des premire tape de la dmarche de modlisation dune srie temporelle consiste vrifier la stationnarit du processus gnrateur de donnes.
Gnralement, on se limite vrifier la stationnarit faible ou stationnarit du second ordre.
Nous allons prsent tudier de faon de plus prcise ce quest un processus non stationnaire.
Il existe en eet deux sorte de non stationnarit : la non stationnarit dterministe et la non
stationnarit stochastique. Nous verrons que suivant lorigine de la non stationnarit, il convient
dadopter une mthode de stationnarisation particulire.
La seconde partie de ce chapitre sera ensuite consacre la prsentation des principaux tests
de non stationnarit. Il sagit alors de dfinir une stratgie empirique permettant de vrifier si les
processus sont stationnaires ou au contraire si il est ncessaire de les stationnariser et quelle est
alors la mthode approprie.

Processus non stationnaires

Dans le premier chapitre, nous avons introduit la notion de stationnarit du second ordre ou stationnarit faible. Daprs cette dfinition, un processus est stationnaire au second ordre si lensemble
de ses moments dordre un et dordre deux sont indpendants du temps. Par opposition, un processus non stationnaire est un processus qui ne satisfait pas lune ou lautre de ces deux conditions.
Ainsi, lorigine de la non stationnarit peut provenir dune dpendance du moment dordre un (lesprance) par rapport au temps et/ou dune dpendance de la variance ou des autocovariances par
rapport au temps.
Le fait quun processus soit stationnaire ou non conditionne le choix de la modlisation que lon
doit adopter. En rgle gnrale, si lon sen tient notamment la mthodologie de Box et Jenkins,
si la srie tudie est issue dun processus stationnaire, on cherche alors le meilleur modle parmi
la classe des processus stationnaire pour la reprsenter, puis on estime ce modle. En revanche
si la srie est issue dun processus non stationnaire, on doit avant toutes choses, chercher la
stationnariser, cest dire trouver une transformation stationnaire de ce processus. Puis, on
modlise et lon estime les paramtres associs la composante stationnaire.
La dicult rside dans le fait quil existe direntes sources de non stationnarit et qu chaque
origine de la non stationnarit est associe une mthode propre de stationnarisation. Nous allons
donc commencer dans cette section par prsenter deux classes de processus non stationnaires,
selon la terminologie de Nelson et Plosser (1982) : les processus T S (Time Stationary) et les
processus DS (Dierency Stationary). Dans la section suivante, nous prsenterons les mthodes de
stationnarisation pour chacune de ces classes de processus. Mais au del des enjeux de modlisation
conomtriques, nous verrons dans cette partie, que lorigine de la non stationnarit a de trs fortes

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

implications sur lanalyse conomique des sries que lon tudie. Nous verrons en particulier que
pour les processus DS il existe une proprit de persistance des chocs qui nexiste pas dans les
processus T S. Une telle hypothse implique par exemple que si les sries macroconomiques satisfont
une reprsentation de type DS, limpact des chocs conjoncturels peut avoir un eet permanent sur
le niveau de la srie tudie.

Avant de prsenter de faon formelle les direntes sources de non stationnarit, nous allons
considrer quelques exemples simples de processus non stationnaires. Rappelons au passage la
dfinition de la stationnarit du second ordre (cf. chapitre 1) :
Definition 1 Un processus (xt , t Z) est dit stationnaire au second ordre, ou stationnaire au sens faible, ou stationnaire dordre deux si les trois conditions suivantes sont
satisfaites :
t Z, E x2t <
t Z, E (xt ) = m, indpendant de t
(t, h) Z2 , cov (xt , xt+h ) = E [(xt+h m) (xt m)] = (h) , indpendant de t
Figure 1.1: Processus Non Stationnaire : Modle avec Rupture
15

10

-5
50

100

150

200

250

Sur la figure (1.1), est reprsente une simulation dun processus (xt , t Z) prsentant une
rupture de moyenne partir de la date t0 = 125, avec (t , t Z) i.i.d. (0, 2) :
xt = 3 + t

t < t0

xt = 10 + t

t t0

Ce processus est par dfinition non stationnaire (condition sur le moment dordre un) et lon
vrifie bien sur la figure (1.1) que la ralisation de la moyenne empirique (estimateur convergent de

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

lesprance) dpendra alors de lchantillon considr (avant t0 , ou aprs t0 ). Dans ce cas, la non
stationnarit provient de la rupture du modle, ou plus gnralement de la non linarit.
Un autre exemple de processus non stationnaire est celui du processus suivant :
xt = 1 + 0.05t + t
avec t i.i.d.N (0, 1) . Dans ce cas, le processus xt correspond la somme dune fonction linaire du
temps, f (t) = 1 + 0.05t et dun bruit blanc.
Figure 1.2: Processus Non Stationnaire : Trend Dterministe
20
15
10
5
0
-5
50

100

150

200

250

On voit clairement sur le graphique (1.2) que ce processus ne satisfait pas la seconde condition
de la dfinition de la stationnarit du second ordre. En eet E (xt ) = 1 + 0.05t croit avec le
temps, chaque date la variable alatoire xt , t Z a une esprance plus grande que celle de
xt1 , xt2 , ..., xtj ... Dans ce cas, lorigine de la non stationnarit provient tout naturellement de
linclusion de la tendance (ou plus gnralement de la fonction du temps f (.)) dans la dfinition
du processus (xt , t Z) . On dit que la non stationnarit est alors de type dterministe.
Mais il existe dautres sources de non stationnarit. Considrons le processus suivant, que lon
qualifie gnralement de marche alatoire pure (Random Walk Process) ou marche alatoire sans
drive :
(1.1)
xt = xt1 + t
avec t i.i.d.N 0, 2 . A priori dans ce cas, la non stationnarit nest pas de type dterministe,
puisque le processus xt ne comporte pas de fonction dterministe du temps (figure 1.3). Pourtant
ce type de processus est aussi non stationnaire. Cherchons donc dterminer lorigine de cette non

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

stationnarit. Le processus (xt , t Z) peut se rcrire sous la forme :


xt = t + t1 + t2 + ... + tj + ...
=

tj

(1.2)

j=0

Ds lors, connaissant les proprits du bruit blanc t , on montre que :

E (xt ) = E

j=0

tj =

E (tj ) = 0

(1.3)

j=0

Donc le processus xt , t Z a une esprance nulle et donc satisfait la seconde condition de la


dfinition de la stationnarit. Mais il ne satisfait pas la premire condition puisque :

V (xt ) = V

j=0

tj =

V (tj ) =

j=0

j=0

(1.4)

La variance de xt est non convergente. De plus, si lon avait dfinie une condition initiale
2
2
x0 , alors la variance de xt , dfinie par V (xt ) = t1
j=0 = t serait fonction de t. La troisime
condition de la stationnarit faible est alors viole. Le processus (xt , t Z) est donc un processus
non stationnaire. Pourtant, lexamen dune ralisation quelconque de ce processus (figure 1.3) ne
permet pas a priori de dire que cette variable est non stationnaire. On sent dores et dj, la
ncessit de proposer des tests de lhypothse de stationnarit.
Figure 1.3: Processus Non Stationnaire : Marche Alatoire Sans Drive
15
10
5
0
-5
-10
-15
50

100

150

200

250

Dans ce dernier cas, la non stationnarit du processus (xt , t Z) tient au fait que les chocs t
saccumulent au cours du temps, ce qui accrot la variance de xt au fer et mesure que le temps
passe. Lorigine de la non stationnarit provient ici de laccumulation de chocs stochastiques t :

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

la non stationnarit peut donc tre de type stochastique. Le fait que la stationnarit puisse tre
de type dterministe ou stochastique nous amne prsent dfinir la classe des processus T S
(T rend Stationary), qui correspondent une non stationnarit de type dterministe et la classe
des processus DS (Dif ferency Stationary), qui correspondent une non stationnarit de type
stochastique. Cette distinction selon lorigine de la non stationnarit est essentielle tant sur le plan
statistique que sur le plan de lanalyse conomique.

1.1

Les processus TS

Commenons par dfinir ce quest un processus T S pour T rend Stationary , selon la terminologie
propose par Nelson et Plosser (1982)
Definition 2 (xt , t Z) est un processus T S sil peut scrire sous la forme
xt = f (t) + zt

(1.5)

o f (t) est une fonction du temps et zt est un processus stochastique stationnaire.


Dans ce cas, le processus xt scrit comme la somme dune fonction dterministe du temps
et dune composante stochastique stationnaire, ventuellement de type ARMA. Ds lors, il est
vident que le processus ne satisfait plus la dfinition de la stationnarit du second ordre. En eet,
on montre immdiatement que E (xt ) = f (t) + z o z = E (zt ) , dpend du temps, ce qui viole la
seconde condition de la dfinition dun processus stationnaire.
Lexemple le plus simple dun processus T S est celui dune tendance linaire perturbe par un
bruit blanc. On pose f (t) = a0 + a1 t et zt = t :
xt = a0 + a1 t + t

(1.6)

avec (a0 , a1 ) R2 , t i.i.d. 0, 2 . Dans ce cas, on vrifie que le processus xt est non stationnaire
puisque lesprance, E (xt ) = a0 + a1 t, dpend de t. En revanche, le processus yt dfini par lcart
entre xt et la composante dterministe f (t) = a0 + a1 t, est quand lui stationnaire : yt =
xt a0 + a1 t = t est un bruit blanc, par dfinition stationnaire.

Une des proprits importantes de ce type de processus rside dans linfluence des innovations
stochastiques t . En eet, nous allons montrer que lorsque un processus T S est aect par un choc
stochastique, leet de ce choc tend disparatre au fer et mesure que le temps passe : cest la
proprit de non persistance des chocs. De faon plus formelle, cette proprit est la suivante :

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

Proprit 1. Linfluence dun choc t une date T sur un processus xt dfini par
xt = f (t) + zt
avec zt stationnaire et E (zt ) = 0, est transitoire. La tendance du modle tant
dterministe, aprs le choc T , la squence des xt converge ainsi vers sa valeur de
long terme dfinie par f (t) . Il ny a pas de persistance des chocs.
Cela signifie que lorsque lon a un processus T S, en cas de choc positif ou ngatif une date
donne, toutes choses gales par ailleurs, linfluence de ce choc a tendance sestomper au cours
du temps. La variable considre rejoint alors sa dynamique de long terme dtermine par f (t).
Dans le cas o f (t) est une fonction ane du temps, la variable rejoint la tendance linaire de long
terme. Cette proprit traduit lexistence dune tendance non stochastique, et qui donc ne prsente
pas de rupture ds lors que la fonction f (t) est continue. Economiquement, cela signifie que la
trajectoire de long terme de la srie est insensible aux alas conjoncturels.
Afin dillustrer cette proprit considrons lexemple suivant o lon a introduit une structure
autorgressive dans la perturbation zt :
xt = a0 + a1 t + zt

(1.7)

zt = zt1 + t

(1.8)

o (a0 , a1 ) R2 , || < 1 et t i.i.d. 0, 2 . Le processus zt est un AR (1) stationnaire, puisque


la racine associe son polynme autorgressif, gale 1/, est suprieure lunit en module.
Admettons que E (zt ) = 0. Etudions prsent linfluence du choc t une date T quelconque
sur la squence des (xt , t T ) . Pour ce faire, appliquons la dcomposition de Wold au processus
stationnaire zt , il vient :
zt =

j tj

j=0

On peut alors rcrire le processus xt sous la forme suivante :


xt = a0 + a1 t +

j tj

j=0

Supposons qu la date T, on a ait une ralisation du choc T positive (T > 0) et quensuite


les chocs t pour t T soient nuls. A la date T, on a donc :
xT = a0 + a1 T +

j=0

j T j

A la date T + 1, les chocs T +1 tant nul, on obtient :


xT +1 = a0 + a1 (T + 1) +

j=1

j T +1j

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

De faon gnrale, toute date T + k, k 0, le processus xT +k est dfini par :


xT +k = a0 + a1 (T + k) +

j T +kj

(1.9)

j=k

On peut alors montrer que plus le temps passe, cest dire plus k est lev, plus linfluence
du choc T de la date T sestompe. Linfluence de ce choc est donc transitoire. En eet, la
v.a.r. xT +k va converger vers sa valeur de long terme dfinie par la tendance linaire f (.) . Pour
le montrer, il sut de considrer lcart entre xT +k et la valeur correspondante de la tendance
f (T + k) = a0 + a1 (T + k) et de montrer que cet cart converge vers 0 quand k tend vers linfini.
On pose xt = xt f (t) . A la date T + k, on a xT +k = xT +k a0 + a1 (T + k) et daprs lquation
(1.9), cet cart la tendance linaire, peut se rcrire sous la forme :
xT +k =

j T +kj = lim

j=k

k T + k+1 T 1 + ... + k+n T n

(1.10)

Maintenant, voyons ce qui se passe lorsque lon sloigne de la date du dernier choc T, cest
dire lorsque k tend vers linfini.
lim xT +k = lim

lim

k T + k+1 T 1 + ... + k+n T n

(1.11)

Sous lhypothse que le processus zt est stationnaire, cest dire sous lhypothse que || < 1,
alors montre immdiatement que :
p
(1.12)
xT +k 0
k

Ce rsultat signifie que lorsque k tend vers linfini, lcart entre le processus xT +k et la tendance
linaire, converge en probabilit vers 0. Ainsi, sous leet des chocs antrieurs la date T, on sest
loign de la tendance, mais lorsque le temps passe, leet de ces chocs sestompe et lon rejoint
la tendance de long terme. Ce rsultat illustre labsence de persistance des chocs, ou
labsence dhystrsis pour les processus T S.

Nous allons prsent raliser une exprience numrique pour illustrer cette proprit de non
persistance. On considre le processus xt = 1+0.05 t+zt avec zt = zt1 +t o z0 = 1, = 0.4 < 1
et t i.i.d. (0, 1) . Le profil gnral dune ralisation de ce processus est celui de la figure (1.2). Nous
allons prsent crire un petit programme sous Eviews dans lequel nous allons annuler toutes les
ralisations du choc t partir de la date T = 50, puis nous allons comparer les volutions du
processus xt et de la tendance dterministe f (t) = 1 + 0.05 t. Le programme1 utilis sous Eviews
est le suivant :
1

Pour lancer ce programme, il convient au pralable de crer un Workfile de type Undated or Irregular, de 1
100, puis de charger le programme (open program ) ou de le taper (new program ), et ensuite de lexcuter (Run).

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

10

- Cuhdwlrq gh od vhulh gh fkrfvvpso 1 50


jhqu hsv = quqg
vpso 51 100
jhqu hsv = 0
- Cuhdwlrq gh od frpsrvdqwh vwdwlrqqdluh }
vpso 1 100
jhqu } = 1
vpso 2 100
jhqu } = 0.4*}(-1)+hsv
- Cuhdwlrq gh od whqgdqfh i
vpso 1 100
jhqu i = 1+0.05*@wuhqg(1)
- Cuhdwlrq gh od vhulh {
jhqu { = i+}
Ce programme dbute par la simulation dune ralisation des chocs tirs dans une loi normale
N (0, 1) par linstruction quqg sur la priode de 1 50, puis par lannulation des chocs pour t allant
de 51 100. Ensuite on construit une ralisation de la composante stationnaire zt . On commence
pour cela par initialiser la srie zt lunit (puisque z0 = 1) sur lensemble de la priode, puis on
gnre un AR (1) grce linstruction }(-1) qui correspond aux valeurs retardes dune priode
de la srie zt . Enfin, on cre la composante tendancielle dterministe f (t) laide de linstruction
@wuhqg(q) qui permet de gnrer un trend prenant la valeur 0 la date N.
Figure 1.4: Illustration de la Proprit de Non Persistance des Chocs : Processus T S
8
6
4
2
0
-2
10

20

30

40

50
X

60
F

70

80

90

100

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

11

Sur le graphique (1.4) on a report les deux sries i et { en crant un groupe sous Eviews. On
vrifie sur cette figure qu partir de la date darrt des chocs (T = 50), la ralisation du processus
xt converge vers la tendance dterministe. Les chocs antrieurs la date T voient leur influence
diminuer au fer et mesure que le temps passe. On vrifie bien ici la proprit de non persistance
des chocs propre au processus T S.

1.2

Les processus DS

Comme nous lavons prcdemment mentionn, il existe une autre forme de non stationnarit,
provenant non pas de la prsence dune composante dterministe tendancielle, mais dune source
stochastique. Cest pourquoi nous allons prsent introduire la dfinition des processus DS pour
Dif ferency Stationnary.
Definition 3 Un processus non stationnaire (xt , t Z) est un processus DS (Dif ferency
Stationnary) dordre d, o d dsigne lordre dintgration, si le processus filtr dfini
par (1 L)d xt est stationnaire. On dit aussi que (xt , t Z) est un processus intgr
dordre d, not I (d) .
Ainsi, on peut dfinir une classe de processus stochastiques qui ne satisfont pas les conditions
de la stationnarit, mais dont la dirence lordre d satisfait elle les proprits de la stationnarit.
Par exemple, si un processus zt nest pas stationnaire, on dit que ce processus est DS, intgr
dordre un, not I (1) , si le processus dfini par la dirence premire zt = zt zt1 est quant
lui stationnaire. De la mme faon, le processus zt est I (2) si le processus dfini par la dirence
seconde (1 L)2 zt = (1 L) zt = zt 2zt1 + zt2 est stationnaire.
On comprend alors que la dfinition des processus DS repose sur la prsence de racines unitaires
dans le polynme associ la dynamique autorgressive du processus.
Proprit 1. Un processus non stationnaire (xt , t Z) est un processus DS intgr
dordre d, not I (d) , si le polynme (L) dfini en loprateur retard L, associ
sa composante autorgressive admet d racines unitaires :
(L) xt = zt

avec (L) = (1 L)d (L)

(1.13)

o zt est un processus stationnaire, et si les racines du polynme (L) sont toutes


suprieures strictement lunit en module.
En eet, on pose (L) xt = zt avec (L) = (1 L)d (L) . Si lon admet que les racines du
polynme (L) sont infrieures lunit en module, ce polynme est inversible. On peut alors
crire la dirence de`me de xt sous la forme dune somme de valeurs retardes de zt , :
(1 L)d (L) xt = zt (1 L)d xt = (L) zt

(1.14)

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

12

o (L) = 1 (L) . Si zt est un processus stationnaire, la somme pondre de ses valeurs passes
(L) zt est elle aussi stationnaire. Donc, en rsum, ds lors que le polynme autorgressif (L)
de xt admet d racines unitaires, la quantit (1 L)d xt est stationnaire, donc le processus xt est
I (d) .
E{hpsoh : Considrons le processus ARM A(2, 2) suivant (L) xt = (L) t avec (L) =
1 2.5L + 1.5L2 et (L) = (1 0.5L) , et t i.i.d. 0, 2 . On admet que xt est non stationnaire
et lon cherche dterminer si xt est un processus I (d) et quel est alors son degr dintgration.
Pour cela il sut de dterminer le nombre de racines unitaires de (L) . Soient 1 et 2 les racines
de (L) = 0, on a 1 = 1 et 2 = 2/3. Ds lors, le processus xt est I (1) , en eet :
(L) = 1

1
L
1

1
3
L = (1 L) 1 L (1 L)d (L)
2
2

o (L) = 1 32 L admet une racine 2 = 2/3 infrieure un en module.

Dans la classe gnrale des processus DS, un type de processus apparat de faon rgulire, si
bien que lon lui a attribu un nom particulier : la marche alatoire.
Definition 4 Une marche alatoire (Random W alk), ou martingale, est un processus
AR (1) intgr dordre un, not I (1) :
xt = (1 L) xt = c + t xt = c + xt1 + t

(1.15)

o t est un bruit blanc i.i.d. 0, 2 . Si c = 0, on parle dune marche alatoire pure


(P ure Random W alk).
Le terme de marche alatoire provient du fait que la ralisations du processus la date t, part
de lendroit o stait arrt xt1 (la ralisation de xt1 ) et va dans une direction (le choc t )
totalement alatoire. Les processus de martingale sont ainsi souvent employs en finance, o sous
des proprits particulires (marchs complets etc..) ils permettent de caractriser le cours dun
actif et le rsultat selon lequel il ny a pas de meilleure prdicteur pour le cours de demain que le
cours daujourdhui.

Une des principales proprits des processus DS est lhystrsis ou la persistance des chocs.
Proprit 2. Linfluence dune innovation t une date T sur un processus I (d)
(1 L)d xt = (L) t

(1.16)

est permanente. On a ainsi une proprit de persistance des chocs ou dhystrsis.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

13

Cela signifie que, contrairement au cas des processus T S, les chocs alatoires t conservent une
influence sur le niveau de la variable I (d) et cela jusqu linfini des temps. Pour bien comprendre
cette proprit, nous allons considrer le cas dune marche alatoire avec drive :
xt = c + xt1 + t

(1.17)

o t i.i.d. 0, 2 . On sait que ce processus I (1) est, par dfinition, non stationnaire, donc on
ne peut pas lui appliquer la dcomposition de Wold (cf. chapitre prcdent). Pour autant, rien
ne nous empche dexprimer xt sous la forme dune moyenne mobile infinie dans les innovations
passes tj . En eet, on a xt = c + xt1 + t , en substituant xt1 par son expression on obtient
xt = 2c + xt2 + t1 + t . En itrant t fois cette substitution, on obtient finalement :
t

xt = x0 + t.c +

(1.18)

j=1

On constate2 partir de cette criture moyenne mobile infinie que le processus (xt , t Z) correspond une accumulation des chocs passs et prsent. Ds lors, un choc une date T quelconque
un impact permanent sur le niveau processus pour toutes les dates ultrieures. Supposons ainsi
pour simplifier que c = 0 et quil ny ait quun seul choc T la date T (t = 0, t = T ). Le
processus xt la date T est alors dfini par xT = x0 + T . Pour tout k 0, on a xT +k = x0 + T .
Ds lors, lorsque k tend vers linfini, le niveau du processus xT +k ne rejoint pas la valeur initiale
x0 . Leet du choc est donc permanent.

Sur la figure (1.5), on a simul deux marches alatoires avec et sans drive, pour un chantillon
de taille 100. La premire not xt correspond au processus xt = xt1 + t et la seconde au processus
yt = yt1 + 0.05 + t avec t i.i.d. N (0, 1) et x1 = y1 = 1. Le programme utilis sous Eviews est le
suivant :
- Cuhdwlrq gh od vhulh g lqqrydwlrqvvpso 1 1000
jhqu hsv = quqg
2

On vrifie au passage que la marche alatoire xt est non stationnaire puisque si lon suppose que la condition
initiale x0 est donne et exogne, on a :
E (xt ) = t = x0 + t.c
(1.19)
lim E (xt t )2 = lim

(h) = E (xt t ) xth th

t2 =

= 2 min (t, t h)

(1.20)
h Z

(1.21)

Ds lors, les trois conditions de la stationnarit du second ordre sont violes. Ceci est vrai, mme si la constante c
est nulle puisque dans ce cas les premire (quation 1.20) et troisime conditions (quation 1.21) demeurent invalides.
Pour stationnariser la srie, il sut de lui appliquer le filtre (1 L)d , avec ici d = 1. En eet, (1 L) xt = t , o t
est un bruit blanc, donc la srie (1 L) xt est bien stationnaire.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

14

- Iqlwldolvdwlrqv ghv vhulhv


vpso 1 1000
jhqu { = 1
jhqu | = 1
- Cuhdwlrq ghv vhulhv { hw |
vpso 2 1000
jhqu { = {(-1)+hsv
jhqu | = |(-1)+0.05+hsv
vpso 1 1000
Le programme nappelle aucun commentaire particulier. Pour les deux ralisations obtenues
sur la figure (1.5), on constate qua priori il nexiste aucun phnomne de rattrapage vers une
quelconque tendance linaire de long terme pour ces deux processus. Mais en fait, nous verrons
que leur tendance est stochastique.
Figure 1.5: Simulations de Marches Alatoires
80
60
40
20
0
-20
200

400

600
X

800

1000

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

1.3

15

Processus DS ou T S : quels enjeux ?

A ce niveau de lexpos, on peut se demander quels sont les enjeux associs la distinction entre les
notions de non stationnarit dterministe et de non stationnarit stochastique. En eet aprs tout,
jusquen matrise les tudiants ont dj eu une certaine pratique de lconomtrie sans connatre la
notion de stationnarit. Alors, aprs tout, quest ce que cela change que les sries soient T S, DS
etc..., pourrait se demander ltudiant press de cliquer sur sa souris. Nous allons montrer que les
consquences sont doubles, sur le plan statistique et sur le plan conomique.
1.3.1

Consquences statistiques de la non stationnarit

Ce que nous allons montrer tout au long de ce chapitre, cest que si on lve lhypothse de stationnarit, et quen particulier on considre des processus de la classe DS, alors les principales
mthodes destimation et dinfrence deviennent non fondes.
Remarque Les proprits de stationnarit ou de non stationnarit des sries utilises
dterminent le type de modlisation et les proprits asymptotiques des mthodes
conomtriques correspondantes.
En dautres termes, le fait de savoir si la srie statistique est une ralisation dun processus
stationnaire, non stationnaire DS ou non stationnaire T S conditionne dune part le choix du
modle conomtrique qui doit tre utilis. Mais de faon plus fondamentale et insidieuse, cela
conditionne les proprits asymptotiques des estimateurs des paramtres de ce modle et donc par
consquent les proprits asymptotiques des statistiques des tests usuels sur les paramtres. Si le
processus est stationnaire on retrouve les proprits standard du cours dconomtrie de base, mais
si le processus est non stationnaire, et en particulier DS, on a alors des proprits asymptotiques
particulires.
Mais aprs tout, dira lconomtre cliqueur, moi les proprits asymptotiques des MCO et
des statistiques de test de Student cest pas mon problme ! Certes, mais lignorance de ces proprits asymptotiques particulires peut conduire, par exemple dans le cas dun processus DS des
erreurs de diagnostics et des modlisations totalement fallacieuses. Prenons un exemple concret
: le seuil asymptotique de significativit 5% dune statistique de Student dun test de nullit sur
un coecient. Tout conomtre, mme cliqueur, doit savoir que du fait de lapproximation de
la loi de Student par une loi normale N (0, 1) , ce seuil est asymptotiquement gal 1.96 dans le
cas standard. Ce seuil est en particulier valide dans le cas dune rgression entre deux processus
stationnaires. Or, nous allons montrer que lorsque lon rgresse deux processus I (1) , la loi asymptotique de la statistique de Student associ au test de la nullit du coecient estim nest plus une
loi de Student, ni une loi normale centre rduite. Ds lors, le fameux seuil 5% de 1.96 nest

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

16

plus valide. Si lconomtre cliqueur continue dutiliser ce seuil pour tablir son diagnostic ou sil
continue dutiliser les pvalues fournies par le logiciel dconomtrie sur la base dune distribution
normale, il peut commettre et il commettra souvent des erreurs de diagnostic. Ainsi, il acceptera
tort la significativit dune variable ou au contraire il rejettera tort la significativit dune autre.
Pour bien prendre la mesure des enjeux statistiques, nous allons mener une petite exprience
sous Eviews. On simule deux marches alatoires xt et yt qui nont aucun lien entre elles :
xt = xt1 + t
yt = yt1 + t
avec t N 0, 2 et t N 0, 2 . On pose T = 1000, 2 = 2 = 1. A partir de deux ralisations de
ces deux processus on estime le modle suivant par la mthode des MCO :
xt = 0 + 1 yt + t

(1.22)

De faon thorique, on sait que 1 = 0, puisquil nexiste aucune corrlation thorique entre les
deux variables. Le programme sous Eviews est le suivant :
- Cuhdwlrq ghv vhulhv g lqqrydwlrqvvpso 1 1000
jhqu hsv{ = quqg
jhqu hsv| = quqg
- Iqlwldolvdwlrqv ghv vhulhv
vpso 1 1000
jhqu { = 1
jhqu | = 1
- Cuhdwlrq ghv vhulhv { hw |
vpso 2 1000
jhqu { = {(-1)+hsv{
jhqu | = |(-1)+hsv|
vpso 1 1000
- Rhjuhvvlrq
ov { f |
Les rsultats de lestimation sont reports sur la figure (1.6). On constate que si lon sen tient
la thorie standard et que la test la significativit du coecient 1 , on conclut que 1 est dirent
de zro puisque la statistique de Student associe est trs largement suprieure au seuil 1.96 5%.
La variable yt est donc largement significative, alors que les deux marches alatoires sont totalement
indpendantes.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

17

Figure 1.6: Rgression de Deux Marches Alatoires

Cet exemple de simulations est ce que lon appelle une rgression fallacieuse (Spurious Regression). Dans la vraie vie, on peut ainsi multiplier cet exercice linfini. Il sut de considrer deux
sries non stationnaires, par exemple deux sries possdant une tendance croissante relativement
similaire, et de les rgresser lune sur lautre. En appliquant les thories asymptotiques standards,
vous montrerez ainsi que la production de sous vtements fminins au Burkina Faso est une variable
explicative trs importante dans la dtermination du cours de laction Microsoft sur la place de
New York. Il ne restera plus alors qu trouver une justification conomique...

1.3.2

Consquences conomiques

Les consquences conomiques de lintroduction des processus DS furent toutes aussi importantes
que les consquences statistiques. La mise vidence de la non stationnarit dorigine stochastique
a tout dabord conduit une mise en cause gnrale des schmas de dcomposition tendance /
cycle. Ce type de dcomposition est utilise dans de nombreux champs de lconomie applique
(par exemple en finance dans le cadre de lanalyse chartiste etc..), mais plus particulirement en
macroconomie. En eet, en macroconomie applique, la dcomposition des principales sries,
comme le PIB, le taux de chmage, en une composante tendancielle et un cart conjoncturel est
trs souvent employe. Sur le plan thorique, elle se justifie par la relative indpendance des thories
traditionnelles de la croissance par rapport aux thories des fluctuations conjoncturelles, souvent
inspirs des thses keynsiennes ou montaristes. Jusqu la fin des annes 80, les macroconomistes
eectuaient cette dcomposition laide de lextraction dune tendance dterministe des principales
sries macroconomiques.
Dans le cas du PIB, la tendance tait alors assimil au PIB potentiel, et les carts la tendance
estime correspondaient aux fluctuations conjoncturelles, cest dire aux cycles conomiques (GNP-

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

18

gap). Or dj la suite de la crise conomique des annes 70, la rupture de rythme de croissance des
conomies occidentales, avait conduit sinterroger sur cette mthode de dcomposition, puisque
une composante tendancielle ane du temps ne permet pas de rendre compte de cette volution.
Les plus optimistes assimilaient le ralentissement conomique leet transitoire dun choc sur la
composante dcart conjoncturel. Pour dautres, au contraire, les annes 70 marquaient une rupture
de tendance dans le schma de croissance. Mais ds lors que lon autorise la prsence dune rupture
de tendance, on tend remettre en cause le statut dterministe de la composante tendancielle.
La date de rupture est elle alatoire ? Le phnomne de rupture peut il se reproduire ? Quel
aurait t la signification dune tendance dterministe prsentant des ruptures toutes dates ? La
rponse toutes ces questions est venue avec la remise en cause de lassimilation de la composante
tendancielle une composante dterministe et donc au choix de la mthode de dcomposition.
Lextraction dune tendance est en eet une mthode de stationnarisation propre aux processus
T S, et ne sapplique pas aux processus DS. Nous allons montrer dans ce chapitre que la rgression dun processus DS sur une tendance dterministe peut engendrer des rsultats totalement
fallacieux. Chan, Hayya et Ord (1977) furent les premiers mettre en vidence ce rsultat, ils
montrent en particulier que :
Llimination dune tendance linaire dune marche alatoire cre artificiellement une
forte autocorrlation positive des rsidus dans les premiers retards, Chan, Hayya et
Ord (1977), p. 741.
Cela signifie que si la srie tudie est DS, et en particulier une marche alatoire, le fait de la
rgresser sur une tendance, comme le faisaient lpoque les macroconomistes, va conduire une
forte autocorrlation, totalement fallacieuse, des rsidus, qui correspondent en fait la composante
dcarts conjoncturels dans la dcomposition tendance / cycle. Or cette autocorrlation dterminent
en fait les caractristiques cycliques des fluctuations conjoncturelles. Nelson et Kang (1981, 1984),
partir de simulations, montrent ainsi que la composante conjoncturelle prsente une volution
pseudo priodique alors quaucun facteur nintervenait dans les processus gnrateurs de donnes.
Les cycles conomiques proviendraient ils dun artefact statistique ?
Lenjeu est important pour lanalyse conjoncturelle et la vision traditionnelle dune
dissociation entre cycle et croissance. A la limite, lexistence mme du phnomne
cyclique relverait-il de la construction artificielle de sries en carts une tendance
dterministe ? Slutz et Wasserfallen (1985) trouvent en eet que les cycles disparaissent
dans plusieurs conomies de lOCDE lorsque les sries dactivit sont considres comme
DS et non comme T S. On mesure de ce fait limportance que revt la possibilit de tests
spcifiques de la nature des sries macroconomiques, Hnin (1989), p. 666.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

19

La question qui se pose prsent est de savoir, si les principales sries utilise en macroconomie
sont issues de processus DS ou de processus T S. Aprs tout, si la non stationnarit stochastique est
un phnomne marginal, le rsultat de Chan, Hayya et Ord naurait que peu dimportance. Ainsi,
Nelson et Plosser (1982) furent les premiers appliquer de faon systmatique un ensemble de tests3
de lhypothse de racine unitaire, cest dire de tests de lhypothse DS, un ensemble de 14 sries
macroconomiques amricaines annuelles sur des dures de 60 ans un sicle et se terminant en
1970. Ils considrent le PNB rel, le PNB nominal, le PNB par tte, la production industrielle,
diverses sries de prix, de salaires et de rendement, la monnaie et sa vitesse de circulation ainsi
que le taux de chmage. A la seule exception du taux de chmage, les tests eectus ne permettent
pas de rejeter lhypothse de sries DS. Ainsi, lexception du taux de chmage, toutes les sries
macroconomiques amricaines sont issues de processus DS et non T S. Des conclusions similaires
ont t obtenues pour la plupart des pays de lOCDE.
Les conclusions de Nelson et Plosser (1982) ont trois principales consquences : la premire cest
que la prsence de racines unitaires implique que, pour une part au moins, les impulsions conjoncturelles sont constitues de chocs permanents. Linfluence dun choc aecte de faon permanente
le niveau de la variable observ, cest la proprit de persistance des chocs des processus DS. Une
telle proprit peut par exemple expliquer labsence de phnomne de rattrapage sur le PNB
aprs le choc des annes 70. Les sries comporte alors des tendances stochastiques. La seconde
consquence est que la plus grande part de la variabilit conjoncturelle aurait son origine dans la
tendance stochastique de lconomie, cest dire dans les ralisations du processus de croissance
lui mme. La troisime implication fut notamment lorigine du courant de pense de nouvelle
conomie classique ou des cycles rels (RBC pour Real Busisnes Cycles) : si lon assimile, comme
dans le keynsianisme de la synthse, les chocs de demande des chocs transitoires, il faut alors interprter comme chocs dore les impulsions permanentes qui dominent la variabilit conjoncturelle
des sries macroconomiques amricaines.

Les tests de Dickey Fuller et de Dickey Fuller Augments utiliss par les auteurs seront prsents dans les sections
3 et 4 de ce chapitre.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

20

Elments de thorie asymptotique pour les processus I (1)

On cherche prsent connatre les proprits asymptotiques destimateurs usuels comme les
MCO dans des modles conomtriques incluant des sries intgres. Nous nous au limiterons au
cas de sries intgres dordre 1, not I (1). Ces proprits nous permettront de non seulement
comprendre les modifications des proprits asymptotiques des MCO dans le cadre de rgressions
avec variables I (1) , mais aussi de construire des tests de lhypothse de non stationnarit.

2.1

Mouvement Brownien et Thorme Central Limite Fonctionnel

Dans cette section, nous introduirons la notion de mouvement Brownien, ou processus de Wiener,
puis nous prsenterons le thorme central limite fonctionnel.
2.1.1

Mouvement Brownien

La dfinition dun mouvement Brownien est la suivante :


Definition 5 Un mouvement Brownien standard W (.) est un processus stochastique en
temps continu qui chaque date t [0, 1] associe le scalaire W (t) tel que
(i) W (0) = 0
(ii) Pour toutes dates 0 t1 t2 ... tk 1, les accroissements correspondants
[W (t2 ) W (t1 )] , [W (t3 ) W (t2 )] ,...et [W (tk ) W (tk1 )] sont indpendants et distribus
selon une loi normale N (0, s t)
(iii) Pour toutes ralisations, W (t) est continu en t avec une probabilit de 1.
Un processus stochastique en temps continu W (.) associe toute date t R+ une variable
alatoire W (t) , alors quun processus en temps discret nest dfini que pour des indices de temps
entiers, t N. Cest pourquoi, on distingue gnralement la notation des indices pour ces deux types
de processus : un indice en subscript pour les processus en temps discret, Yt , et un indice entres
parenthses pour un processus en temps continu W (t) . Un processus en temps discret est ainsi
reprsent par une squence dnombrable de variables alatoires {Yt }
t=1 , tandis que la ralisation
dun processus en temps continu correspond une fonction stochastique W (.) , t [0, [ R1 .
Le mouvement Brownien est un processus en temps continu particulier, dont les ralisations
W (t) sont dfinies de faon continue sur t [0, 1], et donc les accroissements sont indpendants et
distribus selon une loi normale. On comprend ainsi, que bien que W (t) soit continu en t, cette
quantit ne peut pas tre direncie en utilisant les techniques usuelles, puisque laccroissement

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

21

entre les dates t et t+ peut aller dans nimporte quel direction et prendre nimporte quelle valeur,
et cela dautant plus que est trs petit.
2.1.2

Thorme central limite fonctionnel

On considre une Nous avons vu que lorsquune srie est intgre dordre un, linfluence des chocs
est persistante. Ds lors, si lon suppose par exemple que les ralisations des innovations dun
processus xt sont toutes positives, le processus considr a un comportement explosif, au sens o la
squence des xt diverge lorsque T tend vers linfini.
Soit xt un processus I (1) observ sur les dates t = 1, ., T. On sait que xt explose quand T
tend vers linfini. On a donc ici une dirence entre lindice du processus et la dimension T qui
tend vers linfini. On commence donc par se ramener un indice de temps unique tendant vers
linfini.
Definition 6 Si lon pose t = T. Tt = [r.T ] o [.] dsigne la partie entire, on a :
xt = x[r.T ]
avec r =

t
T

(2.23)

[0, 1] . On a ainsi concentr le temps et x[r.T ] est dite srie concentre.

Prenons lexemple dun processus {xt }Tt=0 avec T = 4. On cherche donc changer lindice de
temps de la squence de la faon suivante :
1 = [T.r] r =

1
4

2 = [T.r] r =

1
2

3
4 = [T.r] r = 1
4
On peut donc changer lindice de temps de la squence {x0 , x1 , x2 , x3 , x4 } de la faon suivante
x[T.0] , x[T 1 ] , x[T 1 ] , x[T 3 ] , x[T 1] ce qui revient poser x[T r] pour r = 0, 14 , 12 , 34 , 1 et T = 4.
4
2
4
Mais attention, la srie concentre x[r.T ] est dfinie pour un indice r continu sur [0, 1]. Ainsi, si
r < 1/4, alors [T.r] = 0, donc on a :x[T.r] = x0 . Pour4 r [1/4, 1/2[ alors [T.r] = 1, donc x[T.r] = x1 .
La dfinition du processus concentr x[r.T ] pour r [0, 1] est donc la suivante :
3 = [T.r] r =

x[r.T ]

x0

x
1
=
x2

3
x4

r < 14
1
1
4 r < 2
1
3
2 r < 4
3
4 r <1
r=1

(2.24)

De plus, lorsque T tend vers linfini lindice de la srie concentre x[T r] , r [0, 1] converge lui
aussi vers linfini.
4

Par exemple r = 0.3 [1/4, 1/2[ , on a [T.r] = [4.0.3] = [1.2] = 1.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

22

En second lieu, il faut contrler la vitesse dexplosion de la srie. On sait que si xt est I (1) ,
ce processus explose en t1/2 quand T tend vers linfini. Mais de faon gnrale on note la
vitesse dexplosion dun processus qui explose en t . On cherche alors contrler cette vitesse de
convergence de la faon suivante :
Definition 7 Si le processus xt explose en t , > 0, on note :
XT (r) =

x[T r]
r [0, 1]
T

(2.25)

On cherche alors caractriser XT (r) (qui est un processus index par un ensemble continu
sur r), lorsque T tend vers linfini, pour tout r [0, 1] en choisissant de telle sorte que XT (r)
nait plus de comportement explosif en T. Pour cela nous allons prsent considrer lexemple de
la marche alatoire pure.
On considre un processus xt reprsent par une marche alatoire pure :
xt = xt1 + t

(2.26)
t
j=1 j .

On sait que le processus xt explose

XT (r) = T 2 x[T r] r [0, 1]

(2.27)

avec t i.i.d. 0, 2 . On pose x0 = 0, ds lors on a xt =


1
la vitesse T 2 . On dfinit donc la srie suivante :
1

Or, dans ce cas on montre que :


[T.r]

XT (r) = T

12
j=1

j r [0, 1]

(2.28)

En fait, le processus XT (r) correspond un processus en marche descalier. Pour tout r <
on a t = [r.T ] = 0 et donc on a x[T.r] = x0

1
T,

Theorem 8 (Thorme Central Limite Fonctionnel TCLF) Soit vt un vecteur de dimension


n de variables alatoires i.i.d. (0, ) , avec = P P . On pose, t = 1, .., T
ut = (L) vt =

s vts

s=0

o les lments sij du polynme matriciel (L) vrifient

T XT (.)
squence de fonctions stochastiques vectorielles
XT

1
(r) =
T

s=0 s

T =1

[T r]

t=1

ut r [0, 1]

sij < i, j = 1, .., n. La

dfinies par

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

23

a une distribution asymptotique dcrite par un mouvement Brownien vectoriel (n, n) standard, not
W (.).

L
T XT (.) (1) P W (.)
T

(1) P W (r)

est distribu suivant une loi normale N 0, r (1) (1)

Dans le cas r = 1, on retrouve le TCL standard.

Theorem 9 (Continuous Mapping Theorem) Soit ST (.) une fonction stochastique telle que
L
L
ST (.) S (.) et soit g (.) une fonctionnelle continue, alors g [ST (.)] g [S (.)] .

2.2

Application aux processus I (1)

La premire utilisation du thorme central limite fonctionnel pour tablir les distributions asymptotiques de statistiques construites partir de processus I (1) est due Phillips (1986, 1978). On
se limitera ici ltude du cas simple dune marche alatoire. Pour ltude des processus dont
les innovations sont autocorrles, le lecteur pourra se rfrer Phillips (1986, 1978). Ces distributions asymptotiques nous serons particulirement utiles pour la construction des tests de non
stationnarit et pour bien comprendre les enjeux statistiques de la non stationnarit statistique.
Lillustration la plus simple des rsultats de Phillips conduit tudier une marche alatoire
pure :
(2.29)
xt = xt1 + t
avec t i.i.d. 0, 2 . On suppose pour simplifier que la condition initiale sur le processus (2.29) est
dterministe et nulle : x0 = 0. Nous avons vu que dans ce cas l le processus en temps discret xt
correspond laccumulation des chocs passs entre la date 1 et la date t :
xt = 1 + 2 + ... + t

(2.30)

A partir de la dfinition du processus xt on peut dfinir la fonction continue stochastique


XT (r) = x[r.T ] /T en fonction dun indice de temps continu r [0, 1] :

XT (r) =

1
T x0
1
T x1
1
T x2

=0
= T1
= T1 (1 + 2 )

...

1
T xT =

1
T

(1 + .. + T )

0 r < T1
2
1
T r < T
3
2
T r < T
...
r=1

(2.31)

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

24

La fonction stochastique XT (r), conditionnellement aux ralisations 1 , 2 , ..., T peut ainsi tre
reprsente sous la forme dune fonction en marches descalier , comme le montre lillustration
(2.7). Pour toutes les valeurs de r comprises entre 0 et 1/T, valeur exclue, les ralisations de
T XT (r) correspondent la condition initiale x0 . Entre 1/T et 2/T, valeur exclue, les ralisations
de T XT (r) correspondent la ralisation 1 , et ainsi de suite. Pour les valeurs de r comprises entre
(T 1) /T et T, ralisations de T XT (r) correspondent la somme des ralisations de 1 T 1 .
Figure 2.7: Illustration de la Forme des Ralisations XT (r)

Bien entendu, laire dfinie par cette fonction en marches descalier correspond la somme de
laire de T rectangles. Le ie`me rectangle a une largeur gale 1/T et une longueur gale xi1 /T ,
et donc son aire est gale xi1 /T 2 . Ds lors lintgrale de la fonction stochastique XT (r) est
quivalente la somme :
1

x0
x1
x2
xT 1
+ 2 + 2 + ... +
2
T
T
T
T2
0

En multipliant les deux membres de cette galit par T , on obtient :


XT (r) dr =

XT (r) dr = T 2

(2.32)

xt1

(2.33)

t=1

Or, daprs le thorme central limite fonctionnel on sait que :

L
T XT (.) W (.)

(2.34)

On dfinie prsent une fonctionnelle continue g (.) , telle que g


1
0 XT

T XT (r) =

(r) dr, par application du continuous mapping theorem on obtient :

1
T XT
0

(r) dr =

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

XT (r) dr

W (r) dr

25

(2.35)

Ds lors, on peut tablir la distribution asymptotique de la somme de marches alatoires :


T

T2
t=1

xt1

W (r) dr

(2.36)

0
3

Ce rsultat implique que pour une marche alatoire sans drive, la somme T 2 Tt=1 xt1 converge vers une variable alatoire de distribution normale N 0, 2 /3 dont la distribution peut tre
exprime comme une intgrale de ralisations de mouvements Browniens de variance 2 . Il est intressant de rappeler ici que pour une marche alatoire sans drive, la moyenne empirique T Tt=1 xt
diverge.

De la mme faon, en utilisant le thorme central limite fonctionnel ainsi que le continuous
mapping theorem, on peut driver la distribution asymptotique de la plupart des moments empiriques dune marche alatoire. Ces rsultats sont rsums dans la proposition (10).
Proposition 10 On considre un processus xt satisfaisant une reprsentation AR (1)
non stationnaire I (1) telle que :
(2.37)
xt = xt1 + t
avec x0 = 0 et o t i.i.d. 0, 2 . Les distributions asymptotiques des principaux moments empiriques de xt sont alors les suivantes :
T
L

T 1/2
t=1

t W (1)

T
L

T 1
t=1

xt1 t

1 2

[W (1)]2 1

t t W (1)
T

t=1

T
t=1

xt1
T

t=1

x2t1 2
T

W (r) dr

(2.41)

[W (r)]2 dr

(2.42)

T 5/2
t=1

t xt1
T

(2.40)

0
1

W (r) dr
0

T 3/2

(2.39)

3/2

(2.38)

r W (r) dr
0

(2.43)

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin


T

T 3
t=1

26

r [W (r)]2 dr

(2.44)

tv 1/ (v + 1) v N

(2.45)

t x2t1 2
T

(v+1)
t=1

o W (.) dsigne un mouvement Brownien standard.


Nous ne dmontrerons pas lensemble des ces convergences. Nous nous limiterons aux rsultats
(2.39) et (2.42). Commenons par le rsultat (2.42). Pour cela, on dfinit une nouveau processus
en temps continu ST (r) tel que :
ST (r) T [XT (r)]2

r [0, 1]

(2.46)

Ce nouveau processus ST (r) correspond en fait la somme partiel des carrs des innovations
t puisque :
1 2
0 r < T1

T x0 = 0

1
1
2
2
2
1

T x1 = T 1
T r < T
2
1
3
2
1 2
ST (r) =
(2.47)
T x2 = T (1 + 2 )
T r < T

...
...

1 2
2
1
r=1
T xT = T (1 + .. + T )
En faisant le mme raisonnement que prcdemment, on montre que :
T

T 2

x2t1 =
t=1

x2T 1
x20
x21
x22
+
+
+
...
+
=
T2 T2 T2
T2

ST (r) dr

(2.48)

Daprs le thorme central limite fonctionnel on sait que :

L
T XT (.) W (.)
T

On dfinit prsent une fonctionnelle continue g (.) , telle que toute ralisation ST (r) =
2
2

1
1
T XT (r) on associe g [ST (r)] = 0 ST (r) dr = 0
T XT (r) dr. Par applicaT [XT (r)]2 =
tion du continuous mapping theorem on obtient :
1

ST (r) dr =
0

T XT (r)

dr g [ W (r)]
T

[ W (r)]2 dr

Daprs ce rsultat, en reprenant lgalit (2.48), on dmontre finalement le rsultat (2.42) :


T

T 2

x2t1 =
t=1

1
0

ST (r) dr 2
T

[W (r)]2 dr

(2.49)

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

27

Dmontrons prsent le rsultat (2.39) de la proposition (10) selon lequel :


T

1 2

T 1
t=1

xt1 t

[W (1)]2 1

(2.50)
T
t=1 xt1 t .

Pour cela il convient tout dabord de transformer le moment empirique


on utilise le rsultat suivant :

2
T

t1

2t + 2

t=1

t=1

t=1

j t

j=1

Etant la dfinition de la marche alatoire xt , on sait que xt =


cette galit peut se rcrire sous la forme suivante :
T

Pour cela,

T
t=1 t

(2.51)

puisque x0 = 0. Ds lors

x2T =

2t + 2
t=1

xt1 t
t=1

On en dduit alors une nouvelle expression du moment empirique qui nous intresse, savoir
T
t=1 xt1 t :
1
T

1
T

1
2

xt1 t =
t=1

x2T

1
T

1
2

2t

(2.52)

t=1

Etudions la convergence de ces dirents lements. Commenons par la quantit T 1 Tt=1 2t .


En utilisant la loi des grands nombres (cf. chapitre 1), on sait que si t est i.i.d. 0, 2 alors cette
quantit, qui est tout simplement le moment empirique dordre deux des t , converge en probabilit
vers le moment thorique dordre deux, savoir la variance 2 :
1
T

T
t=1

2t 2

(2.53)

Reste le premier lments de lquation (2.52). En reprenant la dfinition du processus en


2

T XT (1) . Daprs
temps continu ST (.) , on montre immdiatement que T 1 x2T = ST (1)

le thorme central limite fonctionnel, on sait que T XT (1) converge en loi vers W (1) . Ds

lors, on dfinit une fonctionnelle g (.) qui toute ralisation T XT (r) associe g T XT (r) =
2

T XT (r) = ST (r) . Par application du continuous mapping theorem on montre alors que ST (1)
converge en loi vers 2 [W (1)]2 . Finalement, on montre ainsi que :
1
T

x2T = ST (1) g [ST (1)] 2 [W (1)]2

(2.54)

En reprenant les rsultats (2.53) et (2.54), ainsi que lexpression (2.52) du moment empirique
on retrouve le rsultat (2.39) de la proposition (10) :
1
T

xt1 t =
t=1

1
2

1
T

2
2

x2T

1
2

[W (1)]2

1
T
2
2

2t
t=1

(2.55)

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

28

Rappelons que la ralisation W (1) , cest dire la ralisation dun mouvement Brownien la
date 1, a une distribution N (0, 1) . Cela signifie que la variable alatoire [W (1)]2 a une distribution
2 (1) .
Ltude de ces distributions asymptotiques nous permet en particulier de dfinir les vitesses de
convergence des dirents moments empiriques de la marche alatoire. Cette vitesse est reprsent
par la puissance de T pour laquelle un processus T zt converge en probabilit vers une valeur
finie.

Definition 11 Une squence de variable alatoire {zt }


t=1 est dite Op (T ), si pour tout
> 0, il existe une valeur finie M telle que :

zT
>M
T

<

(2.56)

En appliquant cette dfinition aux rsultats de la proposition (10), on dtermine les vitesses de
convergence des dirents moments empiriques :
Proposition 12 Les vitesses de convergence des moments empiriques dune marche
alatoire sont les suivantes :
1
T
2
t=1 t = Op T
3
T
2
t=1 t t = Op T
T
2
2
t=1 xt1 = Op T
L
T
2
= Op
t=1 t xt1 T

T
t=1 xt1 t = Op (T )
3
T
2
t=1 xt1 = Op T
5
T
2
t=1 t xt1 = Op T

T3

Ltudiant intress devra outre la proposition (10), tudier le cas o les innovations t sont
autocorrls et le cas vectoriel, o xt dsigne un vecteur dobservation de n variables.

2.3

Les rgressions fallacieuses

Maintenant que nous avons tabli les distributions asymptotique dun certain nombre de moments
empiriques associs une marche alatoire, on peut sintresser aux proprits asymptotiques des
estimateurs des MCO et des principales statistiques de tests usuelles lorsque le modle comprend
des variables I (1) . Nous allons en particulier tudier le cas des rgressions fallacieuses (Spurious
Regressions). De faon gnrale, on a le rsultat suivant :
Definition 13 On considre une rgression de la forme yt = xt + t o xt et yt dsigne
deux variables I (1) . On suppose quil nexiste aucune valeur de telle que le rsidu
t = yt xt soit I (0). Alors lestimateur des MCO, appliqu ce modle, conduit
une phnomne de rgression fallacieuse.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

29

Ce phnomne a t mis en vidence partir dexpriences de Monte Carlo par Granger et


Newbold (1974) et fut plus tard expliqu thoriquement par Phillips (1986). Que ce passe-t-il dans
le cas des rgressions fallacieuses ? Nous allons montrer que bien que les estimateurs des MCO
soient convergents, la plupart des statistiques de tests usuelles nont plus une distribution standard.
Ds lors, on comprend les enjeux statistiques associs la non stationnarit : si lon applique les
thories usuelles dans des configurations de rgressions fallacieuses, on pourra montrer sans aucun
problme que la production de sous vtements fminins au Burkina Faso est une variable explicative
trs importante dans la dtermination du cours de laction Microsoft sur la place de New York....
Nous allons tout dabord tudier ce phnomne sur le plan thorique avant de mener des expriences
de Monte Carlo.
2.3.1

Distributions asymptotiques dans le cas des rgressions fallacieuses

Montrons prsent comment, dans le cas dune rgression fallacieuse, les proprits asymptotiques
des estimateurs et des statistiques de tests usuelles sont aectes. Pour cela nous allons considrer
un petit modle extrmement simple.
Hypothses (H1 ) On considre deux marches alatoires pures sans aucun lien :
xt = xt1 + t

(2.57)

yt = yt1 + t

(2.58)

avec x0 = y0 = 0, et t i.i.d. 0, 2 , t i.i.d. 0, 2 . On suppose que les innovations


des processus xt et yt sont totalement indpendantes : E (t s ) = 0, (s, t) .
Supposons quun conomtre tourdi rgresse la variable xt sur la variable yt , sans avoir au
pralable diagnostiquer la non stationnarit de ces deux processus et labsence de relation stable
entre les deux sries. Notre conomtre va donc eectuer la rgression :
yt = 0 + 1 xt + t

(2.59)

Nous sommes ici dans une configuration de rgression fallacieuse. Etudions le comportement
asymptotitque des estimateurs des MCO, 0 et 1 ainsi que le comportement asymptotique de la
statistique de Student associe au test H0 : 1 = 0. Rappelons au passage, que puisque les deux
variables xt et yt nont aucun lien, on a 1 = 0 = 0.
Commenons par tudier le comportement des estimateurs 0 et 1 . Daprs la dfinition des
estimateurs de MCO du modle (2.59), on a :
1 T

T
xt
yt
T
0
t=1
t=1

(2.60)
=
T
T

T
1
2
xt
xt
xt yt
t=1

t=1

t=1

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

30

Essayons prsent dtudier la vitesse de convergence des dirents lements des estimateurs
0 et 1 . Llment T diverge la vitesse T, il est Op (T ). Concernant llment Tt=1 xt , on a :
T

xt =
t=1

t=1

T
t=1 xt

xt1 +
t=1

= Op T 2

et que

T
t=1 xt1

= Op T 2 .

par T 3/2 pour obtenir une distribution non divergente :

T 3/2

(2.61)

t=1
1

T
t=1 t

Nous avons vu dans la section prcdent que


Il convient donc de dflater

xt1 + xT =

xt = T 3/2
t=1

xt1 + T 1 T 1/2
t=1
T

= T 3/2

t
t=1

xt1 + T 1 .Op T 2
t=1

Cela signifie que la quantit droite de cette expression converge en probabilit vers 0, lorsque
T tend vers linfini :
T

T
L

T 1/2
t=1

t W (1) T 1 T 1/2
T

t=1

T
t=1 xt

converge vers la mme limite que T 3/2


Ainsi la quantit T 3/2
utilisant la proposition (10), on montre que :
T
t=1

Ds lors, en

T 3/2

T
t=1 xt1 .

xt
T

W1 (r) dr

(2.62)

W2 (r) dr

(2.63)

De la mme faon, on montre que :


T

3/2
t=1

yt
T

o W1 (.) et W2 (.) sont deux mouvement Browniens standards indpendants.


T
2
t=1 xt

Concernant llment
T

de la dfinition des MCO, on sait que :


T

x2t =
t=1

x2t1 + x2T =
t=1

x2t1 +
t=1

(2.64)

t=1

Par un raisonnement analogue au prcdent, sachant que Tt=1 x2t1 = Op T 2 , il convient de


dflater Tt=1 x2t par T 2 pour obtenir une distribution non divergente :
T

x2t

= T

t=1

t=1
T

= T 2

+T

1/2

t
t=1
1

xt1 + T 1 . Op T 2
t=1

x2t1

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

31

De la mme faon, on montre que la quantit T 2 Tt=1 x2t converge vers la mme limite que
T 2 Tt=1 x2t1 . Ds lors, en utilisant la proposition (10), on montre que :
T

T 2
t=1

x2t1 2
T

[W1 (r)]2 dr

(2.65)

o W1 (.) dsigne le mouvement Brownien prcdemment dfini.


Il ne reste plus enfin qu tudier la convergence de llment
suivant :
T

t=1

On admettra le rsultat

T 2

T
t=1 xt yt .

xt yt

W1 (r) W2 (r) dr

(2.66)

o W1 (.) et W2 (.) sont les deux mouvement Browniens prcdemment dfinis.


Nous avons prsent lensemble des lements ncessaires la dtermination de la distribution
asymptotique des estimateurs 0 et 1 . Il sut pour cela dquilibrer lquation (2.60) dans les
termes en T , aprs avoir contrler la vitesse de convergence de chaque lment5 . On obtient alors
la distribution asymptotique des estimateurs 0 et 1 .
Proposition 14 Sous les hypothses (2.3.1), les estimateurs des MCO , 0 et 1 ,
obtenus dans le modle :
(2.67)
yt = 0 + 1 xt + t
ont pour distribution asymptotique :
1

T 2 0
1

T 1 .T
T

32

xt

t=1

t=1
T

T 2

t=1

32

1
0 W1 (r) dr

32

T 2

xt

2
xt

yt

xt yt

t=1
T
t=1

1
0 W1 (r) dr
1
2 0 [W1 (r)]2 dr

(2.68)

1
0 W2 (r) dr

1
0 W1 (r) W2 (r) dr

En explicitant les termes de la proposition (14), on montre en particulier que :

1 h1 =
T

1
1
1
0 W1 (r) W2 (r) dr 0 W1 (r) dr 0 W2 (r) dr

2
1
1
2
0 [W1 (r)] dr
0 W1 (r) dr

En eet, T R+ , et (a, b, c, d, e, f ) R6 tels que ad = c2 , on a :


T 1 a
3
T2 c

T2 c
T 2 d

T2 e
T 2 f

de+cf
T (ad+c2 )
ce+af
ad+c2

(2.69)

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

32

On remarque que la loi asymptotique de lestimateur 1 est non standard, pour autant cette
estimateur demeure convergent puisque on peut montrer que la distribution h1 est quivalente
une loi normale centre sur 0. En moyenne, lestimateur 1 est donc nul, ce qui est logique compte
tenu de la dfinition du modle. Mais attention cela ne signifie pas que la ralisation de 1 est nulle.
Or, lconomtre tourdi partir de la ralisation de 1 va eectuer un test de significativit pour
tester si le paramtre 1 est nul. Reste donc savoir si le test de Student 1 = 0 ne va pas conduire
lconomtre un mauvais diagnostic si ce dernier continue dappliquer la thorie standard et par
1
exemple le seuil de 1.96 5%. Par la suite, on notre h0 la distribution asymptotique de T 2 0 .

Dterminons donc prsent la distribution de la statistique de Student, not t , associe au


1
test de lhypothse 1 = 0, sachant que sous (2.3.1) cette hypothse est vraie. De faon standard,
la statistique t est dfinie de la faon suivante :
1

t =
1

T
2
t=1 t

o s2T =

(2.70)

sT ( 22 ) 2

/ (T 2) dsigne lestimateur de la variance des rsidus t et o 22 dsigne

llment de la deuxime colonne, deuxime ligne de la matrice (XX)1 . En utilisant lcriture


(2.60), on montre que :

1
2 2
T
T
1
T
x2t
xt
(2.71)
t =
1
1
sT T 2
t=1
t=1

Commenons par dterminer la distribution asymptotique de s2T et en particulier de la somme


T
2
des carrs des rsidus SCRT =
t=1 t .
T

SCRT

2t

t=1
T

=
t=1

t=1
T

yt2

yt 0 1 xt
0 + 1 xt

t=1

T
2
t=1 yt

On sait que le premier lment de cette somme


2

yt 0 + 1 xt

(2.72)

t=1

est Op T 2 . Dans le second lment,

la quantit Tt=1 1 x2t est aussi Op T 2 , ainsi que la quantit Tt=1 0 xt . Enfin, dans le troisime
terme, seul la quantit Tt=1 xt yt est Op T 2 . Il faut donc diviser la somme des carrs des rsidus
par T 2 pour obtenir une distribution non divergente. En regroupant les termes croiss ayant une
vitesse de convergence gale T 2 , on obtient :
T

SCRT = T

yt2
t=1

2
1

x2t
t=1

2 0

t=1

xt 2 1

xt yt + T 2+ Op ()
t=1

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

33

avec < 2. En utilisant les rsultats prcdents, on montre que :


T 1 s2T =

SCRT
L

T (T 2) T

(2.73)

avec
1

= 2

[W2 (r)]2 dr h1 2

[W1 (r)]2 dr

2h0

W1 (r) dr 2h1

W1 (r) W2 (r) dr

(2.74)

o h0 et h1 dsignent les distributions asymptotiques de 0 et de 1 , et o W1 (.) et W2 (.) sont


deux mouvement Browniens standards indpendants. Dores et dj, on peut faire la remarque
suivante :
Remarque Sous les hypothses (2.3.1), lestimateur s2T de la variance des rsidus t
dans le modle
(2.75)
yt = 0 + 1 xt + t
diverge, puisque :
L

T 1 s2T

(2.76)

avec
= 2

1
0

[W2 (r)]2 dr h1 2

2h0

[W1 (r)]2 dr

W1 (r) dr 2h1

W1 (r) W2 (r) dr

(2.77)

o h0 et h1 dsignent les distributions asymptotiques de 0 et de 1 , et o W1 (.)


et W2 (.) sont deux mouvement Browniens standards indpendants.
Cette remarque signifie que si lconomtre tourdi ne dflate pas lestimateur s2T par T, il
obtiendra une ralisation dun processus divergent. Plus T sera important, plus s2T sera grand.
Pour T tendant vers linfini, s2T diverge. Le problme cest que s2T intervient dans la construction
de la statistique de Student. Ds lors, nous allons montrer que cette statistique diverge elle aussi.
En eet, reprenons lexpression (2.71) de la statistique de Student

t =
1

1
1

sT T 2

x2t
t=1

xt
t=1

1
2

(2.78)

On sait que sT est Op T 1/2 , 1 est Op (1) , Tt=1 x2t est Op T 2 et que Tt=1 xt est Op T 3/2 .
En utilisant ces proprits, on contrle la vitesse de convergence des dirents lements de la faon

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin


suivante :
t

1
T T 2 T 2
x2t
1/2
T
sT T 1/2 T 1/2
t=1

34

T 3/2

T 1/2 sT

T 2

x2t

t=1

T
3

3/2

3/2

xt
t=1

1
2

xt
t=1

1
2

(2.79)

Ds lors, on constate immdiatement que pour obtenir une valeur non divergente de la statistique
de Student, celle-ci doit imprativement tre multipli par une facteur T 1/2 . Si lon ne multiplie
pas la statistique de Student par ce facteur, celle -ci diverge. Plus lchantillon est grand plus
les ralisations de la statistique de Student seront importantes. En eet, en utilisant les rsultats
asymptotiques prcdents, on tablit immdiatement la proposition suivante.
Proposition 15 Sous les hypothses (2.3.1), la statistique de Student associe au test
1 = 0, fonde sur lestimateur des MCO, dans le modle :
yt = 0 + 1 xt + t

(2.80)

est divergente. On montre que :


T

12

1
T 1/2 sT
L

h1

T 2
1

x2t
t=1

[W1 (r)]2 dr

3/2

xt
t=1

1
2

W1 (r) dr

(2.81)

o h0 et h1 dsignent les distributions asymptotiques de 0 et de 1 , et o W1 (.) et


W2 (.) sont deux mouvement Browniens standards indpendants.
Ainsi, si notre conomtre tourdi ne contrle pas la vitesse de convergence de la statistique
de Student, cest dire sil considre uniquement les ralisations de t , il obtiendra ds lors des
1
ralisations dun processus qui diverge la vitesse T 1/2 . Pour un mme tirage de chocs, plus la
taille dchantillon sera importante, plus la ralisation de t sera grande. Ds lors, si lconomtre
1
applique le seuil de significativit standard de 1.96 5%, il aura de forte chance de rejeter tort
la nullit du paramtre , et ce dautant plus que la taille dchantillon est importante. Ainsi
si lon rgresse deux marches alatoires qui nont aucun lien, les tests usuels conduisent dans de
trs nombreux cas accepter tort la significativit de la variable explicative. Cest que lon
a pu observer dans le tableau (1.6) o lon constate que la statistique de Student est gale
20 (T = 1000) alors que les deux sries non aucun lien. Voil pourquoi, si lon sen tient la
thorie usuelle des tests, la production de sous vtements fminins au Burkina Faso est une variable
explicative trs importante dans la dtermination du cours de laction Microsoft sur la place de New
York...

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin


2.3.2

35

Exercices de Simulations

Afin de mieux comprendre la divergence de la statistique dans le cas dune rgression fallacieuse,
nous allons prsent mener un exercice de simulation. On simule 1000 ralisations des processus
{xt }Tt=1 et {yt }Tt=1 , pour une taille dchantillon T, selon le modle :
xt = xt1 + t

(2.82)

yt = yt1 + t

(2.83)

avec x0 = y0 = 0, et t i.i.d. N (0, 1) , t i.i.d. N (0, 1) . Pour chaque pseudo chantillon, on eectue
la rgression :
yt = 0 + 1 xt + t
et lon stocke la ralisation de la statistique de Student t associe au test 1 = 0. On dispose
1
ainsi de 1000 ralisations de cette statistique partir desquelles on peut calculer un certain nombre
dindicateurs. Dans le programme, nous faisons varier la taille des chantillons qui est dabord fixe
T = 5000, puis T = 1000, puis T = 500 et enfin T = 100. Le programme utilis est report en
Annexe (A.1). Les rsultats sont reports dans le tableau (2.1)
Tableau 2.1: Rsultats des Simulations : t
Moyenne des t
1
Mdiane des t
1
Ecart Type
Moyenne des t
Skewness
Kurtosis
P

> 1.96

T = 100
0.03
0.17
10.24

T = 500
0.45
0.73
22.01

T = 1000
0.47
0.32
31.77

T = 5000
0.54
4.14
69.83

8.06
0.03
3.03

17.40
0.03
3.05

24.46
0.03
3.46

55.74
0.13
2.81

0.83

0.93

0.94

0.98

L es r su ltats s ont ob tenu s p artir d e 1 000 sim u lation s.

On observe que plus la taille dchantillon crot, plus lcart type des ralisations augmente
tandis que la moyenne est peu prs stable. Cela signifie que plus la taille augmente, plus les
ralisations sont importantes en valeur absolue, comme le confirme la quatrime ligne du tableau
(2.1). La valeur absolue de t crot avec T , ce qui confirme notre rsultat thorique de divergence.
1
Cest pourquoi, notre conomtre tourdi sil applique les thories usuelles et sil compare la ralisation de t avec le seuil de 1.96 5%, rejettera dautant plus souvent lhypothse nulle 1 = 0
1
que la taille T sera importante. On constate, sur la dernire ligne du tableau, que le nombre de
ralisations de t suprieures au seuil de 1.96 crot avec T.
1

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

36

Les implications statistiques de la non stationnarit sont donc particulirement fortes, puisque
dans notre exercice pour T = 100, lconomtre tourdi rejettera dans prs de 83% de cas lhypothse de nullit de 1 . Ainsi, notre conomtre aura 8 chances sur dix darmer que la variable
xt est significative dans la rgression de yt sur xt , alors que les deux processus nont aucun lien.
Encore une fois, si lon sen tient la thorie usuelle des tests, la production de sous vtements
fminins au Burkina Faso est ainsi une variable explicative trs importante dans la dtermination
du cours de laction Microsoft sur la place de New York... Bien entendu, une telle conclusion ne
serait sans doute pas accept, si lon avait au pralable stationnaris les deux sries xt et yt en
les direntiant. Cest pourquoi la stationnarisation des sries est une tape fondamentale de la
modlisation conomtrique.

2.4

Consquences dune mauvaise stationnarisation du processus

Nous avons dans la section prcdente montrer quel point la stationnarisation des sries tait
importante pour viter de se retrouver dans la situation des rgressions fallacieuses. Reste dterminer quelle est la mthode de stationnarisation approprie suivant que la srie est DS ou T S.
Proposition 16 Pour stationnariser un processus T S, il convient de retirer la composante dterministe ft en rgressant la srie xt sur la plan dfini par les puissances
de t. Pour stationnariser un processus DS dordre d, il convient dappliquer le filtre
(1 L)d .
Par exemple, pour stationnariser le processus xt = a0 + a1 t + t , il sut de rgresser xt sur
une constante et sur t pour obtenir un processus xt a0 a1 t stationnaire. Nous allons prsent
tudier les consquences dune mauvaise stationnarisation des processus.
2.4.1

Consquence sur un processus TS

Supposons que (xt , t Z) soit un processus T S dfini par


xt = a0 + a1 t + t
o t est un bruit blanc gaussien N 0, 2 . Supposons que lon applique, tort, au processus xt
un filtre aux dirences premires. On dfinit le processus xt tel que
xt = (1 L) xt = xt xt1
On montre que
xt = a1 + t t1
Cette criture implique que lapplication dun filtre aux dirences premires au processus
T S xt a conduit introduire une racine unitaire dans la partie moyenne mobile du processus

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

37

xt = (1 L) xt . Vrifions si lapplication dun filtre aux dirences premires nous a permis


de dfinir un processus xt stationnaire. Reprenons les trois conditions de la dfinition de la
stationnarit du second ordre.
Convergence de E (xt )2 : On montre que E (xt )2 converge puisque
E (xt )2

= E (xt xt1 )2 = E [a1 + (t t1 )]2


= a21 + E (t t1 )2 = a21 + 22 <

Moment dordre un : Montrons que E (xt ) est indpendant de t


E (xt ) = a1 indpendant de t
Moments dordre deux : Dterminons la fonction gnratrice dautocovariance (h) du processus xt .
(h) = E {[xt E (xt )] [xth E (xth )]}
= E [(t t1 ) (th th1 )]
Do lon tire que :

22
(h) =
2

h=0
h = {1; 1}
sinon

(2.84)

On vrifie que (h) est indpendant de t. Donc les trois conditions de la stationnarit du second
ordre sont vrifies. Le processus xt est stationnaire. Attention, rsultat nest pas gnral puisque
par exemple lapplication dun filtre lordre deux (1 L)2 aurait conduit un processus 2 xt non
stationnaire. Mais mme si le processus xt est stationnaire, il ne correspond un bruit blanc.
Remarque 1. La direnciation dun processus T S conduit une autocorrlation fallacieuse du rsidu du filtre.
En eet, la fonction gnratrice dautocovariance (h) ne correspond pas celle dun bruit
blanc. Donc le fait davoir direnci xt a introduit une autocorrlation dordre un de linnovation
du processus xt qui nexistait pas dans la composante stationnaire du processus xt a0 a1 t.
2.4.2

Consquence sur un processus DS

Supposons que (xt , t Z) soit un processus DS dfini dordre un sans drive (P ure Random W alk)
xt = xt1 + t

(2.85)

o t est un bruit blanc gaussien N 0, 2 . Supposons que lon applique, tort, au processus xt
une mthode de stationnarisation consistant rgresser la srie xt sur une constante et un trend
dterministe t. On considre donc le modle empirique suivant
xt = 0 + 1 t + t

(2.86)

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

38

On devrait alors montrer que les estimateurs des MCO 0 et 1 convergent vers 0 et que les
t-statistiques (test de Student) associes sont gnralement non significatives aux seuils standards.
Or nous allons voir prcisment que tel nest pas le cas. La distribution des t-statistiques est en
particulier divergente et une fois contrle par la vitesse de convergence, cette distribution est de
plus non standard.
Remarque 2. Lextraction dune tendance linaire dun processus DS conduit crer
artificiellement une forte autocorrlation des rsidus aux premiers retards et donc
un mouvement pseudo-priodique des rsidus.

Considrons un petit exemple. Soit le processus xt = xt1 + t o t suit une N (0, 1/4) . On
considre 1000 chantillons du bruit blanc t partir desquels sont construites 1000 pseudo sries
xt . Pour chacun de ces pseudo chantillons, on tudie la rgression :
xt = 0 + 1 t + t
On obtient alors les rsultats suivants :
1

moyenne des 0 = 1.3081 moyenne des 1 = 0.0007. var(T 2 1 )

4 2
3

moyenne des t 0 = 5.26 et moyenne des t 1 = 2.34


P t 0 > 1.96 = 93% et P t 1 > 1.96 = 96% . Cela signifie que si lon applique tort
les seuils de significativit standard, dans plus de 90% des cas on rejette lhypothse de nullit
des coecients 0 et 1 .
Autocorrlation moyenne des rsidus t : ordre 1 : 0.9899, ordre 2 : 0.9799, ordre 3 : 0.9699,
ordre 10 : 0.9012.

Tout ceci montre limportance de bien choisir la mthode de stationnarisation des sries en
fonction de lorigine de la non stationnarit : DS ou T S Il convient donc prsent de prsenter des
tests qui nous permettent, tout dabord de vrifier que les sries sont non stationnaires et dautre
part de discriminer entre les processus DS et T S : ce sont les tests de racine unitaire.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

39

Un Test de Racine Unitaire : le Test de Dickey Fuller

Le test de Dickey Fuller simple (1979) est un test de racine unitaire (ou de non stationnarit) dont
lhypothse nulle est la non stationnarit dun processus autorgressif dordre un. Considrons un
processus (xt , t Z) satisfaisant la reprsentation AR (1) suivante :
xt = xt1 + t

(3.87)

avec t i.i.d. 0, 2 , et R. Le principe gnral du test de Dickey Fuller consiste tester


lhypothse nulle de la prsence dune racine unitaire :
H0 : = 1

(3.88)

Ha : || < 1

(3.89)

En eet, sous lhypothse nulle H0 , le processus (3.87) se ramne une pure marche alatoire
(Random Walk Process). Lhypothse nulle teste correspond ainsi une hypothse de non stationnarit stochastique 6 . Ce test, comme tout test non symtrique, peut tre ralis de direntes
faons. La plus simple consiste utiliser une statistique de Student associe lhypothse H0 .
En cela, le test de Dickey Fuller ne se distingue pas dun test quelconque dune hypothse non
symtrique. L o lapplication du test de Dickey Fuller dire de celle dun test standard, cest
dans la distribution asymptotique de la statistique de Student associe au test H0 . En eet, nous
allons montrer que la distribution asymptotique de lestimateur des MCO du paramtre , sous
lhypothse de non stationnarit, est non standard. On na plus dans ce cas une distribution asymptotique normale, comme en conomtrie de base. De la mme faon, la statistique de Student
associe au tests = 1, na pas une distribution asymptotique standard (distribution de Student
approxime par une distribution normale). Cest pourquoi, lapplication du test de Dickey Fuller
ncessite que lon utilise des seuils dirents de ceux que lon utilise traditionnellement pour des
statistiques de Student.
De plus, puisquun malheur narrive jamais seul, nous montrerons que la distribution asymptotique de la statistique de Student associe au test H0 , nest pas la mme suivant que dans le modle
(3.87) on inclut ou non, une constante et un trend dterministe. Ds lors, puisque a priori, on
se sait pas si lon doit inclure cette constante et ce trend, il convient dappliquer non pas un test
simple, mais une stratgie de tests de Dickey Fuller.

Cest pourquoi le test de Dickey Fuller, contrairement dautres tests que nous verrons par la suite, est un test
de non stationnarit, et non pas un test de stationnarit.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

3.1

40

Des distributions asymptotiques non standard sous H0

Considrons le modle le plus simple sans constante, ni trend. Soit un processus (xt , t Z) satisfaisant la reprsentation AR (1) suivante :
xt = xt1 + t

(3.90)

avec t i.i.d. 0, 2 . Dans ce modle, le test de Dickey Fuller revient tester lhypothse nulle
= 1. Nous commencerons par tudier la distribution asymptotique de lestimateur des MCO du
paramtre , sous lhypothse H0 . Puis nous tudierons la distribution la statistique de Student
associe au test = 1.
3.1.1

Distribution de lestimateur

Daprs la dfinition des MCO, pour un chantillon de taille T, lestimateur est dfini par :
T

xt xt1
=

t=1
T

(3.91)

t=1

x2t1

Nous savons que sous, lhypothse H0 ( = 1) , le processus gnrateur de donnes (modle


3.108) se ramne alors une simple marche alatoire
xt = xt1 + t
avec t i.i.d. 0, 2 . Ainsi on a Tt=1 xt xt1 =
lestimateur peut scrire sous la forme :

(3.92)

T
2
t=1 xt1

T
t=1 xt1 t .

Ds lors, le biais associ

xt1 t
1=

t=1
T

(3.93)

t=1

x2t1

Afin de contrler les vitesses de convergence des moments empiriques apparaissant au numrateur et au dnominateur, nous allons transformer cette expression de la faon suivante :
T 1

xt1 t

t=1
T
T 2

T ( 1) =

t=1

(3.94)
x2t1

Nous savons que sous, lhypothse H0 ( = 1) , le processus gnrateur de donnes est une
simple marche alatoire. En appliquant le Thorme Central Limite Fonctionnel et le Continuous
Mapping Theorem, on sait que dans ce cas :
T
L

T 1
t=1

xt1 t

2
W (1)2 1
2

(3.95)

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin


T

T 2
t=1

x2t1 2
T

[W (r)]2 dr

41

(3.96)

o W (.) dsigne un mouvement Brownien scalaire standard. On peut alors tablir la distribution
asymptotique de lestimateur sous lhypothse H0 .

Proposition 17 Sous lhypothse H0 de non stationnarit, = 1, la distribution asymptotique de lestimateur des MCO du paramtre dans le modle
xt = xt1 + t

(3.97)

2
1 W (1) 1
T ( 1)
T 2 1 [W (r)]2 dr
0

(3.98)

avec t i.i.d. 0, 2 , est la suivante :


L

o W (.) est un mouvement Brownien standard.


On vrifie ainsi que conformment ce que nous avions nonc en introduction, la distribution
asymptotique de lestimateur obtenue sous H0 est non standard, et en particulier non symtrique.
Plusieurs remarques peuvent tre faites ce niveau, qui nous permettront de bien comprendre les
implications de la non stationnarit.

Remarque 1. Lestimateur converge la vitesse 1/T , sous lhypothse H0 = 1, alors


quil converge la vitesse 1/T 1/2 sous lhypothse alternative Ha , || < 1 :
2
1 W (1) 1
Sous H0 : T ( 1)
T 2 1 [W (r)]2 dr
0
L

Sous Ha :

L
T ( ) N 0, 2
T

(3.99)
(3.100)

Une autre faon de comprendre ce rsultat est la suivante. Quelle que soit lhypothse retenue,
stationnarit ou non, lestimateur des MCO converge en probabilit vers la vraie valeur (avec
= 1, si H0 est vraie, || < 1, si Ha est vraie).
p

Toutefois, si les donnes sont non stationnaires (H0 : = 1), lestimateur des MCO, converge
plus vite vers la vraie valeur du paramtre , gale 1 dans ce cas l. La variance de la distribution

asymptotique scrase alors la vitesse T sous H0 , alors quelle ne scrase qu la vitesse T


dans le cas stationnaire (cf. illustration de la convergence en probabilit, chapitre 1).

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

42

Remarque 2. Sous lhypothse de non stationnarit H0 , la distribution asympotique de


lestimateur est non standard (non normale). En particulier, cette distribution
est non symtrique.

Rappelons que dans le cas stationnaire, la distribution asymptotique de T ( ) est une


loi normale centre, donc par dfinition une distribution symtrique. En revanche, sous H0 , la
distribution de T ( 1) nest pas une distribution normale, et en particulier cette distribution est
non symtrique.
2
1 W (1) 1
L
T ( 1)
T 2 1 [W (r)]2 dr
0
En eet, tant donne la dfinition dun mouvement Brownien standard, le processus W (1)2 suit
approximativement un 2 (1) . Sachant que P 2 (1) < 1 = 0.68, cela signifie que la distribution de
1
T ( 1) , conditionnellement 0 [W (r)]2 dr, est non symtrique et quenviron 2/3 des ralisations
de seront infrieures 1.
Pour illustrer cette dernire remarque, on peut raliser un exercice de simulation sous Eviews.
Lide gnrale de cet exercice est la suivante. On va rpliquer, par la mthode de Monte Carlo,
N chantillons (qualifis de pseudo chantillons) du processus xt dfini par lquation (3.90) sous
lhypothse nulle = 1. Pour cela il sut de se donner une valeur numrique pour 2 et de tirer
N chantillons de taille T dans une loi normale7 N 0, 2 . A partir de ces N chantillons du
processus {t }Tt=1 , on reconstruit N chantillons de taille T du processus {xt }Tt=1 selon lquation
xt = xt1 +t , en se donnant pour chaque chantillon une condition initiale sur x0 (par exemple x0 =
0). Ensuite, il sut deectuer la rgression de xt sur xt1 et de stocker pour chaque chantillon la
ralisation de lestimateur des MCO. Ainsi, au final, on obtient N ralisations de cet estimateurs,
partir desquelles on peut calculer un certain nombre de statistiques et construire, en particulier,
un estimateur de la distribution de .
Tableau 3.2: Valeurs des Paramtres de la Simulation
N
100

T
5000

2
1

x0
0

Pour approcher au mieux de la distribution asymptotique il convient de choisir une taille T


dchantillon assez importante. De plus, il convient de faire un grand nombre N de simulations
pour obtenir des statistiques indpendantes des tirages eectus dans la loi normale. Les paramtres
que nous avons retenus pour cet exercice sont reports dans le tableau (3.2).
7

Lhypothse de normalit des t est en eet compatible avec lhypothse t i.i.d. de notre modle.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

43

Le programme8 utilis sous Eviews est le suivant :


- Vhfwhxu ghv Rhdolvdwlrqv gh o hvwlpdwhxu ghv MCOyhfwru (100) ukr
iru !l = 1 wr 100
lqlwldolvdwlrq gx surfhvvxv
vpso 1 5001
jhqu { = 0
Crqvwuxfwlrq gh od Mdufkh Aohdwrluh
jhqu hsv = quqg
vpso 2 5001
jhqu { = {(-1)+hsv
Rhjuhvvlrq OLS
htxdwlrq ht1.ov { {(-1)
ukr(!l) = ht1.@frhiv(1)
qh{w
Crqyhuvlrq ghv Vhfwhxuv hq Shulhv
vpso 1 100
pwrv(ukr,ukr-v)
jhqu eldlv-v = (ukr-v-1)*5000
Ce programme dbute par la dclaration dun vecteur, nomm ukr, de dimension (N, 1) dans
lequel seront stockes les valeurs de la ralisation de lestimateur pour chaque simulation. Ensuite
une boucle est construite avec un indice i allant de 1 N = 100. Au sein de cette boucle, on
commence par initialiser le processus xt en lgalisant 0 sur lensemble de la priode allant de
1 5001 (la premire valeur correspondant au x0 ). Ensuite, laide de la commande quqg on
eectue un tirage dans un loi normale N (0, 1) que lon stocke dans une srie hsv. En rduisant
la priode dchantillon, de la date 2 la date 5001, on reconstruit la srie xt selon le modle
xt = xt1 + t . La valeur retarde de xt se note {(-1). Reste enfin eectuer la rgression de xt
sur xt1 (ov { {(-1)) et stocker dans le vecteur ukr la valeur de lestimateur obtenue pour le
ie`me pseudo chantillon, grce linstruction ukr(!l) = ht1.@frhiv(1). Au sortir de la boucle,
on convertit le vecteur ukr en une srie ukr-v afin deectuer plus facilement certains calculs, et
lon construit la variable transforme eldlv-v correspondant la v.a.r. T ( 1).
En cliquant sur la srie ukr-v, puis en cliquant sur View, Descriptive Statistics, et Histogramm
and Stats, on obtient les informations qui sont reportes sur la figure (3.8). Tout dabord, ces
8

Pour lancer ce programme, il convient au pralable de crer un Workfile de type Undated or Irregular, de 1
5001, puis de charger le programme (open program ) ou de le taper (new program), et ensuite de lexcuter (Run).

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

44

rsultats apparaissent compatibles avec le fait que lestimateur soit un estimateur convergent
(plim = 1) puisque lon observe que la moyenne des 100 ralisations des est trs proche de 1.
La distribution des apparat en outre relativement concentre autour de la vraie valeur = 1. Mais
ce qui est le plus frappant, cest que lon vrifie partir de cette petite exprience la non symtrie
de la distribution (cf. remarque 2). On peut le vrifier visuellement partir de lhistogramme,
mais en outre cette intuition est conforte par lexamen de la Skewness qui vaut 1.38 dans cette
exprience et qui est donc largement dirente de 0. Le test de normalit de Jarque-Bera (cf.
chapitre 4) rejette ainsi la normalit de la distribution.
Figure 3.8: Histogramme et Statistiques Descriptives des
14
12
10
8
6
4
2

Series: RHO_S
Sample 1 100
Observations 100
Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis
Jarque-Bera
Probability

0.999622
0.999819
1.000712
0.997520
0.000579
-1.381356
5.011701
48.66468
0.000000

0
0.9975 0.9980 0.9985 0.9990 0.9995 1.0000 1.0005

Ce premier examen quand la non normalit de la distribution, est toute fois incomplet et
non fond sur le plan thorique. En eet, nous avons montr que la distribution asymptotique
de tait dgnre dans le sens o converge en probabilit vers 1. Ainsi si lon fait tendre T
vers linfini, la distribution des convergera vers une masse ponctuelle en 1. Donc pour tudier
correctement la forme de la distribution asymptotique des , il convient dtudier le comportement
de la transforme T ( 1) qui elle possde une distribution non dgnre. Pour ce faire, on
clique sur la srie eldlv-v, puis sur View, Distribution Graphs, Kernel Density. On obtient alors
un estimateur (estimateur noyau) de la fonction de densit thorique de la v.a.r. T ( 1) . Cet
estimateur de la densit thorique est reproduit sur la figure (3.9).
Sur la figure (3.9), on vrifie bien que la distribution asymptotique de T ( 1) nest pas une
loi normale, conformment la proposition (17). On vrifie en outre que cette distribution est non
symtrique, et que la probabilit dobtenir une valeur de infrieure 1, est largement suprieure
celle dobtenir une valeur suprieure, et cela dans un rapport de 2/3, 1/3. En eet, la surface dfinie

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

45

par la fonction de distribution empirique de T ( 1) entre et 1 est largement suprieure


celle dfinie entre 1 et +. Ainsi pour les N = 100 simulations eectues, nous avons obtenu 74
ralisations infrieures 1, et 26 suprieures. La probabilit empirique 0.74 dobtenir une valeur
infrieure 1 est donc relativement proche de la probabilit thorique de 0.68. Pour un nombre de
simulations N plus important, la dirence aurait t encore plus faible.
Figure 3.9: Estimateur de la Fonction de Densit Thorique des T ( 1)
Kernel Density (Epanechnikov, h = 1.8832)

0.25
0.20
0.15
0.10
0.05
0.00
-10

-5

BIAIS_ST

3.1.2

Distribution de la statistique de Student t=1

Nous allons maintenant nous intresser au coeur du problme du test de Dickey Fuller, savoir le
comportement asymptotique de la statistique de Student associe au test = 1 dans le modle :
xt = xt1 + t

(3.101)

avec t i.i.d. 0, 2 . La question que lon se pose sur le plan pratique est la suivante : peut on,
sous lhypothse H0 , adopter les seuils standard dune loi normale (1.96 5% par exemple) pour
eectuer le test de Dickey Fuller ? Exprime en dautres termes, cette question revient dterminer
si la distribution asympotique de la statistique de Student associe au test = 1, correspond, sous
H0 , une loi de Student, qui peut tre approxime par une loi normale pour T (cf. chapitre
1). Si tel nest pas le cas, alors le test de Dickey Fuller ne devra bien entendu pas tre construit
partir des seuils standards de la loi normale.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

46

Pour rpondre cette question, commenons par dfinir la statistique de Student sur laquelle
sera fonde le test de Dickey Fuller de lhypothse nulle = 1. Cette dernire, note t=1 , est tout
simplement dfinie de la faon suivante :

1
T

t=1

x2t1

( 1)
t=1

=
= ( 1)

2
sT

(3.102)

o s2T dsigne lestimateur empirique de la variance des rsidus :


s2T =

1
(T 1)

2t =
t=1

1
(T 1)

t=1

(xt xt1 )2

(3.103)

Afin de contrler la vitesse de convergence des moments intervenant au numrateur et au dnominateur de t=1 , nous allons tudier la distribution asymptotique de t=1 exprime sous la forme
suivante :
T

T 1

xt1 t
t=1

t=1 =

T 2

t=1

x2t1

(3.104)

1
2

sT

Essayons prsent dtablir la distribution asymptotique de t=1 sous H0 . Pour cela tudions
tout dabord le comportement asymptotique de s2T . On sait que sous H0 , ou sous Ha , lestimateur
est convergent (plim = ). Donc par construction, les rsidus estimes t = xt xt1 sont non
biaiss. Dans ce cas, on montre que le moment empirique dordre deux s2T converge en probabilit
vers la variance 2 de la population des rsidus t (cf. chapitre 1).
p

= s2T 2

(3.105)

Reprenons maintenant un un les dirents lements de lexpression de t=1 (quation 3.104)


et tudions leurs distributions respectives. Daprs les rsultats de la premire section, on a :
T
L

T 1
t=1

xt1 t

2
W (1)2 1
2

2
t=1

x2t1 2
T

[W (r)]2 dr

sT
T

En utilisant les direntes proprits numres dans le cadre des rappels du premier chapitre
sur la convergence en loi et en probabilit, on peut alors immdiatement driver la distribution
asymptotique de t=1 .

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

47

Proposition 18 Sous lhypothse H0 de non stationnarit, la distribution asymptotique


de la statistique de Student associe au test de Dickey Fuller, = 1, dans le modle
xt = xt1 + t

(3.106)

avec t i.i.d. 0, 2 , est la suivante :


t=1

T 2
L

W (1)2 1
1
0 [W

(r)] dr

1
2

(3.107)

o W (.) est un mouvement Brownien standard.


Ainsi, on vrifie que cette distribution asymptotique nest pas une distribution normale. Encore
une fois, en particulier, cette distribution est non symtrique en raison de la prsence du terme
W (1)2 distribu selon un 2 . Les seuils de cette loi ont t tabuls par Dickey et Fuller (1979) et
par dautres auteurs comme Mc Kinnon (1981).

Remarque 1. La distribution asymptotique, sous H0, de la statistique de Student t=1


du test de Dickey Fuller dans le modle (3.101) nest pas standard. Lutilisation,
tort, des seuils standard associs une distribution normale peut ainsi conduire
un mauvais diagnostic quant la non stationnarit de la srie tudie. En
particulier, ce type derreur conduit rejeter trop souvent lhypothse de non
stationnarit.
Essayons, de bien comprendre les enjeux de cette remarque. Pour cela, menons nouveau un
exercice de simulation. On simule, de la mme faon que prcdemment, un grand nombre (N) de
pseudo chantillons du processus {xt }Tt=1 sous lhypothse H0 . Pour chaque pseudo chantillon, on
ralise la rgression de xt sur xt1 , et lon conserve la ralisation de la statistique de Student t=1
associe au test = 1. On obtient N ralisations de cette statistique, partir desquelles on peut la
distribution de t=1 .
Dans la pratique, les principaux logiciels dconomtrie (et en particulier Eviews), proposent
une statistique de Student associe au test de la nullit dun paramtre dj programme, alors
que le test de lgalit dun paramtre 1 nest pas toujours programm. Cest pourquoi, pour
viter de programmer la construction de t=1 , nous allons tout dabord transformer ce modle avant
dappliquer le test de Dickey Fuller.
Proposition 19 Le test de lhypothse = 1 dans lquation (3.90) est identique au test
de lhypothse = 0 dans le modle transform suivant :
xt = xt1 + t

(3.108)

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

48

avec = 1 et xt = (1 L) xt = xt xt1 . Dans ce modle, le test de Dickey Fuller


se ramne alors H0 : = 1 = 0 contre Ha : < 0. La statistique t=0 a la mme
distribution asympotique que t=1 .

Pour cet exercice de simulation, nous avons retenu les mme paramtres que pour la simulation
prcdente (cf. tableau 3.2), lexception du nombre de simulations N que nous avons port
1000. Le programme9 sous Eviews est le suivant :
- T Swdwlvwltxh : Thvw gh Dlfnh| Fxoohuyhfwru (1000) wvwdw
iru !l = 1 wr 1000
lqlwldolvdwlrq gx surfhvvxv
vpso 1 5001
jhqu { = 0
Crqvwuxfwlrq gh od Mdufkh Aohdwrluh
jhqu hsv = quqg
vpso 2 5001
jhqu { = {(-1)+hsv
jhqu g{ = { - {(-1)
Rhjuhvvlrq OLS
htxdwlrq ht1.ov g{ {(-1)
wvwdw(!l) = ht1.@wvwdwv(1)
qh{w
Conversion des V ecteurs en Series
vpso 1 1000
pwrv(wvwdw,wvwdw-v)
Lide gnrale du programme est sensiblement la mme que pour lexercice prcdent, la seule
dirence tant que cette fois-ci, on construit le vecteur des statistiques de Student grce linstruction @wvwdwv(1) qui permet de rcuprer les t-stats de la rgression des MCO. Lestimateur
de la fonction de densit de t=0 obtenu partir des 1000 simulations est report sur la figure
(3.10). On constate une nouvelle fois que la distribution asymptotique de t=0 (qui a la mme
distribution asympotique que t=1 ) nest pas une loi normale. On vrifie, que conformment au
rsultat thorique, cette distribution nest pas symtrique.
A partir des 1000 simulations, il est en outre possible de calculer les quantiles au seuil associs
au test non symtrique = 1 et de le comparer ceux que lon obtiendrait, si lon supposait,
9

Pour lancer ce programme, il convient au pralable de crer un Workfile de type Undated or Irregular, de 1
5001, puis de charger le programme (open program ) ou de le taper (new program), et ensuite de lexcuter (Run).

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

49

Figure 3.10: Estimateur de la Fonction de Densit Empirique de t=0


Kernel Density (Epanechnikov, h = 0.4944)
0.5
0.4
0.3
0.2
0.1
0.0
-3

-2

-1

TRHO_S

tort que t=1 tait distribue selon une loi N (0, 1) . On cherche donc le seuil C() tel que10 :
P t=0 C() =

(3.109)

Pour cela, il sut de classer dans lordre croissant les 1000 ralisations de t=0 et de considrer
la N/100 e`me ralisation. Par exemple, pour le seuil 5%, aprs avoir class les ralisations, on
retiendra la 50e`me observation, puisque empiriquement, il existe 95% de chances que lon ait une
ralisation suprieure ce seuil. Sur le tableau (3.3) sont reports les seuils obtenus partir des
simulations, et les seuils thoriques associs un test unilatral fond sur une loi N (0, 1) .
Tableau 3.3: Seuils Critiques des Tests t=0
C()
N(0,1)
C()

= 1%
2, 44
2.32

= 5%
1, 98
1.64

= 10%
1, 58
1.28

On observe ainsi que si lon considre un risque de premire espce de 5%, le seuil dune loi
normale pour le test unilatral = 1, est gal 1.64. Mais, nous avons vu thoriquement que
la statistique t=0 ne suit pas une loi normale. Les 1000 simulations montrent que le vrai seuil
10

Contrairement au test standard, on ne considre pas ici la valeur absolue de la t-stat : le test est non symtrique.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

50

5% de la loi de t=0 , est en fait plus proche de 1.98. Ainsi, on vrifie que lon aurait eu tendance
trop souvent rejeter la non stationnarit si lon avait appliqu pour le test de Dickey Fuller les
seuils standard dune loi normale. Le mme diagnostic vaut pour les autres niveaux de risque.
Cest pourquoi, il est ncessaire dutiliser les seuils tabuls par Dickey Fuller (1979) ou Mc Kinnon
(1981) pour eectuer les test de non stationnarit.

3.2

Des distributions conditionnelles au modle choisi...

Comme un malheur narrive jamais seul, le pauvre conomtre qui voit dj disparatre sa sacro
sainte loi normale dans lapplication des tests de Dickey Fuller, va de plus tre confront un autre
type de problme : celui de la dpendance des distributions asymptotiques au modle choisi.

Proposition 20 Sous lhypothse H0 de non stationnarit, la distribution asymptotique


de la statistique de Student t=1 dire suivant que le modle utilis soit :
xt = xt1 + t

(3.110)

xt = xt1 + c + t

(3.111)

xt = xt1 + c + t + t

(3.112)

avec t i.i.d. 0, 2 .
Ainsi, le fait dintroduire une constante, ou une constante et un trend dterministe aecte la
distribution asymptotique de t=1 . Pour le praticien, cela signifie que les seuils critiques du tests de
Dickey Fuller ne seront pas identiques, suivant que lon inclut ou non dans le modle une constante
et un trend. Cela pose naturellement un problme, puisque a priori, on ne sait pas si lon doit
inclure ces lments dans le modle test. Cest pourquoi, on propose gnralement une stratgie
de tests de Dickey Fuller, et non pas un seul test unique.
Nous ne dmontrerons pas le rsultat gnral de cette proposition. Nous nous contenterons
de dmontrer que la distribution de lestimateur obtenue dans le modle (3.110) dire de celle
obtenue dans le modle (3.111). Naturellement, il en dcoule que la distribution de t=1 dans les
deux modles dire. Dterminons la distribution de t=1 partir du modle (3.111). Pour ce faire,
nous considrerons pour simplifier que sous H0 , le processus xt est non stationnaire (hypothse du
test de Dickey Fuller), mais quen plus il se ramne une marche alatoire pure (c = 0). Ainsi
supposons que les donnes soient gnres par le modle :
xt = xt1 + t

(3.113)

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

51

avec t i.i.d. 0, 2 . Le modle estim par les M CO, pour eectuer le test de non stationnarit,
inclut une constante (modle 1 des tests Dickey Fuller donn par lquation 3.111) :
xt = xt1 + c + t

(3.114)

Les estimateurs et c sont alors dfinis par le systme matriciel :

c
1

1
xt1
t=1

T

2
xt1
T

T
=
T

xt1

t=1

t=1

t
t=1
T

xt1 t
t=1

Etudions le comportement asymptotique de ces dirents lments :


T

2
W (1)2 1
2

T 1
t=1

xt1 t

T
t=1

T 2

x2t1 2
T

[W (r)]2 dr

32

t=1

xt1

W (r) dr
0

T
L

T2
t=1

t W (1)
T

Afin de contrler la vitesse de convergence des dirents lments de cette


donc utiliser la transforme suivante11 :

1
T
T
32
12
1
T
T
T
T
x
t
1
t1


T 2c
t=1
t=1

=
T
T


3 T
T ( 1)
T2
xt1 T 2
x2t1
T 1
xt1 t
t=1

t=1

t=1

expression, on doit

(3.115)

Ds lors, en utilisant les proprits de la convergence en loi, on montre que :


1

T 2c
T ( 1)

1
2
0 W (r) dr

1
0 W (r) dr
1
2
0 [W (r)] dr

W (1)
2
2

W (1)2 1

A partir de ces dirents lments, on peut facilement driver la distribution asymptotique de


lestimateur .
11

En eet, T R+ , et (a, b, c, d, e, f ) R6 tels que ad = c2 , on a :


T 1 a
3
T2 c

T2 c
T 2 d

T2 e
T 1 f

decf
T adc2
T ce+af
adc2

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

52

Proposition 21 La distribution asymptotique de lestimateur obtenue dans le modle


xt = xt1 + c + t

(3.116)

sous lhypothse de non stationnarit H0 , est la suivante :


L

T ( 1)

1
2

W (1)2 1 W (1)
1
0 [W

1
0 W

1
0 W

(r)]2 dr

(r) dr

(r) dr

(3.117)

Dans le modle :
xt = xt1 + t

(3.118)

cette mme distribution asymptotique de tait dfinie par :


2
1 W (1) 1
T ( 1)
T 2 1 [W (r)]2 dr
0
L

(3.119)

On vrifie bien que la distribution de lestimateur dire suivant que lon inclut ou non dans
le modle estim une constante. Il en va de mme pour lintroduction dune tendance dterministe.
Naturellement, si la distribution de dire suivant les modles, celle de la statistique de Student
du test de Dickey Fuller dire elle aussi suivant le modle estim. En particulier, on peut montrer
(exercice) :
Proposition 22 Sous lhypothse H0 de non stationnarit, la distribution asymptotique
de la statistique de Student associe au test de Dickey Fuller, = 1, dans le modle
xt = xt1 + c + t

(3.120)

avec t i.i.d. 0, 2 , est la suivante :


t=1

T 2
L

W (1)2 1 W (1)
1
0 [W

(r)] dr

1
0 W

1
0 W

(r) dr

(r) dr

1
2

(3.121)

Ainsi, on vrifie que la prsence dune constante modifie la distribution asymptotique de la


statistique de test de lhypothse de racine unitaire. En eet, dans le modle sans constante, nous
avions montr que :
W (1)2 1
1
L
(3.122)
t=1
1
T 2
2
1
2
0 [W (r)] dr
Il en est exactement de mme concernant la prsence dune tendance dans le modle. A chaque
fois la distribution asymptotique de t=1 est aecte.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

53

Tout ceci est dautant plus regrettable pour lconomtre que les seuils critiques sont relativement dirents pour les 3 modles. Comme on peut lobserver sur le tableau (3.4), la dformation
de la distribution asymptotique est susamment importante pour que les seuils standard soient
1 le seuil critique pour un risque de premire espce de % associ au
trs dirents. On note C()
2 le seuil critique associ au modle (3.111)
modle (3.110) sans constante ni trend. On note C()
3 le seuil critique associ au modle (3.112) avec constante
avec constante sans trend. On note C()
et trend.
Tableau 3.4: Seuils Critiques des Tests t=0
1
C()
2
C()
3
C()

= 1%
2.58
3.43
3.96

= 5%
1.95
2.86
3.41

= 10%
1.62
2.57
3.12

L es seu ils so nt tirs d e Fu ller (197 6) p o ur T =

On comprend ainsi que si lon se trompe de modle, par exemple si lon inclut tort une
constante dans le modle estim, on se trompe de seuil critique, et donc risque fort de se tromper
de diagnostic quant la stationnarit de la srie tudie. Cest pourquoi, il convient prsent
de dvelopper une stratgie de tests de non stationnarit pour tester la non stationnarit dans un
modle adquat.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

3.3

54

Une Stratgie de Tests

Nous allons prsent proposer une stratgie de tests de Dickey Fuller permettant de tester la non
stationnarit conditionnellement la spcification du modle utilis. On considre trois modles
dfinis comme suit :
(3.123)
Modle 1 : xt = xt1 + t
Modle 2 : xt = xt1 + c + t

(3.124)

Modle 3 : xt = xt1 + c + t + t

(3.125)

avec t i.i.d. 0, 2 . On cherche tester lhypothse de racine unitaire :


H0 : = 0

H1 : < 0

(3.126)

Remarque 1. Le principe gnral de la stratgie de tests est le suivant. Il sagit de


partir du modle le plus gnral, dappliquer le test de racine unitaire en utilisant
les seuils correspondant ce modle, puis de vrifier par un test appropri que
le modle retenu tait le bon. En eet, si le modle ntait pas le bon, les
seuils utiliss pour le test de racine unitaire ne sont pas valable. On risque alors
de commettre une erreur de diagnostic quant la stationnarit de la srie. Il
convient dans ce cas, de recommencer le test de racine unitaire dans un autre
modle, plus contraint. Et ainsi de suite, jusqu trouver le bon modle, les
bons seuils et bien entendu les bons rsultats.

Le droulement de la stratgie de test est reporte sur la figure suivante. On commence par
tester la racine unitaire partir du modle le plus gnral, savoir le modle 3. On compare
3
tabuls par Dickey et Fuller, ou
la ralisation de la statistique de Student t=0 aux seuils C()
McKinnon pour le modle 3 (par exemple 3.41 5%, pour T ). Si la ralisation de t=0
3 , on accepte lhypothse nulle de non stationnarit. Une fois que le
est suprieure12 au seuil C()
diagnostic est tabli, on cherche vrifier si la spcification du modle 3, incluant une constante et
un trend, tait une spcification compatible avec les donnes. On teste alors la nullit du coecient
de la tendance. Deux choses lune :
Soit on a rejet au pralable lhypothse de racine unitaire, dans ce cas on teste la nullit de
par un simple test de Student avec des seuils standards (test symtrique, donc seuil de 1.96
5%). Si lon rejette lhypothse = 0, cela signifie que le modle 3 est le bon modle
12
Etant donn que le test est non symtrique, on ne considre pas, bien entendu, la valeur absolue de t=0 , mais
son niveau relatif.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

55

pour tester la racine unitaire, puisque la prsence dune tendance nest pas rejete. Dans ce
cas, on conclut que la racine unitaire est rejete, la srie est T S, du fait de la prsence de la
tendance. En revanche, si lon accepte lhypothse = 0, le modle nest pas adapt puisque
la prsence dune tendance est rejete. On doit refaire le test de racine unitaire partir du
modle 2, qui ne comprend quune constante.
Soit, au contraire, on avait au pralable, accept lhypothse de racine unitaire, et dans ce
cas, on doit construire un test de Fischer de lhypothse jointe = 0 et = 0. On teste ainsi
la nullit de la tendance, conditionnellement la prsence dune racine unitaire:
H03 : (c; b; ) = (c; 0; 0) contre H13

(3.127)

La statistique de ce test se construit de faon standard par la relation :


F3 =

SCR3,c SCR3 /2
SCR3 / (T 3)

(3.128)

o SCR3,c est la somme des carrs des rsidus du modle 3 contraint sous H03 :
xt = c + t
et SCR3 est la somme des carrs des rsidus du modle 3 non contraint (quation 3.125). Les
seuils distance fini de cette statistique sont fournies dans la partie annexe du programme de
cours. Si la ralisation de F3 est suprieure la valeur 3 lue dans la table un seuil %, on
rejette lhypothse H03 . Dans ce cas, le modle 3 est le bon modle et la srie xt est intgre
dordre 1, I (1) + c + T, le taux de croissance est T S, xt = c + t + t . En revanche, si lon
accepte H03 , le coecient de la tendance est nul, le modle 3 nest pas le bon modle, on
doit donc eectuer nouveau le test de non stationnarit dans le modle 2.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

Stratgie de Tests de Dickey Fuller

56

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

57

Si lon a accept la nullit du coecient de la tendance, on doit alors eectuer nouveau les
tests de non stationnarit partir cette fois-ci du modle 2 (quation 3.124) incluant uniquement
2
une constante. On compare alors la ralisation de la statistique de Student t=0 aux seuils C()
tabuls par Dickey et Fuller, ou McKinnon pour le modle 2 (par exemple 2.86 5%, pour
2 , on accepte lhypothse nulle de
T ). Si la ralisation de t=0 est suprieure au seuil C()
non stationnarit. Une fois que le diagnostic est tabli, on cherche vrifier si la spcification du
modle 2, incluant une constante, est une spcification compatible avec les donnes. On teste alors
la nullit du coecient c de la constante. Deux choses lune :
Soit on a rejet au pralable lhypothse de racine unitaire, dans ce cas on teste la nullit de
c par un simple test de Student avec des seuils standard (test symtrique, donc seuil de 1.96
5%). Si lon rejette lhypothse c = 0, cela signifie que le modle 2 est le bon modle
pour tester la racine unitaire, puisque la prsence dune constante nest pas rejete. Dans
ce cas, on conclut que la racine unitaire est rejete, la srie est stationnaire I (0) + c. En
revanche, si lon accepte lhypothse c = 0, le modle 2 nest pas adapt puisque la prsence
dune constante est rejete. On doit refaire le test de racine unitaire partir du modle 1,
qui ne comprend ni constante ni trend.
Soit, au contraire, on avait au pralable, accept lhypothse de racine unitaire, et dans ce
cas, on doit construire un test de Fischer de lhypothse jointe = 0 et c = 0. On teste ainsi
la nullit de la constante, conditionnellement la prsence dune racine unitaire:
H02 : (c; ) = (0; 0) contre H12

(3.129)

La statistique de ce test se construit de faon standard par la relation :


F2 =

SCR2,c SCR2 /2
SCR2 / (T 2)

(3.130)

o SCR2,c est la somme des carrs des rsidus du modle 2 contraint sous H02 , cest dire
SCR2,c = Tt=1 2t = Tt=1 (xt )2 et SCR2 est la somme des carrs des rsidus du modle
2 non contraint (quation 3.124). Les seuils distance fini de cette statistique sont fournies
dans la partie annexe du programme de cours. Si la ralisation de F2 est suprieure la
valeur 1 lue dans la table un seuil , on rejette lhypothse H02 au seuil %. Dans ce cas,
le modle 2 est le bon modle et la srie xt est intgre dordre 1, I (1) + c. En revanche, si
lon accepte H02 , le coecient de la constante est nul, le modle 2 nest pas le bon modle,
on doit donc eectuer nouveau le test de non stationnarit dans le modle 1.

Enfin, si lon a accept la nullit du coecient c de la constante, on doit alors eectuer


nouveau les tests de non stationnarit partir cette fois-ci du modle 1 (quation 3.123) sans
constante ni trend. On compare alors la ralisation de la statistique de Student t=0 aux seuils

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

58

1 tabuls par Dickey et Fuller, ou McKinnon pour le modle 1 (par exemple 1.95 5%, pour
C()
1 , on accepte lhypothse nulle de
T ). Si la ralisation de t=0 est suprieure au seuil C()
non stationnarit. Dans ce cas la srie xt est I (1) et correspond une pure marche alatoire,
xt = xt1 + t . Si lhypothse nulle est rejete, la srie est stationnaire, I (0) de moyenne nulle
xt = xt1 + t , avec || < 1.

3.4

Application : PIB, consommation et commerce extrieur

Nous allons proposer prsent une application de la stratgie de tests de Dickey Fuller direntes
sries13 issues des Comptes Nationaux Trimestriels de lINSEE, releves sur la priode allant du
premire trimestre 1978 au deuxime trimestre 2001, soit 94 observations. Les quatre sries utilises
sont exprimes en milliards deuros, au prix de 1995, et correspondent ainsi des agrgats en volume
qui sont de plus corrigs des variations saisonnires (donnes CVS ).
1. CONSO : correspond la consommation des mnages.
2. EXPORT : correspond aux exportations CAF agrges.
3. IMPORT : correspond aux importations CAF agrges.
4. PIB : correspond au produit intrieur brut.
Le graphique de ces sries est report sur la figure (3.11).
Figure 3.11: Comptes Trimestriels de lINSEE : 1978:1-2001:2
200

120
100

180

80
160
60
140

40
20

120
78 80 82 84 86 88 90 92 94 96 98 00

78 80 82 84 86 88 90 92 94 96 98 00

CONSO

100

EXPORT

360
340

80

320
300

60

280
260

40

240
220
200

20
78 80 82 84 86 88 90 92 94 96 98 00
IMPORT

13

78 80 82 84 86 88 90 92 94 96 98 00
PIB

Ces sries sont disponibles sur le site de lINSEE (www.insee.fr) dans la rubrique comptes nationaux.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

59

Un simple examen graphique met clairement en vidence le fait que les quatre sries tudies
sont a priori non stationnaires. Les processus gnrateurs correspondants ne semblent pas satisfaire
en eet la condition dinvariance de lesprance, et il en va de mme pour la variance. Reste savoir
si ces processus sont des processus DS ou T S selon la terminologie de Nelson et Plosser (1982).
Nous faisons lhypothse14 pour linstant que les quatre processus, sils sont I (d) , sont au plus
I (1) . Appliquons la stratgie de tests de Dickey Fuller expose prcdemment tout dabord la
consommation des mnages.
On commence par estimer le modle 3, xt = xt1 + c + .t + t , incluant une constante et
un trend. On teste alors la prsence dune racine unitaire dans le processus en testant la nullit du
paramtre laide dune statistique de Student t , o dsigne lestimateur des MCO. Sous le
logiciel Eviews, on peut soit eectuer directement cette rgression en crant au pralable la srie
xt et la tendance grce linstruction @wuhqg(q), soit on utilise le test pr-programm sous le
logiciel. Pour cela, il sut de cliquer sur la srie, puis sur longlet View, puis sur longlet Unit Root
Test. Apparat alors une bote de dialogue dans lequel on choisit le type Augmented Dickey Fuller,
le test in level, on inclut une constante et un trend (Trend and Intercept) et lon choisit un nombre
de termes en dirences retards (Lagged Dierence) gal 0. Le rsultat de lachage pour la
srie CONSO est reproduit sur la figure (3.12).
Figure 3.12: Test de Racine Unitaire sur CONSO : Modle 3

14

Si lon dsire vrifier cette hypothse, il sut de tester la stationnarit des taux de croissance des sries en
appliquant les tests de Dickey Fuller ces taux de croissance.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

60

Cette procdure nous donne la valeur des ralisations des estimateurs des MCO des dirents
paramtres du modle 3 (, c, ) ainsi que les statistiques de Student associes aux tests de nullit de
ces paramtres. Ce qui nous intresse ici plus particulirement cest bien entendu la statistique de
Student t associe la variable endogne retarde CONSO(1). Celle-ci est ici gale 1.236,
et cette valeur est en outre reporte en haut de lachage (ADF Test Statistic). Pour tester
lhypothse = 0, on utilise alors les seuils tabuls par Dickey et Fuller (cf. document joint,
polycopi dexercices) pour le modle 3 et pour une taille dchantillon de 93 observations (T 1 en
raison de la valeur retarde sur CONSO). Ces seuils sont reports dans lachage de la procdure
dEviews. Au seuil de 5%, le seuil critique est C() = 3.4581 (3.45 dans la table fournie en
annexe pour 100 observations). Ainsi, dans ce cas pour un niveau de risque de 5%, t > C() , on
accepte lhypothse nulle de racine unitaire ( = 0).
Il faut prsent valuer la validit de notre diagnostic en vrifiant que le modle partir
duquel nous avons fait le test (modle 3) est bien le bon modle. Il nous faut donc prsent
tester la nullit du coecient de la tendance conditionnellement la prsence dune racine unitaire.
On eectue pour cela le test H03 : (c, , ) = (c, 0, 0) . Malheureusement, ce test joint nest pas
prprogramm dans Eviews, il faut donc crire le petit programme suivant pour obtenir la valeur
de la statistique de Fisher F3 associe H03 .
- Crqvwuxfwlrq ghv gliihuhqfhv suhplhuhv
vpso 1978:2 2001:2
jhqu gfrqvr = frqvr-frqvr(-1)
- Evwlpdwlrq gx prghoh oleuh
htxdwlrq prg3.ov gfrqvr f @wuhqg(1978:1) frqvr(-1)
vfdodu vfu3=@vvu
vfdodu qgo=@uhjrev-@qfrhi
- Evwlpdwlrq gx prghoh frqwudlqw
htxdwlrq prg3f.ov gfrqvr f
vfdodu vfu3f=@vvu
- Crqvwuxfwlrq gh od vwdwlvwltxh i3
vfdodu i3=((vfu3f-vfu3)/2)/(vfu3/qgo)
Ce programme nappelle que peu de commentaires. Il utilise simplement linstruction @vvu qui
correspond la somme des carrs des rsidus de la rgression prcdente, linstruction @uhjrev qui
correspond au nombre dobservations de cette rgression et linstruction @qfrhi qui correspond au
nombre de coecients estims. On estime15 successivement le modle libre (modle 3) et le modle
15

Dans ce cas, bien entendu il nest pas ncessaire dappliquer les M CO pour obtenir la somme des carrs des
2
T
rsidus du modle contrainte puisque RC3c =
avec xt = (1/T ) Tt=1 xt . Toutefois, nous
t=1 xt xt
verrons que dans le cas des tests ADF, il sera ncessaire de faire une telle rgression. Cest pourquoi, nous prsentons

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

61

contraint sous H03 , cest dire le modle xt = c + t . La valeur de la ralisation de la statistique


de Fischer F3 est stocke dans la variable scalaire (vfdodu) nomme i3. Il sut de cliquer sur ce
scalaire dans le Workfile dEviews pour voir sacher la valeur correspondante en bas de lcran.
Pour la variable de consommation, nous obtenons ainsi une valeur de F3 gale 1.08. Cette valeur
est comparer aux seuils critiques lus dans la table de Dickey et Fuller (1981), tableau VI, page
1063, fournie en annexe (cf. polycopi dexercices). Pour une taille dchantillon de 100, et un
risque de premire espce de 5%, la valeur critique est gale 6.49. Donc la ralisation de F3 est
infrieure au seuil critique, on accepte lhypothse nulle de la nullit du coecient de la tendance
conditionnellement la prsence dune racine unitaire. Ceci signifie que le test de non stationnarit
pratiqu avec les seuils asymptotiques incluant une tendance (modle 3) doit tre remis en cause.
Il faut donc recommencer ce test partir du modle incluant uniquement une constante.
On estime alors le modle 2, xt = xt1 + c + t et lon teste la prsence dune racine unitaire.
Pour cela, il sut de cliquer sur la srie, puis sur longlet View, puis sur longlet Unit Root Test.
Apparat alors une bote de dialogue dans lequel on choisit le type Augmented Dickey Fuller, le
test in level, on inclut uniquement une constante (Intercept) et lon choisit un nombre de termes
en dirences retards (Lagged Dierence) gal 0. Le rsultat de lachage pour la srie CONSO
est reproduit sur la figure (3.13).
Figure 3.13: Test de Racine Unitaire sur CONSO : Modle 2

le programme sous cette forme afin de prsenter une dmarche systmatique.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

62

La statistique de Student t associe la variable endogne retarde CONSO(1) prend ici une
valeur de 0.595. Pour tester lhypothse = 0, on utilise alors les seuils tabuls par Dickey et Fuller
pour le modle 2 (cf. document joint, polycopi dexercices) et pour une taille dchantillon de 93
observations. Ces seuils sont reports dans lachage de la procdure dEviews. Au seuil de 5%,
le seuil critique est C() = 2.8925 (2.89 dans la table fournie en annexe pour 100 observations).
Ainsi, dans ce cas pour un niveau de risque de 5%, t > C() , on accepte lhypothse nulle de racine
unitaire ( = 0) dans le modle 2.
Il faut nouveau valuer la validit de notre diagnostic en vrifiant que le modle 2 partir
duquel nous avons fait le test de racine unitaire est bien le bon modle. On teste pour cela la
nullit du coecient de la constante conditionnellement la prsence dune racine unitaire. On
eectue le test H02 : (c, ) = (0, 0) , ce qui revient, dans le cas du test de Dickey Fuller simple, tester
la nullit des deux coecients du modle 2. Ds lors, on peut utiliser la valeur de la ralisation
de la statistique de Fisher programm dans Eviews pour le test de la nullit de lensemble des
coecients du modle. Attention, ceci nest valable que pour le test de Dickey Fuller simple et ne le
sera plus pour les tests ADF que nous verrons ultrieurement. Sur la figure (3.13), on observe que
la ralisation de la statistique de Fisher, qui dans ce cas prcis et uniquement dans ce cas prcis
correspond F2 , est gale 0.354. Par contre, on ne doit surtout pas utiliser la pvalue programm
sous Eviews, puisque celle-ci est construite partir dune distribution de Fischer standard de F2 . Il
faut en eet comparer la ralisation de F2 aux seuils critiques de la table de Dickey et Fuller (1981),
tableau VI, page 1063, fournie en annexe (cf. polycopi dexercices). Pour une taille dchantillon
de 100, et un risque de premire espce de 5%, la valeur critique est gale 4.71. Pour un risque de
5%, la ralisation de F3 est infrieure au seuil critique, on accepte lhypothse nulle de la nullit de
la constante conditionnellement la prsence dune racine unitaire. Ceci signifie que le test de non
stationnarit pratiqu avec les seuils asymptotiques incluant une constante (modle 2) doit tre
remis en cause. Il faut donc recommencer ce test partir du modle 1 sans constante, ni trend.
Il ne reste plus alors qu recommencer le test de racine unitaire partir du modle 1, xt =
xt1 + t . Dans la bote de dialogue, on choisit le type Augmented Dickey Fuller, le test in level,
on exclut la constante et la tendance (None) et lon choisit un nombre de termes en dirences
retards (Lagged Dierence) gal 0. Le rsultat de lachage pour la srie CONSO est reproduit
sur la figure (3.14). La statistique de Student t associe la variable endogne retarde prend ici
une valeur de 6.538. Pour tester lhypothse = 0, on utilise alors les seuils tabuls par Dickey et
Fuller pour le modle 1 (cf. document joint, polycopi dexercices). Ces seuils sont reports dans
lachage de la procdure dEviews. Au seuil de 5%, le seuil critique est C() = 1.9436 (1.94
dans la table fournie en annexe pour 100 observations). Ainsi, dans ce cas pour un niveau de risque
de 5%, t > C() , on accepte lhypothse nulle de racine unitaire ( = 0) dans le modle 1.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

63

Figure 3.14: Test de Racine Unitaire sur CONSO : Modle 1

Finalement, selon le test de Dickey Fuller simple, on conclut que la srie trimestrielle de consommation des mnages est issue dun processus non stationnaire, de type I (1) et peut tre reprsente
par une pure marche alatoire :
(3.131)
xt = xt1 + t
avec t i.i.d. 0, 2 . Pour stationnariser cette srie, il convient donc de la direncier. En eet, on
peut vrifier sur la figure (3.15) que la dirence premire de la srie de consommation des mnages
semble possder un comportement de type stationnaire.
A lissue de nos tests nous avons conclu que la dirence premire de la srie correspond
linnovation t , qui dans le test de Dickey Fuller est assimil un bruit blanc. Or, il convient
de sassurer que la srie direncie possde bien les proprits dun bruit blanc. En particulier,
il convient de sassurer que celle-ci nest pas autocorrle puisque par dfinition E (t tk ) = 0,
si k = 0. Pour cela, il nous faut tudier le corrlogramme de la srie DCONSO. Pour obtenir ce
corrlogramme sous Eviews, on clique sur la srie, puis sur Correlogram. Pour un choix de lags de
10, les rsultats achs sont reports sur la figure (3.16).
Pour un ordre k allant de 1 10, figurent ce corrlogramme la ralisation de lautocorrlation
empirique dordre k dfinie pour une srie zt par :
1
k =
T k

T
t=1

[(zt z t ) (ztk z tk )]

(3.132)

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

64

Figure 3.15: Srie de Consommation en Dirences Premires


3
2
1
0
-1
-2
-3
80

82

84

86

88

90

92

94

96

98

00

DCONSO

Figure 3.16: Corrlogramme de la Srie DCONSO

On sait que k converge en probabilit vers k = E [(zt z t ) (ztk z tk )] . Or, on observe


dans la premire colonne de la figure (3.16), note AC pour autocorrlation, que lautocorrlation
de la srie DCONSO notamment lordre 2 est relativement importante. Elle est statistiquement
dirente de zro puisque la ralisation sort de lintervalle de la rgion de confiance de lhypothse
de nullit matrialise par des petits tirets verticaux. Cela signifie que la srie de consommation
direncie est autocorrle. Par consquent, puisque nous avions conclu que xt = t , le processus
t nest pas un bruit blanc. Or si le processus t nest pas un bruit blanc i.i.d., cela remet en cause
la validit de lensemble des distributions asymptotiques des statistiques de tests de Dickey Fuller
et donc les conclusions que nous avons dress quant la non stationnarit de la srie. Il est donc
ncessaire de tester la non stationnarit de la srie en prenant en compte lautocorrlation des
perturbations t . Cest prcisment lobjet des tests de Dickey Fuller Augments, ou tests ADF.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

65

Tests de Dickey Fuller Augments

Comme nous lavons vu dans le cadre de lapplication sur la consommation des mnages, il arrive
parfois que les rsidus t du modle de Dickey Fuller soient autocorrls. Or, les distributions asymptotiques des statistiques de test de racine unitaire ont t construites sous lhypothse que t est
un bruit blanc. Ds que lon lve cette hypothse les statistiques des tests de Dickey Fuller ne suivent
plus les mmes distributions asymptotiques, et donc les seuils de significativit des tests de racine
unitaire sont dirents. Il apparat donc ncessaire de tenir compte de lventuelle autocorrlation
des rsidus dans la construction des tests de racine unitaire.
Il existe alors deux approches direntes pour tenir de cette ventuelle autocorrlation. La
premire approche, propose par Phillips (1987) et Phillips et Perron (1988) consiste proposer
une correction des estimateurs des MCO et des statistiques de Student associes ces estimateurs
prenant en compte la possible autocorrlation des rsidus. La seconde approche, dveloppe par
Dickey et Fuller (1979), consiste contrler directement lautocorrlation dans le modle (et non au
niveau des estimateurs) en incluant un ou plusieurs termes autorgressifs direncis. Nous allons
montrer quune telle approche permet en eet de blanchir les rsidus et de plus, de se ramener
une reprsentation similaire celle du test de Dickey Fuller Simple. Ds lors, lapplication de
cette nouvelle stratgie est identique celle prsente prcdemment et lon retrouve les mmes
distributions asymptotiques.

4.1

Les tests ADF : la prise en compte de lautocorrlation des rsidus

Pour bien comprendre largument de Dickey Fuller, considrons un processus xt admettant une
reprsentation de type AR (1) dont les innovations t sont autocorrles dordre p 1.
xt = xt1 + t

(4.133)

o t ne satisfait pas les hypothses dun bruit blanc et est autocorrl dordre p 1 :
t + 1 t1 + .. + p1 tp+1 = t

(4.134)

avec t i.i.d. 0, 2 . En substituant t par lexpression xt xt1 , lquation (4.134) se rcrit


sous la forme :
t = (xt xt1 ) + 1 (xt1 xt2 ) + 2 (xt2 xt3 ) ... + p1 (xtp+1 xtp )
= xt + (1 ) xt1 + ( 2 1 ) xt2 + ... + (p1 p2 ) xtp+1 p1 xtp (4.135)

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

66

Ainsi, la reprsentation de type AR (1) avec autocorrlation des innovations dordre p 1 peut
tre transforme en une reprsentation AR (p) o les innovations sont des bruits blancs.
xt = 1 xt1 + 2 xt2 + .... + p xtp + t

(4.136)

avec 1 = (1 ) , i = (i1 i2 ) pour i = 2, .., p 1 et p = p1 .


Remarque 1. Lintuition de la dmarche du test de Dickey Fuller Augment consiste
postuler un modle de type AR (p) afin de corriger une ventuelle autocorrlation
dordre p 1 des innovations dune reprsentation de type AR (1) .
Toutefois, le test de Dickey Fuller Augment nest pas construit directement partir de la
forme AR (p) avec innovations i.i.d. de lquation (4.135). Les auteurs privilgient une spcification
incluant p 1 termes direncis retards, connue sous le nom de reprsentation de Sims, Stock
et Watson ( 1990).
Proposition 23 (Reprsentation de Sims, Stock et Watson 1990) Tout processus (xt , t Z)
satisfaisant une reprsentation AR (p)
xt = 1 xt1 + 2 xt2 + .... + p xtp + t

(4.137)

avec t i.i.d. 0, 2 , peut tre exprim sous la forme suivante :


xt = xt1 + 1 xt1 + 2 xt2 + ... + p1 xt(p1) + t

(4.138)

o j dsigne loppos de la somme partielle des coecients j = 0, 1, .., p 1 :


j = j+1 + j+2 + ... + p

(4.139)

= 0 = 1 + 2 + ... + p

(4.140)

Cette forme canonique est connue sous le nom de reprsentation de Sims, Stock et
Watson (1990).

La dmonstration de cette proposition est la suivante. On considre un processus AR (p) :


(L) xt = 1 1 L 2 L2 .... p Lp xt = t

(4.141)

avec t i.i.d. 0, 2 . Notons que cette quation est formellement identique lquation (4.135).
Nous allons prsent exprimer ce modle en introduisant des termes direncis retards. On
commence par poser :
1 1 L 2 L2 .... p1 Lp1 p Lp

= 1 1 L 2 L2 .... p2 Lp2 p + p1 + p1

Lp1 p Lp

= 1 1 L 2 L2 .... p3 Lp3 p + p1 + p2 + p1 + p
p + p1 + p

Lp1 p Lp

Lp2

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

67

En poursuivant cette dmarche, on obtient une expression du polynme (L) faisant apparatre
les sommes partielles des coecients, notes j :
(L) = 1 ( 1 0 ) L ( 2 1 ) L2 ( 3 2 ) L3
.... p1 p2 Lp1 p1 Lp

(4.142)

avec
j = j+1 + j+2 + ... + p

j = 0, 1, .., p 1

(4.143)

En arrangeant les termes du polynme (L) , on parvient alors la formulation suivante :


(L) = (1 + 0 L) 1 L + 2 L2 + ... + p1 Lp1 (1 L)

(4.144)

Cest cette expression de (L) qui nous permet de faire apparatre un polynme retard dfini
en la dirence premire (1 L) . En posant = 0 , on retrouve alors la reprsentation de Sims,
Stock et Watson (quation 4.138).
Maintenant, envisageons le cas o le processus AR (p) admet au plus une racine unitaire. Si tel
est le cas, le polynme (L) admet un pour racine.
(1) = 0 1 1 2 .... p = 0

(4.145)

Sous cette hypothse, le terme = 0 de la reprsentation de Sims, Stock et Watson est alors
gal lunit.
Proposition 24 Si le polynme (L) associ au processus (xt , t Z), admet une racine
unitaire, alors le terme dans la reprsentation de Sims, Stock et Watson (quation
4.138) est gal lunit. Le processus (xt , t Z) se rcrit alors sous la forme :
xt = 1 xt1 + 2 xt2 + ... + p1 xt(p1) + t

(4.146)

Ds lors, le test de lhypothse de racine unitaire dans un modle ADF revient tester
la nullit du coecient dans le modle incluant p 1 termes direncis retards :
xt = xt1 + 1 xt1 + 2 xt2 + ... + p1 xt(p1) + t

(4.147)

avec = 1. Cette structure est identique celle des tests de Dickey Fuller Simples
aux termes retards prs.
On comprend ainsi que lide de Dickey Fuller consiste se ramener une reprsentation
similaire celle du test de Dickey Fuller Simple, mais qui leur permet de traiter le problme de
lautocorrlation des innovations.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

68

Rsum de la dmarche Partant dun modle AR (1) (quation 4.133), on sait que les rsidus
t sont autocorrls dordre p 1. Donc on peut pas faire le test directement partir de cette
reprsentation. On cherche se ramener une reprsentation alternative dans laquelle les
innovations sont des bruits blancs. Pour ce faire, on se ramne un AR dordre p (quation
3.87). Mais si lon dsire tester la racine unitaire directement partir de lquation 3.87,
il est ncessaire de proposer une stratgie de test dirente de celle du test de Dickey Fuller
Simple. Donc, les auteurs ont cherch une autre reprsentation de l AR (p) leur permettant
de pratiquer un test de racine unitaire dont la spcification est exactement identique celle
du test de Dickey Fuller Simple : cest la reprsentation de Sims, Stock et Watson (quation
4.138). Ne reste plus qu dmontrer que les distributions asymptotiques des statistiques de
tests sont identiques celles des tests de Dickey Fuller Simples.
Afin de mieux comprendre cette dmarche considrons lexemple suivant.

Exemple : On considre le processus zt satisfaisant une reprsentation AR (1) o les rsidus t


sont autocorrls :
1
zt = zt1 + t
2
t = t1 + t
avec t i.i.d. 0, 2 . Dans ce cas, les rsidus t sont autocorrls dordre 1, on peut donc
trouver une reprsentation de type AR (2) sur zt avec des innovations de type bruits blancs :
1
t = t1 + t zt zt1
2

1
= zt1 zt2 + t
2

(4.148)

On obtient ainsi :

3
1
zt zt1 + zt2 = (L) zt = t
2
2
A partir de cet AR (2) , on cherche la reprsentation canonique de Sims, Stock et Watson :
3
1
(L) = 1 L + L2
2
2
1
1
3 1

L + L2
= 1+ +
2 2
2
2
1
1
= 1 L L + L2
2
2
On obtient ainsi la reprsentation suivante :
(L) = (1 + 0 L) ( 1 L) (1 L) = (1 L)

1
L (1 L)
2

avec 0 = (1 + 2 ) = 32 12 = 1 et 1 = 2 = 12 . Le modle scrit donc en un


polynme de degr 1 dfini en la dirence premire (1 L) zt :
1
(L) zt = zt zt1 = t
2

(4.149)

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

69

ou encore :

1
zt = zt1 + zt1 + t
(4.150)
2
On a ici inclut 1 terme direnci retard pour corriger lautocorrlation dordre 1 des rsidus
du modle initial. De plus, daprs la proposition prcdente, on sait que le processus zt
comporte une racine unitaire et est par l mme I (1) .

Ainsi, pour un choix de p retards, correspondant une autocorrlation dordre p + 1 des innovations dans une reprsentation AR (1) , les trois modles utiliss pour dvelopper le test ADF
sont les suivants :
p
Modle 1 : xt = xt1 +

j xtj + t

(4.151)

j xtj + c + t

(4.152)

j xtj + c + t + t

(4.153)

j=1
p

Modle 2 : xt = xt1 +
j=1
p

Modle 3 : xt = xt1 +
j=1

Proposition 25 La stratgie de test ADF consiste en un premire tape dterminer


le nombre de retard p ncessaire pour blanchir les rsidus. Dans la seconde tape, il
sut dappliquer la stratgie squentielle du test de Dickey Fuller Simple aux modles (4.151), (4.152) et (4.153). Les distributions asymptotiques des statistiques de test
t obtenues dans ces trois modles sont alors identiques celles obtenues dans les
modles de Dickey Fuller Simple correspondants.
La dmonstration de cette proposition sera fournie titre dexercice. Pour lconomtre appliqu, cela implique que les seuils de significativit pour les tests de racine unitaire DF et ADF
sont identiques, et cest l le principale avantage de dmarche de Dickey Fuller (1979). Ces deux
auteurs ont ainsi fourni une dmarche de tests intgre, avec des seuils identiques en cas dautocorrlation ou non des rsidus, grce ladoption de la reprsentation de Sims, Stock et Watson.

4.2

Choix du nombre de retards optimal

Jusqu prsent nous avons suppos que lordre dautocorrlation des rsidus t tait connu. Si
cet ordre est gal p, on sait prsent quil faut inclure dans le test ADF, p termes direncis
retards, ce qui correspond alors un modle de type AR (p + 1). Le problme, cest que dans la
vraie vie, on ignore souvent a priori lordre dautocorrlation des rsidus. On doit donc chercher
le nombre optimal p. Pour ce faire, plusieurs approches peuvent tre envisages, parmi celles-ci
nous nen retiendrons que deux : le contrle ex-post de labsence dautocorrlation des innovations
ou la minimisation de critres dinformation.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin


4.2.1

70

Critres dinformation

Une des manires de choisir le nombre de retards consiste comparer dirents modles ADF
incluant dirents choix de retards, sur la base de critres dinformation. Un critre dinformation est un critre fond sur le pouvoir prdictif du modle considr et qui tient du nombre de
paramtres estimer. De faon concrte ces critres sont construits comme des fonctions de la
variance des rsidus estims du modle 2t et du nombre de paramtres estimer. Lobjectif tant
bien entendu de minimiser cette fonction par rapport ces deux arguments (application du principe
de parcimonie). Ces critres sapplique de faon gnrale tout type de modle et pas uniquement
aux modles des tests ADF. Nous en retiendrons que deux : le critre dAkaike et le critre de
Schwarz (1978).
Definition 26 Pour un modle, incluant k paramtres, estim sur T priodes et dont
la ralisation de lestimateur de la variance des rsidus est 2t , le critre dAkaike, ou
AIC, est :
(4.154)
AIC (k) = T log 2t + 2 (k)
Le critre de Schwartz (1978) est dfini par :
SC (k) = T log 2t + k log (T )

(4.155)

Dans le cas de notre application au choix du nombre de retards dans les modles ADF, on
cherche le nombre de retard p qui minimise ces deux critres. Prenons par exemple, le cas du
modle ADF 3 :
p
xt = xt1 +

j xtj + c + t + t

(4.156)

j=1

Dans ce cas, pour un choix de retards p on a un nombre de paramtres estimer gal k = 3+p.
Si lon dispose dun hcnatillon de taille T et que lon note 2t la ralisation de lestimateur de la
variance des rsidus obtenue dans le modle avec p retard, les deux critres sont dfinis en fonction
de p par :
(4.157)
AIC (p) = T log 2t + 2 (3 + p)
SC (p) = T log 2t + (3 + p) log (T )

(4.158)

On cherche donc le nombre de retards p qui minimise ces deux critres. Sous Eviews, ces
deux critres sont fournis ds lors que lon utilise linstruction de rgression. Nous verrons dans
lapplication comment obtenir la ralisation de ces deux critres.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin


4.2.2

71

Tests dautocorrlation des rsidus

Une fois que lon est parvenu apporter un diagnostic quant la non stationnarit de la srie et
identifier un modle final, on peut obtenir une ralisation du processus des innovations {t , t Z} .
Il convient alors de vrifier que celle-ci satisfait les proprits dun bruit blanc. Les tests dautocorrlation de rsidus ne peuvent donc tre mis en place quex-post : ils ne servent pas directement au
choix ex-ante du nombre de retards, ils ne servent qu valider un choix de retards. Par exemple,
supposons que lon ait identifier un modle du type :
xt = xt1 + 1 xt1 + c + t

(4.159)

avec = 0, p = 1. Le processus xt est donc I (1) . En estimant le modle xt = 1 xt1 +


c + t , on obtient une ralisation de taille T des innovations t . On doit alors vrifier labsence
dautocorrlation des t .
Remarque 1. Si il ny pas dautocorrlation, le modle est bien spcifi. Si en revanche,
il existe de lautocorrlation, le modle est mal spcifi et en particulier le choix
p = 1 nest pas valide. Il convient daugmenter le nombre de retards afin de
corriger lautocorrlation des rsidus.

Pour tester lautocorrlation, on tudie le corrlogramme de la srie et lon utilise le test dit du
porte-manteau16 , dont il existe deux variantes :
Definition 27 On note rn lautocorrlation empirique dordre n des rsidus t dun
modle incluant k paramtres et estim sur T priodes. Pour un ordre N, le test de
Box et Pierce est le test de lhypothse H0 : r1 = ... = rN = 0 contre H1 : j [1, N] , tel
que rj = 0. La statistique de ce test est :
N
L

QBP = T
n=1

rn2 X 2 (N k)
T

(4.160)

Lhypothse H0 est rejete au seuil de 5% si QBP est suprieur au quantile 0.95 de la


loi du X 2 correspondant.

Definition 28 Le test du Ljung-Box, pour un ordre N, correspond lhypothse nulle


H0 : rn = 0 n N et sont construites de la faon suivante :
N

QK = T (T + 2)
16

rn2
L
X 2 (N k)
T
T

n
n=1

Ou fourre tout dans une traduction plus prcise du terme anglais.

(4.161)

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

72

Sous Eviews, linstruction Correlogram permet dobtenir les Qstats associes au second test,
celui de Ljung-Box. On peut ainsi facilement tester lautocorrlation des rsidus empiriques dun
modle ADF incluant p retards.

4.3

Application des tests ADF : la consommation des mnages

Nous avions montr prcdemment la ncessit dappliquer les tests ADF la srie de consommation des mnages issues des comptes nationaux trimestriels, en raison de la prsence dune
autocorrlation des rsidus du modle retenu. Cest ce que nous allons faire prsent et nous
dterminer la correction de lautocorrlation modifie le diagnostic quant la non stationnarit de
la srie. Rappelons que cette srie est disponible du premier trimestre 1978 au deuxime trimestre
2001, soit sur 94 observations. La srie est exprime en milliards deuros, au prix de 1995, et est
corrige des variations saisonnires (donnes CVS ). Nous allons dans un premier temps chercher
dterminer lordre des retards optimal, puis nous appliquerons la stratgie de test ADF la srie
CONSO.
4.3.1

Choix optimal des retards

Comme nous lavons indiqu prcdemment, il existe direntes faons de choisir lordre optimal p
des retards dans le modle des tests Dickey Fuller Augments. Dans la pratique, on se limite souvent
lobservations des critres dinformation et la vrification ex-post de labsence dautocorrlation
des innovations.
Tableau 4.5: Choix du Nombre de Retards
p
5
4
3
2
1
0

Modle 3
AIC
SC
2.765 2.990
2.778 2.974
2.754 2.921
2.779 2.917
2.838 2.948
2.882 2.964

Modle 2
AIC
SC
2.810 3.007
2.800 2.967
2.782 2.921
2.785 2.895
2.827 2.910
2.881 2.935

Modle 1
AIC
SC
2.791 2.960
2.779 2.919
2.764 2.875
2.766 2.849
2.808 2.862
2.859 2.887

Dans un premier temps, on utilise ainsi les critres dinformation disponibles sous Eviews,
savoir le critre dAkaike (AIC) et le critre de Schwartz (tableau 4.5). Pour ce faire, il sut
tout dabord de se donner un nombre de retards maximum admissibles, not pmax , compte tenu
du nombre dobservations disponibles et donc du nombre de degrs de libert des rgressions correspondantes. Dans cette tude nous poserons pmax = 5. Puis, pour chaque modle, on cherche le
nombre de retards p optimal, compris entre 0 (test de Dickey Fuller simple) et pmax qui minimise
les deux critres dinformations. Une des faons de dobtenir les deux critres dinformation sous

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

73

Eviews consiste cliquer sur la srie, sur Unit Root Test, de choisir le modle (Intercept and Trend,
Intercept ou None) et le nombre de lags, puis de recommencer lopration pour p variant de 0
pmax . Les critres dinformation (Akaike Info Criterion et Schwarz criterion) figurent alors sur
lcran dachage des rsultats (voir par exemple la figure 3.14). Aprs avoir rpt cette opration,
les rsultats obtenus ont t reports dans le tableau 4.5.
Quel que soit le modle retenu, on constate que le critre dAkaike conduit un choix de retard
optimal p = 3, tandis que le critre de Schwartz conduit p = 2. On est donc ici en prsence dune
divergence de diagnostic quant lutilisation de ces deux critres dinformation, ce qui arrive souvent
dans la pratique. Dans ce cas, il est ncessaire de bien comprendre que lobjectif de lintroduction
des termes retards consiste blanchir les rsidus, cest dire contrler lautocorrlation des
innovations. Ds lors, on cherche la structure minimale qui permet datteindre cet objectif. Selon
un principe de parcimonie, il convient de choisir le modle incluant le minimum de paramtres
estimer et qui permet de blanchir totalement les rsidus. On adopte donc ici un choix optimal
de retard p = 2 et nous vrifierons ex-post dans le modle retenu (avec ou sans constante) que
lintroduction des deux termes direncis retards a permis dliminer totalement lautocorrlation
des rsidus.
4.3.2

Stratgie de tests ADF

Comme nous lavons expliqu prcdemment, la stratgie de test des Dickey Fuller Augments est
strictement identique celle des tests Dickey Fuller simple, mis part la modification des 3 modles
qui inclut prsent des termes direncis retards.
On commence par estimer le modle 3 incluant une constante, un trend et deux termes direncis retards :
2

xt = xt1 + c + .t +

i xti + t

(4.162)

i=1

0, 2

. On teste alors la prsence dune racine unitaire dans le processus en testant


avec t i.id.
la nullit du paramtre laide dune statistique de Student t , o dsigne lestimateur des
MCO. Pour eectuer ce testes sous le logiciel Eviews, on clique sur la srie, puis sur longlet View,
puis sur longlet Unit Root Test. Apparat alors une bote de dialogue dans lequel on choisit le type
Augmented Dickey Fuller, le test in level, on inclut une constante et un trend (Trend and Intercept)
et lon choisit un nombre de termes en dirences retards (Lagged Dierence) gal 2. Le rsultat
de lachage pour la srie CONSO est reproduit sur la figure (4.17).
Pour cet chantillon de 91 observations (aprs les ajustements ds aux valeurs retardes), la
ralisation de la statistique de Student t est gale 1.344. On compare cette valeur aux seuils17
17

On utilise ici les mmes seuils que pour le test de Dickey Fuller Simple.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

74

Figure 4.17: Test de Racine Unitaire ADF sur CONSO : Modle 3

tabuls par Dickey et Fuller (cf. document joint, polycopi dexercices) pour le modle 3 et pour
une taille dchantillon de 91 observations. Au seuil de 5%, le seuil critique est C() = 3.4591
(3.45 dans la table fournie en annexe pour 100 observations). Ainsi, dans ce cas pour un niveau
de risque de 5%, t > C() , on accepte lhypothse nulle de racine unitaire ( = 0).
On vrifie ensuite que le modle partir duquel nous avons fait le test (modle 3) est bien le
bon modle. On teste pour cela la nullit du coecient de la tendance conditionnellement la
prsence dune racine unitaire : cest le test H03 , (c, , ) = (c, 0, 0) . Pour obtenir la ralisation de
la statistique de Fisher F3 associe H03 , on construit le mme programme que celui expos dans
le cadre des tests DF simples. La seule dirence rside dans le fait que dans les deux rgressions
(modle libre et modle contraint), on doit maintenant ajouter les termes gfrqvr(-1) et gfrqvr(2). Pour la variable de consommation, nous obtenons ainsi une valeur de F3 gale 1.8725. Cette
valeur est comparer aux seuils critiques lus dans la table de Dickey et Fuller (1981), tableau VI,
page 1063, fournie en annexe (cf. polycopi dexercices). Pour une taille dchantillon de 100, et un
risque de premire espce de 5%, la valeur critique est gale 6.49. Donc la ralisation de F3 est
infrieure au seuil critique, on accepte lhypothse nulle de la nullit du coecient de la tendance
conditionnellement la prsence dune racine unitaire. Ceci signifie que le test de non stationnarit
pratiqu avec les seuils asymptotiques incluant une tendance (modle 3) doit tre remis en cause.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

75

Il faut donc recommencer ce test partir du modle incluant uniquement une constante.
On estime prsent le modle 2 et lon teste la prsence dune racine unitaire dans :
2

xt = xt1 + c +

i xti + t

(4.163)

i=1

avec t i.id. 0, 2 . Si dans la procdure Eviews, on inclut uniquement une constante (Intercept)
et lon choisit un nombre de termes en dirences retards (Lagged Dierence) gal 2, on obtient
les rsultats suivants (figure 4.18).
Figure 4.18: Test de Racine Unitaire ADF sur CONSO : Modle 2

La statistique de Student t associe la variable endogne retarde CONSO(1) prend ici une
valeur de 1.151. Pour tester lhypothse = 0, on utilise alors les seuils tabuls par Dickey et Fuller
pour le modle 2 (cf. document joint, polycopi dexercices) et pour une taille dchantillon de 91
observations. Ces seuils sont reports dans lachage de la procdure dEviews. Au seuil de 5%,
le seuil critique est C() = 2.8932 (2.89 dans la table fournie en annexe pour 100 observations).
Ainsi, dans ce cas pour un niveau de risque de 5%, t > C() , on accepte lhypothse nulle de racine
unitaire ( = 0) dans le modle 2.
Il faut nouveau valuer la validit de notre diagnostic en vrifiant que le modle 2 partir
duquel nous avons fait le test de racine unitaire est bien le bon modle. On teste pour cela la

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

76

nullit du coecient de la constante conditionnellement la prsence dune racine unitaire : test


H02 , (c, ) = (0, 0) . Dans le cas des tests de Dickey Fuller Augments, le test H02 ne correspond
plus lhypothse de nullit jointe de lensemble des coecients de la rgression. En eet, sous H02 ,
les coecients i ne sont pas ncessairement nuls. On ne peut donc plus utiliser la statistique de
Fisher programm dans Eviews pour le test de la nullit de lensemble des coecients du modle.
On doit donc programmer la statistique de Fisher F2 associe H02 .
- Crqvwuxfwlrq ghv gliihuhqfhv suhplhuhv
vpso 1978:2 2001:2
jhqu gfrqvr = frqvr-frqvr(-1)
- Evwlpdwlrq gx prghoh oleuh
htxdwlrq prg2.ov gfrqvr f frqvr(-1) gfrqvr(-1) gfrqvr(-2)
vfdodu vfu2=@vvu
vfdodu qgo=@uhjrev-@qfrhi
- Evwlpdwlrq gx prghoh frqwudlqw
htxdwlrq prg2.ov gfrqvr gfrqvr(-1) gfrqvr(-2)
vfdodu vfu2f=@vvu
- Crqvwuxfwlrq gh od vwdwlvwltxh i2
vfdodu i2=((vfu2f-vfu2)/2)/(vfu2/qgo)
La ralisation de la statistique de Fisher F2 , est gale 8.47. On compare cette ralisation de F2
aux seuils critiques de la table de Dickey et Fuller (1981), tableau VI, page 1063, fournie en annexe
(cf. polycopi dexercices). Pour une taille dchantillon de 100, et un risque de premire espce
de 5%, la valeur critique est gale 4.71. Pour un risque de 5%, la ralisation de F3 est suprieure
au seuil critique, on rejette donc lhypothse nulle de la nullit de la constante conditionnellement
la prsence dune racine unitaire. Ceci signifie que le modle 2 est le bon modle, ce qui valide
par la mme notre diagnostic quant la non stationnarit de la srie de consommation.
Finalement, lapplication des tests ADF nous indique que la srie trimestrielle de consommation
des mnages est engendre par un processus non stationnaire I (1) de type AR (3), puisque :
Consot = 0.56 +Consot1 0.13 (Consot1 Consot2 )
(3.94)

(1.26)

+ 0.26 (Consot2 Consot3 ) + t


(2.56)

(4.164)

Par contre, la srie de consommation direncie (qui correspond au taux de croissance si la


srie en logarithme), est gnre par un processus stationnaire I (0) de type AR (2) avec constante
:
(4.165)
Consot =0.56 0.13 Consot1 + 0.26 Consot2 + t
(3.94)

(1.26)

(2.56)

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

77

o t est un processus bruit blanc. On vrifie en eet que le choix du lag p = 2, nous a permis de
blanchir totalement les rsidus t , comme le confirme lexamen du corrlogramme (non report).

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

78

Les processus ARIM A

Il ne nous reste plus qu introduire prsent une sous-classe de processus ARMA, la classe des
processus ARIMA cest les processus ARMA intgr ou DS. Nous distinguerons les processus
ARIMA non saisonniers et les processus saisonniers SARIMA
Definition 29 Le processus stationnaire xt satisfait une reprsentation ARIMA (Integrated AutoRegressive Moving Average) dordre p et q, intgr dordre d,note ARIMA(p, d, q),
si :
(5.166)
(L) (1 L)d xt = c + (L) t
q
p
j
j
2
2
avec c R, (L) =
j=0 j L , (L) =
j=0 j L o j < q j R , j < p j R ,
0 = 0 = 1 et p , q R2 ,avec {t } i.i.d. 0, 2 . Les polynmes (L) et (L) ont
toutes racines situes lextrieur du cercle unit.

Definition 30 Le processus stationnaire xt satisfait une reprsentation SARIMA saisonnier (Seasonal Integrated AutoRegressive Moving Average) dordre p et q, intgr dordre d, de priode s et s , note SARIMAs,s (p, d, q), si :
(Ls ) (1 Ls )d xt = c + Ls

(5.167)

q
p
j
j
2
2
avec c R, (L) =
j=0 j L , (L) =
j=0 j L o j < q j R , j < p j R ,
0 = 0 = 1 et p , q R2 ,avec {t } i.i.d. 0, 2 . Les polynmes (L) et (L) ont
toutes racines situes lextrieur du cercle unit.

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin

Annexes

A.1

Simulations de rgressions fallacieuses

Le programme des simulations est le suivant :


Tvwdwlvwltxhv : Ssxulrxv Rhjuhvvlrqv
yhfwru (1000) wvwdw5000
yhfwru (1000) wvwdw1000
yhfwru (1000) wvwdw500
yhfwru (1000) wvwdw100
iru !l=1 wr 1000
Iqlwldolvdwlrq gx Purfhvvxv
vpso 1 5000
jhqu {=0
jhqu |=0
Crqvwuxfwlrq ghv Mdufkhv Aodwrluhv
vpso 2 5000
jhqu {={(-1)+quqg
jhqu |=|(-1)+quqg
Rhjuhvvlrq 5000 srlqwv
vpso 1 5000
htxdwlrq ht1.ov | f {
wvwdw5000(!l)=ht1.@wvwdwv(1)
Rhjuhvvlrq 1000 srlqwv
vpso 1 1000
htxdwlrq ht1.ov | f {
wvwdw1000(!l)=ht1.@wvwdwv(1)
Rhjuhvvlrq 500 srlqwv
vpso 1 500
htxdwlrq ht1.ov | f {
wvwdw500(!l)=ht1.@wvwdwv(1)
Rhjuhvvlrq 100 srlqwv
vpso 1 100
htxdwlrq ht1.ov | f {
wvwdw100(!l)=ht1.@wvwdwv(1)
qh{w
vpso 1 100
pwrv(wvwdw5000,wvwdw5000_v)

79

Chapitre 2. UFR Economie Applique. Cours de C. Hurlin


pwrv(wvwdw1000,wvwdw1000_v)
pwrv(wvwdw500,wvwdw500_v)
pwrv(wvwdw100,wvwdw100_v)

80

Vous aimerez peut-être aussi