Vous êtes sur la page 1sur 394

conomtrie

Cours et exercices corrigs


Rgis Bourbonnais

9e dition
Dunod, 2015
5 rue Laromiguire, 75005 Paris
www.dunod.com
ISBN 978-2-10-072151-1
Table des matires
Avant-propos IX

1. Quest-ce que lconomtrie ? 1


I. La notion de modle 1
A. Dfinition 1
B. La construction des modles en conomtrie 2
II. Le rle de lconomtrie 5
A. Lconomtrie comme validation de la thorie 5
B. Lconomtrie comme outil dinvestigation 5
III. La thorie de la corrlation 6
A. Prsentation gnrale 6
B. Mesure et limite du coefficient de corrlation 8

2. Le modle de rgression simple 13


I. Prsentation du modle 13
A. Exemple introductif 13
B. Rle du terme alatoire 14
C. Consquences du terme alatoire 16
II. Estimation des paramtres 17
A. Modle et hypothses 17
B. Formulation des estimateurs 18
C. Les diffrentes critures du modle : erreur et rsidu 21
D. Proprits des estimateurs 22
III. Consquences des hypothses : construction des tests 24
A. Hypothse de normalit des erreurs 24
B. Consquences de lhypothse de normalit des erreurs 25
C. Test bilatral, test unilatral et probabilit critique dun test 27
IV. quation et tableau danalyse de la variance 33
A. quation danalyse de la variance 33
B. Tableau danalyse de la variance 34
V. La prvision dans le modle de rgression simple 39

Table des matires  III


3. Le modle de rgression multiple 47
I. Le modle linaire gnral 47
A. Prsentation 47
B. Forme matricielle 48
II. Estimation et proprits des estimateurs 49
A. Estimation des coefficients de rgression 49
B. Hypothses et proprits des estimateurs 51
C. quation danalyse de la variance et qualit dun ajustement 54
III. Les tests statistiques 59
A. Le rle des hypothses 59
B. Construction des tests 60
C. Tests sur les rsidus : valeur anormale, effet de levier
et point dinfluence 62
IV. Lanalyse de la variance 67
A. Construction du tableau danalyse de la variance
et test de signification globale dune rgression 67
B. Autres tests partir du tableau danalyse de la variance 68
C. Gnralisation des tests par analyse de la variance 73
V. Lutilisation de variables indicatrices 75
A. Constitution et finalits des variables indicatrices 75
B. Exemples dutilisation 76
VI. La prvision laide du modle linaire gnral
et la rgression rcursive 81
A. Prdiction conditionnelle 81
B. Fiabilit de la prvision et intervalle de prvision 82
C. Les tests de stabilit par la rgression rcursive 84
D. Le test de spcification de Ramsey 86
VII. Exercices rcapitulatifs 90
Annexe 102
A) Interprtation gomtrique de la mthode des moindres carrs 102
B) Rsolution de lexercice 1 par des logiciels informatiques
de rgression multiple 103
C) Estimation de la variance de lerreur 105

4. Multicolinarit et slection du modle optimal 107


I. Corrlation partielle 107
A. Exemple introductif 107
B. Gnralisation de la notion de corrlation partielle 108
II. Relation entre coefficients de corrlation simple,
partielle et multiple 112

IV  CONOMTRIE
III. Multicolinarit : consquences et dtection 114
A. Consquences de la multicolinarit 114
B. Tests de dtection dune multicolinarit 115
C. Comment remdier la multicolinarit ? 118
IV. Slection du modle optimal 119

5. Problmes particuliers : la violation des hypothses 125


I. Lautocorrlation des erreurs 125
A. Prsentation du problme 125
B. Lestimateur des Moindres Carrs Gnraliss (MCG) 126
C. Les causes et la dtection de lautocorrlation des erreurs 127
D. Les procdures destimation en cas dautocorrlation des erreurs 134
II. Lhtroscdasticit 142
A. Prsentation du problme 142
B. Correction de lhtroscdasticit 144
C. Tests de dtection de lhtroscdasticit 147
D. Autre test dhtroscdasticit : le test ARCH 153
III. Modles erreurs sur les variables 154
A. Consquences lorsque les variables sont entaches derreurs 154
B. La mthode des variables instrumentales 155
C. Le test dexognit dHausman 156
D. La mthode des moments gnralise 157

6. Les modles non linaires 165


I. Les diffrents types de modles non linaires 165
A. Les fonctions de type exponentiel 165
B. Les modles de diffusion 168
II. Mthodes destimation des modles non linaires 170
A. Initiation aux mthodes destimation non linaires 170
B. Exemples dapplication 172

7. Les modles dcalages temporels 177


I. Les modles linaires autorgressifs 177
A. Formulation gnrale 177
B. Test dautocorrlation et mthodes destimation 178
II. Les modles retards chelonns 183
A. Formulation gnrale 183
B. Dtermination du nombre de retards 184

Table des matires  V


C. Distribution finie des retards 188
D. Distribution infinie des retards 192
III. Deux exemples de modles dynamiques 198
A. Le modle dajustement partiel 198
B. Le modle danticipations adaptatives 199

8. Introduction aux modles quations simultanes 217


I. quations structurelles et quations rduites 218
A. Exemple introductif 218
B. Le modle gnral 220
C. Cas particulier : les modles rcursifs 221
II. Le problme de lidentification 221
A. Restrictions sur les coefficients 221
B. Conditions didentification 222
III. Les mthodes destimation 223
A. Les moindres carrs indirects 223
B. Les doubles moindres carrs 223
C. Autres mthodes destimation 224
Annexe 236
Identification : les conditions de rang 236

9. lments danalyse des sries temporelles 239


I. Stationnarit 239
A. Dfinition et proprits 239
B. Fonctions dautocorrlation simple et partielle 240
C. Tests de bruit blanc et de stationnarit 241
II. La non-stationnarit et les tests de racine unitaire 245
A. La non-stationnarit : les processus TS et DS 245
B. Les tests de racine unitaire et la stratgie squentielle de test 248
III. Les modles ARIMA 256
A. Typologie des modles AR, MA et ARMA 256
B. Lextension aux processus ARIMA et SARIMA 259
IV. La mthode de Box et Jenkins 260
A. Recherche de la reprsentation adquate : lidentification 260
B. Estimation des paramtres 261
C. Tests dadquation du modle et prvision 262

10. La modlisation VAR 275


I. Reprsentation dun modle VAR 276
A. Exemple introductif 276

VI  CONOMTRIE
B. La reprsentation gnrale 277
C. La reprsentation ARMAX 278
II. Estimation des paramtres 279
A. Mthode destimation 279
B. Dtermination du nombre de retards 279
C. Prvision 280
III. Dynamique dun modle VAR 284
A. Reprsentation VMA dun processus VAR 284
B. Analyse et orthogonalisation des chocs 285
C. Dcomposition de la variance 288
D. Choix de lordre de dcomposition 288
IV. La causalit 292
A. Causalit au sens de Granger 292
B. Causalit au sens de Sims 293

11. La cointgration et le modle correction derreur 297


I. Exemples introductifs 297
II. Le concept de cointgration 299
A. Proprits de lordre dintgration dune srie 299
B. Conditions de cointgration 301
C. Le modle correction derreur (ECM) 301
III. Cointgration entre deux variables 302
A. Test de cointgration entre deux variables 303
B. Estimation du modle correction derreur 303
IV. Gnralisation k variables 306
A. La cointgration entre k variables 306
B. Estimation du modle correction derreur 307
C. Le modle correction derreur vectoriel 308
D. Tests de relation de cointgration 310
E. Test dexognit faible 313
F. Synthse de la procdure destimation 314

12. Introduction lconomtrie des variables qualitatives 319


I. Les problmes et les consquences de la spcification binaire 320
II. Les modles de choix binaires 322
A. Le modle linaire sur variable latente 322
B. Les modles Probit et Logit 323
C. Interprtation des rsultats et tests statistiques 325
III. Les modles choix multiples 330
A. Les modles Probit et Logit ordonns 331

Table des matires  VII


B. Le modle de choix multiples non ordonn :
le Logit multinomial 335
IV. Les modles variable dpendante limite : le modle Tobit 337
A. Le modle Tobit simple : modle de rgression tronqu
ou censur 338
B. Estimation et interprtation des rsultats 340

13. Introduction lconomtrie des donnes de panel 345


I. Prsentation des modles donnes de panel 346
A. Spcificits des donnes de panel 346
B. La mthode SUR 347
C. Le modle linaire simple 348
II. Les tests dhomognit 349
A. Procdure squentielle de tests 349
B. Construction des tests 350
III. Spcifications et estimations des modles effets individuels 355
A. Le modle effets fixes individuels 355
B. Le modle effets alatoires 357
C. Effets fixes ou effets alatoires ? Le test dHausman 358

Liste des exercices 363

Tables statistiques 367

Bibliographie 375

Index 379

VIII  CONOMTRIE
Avant-propos
Cette neuvime dition est enrichie de nouveaux exercices et des dveloppe-
ments les plus rcents de lconomtrie. Ce livre couvre tous les champs de
lconomtrie : rgression simple et multiple, violation des hypothses (ht-
roscdasticit, autocorrlation des erreurs, variables explicatives alatoires),
modle dcalage, analyse des sries temporelles, tests de racine unitaire, qua-
tions multiples, VAR, cointgration, VECM, conomtrie des variables qualita-
tives et des donnes de panel
Sur lensemble de ces thmes, ce livre vous propose un cours, des exercices cor-
rigs, et une prsentation des logiciels dconomtrie les plus rpandus.
Souhaitons quil corresponde votre attente.
En effet, nous avons voulu, par une alternance systmatique de cours et
dexercices, rpondre un besoin pdagogique qui est de mettre rapidement en
pratique les connaissances thoriques et ainsi, dutiliser de manire opration-
nelle les acquis du cours ; les exercices sont reprs grce un bandeau gris.
De surcrot, le recours des logiciels1, lors de la rsolution des exercices, per-
met une dcouverte de ces outils et donne une dimension pratique que recher-
chent ltudiant et le praticien.
Afin que le lecteur puisse lui-mme refaire les exercices, les donnes utili-
ses (sous format Excel, ASCII, RATS et Eviews) ainsi que les programmes de
traitement Batch de Eviews ou de RATS sont disponibles gratuitement par
tlchargement sur le serveur web :
http://regisbourbonnais.dauphine.fr
Pour chaque exercice faisant appel un fichier de donnes, le nom du fichier
est cit en tte de lexercice et repr par licne suivante :
Nous avons voulu faire de ce manuel un livre dapprentissage facilement
accessible ; cest pourquoi les dmonstrations les plus complexes font lobjet de
renvois une bibliographie plus spcialise. Cependant, il convient de prciser
que lconomtrie fait appel des notions dalgbre linaire et dinduction sta-
tistique quil est souhaitable de connatre.

1. Trois logiciels sont utiliss : EXCEL ( Microsoft), RATS ( Var Econometrics version 3 et
Estima version 4), Eviews ( Quantitative Micro Software). Nous recommandons aussi parti-
culirement le logiciel GRETL (http://gretl.sourceforge.net) qui est un logiciel dconomtrie
gratuit, complet et trs facile dapprentissage.

Avant-propos  IX
Dans le terme conomtrie figure la racine du mot conomie car son
utilisation est surtout destine des fins de traitement de donnes conomiques ;
cependant, dautres domaines tels que la finance, la recherche agronomique, la
mdecine, etc., font maintenant le plus souvent appel ces techniques.
Ce livre sadresse en premier lieu aux tudiants (sciences conomiques, ges-
tion, coles de commerce et dingnieurs, etc.) dont la formation requiert une
connaissance de lconomtrie. Gageons quil sera un support de cours indis-
pensable et un alli prcieux pour prparer les sances de travaux dirigs.
Noublions pas cependant le praticien de lconomtrie (conomiste dentre-
prise, chercheur, etc.) qui, confront des problmes destimation statistique,
trouvera dans ce livre les rponses pratiques aux diffrentes questions quil peut
se poser.
Enfin, jexprime toute ma gratitude toutes les personnes collgues et tu-
diants qui ont eu la gentillesse de me faire des commentaires et dont les
conseils et suggestions contribuent la qualit pdagogique de ce livre. Je reste,
bien entendu, le seul responsable des erreurs qui subsisteraient1.

1. Les lecteurs souhaitant faire des commentaires ou des remarques peuvent me contacter : Rgis
Bourbonnais, universit de Paris-Dauphine, place du Marchal de Lattre de Tassigny, 75775
Paris Cedex 16, E-mail : regis.bourbonnais@dauphine.fr

X  CONOMTRIE
1. Quest-ce que
lconomtrie ?

C
e premier chapitre est consacr la prsentation de lconomtrie
et sa liaison avec la thorie conomique. Nous abordons tout
dabord la notion de modle ainsi que les diffrentes tapes de la
modlisation. Lapport de lconomtrie en tant quoutil de validation
est tudi en II. Enfin, la thorie de la corrlation fondement de lco-
nomtrie fait lobjet de la section III.

I. La notion de modle
A. Dfinition
Il est dlicat de fournir une dfinition unique de la notion de modle1. Dans le
cadre de lconomtrie, nous pouvons considrer quun modle consiste en une
prsentation formalise dun phnomne sous forme dquations dont les
variables sont des grandeurs conomiques. Lobjectif du modle est de repr-
senter les traits les plus marquants dune ralit quil cherche styliser. Le
modle est donc loutil que le modlisateur utilise lorsquil cherche com-
prendre et expliquer des phnomnes. Pour ce faire, il met des hypothses et
explicite des relations.

1. La notion de modle est relative au point de vue auquel nous nous plaons : la physique,
lpistmologie...

Quest-ce que lconomtrie ?  1


 Pourquoi des modles ?

 Nombreux sont ceux sociologues, conomistes ou physiciens qui


fondent leurs analyses ou leurs jugements sur des raisonnements
construits et labors. Ces constructions refrent implicitement des
modles ; alors pourquoi ne pas expliciter clairement les hypothses et
les relations au sein dun modle ?
Le modle est donc une prsentation schmatique et partielle dune ralit
naturellement plus complexe. Toute la difficult de la modlisation consiste ne
retenir que la ou les reprsentations intressantes pour le problme que le mod-
lisateur cherche expliciter. Ce choix dpend de la nature du problme, du type
de dcision ou de ltude effectuer. La mme ralit peut ainsi tre formalise
de diverses manires en fonction des objectifs.

B. La construction des modles en conomtrie


Dans les sciences sociales, et particulirement en conomie, les phnomnes
tudis concernent le plus souvent des comportements afin de mieux com-
prendre la nature et le fonctionnement des systmes conomiques. Lobjectif du
modlisateur est, dans le cadre de lconomtrie et au travers dune mesure sta-
tistique, de permettre aux agents conomiques (mnages, entreprises, tat...)
dintervenir de manire plus efficace. La construction dun modle comporte un
certain nombre dtapes qui sont toutes importantes. En effet, en cas de faibles-
se dun des maillons , le modle peut se trouver invalid pour cause dhypo-
thses manquantes, de donnes non reprsentatives ou observes avec des
erreurs, etc. Examinons les diffrentes tapes suivre lors de la construction
dun modle, ceci partir de lexemple du modle keynsien simplifi.

1) Rfrence une thorie

Une thorie sexprime au travers dhypothses auxquelles le modle fait rf-


rence. Dans la thorie keynsienne, quatre propositions sont fondamentales :
1. la consommation et le revenu sont lis ;
2. le niveau dinvestissement priv et le taux dintrt sont galement lis ;
3. il existe un investissement autonome public ;
4. enfin, le produit national est gal la consommation plus linvestissement
priv et public.

2  CONOMTRIE
2) Formalisation des relations et choix de la forme des fonctions

partir des propositions prcdentes, nous pouvons construire des relations :


1. la consommation est fonction du revenu : C = f (Y ) avec f > 0 ;
2. linvestissement priv dpend du taux dintrt : I = g(r) avec g < 0 ;
3. il existe un investissement autonome public : I ;
4. enfin, le produit national (ou le revenu national) est gal la consomma-
tion plus linvestissement : Y C + I + I .
ce stade, nous navons postul aucune forme particulire en ce qui concer-
ne les fonctions f et g . Ainsi, bien que des considrations dordre thorique nous
renseignent sur le signe des drives, il existe une multitude de fonctions de
formes trs diffrentes et ayant des signes de drives identiques, par exemple
C = a0 + a1 Y et C = a0 Y a1 . Cependant ces deux relations ne refltent pas le
mme comportement ; une augmentation du revenu provoque un accroissement
proportionnel pour la premire relation, alors que, dans la seconde, leffet ses-
tompe avec laugmentation du revenu (si 0 < a1 < 1 ). Nous appelons forme
fonctionnelle ce choix (arbitraire ou fond) de spcification prcise du mod-
le. Dans notre exemple, le modle explicit scrit :

C = a0 + a1 Y avec a0 > 0 et 0 < a1 < 1


a1 = propension marginale consommer
et a0 = consommation incompressible ;
I = b0 + b1 r avec b0 > 0 et b1 < 0 ;
Y C+I+I

Les deux premires quations refltent des relations de comportements alors


que la troisime est une identit (aucun paramtre nest estimer).

3) Slection et mesure des variables


Le modle tant spcifi, il convient de collecter les variables reprsentatives
des phnomnes conomiques. Ce choix nest pas neutre et peut conduire des
rsultats diffrents, les questions quil convient de se poser sont par exemple :
Faut-il raisonner en euros constants ou en euros courants ?
Les donnes sont-elles brutes ou CVS 1 ?
Quel taux dintrt faut-il retenir (taux au jour le jour, taux directeur de la
Banque Centrale Europenne,...) ? etc.

1. Corriges des Variations Saisonnires.

Quest-ce que lconomtrie ?  3


Nous distinguons plusieurs types de donnes selon que le modle est spci-
fi en :
srie temporelle : cest le cas le plus frquent en conomtrie, il sagit de
variables observes intervalles de temps rguliers (la consommation
annuelle, totale France, exprime en euros courants sur 20 ans) ;
coupe instantane : les donnes sont observes au mme instant et concer-
nent les valeurs prises par la variable pour un groupe dindividus1 spci-
fiques (consommation observe des agriculteurs pour une anne donne) ;
panel : la variable reprsente les valeurs prises par un chantillon dindivi-
dus intervalles rguliers (la consommation dun chantillon de mnages
de la rgion parisienne sur 20 ans) ;
cohorte : trs proches des donnes de panel, les donnes de cohorte se dis-
tinguent de la prcdente par la constance de lchantillon, les individus
sonds sont les mmes dune priode sur lautre.

4) Dcalages temporels
Dans le cadre de modle spcifi en sries temporelles, les relations entre les
variables ne sont pas toujours synchrones mais peuvent tre dcales dans le
temps. Nous pouvons concevoir que la consommation de lanne t est explique
par le revenu de lanne t 1 et non celui de lanne t . Pour lever cette ambi-
gut, il est dusage dcrire le modle en le spcifiant laide dun indice
de temps : Ct = a0 + a1 Yt1 . La variable Yt1 est appele variable endogne
retarde .

 On appelle variable exogne une variable dont les valeurs sont pr-
dtermines, et variable endogne une variable dont les valeurs
dpendent des variables exognes.

5) Validation du modle
La dernire tape est celle de la validation2 du modle :
Les relations spcifies sont-elles valides ?
Peut-on estimer avec suffisamment de prcision les coefficients ?
Le modle est-il vrifi sur la totalit de la priode ?
Les coefficients sont-ils stables ? Etc.
toutes ces questions, les techniques conomtriques sefforcent dapporter
des rponses.

1. Le terme dindividu est employ au sens statistique, cest--dire comme un lment dune popu-
lation : une personne, une parcelle de terre...
2. Validation, cest--dire en conformit avec les donnes disponibles.

4  CONOMTRIE
II. Le rle de lconomtrie
A. Lconomtrie comme validation de la thorie
Lconomtrie est un outil la disposition de lconomiste qui lui permet din-
firmer ou de confirmer les thories quil construit. Le thoricien postule des
relations ; lapplication de mthodes conomtriques fournit des estimations sur
la valeur des coefficients ainsi que la prcision attendue.
Une question se pose alors : pourquoi estimer ces relations, et les tester
statistiquement ? Plusieurs raisons incitent cette dmarche : tout dabord cela
force lindividu tablir clairement et estimer les interrelations sous-jacentes.
Ensuite, la confiance aveugle dans lintuition peut mener lignorance de
liaisons importantes ou leur mauvaise utilisation. De plus, des relations mar-
ginales mais nanmoins explicatives, qui ne sont quun lment dun modle
global, doivent tre testes et valides afin de les mettre leur vritable place.
Enfin, il est ncessaire de fournir, en mme temps que lestimation des relations,
une mesure de la confiance que lconomiste peut avoir en celles-ci, cest--dire
la prcision que lon peut en attendre. L encore, lutilisation de mthodes pure-
ment qualitatives exclut toute mesure quantitative de la fiabilit dune relation.

B. Lconomtrie comme outil dinvestigation


Lconomtrie nest pas seulement un systme de validation, mais galement un
outil danalyse. Nous pouvons citer quelques domaines o lconomtrie appor-
te une aide la modlisation, la rflexion thorique ou laction conomique
par :
la mise en vidence de relations entre des variables conomiques qui
ntaient pas a priori videntes ou pressenties ;
linduction statistique ou linfrence statistique consiste infrer, partir
des caractristiques dun chantillon, les caractristiques dune population.
Elle permet de dterminer des intervalles de confiance pour des paramtres
du modle ou de tester si un paramtre est significativement1 infrieur,
suprieur ou simplement diffrent dune valeur fixe ;

1. Au sens statistique, cest--dire avec un seuil (risque derreur ne pas dpasser, souvent 5 %).

Quest-ce que lconomtrie ?  5


la simulation qui mesure limpact de la modification de la valeur dune
variable sur une autre (Ct = a1 Yt ) ;
la prvision1, par lutilisation de modles conomtriques, qui est utilise
par les pouvoirs publics ou lentreprise afin danticiper et ventuellement
de ragir lenvironnement conomique.
Dans cet ouvrage, nous nous efforcerons de montrer, laide dexemples, les
diffrentes facettes de lutilisation des techniques conomtriques dans des
contextes et pour des objectifs diffrents.

III. La thorie de la corrlation


A. Prsentation gnrale
Lorsque deux phnomnes ont une volution commune, nous disons quils sont
corrls . La corrlation simple mesure le degr de liaison existant entre ces
deux phnomnes reprsents par des variables. Si nous cherchons une relation
entre trois variables ou plus, nous ferons appel alors la notion de corrlation
multiple.
Nous pouvons distinguer la corrlation linaire, lorsque tous les points du
couple de valeurs (x,y) des deux variables semblent aligns sur une droite, de
la corrlation non linaire lorsque le couple de valeurs se trouve sur une mme
courbe dallure quelconque.
Deux variables peuvent tre :
en corrlation positive ; on constate alors une augmentation (ou diminu-
tion, ou constance) simultane des valeurs des deux variables ;
en corrlation ngative, lorsque les valeurs de lune augmentent, les valeurs
de lautre diminuent ;
non corrles, il ny a aucune relation entre les variations des valeurs de
lune des variables et les valeurs de lautre.
Le tableau 1, en croisant les critres de linarit et de corrlation, renvoie
une reprsentation graphique.

1. Pour dcouvrir lutilisation de lconomtrie des fins de prvision de ventes, voir Bourbonnais
R. et Usunier J. C. (2013).

6  CONOMTRIE
Tableau 1 Linarit et corrlation

Corrlation Corrlation Absence de


positive ngative corrlation
Relation linaire Graphe 1 Graphe 2 Graphe 5
Relation non linaire Graphe 3 Graphe 4 Graphe 5

y
y

x x
Graphe 1 Graphe 2
y
y

x x
Graphe 3 Graphe 4
y

x
Graphe 5

Quest-ce que lconomtrie ?  7


B. Mesure et limite du coefficient de corrlation
1) Le coefficient de corrlation linaire
La reprsentation graphique ne donne quune impression de la corrlation
entre deux variables sans donner une ide prcise de lintensit de la liaison,
cest pourquoi nous calculons une statistique appele coefficient de corrlation
linaire simple, not r x,y . Il est gal :


n
(xi x)(yi y)
Cov (x,y) i=1
r x,y = =  [1]
x y n n
2
(xi x ) (yi y )2
i=1 i=1

avec :
Cov (x,y) = covariance entre x et y ;
x et y = cart type de x et cart type de y ;
n = nombre dobservations.
En dveloppant la formule [1], il vient :


n 
n 
n
n xi yi xi yi
i=1 i=1 i=1
r x,y =   [2]

n 
n 2 
n 
n 2
2
n x
i xi n yi2 yi
i=1 i=1 i=1 i=1

On peut dmontrer que, par construction ce coefficient reste compris entre


1 et 1 :
proche de 1, les variables sont corrles positivement ;
proche de 1 , les variables sont corrles ngativement ;
proche de 0, les variables ne sont pas corrles.
Dans la pratique, ce coefficient est rarement trs proche de lune de ces trois
bornes et il est donc difficile de proposer une interprtation fiable la simple
lecture de ce coefficient. Ceci est surtout vrai en conomie o les variables sont
toutes plus au moins lies entre elles. De plus, il nest calcul qu partir dun
chantillon dobservations et non pas sur lensemble des valeurs. On appelle x,y

8  CONOMTRIE
ce coefficient empirique qui est une estimation du coefficient vrai r x,y . La tho-
rie des tests statistiques nous permet de lever cette indtermination.
Soit tester lhypothse H0 : r x,y = 0 , contre lhypothse H1 : r x,y = 0 .
x,y
Sous lhypothse H0, nous pouvons dmontrer que    suit une loi
2
1 x,y
n2
de Student n 2 degrs de libert1. Nous calculons alors une statistique, appe-
l le t de Student empirique :

|x,y |
t =    [3]
2
1 x,y
n2

/2
Si t > tn2 valeur lue dans une table de Student2 au seuil = 0,05 (5 %)
n 2 degrs de libert3, nous rejetons lhypothse H0, le coefficient de corrla-
tion est donc significativement diffrent de 0 ; dans le cas contraire, lhypoth-
se dun coefficient de corrlation nul est accepte. La loi de Student tant sym-
trique, nous calculons la valeur absolue du t empirique et nous procdons au test
par comparaison avec la valeur lue directement dans la table.

1. La notion de degrs de libert est explicite au chapitre 2.


2. Les lois de probabilit sont en fin douvrage.
3. Si le nombre dobservations n est suprieur 30, on peut approximer la loi de Student par une
loi normale, soit t /2 1,96 .

Quest-ce que lconomtrie ?  9


Exercice n 1
fichier C1EX1
Calcul dun coefficient de corrlation
Un agronome sintresse la liaison pouvant exister entre le rendement de mas x
(en quintal) dune parcelle de terre et la quantit dengrais y (en kilo). Il relve 10 cou-
ples de donnes consigns dans le tableau 2

Tableau 2 Rendement de mas et quantit dengrais

Rendement x 16 18 23 24 28 29 26 31 32 34

Engrais y 20 24 28 22 32 28 32 36 41 41

1) Tracer le nuage de points et le commenter.


2) Calculer le coefficient de corrlation simple et tester sa signification par rapport 0
pour un seuil = 0,05 .

Solution

1) Le nuage de points (graphique 6) indique que les couples de valeurs sont approxima-
tivement aligns : les deux variables semblent corrles positivement.
Quantit dengrais

Rendement

Graphique 6 Nuage du couple de valeurs :


rendement-quantit dengrais

10  CONOMTRIE
2) Afin dappliquer la formule [2], nous dressons le tableau de calcul 3.

Tableau 3 Calcul dun coefficient de corrlation

. x y x2 y2 xy

16 20 256 400 320


18 24 324 576 432
23 28 529 784 644
24 22 576 484 528
28 32 784 1 024 896
29 28 841 784 812
26 32 676 1 024 832
31 36 961 1 296 1 116
32 41 1 024 1 681 1 312
34 41 1 156 1 681 1 394

Somme 261 304 7 127 9 734 8 286

(10)(8 286) (261)(304) 3 516


x,y =   =
2
(10)(7 127) 261 (10)(9 734) 3042 (56,11)(70,17)

2
soit x,y = 0,89 et x,y = 0,79
Le t de Student empirique (daprs [3]) est gal :
|x,y | 0,89
t =  = = 5,49 > t80,025 = 2,306
(1 2
x,y ) 0,1 620
n2

le coefficient de corrlation entre x et y est significativement diffrent de 0.

2) Limites de la notion de corrlation

a) La relation teste est linaire


Lapplication de la formule [1] ou [2] ne permet de dterminer que des corrla-
tions linaires entre variables. Un coefficient de corrlation nul indique que la
covariance entre la variable x et la variable y est gale 0. Cest ainsi que deux
variables en totale dpendance peuvent avoir un coefficient de corrlation nul,
comme lillustre lexemple suivant : lquation dun cercle nous est donne
par (x x1 )2 + (y y1 )2 = R 2 , les variables x et y sont bien lies entre elles
fonctionnellement (graphique 7) et pourtant leur covariance est nulle et donc
leur coefficient de corrlation gal 0.
Pour pallier cette limite, il convient ventuellement de transformer les
variables, pralablement au calcul du coefficient de corrlation, afin de linariser

Quest-ce que lconomtrie ?  11


leur relation, par exemple au moyen dune transformation de type logarith-
mique.

Graphique 7 Relation fonctionnelle nest pas corrlation linaire

b) Corrlation nest pas causalit


Le fait davoir un coefficient de corrlation lev entre deux variables ne signi-
fie pas quil existe un autre lien que statistique. En dautres termes, une cova-
riance significativement diffrente de 0 nimplique pas une liaison dordre co-
nomique, physique ou autre. Nous appelons corrlation fortuite ce type de cor-
rlation que rien ne peut expliquer.
Lexemple le plus fameux concerne la forte corrlation existante entre le
nombre de taches solaires observes et le taux de criminalit aux tats-Unis.
Cela ne signifie pas quil existe une relation entre les deux variables, mais
quune troisime variable, lvolution de long terme (la tendance) ici, explique
conjointement les deux phnomnes. La thorie de la cointgration traite de ce
problme (cf. chapitre 11).

12  CONOMTRIE
2. Le modle
de rgression simple

N
ous commenons notre tude par le modle le plus simple : une
variable endogne est explique par une variable exogne.
Aprs avoir tudi les consquences probabilistes de lerreur
dobservation, nous prsentons en I. les formules de base permettant
destimer les paramtres du modle. Les hypothses stochastiques et
leurs consquences sont tudies au paragraphe II.
En III. et IV., la qualit de lestimation dun modle est examine laide
des premiers tests statistiques (Student, Fisher).
Enfin, en V., le modle de rgression simple est tudi en tant quoutil de
prvision avec le degr de confiance que nous pouvons en attendre.

I. Prsentation du modle
A. Exemple introductif
Soit la fonction de consommation keynsienne :
C = a0 + a1 Y

o :
C = consommation,
Y = revenu,
a1 = propension marginale consommer,
a0 = consommation autonome ou incompressible.

Le modle de rgression simple  13


1) Vocabulaire

La variable consommation est appele variable expliquer ou variable


endogne .
La variable revenu est appele variable explicative ou variable exogne
(cest le revenu qui explique la consommation).
a1 et a0 sont les paramtres du modle ou encore les coefficients de rgression.

2) Spcification

Nous pouvons distinguer deux types de spcifications :


Les modles en srie temporelle, les variables reprsentent des phnomnes
observs intervalles de temps rguliers, par exemple la consommation et le
revenu annuel sur 20 ans pour un pays donn. Le modle scrit alors :
Ct = a0 + a1 Yt t = 1,. . . , 20
o :
Ct = consommation au temps t ,
Yt = revenu au temps t .
Les modles en coupe instantane, les variables reprsentent des phnomnes
observs au mme instant mais concernant plusieurs individus, par exemple la
consommation et le revenu observs sur un chantillon de 20 pays. Le modle
scrit alors :
Ci = a0 + a1 Yi i = 1,. . . , 20
o :
Ci = consommation du pays i pour une anne donne,
Yi = revenu du pays i pour une anne donne.

B. Rle du terme alatoire


Le modle tel quil vient dtre spcifi nest quune caricature de la ralit.
En effet ne retenir que le revenu pour expliquer la consommation est lvi-
dence mme insuffisant ; il existe une multitude dautres facteurs susceptibles
dexpliquer la consommation. Cest pourquoi nous ajoutons un terme (t )
qui synthtise lensemble de ces informations non explicites dans le mo-
dle : Ct = a0 + a1 Yt + t si le modle est spcifi en srie temporelle
(Ci = a0 + a1 Yi + i si le modle est spcifi en coupe instantane), o t repr-
sente lerreur de spcification du modle, cest--dire lensemble des phno-
mnes explicatifs de la consommation non lis au revenu. Le terme t mesure la

14  CONOMTRIE
diffrence entre les valeurs rellement observes de Ct et les valeurs qui auraient
t observes si la relation spcifie avait t rigoureusement exacte. Le terme
t regroupe donc trois erreurs :
une erreur de spcification, cest--dire le fait que la seule variable expli-
cative nest pas suffisante pour rendre compte de la totalit du phnom-
ne expliqu ;
une erreur de mesure, les donnes ne reprsentent pas exactement le ph-
nomne ;
une erreur de fluctuation dchantillonnage, dun chantillon lautre les
observations, et donc les estimations, sont lgrement diffrentes.

Exercice n 1
fichier C2EX1

Gnration dune consommation alatoire


Le tableau 1 prsente le revenu moyen par habitant sur 10 ans exprim en dollars
pour un pays.

Tableau 1 volution du revenu moyen par habitant en dollars

Anne Revenu
1 8 000
2 9 000
3 9 500
4 9 500
5 9 800
6 11 000
7 12 000
8 13 000
9 15 000
10 16 000

Sachant que la propension marginale consommer est de 0,8 et que la consomma-


tion incompressible est 1 000, on demande :
1) de calculer la consommation thorique sur les 10 ans ;
2) considrant que notre erreur dobservation suit une loi normale de moyenne 0 et de
variance 20 000, de gnrer cette variable alatoire et de calculer une consommation
observe tenant compte de cette erreur.

Solution

Les calculs des questions 1) et 2) sont prsents dans le tableau 2.


La consommation thorique (colonne 3) est calcule par application directe de la
formule : Ct = 1 000 + 0,8 Yt .

Le modle de rgression simple  15


La gnration de la variable alatoire t (t N (0 ; 20 000)) ne pose pas de diffi-
cult particulire ; bien entendu il en existe une infinit, un exemple en est prsent en
colonne 4.
La consommation observe (colonne 5) est donc gale Ct = 1 000 + 0,8 Yt + t ,
soit la somme de la colonne 3 et de la colonne 4.

Tableau 2 Calcul de la consommation observe

(1) (2) (3) (4) (5)


Anne Revenu Consommation Ala Consommation
disponible thorique t observe

1 8 000 7 400 10,01 7 389,99


2 9 000 8 200 30,35 8 169,65
3 9 500 8 600 231,71 8 831,71
4 9 500 8 600 52,84 8 652,84
5 9 800 8 840 51,92 8 788,08
6 11 000 9 800 183,79 9 616,21
7 12 000 10 600 6,55 10 593,45
8 13 000 11 400 213,89 11 186,11
9 15 000 13 000 241,91 12 758,09
10 16 000 13 800 69,62 13 869,62
Moyenne : 38,42
cart type : 137,24

Nous observons que la moyenne de t , = 38,42 et la variance de t , Var(t ) =


18 834,81 sont lgrement diffrentes des valeurs thoriques. Cela est la consquence
du tirage particulier dun chantillon de taille assez faible (dix observations).

C. Consquences du terme alatoire


Dans lexercice prcdent, les valeurs vraies a0 et a1 sont parfaitement connues,
cependant, dans la ralit, nous ne connaissons pas ces valeurs mais seulement
les deux sries dobservations Ct et Rt . Les estimateurs1 de a0 et a1 , nots res-
pectivement  a0 et 
a1 , sont des variables alatoires, qui suivent les mmes lois de
probabilit, celle de t , puisquils sont fonctions de la variable alatoire t . Les
caractristiques de moyenne et dcart type de ces coefficients permettent de
construire des tests de validit du modle estim.

1. Il ne faut pas confondre : estimateur 


a de a et estimation de 
a qui est la valeur particulire de
lestimateur pour un chantillon.

16  CONOMTRIE
Si laide dun programme informatique ( C2EX1.PRG) nous construi-
sons 150 chantillons de valeurs diffrentes pour la variable alatoire
t N (0 ; 20 000), nous allons alors trouver 150 estimations de a1 lgrement
diffrentes entre elles dont la distribution aura la forme de lhistogramme du
graphique 1.
Cette distribution a pour moyenne 0,801 et cart type 0,032, nous pouvons
observer quelle est peu prs symtrique par rapport la moyenne et quelle a
la forme dune courbe en cloche : tous ces lments suggrent bien une dis-
tribution normale de : a1 N (0,801 ; 0,032) . Cela est la consquence directe
de la normalit des erreurs.
Frquence

Coefficient 1

Graphique 1 Histogramme de la distribution de 150 


a1

II. Estimation des paramtres


A. Modle et hypothses
Soit le modle suivant :
yt = a0 + a1 xt + t pour t = 1,. . . ,n

Le modle de rgression simple  17


avec :
yt = variable expliquer au temps t ;
xt = variable explicative au temps t ;
a0 ,a1 = paramtres du modle ;
t = erreur de spcification (diffrence entre le modle vrai et le modle
spcifi), cette erreur est inconnue et restera inconnue ;
n = nombre dobservations.

Hypothses
H1 : le modle est linaire en xt (ou en nimporte quelle transformation de xt ).
H2 : les valeurs xt sont observes sans erreur (xt non alatoire).
H3 : E(t ) = 0 , lesprance mathmatique de lerreur est nulle : en moyenne le
modle est bien spcifi et donc lerreur moyenne est nulle.
H4 : E(t2 ) = 2 , la variance de lerreur est constante1 : le risque de lamplitu-
de de lerreur est le mme quelle que soit la priode.
H5 : E(t t ) = 0 si t = t , les erreurs sont non corrles (ou encore indpen-
dantes) : une erreur linstant t na pas dinfluence sur les erreurs sui-
vantes.
H6 : Cov(xt ,t ) = 0 , lerreur est indpendante de la variable explicative.

B. Formulation des estimateurs


En traant un graphique (2) des couples de donnes liant le revenu et la consom-
mation observe, nous obtenons un nuage de points que nous pouvons ajuster
laide dune droite.
Lestimateur des coefficients a0 et a1 est obtenu en minimisant la distance au
carr entre chaque observation et la droite, do le nom destimateur des
moindres carrs ordinaires (MCO).
La rsolution analytique est la suivante :


t=n 
t=n
Min t2 = Min (yt a0 a1 xt )2 = Min S
t=1 t=1

1. Cette hypothse sappelle lhypothse dhomoscdasticit ; dans le cas o cette hypothse nest
pas vrifie, on parle alors de modle htroscdastique.

18  CONOMTRIE
Graphique 2 Ajustement dun nuage de points par une droite

En oprant par drivation par rapport a0 et a1 afin de trouver le minimum1


de cette fonction, on obtient les rsultats suivants :

S  S 
= 2 (yt a0 a1 x t ) = 0 et = 2 x t (yt a0 a1 x t ) = 0
a0 t
a1 t

Sommant par rapport t , il vient :


  
xt yt 
a0 xt 
a1 xt2 = 0
t t t
 
a0 
yt n a1 xt = 0
t t

quon appelle les quations normales et qui impliquent que :


t=n 
t=n
(xt x)(yt y) xt yt nx y
[1]
t=1 t=1

a1 = =
t=n  t=n
(xt x)2 xt2 nx 2
t=1 t=1

a0 = y 
 a1 x [2]

1. Nous considrons les conditions du deuxime ordre comme vrifies car la fonction est convexe.

Le modle de rgression simple  19


Nous pouvons faire deux remarques :
lcriture du modle nest pas neutre ;
La spcification : yt = a0 + a1 xt + t nest pas quivalente :
xt = a0 + a1 yt + t . Dans le premier modle, xt est la cause de yt , alors que dans
la deuxime spcification, cest yt qui est la cause de xt .

Nous remarquons que :  a1 = 2


a1 
( = coefficient de corrlation entre x et y ) ;

le coefficient a1 reprsente la pente de la droite ou encore une propension


marginale.
Nous avons :
yt =  a1
xt . Limpact dune variation de xt se mesure direc-
tement sur yt au travers du coefficient 
a1 .

Cas particulier : modle sans terme constant


La thorie conomique postule parfois des relations dans lesquelles a0 = 0 :
cest le cas par exemple pour une fonction de production de produit industriel
o le facteur de production (unique) nul entrane une production nulle.
Lestimation de a1 est alors donne par la formule suivante :

t=n
xt yt
t=1

a1 = [3]
t=n
2
x t
t=1

Nous remarquons quil sagit de lapplication de la formule [1] dans laquel-


le x et y sont nulles. Dans le cas de variables centres1, cest donc cette formu-
le [3] quil convient demployer car le terme constant est nul.

Exercice n 2
fichier C2EX2
Estimation des coefficients de rgression
partir des donnes du tableau 2 de lexercice 1, on demande de calculer les esti-
mations de 
a0 et 
a1 .

Solution

Le tableau 3 prsente les calculs effectuer.

1. Les donnes sont centres lorsque les observations sont centres sur leur moyenne : (xt x) ,
la somme des donnes centres est donc par construction nulle.

20  CONOMTRIE
Tableau 3 Calcul dun coefficient de rgression

(1) (2) (3) (4) (5) (6) (7)


t yt xt yt y xt x (5)* (5) (4)* (5)

1 7 389,99 8 000 2 595,59 3 280 10 758 400 8 513 518


2 8 169,65 9 000 1 815,93 2 280 5 198 400 4 140 300
3 8 831,71 9 500 1 153,87 1 780 3 168 400 2 053 879
4 8 652,84 9 500 1 332,74 1 780 3 168 400 2 372 268
5 8 788,08 9 800 1 197,50 1 480 2 190 400 1 772 292
6 9 616,21 11 000 369,37 280 78 400 103 422
7 10 593,45 12 000 607,88 720 518 400 437 670
8 11 186,11 13 000 1 200,54 1 720 2 958 400 2 064 920
9 12 758,09 15 000 2 772,52 3 720 13 838 400 10 313 755
10 13 869,62 16 000 3 884,05 4 720 22 278 400 18 332 692

Somme 99 855,75 112 800 0 0 64 156 000 50 104 729


Moyenne 9 985,57 11 280 0 0 6 415 600 5 010 472


t=n
(xt x)(yt y)
t=1 50 104 729

a1 = = = 0,78

t=n 64 156 000
(xt x)2
t=1

a0 = y 
 a1 x = 9 985,57 0,78 11 280 = 1 176,08
Ces estimations sont comparer aux valeurs vraies (respectivement 0,8 et 1 000),
les diffrences importantes en ce qui concerne surtout le terme constant sont imputables
lala dobservation qui perturbe lestimation des coefficients.

C. Les diffrentes critures du modle :


erreur et rsidu
Le modle de rgression simple peut scrire sous deux formes selon quil sagit
du modle thorique spcifi par lconomiste ou du modle estim partir dun
chantillon.
Modle thorique spcifi par lconomiste avec t lerreur inconnue :

yt = a0 + a1 xt + t

Modle estim partir dun chantillon dobservations :

yt = 
a0 + 
a1 xt + et = 
yt + et et = rsidu

(Bien noter les chapeaux sur les a .)

Le modle de rgression simple  21


Le rsidu observ et est donc la diffrence entre les valeurs observes de la
variable expliquer et les valeurs ajustes laide des estimations des coeffi-
cients du modle ;
ou encore :

yt = 
a0 + 
a1 x t

D. Proprits des estimateurs


yt = a0 + a1 xt + t [4]
y = a0 + a1 x + [5]

[4] [5] = yt y = a1 (xt x) + (t )

En remplaant dans la formule [1] de lestimateur 


a1 , yt y par son expression,
on obtient :
t=n t=n
(x t x)(t ) (x t x)t
t=1 t=1

a1 = a1 + = a1 + [6]

t=n 
t=n
2 2
(x t x) (x t x)
t=1 t=1


n
xt

n 
n
t=1
car (x t x) = x t n x = nx nx = 0 avec x =
t=1 t=1
n

Les estimateurs sont-ils sans biais ?


a ) = a.)
(Rappel : un estimateur est sans biais si E(

t=n
(x t x)t
t=1

a1 = a1 + [7]
t=n
2
(x t x)
t=1


t=n
(xt x)E(t )
t=1
do : a1 ) = E(a1 ) +
E(
t=n
(xt x)2
t=1

a1 ) = a1 car E(t ) = 0
Soit E(
a0 ) = a0 .
De mme on dmontre que E(

22  CONOMTRIE
y =a0 + 
a1 x

a0 = a0 + (
a1 a1 )x
y = a0 + a1 x +
a0 ) = a0 + E() E((
E( a1 a1 )x) = a0
a1 a1 ) = 0 et E() = 0
car E(

n 
car E() est par hypothse nulle, E t = 0
t=1

 Les estimateurs sont sans biais.


Les estimateurs sont-ils convergents ?
Puisque les estimateurs sont sans biais, il suffit pour quils soient convergents
que :
Lim V (a1 ) 0 lorsque n o V ( a1 ) est la variance de 
a1 .
t=n 2

(x t x)t
t=1
a1 ) = E{
V ( a1 E( 2
a1 )} = E( 2
a1 a1 ) = E t=n (daprs [7])


(x t x)2
t=1
 2   
  
2 2
a1 ) = E
V ( wt t =E w +2
t t wt wt t t
t t t<t

(xt x)
avec wt =

t=n
(xt x)2
t=1
 
a1 ) =
V ( wt2 E(t2 ) + 2 wt wt E(t t )
t t<t

Or, daprs les hypothses :


H4 E(t2 ) = 2 ;
H5 E(t t ) = 0 si t = t .

 2
a1 ) =
V ( wt2 2 =  [8]
t (xt x)2
t


Lorsque n alors (xt x)2 tend galement vers , do V (
a1 ) tend
t
2
vers 0 puisque est constant.

Nous pouvons observer sur lexpression de la variance de  a1 que cet estima-



2
teur est dautant plus prcis que (xt x) est lev, cest--dire lorsque :
t

Le modle de rgression simple  23


le nombre dobservations est important ;
et/ou les valeurs de la variable explicative sont trs disperses autour de la
moyenne.
Une dmonstration analogue pour  a0 conduit aux rsultats suivant :

2
1 x
a0 ) = 2 + 
V ( [9]
n (xt x)2

a0 ) 0 lorsque n .
Lim V (
Nous remarquons que :
2
a0 ) =
V ( + x 2 V (
a1 ) Cov( a1 ) = x V (
a0 , a1 )
n
 Les estimateurs sont convergents.

III. Consquences des hypothses :


construction des tests
A. Hypothse de normalit des erreurs
Nous allons maintenant introduire de nouveau lhypothse qui est celle de la
normalit des erreurs (cf. exercice 1). Cette hypothse nest pas indispensable
afin dobtenir des estimateurs convergents mais elle va nous permettre de
construire des tests statistiques1 concernant la validit du modle estim.
Soit t N (0, 2 )
Le graphique 3 illustre cette hypothse sur la distribution des valeurs proje-
tes sur la droite des moindres carrs.

Graphique 3 Les erreurs suivent une loi normale

1. En effet, cette hypothse permet de dfinir la loi de probabilit des estimateurs.

24  CONOMTRIE
B. Consquences de lhypothse de normalit des erreurs
En prliminaire, cherchons un estimateur de la variance de lerreur.
Le rsidu est donn par :
et = yt yt = yt a1 xt a0
Sans rien changer lexpression prcdente, nous pouvons crire :
et = yt a1 xt a0 a1 x + a1 x
Ou encore : et = yt a1 x a0 a1 xt + a1 x
Or y = a1 x + a0
Do : et = yt y a1 (xt x)
En remplaant yt et y par leurs expressions [4] et [5], il vient :
et = (a1 
a1 )(xt x) + (t )
Nous obtenons en levant ce terme au carr et effectuant la somme sur les n
observations :
   
a1 )2
et2 = (a1  (xt x)2 + (t )2 + 2(a1 
a1 ) (xt x)(t )
t t t t

Or daprs lexpression [6], nous avons :


 
(xt x)(t ) = (a1 
a1 ) (xt x)2
t t
que nous remplaons dans lexpression prcdente et aprs simplification :
  
et2 = (t )2 (a1 
a1 )2 (xt x)2
t t t
En prenant lesprance mathmatique de cette dernire expression :
   
 
E et2 = E a1 )2
(t )2 E (a1  (xt x)2
t t t

Examinons les deux membres de cette quation.


       
2
a) E 2
(t ) = E 2
(t 2t + ) = E 2
t 2 t + 2
t t t t
   t
2 2 2 2 2
=E t 2n + n = E t 2n + n
t t
    
=E t2 n2 = E t2 t
t t t
 2
 t   

2 t 2 1   2
=E t = E( ) E
t t
t
n t
n t

Le modle de rgression simple  25


Nous savons que : E[t2 ] = 2
 
1  2
E (t ) = n2 E 1 + 2 + . . . + n
2

t
n

Or, daprs lhypothse dindpendance des erreurs, les doubles produits


sont donc tous nuls. Nous obtenons alors :
 
1
E (t ) = n2 n2 = n2 2
2

t
n
 
a1 )2
b) E (a1  (xt x)2 = 2
t
  2
a1 )2 = 
En effet E (a1 
(xt x)2
Do : t
 

E et2 = (n 1)2 2 = (n 2)2
t

Lestimateur de la variance de lerreur (2 ) not 


2 est donc gal :

1  2
2 =
 e [10]
n2 t t

Ce qui nous permet de dfinir, en remplaant la variance des erreurs par son
estimateur dans les expressions [8] et [9], les estimateurs empiriques1 de la
variance de chacun des coefficients.

2

a21 = 

(xt x)2
t
[11]
2
1 x
 2 + 
a20 = 
n (xt x)2

Lhypothse de normalit des erreurs implique que :



a1 a1 
a0 a0
et
a1 a0

suivent une loi normale centre rduite N(0, 1).

1. Bien noter les chapeaux qui diffrencient les estimateurs thoriques (inconnus) des estima-
tions empiriques (calculables).

26  CONOMTRIE

n
et2
t=1 2

2
= (n 2)
2

suit une loi du 2 (chi-deux) n 2 degrs de libert1 (somme au carr de n 2


variables alatoires indpendantes normales centres rduites).
n
et2
2 2


t=1
Nous pouvons remarquer que (n 2) 2 = (n 2) a2 = 2 
a a (x t x)2
t
suit donc aussi une loi du 2 (chi-deux) n 2 degrs de libert.
Il en rsulte que :

a1 a1 
a0 a0
 et (lcart type thorique est remplac par lcart type

a1 
a0
empirique) suivent une loi de Student n 2 degrs de libert.

a1 a1

a1 a1 a1
En effet = est le rapport dune loi normale

a1 a2
 1
(n 2) 21
a1 (n 2)
centre rduite la racine carre dun chi-deux divis par son degr de libert.
Il est donc possible maintenant de mettre en place des tests statistiques afin
dapporter des rponses des problmes tels que :
comparaison dun coefficient de rgression par rapport une valeur fixe ;
comparaison de deux coefficients de rgression provenant de deux chan-
tillons diffrents ;
dtermination dun intervalle de confiance pour un coefficient.

C. Test bilatral, test unilatral et probabilit critique dun test


1) Test bilatral
Soit tester, un seuil de 5 %, lhypothse H0 : a1 = 0 contre lhypothse
H1 : a1 0.

a1 a1
Nous savons que suit une loi de Student n 2 degrs de libert.

a1
1. La notion de degr de libert correspond au nombre de valeurs restant rellement disposition
aprs une procdure destimaton statistique. Si un chantillon comprend 10 observations et
quon dispose en plus de la moyenne de cet chantillon, on ne peut choisir librement les valeurs
que pour 9 de ces observations, la dixime se dduisant de la valeur de la moyenne. Dans le
cas prsent, le modle de rgression simple, le nombre de degrs de libert est donc de
n 2 car nous avons estim deux paramtres a0 et a1.

Le modle de rgression simple  27



a1 0
Sous H0 (a1 = 0) le ratio appel ratio de Student suit donc une loi de

a1
Student n 2 degrs de libert. Le test dhypothses bilatral consiste donc com-
|
a1 |
parer le ratio de Student empirique t = la valeur du t de Student lue dans la

a1
table n 2 degrs de libert1 et pour un seuil de probabilit gal 5 %, soit si n
0,05
2 > 30, t = 1,96 (la table 2. de Student en fin du livre est tabule pour les tests
bilatraux). Si t* > t
0,05
= 1,96 , nous rejetons lhypothse H0 (cf. graphique 4), le
coefficient thorique et inconnu a1 est significativement diffrent de 0.

Graphique 4 Test bilatral 5 %

2) Test unilatral

Soit tester, un seuil de 5 %, lhypothse H0 : a1 = 0 contre lhypothse


H1 : a1 > 0 ou a1 < 0 selon que le coefficient estim soit positif ou ngatif.
Le test dhypothses unilatral consiste donc comparer le ratio de Student
|
a1 |
empirique t = la valeur du t de Student lue dans la table n 2 degrs

a1
de libert et pour un seuil de probabilit gal 5 %, soit si n 2 > 30,
0,05
t = 1,65 . Si t* > t0,05
= 1,65 nous rejetons lhypothse H0 (cf. graphique 5),
le coefficient thorique et inconnu a1 est significativement diffrent de 0.
Attention, la table de Student en fin du livre est tabule pour les tests bilatraux,
il faut donc lire 10 % = 2 0,05.

1. Si le degr de libert est suprieur 30, la loi de Student peut tre approxime par une loi nor-
male.

28  CONOMTRIE
Graphique 5 Test unilatral 5 % (H1 : a1 > 0)

Remarque : si nous rejetons lhypothse H0 pour un test bilatral, alors nous


rejetons forcment (pour un mme seuil de probabilit) lhypothse H0 pour un
test unilatral.

3) Probabilit critique dun test

La probabilit critique risque de rejeter tort lhypothse H0 ou encore


risque de premire espce est donne par la valeur de la probabilit c telle que :
c

a1
tn2 = t = , par la lecture sur une table de Student n 2 degrs de libert.

a1
La probabilit critique dun test unilatral peut directement se dduire de la
probabilit critique dun test bilatral par une simple division par 2
c c
unilatr al = bilatr al /2 (opration inverse de celle de la lecture de la table).

Exemple : Pour t = 2,53 et n 2 = 20, soit dterminer c tel que


c
t = 2,53 . Par lecture de la table de Student 20 degrs de libert, nous trou-
20
vons c = 2 % pour un test bilatral et donc 1 % pour un test unilatral.

Exercice n 3
fichier C2EX2
Test de coefficient et intervalle de confiance
En reprenant les rsultats de lexercice 2, on demande de rpondre aux questions
suivantes.
1) La propension marginale consommer est-elle significativement diffrente de 0 ?

Le modle de rgression simple  29


2) Quel est lintervalle de confiance au seuil (ou niveau) de 95 % pour la propension
marginale consommer ?

Solution

1) La propension marginale consommer est-elle significativement diffrente de 0 ?


Cette question est trs importante en conomtrie. En effet, dans le cas dune rpon-
se ngative le coefficient nest pas significativement diffrent de 0 la variable expli-
cative Revenu ne sera pas considre comme tant explicative de la consommation
puisque son coefficient de pondration est nul.
Il peut paratre tonnant de tester la diffrence par rapport zro et non pas seule-
ment la positivit ou la ngativit du coefficient de rgression. En effet, il est commode
de ne sinterroger que sur la contribution de la variable explicative, quelle soit positive
ou ngative.
Ce problme peut tre formul laide de la thorie des tests partir des deux hypo-
thses suivantes :
H0 : a1 = 0
H1 : a1 = 0

Si nous rejetons lhypothse H0, un seuil 1 fix, alors la propension marginale


consommer est considre comme tant significativement diffrente de 0. Le seuil le
plus communment employ est = 0,05 , soit un risque de rejeter tort H0 de 5 %.
Nous savons que :

a1 a1
suit une loi de Student n 2 degrs de libert.

a1

Sous lhypothse H0, cette relation devient :



a1 0 
a1
= = ta1 loi de Student n 2 degrs de libert.
a1 
a1

ta1 est appel le ratio de Student.

Nous avons calcul 


a1 lors de lexercice 2, il convient donc de calculer 
a1 ; or,
daprs [11],
2
 
 2
a1 =  , nous connaissons (xt x)2 = 64 156 000
(xt x)2 t
t

(colonne 6 du tableau de calcul 3). Lestimateur de la variance de lerreur nous est donn
par [10] :

et2
t
2 =
 , o et est le rsidu de lestimation (et = yt 
yt )
n2

1. Le seuil est aussi appel risque de premire espce : cest la probabilit de rejeter lhypo-
thse H0 bien quelle soit vraie.

30  CONOMTRIE
a) Calcul de 
yt et de et
yt est calcule par application des estimations 
La srie ajuste  a0 et 
a1 :

yt = 
a0 + 
a1 x t
soit 
y1 = 
a0 + 
a1 x1 e1 = y1 
y1

y1 = 1 176,08 + 0,78 8 000 = 7 423,95 1 e1 = 7 389,99 7 423,95 = 33,96




y2 = 1 176,08 + 0,78 9 000 = 8 204,93 e2 = 8 169,65 8 204,93 = 35,28

 Les rsultats sont consigns dans le tableau 4. Nous remarquons bien que
et = 0 (proprit de la mthode des moindres carrs).
t

Tableau 4 Calcul du rsidu destimation


yt et et2

7 423,95 33,96 1 153,38


8 204,93 35,28 1 244,98
8 595,43 236,28 55 830,26
8 595,43 57,41 3 296,40
8 829,72 41,64 1 733,93
9 766,90 150,69 22 707,42
10 547,88 45,57 2 076,39
11 328,87 142,76 20 379,08
12 890,83 132,74 17 620,12
13 671,81 197,81 39 127,38
Somme 0,00 165 169,30
Moyenne 0,00 16 516,93

b) Calcul de lestimation de la variance de lerreur et de lcart type du coefficient


de rgression.
Lestimation de la variance de lerreur est donc gale :

et2
2 t 165 169,3

= = = 20 646,16
n2 10 2
ce qui nous permet de calculer la variance estime de a1 :
2
 20 646,16
 2
a1 =  2
= = 0,000 321 8
(xt x) 64 156 000
t
soit 
a1 = 0,017 9
c) Calcul du ratio de Student et rgle de dcision.
a1
Nous savons que = ta1 est distribu selon une loi de Student n 2

a1
degrs de libert, la distribution dchantillonnage sous H0 est donc reprsente par le
graphe 6.

1. Les petites diffrences constates sont dues des problmes darrondi.

Le modle de rgression simple  31


/2 /2
H1 tn2 + tn2 H1
 
H0

Graphique 6 Distribution dchantillonnage sous lhypothse H0

La rgle de dcision pour un seuil est alors la suivante :


a1
On calcule le ratio empirique de Student ta1 = (rapport du coefficient sur son
cart type) a1
/2 /2
Si ta1 est infrieur tn2 ou suprieur +tn2 alors on rejette lhypothse H0
(nous sommes dans la zone hachure H1), le coefficient a1 est alors significativement
diffrent de 0 (on accepte a1 = 0) ; la variable explicative Rt est donc contributive
lexplication de la variable Ct.
/2
Si ta1 est compris dans lintervalle tn2, alors nous ne sommes pas en mesure de
rejeter lhypothse H0 (donc on laccepte), le coefficient a1 nest pas significativement
diffrent de 0 (on accepte a1 = 0) ; la variable explicative Rt nest donc pas explicati-
ve de la variable Ct.
Il est plus simple de profiter de la symtrie de la loi de Student et donc de calculer
la valeur absolue du ratio de Student et de la comparer directement la valeur lue dans
la table.
La rgle de dcision pour un seuil = 0,05 est alors la suivante :
|
a1 | 0,025
si ta1 = > tn2 on rejette lhypothse H0, le coefficient a1 est alors

a1
significativement diffrent de 0 (on accepte a1 = 0 ) ; la variable explicative Rt est donc
contributive lexplication de la variable Ct ;
|a1 | 0,025
si ta1 =  tn2 on accepte lhypothse H0, le coefficient a1 nest donc
a1
pas significativement diffrent de 0 (on accepte a1 = 0 ) ; la variable explicative Rt
nest donc pas contributive lexplication de Ct .
Nous voyons limportance que revt ce test dans linvestigation conomtrique ; en
effet, il permet de tester la pertinence dune variable explicative qui figure dans un
modle et sa contribution lexplication du phnomne que lon cherche modliser.
Dans notre exemple, nous calculons le ratio de Student :
|
a1 | 0,78

ta1 = = = 43,57 > t80,025 = 2,306 1 a1 = 0

a1 0,017 9
La propension marginale consommer est donc significativement diffrente de 0,
la variable Revenu est bien explicative de la variable Consommation.
2) Dtermination dun intervalle de confiance, au seuil de 95 %, pour la propension
marginale consommer.

1. Les tables statistiques sont en fin douvrage. Dans le cas dun test unilatral, il convient duti-
liser une table correspondant ce type de test, cest--dire dont seule la partie de gauche est
hachure. Dans le cas dun test bilatral, ce sont les tables dont les deux parties extrmes sont
hachures. Bien entendu, cela nest vrai que pour les lois de probabilit symtriques.

32  CONOMTRIE
Nous savons que :

a1 a1 
a1 a1
suit une loi de Student n 2 degrs de libert, soit = tn2 , lintervalle de

a1 a1
confiance nous est donn (cf. graphe 4) par :
a1 a 1 /2 /2
= tn2 a1 = a1 
a1 tn2

a1
Application numrique pour un seuil = 0,95 :
a1 = 0,78 2,306 0,0179
Nous avons donc un risque de 5 % que le vritable coefficient a1 se trouve lextrieur
de lintervalle [0,74 ; 0,82] ; nous constatons que 0 ne figure pas dans cet intervalle de confian-
ce, ce qui est bien entendu cohrent avec la question prcdente.

IV. quation et tableau danalyse


de la variance

A. quation danalyse de la variance


Dmontrons les deux relations suivantes :

et = 0 : la somme des rsidus est nulle (la droite de rgression passe
t
par le point moyen 1
).   
yt = a0 + 
a1 xt + et yt = 
a0 + 
a1 xt + et
  t  t t t

yt na0 a1 xt = a0 = y 
et or  a1 x , en divisant par n il apparat que
t t t

et = 0 .
t
 
yt = yt , il y a galit entre la moyenne de la srie expliquer et la
t t
moyenne de la srie ajuste.
  
yt 
yt = et yt 
yt = et = 0 y = 
y
t t t
De ces deux relations nous pouvons en dduire lquation fondamentale
danalyse de la variance :
  
(yt y)2 = y)2 +
yt 
( et2
t t t [12]
SC T = SC E +SC R

1. Cela nest vrai que pour les modles comportant un terme constant, ou bien, pour les modles
sans terme constant, si les donnes sont centres sur leur moyenne.

Le modle de rgression simple  33


La variabilit totale (SCT) est gale la variabilit explique (SCE) + la
variabilit des rsidus (SCR).
Cette quation va nous permettre de juger de la qualit de lajustement dun
modle. En effet, plus la variance explique est proche de la variance totale,
meilleur est lajustement du nuage de points par la droite des moindres carrs.
Il est dusage de calculer le rapport :
 
yt y)2
( et2
t t
R2 =  =1  [13]
(yt y)2 (yt y)2
t t

R 2 est appel le coefficient de dtermination, et R le coefficient de corrlation


multiple (dans le cas particulier du modle de rgression une seule variable
explicative, il est gal au coefficient de corrlation linaire simple entre x et y ).

B. Tableau danalyse de la variance


Le tableau 5 prsente lanalyse de la variance pour un modle de rgression simple.
Tableau 5 Analyse de la variance par une rgression simple
Source Somme Degr Carrs
de variation des carrs de libert moyens

x SC E = yt y)2
( 1 SC E/1
t

Rsidu SC R = et2 n2 SC R/(n 2)
t

Total SC T = (yt y)2 n1
t

Les degrs de libert correspondent au nombre de valeurs que nous pouvons


choisir arbitrairement (par exemple, pour la variabilit totale, connaissant n 1
valeurs, nous pourrons en dduire la n -ime, puisque nous connaissons la
moyenne y ).
Le test H0 : a1 = 0 est quivalent au test dhypothse1 H0 : SC E = 0 (la
variable explicative xt ne contribue pas lexplication du modle).
Soit le test dhypothses H0 : SC E = 0 contre lhypothse H1 : SC E =
/ 0.
La statistique2 de ce test est donne par :

1. Cela nest vrai que dans le cas du modle de rgression simple.


2. Nous comparons la somme des carrs expliqus SCE la somme des carrs des rsidus SCR
qui est reprsentative de la somme des carrs thoriquement la plus faible.

34  CONOMTRIE

yt y)2
(
SC E t

ddl SC E 1
F = = [14]
SC R et2
ddl SC R t

(n 2)
Ou encore :

yt y)2
(
SC E t R2
ddl SC E 1 1
F = = = [15]
SC R et2 (1 R 2 )
ddl SC R t (n 2)
(n 2)

La statistique F est le rapport de la somme des carrs expliqus par xt sur la


somme des carrs des rsidus, chacune de ces sommes tant divise par son
degr de libert respectif. Ainsi, si la variance explique est significativement
suprieure la variance rsiduelle, la variable xt est considre comme tant une
variable rellement explicative.
F suit une statistique de Fisher 1 et n 2 degrs de libert. Si F > F1;n2

nous rejetons au seuil lhypothse H0 dgalit des variances, la variable xt est


significative ; dans le cas contraire, nous acceptons lhypothse dgalit des
variances, la variable xt nest pas explicative de la variable yt .
 2
a1 a1
En effet, 2 ! suit une loi du 2 (chi-deux) un degr de li-
/ t (xt x)2
bert (carr dune variable alatoire normale centre rduite) et

n
et2
t=1 2 a2i
= (n 2) = (n 2) suit une loi du 2 (chi-deux) n 2 degrs de
2 2 a2i
libert (somme au carr de n 2 variables alatoires indpendantes normales
centres rduites).

(a1 a1 )2 (xt x)2
En effectuant le rapport des deux chi-deux on obtient : F = t ,
et2
t

(n 2)

a12 (xt x)2 SC E
soit sous H0 (a1 = 0) F =
t
 = 1 suit une loi de Fisher 1
et2 SC R
t (n 2)
(n 2)

Le modle de rgression simple  35


et n 2 degrs de libert (rapport de chi-deux diviss par leurs degrs de
libert).
 
En effet, nous avons SC E = ( yt y)2 = a12 (xt x)2 car
t t
yt y = a0 + a1 xt a0 a1 x = a1 (xt x) .
Nous remarquons : 
 2 a12 (xt x)2
 2 a1 a12 t
F = ta1 = =  =  2
a1 2 / (xt x)2 et /(n 2)
t t

Exercice n 4
quivalence des tests et analyse de la variance
Un agronome cherche estimer la relation liant la production de mas yi au taux de
bauxite xi se trouvant dans la terre en formalisant la relation :
yi = a0 + a1 xi + i
partir dune tude statistique portant sur 85 parcelles de terre, un conomtre lui
fournit les rsultats suivants :
yi = 132,80 1,1 xi + ei i = 1,. . . , 85
(4,3) (10,2)
() = ratio de Student

ei2 = 6 234,32
i

1) Montrer que tester lhypothse H0 : a1 = 0 revient tester lhypothse r = 0 , o r


est le coefficient de corrlation linaire simple entre yi et xi ; le calculer.
2) Construire le tableau danalyse de la variance et vrifier les rsultats obtenus en 1)
partir du test de Fisher.
3) Le coefficient a1 est-il significativement infrieur 1 ?

Solution

1) Les observations ne sont pas dates, le modle est spcifi en coupe instantane.
Pour tester lhypothse H0 : a1 = 0 , nous comparons le ratio de Student empirique
0,05
t = 10,2 la valeur critique t83 = 1,96 1.

1. Le degr de libert de la loi de Student tant suprieur 30, il est licite de lapproximer par
une loi normale, 1,96 est la valeur de la loi normale un seuil de 0,05 (test bilatral).

36  CONOMTRIE
Puisque t est largement suprieur 1,96, nous rejetons lhypothse H0, a1 est donc
significativement diffrent de 0. Le taux de bauxite est un facteur explicatif (ngatif) de
la production de mas.
Lcart type du coefficient 
a1 est gal :  a1 /t = 0,107.
a1 = 
Montrons lquivalence de ce test avec H0 : r = 0 .
Le coefficient de corrlation linaire simple est gal :
 2
 
(xi x)(yi y) (xi x)(yi y)
i i
r = "  r2 =  
(xi x)2 (yi y)2 (xi x)2 (yi y)2
i i i i

Or, daprs [1], nous savons que :


 
(xi x)(yi y) 
a1 (xi x)(yi y)
i i SC E

a1 =  r2 =  = = R2
(xi x)2 (yi y)2 SC T
i i
En effet :
  

a1 (xi x)(yi y) = a1 a1 (xi x)2 = 
a12 (xi x)2
i i i
  
= ( a1 x)2 =
a1 x i  yi 
( a0 )2 =
a0 y +  yi y)2 = SC E
(
i i i
Pour le modle de rgression simple, nous avons galit entre le coefficient de dter-
mination et le carr du coefficient de corrlation.

Nous avons la relation :

R2 r2
F = = = (t )2
(1 R 2 )/(n 2) (1 r 2 )/(n 2)

donc on en dduit :


r (n 2)
t = # qui suit une loi de Student n 2 degrs de libert.
(1 r 2 )

Ceci permet de tester si la relation entre yi et xi est significative, ou encore si le


coefficient r est significativement diffrent de 0. Le calcul du coefficient de corrlation
ne pose alors plus de problme :

r 83
t = 10,2 = # r 2 = 0,556 |r| = 0,745 1
(1 r 2 )

1. Nous savons que le coefficient r est en ralit ngatif puisque le coefficient de rgression 
a1
est lui-mme ngatif.

Le modle de rgression simple  37


2) Pour construire le tableau danalyse de la variance, il nous faut connatre :

SC E = yi y)2
(
i

SC R = ei2
i

SC T = (yi y)2
i


ei2
i SC R
Or, daprs [13], nous avons : R 2 = 1  =1
(yi y)2 SC T
i

2 2
R = r = 0,556 , la connaissance de SC R = ei2 = 6 234,32 permet de dterminer
i
SC T = 14 041,26 ainsi que, daprs [12], SC E = 7 806,94 . Nous pouvons mainte-
nant construire le tableau 6 danalyse de la variance.

Tableau 6 Analyse de la variance

Source Somme Degr Carrs


de variation des carrs de libert moyens

xi SC E = 7 806,94 1 7 806,94
Rsidu SC R = 6 234,32 85 2 75,11
Total SC T = 14 041,26 85 1

SC E/1 7 806,94 0,05


. F = = = 103,94 > F1,83 = 3,96
SC R/(n 2) 75,11

Nous remarquons que F = (t )2.


Dans le modle de rgression simple, il y a quivalence tester :

H0 H1

a1 = 0 a1 =  0
r x,y = 0 r x,y = 0
SC E = 0 SC E = 0

Le premier test porte sur la pente de la droite de rgression, le deuxime test sur le
coefficient de corrlation entre x et y et, enfin, le troisime a pour but de juger si la
somme des carrs expliqus est significative, ces trois tests nanmoins rpondent la
mme interrogation.
3) Le coefficient a1 est-il significativement infrieur 1 ?
La formulation des hypothses est la suivante :

H0 : a1 = 1
H1 : a1 < 1

38  CONOMTRIE
Sous lhypothse H0, nous avons :

a1 a1 |
| |
a1 (1)| | 1,1 + 1|
= = = 0,92 < t 0,05 = 1.651

a1 
a1 0,107 8

Nous acceptons lhypothse H0, a1 nest pas significativement diffrent de 1.


Nous pouvons aussi rpondre cette question en vrifiant que la valeur 1 est compri-
se dans lintervalle de confiance :
a1 = 
a1 1,96 
a1 a1 [ 1,31 ; 0,89]

(Attention : t 0,05 = 1,96 car le test est maintenant bilatral.)

V. La prvision dans le modle


de rgression simple
Lorsque les coefficients du modle ont t estims, il est possible de cal-
culer une prvision un horizon h .
Soit le modle estim sur la priode t = 1,. . . , n : yt =  a0 + a1 xt + et ,
si la valeur de la variable explicative xt est connue en n + 1(xn+1 ) , la pr-
vision est donne par :  yn+1 = 
a0 + a1 xn+1 .
Montrons que cette prvision est sans biais.
Lerreur de prvision est gale : en+1 = yn+1  yn+1
que lon peut crire : en+1 = (a0 + a1 xn+1 + n+1 ) ( a0 + 
a1 xn+1 )
soit : en+1 = (a0 
a0 ) + (a1 
a1 )xn+1 + n+1 . En se rfrant aux hypothses
du modle, on a :
E(en+1 ) = 0

Une dmonstration analogue permet dobtenir E(en+h ) = 0 .


La prvision sans biais est donc obtenue par lapplication directe du
modle de rgression estim. Cependant, dans la pratique, il nest que de
peu dutilit de connatre la prvision si nous ne savons pas quel degr de
confiance nous pouvons lui accorder. Nous allons donc calculer la varian-
ce de lerreur de prvision qui nous permet de dterminer un intervalle de

1. Valeur de la loi normale au seuil de 5 % ; en effet il sagit dun test unilatral.

Le modle de rgression simple  39


confiance1 bornant la prvision. La variance de lerreur de prvision est donne
par :
 
V (en+1 ) = V (
a0 a0 ) + (
a1 a1 )xn+1 + n+1
Puisque la variable xn+1 est certaine et lerreur n+1 est non autocorrle avec les
t cette expression peut scrire :
2
V (en+1 ) = V (
a0 ) + xn+1 a1 ) + 2xn+1 Cov(
V ( a1 ) + V (n+1 )
a0 ,

En remplaant les variances et la covariance des coefficients par leurs expres-


sions daprs [9] et connaissant V (n+1 ) = 2 , nous obtenons :
 
2
V (en+1 ) = + x 2 V ( 2
a1 ) + xn+1 a1 ) + 2
a1 ) 2xn+1 x V (
V (
n

ou encore :
1 (xn+1 x)2
V (en+1 ) = V (yn+1  2 + 
yn+1 ) =  + 1 [16]
n (xt x)2
t

Nous pouvons observer que, dans cette formule, la variance de lerreur de


prvision est fonction de lcart quadratique entre la variable exogne prvue et
la moyenne de cette mme variable : plus la valeur prvue sloigne de cette
moyenne, plus le risque derreur est important. De mme, nous remarquons que
la variance de lerreur de prvision est une fonction inverse de la variabilit de
la srie explicative.
Lhypothse de normalit de t permet alors de dterminer un intervalle
(1 ) % pour la prvision :
1 (xn+1 x)2
yn+1 N 0, 2 + 
en+1 = yn+1  + 1
n (xt x)2
t


a0 + 
a1 xn+1 yn+1
Soit $ tn2 (Student n 2 d.d.l.)
%
%1 (xn+1 x)2
% + 
 +1
&n (xt x)2
t

$
%
%1 (x x)2
yn+1 = 
yn+1 t /2
%
 + n+1 +1 [17]
n2 &n (xt x)2
t

1. Il est plus juste de parler dintervalle de prdiction.

40  CONOMTRIE
Cas particulier
Lorsque nous utilisons le modle de rgression simple pour calculer une droite
de tendance (moindres carrs sur le temps), le modle est spcifi ainsi :
Tt = 
a0 + 
a1 t + et pour t = 1,. . . , n
Pour calculer la prvision lhorizon h , nous employons la formule dextra-
polation :
n+h = 
T a0 + 
a1 (n + h) , et lintervalle de prdiction se trouve alors sur deux bran-
ches dhyperbole1 (n + h t)2 illustr par le graphique 7.

Graphique 7 Intervalle de la prvision par extrapolation de tendance


Exercice n 5
fichier C2EX2

Prvision dans un modle de rgression simple


Nous reprenons le modle consommation-revenu estim lors de lexercice 2 :
yt = 1 176,08 + 0,78 xt + et
(0,21) (43,53)
n = 10
() = t de Student

1) Calculer le coefficient de dtermination et effectuer le test de Fisher permettant de


dterminer si la rgression est globalement significative.

1. Cest leffet trompette , le lecteur devinera pourquoi...

Le modle de rgression simple  41


2) Quelle est la consquence sur la consommation de laugmentation du revenu de 8 % ?
3) Pour les annes 11 et 12, on prvoit respectivement 16 800 et 17 000 dollars de reve-
nu par habitant. Dterminer la prvision de consommation pour ces deux annes
ainsi que lintervalle de prdiction au seuil de 95 %.

Solution

1) Pour calculer le coefficient de dtermination, nous nous rfrons la relation [15] :


R2 r2
F = = = (t )2 = 43,52
(1 R 2 )/(n 2) (1 r 2 )/(n 2)
Soit : r 2 = 0,99 , nous pouvons alors calculer le Fisher empirique :
0,05
F = 1895,3 > F1,8 = 5,32 , la variable explicative est significative.
2) Augmentation de 8 % du revenu.
Nous avons :

yt = 
a1
xt soit
yt = 0,78
xt = 0,78 0,08 = 0,062 4
La consommation augmente de 6,24 %, soit un peu moins que le revenu.
3) Les prvisions sont calcules par lutilisation du modle estim.


y11 = 1 176,08 + 0,78 x11 = 1 176,08 + 0,78 16 800
= 14 280,08
Lintervalle de prvision [17] peut alors tre calcul :
$
%
%1 (x x)2
y11 = 
/2
%
y11 tn2  + 11 +1
&n (xt x)2
t
avec :
n = 10
 
= 143,69 (daprs lexercice 3)
(xt x)2 = 64 156 000 (daprs lexercice 3)
t x = 11 280 (daprs lexercice 2)
/2
tn2 = 2,306
x11 = 16 800
y11 = 14 280,08 2,306 180,32
IC = [13 864,24 ; 14 695,91]
La ralisation a 95 % de chance de se trouver lintrieur de cet intervalle1.
De mme, pour lanne 12, nous obtenons :


y12 = 1 176,08 + 0,78 x12 = 1 176,08 + 0,78 17 000
= 14 436,08
y12 = 14 436,08 2,306 182,32
IC = [14 015,65 ; 14 856,51]

1. La distribution tant normale (loi continue), il est clair que la probabilit dapparition de cha-
cune des valeurs de lintervalle nest pas identique. La valeur la plus probable se trouve au
centre de lintervalle.

42  CONOMTRIE
Exercice n 6
Comparaison de coefficients de rgression
Un conomiste spcialis en conomie du travail sintresse la relation liant la
rmunration et la dure des tudes (thorie du capital humain). Pour ce faire, il dispo-
se dun chantillon de 40 hommes et 25 femmes ayant le mme ge, dont il relve la
rmunration annuelle (yi ) , exprime en milliers deuros, et le nombre dannes
dtudes (xi ) .
Les estimations conomtriques conduisent aux rsultats suivants :
Pour les hommes :
yi = 18,60 + 1,8 xi + ei i = 1,. . . , 40 n 1 = 40
(9,3) (5,2)
() = ratio de Student
R 2 = 0,42

Pour les femmes :


yi = 14,50 + 0,7 xi + ei i = 1,. . . , 25 n 2 = 25
(12,8) (2,5)
() = ratio de Student
R 2 = 0,22

1) Linfluence de la dure des tudes sur la rmunration vous semble-t-elle signifi-


cative ?
2) Existe-t-il une diffrence significative de limpact de la dure des tudes sur la rmu-
nration des hommes et des femmes ?

Solution
1) Pour rpondre cette premire question, nous pouvons analyser soit les ratios de
Student, soit le coefficient de dtermination.
Le ratio de Student empirique de la variable annes dtudes est gal :
Pour les hommes :

ah 0,05
tah = = 5,2 > t38 = 1,96

ah

Pour les femmes :



af 0,05
ta f = = 2,5 > t23 = 2,06

a f

Les carts types sont :



ah = 0,34 et 
a f = 0,28

Les deux coefficients de rgression sont donc significativement diffrents de 0. Il est


noter que, pour les femmes, le coefficient de pondration des annes dtudes est plus

Le modle de rgression simple  43


faible et moins significatif que celui des hommes. Les probabilits critiques1 sont, pour
les hommes, de c = 0,000 1 et de c = 0,02 pour les femmes (nous considrons le
coefficient comme non significativement diffrent de 0 au seuil de 2 %).
Le test de Fisher men sur les coefficients de dtermination conduit aux mmes
rsultats.
2) Ce problme se ramne un test de diffrence de moyennes de variables alatoires
normales indpendantes et de variances ingales.
H0 : ah = a f H0 : d = ah a f = 0
H1 : ah = a f H1 : d = ah a f = 0
ah 
( a f ) (ah a f )
Le rapport suit une loi de Student n 1 + n 2 4 degrs de

ah a f
libert.
Avec  a2 f + 
d2 =  2
ah et d = 
ah 
a f et sous lhypothse H0, le rapport scrit :

d (1,8 0,7) 0,05


= t = = 2,49 > t61 = 1,96

d 0,342 + 0,282

Rappel : Var(a x1 + b x2 ) = a 2 Var(x1 ) + b2 Var(x2 ) + 2abCov(x1 ,x2 ) o x1 et x2


sont deux variables alatoires et a et b sont deux scalaires. Ici Cov(ah ,a f ) = 0 car les
deux rgressions sont indpendantes. Do Var(a f ah ) = Var(a f ) + Var(ah ) .
Nous rejetons lhypothse H0, il existe une diffrence significative des coefficients
de rgression : la dure des tudes des femmes a moins dimpact sur la rmunration
que la dure des tudes des hommes (sur cet chantillon...)
Nous pouvons dterminer la probabilit critique de ce test (probabilit partir de
laquelle nous sommes amens accepter lhypothse H0). La lecture de la table de
Student 61 degrs de libert (sur la table ) indique une probabilit comprise entre
0,01 et 0,02 (la valeur exacte dtermine par la fonction Excel loi.student
est 0,0154). Le risque de se tromper en rejetant lhypothse H0 est donc de 1,54 % ;
compte tenu de ce trs faible risque, nous rejetons lhypothse H0. Evidemment, plus la
probabilit critique est faible plus nous sommes conforts dans notre dcision.

Exercice n 7
Apprendre manipuler les formules
Soit les rsultats dune estimation conomtrique :
yt = 1,251 xt 32,95 + et
n = 20
R 2 = 0,23
= 10,66

1. Cette notion est importante : il sagit de dterminer le seuil de probabilit partir duquel on
accepte lhypothse H0. Plus ce seuil est faible, moins le risque de se tromper est important.

44  CONOMTRIE
1) A partir des informations connues, on demande de retrouver les statistiques sui-
vantes : la somme des carrs des rsidus (SCR), la somme des carrs totaux (SCT),
la somme des carrs expliqus (SCE), la valeur de la statistique du Fisher empirique
(F ) et lcart type du coefficient a1 (a1 ).
2) Le coefficient de la variable x est-il significativement suprieur 1 ?

Solution
"
SCR
1) On sait que = = 10,66 SCR = (10,66)2 18 = 2 045,44
n2
Nous pouvons calculer SCE et SCT laide du coefficient de dtermination.
R 2 = 0,23 = 1 SC R/SC T
SC T = SC R/(1 R 2 ) = 2045,44/(1 0,23) = 2 656,42
Or SCT = SCE + SCR SCE = 610,98
Nous pouvons calculer maintenant :
R2 SC E
F = 2
= = 5,40 t = F = 2,32
(1 R )/(n 2) SC R/(n 2)

(dans le cas dun modle de rgression simple t 2 = F ). Nous pouvons en dduire


a1 1,251
lcart type du coefficient : a1 = = = 0,54.
t 2,32
2) On pose le test dhypothses :
H0 : a1 = 1 contre lhypothse H1 : a1 > 1
Sous H0, nous pouvons crire :
a1 a1 1,25 1 0,05
ta1 = = = 0,46 < t18 = 1,734 1 nous sommes donc dans la
a1 0,54
zone de lacceptation de H0, le coefficient a1 nest pas significativement suprieur
1.

Exercice n 8
Apprendre utiliser les formules
partir dun chantillon de 190 observations, on tudie la relation entre la variable
expliquer yi et la variable explicative xi .
laide des informations fournies ci-dessous reconstituez les huit valeurs man-
quantes signales par VM1, ...VM8.

1. Attention, comme le test est unilatral et que la table de Student de cet ouvrage est tabule direc-
tement pour /2 (cas le plus gnral dun test bilatral), il convient donc ici de lire sur la table
un seuil de 0,10 = 2 0,05 .

Le modle de rgression simple  45


Dependent Variable: Y
Method: Least Squares
Sample: 1 190
Included observations: 190
Variable Coefficient Std. Error t-Statistic Prob.
C 4364.928 VM1 16.61141 0.0000
X VM4 VM3 VM2 0.0000
R-squared VM5 Mean dependent var VM6
S.E. of regression 322.8850 S.D. dependent var VM8
Sum squared resid VM7 F-statistic 778.9623

On donne x = 3,447 et x = 38,416

Solution

a0
VM1 : directement par a0 = = 262,76
ta0

VM2 : ta1 = F = 778,96 = 27,91


VM3 : a1 = #! , or = 322,88 ;
(xi x)2

(xi x)2 !
x = do1 (xi x)2 = (n 1) x2 = 189 (3,447)2 = 2245,66
n1
322,88
a1 = #! = = 6,81
(xi x)2 2245,66
do VM4 = VM3 VM2 = 190,15
R 2 /1 R2
VM5 : on sait que F = 2
=
(1 R )/(n 2) (1 R 2 )/188
778,96
= 778,96 R 2 = = 0,80
778,96 + 188
VM6 : y = a0 + a1 x = 4364,928 + 190,15 38,416 = 2939,8
! 2
! ei
VM7 : SCR = ei2 , or 2 =
n2
!
do ei2 = (n 2) 2 = 188 (322,88)2 = 19 599 280 .
SC E SC R SC R
VM8 : R 2 = =1 SC T = = 98 986 262
SC T SC T 1 R2
! "
(yi y)2 SC T
y = = = 723,7
n1 n1

1. Nous prenons ici la formule de lestimateur de lcart type calcul partir dun chantillon,
donc nous divisons par n 1.

46  CONOMTRIE
3. Le modle
de rgression multiple

L
e modle linaire gnral est une extension du modle de rgres-
sion simple abord au chapitre prcdent. Aprs avoir prsent le
modle linaire gnral (I), nous envisageons une procdure des-
timation des paramtres en tudiant les proprits statistiques des esti-
mateurs (II). Les diffrents tests dhypothses concernant les coefficients
du modle sont proposs en (III), et la section (IV) est consacre lanaly-
se de la variance ainsi quaux tests sy rattachant.
En (V) nous prsentons une classe particulire de sries explicatives : les
variables indicatrices, puis la prvision laide du modle linaire gn-
ral fait lobjet de la section (VI).
Enfin nous terminons ce chapitre par quelques exercices rcapitulatifs.

I. Le modle linaire gnral


A. Prsentation
Lors du chapitre prcdent, nous avons considr quune variable endogne est
explique laide dune seule variable exogne. Cependant, il est extrmement
rare quun phnomne conomique ou social puisse tre apprhend par une
seule variable. Le modle linaire gnral est une gnralisation du modle de
rgression simple dans lequel figurent plusieurs variables explicatives :
yt = a0 + a1 x1t + a2 x2t + . . . + ak xkt + t pour t = 1,. . . , n

Le modle de rgression multiple  47


avec :
yt = variable expliquer la date t ;
x1t = variable explicative 1 la date t ;
x2t = variable explicative 2 la date t ;
...
xkt = variable explicative k la date t ;
a0 , a1 ,. . . , ak = paramtres du modle ;
t = erreur de spcification (diffrence entre le modle vrai et le modle sp-
cifi), cette erreur est inconnue et restera inconnue ;
n = nombre dobservations.

B. Forme matricielle
Lcriture prcdente du modle est dun maniement peu pratique. Afin den
allger lcriture et de faciliter lexpression de certains rsultats, on a habituel-
lement recours aux notations matricielles. En crivant le modle, observation
par observation, nous obtenons :

y1 = a0 + a1 x11 + a2 x21 + . . . + ak xk1 + 1


y2 = a0 + a1 x12 + a2 x22 + . . . + ak xk2 + 2
...
yt = a0 + a1 x1t + a2 x2t + . . . + ak xkt + t
...
yn = a0 + a1 x1n + a2 x2n + . . . + ak xkn + n

Soit, sous forme matricielle : Y = X a +


(n,1) (n,k+1) (k+1,1) (n,1)

avec :

y1 1 x11 x21 ... xk1 1
y2 1 x12 x22 ... xk2 a 0 2
. . .. .. a1 .
. . .
. . . . ... a .
Y = ; X = ; a = 2 ; =
yt 1 x1t x2t ... xkt ... t
. . .. .. .
. .. . . ... ..
. ak
yn 1 x1n x2n ... xkn n
Nous remarquons la premire colonne de la matrice X , compose de 1, qui
correspond au coefficient a0 (coefficient du terme constant).
La dimension de la matrice X est donc de n lignes et k + 1 colonnes (k tant
le nombre de variables explicatives relles, cest--dire constante exclue).

48  CONOMTRIE
Lcriture sous forme matricielle rend plus aise la manipulation du modle
linaire gnral, cest pourquoi nous ladoptons par la suite.

II. Estimation et proprits


des estimateurs

A. Estimation des coefficients de rgression


Soit le modle sous forme matricielle k variables explicatives et n observa-
tions :
Y = Xa + [1]
Afin destimer le vecteur a compos des coefficients a0 , a1 . . . ak , nous appli-
quons la mthode des Moindres Carrs Ordinaires (MCO) qui consiste mini-
miser la somme des carrs des erreurs, soit :


n
Min t2 = Min = Min (Y Xa) (Y Xa) = Min S [2]
t=1

avec transpos1 du vecteur .


Pour minimiser cette fonction par rapport a , nous diffrencions2 S par
rapport a :
S
= 2 X Y + 2 X X
a=0 a = (X X)1 X Y [3]
a
Cette solution est ralisable3 si la matrice carre X X de dimension
(k + 1, k + 1) est inversible. La matrice X X est la matrice des produits croiss
des variables explicatives ; en cas de colinarit parfaite entre deux variables
explicatives, la matrice X X est singulire et la mthode des MCO dfaillante.
On appelle quations normales les quations issues de la relation :
X X
a = X Y

1. Nous dsignerons par le signe les transposs de vecteur ou de matrice.


2. S = (Y Xa) (Y Xa) = Y Y Y Xa a X Y + a X Xa
= Y Y 2 a X Y + a X Xa .
3. Les conditions de second ordre sont vrifies du fait que X X est une matrice dfinie semi-
positive.

Le modle de rgression multiple  49


Soit, sous forme matricielle :
  
n x1t x2t ... xkt 
yt
    a0
x1t x1t2 x1t x2t ... x1t xkt 
a1 x1t yt
   
x2t xkt =
x2t x2t x1t x2t2 ...
a2 x y
. ... 2t t
. ...
. ... ... ... ... 
   
ak xkt yt
2
xkt xkt x1t xkt x2t ... xkt

Le modle estim scrit :


yt =
a0 +
a1 x1t +
a2 x2t + . . . +
ak xkt + et

avec et = yt yt o et est le rsidu, cest--dire lcart entre la valeur observe


de la variable expliquer et sa valeur estime (ajuste).
Attention : il convient de bien distinguer entre lerreur de spcification du
modle (not t ) qui est et restera inconnue et le rsidu (et ) qui, lui, est connu.

1) Cas particulier
Si nous raisonnons sur des donnes centres, lestimateur de a peut scrire en
fonction des matrices des variances et covariances empiriques :
1

a1 Var(x1 ) Cov(x1 , x2 ) Cov(x1 , x3 ) . . . Cov(x1 xk )

a Cov(x2 , x1 ) Var(x2 ) Cov(x2 , x3 ) . . . Cov(x2 , xk )
2
= . . . Cov(x3 , xk )
a3 Cov(x3 , x1 ) Cov(x3 , x2 ) Var(x3 )
... ...

ak Cov(xk , x1 ) Cov(xk , x2 ) Cov(xk , x3 ) . . . Var(xk )

Cov (x1 ,y)

Cov(x2 , y)


Cov(x3 , y)
...
Cov(xk , y)
avec a0 = y
a1 x 1
a2 x 2 . . .
ak x k .
Que sont des donnes centres sur la moyenne ? Soit xt une variable connue
sur n observations et x sa moyenne, nous pouvons calculer une nouvelle variable

n 
n
(X t = xt x) dont la somme est par construction nulle : (xt x) = Xt = 0 .
t=1 t=1
Nous avons donc X = 0 .

2) Effet de la variation dune seule des variables explicatives


Soit le modle estim : yt =
a0 +
a1 x1t +
a2 x2t + . . . +
ak xkt + et .

50  CONOMTRIE
Si la variable x2 passe de la valeur x2t (x2t + x2t ) , toutes choses tant
gales par ailleurs (les k 1 autres variables restant constantes), alors la
a2 x2 :  yt =
variable expliquer varie de a2 x2t .
Les coefficients sinterprtent donc directement en terme de propension mar-
ginale.

B. Hypothses et proprits des estimateurs


Par construction, le modle est linaire en X (ou sur ces coefficients) et nous dis-
tinguons les hypothses stochastiques (lies lerreur ) des hypothses struc-
turelles.

1) Hypothses stochastiques

H1 : les valeurs xi, t sont observes sans erreur.


H2 : E(t ) = 0 , lesprance mathmatique de lerreur est nulle.
H3 : E(t2 ) = 2 , la variance de lerreur est constante (t) (homoscdasticit).
H4 : E(t t ) = 0 si t = t , les erreurs sont non corrles (ou encore ind-
pendantes).
H5 : Cov(xit , t ) = 0 , lerreur est indpendante des variables explicatives.

2) Hypothses structurelles

H6 : absence de colinarit entre les variables explicatives, cela implique


que la matrice (X X) est rgulire et que la matrice inverse (X X)1
existe.
H7 : (X X)/n tend vers une matrice finie non singulire.
H8 : n > k + 1, le nombre dobservations est suprieur1 au nombre des
sries explicatives.

3) Proprits des estimateurs

Considrons les proprits de lestimateur [3].


Le modle sous forme matricielle peut scrire, comme pour le modle de
rgression simple, de diffrentes manires :

1. Dans le cas dune galit, nous aurions un systme de n quations n inconnues, donc parfai-
tement dtermin.

Le modle de rgression multiple  51


Y = Xa +
Y = X
a+e (e = rsidu)
e =Y Y
= X
Y a
Nous obtenons :
a = (X X)1 X Y = (X X)1 X (Xa + )

a = (X X)1 X (Xa) + (X X)1 X
[4]
a = a + (X X)1 X

a ) = a + (X X)1 X E() = a
do E( car E() = 0
Lestimateur est donc sans biais : a) = a
E(

Calculons maintenant la matrice des variances et covariances des coefficients


de rgression a .
a = E{( a a) }
a a)(

a a) = (X X)1 X et (
Or, daprs [4], ( a a) = X (X X)1 puisque
1
(X X) est symtrique . 1

a a) = (X X)1 X X (X X)1 do
a a)(
(

a = (X X)1 X E( )X (X X)1 avec E( ) = = 2 I = matrice des


variances et covariances de lerreur .
En effet, daprs les hypothses H3 et H4 nous avons :

E(1 1 ) E(1 2 ) ... E(1 n )

= E( ) = E(2 1 ) E(2 2 ) ... E(2 n ) =
...
E(n 1 ) E(n 2 ) . . . E(n n )

2 0 0 ... 0

= 0 2 0 ... 0
...
0 0 0 . . . 2

Soit : a = 2 (X X)1 X X (X X)1

a = 2 (X X)1 [5]

1. Nous rappelons quelques rgles du calcul matriciel : (ABC) = C B A et si A est symtrique


A = A et donc [(X X)1 ] = (X X)1 .

52  CONOMTRIE
 1
2 XX
a =  Lim a = 0 si n (daprs les hypothses H3
n n
et H7). Lestimateur est donc convergent.
Thorme de Gauss-Markov : Lestimateur [3] des moindres carrs est qua-
lifi de BLUE (Best Linear Unbiaised Estimator), car il sagit du meilleur esti-
mateur linaire sans biais (au sens quil fournit les variances les plus faibles pour
les estimateurs).
Il est noter que lestimateur du maximum de vraisemblance des paramtres
fournit des rsultats identiques ceux de lestimateur des MCO si lhypothse
de normalit des erreurs est vrifie.
Aprs un calcul matriciel1, il apparat que nous pouvons estimer sans biais
2
par :
e e
2 =
[6]
nk1

En remplaant la variance de lerreur par son estimateur, nous obtenons :

a =
2 (X X)1 [7]

4) Le thorme de Frisch, Waugh et Lovell (FWL)

Supposons que les variables explicatives soient spares en deux groupes repr-
sents par les matrices X 1 et X 2 . Le modle scrit : Y = X 1 a1 + X 2 a2 + .
Le thorme de FWL nous dit que lestimateur des MCO du paramtre a2 et
des rsidus sont les mmes que ceux du modle : M1 Y = M1 X 2 a2 + v avec
M1 = I X 1 (X 1 X 1 )1 X 1 .
La matrice M1 est symtrique et idempotente (M1 M1 = M1 ) , de plus
M1 X 1 = 0 .
Ce thorme permet de bien comprendre le problme de la spcification dun
modle : si une variable Y est effectivement explique par le groupe de variables
X 1 et X 2 , il faut imprativement faire figurer dans le modle ces deux groupes
de variables mme si seul le groupe de variables X 1 nous intresse.

1. Voir dmonstration en annexe C.

Le modle de rgression multiple  53


C. quation danalyse de la variance
et qualit dun ajustement
Comme pour le modle de rgression simple, nous avons :
 
a) yt = yt y =
y
t t

b) et = 0
t

De ces deux relations, nous en dduisons lquation fondamentale danalyse


de la variance :

  
(yt y)2 = y)2 +
yt
( et2
t t t [8]
SC T = SC E + SC R

La variabilit totale (SCT) est gale la variabilit explique (SCE) + la


variabilit des rsidus (SCR).
Cette quation va nous permettre de juger de la qualit de lajustement dun
modle ; en effet, plus la variance explique est proche de la variance tota-
le, meilleur est lajustement global du modle. Cest pourquoi nous calculons le
rapport SCE sur SCT :

 
yt y)2
( et2
t t
R2 =  =1  [9]
(yt y)2 (yt y)2
t t

R 2 est appel le coefficient de dtermination, et R le coefficient de corrla-


tion multiple. R 2 mesure la proportion de la variance de Y explique par la
rgression de Y sur X .
Dans le cas de donnes centres (moyenne nulle) et seulement dans ce cas,
le coefficient de dtermination est gal :

Y
Y e e
R2 = = 1 [10]
Y Y Y Y

Cette qualit de lajustement et lapprciation que lon a du R 2 doivent tre


tempres par le degr de libert de lestimation. En effet, lorsque le degr de

54  CONOMTRIE
libert est faible1, il convient de corriger le R 2 afin de tenir compte du relative-
ment faible nombre dobservations compar 2
au nombre de facteurs explicatifs
par le calcul dun R 2 corrig not R :

2 n1
R =1 (1 R 2 ) [11]
nk1

2 2
On a R < R 2 et si n est grand R R 2 .
Nous verrons au chapitre 4 section IV deux critres (Akaike et Schwarz) per-
mettant darbitrer, lors de lintroduction dune ou plusieurs variables explica-
tives, entre la perte de degrs de libert et lapport dinformation.

Exercice n 1
fichier C3EX1

Mise sous forme matricielle dun modle et calcul des coefficients


de rgression
Soit le modle trois variables explicatives :

yt = a0 + a1 x1t + a2 x2t + a3 x3t + t

Nous disposons des donnes du tableau 1.


1) Mettre le modle sous forme matricielle en spcifiant bien les dimensions de cha-
cune des matrices.
2) Estimer les paramtres du modle.
3) Calculer lestimation de la variance de lerreur ainsi que les carts types de chacun
des coefficients.
2
4) Calculer le R 2 et le R corrig.

1. Dans le cas dun modle o le nombre dobservations est gal au nombre de variables explica-
tives (degr de libert = 0 ), le R 2 = 1 . Cependant, le pouvoir explicatif de ce modle est nul.

Le modle de rgression multiple  55


Tableau 1 Valeurs observes de y , x1 , x2 et x3
t y x1 x2 x3

1 12 2 45 121
2 14 1 43 132
3 10 3 43 154
4 16 6 47 145
5 14 7 42 129
6 19 8 41 156
7 21 8 32 132
8 19 5 33 147
9 21 5 41 128
10 16 8 38 163
11 19 4 32 161
12 21 9 31 172
13 25 12 35 174
14 21 7 29 180

Solution

1) Forme matricielle
Nous disposons de 14 observations et trois variables explicatives, le modle peut
donc scrire :
Y = Xa + avec :
1
12 1 2 45 121 2
14 1 1 43 132 a0 .
.
a .
Y = 10 ; X = 1 3 43 154 ; a =
1
.
a2 ; = t
.. .. .. .. ..
. . . . . .
a3 ..
21 1 7 29 180
14
Dimensions :
(14,1) (14,4) (4,1) (14,1)

2) Estimation des paramtres


a = (X X)1 X Y .
Nous savons daprs [3] que

Calcul de X X et de (X X)1
X X

1 2 45 121
1 1 1 ... 1 1 1 43 132
2 1 3 ... 7
1 3 43 154
45 =
43 43 . . . 29 .. .. .. ..
. . . .
121 132 154 . . . 180
1 7 29 180

14 85 532 2 094
85 631 3 126 13 132
=
532

3 126 20 666 78 683
2 094 13 132 78 683 317 950

56  CONOMTRIE

20,16864 0,015065 0,23145 0,07617
0,015065 0,013204 0,001194 0,00094
(X X)1
=
0,23145 0,001194 0,003635 0,000575
0,07617 0,00094 0,000575 0,000401

Calcul de X Y
X Y
12
1 1 1 ... 1 14 248
2 7
1 3 ... 1 622
45 10 =
43 43 ... 29 .. 9 202
.
121 132 154 ... 180 37 592
21

Calcul de
a
(X X)1

X Y

20,16864 0,015065 0,23145 0,07617 248
0,015065 0,013204 0,001194 0,00094
1 622 =
a
0,23145 0,001194 0,003635 0,000575 9 202
0,07617 0,00094 0,000575 0,000401 37 592

32,89132
0,801900
= 0,38136

0,03713
Soit
a0 = 32,89 ;
a1 = 0,80 ;
a2 = 0,38 ;
a3 = 0,03
Les calculs que nous venons de dvelopper sont longs et fastidieux et mettent en vi-
dence lintrt incontestable dutiliser un ordinateur.

a2
2 et de
3) Calcul de
e e
2 =
Daprs [6] , nous devons donc calculer le rsidu e .
nk1

e =Y Y = Y X a
Soit a0 +
et = yt ( a1 x1t +
a2 x2t +
a3 x3t )
et = yt 32,89 0,80 x1t + 0,38 x2t + 0,03 x3t
Par exemple pour e1 :
e1 = y1 32,89 0,80 x11 + 0,38 x21 + 0,03 x31
e1 = 12 32,89 0,80 2 + 0,38 45 + 0,03 121 = 0,84
Le tableau 2 prsente lensemble des rsultats.
Par construction, la somme des rsidus est bien nulle.


t=14
et2
e e t=1 67,45
2
= = = = 6,745
nk1 14 3 1 10

Le modle de rgression multiple  57


Tableau 2 Calcul du rsidu

t
. yt
yt et et2

1 12 12,84 0,84 0,71


2 14 12,39 1,61 2,58
3 10 13,18 3,18 10,11
4 16 13,39 1,61 2,58
5 14 17,70 3,70 13,67
6 19 17,88 1,12 1,26
7 21 22,20 1,20 1,44
8 19 18,86 0,14 0,02
9 21 16,51 4,49 20,14
10 16 18,76 2,76 7,63
11 19 17,92 1,08 1,17
12 21 21,90 0,90 0,81
13 25 22,71 2,29 5,27
14 21 20,76 0,24 0,06
Somme 0 67,45

La matrice des variances et covariances estimes des coefficients nous est donne
par [7], soit :
a =
2 (X X)1

20,16864 0,015065 0,23145 0,07617
0,015065 0,013204 0,001194 0,00094
a = 6,745

0,23145 0,001194 0,003635 0,000575
0,07617 0,00094 0,000575 0,000401

Les variances des coefficients de rgression se trouvent sur la premire diagonale :


a20 = 6,745 20,17 = 136,04

a0 = 11,66
a21
= 6,745 0,013 = 0,087
a1 = 0,29
2

a2 = 6,745 0,0036 = 0,024
a2 = 0,15
2

a3 = 6,745 0,0004 = 0,0026
a3 = 0,05

4) Le calcul du R 2 est effectu partir de la formule [9].



Nous connaissons e e = 67,45 , il convient de calculer (yt y)2 = 226,86 .
 t
et2
2 t 67,45
R =1  2
=1 = 0,702
(yt y) 226,86
t

2
Le R corrig est donn par [11] :

2 n1 14 1
R =1 (1 R 2 ) = 1 (1 0,702) = 0,613
nk1 14 4

58  CONOMTRIE
Nous observons la baisse du coefficient de dtermination lorsque nous le corrigeons
par le degr de libert.

III. Les tests statistiques


A. Le rle des hypothses
Lhypothse de normalit des erreurs implique1 que :

n
et2
t=1 2
a2i

= (n k 1) 2 = (n k 1) 2 [12] suit une loi du 2 (chi-deux)
2 ai
n k 1 degrs de libert (somme au carr de n k 1 variables alatoires ind-
pendantes normales centres rduites).
Il en rsulte que :
ai ai
 (lcart type thorique est remplac par lcart type empirique) suit

ai
une loi de Student n k 1 degrs de libert.

ai ai

ai ai ai
En effet, = est le rapport dune loi nor-

ai a2i 1
(n k 1) 2
ai (n k 1)
male centre rduite la racine carre dun chi-deux divis par son degr de
libert.
a a) a1 (
( a a) suit une loi du 2 (chi-deux) k + 1 degrs de libert
(somme au carr de k + 1 variables alatoires normales centres rduites, les
k + 1 coefficients).
Si on remplace la matrice des variances covariances thoriques des coefficients, par
a = 1 a1 (
son estimateur 2 (X X)1 , la loi de probabilit de a a)
( a a)
k+1
est alors un Fisher k + 1 et n k 1 degrs de libert.

1. Lensemble de ces rsultats sont une gnralisation k variables explicatives des rsultats pr-
sents au chapitre 2, paragraphe III.B.

Le modle de rgression multiple  59


1  1
a a) 2 (X X )1 (
( a a)
k + 1
En effet, F = est le rapport de deux
2
1
(n k 1) 2
(n k 1)
chi-deux diviss par leurs degrs de libert (caractristique dune loi de Fisher
k + 1 et n k 1 degrs de libert).

B. Construction des tests


partir des diffrentes relations dfinies ci-dessus, nous pouvons mettre en
place un certain nombre de tests statistiques que nous allons expliciter.

1) Comparaison dun paramtre ai une valeur fixe a


Le test dhypothses est le suivant :
H0 : ai = a
H1 : ai = a
Nous savons que :

ai ai
suit une loi de Student n k 1 degrs de libert.

ai
Sous lhypothse H0, cette relation devient1 :
|
ai a|
= tai loi de Student n k 1 degrs de libert [13]

ai
/2
Si tai > tnk1 alors nous rejetons lhypothse H0, ai est significativement
diffrent de a (au seuil de ).
/2
Si tai  tnk1 alors nous acceptons lhypothse H0, ai nest pas significati-
vement diffrent de a (au seuil de ).
Cas particulier : test par rapport une valeur particulire a = 0 .
Si nous dsirons savoir si une variable explicative figurant dans un modle
est rellement significativement contributive pour expliquer la variable endo-
gne, il convient de tester si son coefficient de rgression est significativement
diffrent de 0 pour un seuil choisi, en gnral = 5 %.

1. Comme il sagit dun test bilatral, on calcule la valeur absolue du t empirique.

60  CONOMTRIE
La relation [13], sous H0 ( ai = 0 ), devient :
 
 
 ai  = t loi de Student n k 1 degrs de libert [14]
ai 
 ai

tai est appel le ratio de Student, les rgles de dcision cites plus haut sappli-
quent alors.
Ce test est trs important ; en effet, si dans un modle estim, un des coeffi-
cients (hormis le terme constant) nest pas significativement diffrent de 0, il
convient dliminer cette variable1 et de r-estimer les coefficients du modle.
La cause de cette non-significativit, est due :
soit une absence de corrlation avec la variable expliquer,
soit une colinarit trop leve avec une des variables explicatives.

2) Comparaison dun ensemble de paramtres


un ensemble de valeurs fixes

Nous cherchons tester simultanment lgalit dun sous-ensemble de coeffi-


cients de rgression des valeurs fixes.

H0 : aq = a q
H1 : aq = a q

q tant le nombre de coefficients retenus, cest--dire la dimension de chacun


des vecteurs aq .
1 a1 (
Nous avons dmontr que a a)
( a a) suit une loi de Fisher
k+1
k + 1 et n k 1 degrs de libert ; pour un sous-ensemble de paramtres q,
1 a1 (
lexpression ( aq aq ) q,q
aq aq ) suit alors une loi de Fisher q et
q
n k 1 degrs de libert.
Pour accepter H0, il suffit que :

1 a1 (
aq aq )
( q,q
aq aq )  F (q, n k 1) [15]
q

F (q, n k 1) = loi de Fisher au seuil q et n k 1 degrs de libert.

1. En effet, elle napporte aucune contribution et dgrade lestimation des autres variables.

Le modle de rgression multiple  61


3) Intervalle de confiance de la variance de lerreur

Lintervalle de confiance de la variance de lerreur permet de dterminer une


fourchette de variation de lamplitude de lerreur. Pour un intervalle (1 ) %,
il est donn par :

 
2 (n k 1)
(n k 1) 2
IC = 2
; 2
[16]
1 2

Avec 12 n k 1 degrs de libert et /2 de probabilit1 dtre dpasse


et 22 n k 1 degrs de libert et (1 /2) de probabilit dtre
dpasse.

C. Tests sur les rsidus : valeur anormale, effet de levier


et point dinfluence
Nous nabordons pas ici les tests sur les rsidus remettant en cause les hypo-
thses dhomoscdasticit ou dindpendance, qui sont traits au chapitre 5,
mais trois notions qui sont proches et nanmoins diffrentes dans leur cons-
quence sur lestimation des paramtres du modle et leurs prcisions.

1) La matrice HAT

La matrice HAT2 , note H, joue un rle essentiel dans la dtection de leffet


de levier.
Nous calculons la matrice HAT H = X (X X )1 X .
Les lments de la premire diagonale de cette matrice H sont appels les
leviers, qui dterminent linfluence de lobservation i sur les estimations obte-
nues par la rgression.
Le levier est situ sur la premire diagonale de cette matrice soit
h i = xi (X X )1 xi
n
Deux proprits : 0  h i  1 et h i = k + 1 , la somme des lments de
i =1
la premire diagonale de la matrice H est gale au nombre de paramtres esti-
ms du modle.

1. Attention, la loi du chi-deux nest pas symtrique, il convient donc de lire sur la table les deux
probabilits 1 /2 et /2 .
2. Cette matrice permet de passer du vecteur Y au vecteur Y do le nom de matrice HAT (chapeau
en anglais), en effet nous avons Y = X a = X (X X )1 X Y = H Y .

62  CONOMTRIE
Si chaque observation pse le mme poids, alors les valeurs des h i doivent
k+1
tre proches de .
n
k+1
Le levier dune observation i est donc anormalement lev si : h i > 2 ,
n
lobservation est alors considre comme un point de levier (leverage point) ou
point dinfluence.

2) Point de levier et valeur anormale

Une observation exerce un effet de levier si elle est loigne des autres en
termes de combinaison des variables explicatives ; cest--dire que les valeurs
prises par les variables explicatives, pour cette observation de la variable expli-
quer, sont inattendues. Par exemple, un pays dont la population est faible mais
le PIB lev, chaque facteur explicatif pris individuellement nest pas surpre-
nant, mais la survenance de deux valeurs la fois pour un pays est insolite.
Le point dinfluence est une observation qui contribue trs fortement au pou-
voir explicatif du modle (sans cette valeur la rgression peut tre non signifi-
cative !), lobservation pse de manire exagre dans la rgression, au point
que les rsultats obtenus sont trs diffrents selon que nous lintgrons ou non
dans la rgression.
La valeur prise par la variable explicative est anormale si le rsidu de cette
observation est beaucoup plus lev que les autres rsidus, pour identifier une
valeur anormale nous pouvons calculer le rsidu standardis (ou encore appel
le rsidu studentis). Une autre approche permettant de dtecter des valeurs
anormales laide de variables indicatrices sera prsente dans ce chapitre la
section V.

3) Rsidu standardis (ou studentis)

Les rsidus standardiss1 nots eiS permettent de dtecter des valeurs anor-
males. Le rsidu ei est divis par son cart type estim pondr par le levier2 :
ei
eiS = suit une loi de Student n k 1 degrs de libert, avec
1 h
e  i

 ei2
 t
e = . Si, par exemple, les rsidus standardiss eiS sont compris
nk1
0,025
dans lintervalle tnk1 , on ne suspecte pas de valeurs anormales pour un seuil
de confiance 95 %.

1. Dans cette mthode de calcul nous parlons de rsidus studentiss internes car le calcul porte sur
lensemble des observations. ei
2. Certains auteurs divisent le rsidu par son cart type eiS = sans intgrer la valeur du levier.
e

Le modle de rgression multiple  63


Il est aussi possible de calculer des rsidus studentiss externes, ils sont cal-
culs de la mme manire mais en excluant du calcul lobservation i.

Exercice n 2
fichier C3EX1

Tests statistiques sur les coefficients et la variance de lerreur : calcul


des leviers et des rsidus studentiss
En reprenant les donnes du tableau 1 et les rsultats de lexercice 1, on demande de
rpondre aux questions suivantes :
1) Les variables explicatives sont-elles significativement contributives pour expliquer
la variable endogne ?
2) Le coefficient a1 est-il significativement infrieur 1 ?
3) Les coefficients a1 et a2 sont-ils simultanment et significativement diffrents de
1 et 0,5 ?
4) Quel est lintervalle de confiance pour la variance de lerreur ?
5) Calculer les leviers et les rsidus standardiss, existe-t-il des valeurs aberrantes ?
(Les seuils choisis seront de 5 %.)

Solution

1) Il convient de calculer les trois ratios de Student et de les comparer la valeur lue
dans la table pour un seuil de 5 % (la table de Student en fin douvrage indique direc-
tement les valeurs de pour un test bilatral).
Daprs [14], nous obtenons :


a1 0,80 0,05
= = ta1 = 2,75 > t10 = 2,228 a1 = 0 , la variable explicative x1 est

a1 0,29

contributive lexplication de y ; de mme :


 

a2  0,38 
=   = t = 2,53 > t 0,05 = 2,228 a2 = 0

a2 0,15  a2 10

 

a3  0,03 

=  = t = 0,60 < t 0,05 = 2,228 a3 = 0

a3 0,05  a3 10

la variable x2 est explicative de y alors que la variable x3 nest pas contributive


lexplication de y , il convient donc de la retirer de ce modle et de procder une nou-
velle estimation.
Nous aurions pu tout aussi bien rpondre cette question en calculant les intervalles
de confiance de chacun des coefficients :

64  CONOMTRIE
0,05
I Ca1 =
a1 tnk1
a1 = 0,80 2,228 0,29 = [0,14 ; 1,45]

De mme nous obtenons :

I Ca2 = [0,71 ; 0,04] et I Ca3 = [0,14 ; 0,08]

La valeur 0 nappartient pas lintervalle de confiance 95 % de a1 et a2 , donc ces


deux coefficients sont significativement diffrents de 0 ; en revanche, 0 appartient lin-
tervalle de confiance de a3 , ce coefficient nest pas significativement diffrent de 0.
2) Nous posons le test dhypothses suivant :

H0 : a1 = 1
H1 : a1 < 1

Sous H0, la relation [13] scrit :



a1 a1 0,80 1 0,05
= = 0,68 > t10 = 1,811 acceptation de H0

a1 0,29
Nous sommes bien dans la zone dacceptation de H0 (cf. graphique 4 du chapitre 2).
Par souci de simplification, nous pouvons procder au test de Student en profitant
de la symtrie de cette loi, soit calculer :
|
a1 a 1 | |0,80 1| 0,05
= = 0,68 < t10 = 1,81 acceptation de H0

a1 0,29
Le fait de raisonner sur la valeur absolue du numrateur entrane une lecture direc-
te de la table et ainsi une construction et interprtation immdiate du test.
3) Le test dhypothses est le suivant :
   
a1 1
H0 : =
a2 0,5
   
a1 1
H1 : =
a2 0,5

Examinons les diffrents lments de la relation [15] sous H0 :


1 1 (
aq aq )
( aq aq aq )
q
   
0,80 1
Nous avons : q = 2 , aq = et aq = . La matrice des variances
0,38 0,5
et covariances des coefficients a t calcule lors de lexercice 1, nous ne retenons que
la sous-matrice de dimension 2 2 correspondant aux deux coefficients de rgression
faisant lobjet du test.
   
aq = 6,745 0,013204 0,001194 1 = 11,57140 3,80213
aq
0,001194 0,003635 3,80213 42,03506

1. Attention, le test est unilatral, il convient de lire sur la table de Student tabule pour /2 un
seuil de 0,10 = 2 0,05 .

Le modle de rgression multiple  65


   
1 11,57140 3,80213 0,80 1
F = (0,80 1; 0,38 + 0,5)
2 3,80213 42,03506 0,38 + 0,5

0,05
F = 0,612 est comparer F (q, n k 1) = F2,10 = 4,10 , le F empirique est
infrieur au F lu dans la table, on accepte lhypothse H0. Les donnes ne sont pas
incompatibles avec la possibilit que les coefficients a1 et a2 soient simultanment et
respectivement gaux 1 et 0,5.

4) Lintervalle de confiance de la variance de lerreur un seuil (1 )% = 95%


( = 0,05) est calcul partir de la formule [16] pour 10 degrs de libert :
   
2 (n k 1)
(n k 1) 2 10 6,745 10 6,745
IC = 2
; 2
= ;
0,025 0,975 20,48 3,25

Soit 3,30  2  20,75. La variance vraie (mais inconnue) 2 de lerreur a 95 % de


chance de se situer lintrieur de cet intervalle.
5) Le calcul de h i et des rsidus standardiss sont effectus laide du programme
 C3EX2.PRG. Les rsultats sont prsents sur le tableau 3.

Tableau 3 Valeur des leviers hi et des rsidus standardiss eiS

Rsidus
i ei hi eiS
1 0,8408 0,2790 0,3813
2 1,6068 0,2966 0,7377
3 3,1800 0,3091 1,4732
4 1,6055 0,3248 0,7523
5 3,6973 0,2609 1,6559
6 1,1220 0,1825 0,4778
7 1,2015 0,5327 0,6768
8 0,1426 0,2025 0,0615
9 4,4880 0,1804 1,9088
10 2,7622 0,1442 1,1497
11 1,0830 0,3066 0,5008
12 0,8994 0,2115 0,3900
13 2,2946 0,4086 1,1489
14 0,2387 0,3605 0,1149

k+1 4
Le seuil du levier est gal 2 =2 = 0,57 , aucune valeur nest suprieure
n 14
0,57, nous ne dtectons pas de point de levier (ou de point dinfluence).
0,025
Les rsidus studentiss sont tous dans lintervalle t10 = 2,228, nous ne dtec-
tons pas de valeur anormale.

66  CONOMTRIE
IV. Lanalyse de la variance
A. Construction du tableau danalyse de la variance
et test de signification globale dune rgression
Dans cette section, nous allons nous interroger sur la signification globale du
modle de rgression, cest--dire si lensemble des variables explicatives a une
influence sur la variable expliquer. Ce test peut tre formul de la manire
suivante : existe-t-il au moins une variable explicative significative ? Soit le test
dhypothses :
H0 : a1 = a2 = . . . = ak = 0 (tous les coefficients sont nuls1)
H1 : il existe au moins un des coefficients non nul
Nous ne testons pas le cas o le terme constant a0 est nul, car seules nous
intressent les variables explicatives. Un modle dans lequel seul le terme
constant est significatif na aucun sens conomique.
Le cas o lhypothse H0 est accepte signifie quil nexiste aucune relation
linaire significative entre la variable expliquer et les variables explicatives (ou
encore que la Somme des Carrs Expliqus nest pas significativement diffren-
te de 0).
Nous reprenons lquation fondamentale [8] danalyse de la variance :
  
(yt y)2 = yt y)2 +
( et2
t t t

La rgression est juge significative si la variabilit explique est signi-


ficativement diffrente de 0. Le tableau 4 prsente le tableau danalyse de la
variance2 permettant deffectuer le test de Fisher.


yt y)2 /k
(
t R 2 /k
F =  2 = (daprs [9])
et /(n k 1) (1 R 2 )/(n k 1)
t
[17]

1. Nous remarquons que nous pouvons rpondre cette question par le test dun sous-ensemble
de coefficients [15], le test ici prsent conduit videmment des rsultats identiques.
2. Voir chapitre 2, paragraphe 4, pour la construction de ce tableau.

Le modle de rgression multiple  67


Tableau 4 Analyse de la variance pour une rgression multiple

Source de variation Somme des carrs Degr de libert Carrs moyens



. x1 , x2 ,. . . , xk SC E = yt y)2
( k SC E/k
t

Rsidu SC R = et2 nk1 SC R/(n k 1)
t

Total SC T = (yt y)2 n1
t

Lhypothse de normalit des erreurs implique que sous lhypothse H0, F


suit une loi de Fisher (rapport de deux chi-deux). Nous comparons donc ce F
calcul au F thorique k et (n k 1) degrs de libert : si F > F nous reje-
tons lhypothse H0, le modle est globalement explicatif.
Dans la pratique, ce test est effectu immdiatement grce la connaissance
du coefficient de dtermination R 2 (seulement si le modle comporte un terme
constant) qui permet de calculer le Fisher empirique (calcul).

B. Autres tests partir du tableau danalyse


de la variance
partir dun exercice, nous allons prsenter quatre tests usuels se rfrant
lanalyse de la variance, la gnralisation de ces tests ne posera par la suite aucu-
ne difficult au lecteur.

1) Introduction dune ou de plusieurs variables explicatives


supplmentaires
Lajout dun bloc supplmentaire de variables explicatives amliore-t-il signifi-
cativement la qualit de lajustement ?

2) Stabilit des coefficients du modle dans le temps (test de CHOW)


Peut-on considrer le modle comme tant stable sur la totalit de la priode, ou
bien doit-on considrer deux sous-priodes distinctes destimation (changement
structurel du modle) ? La spcification du modle est la mme, mais les valeurs
estimes des coefficients pour les deux chantillons sont diffrentes.

3) Test de restrictions et de contraintes sur les coefficients


Les contraintes souhaites ou envisages sur les coefficients sont-elles justifies
et valides par lestimation conomtrique ?

68  CONOMTRIE
4) Augmentation de la taille de lchantillon servant estimer le modle
Lorsque la taille de lchantillon aug mente (le nombre dobservations dispo-
sition est plus important), le modle reste-t-il stable ? Ce test se ramne au test
de Chow de stabilit des coefficients sur deux sous-priodes. Lestimation sur la
sous-priode 1 est effectue partir de lchantillon initial et lestimation de la
sous-priode 2 partir des nouvelles observations.
Nous voyons lintrt pratique de ces tests et lapport pour lconomiste des
rponses ces questions.

Exercice n 3
fichier C3EX1
Tests partir de lanalyse de la variance
En reprenant les donnes de lexercice 1 (tableau 1), dont nous rappelons les rsul-
tats de lestimation du modle1 :

yt = 32,89 + 0,80 x1t 0,38 x2t 0,03 x3t + et


(11,66) (0,29) (0,15) (0,05)
R 2 = 0,702
n = 14
() = cart type des coefficients
on demande de tester les hypothses suivantes.
1) Lajout des variables explicatives x2 et x3 amliore-t-il significativement la qualit de
lestimation par rapport x1 seul ?
2) Peut-on considrer le modle ( trois variables explicatives) comme stable sur len-
semble de la priode, ou doit-on procder deux estimations, lune de la priode 1
7, et lautre de la priode 8 14 ?
3) Un conomiste suggre que dans ce modle a1 = 1 et a2 = a3 , quen pensez-vous ?

Solution2

Nous pouvons tout dabord appliquer le test de Fisher [17] afin de tester la signifi-
cation globale de la rgression trois variables x1 , x2 et x3 .
R 2 /k 0,702/3 0,05
F = = = 7,878 > F3,10 = 3,71
(1 R 2 )/(n k 1) (1 0,702)/10

1. Le lecteur notera la prsentation standard des rsultats destimation dun modle. Les infor-
mations listes ici doivent imprativement figurer. noter que le t de Student est souvent indi-
qu la place de lcart type des coefficients afin de pouvoir, sans aucun calcul, procder aux
tests de significativit des coefficients.
2. Les calculs sont effectus partir dun logiciel, il peut apparatre de lgres diffrences entre
les calculs manuels et les rsultats, imputables au fait que le logiciel tient compte dun nombre
lev de dcimales.

Le modle de rgression multiple  69


Nous rejetons lhypothse H0 de nullit de tous les coefficients, la rgression est
globalement significative.
1) Test dajout de variables

tape 1 : calcul de la variabilit totale, explique et rsiduelle sur le modle complet.


Les rsultats calculs prcdemment lors de lexercice 1 nous ont donn :
 
SC T = (yt y)2 = 226,86 ; SC E = ( yt y)2 = 159,41 ;
t t SC R = e e = 67,45
tape 2 : calcul de la variabilit totale, explique et rsiduelle sur le modle une seule
variable explicative x1 .
Le modle estim est le suivant :
yt = 1,011x1,t + 11,57 + et
(0,281)
n = 14
R 2 = 0,52
(.) = Ecart type

= 3,0165

Nous calculons dabord


SC R 1 = e e = d.d.l.
2 = 12 3,01652 = 109,20
puis partir du coefficient de dtermination R 2 , nous dduisons :
SC T 1 = 226,86 et SC E 1 = 117,65
Le test dhypothses est le suivant :
H0 : a2 = a3 = 0
H1 : il existe au moins un des deux coefficients non nul.
Ce test se ramne un test par analyse de la variance : le fait dajouter des variables
explicatives dans un modle entrane automatiquement une augmentation1 de SCE
(et donc une diminution de SC R ) ; on souhaite donc tester que la diffrence entre SCE
et SC E 1 soit significativement positive (ou bien que la diffrence entre SC R 1 et SC R
soit significativement positive, il sagit du mme test). On compare donc la diffrence
par rapport la somme des carrs la plus faible, soit ici SC R . Le tableau 5 danalyse de
la variance permet de procder au test de Fisher.

tape 3 : tableau danalyse de la variance.


Tableau 5 Tableau danalyse de la variance pour tester lajout
dun bloc de variables explicatives

Source Somme Degr Carrs


de variation des carrs de libert moyens

x1 SC E 1 = 117,65 1 117,65
x1 , x2 , x3 SC E = 159,41 3 53,14
Rsidu SC R = 67,45 10 6,74
Total SC T = 226,85 13

1. Sauf si la ou les variables ajoutes sont orthogonales la variable expliquer, SC E reste alors
identique. Ce cas est videmment rare.

70  CONOMTRIE
tape 4 : calcul du Fisher empirique.
(SC E SC E 1 )/(k k ) 41,67/(3 1) 0,05
F = = = 3,09 < F2,10 = 4,10
SC R/(n k 1) 67,45/10

(SC R 1 SC R)/(k k ) (109,2 67,45)/2


Ou encore : F : = = 3,09
SC R/(n k 1) 67,45/10
Avec k = nombre de variables explicatives du modle complet et k = nombre de
variables explicatives du modle sans lajout du bloc de variables. Nous acceptons lhy-
pothse H0, il ny a donc pas de diffrence significative entre les deux variances expli-
ques, lajout des variables explicatives x2 et x3 namliore pas de manire significati-
ve au seuil de 5 % le pouvoir explicatif du modle.
2) Le modle est-il stable sur la totalit de la priode ?
Soit le modle estim sur une seule priode :
yt =
a1 x1t +
a2 x2t +
a3 x3t +
a0 + et pour t = 1, . . . , 14
ou le modle estim sur deux sous-priodes :
a11 x1t +
yt = a21 x2t +
a31 x3t +
a01 + et pour t = 1, . . . , 7
a12 x1t +
yt = a22 x2t +
a32 x3t +
a02 + et pour t = 8, . . . , 14

Le test dhypothses jointes est alors le suivant :


a = a1 = a2
1 1 1
a2 = a 1 = a 2
2 2
H0 :
a3 = a31 = a32
a0 = a01 = a02
Ce test de stabilit des coefficients (test de Chow) se ramne la question suivante :
existe-t-il une diffrence significative entre la somme des carrs des rsidus (SC R) de
lensemble de la priode et laddition de la somme des carrs des rsidus calcule par-
tir des deux sous-priodes (SC R 1 + SC R 2 ) ?
En effet, dans le cas dune rponse ngative, cela signifie que le fait de scinder en
deux chantillons namliore pas la qualit du modle, donc quil est stable sur la tota-
lit de la priode.
Les tapes sont alors les suivantes.
tape 1 : estimation du modle sur chacune des deux sous-priodes1 et calcul des
sommes des carrs de rsidus.
sous-priode 1 : donnes de 1 7

yt = 0,774x1,t 0,293x2,t 0,012x3,t + 25,27 + et


(0,53) (0,31) (0,10)
n = 7
R 2 = 0,692
(.) = Ecart type

= 3,01759

1. Les deux sous-priodes peuvent tre de longueur ingale, cependant elles doivent imprative-
ment recouvrir la totalit des observations de la priode.

Le modle de rgression multiple  71


Nous pouvons en dduire comme prcdemment :
SC T 1 = 88,85 ; SC E 1 = 61,54 ; SC R 1 = 27,31

sous-priode 2 : donnes de 8 14

yt = 1,228x1,t 0,620x2,t 0,184x3,t + 62,63 + et


(0,69) (0,52) (0,15)
n = 7
R 2 = 0,543
(.) = Ecart type

= 2,6281

Do SC T 2 = 45,43 ; SC E 2 = 24,70 ; SC R 2 = 20,73.


tape 2 : calcul du Fisher empirique.
En prenant au dnominateur la plus faible des sommes des carrs (soit
SC R 1 + SC R 2 ) , le Fisher empirique est gal :

[SC R (SC R 1 + SC R 2 )]/ddln


F =
(SC R 1 + SC R 2 )/ddld

avec ddln = (n k 1) [(n 1 k 1) + (n 2 k 1)] = k + 1 = 4


car n = n 1 + n 2
ddld = (n 1 k 1) + (n 2 k 1) = n 2(k + 1) = 6
do
[(67,45 (27,31 + 20,73))]/4 4,852
F = = = 0,606 < F40,05
; 6 = 4,53
(27,31 + 20,73)/6 8,00
Lhypothse H0 est accepte, les coefficients sont significativement stables sur len-
semble de la priode.
Attention, en cas dhtroscdasticit (cf. chapitre 5), le test de Chow est biais dans
le sens dune surestimation du seuil de rejet du test, nous rejetons trop souvent lhypo-
thse H0.
3) Test de a1 = 1 et a2 = a3
Si cette hypothse est vrifie, le modle :
yt = a0 + a1 x1t + a2 x2t + a3 x3t + t

peut scrire :
yt = a0 + 1 x1t + a2 x2t + a2 x3t + t
ou encore :
yt x1t = a0 + a2 (x2t + x3t ) + t
z t = a0 + a2 vt + t

Il convient de constituer la nouvelle variable expliquer, z t , et la nouvelle variable


explicative vt , puis deffectuer la rgression de z t sur vt .
Le tableau 6 prsente ces nouvelles variables.
Lestimation des deux (k + 1) coefficients du modle conduit aux rsultats suivants :

72  CONOMTRIE
z t = 0,0111vt + 13,74 + et
(0,051)
n = 14
R 2 = 0,0389
(.) = Ecart type

= 3,0109

Tableau 6 Variables transformes sous lhypothse


de vrification des contraintes
t z t = yt x1t vt = x2t + x3t

1 10 166
2 13 175
3 7 197
4 10 192
5 7 171
6 11 197
7 13 164
8 14 180
9 16 169
10 8 201
11 15 193
12 12 203
13 13 209
14 14 209

Nous pouvons en dduire :


SC T 1 = 109,21 ; SC E 1 = 0,425 ; SC R 1 = 108,78
Lhypothse tester est donc :
H0 : les restrictions sont toutes vrifies (SC R 1 = SC R) .
H1 : il existe au moins une restriction non vrifie (SC R 1 = SC R) .
Le Fisher empirique est donn par :
(SC R 1 SC R)/ddln (108,78 67,45)/2 0,05
F = = = 3,06 < F2,10 = 4,10
SC R/(n k 1) 67,45/10
avec ddln = (n k 1) (n k 1) = k k = 2 .
Lhypothse H0 est accepte, les contraintes envisages sur les coefficients sont com-
patibles avec les donnes.

C. Gnralisation des tests par analyse de la variance


Nous pouvons remarquer que tous ces tests par analyse de la variance se ram-
nent un test unique, tel que les lments du vecteur des coefficients a vrifient
un ensemble de q contraintes linaires :

Le modle de rgression multiple  73


H0 : Ra = r
H1 : Ra = r
Ainsi le Fisher empirique est donn par :
a r) [R(X X)1 R ]1 (R
{(R a r)}/q
F =
SC R/(n k 1)
o
a est le vecteur des coefficients estims sur le modle non contraint.
On rejette H0 si le F est suprieur au F lu q et n k degrs de libert.
Quelques exemples dutilisation pour un modle k variables explicatives :
Test sur un coefficient de rgression. Hypothse H0 : a3 = 0,5 .
Soit tester lgalit du 3e coefficient par rapport 0,5 ; la contrainte scrit
Ra = r avec R = (0 0 0 10 0 0) et r = (0 0 0 0,50 0 0) . Le premier lment
des vecteurs correspond au terme constant a0. Ce test peut aussi tre men par
un classique test de Student.
Test dgalit de coefficients. Hypothse H0 : a1 = a3 a1 a3 = 0 .
La contrainte scrit Ra = r avec R = (0 1 0 1 . . . 0 0 0)
et r = (0 0 0 0 . . . 0 0 0) .
Test de significativit globale de la rgression.
Hypothse H0 : a1 = a2 = a3 = = ak = 0 .
Ce test de Fisher (cf. quation [17]) est quivalent lcriture contrainte Ra = r
avec R = (0 1 1 11 1) et r = (0 0 0 00 0 0) .
De manire quivalente, nous pouvons utiliser la statistique :
(SC Rc SC R)/q
F = o SC Rc est la somme des carrs des rsidus du
SC R/(n k 1)
modle contraint.
Une autre manire de procder consiste comparer le ratio de vraisem-
blance1 du modle contraint et non contraint : si la contrainte est valide, nous
devons avoir L c < L nc o L nc est la fonction de vraisemblance du modle non
contraint et L c est la fonction de vraisemblance du modle contraint. Soit
L c /L nc < 1 , sous forme logarithmique Ln(L c ) Ln(L nc ) < 0 ou encore
lc lnc < 0 , la diffrence entre les logarithmes des fonctions doit tre significa-
tivement ngative. On dmontre que ce test se ramne un test du 2 par calcul
de la statistique L R = 2(lc lnc ) qui suit un 2 r degrs de libert ( r tant
le nombre de contraintes). Ainsi, si L R est suprieur au 2 lu dans la table au
seuil choisi et r degrs de libert, on rejette lhypothse H0, les restrictions
ne sont pas vrifies.
Enfin, nous pouvons citer le test du multiplicateur de Lagrange ( L M test )
fond sur lestimation dune quation intermdiaire et de la valeur dune statis-
tique L M = n R 2 (n = nombre dobservations et R 2 = coefficient de dtermi-

1. Dans un modle de rgression classique, la maximisation de la fonction de vraisemblance four-


nit des estimations identiques celle de la mthode des MCO.

74  CONOMTRIE
nation issu de lestimation de lquation intermdiaire) qui suit un 2 r degrs
de libert ( r tant le nombre de contraintes) ; nous verrons des applications de
cette statistique au chapitre 5 concernant les tests de dtection de lautocorrla-
tion des erreurs et de lhtroscdasticit.

V. Lutilisation de variables indicatrices1


A. Constitution et finalits des variables indicatrices
Une variable indicatrice est une variable explicative particulire qui nest com-
pose que de 0 ou de 1. Cette variable est utilise lorsque, dans un modle, nous
dsirons intgrer un facteur explicatif binaire : le phnomne a lieu ou na pas
lieu pour corriger, par exemple, dune valeur anormale ; ou bien lorsque le fac-
teur explicatif est qualitatif : le genre dun individu, homme ou femme . Il
sagit donc dincorporer une ou des variables explicatives supplmentaires au
modle spcifi initialement et dappliquer les mthodes classiques destima-
tion.
Le modle de rgression diffre selon lapparition du phnomne par les valeurs
dun ou plusieurs coefficients alors que les autres paramtres sont identiques. En
cas de modification structurelle dun coefficient de rgression, la variable muette
affecte alors le coefficient de la ou des variables explicatives considres.
Par exemple, soit le modle deux variables explicatives x1t et x2t :
yt = a0 + a1 x1t + a2 x2t + b0 Dt + b1 Dt x1t + b2 Dt x2t + t
Si le phnomne existe, Dt = 1 et Dt = 0 sinon.
Si Dt = 0 , le modle scrit : yt = a0 + a1 x1t + a2 x2t + t
Si Dt = 1 , le modle scrit : yt = (a0 + b0 ) + (a1 + b1 )x1t + (a2 + b2 )x2t + t
Si b1 = b2 = 0 , le modle ne diffre que par la valeur du terme constant.

Domaine dutilisation des variables indicatrices.


Le domaine dutilisation des variables indicatrices est trs vaste, nous pou-
vons citer : la correction des valeurs anormales (cf. exercice n 4), la modifica-
tion structurelle (0 pour la priode avant le changement structurel, 1 aprs le
changement structurel), lintgration de la saisonnalit (cf. exercice n 6), la
caractrisation dun individu (genre, situation matrimoniale), lintgration de
facteurs qualitatifs (appartenance dun pays la zone euro, promotion non quan-
tifiable), etc.

1. Les termes de variables indicatrices, de variables auxiliaires ou de variables muettes sont indif-
fremment employs en franais. Le terme anglo-saxon dummy est le plus couramment
utilis.

Le modle de rgression multiple  75


B. Exemples dutilisation
1) Correction de valeurs anormales
Les sries statistiques sont parfois affectes de valeurs anormales lies la sur-
venance dvnements exceptionnels : grve, guerre, aberration climatique, etc.
Deux problmes se posent alors : dtecter la valeur anormale et la corriger afin
quelle ne perturbe pas lestimation statistique des autres variables.

Exercice n 4
Dtection et correction de valeurs anormales par variable indicatrice
Un modle de production de service du secteur du tourisme est spcifi de la mani-
re suivante :
Q P St = a0 + a1 V At + a2 P O Pt + t

avec :
Q P St = production du secteur tourisme pour lanne t ;
V At = valeur ajoute du secteur tourisme pour lanne t ;
P O Pt = population pour lanne t .

Lconomtre charg de lestimation de ce modle sur 18 ans sinterroge sur la per-


turbation entrane par leffet dune guerre pour lanne 16. Pour rpondre cette ques-
tion, il intgre son modle de base une variable indicatrice Dt tel que :

Dt = 0 pour t = 1 15 et t = 17 18

Dt = 1 pour t = 16

Lestimation du modle conomtrique est la suivante :

Q P St = 2 340,4 + 23,5 V At + 0,3 P O Pt 120,56 Dt + et


(4,5) (2,2) (2,9) (5,8)
n = 18
R 2 = 0,65
() = t de Student

Leffet guerre a-t-il une influence significative sur la production du service du


secteur du tourisme ?

76  CONOMTRIE
Solution

0,05
La variable indicatrice Dt a un ratio de Student de t = 5,8 > t14 = 2,14 , le coef-
ficient de rgression de cette variable est significativement diffrent de 0, la production
de service pour lanne 16 est donc anormalement basse (120,56) . Cette baisse est,
sans doute imputable leffet de la guerre.

Gnralisation
Dans le cas dun phnomne se produisant de manire sporadique, la variable indi-
catrice prend la valeur 1 pour la ou les priodes que lon dsire corriger et 0 pour les
autres.
Nous remarquons que nous pouvons procder au test de Chow (stabilit du modle
sur lensemble de la priode) en recourant une variable indicatrice prenant la valeur 1
pour la premire sous-priode et la valeur 0 pour la deuxime sous-priode. Le test de
Student portant sur le coefficient de la variable indicatrice permet alors de se dtermi-
ner sur un modle un rgime ou un modle deux rgimes.

2) Variable qualitative

Il peut savrer important dans certaines spcifications de modle de tenir comp-


te de leffet, sur la variable endogne, de variables qualitatives : tre titulaire
dun diplme, genre dun individu, appartenance politique, etc. Lutilisation
dune variable indicatrice permet de segmenter les individus en deux groupes et
de dterminer si le critre de segmentation est rellement discriminant.
Attention, dans le cas de variables qualitatives plusieurs modalits, par
exemple la couleur des yeux (bleu, vert, marron, autres), ou bien la situation
familiale (clibataire, mari, divorc, veuf, autres), etc. Il convient alors de
coder autant de variables indicatrices que de modalits moins une. En reprenant
lexemple de la couleur des yeux nous dfinissons trois variables indicatrices :
bleu (= 1 si lindividu les yeux bleus, 0 sinon), vert (= 1 si lindividu les yeux
verts, 0 sinon), marron (= 1 si lindividu les yeux marrons, 0 sinon), le cas des
autres individus nappartenant pas lune des trois premires catgories est
implicitement contenu dans le terme constant. Une erreur ne pas commettre
consiste crer une seule variable explicative code, par exemple, de la mani-
re suivante : bleu = 1, vert = 2, marron = 3,
Au chapitre 12 nous traitons du cas particulier des variables qualitatives qui
figurent en tant que variables expliquer.

Le modle de rgression multiple  77


Exercice n 5
Intgration dune variable qualitative
Afin de dterminer les facteurs explicatifs de la russite de la licence en sciences
conomiques, on spcifie le modle suivant :
N L = a0 + a1 N D + a2 DS +
o :
N L = note moyenne obtenue en licence,
N D = note moyenne obtenue en fin de deuxime anne,
DS = variable indicatrice de genre (1 pour les hommes et 0 pour les femmes).
Lestimation partir dun chantillon de 60 tudiants conduit aux rsultats suivants :
N L = 8,5 + 0,3 N D 1,2 DS + e
(4,5 ) (7,1) (2,3)
n = 60
R 2 = 0,72
() = t de Student
Le fait dtre homme ou femme a-t-il une influence sur la note obtenue en licence
de sciences conomiques ?
Solution
La variable indicatrice DS a un ratio de Student de
0,05
t = 2,3 > t57 = 1,96
le coefficient de rgression a2 est significativement diffrent de 0, le facteur sexe est
donc bien un facteur discriminant de la note obtenue en licence. La probabilit critique,
associe au risque de premire espce (risque de rejeter lhypothse H0 tort), est gale
0,025. Nous avons donc 2,5 % de risque de nous tromper en rejetant lhypothse H0.
Le risque derreur est trs faible, nous la rejetons.
Il est noter que le coefficient ngatif indique quil est pnalisant dtre un
homme (DS = 1) et quen moyenne, sur notre chantillon, les hommes ont une note
infrieure de 1,2 point celle des femmes.
Toutefois le facteur explicatif le plus important reste bien la note obtenue en fin de
deuxime anne (t = 7,1) .

78  CONOMTRIE
3) Analyse de saisonnalit

Exercice n 6
fichier C3EX6

tude de saisonnalit par variables indicatrices


Une entreprise cherche apprhender une relation entre ses ventes et ses dpenses
publicitaires. Le directeur du marketing dispose des donnes (tableau 7) de ventes et de
dpenses publicitaires sur 5 ans par trimestre.
1) Ce directeur du marketing commence par estimer la relation :
Vt = a0 + a1 Pubt + t
Commenter les rsultats obtenus.
2) Tracer le graphique de la srie des ventes, que pouvez-vous en conclure ?
3) Spcifier et estimer le modle adquat.
Tableau 7 Ventes et dpenses publicitaires

Annes T1 T2 T3 T4
1 Ventes 164 198 85 179
Pub. 34 36 32 29
2 Ventes 168 201 98 197
Pub. 45 67 76 75
3 Ventes 197 209 100 216
Pub. 75 78 72 75
4 Ventes 223 245 119 260
Pub. 78 81 84 83
5 Ventes 298 309 124 267
Pub. 89 82 81 83

Solution

1) Lestimation du modle de rgression simple


Vt = a0 + a1 Pubt + t
conduit aux rsultats suivants :
Vt = 104,89 + 1,29 Pubt + et
(1,85)
n = 20
R 2 = 0,16
() = t de Student
La publicit a-t-elle un effet significatif sur les ventes ? La valeur du ratio du Student
empirique permet de rpondre cette question.
0,05
t = 1,85 < t18 = 2,10 le coefficient a1 nest pas significativement diffrent
de 0, la publicit na pas, a priori, dimpact sur les ventes.

Le modle de rgression multiple  79


2) Le graphique 1 de la srie des ventes et des dpenses publicitaires indique une srie
des ventes fortement saisonnire avec un creux trs affirm au troisime trimestre
alors que la variable publicit ne semble pas affecte de variations saisonnires.
La relation entre les ventes et la publicit ne peut tre dtermine puisque le mou-
vement saisonnier vient occulter lestimation conomtrique1. Il convient donc dint-
grer ce mouvement saisonnier laide de variables muettes.
3) Le modle tenant compte de ce mouvement saisonnier scrit :
Vt = a0 + a1 Pubt + a2 D1t + a3 D2t + a4 D3t + t
avec D1t = variable indicatrice du trimestre 1 : cette variable est compose de 0, sauf
pour les premiers trimestres pour lesquels la valeur 1 figure ; D2t = variable indicatrice
du trimestre 2 : cette variable est compose de 0, sauf pour les deuximes trimestres pour
lesquels la valeur 1 figure ; D3t = variable indicatrice du trimestre 3 : cette variable est
compose de 0, sauf pour les troisimes trimestres pour lesquels la valeur 1 figure.

Graphique 1 Srie des ventes et de dpenses publicitaires


La variable indicatrice du quatrime trimestre ne doit pas tre incorpore au mod-
le. En effet, nous aurions dans le cas de son existence
D1t + D2t + D3t + D4t = U
U tant le vecteur unit qui serait par construction colinaire au vecteur unit du terme
constant, ce qui rendrait la matrice X X singulire (non inversible).
La valeur du coefficient saisonnier du quatrime trimestre est donc implicitement
incorpore la valeur du terme constant.
Nous pourrions, dans une solution alternative, utiliser les quatre variables indica-
trices et procder une rgression sans terme constant. Les donnes utilises pour les-
timation sont prsentes dans le tableau 8.
Lestimation du modle est la suivante :
Vt = 129,10 + 1,37 Pubt 7,21 D1t + 8,87 D2t 118,6 D3t + et
(3,97) (0,38) (0,47) (6,25)

1. Dans un modle conomtrique, les variables doivent tre non saisonnires ou Corriges des
Variations Saisonnires (CVS).

80  CONOMTRIE
n = 20
R 2 = 0,83
() = t de Student
Les dpenses publicitaires, dont le ratio de Student est gal 3,97, sont maintenant
explicatives1 des ventes ; la variable indicatrice D3t est la seule variable muette signifi-
cative (t = 6,25), ce qui implique que la saisonnalit des ventes est lie essentielle-
ment au creux du troisime trimestre.

Tableau 8 Variables indicatrices


pour une dsaisonnalisation trimestrielle

. Vt Pubt D1t D2t D3t

T1 164 34 1 0 0
T2 198 36 0 1 0
T3 85 32 0 0 1
T4 179 29 0 0 0
T1 168 45 1 0 0
T2 201 67 0 1 0
T3 98 76 0 0 1
T4 197 75 0 0 0
T1 197 75 1 0 0
T2 209 78 0 1 0
T3 100 72 0 0 1
T4 216 75 0 0 0
T1 223 78 1 0 0
T2 245 81 0 1 0
T3 119 84 0 0 1
T4 260 83 0 0 0
T1 298 89 1 0 0
T2 309 82 0 1 0
T3 124 81 0 0 1
T4 267 83 0 0 0

VI. La prvision laide du modle


linaire gnral et la rgression rcursive

A. Prdiction2 conditionnelle
Le problme consiste dterminer quelle valeur doit tre attribue la variable
endogne lorsque nous connaissons les valeurs des variables exognes.

1. Ceci est noter : dans un modle, labsence dune ou de plusieurs variables explicatives impor-
tantes peut entraner une mauvaise estimation des variables figurant dj dans le modle.
2. Il ne sagit pas toujours de prvoir une valeur dans le futur, mais dans le cadre de sries tem-
porelles de simuler le pass ou bien dans les modles en coupe instantane de prdire des
valeurs.

Le modle de rgression multiple  81


Le modle gnral estim est le suivant :
yt =
a0 +
a1 x1t +
a2 x2t + . . . +
ak xkt + et
La prvision pour la donne t + h (respectivement i + h pour les modles en
coupe instantane) est la suivante :

yt+h =
a0 +
a1 x1t+h +
a2 x2t+h + . . . +
ak xkt+h
Lerreur de prvision est donne par :
et+h = yt+h
yt+h
Considrant que les hypothses du modle linaire gnral sont vrifies, la
prvision yt+h est sans biais.
Nous avons postul que nous connaissons sans erreur les valeurs en t + h
des variables explicatives. Si pour un modle en coupe instantane cette hypo-
thse est raliste, il nen est pas de mme dans les modles en sries temporelles
pour lesquelles les valeurs futures des variables explicatives sont estimes avec
imprcision et donc introduisent un lment supplmentaire dincertitude dans
le calcul de la prvision. Ce problme est exclu du champ de notre analyse,
puisque nous traitons de prdiction conditionnelle.

B. Fiabilit de la prvision et intervalle de prvision


Lerreur de prvision calcule en t lhorizon h peut scrire aussi :

et+h = yt+h yt+h = X t+h (a a ) + t+h
 
Calculons la variance de cette expression : V (et+1 ) = V X t+h (a
a ) + t+h

X t+h (a
a ) est une combinaison linaire des yt et puisque t+h est sans corrla-
 
tion avec les yt , nous avons Cov X t+h (a
a ),t+h = 0 .
 
On a alors : V (et+h ) = V X t+h (a a) + V (t+h )
  !

V X t+h (a a) = X t+h V (a a)X t+h = 2 X t+h (X X)1 X t+h
(puisque V (a) = 2 (X X)1 ) )
On connat : V (t+h ) = 2
La variance de lerreur de prvision est donc gale :

2
et+h = 2 [X t+h (X X)1 X t+h + 1] [18]

1
x1t+h

Avec X t+h =
x2t+h vecteur des valeurs prvues des variables explicatives.
...
xkt+h

82  CONOMTRIE
Or lerreur de prvision (et+h = yt+h yt+h ) est distribue suivant une loi nor-
2
male N (0, et+h ) , en remplaant la variance thorique 2 par la variance empi-
2 dans lexpression [18], nous pouvons en dduire que :
rique

yt+h yt+h

suit une loi de Student n k 1 degrs de libert.

[X t+h (X X)1 X t+h + 1]1/2

Nous remarquons que, comme pour le modle de rgression simple, la va-


riance de lerreur de prvision est dautant plus faible lorsque :
la variance rsiduelle est faible ;
les valeurs prvues des variables explicatives se rapprochent de leur
moyennes.
Lintervalle au seuil (1 ) de la prvision est alors :

/2
"
yt+h =
yt+h tnk1
2 [X t+h (X X)1 X t+h + 1] [19]

Exercice n 7
fichier C3EX1

Prvision partir du modle linaire


En reprenant les donnes de lexercice 1 (tableau 1), on demande :
1) destimer le modle deux variables explicatives :
yt = a0 + a1 x1t + a2 x2t + t (puisque nous avons montr que la variable x3 nest
pas significative) ;
2) de calculer une prvision et son intervalle 95 % pour les priodes 15 et 16, sachant
que :
x1 15 = 3 ; x1 16 = 6 et x2 15 = 24 ; x2 16 = 38

Solution

1) Lestimation du modle deux variables explicatives conduit aux rsultats suivants :

yt = 25,84 + 0,715x1,t 0,328x2,t + et


(0,26) (0,13)
n = 14
R 2 = 0,687
(.) = Ecart type

= 2,538

Nous remarquons les t de Student suprieurs 2,201, les coefficients a1 et a2 sont


significativement diffrents de 0.
2) La prvision pour la priode 15 est calcule partir du modle estim :

Le modle de rgression multiple  83



y15 = 25,84 + 0,71 x1 15 0,33 x2 15 = 25,84 + 0,71 3 0,33 24

y15 = 20,25
De mme, pour la priode 16, on obtient :

y16 = 25,84 + 0,71 x1 16 0,33 x2 16 = 25,84 + 0,71 6 0,33 38

y16 = 17,26
Les carts types de lerreur de prvision sont donns par [18] :

2
e15 = 2 [X 15 (X X)1 X 15 + 1] . Nous devons calculer (X X)1, les autres l-
ments tant connus.

14 85 532
X X = 85

631 3 126 (X X)1 =
532 3 126 20 666
5,707687 0,16341 0,12221
= 0,16341 0,011001 0,002542
0,12221 0,002542 0,002809

5,707687 0,16341 0,1222 1
e215 = (2,538)2 (1 3 24) 0,16341
0,011001 0,002542 3 + 1
0,12221 0,002542 0,0022809 24
2

e15 = 6,44 [0,94 + 1] = 12,53
e15 = 3,54
De mme, nous pouvons dterminer :
2

e16 = 6,44 [0,071 + 1] = 6,90
e16 = 2,62
Les intervalles de prvision peuvent tre calculs par [19] :
#
/2
yt+h =
yt+h tnk1 2 [X t+h (X X)1 X t+h + 1]
0,025
y15 =
y15 t1421
e15 = 20,05 2,201 3,54
0,05
I C15 = [12,26 ; 27,84] , la prvision pour la priode 15 a 95 % de chances de se
situer dans cet intervalle et la prvision de la priode 16 :
0,05
I C16 = [11,49 ; 23,03]
Les intervalles de la prvision semblent assez larges, cependant il convient de sou-
ligner que la distribution de probabilit suit une loi de Student et qu ce titre la valeur
la plus probable demeure la valeur centrale (la prvision estime) et que la probabilit
dapparition diminue lorsque lon sloigne de cette valeur centrale.
Nous remarquons que lcart type de lerreur de prvision de la priode 16 est inf-
rieur celui de la priode 15. Cela est la consquence des valeurs des variables explica-
tives pour la priode 16 que nous avons choisies sensiblement gales leur moyenne.

C. Les tests de stabilit par la rgression rcursive


On appelle rgression rcursive la procdure qui consiste estimer une succes-
sion de rgressions en augmentant progressivement le nombre dobservations.

84  CONOMTRIE
On estime dabord le modle avec les k + 2 premires observations (modle
un degr de libert) puis on incorpore lobservation suivante et on re-estime le
modle, et ainsi de suite jusqu n (le nombre dobservations total disponible).
Un simple examen graphique de lvolution des coefficients du modle
assortis de leurs intervalles de confiance deux carts types permet ven-
tuellement de dterminer des changements structurels.
Les tests du CUSUM sont fonds sur la dynamique de lerreur de
prvision.
Ces tests permettent de dtecter les instabilits structurelles des quations de
rgression au cours du temps. Contrairement au test de Chow, ils ne ncessitent
pas de connatre a priori la date de modification structurelle. Lide gnrale de
ces tests est dtudier lvolution au cours du temps de lerreur de prvision nor-
malise, on appelle rsidu rcursif cette succession derreur de prvision calcu-
le en t 1 pour t.
Le rsidu rcursif wt au temps t est donc dfini comme le rapport :
de lcart entre la prvision calcule en t 1 pour t et la ralisation en t,
et une variable dchelle1 calcule pour cette mme priode t,
soit :
et = yt
yt yt xt at1
wt = =#
Se X
(1 + xt (X t 1
1 t1 ) x t )

avec t = K + 2,K + 3,K + 4,. . . , n(K = k + 1 est le nombre total de para-


mtres estims du modle). Ce rsidu rcursif suit donc une loi normale N (0, 2 ) .
Soit les deux tests :
le CUSUM (CUmulative SUM) fond sur la somme cumule des rsidus
rcursifs,
le CUSUM SQ fond sur la somme cumule du carr des rsidus rcursifs.
partir du rsidu rcursif wt , on calcule la statistique CUSUM :
nK  t
Wt = wj
SC R j=K +2
avec t = K + 2,. . . , n(K = k + 1 est le nombre total de paramtres estims du
modle) et SCR la somme des carrs des rsidus calcule partir du modle n
observations.
Si les coefficients sont stables au cours du temps, alors les rsidus
rcursifs
rester dans lintervalle dfini par les deux droites : [K , n K ] et
doivent
[n, 3 n K ] avec = 1,143 0,948 et 0,850 respectivement pour des
seuils de confiance de 1 %, 5 % et 10 %. Dans le cas contraire, le modle est
rput instable.

1. On remarque quil sagit de la formule [18], hormis la variance rsiduelle.

Le modle de rgression multiple  85


La statistique du CUSUM SQ est donne par le carr du rsidu rcursif :

t
w2j
j=K +2
St =

n avec t = K + 2,. . . ,n et 0  St  1 ;
2
w j
j=K +2

ce test permet de dtecter des modifications alatoires (ponctuelles) dans le


comportement du modle. Si les coefficients sont stables au cours du temps,
alors les rsidus rcursifs carrs doivent rester dans lintervalle dfini par :
 
(t K )
C
nK
o C est la statistique de Kolmogorov-Smirnov1.

D. Le test de spcification de Ramsey


Le test de Ramsey, aussi appel le test de RESET (Regression Error
Specification Test), porte sur la pertinence de la forme fonctionnelle du modle,
telle que :
une relation fonctionnelle non adapte (passage aux logarithmes, fonctions
inverses) entre la variable expliquer et les variables explicatives ;
labsence dune variable explicative dans le modle ;
la corrlation entre la variable explicative et le terme derreur ;

Plutt que destimer des spcifications alternatives (par exemple linaire ou non
linaire), le test porte sur la significativit dun ou des coefficients dune qua-
tion intermdiaire dans laquelle figure la srie expliquer ajuste et leve la
puissance 2, 3, 4 Le test RESET est men en trois tapes :

1) Estimation par les MCO du modle initial et calcul de la srie ajuste :


yt = a0 + a1 x1 + a2 x2 + . . . + ak xk

2) Estimation par les MCO de lquation intermdiaire :


yt = b0 + b1 x1 + b2 x2 + . . . + bk xk + 2 yt2 + 3 yt3 + . . . + h yth + vt

1. Pour la table, cf. Johnston J. et Dinardo J., pages 379-380, 1999.

86  CONOMTRIE
3) Test de lhypothse H0 : 2 = 3 = . . . = h par un classique test de Fisher
dun sous-ensemble de coefficients (ou si h = 2, par un test de Student portant
sur le coefficient unique, H0 : 2 = 0 ).
Si lhypothse H0 est accepte, le modle est bien linaire et il nexiste pas
de problme de spcification.

Exercice n 8
fichier C3EX1

Tests de stabilit structurelle, Test de spcification de Ramsey


Soit les donnes de lexercice 1 (tableau 1) et le modle :
yt = a0 + a1 x1t + a2 x2t + t
On demande :
1) partir dune rgression rcursive de tester un ventuel changement structurel en
examinant la stabilit des coefficients et en procdant aux tests CUSUM ;
2) De procder au test de spcifications de Ramsey.
Solution
1) Stabilit des coefficients
Nous procdons lestimation des coefficients a0 , a1 et a2 avec leur intervalle de
confiance deux carts types, sur 4, 5, , 14 observations, soit 11 coefficients diffrents.
Le programme Eviews (C3EX8) est en tlchargement.
Les graphiques 2, 3 et 4 illustrent lvolution des trois coefficients partir de la sep-
time observation ; en effet compte tenu du degr de libert trs faible, lestimation de
lcart type des coefficients (et donc lintervalle de confiance) pour les trois premiers
calculs nest pas significatif.

Graphique 2 volution de a0 et de son intervalle de confiance deux carts types

Le modle de rgression multiple  87


Graphique 3 volution de a1 et de son intervalle de confiance deux carts types

0,4

0,2

0,2

0,4

0,6

0,8

1,0
7 8 9 10 11 12 13 14

Graphique 4 volution de a2 et de son intervalle de confiance deux carts types

Nous constatons que les trois coefficients restent toujours dans leur intervalle de
confiance, nous rejetons lhypothse dun changement structurel.
Tests CUSUM
Les tests CUSUM et CUSUM SQ peuvent tre effectus directement sur Eviews :

Graphique 5 Test CUSUM pour un seuil de confiance de 5%

88  CONOMTRIE
Graphique 6 Test CUSUM SQ pour un seuil de confiance de 5%

Hormis la priode 9 du test CUSUM pour laquelle nous constatons un trs lger
franchissement de lintervalle de confiance, les statistiques CUSUM et CUSUM SQ
restent dans leur intervalle ; l encore nous rejetons donc lhypothse dun changement
structurel. Ces rsultats sont en conformit avec ceux de lexercice n3 (test de Chow).
2) Le test de Ramsey est conduit de la manire suivante :
Calculer la srie expliquer ajuste : yt = 25,84 + 0,71x1t 0,33x2t
lever au carr la srie expliquer : yt2 = ( yt )2 , nous ne testons quune spcification
non linaire de type quadratique.
Estimer le modle en ajoutant comme variable explicative supplmentaire yt2 :

yt = b0 + b1 x1t + b2 x2t + 2 yt2 + t

Effectuer le test dhypothses H0 : 2 = 0 (H1 : 2 = 0 ). La probabilit critique du


coefficient 2 est gale 0,827. Nous acceptons lhypothse H0, le modle est donc cor-
rectement spcifi.
Le test de Ramsey peut tre effectu directement sur Eviews :

Ramsey RESET Test :


F-statistic 0.049866 Probability 0.827792
Test Equation :
Dependent Variable : Y
Included observations : 14
Variable Coefficient Std. Error t-Statistic Prob.
C 16.40322 42.74223 0.383771 0.7092
X1 0.326961 1.759415 0.185835 0.8563
X2 0.150146 0.809298 0.185526 0.8565
FITTED^2 = yt2 0.015484 0.069342 0.223308 0.8278

Remarque : La F -statistique est gale F = 0,0498 = (t )2 = (0,223)2 .

Le modle de rgression multiple  89


VII. Exercices rcapitulatifs
Exercice n 9
Estimation dun modle et tests de validit partir de la connais-
sance de quelques lments statistiques
Sur n = 100 observations et pour trois sries (y, x1 et x2 ), nous avons les rsultats
numriques suivants :
2 2 2
V (y) = 1 000 ; r y, x1 = 0,75 ; r x1, x2 = 0,45 ; r y, x2 = 0,85 ; y = 12

1) Nous avons effectu la rgression :


y = 10 x1 6.
Le coefficient de x1 est-il significativement diffrent de 0 ?
2) La rgression de y sur x2 a donn
y = 4 x2 + 8 , le coefficient de x2 est-il significa-
tivement diffrent de 0 ?
3) Calculer les coefficients du modle : y = a0 + a1 x1 + a2 x2 + , et le coefficient de
corrlation multiple.
4) Les coefficients a1 et a2 sont-ils significativement diffrents de 0 ? La rgression est-
elle globalement significative ?

Solution

1) La variance estime du coefficient de rgression est donne par :


2

a2 = 

(x1t x 1 )2
t
Nous savons que dans le cadre de la rgression simple, il y a galit entre corrla-
tion simple et corrlation multiple, soit :
 2

(yt y)(x1t x 1 )
2 Cov (y, x1 )2 t
r y, x1 = =  
V (y) V (x1 ) (yt y)2 (x1t x 1 )2
t t 
et2
2 t
= R =1  = 0,75
(yt y)2
t
Or :  
(yt y)2 (yt y)2
t t

V (y) = 1 000 = = (yt y)2 = 100 000
n 100 t

Nous utilisons ici la formule de la variance dune population (division par n) et non
la formule de la variance dun chantillon (division par n 1).
Do :

et2 = (1 0,75) 100 000 = 25 000 2 = 25 000/(n 2) = 255,1
t

90  CONOMTRIE
Pour calculer la variance de x1 , nous utilisons les relations :

(yt y)(x1t x 1 )
t

a=  = 10
(x1t x 1 )2
t
et  2

(yt y)(x1t x 1 )
2 t
r y, x1 =
  = 0,75
(yt y)2 (x1t x 1 )2
t t

Connaissant (yt y)2 = 100 000 , nous trouvons :
t
 
(x1t x 1 )2 = 750 et (yt y)(x1t x 1 ) = 7 500
t t

Soit : Var (x1 ) = 7,5 et Cov (y, x1 ) = 75

2
255,1 10
a2 = 
2
= = 0,34 t = = 17,14 > t 0,05 = 1,96
(x1t x 1 ) 750 0,58
t

Le coefficient de rgression de y sur x1 est significativement diffrent de 0.

2) Un calcul analogue pour lcart type du coefficient de rgression de y sur x2 conduit


aux rsultats suivants :

2 = 15 000/98 = 153,06
et2 = (1 0,85) 100 000 = 15 000
t
 
(x2t x 2 )2 = 5 312,5 et (yt y)(x2t x 2 ) = 21 250
t t

Soit : Var (x2 ) = 53,12 et Cov (y, x2 ) = 212,50

2
153,06 4
a2 = 
= = 0,03 t = = 23,5 > t 0,05 = 1,96
(x2t x 2 )2 5 312,5 0,17
t

Le coefficient de rgression de y sur x2 est significativement diffrent de 0.


3) Calculer les coefficients du modle :

y = a0 + a1 x 1 + a2 x 2 +

Nous avons la relation daprs les quations normales (cf. section II, p. 50) :

   1  

a1 Var(x1 ) Cov(x1 , x2 ) Cov(y, x1 )
=

a2 Cov(x1 , x2 ) Var(x2 ) Cov(y, x2 )

Le modle de rgression multiple  91


Nous connaissons tous les lments de ce calcul sauf Cov(x1 , x2 ), or :
 2

(x1t x 1 )(x2t x 2 )
2 [Cov(x1 , x2 )]2 t
r x1, x2 = =   = 0,45
V(x1 ) V(x2 ) (x1t x 1 )2 (x2t x 2 )2
t t

Var(x1 ) = 7,5 et Var(x2 ) = 53,12 Cov(x1 , x2 ) = 13,389 , en effet la covariance


entre x1 et x2 est positive puisque les covariances entre y et x1 , et y et x2 sont positives.
   1       

a1 7,5 13,39 75 0,242 0,061 75 5,19
= = =

a2 13,39 53,12 212,5 0,061 0,034 212,5 2,69

Le terme constant est donn par


a0 = y
a1 x 1
a2 x 2 .
Or y = 12 ;
a1 = 5,19 ; a2 = 2,69 , de plus x 1 = 1,8 car y = 10 x 1 6 (modle 1)
et x 2 = 1 car y = 4 x 2 + 8 (modle 2) a0 = 0,032 .
Le coefficient de dtermination est gal, si lon raisonne sur des donnes centres, :
 
7 500

Y (5,19 2,69)
Y a X Y 21 250 96 087,5
R2 = =
= 
2
= = 0,96
Y Y Y Y (yt y) 100 000
t
Car Y Y
= (X a ) (X a) = a X (X (X X)1 X Y ) =
a X Y
Le coefficient de corrlation multiple est gal R = 0,98
4) Analyse des rsultats et tests statistiques.
Significativit des coefficients
Pour calculer les ratios de Student, il convient dabord de connatre les carts types
de chacun des coefficients.
 1
2 2 1 2 1 Var(x1 ) Cov(x1 , x2 )
(X X) =
ai =
n Cov(x1 , x2 ) Var(x2 )
Or : 
(1 R 2 ) (yt y)2
2
SC R (1 R ) SC T t (1 0,96) 100 000
2 =
= = =
nk1 nk1 nk1 100 2 1

2 = 41,23

0,242 5,19
2
a1 = 41,23 a1 = 0,316 t =
= 0,097 = 16,4 > t 0,05 = 1,96
100 0,316
0,034 2,69
2
a2 = 41,23 a2 = 0,118 t =
= 0,014 = 22,8 > t 0,05 = 1,96
100 0,118

Les coefficients a1 et a2 sont significativement diffrents de 0. Nous pouvons obser-


ver des diffrences par rapport aux valeurs estimes prcdemment, sur les coefficients
et sur leurs carts types. Cela est la consquence de la colinarit1 entre x1 et
x2 (r x1, x2 = 0,67) .

92  CONOMTRIE
Analyse de la rgression dans son ensemble
Nous calculons la statistique de Fisher :
R 2 /k 0,96/2 0,05
F = = = 1 164 > F2,97 = 3,10
(1 R 2 )/(n k 1) (1 0,96)/97
La rgression est globalement significative.

Exercice n 10
Test dune combinaison linaire de coefficients de rgression (test de
contrainte linaire)
Pendant 23 ans nous avons relev, sur une parcelle de terre situe en Auvergne, les
rendements de la culture de bl (y) , la temprature moyenne (x1 ) et le niveau des pr-
cipitations (x2 ) .
Lajustement de ce modle conduit aux rsultats suivants :
y = 0,510 x1 0,350 x2 + 27,3 + e
n = 23
R 2 = 0,937

0,0009 0,08 0,3
(X X)1 = 0,08 0,0025 0,02
0,3 0,02 0,2

et SC T = (yt y)2 = 317,46
t

On demande de tester les deux hypothses suivantes :


1) Existe-t-il une influence dau moins un des facteurs ?
2) Le coefficient de la temprature est-il significativement deux fois plus lev que celui
des prcipitations ?

Solution

1) Nous procdons au test de Fisher :


H0 : a1 = a2 = 0

1. Les diffrents aspects de la colinarit sont tudis au chapitre 4.

Le modle de rgression multiple  93


H1 : il existe au moins un des coefficients non nul
R 2 /k 0,937/2 0,05
F = 2
= = 148,731 > F2,20 = 3,49
(1 R )/(n k 1) (1 0,937)/20
Nous rejetons lhypothse a1 = a2 = 0 , il existe au moins un des coefficients non nul.

2) Le test dhypothses est le suivant1 :


H0 : a1 2 a2 = 0
H1 : a1 2 a2 = 0
a1 2
( a2 ) 0
Sous H0, le rapport suit une loi de Student n k 1 degrs de

a12 a2
libert.
a1 2
Il convient tout dabord de calculer la variance de ( a2 ) :
On rappelle que Var(a x + b y) = a 2 Var(x) + b2 Var(y) + 2a b Cov(x,y) (a et b
sont deux nombres rels ; x et y sont deux variables alatoires).
a1 2
Var( a1 ) + Var(2
a2 ) = Var( a1 , 2
a2 ) + 2 Cov( a2 )
a1 2
Var( a1 ) + (2)2 Var (
a2 ) = Var( a1 ,
a2 ) + 2 2 Cov( a2 )
De plus, la variance rsiduelle est donne par :

et2 = (1 R 2 ) SC T = (1 0,937) 317,46
2 = 20/(n 3) = 1
t

2 2 2
Do
a12 a2 =
a1 +4
a2 a1 ,
4 Cov ( a2 )
2

a12 a2 = 0,0009 + 4 0,0025 4(0,08) = 0,33

a1 2
( a2 ) 0 (0,51 + 2 0,35) 0,05
= = 2,10 > t20 = 2,08

a12 a2 0,57
Nous rejetons (de justesse !), au seuil de 5 %, lhypothse H0. Cependant, pour un
seuil de 4 %, lhypothse H0 est accepte.

Remarque : Nous pouvons aussi procder ce test en calculant la statistique


 

a1 2 a2 2
qui suit un 2 1 degr de libert ; cest ainsi que ce test de restriction

a1 2 a2
linaire sur les coefficients du modle peut tre gnralis des restrictions non linaires
(test de Wald). Par analogie, prenons par exemple une contrainte du type
 
a1 a2 2
a1 a2 = 1 , la statistique suit un 2 1 degr de libert. Cependant, la
a1 a2
variance de ( a1
a2 ) nest plus directement calculable, elle est alors estime par une
approximation de Taylor. Sans procder deux estimations diffrentes, lune sur le
modle non contraint et lautre sur le modle contraint (cf. exercice 3), le test de Wald
permet, donc en une seule tape, de tester des restrictions sur les valeurs des coefficients.
Les logiciels dconomtrie proposent directement ce test.

1. Nous pouvons rpondre cette question par un test danalyse de la variance (section IV).

94  CONOMTRIE
Exercice n 11
Reconstitution dinformations manquantes
Un conomtre recherche une relation entre le taux de mortalit (TX), les dpenses
de sant (DS), le pourcentage de plus de 60 ans dans la population (POP) et la densit de
mdecins (DM).
Une estimation sur 10 pays effectue partir du logiciel RATS conduit aux rsultats
suivants (les donnes ont t pralablement centres sur leur moyenne) :


0,0034229

(X X) 1
= 0,00074442 0,1031686
0,018265 0,125482 ????

1) On demande de calculer les valeurs manquantes notes par : ???.


2) Les coefficients des dpenses de sant et de la densit mdicale sont-ils respective-
ment et simultanment diffrents 0,10 et 0,30 ?

Solution
1) Les rsultats complets sont les suivants :


0,0034229
(X X)1 = 0,00074442 0,1031686
0,018265 0,125482 0,26286

Le modle de rgression multiple  95


2) Le test dhypothses est le suivant :
   
a1 0,1
H0 : =
a3 0,3
   
a1 0,1
H1 : =
a3 0,3
La relation [15] sous H0 scrit :
1 1 (
aq aq )
( aq aq aq )
q
   
0,103 0,1
Nous avons q = 2 ,
aq = et aq = . La matrice des variances
0,318 0,3
covariances des coefficients est gale :

0,0034229
a = 0,0482 0,00074442 0,1031686
0,018265 0,125482 0,26286

do :
 
aq = 0,0482 0,0034229 0,018265

0,018265 0,26286
 
1 = 9632,962 669,3578
aq
669,3578 125,4386
1
F = (0,103 0,1 0,318 0,3)
2   
9632,962 669,3578 0,103 0,1

669,3578 125,4386 0,318 0,3

0,05
F = 0,172 est comparer F (q, n k 1) = F2,7 = 4,74 , le F empirique
est infrieur au F lu dans la table, on accepte lhypothse H0.

Les coefficients a1 et a3 sont simultanment et respectivement gaux 0,1 et 0,3.

Exercice n 12
Modle deux rgimes : estimation par variable muette
ou par analyse de la variance
Nous reprenons lexercice 6 du chapitre 2 concernant la relation liant la rmunra-
tion et la dure des tudes. Nous disposons dun chantillon de 40 hommes et 25 femmes
ayant le mme ge dont nous connaissons la rmunration annuelle (yi ) et le nombre
danne dtudes (xi ) .

96  CONOMTRIE
Pour tudier linfluence du genre sur la rmunration, nous avions compar les coef-
ficients de rgression.
1) Quel type de variable peut-on introduire pour tudier cet effet ?
2) Nous avons procd trois estimations :
sur lchantillon global et nous obtenons : SC R ;
sur lchantillon des 40 hommes : SC Rh ;
sur lchantillon des 25 femmes : SC R f .
Comment construire le test dhomognit ?

Solution

1) Une variable muette prenant la valeur 1 pour les hommes et 0 pour les femmes permet
destimer leffet du genre sur la rmunration. Si le coefficient de cette variable indi-
catrice est significativement diffrent de 0, alors le genre est un facteur discriminant.
2) Il sagit dune application du test de Chow un modle en coupe instantane (test
dhomognit de comportement).
Le Fisher empirique est gal :
[SC R (SC Rh + SC R f )]/ddln
F =
(SC Rh + SC R f )/ddld

avec ddln = (n k 1) [(n 1 k 1) + (n 2 k 1)] = 2


ddld = (n 1 k 1) + (n 2 k 1) = n 2(k + 1) = 65 4 = 61

Si F < F 0,05 = 3,15 , lhypothse H0 est accepte, les coefficients sont stables sur
lensemble de lchantillon ; dans le cas contraire, il existe une diffrence significative
entre la rmunration des hommes et des femmes (cest le cas ici, cf. les rsultats de
lexercice 6, chapitre 2).
Nous avons donc dvelopp trois mthodes diffrentes danalyse pour rpondre la
mme question.

Exercice n 13
fichier C3EX13
Estimation dune fonction de production : impact de la privati-
sation
Soit une fonction de production de type Cobb-Douglas :
Log Q = Log a0 + a1 Log K + a2 Log L + t
Q = production
K = facteur capital

Le modle de rgression multiple  97


L = facteur travail
t = terme derreur rpondant aux hypothses classiques.
Nous disposons de donnes concernant 50 entreprises du secteur des tlcommuni-
cations en Europe pour une anne donne. Le tableau 9 prsente un extrait des donnes.

Tableau 9 Extrait des donnes de production, facteur travail, facteur capital


et variable indicatrice

Entreprise Q K L DU M
1 5 192 511 11 523 4 610 1
2 8 717 373 22 476,2 6 948 1

49 3 701 601 10 147,4 4 760 0
50 440 380 835 248 0

1) crire le modle sous sa forme originale, cest--dire non linaire. Comment sinter-
prtent les coefficients a1 et a2 de ce modle ?
2) On dsire mesurer lhomognit des comportements entre les entreprises publiques
et les entreprises prives, pour ce faire nous intgrons une variable muette (nomme
DUM) qui prend les valeurs 0 pour les entreprises publiques et 1 pour les entreprises pri-
ves.
Soit estimer le modle suivant :
Log Q = Log a0 + a1 Log K + a2 Log L + b0 DU M + b1 DU M Log K
+ b2 DU M Log L +
Existe-t-il une diffrence des fonctions de production entre les entreprises publiques
et prives ? Si oui, pouvez-vous la quantifier ?
3) Proposer et expliciter une autre mthode afin de tester lhomognit des comporte-
ments des entreprises.
4) Nous proposons maintenant destimer une fonction de production de type
Translog en ngligeant les spcificits public/priv :

Log Q = Log a0 + a1 Log K + a2 Log L + a3 0,5 (Log K )2


+ a4 0,5 (Log L)2 + a5 Log L Log K +
La spcification Translog vous semble-t-elle mieux adapte que la spcification
Cobb-Douglas ? Vous justifierez votre rponse par un test appropri.

Solution

1) le modle sous sa forme initiale scrit : Q = a0 K a1 L a2 e


Les coefficients sinterprtent comme tant des lasticits :
a1 = lasticit de la production au facteur capital
a2 = lasticit de la production au facteur travail

98  CONOMTRIE
Il sagit dun modle linaire sur ses coefficients, cest--dire non linaire sous sa
forme initiale mais linarisable par une simple transformation logarithmique, le modle
est Log-linaire.
2) Les rsultats destimation sont les suivants :

Dependent Variable : LOG(Q)


Included observations : 50
Variable Coefficient Std. Error t-Statistic Prob.
C 6.477194 0.287830 22.50358 0.0000
LOG(L) 0.230860 0.143231 1.611803 0.1142
LOG(K) 0.747993 0.143545 5.210878 0.0000
DUM 1.018567 0.457088 2.228384 0.0310
DUM*LOG(L) 0.212946 0.241356 0.882290 0.3824
DUM*LOG(K) 0.091142 0.225917 0.403431 0.6886

Les variables LOG(L), DUM*LOG(L) et DUM*LOG(K) ne sont pas significatives


(probabilits critiques suprieures 5 %) nous commenons par retirer du modle la
moins significative DUM*LOG(K). La nouvelle estimation est la suivante.

Dependent Variable : LOG(Q)


Included observations : 50
Variable Coefficient Std. Error t-Statistic Prob.
C 6.517159 0.267719 24.34327 0.0000
LOG(L) 0.266781 0.111144 2.400321 0.0206
LOG(K) 0.711198 0.109808 6.476720 0.0000
DUM 1.072324 0.433148 2.475654 0.0171
DUM*LOG(L) 0.118229 0.055440 2.132570 0.0385

Les variables sont maintenant toutes significatives, nous constatons que les variables
indicatrices DUM sont explicatives : il existe donc une diffrence significative entre les
fonctions de production des entreprises publiques et prives.
Pour les entreprises publiques, la fonction de production scrit (DUM = 0) :

Log Q = 6,52 + 0,266 Log L + 0,711 Log K + e

Pour les entreprises prives, la fonction de production scrit (DUM = 1) :

Log Q = 6,52 + 0,266 Log L + 0,711 Log K 1,07DU M


+ 0,11DU M Log L + e

Log Q = 5,44 + 0,384 Log L + 0,711 Log K + e

Nous remarquons que le facteur travail contribue plus la production pour les entre-
prises du secteur priv que pour les entreprises du secteur public.

Le modle de rgression multiple  99


3) Nous pouvons procder au test de Chow en segmentant notre chantillon entre les
entreprises du secteur priv et les entreprises du secteur public.
(SC R (SC R Priv + SC R Publique ))/(k + 1)
Soit calculer la statistique : F =
(SC R Priv + SC R Publique )/(n 2(k + 1))
qui suit alors une loi de Fisher (k + 1) et n 2 (k + 1) degrs de libert.
SCR = somme des carrs des rsidus calcule sur la totalit de lchantillon
des 50 entreprises.
SCR Priv = somme des carrs des rsidus calcule sur les 21 entreprises prives.
SC R Publique = somme des carrs des rsidus calcule sur les 29 entreprises
publiques.
k = 2 et n = 50.
(1,853 (0,795 + 0,629))/3 0,05
Soit F = 4,42 > F3;44 2,84 . Nous rejetons
(0,795 + 0,629)/44
lhypothse H0, le modle est instable, il existe une diffrence significative entre les
fonctions de production des entreprises publiques et des entreprises prives.
4) Les rsultats destimation de la fonction Tranlog sont les suivants :

Dependent Variable : LOG(Q)


Included observations : 50
Variable Coefficient Std. Error t-Statistic Prob.
C 5.404574 1.957160 2.761437 0.0084
LOG(K) 1.686188 1.201063 1.403913 0.1674
LOG(L) 0.612883 1.071805 0.571823 0.5704
0.5*LOG(K)^2 0.031900 0.939072 0.033970 0.9731
0.5*LOG(L)^2 0.289379 1.031212 0.280620 0.7803
LOG(L)*LOG(K) 0.156205 0.978803 0.159588 0.8739

La fonction Translog se ramne une fonction Cobb-Douglas si a3 = a4 = a5 = 0,


soit tester lhypothse H0 : a3 = a4 = a5 = 0. Si nous rejetons lhypothse H0 (au
moins un coefficient non nul), cela signifie que la spcification Translog est mieux adap-
te que la spcification Cobb-Douglas. Il sagit dun test de Fisher de contrainte (test de
Wald) dun sous-ensemble de coefficients, le rsultat est le suivant :

Wald Test :
Equation : TRANSLOG
Test Statistic Value df Probability
F-statistic 0.401096 (3.44) 0.7529

La probabilit critique du test est de 75 %, nous acceptons donc lhypothse H0, la


spcification Translog nest donc pas mieux adapte que la spcification Cobb-Douglas.

100  CONOMTRIE
Exercice n 14
Fonction conomtrique dinvestissement
Une estimation conomtrique de la part des emprunts dans les investissements
dune importante entreprise ptrolire donne :
EMP INVO
= 0,6645 TIR + 179,07 + 36,31 + e
INV INVI
(1,26) (4,69)
R 2 = 0,65 ; n = 17 (nombre dannes de la priode destimation)
Les chiffres entre parenthses sous les coefficients sont les t de Student avec :
EMP = emprunts totaux
INV = investissements totaux
TIR = taux dintrt rel
INVO = investissements de la socit dans les forages offshore
INVI = investissements industriels
e = rsidu destimation
1) Commentez les rsultats obtenus, les coefficients des variables explicatives ont-ils le
signe attendu ?
2) Quel est leffet dun passage de 13 % 15 % de INVO/INVI sur la variable endog-
ne ?
3) Le coefficient de la variable TIR nest pas significativement diffrent de zro. Quelle
explication conomique peut-on donner ce rsultat ?
4) On estime de nouveau ce modle en retirant la variable TIR, les rsultats sont les sui-
vants :
EMP INVO
= 162,15 + 41,28 + e
INV INVI
(7,20)
R 2 = 0,57
Pourquoi a-t-on retir la variable explicative TIR (donnez deux raisons possibles de
la non-significativit statistique de cette variable) ?
Le coefficient de dtermination a diminu, est ce fortuit ?
Les coefficients du modle sont lgrement diffrents de la premire estimation,
pourquoi ?
5) Lestimation conomtrique de lquation de la question 4 permet-elle de donner une
approximation du taux dautofinancement de cette entreprise ? Donner le cas chant
une valeur lorsque INVO/INVI = 13%.

Le modle de rgression multiple  101


Solution

1) Le taux demprunt dpend :


ngativement du taux dintrt, ce qui est conforme lintuition conomique ; mais
le coefficient de cette variable nest pas significativement diffrent de 0
0,05
(t = 1,26 < t14 = 2,14) ;
positivement de linvestissement dans les forages offshore, ce qui est logique car
linvestissement dans les forages offshore est trs important ; le coefficient est signi-
0,05
ficativement diffrent de 0 (t = 4,69 > t14 = 2,14).
2) Par application du modle estim, il vient :
EMP
= 179,07 (0,15 0,13) = 3,58
INV
3) La compagnie ptrolire doit pratiquer lautofinancement, donc il nexiste pas de sen-
sibilit au taux dintrt.
4) La variable explicative TIR nest pas significative car elle nest peut tre pas assez
corrle avec la variable expliquer ou bien colinaire avec lautre variable explicative.
Le coefficient de dtermination a diminu car le fait de retirer une variable explica-
tive mme non significative fait augmenter mcaniquement la Somme des Carrs des
Rsidus.
Les coefficients du modle sont lgrement diffrents car la colinarit entre les
variables explicatives entraine une modification de la valeur estime des coefficients.
5) Par application du modle estim il vient :
EMP
= 162,15 0,13 + 41,28 = 62,35
INV
Autofinancement 100 62,35 = 37,65 %

Annexe
A. Interprtation gomtrique de la mthode
des moindres carrs
Soit les vecteurs Y , X 1 , X 2 ,. . . , X k composs de n lments que nous pouvons donc
reprsenter dans R n.
Nous cherchons minimiser :
n
Min t2 = Min = Min (Y Xa) (Y Xa) = Min S
t=1

102  CONOMTRIE
Avec X = (X 1 , X 2 ,. . . , X k ) .
a0
a1


Le vecteur Xa = (X 1 , X 2 ,. . . , X k ) a2 appartient au sous-espace vectoriel
.
..
ak
(L) de R n engendr par X 1 , X 2 ,. . . , X k .
La quantit S est minimale lorsque le vecteur e = Y Xa est orthogonal au sous-
espace (L) .
Le graphique 7 illustre ce propos.

Graphique 7 Interprtation gomtrique de la rgression multiple

B. Rsolution de lexercice 1 par des logiciels


informatiques de rgression multiple

Logiciel RATS

Le modle de rgression multiple  103


Nous retrouvons bien lensemble des rsultats de lexercice 1.

Logiciel Eviews

Tableur EXCEL
par la fonction DROITEREG

0.03713 0.38136 0.801901 32.89132


0.052023 0.156581 0.298436 11.66331
0.702687 2.597069 #N/A #N/A
7.878181 10 #N/A #N/A
159.4095 67.44767 #N/A #N/A

Interprtation et correspondance des informations issues du tableau EXCEL



a3
a2
a1
a0

a3 a2
a1
a0
R2
#N/A #N/A
F ddl #N/A #N/A
SC E SC R #N/A #N/A

Par lutilitaire danalyse Rgression Linaire (Macro-complmentaire)

RAPPORT DTAILL

Statistiques de la rgression

Coefficient de dtermination multiple 0,838


Coefficient de dtermination R^2 0,702
Coefficient de dtermination R^2 (ajust) 0,613
Erreur-type 2,597
Observations 14

104  CONOMTRIE
ANALYSE DE VARIANCE
Degr Somme Moyenne F
de libert des carrs des carrs
Rgression 3 159,409 53,1368 7,8786
Rsidus 10 67,447 6,74476
Total 13 226,857
Coefficients Erreur-type Statistique t Probabilit
Constante 32,891 11,663 2,820 0,0181
X1 0,80190 0,298 2,687 0,0228
X2 0,3813 0,156 2,435 0,0351
X3 0,0371 0,05202 0,713 0,4916

C. Estimation de la variance de lerreur


La variance de lerreur est inconnue, nous allons donc lestimer partir de la somme des
carrs des rsidus.
Soit : e = Y X a = Y X (X X)1 X Y = PY avec P = I X (X X)1 X .
Cette matrice P est symtrique et idempotente (P 2 = P) . Elle est aussi telle que
P X = 0 et Pe = e .
e = PY = P(Xa + ) = P puisque P X = 0.
Do lesprance de lerreur est donne par : E(e e) = E( P P) = E( P) car
2
(P = P) .
En utilisant le fait que la trace1 dun scalaire est un scalaire, il vient :
E( P) = E[Trace( P)] = E[Trace( P)]
= 2 Trace(P) = 2 Trace(I X (X X)1 X )
= 2 Trace(I )2 Trace[X (X X)1 X ]
= 2 Trace(I )2 Trace[(X X)1 (X X)] = 2 (n(k + 1)) = 2 (nk1) .
Trace(I ) = n et Trace[(X X)1 (X X)] = k + 1 car (X X) est de dimension
(k + 1,k + 1).
Do lestimateur de la variance de lerreur (appele aussi la variance rsiduelle)
scrit donc :

et2

2 ee t
= =
nk1 nk1

1. La trace dune matrice est gale la somme des valeurs de la premire diagonale.

Le modle de rgression multiple  105


4. Multicolinarit
et slection
du modle optimal

D
ans ce chapitre, nous examinons comment grer labondance de
linformation. En effet, il est frquent, lorsque lconomiste sp-
cifie un modle, quil hsite intgrer telle ou telle variable
explicative. La question essentielle quil se pose est la suivante : comment
dterminer le mix optimal des variables explicatives ? Formule en terme
statistique, cette question se rsume trouver les variables explicatives
qui maximisent leur coefficient de corrlation avec la srie expliquer,
tout en tant les moins corrles entre elles.
Nous prsentons, en I., tout dabord la notion de corrlation partielle qui
permet de dterminer lapport relatif de chaque srie explicative lex-
plication de la srie endogne.
Les relations entre les coefficients de corrlation simple, partielle et mul-
tiple sont examines en II.
Les consquences de la multicolinarit sur lestimation des coefficients
de rgression font lobjet du III.
Enfin, les techniques de slection de variables explicatives sont exposes
et illustres partir dexemples en IV.

I. Corrlation partielle
A. Exemple introductif
Un marchand de glaces, situ prs de la tour Eiffel, cherche calculer le coeffi-
cient de corrlation entre ses ventes (x1 ) et le nombre de touristes visitant ce
monument (x2 ) . Ces deux variables sont influences par le climat : la consom-

Multicolinarit et slection du modle optimal  107


mation de glaces est plus importante lorsquil fait chaud et les touristes sont peu
enclins visiter un monument extrieur en cas de froid ou de pluie, on appelle
x3 cette variable climatique.
Nous pouvons penser que la corrlation entre x1 et x2 est positive, cependant
un calcul de coefficient de corrlation simple nest pas rvlateur du degr de liai-
son relle entre ces deux variables ; en effet, la variable climat influence la vente
des glaces et la frquentation des touristes. En dautres termes, le coefficient de
corrlation simple calcul ainsi intgre lapport de la variabilit des conditions
climatiques sans pouvoir isoler linfluence relative du nombre de touristes.

B. Gnralisation de la notion de corrlation partielle


Le coefficient de corrlation partielle mesure la liaison entre deux variables
lorsque linfluence dune ou des autres variables explicatives est retire.
Soit y une variable expliquer, et x1 , x2 et x3 des variables explicatives :
r y,2 x1 , r y,2 x2 et r y,2 x3 mesurent respectivement la variance de y explique par
la variable x1 seule, x2 seule et x3 seule.
Nous pouvons calculer six coefficients de corrlation partielle du premier
ordre :
2 2 2 2 2 2
r yx1.x2 ; r yx1.x3 ; r yx2.x1 ; r yx2.x3 ; r yx3.x1 ; r yx3.x2 ;
ainsi que trois coefficients de corrlation partielle du deuxime ordre :
2 2 2
r yx1.x2 x3 ; r yx2.x1 x3 ; r yx3.x1 x2 .

Cette notion de corrlation partielle est trs importante car elle permet de
juger de la pertinence dinclure une variable explicative dans un modle.
Plus le coefficient de corrlation partielle dune variable est lev, plus la
contribution de cette variable est importante lexplication globale du modle.
Le coefficient de corrlation partielle peut se calculer de deux manires
partir :

1) Du coefficient de corrlation simple


Entre le rsidu de la rgression de la variable expliquer sur le sous-
ensemble des k 1 autres variables explicatives,
et le rsidu de la rgression de la variable explicative xi sur les k 1
variables explicatives.
2
Exemple de calcul de r yx3.x1 x2

tape 1 : calcul de rsidu e1 de la rgression de y sur x1 et x2


a0 + 
e1 = y ( a1 x 1 + 
a2 x 2 )

108  CONOMTRIE
tape 2 : calcul de rsidu e2 de la rgression de x3 sur x1 et x2
e2 = x3 (a 0 + a 1 x1 + a 2 x2 )

tape 3 : calcul du coefficient de corrlation simple entre e1 et e2


2 2
r yx 3.x 1 x 2 = re1,e2

2) Du t de Student
Dans un modle k variables explicatives, il existe une relation entre le coeffi-
cient de corrlation partielle et le t de Student1 :

2 ti2
r yxi.(autres variables) =
[1]
ti2 + (n k 1)

Attention : cette relation nest vrifie que pour un coefficient de corrlation


partielle dordre k 1 .

Exercice n 1
fichier C4EX1
Calcul des coefficients de corrlation partielle du premier ordre et
du deuxime ordre
Une entreprise cherche dterminer quelles sont les influences respectives de la
publicit (x1 ) , de la promotion auprs des distributeurs (x2 ) , et de la promotion auprs
des consommateurs (x3 ) exprimes en milliers deuros sur les ventes en tonnes (y) .
Pour ce faire, elle dispose, sur 10 ans, des sries statistiques du tableau 1.
Tableau 1 Ventes, publicit et promotions

Anne y x1 x2 x3
1 49,0 35,0 53,0 200,0
2 40,0 35,0 53,0 212,0
3 41,0 38,0 50,0 211,0
4 46,0 40,0 64,0 212,0
5 52,0 40,0 70,0 203,0
6 59,0 42,0 68,0 194,0
7 53,0 44,0 59,0 194,0
8 61,0 46,0 73,0 188,0
9 55,0 50,0 59,0 196,0
10 64,0 50,0 71,0 190,0

1. Greene W.H., pages 234-235, 2000.

Multicolinarit et slection du modle optimal  109


Pour rpondre cette question, on demande de calculer les coefficients de corrla-
tion partielle du premier ordre et du deuxime ordre et de commenter les rsultats obte-
nus.

Solution

2 2
Nous traitons compltement le calcul de r yx1.x2 et r yx3.x1 x2 , les rsultats des autres
coefficients sont fournis afin que le lecteur puisse vrifier ses propres calculs.
2
a) Calcul de r yx1.x2 par corrlation entre les rsidus
tape 1 : rgression de y sur x2

Rsidu e1 = y (0,7809 x2 + 3,5809)

tape 2 : rgression de x1 sur x2

Rsidu e2 = x1 (0,3809 x2 + 18,3809)

tape 3 : calcul du coefficient de corrlation entre e1 et e2


e1 e2

1 4,02857 3,57143
2 4,97143 3,57143
3 1,62857 0,57142
4 7,56190 2,76190
5 6,24762 5,04762
6 2,31429 2,28571
7 3,34286 3,14286
8 0,40952 0,19047
9 5,34286 9,14286
10 4,97143 4,57143
2 2
re1,e2 = 0,6798 r yx1.x2 = re1,e2 = 0,4621
La corrlation entre les ventes et la publicit est donc gale 0,46 , lorsque lin-
fluence de la promotion auprs des distributeurs est retire.

2
b) Calcul de r yx3.x1 x2 par corrlation entre les rsidus

tape 1 : rgression de y sur x1 et x2

110  CONOMTRIE
Rsidu e1 = y (0,7368 x1 + 0,50 x2 9,9621)

tape 2 : rgression de x3 sur x1 et x2

Rsidu e2 = x3 (0,952 x1 0,304 x2 + 258,932)

tape 3 : calcul du coefficient de corrlation entre e1 et e2


e1 e2

1 6,66000 9,4000
2 2,34000 2,6000
3 2,04960 3,5440
4 5,52693 10,7040
5 2,52853 3,5280
6 3,99840 4,1760
7 1,02720 5,0080
8 0,54986 4,8480
9 1,39360 2,7040
10 1,60320 0,3520

2 2
re1,e2 = 0,921 r yx3.x1 x2 = re1,e2 = 0,848

La corrlation entre les ventes et la promotion consommateur est donc gale


0,84 , lorsque les influences de la publicit et de la promotion distributeur sont reti-
res.

2
c) Calcul de r yx3.x1 x2 partir du t Student

tape 1 : rgression de y sur x1 , x2 et x3

Multicolinarit et slection du modle optimal  111


tape 2 : calcul du coefficient de corrlation partielle
Daprs [1], nous avons :
2 ti2 5,792
r yx3.x1 x2 = = = 0,848
ti2 + (n k 1) 5,792 + (10 4)
d) Autres rsultats
2 2 2
r yx1.x2 = 0,461 r yx1.x3 = 0,212 r yx2.x1 = 0,480
2 2 2
r yx2.x3 = 0,698 r yx3.x1 = 0,734 r yx3.x2 = 0,895
2 2 2
r yx1.x2 x3 = 0,225 r yx2.x1 x3 = 0,703 r yx3.x1 x2 = 0,848

la lecture de ces chiffres, lapport intrinsque de la variable promotion consom-


2
mateur semble le plus important pour expliquer les ventes : r yx3.x1 = 0,734 ;
2 2
r yx3.x2 = 0,895 et r yx3.x1 x2 = 0,848 sont les trois coefficients de corrlation partielle
les plus levs.

II. Relation entre coefficients de corrlation


simple, partielle et multiple

Dans le cas dun modle une seule variable explicative x1 , la somme des car-
rs des rsidus est gale :
  
SC R = et2 = (yt y)2 (1 R 2y.x 1 ) = (yt y)2 (1 r yx
2
1)
t t t
2
R y.x1 = coefficient de dtermination de la rgression de y sur x1 .
Supposons maintenant un modle deux variables explicatives :
y =
a0 + 
a1 x 1 + 
a2 x 2 + e
La somme des carrs des rsidus, aprs avoir retir linfluence de x1 et x2 , est
gale :  
SC R = et2 = (yt y)2 (1 R 2y.x 1x 2 )
t t
2
R y.x1 x2 = coefficient de dtermination de la rgression de y sur x1 et x2 .
2
Or r est la proportion du rsidu explique par la variable x2 seule, cette
yx2.x1
dernire expression peut donc scrire :
 
(yt y)2 (1 R y.x1x2
2 2
) = (1 r yx2.x1 ) (yt y)2 (1 r yx1
2
) [2]
t t

2 2 2
Do 1 R y.x1 x2 = (1 r yx2.x1 )(1 r yx1 )
[3]

112  CONOMTRIE
Nous avons ainsi la dcomposition de linfluence relative de chacune des
variables : lapport de x2 sur y lorsque linfluence de x1 est retire et lapport de
x1 sur y (certains auteurs emploient le terme de rendement pour qualifier ces
apports relatifs).
Cette formule [3] peut tre gnralise pour un modle trois variables
explicatives :
2 2 2 2
1 R y.x1 x2 x3 = (1 r yx1 )(1 r yx2.x1 )(1 r yx3.x1 x2 ) [4]

Pour un modle quatre variables explicatives, nous obtenons :


2 2 2 2 2
1 R y.x1 x2 x3 x4 = (1 r yx1 )(1 r yx2.x1 )(1 r yx3.x1 x2 )(1 r yx4.x1 x2 x3 )

Il est noter que les indices peuvent permuter, ainsi, dans lordre, 3, 4, 1, 2 ;
la relation prcdente devient :
2 2 2 2 2
1 R y.x1 x2 x3 x4 = (1 r yx3 )(1 r yx4.x3 )(1 r yx1.x3 x4 )(1 r yx2.x1 x3 x4 )

Exercice n 2
Relation entre coefficients de corrlation simple, partielle et multiple
Un conomtre estime un modle trois variables explicatives :


y = 348,4 + 56,3 x1 9,5 x2 + 234,8 x3
(4,5) (8,3) (2,1) (4,6)
2
R = 0,76
n = 65
(.) = t de Student

2
Le coefficient de corrlation linaire entre y et x1 est connu, r yx1 = 0,52 .
2
On demande de calculer le coefficient de corrlation partielle r yx2.x1 .

Solution
2
2
ta3 4,62
Le coefficient r yx3.x1 x2 est gal : 2
= 2
ta3 + (n k 1) 4,6 + (65 4)
2
r yx3.x1 x2 = 0,257

Nous pouvons alors utiliser la relation suivante :

1 R 2y.x1 x2 x3 = (1 r yx1
2 2
)(1 r yx2.x1 2
)(1 r yx3.x1 x2 )
2
1 0,76 = (1 0,52)(1 r yx2, x1 )(1 0,257)
2
do r yx2.x1 = 0,324

Multicolinarit et slection du modle optimal  113


III. Multicolinarit :
consquences et dtection

Le terme de multicolinarit est employ dans le cas dun modle incorporant


des sries explicatives qui sont lies entre elles.
loppos, pour des sries explicatives de covariance nulle (Cov (x1 , x2 ) = 0) ,
nous dirons quelles sont orthogonales. Si, pour des tudes thoriques, nous
pouvons supposer que deux sries statistiques sont orthogonales, dans la pra-
tique, lorsque lconomiste modlise des phnomnes conomiques, les sries
explicatives sont toujours plus ou moins lies entre elles. Nous allons donc exa-
miner les consquences de la multicolinarit.

A. Consquences de la multicolinarit
Nous pouvons citer trois effets principaux :
a) augmentation de la variance estime de certains coefficients lorsque la
colinarit entre les variables explicatives augmente (le t de Student dimi-
nue) ;
b) instabilit des estimations des coefficients des moindres carrs, des faibles
fluctuations concernant les donnes entranent des fortes variations des
valeurs estimes des coefficients ;
c) en cas de multicolinarit parfaite, la matrice X X est singulire (le dter-
minant est nul), lestimation des coefficients est alors impossible et leur
variance est infinie.

Exercice n 3
Consquences de la multicolinarit
Soit un modle deux variables explicatives dont les matrices X X et X Y sont
calcules partir dun chantillon dobservations de variables centres.
   
200 150 350
X X = X Y =
150 113 263

114  CONOMTRIE
La suppression dune observation modifie les rsultats de la manire suivante :
   
199 149 347,5
X X = X Y =
149 112 261,5
On demande :
1) de calculer les coefficients de rgression du modle dans les deux cas ;
2) puis de calculer le coefficient de corrlation entre x1 et x2 ;
3) de commenter les rsultats.

Solution

1) Calcul des coefficients de rgression


a) Estimation des coefficients partir des donnes de base. Les quations normales
scrivent :
200 a1 + 150  a2 = 350 
a1 = 1

150 a1 + 113  a2 = 263 
a2 = 1
b) Estimation des coefficients aprs suppression dune observation. Les quations
normales scrivent :
199  a1 + 149 
a2 = 347,5 a1 = 0,5

149  a1 + 112 
a2 = 261,5 a2 = 3

2) Calcul du coefficient de corrlation


[Cov (x1 , x2 )]2 
x21 ,x2 = = 0,995 x1 ,x2 = 0,995 = 0,997
Var (x1 ) Var (x2 )

3) Commentaires : une faible modification dune des observations ou du nombre dob-


servations entrane une profonde modification des valeurs estimes des coefficients,
cela est la consquence directe de la trs forte colinarit entre x1 et x2 (0,997).
Afin dviter ce problme, il convient alors de dtecter une ventuelle multicolina-
rit lors de lestimation dun modle.

B. Tests de dtection dune multicolinarit


1) Test de Klein1

Le test de Klein est fond sur la comparaison du coefficient de dtermination R y2


calcul sur le modle k variables :
y =
a0 + 
a1 x 1 + 
a2 x 2 + . . . + 
ak x k + e

1. Klein L.R., page 101, 1962.

Multicolinarit et slection du modle optimal  115


2
et les coefficients de corrlation simple r xi, x j entre les variables explicatives
pour i
= j .
2
Si R y2 < r xi, x j , il y a prsomption de multicolinarit.

Il ne sagit pas dun test statistique au sens test dhypothses mais simple-
ment dun critre de prsomption de multicolinarit.

2) Test de Farrar et Glauber1


La premire tape consiste calculer le dterminant de la matrice des coeffi-
cients de corrlation entre les variables explicatives.
 
 1 r x1 x2 r x1 x3 . . . r x1 xk 
 
r 1 r x2 x3 . . . r x2 xk 
D =  x2 x1 
 ... ... ... ... ... 
 
r xk x1 r xk x2 r xk x3 ... 1
Lorsque la valeur du dterminant D tend vers zro, le risque de multicoli-
narit est important.
Par exemple, pour un modle deux variables explicatives, si les deux sries
sont parfaitement corrles, le dterminant D scrit :
   
 1 r x1 x2   1 1 
D =  = =0
r x2 x1 1  1 1
Dans le cas oppos o les sries explicatives sont orthogonales, le dtermi-
nant devient :    
 1 r x1 x2   1 0 
D =  = =1
r x2 x1 1  0 1
La deuxime tape consiste effectuer un test du 2 , en posant les hypo-
thses suivantes :
H0 : D = 1 (les sries sont orthogonales) ;
H1 : D < 1 (les sries sont dpendantes).
La valeur empirique du 2 calcule partir de lchantillon est gale :
 
2 1
= n 1 (2 K + 5) . Ln D
6
o n est la taille de lchantillon, K le nombre de variables explicatives (terme
constant inclus, K = k + 1 ) et Ln le logarithme nprien.
1
Si 2  2 lu dans la table K (K 1) degrs de libert et au seuil choisi,
2
alors lhypothse H0 est rejete, il y a donc prsomption de multicolinarit.
Si 2 < 2 , alors nous acceptons lhypothse dorthogonalit.

1. Farrar D.E. et Glauber R.R., 1967.

116  CONOMTRIE
Exercice n 4
fichier C4EX4
Tests de multicolinarit
Un conomiste cherche expliquer la variable y laide de quatre sries explicatives
x1 , x2 , x3 et x4 . Il dsire auparavant tester une ventuelle multicolinarit entre ces
quatre sries ; pour ce faire, il dispose des donnes du tableau 2.

Tableau 2 Ces sries statistiques sont-elles colinaires ?

. y x1 x2 x3 x4
8,40 82,90 17,10 92,00 94,00
9,60 88,00 21,30 93,00 96,00
10,40 99,90 25,10 96,00 97,00
11,40 105,30 29,00 94,00 97,00
12,20 117,70 34,00 100,00 100,00
14,20 131,00 40,00 101,00 101,00
15,80 148,20 44,00 105,00 104,00
17,90 161,80 49,00 112,00 109,00
19,30 174,20 51,00 112,00 111,00
20,80 184,70 53,00 112,00 111,00

On demande donc dappliquer les tests suivants :


1) test de Klein,
2) test de Farrar-Glauber.

Solution

1) Test de Klein
a) Rgression : y = a0 + a1 x1 + a2 x2 + a3 x3 + a4 x4 + .
Les rsultats de lestimation sont les suivants :
y = 13,53 + 0,096 x1 + 0,015 x2 0,199 x3 + 0,34 x4 + e
(1,80) (3,66) (0,30) (2,20) (2,27)
n = 10
R 2 = 0,998
(.) = t de Student
b) Calcul des coefficients de corrlation simple entre les variables explicatives :
2 2 2
r x1, x2 = 0,976 r x1, x3 = 0,960 r x1, x4 = 0,974
2 2 2
r x2, x3 = 0,938 r x2, x4 = 0,938 r x3, x4 = 0,982

la lecture de ces coefficients il ne semble pas ressortir des risques graves de mul-
ticolinarit puisque tous les coefficients de corrlation simple sont infrieurs au coeffi-
cient de dtermination. Toutefois, nous observons quils sont tous trs levs.

Multicolinarit et slection du modle optimal  117


2) Test de Farrar-Glauber
Calcul du dterminant
 
 1 r x1 x2 r x1 x3 r x1 x4 
 
r 1 r x2 x3 r x2 x4 
D =  x2 x1 =
 r x3 x1 r x3 x2 1 r x3 x4 
 
r x4 x1 r x4 x2 r x4 x3 1
 
1 0,988 0,980 0,987 
 
 0,988 1 0,969 0,969 
=  = 0,92198 105
 0,980 0,969 1 0,991 
 0,987 0,969 0,991 1 

La valeur empirique du 2 calcule partir de lchantillon est :


 
1
2 = n 1 (2 K + 5) Ln D
6
 
2 1
= 10 1 (2 5 + 5) 11,59 = 75,33
6

Cette valeur est comparer la valeur lue dans la table :


1
2 K (K 1) = 10 degrs de libert et pour un seuil = 0,05 , soit :
2
2 = 18,31

Puisque 2 > 2 , nous rejetons lhypothse H0 , il y a prsomption de multicoli-


narit.
Ces deux tests conduisent donc des rsultats diffrents, cependant le test de Farrar-
Glauber, dont le fondement thorique est plus affirm, semble devoir tre privilgi.

C. Comment remdier la multicolinarit ?


Nous ne ferons que citer les diffrentes techniques permettant dapporter des
solutions au problme de multicolinarit, le lecteur intress par les dvelop-
pements mthodologiques peut se rapporter Judge1.
Augmenter la taille de lchantillon : cette technique nest efficace que si
lajout dobservations diffre significativement de celles figurant dj dans le
modle, sinon il y aura reconduction de la multicolinarit.
La Ridge Regression est une rponse purement numrique, il sagit de
transformer la matrice X X en ( X X + cI ) o c est une constante choisie arbi-
trairement qui, en augmentant les valeurs de la premire diagonale, rduit les
effets numriques de la multicolinarit.

1. Judge G.G. et al, pages 874-882, 1988.

118  CONOMTRIE
Face ces artifices de calcul, la seule parade vraiment efficace consiste, lors
de la spcification de modle, liminer les sries explicatives susceptibles de
reprsenter les mmes phnomnes et donc dtre corrles entre elles, ceci afin
dviter leffet de masque.
Au paragraphe suivant, nous prsentons des mthodes permettant de dter-
miner le mix optimal de variables explicatives.

IV. Slection du modle optimal


Dans la pratique, lconomtre est souvent confront au choix de plusieurs
variables explicatives x1 , x2 , , xk candidates pour expliquer la variable y . Des
procdures statistiques permettent de dterminer quelles variables retirer ou
quelles variables ajouter dans un modle. Cette dmarche exclut tout raisonne-
ment conomique car elle permet daboutir des modles conomtriques qui
sont souvent bons sur le plan statistique mais dont linterprtation conomique
savre nulle, voire aberrante. Ces techniques automatiques de slection de
variables explicatives sont donc manier avec prudence.
Au problme de la slection des variables explicatives sajoute celui du choix
effectuer entre plusieurs modles concurrents, cest--dire des modles dont
les variables sont toutes significatives mais qui ne sont pas les mmes.
La question se pose alors de slectionner le meilleur modle.
Le critre de maximisation du R 2 (coefficient de dtermination) consiste
retenir le modle dont le R 2 est le plus lev. Ce critre prsente linconvnient
de ne pas arbitrer entre la perte de degrs de libert du modle et lajustement
qui en rsulte. Cest pourquoi on prfre utiliser les critres de Akaike1 ou de
Schwarz2 afin de comparer des modles impliquant un nombre diffrents de
variables explicatives.
Nous retenons le modle qui minimise la fonction de Akaike (Akaike
Information Criterion) :

SC R 2k
AI C = Ln +
n n
ou de Schwarz (Schwarz Criterion) :

SC R k Ln (n)
SC = Ln +
n n

1. Akaide H., 1973 ; 1974.


2. Schwarz, 1978.

Multicolinarit et slection du modle optimal  119


Avec :
Ln = Logarithme nprien,
SCR = somme des carrs des rsidus du modle,
n = nombre dobservations,
k = nombre de variables explicatives.
Nous allons examiner cinq mthodes qui vont nous permettre de retenir le
meilleur modle, celui qui est compos des variables qui sont :
les plus corrles avec la variable expliquer ;
les moins corrles entre elles.

Toutes les rgressions possibles


Il sagit de la mthode la plus simple dans son expos : nous estimons toutes
les combinaisons de rgressions possibles (2k 1 possibilits, k = nombre de
variables explicatives candidates) et le modle retenu est celui dont le critre de
Akaike ou de Schwarz est minimum pour un modle comportant des variables
explicatives toutes significatives. La limite dutilisation de cette mthode est lie
au nombre initial de variables explicatives candidates, par exemple si k = 10 , le
nombre de combinaisons possibles est de 1023 .

Llimination progressive ( Backward Elimination )


Cette procdure consiste, sur le modle complet k variables explicatives,
liminer de proche en proche (cest--dire en restimant lquation aprs chaque
limination) les variables explicatives dont les t de Student sont en dessous du
seuil critique. Cette procdure nest utilisable que si la premire quation peut
tre effectivement estime, ce qui nest pas toujours le cas. En effet, lorsque le
modle comporte un nombre important de variables explicatives, le risque de
colinarit entre ces variables est lev et la matrice X X peut tre singulire.

La slection progressive ( Forward Regression )


Dans cette procdure, on slectionne, dans une premire tape, la variable
explicative dont le coefficient de corrlation simple est le plus lev avec la
variable y , soit xi cette variable. La deuxime tape consiste alors calculer les
2
coefficients de corrlation partielle r yx j xi
pour j
= i et retenir la variable expli-
cative ayant le coefficient le plus lev. La slection sarrte lorsque les t de
Student des variables explicatives sont infrieurs au seuil critique.

La rgression pas pas ( Stepwise Regression )


Cette procdure est identique la prcdente, sauf quaprs avoir incorpor
une nouvelle variable explicative, nous examinons les t de Student de chacune
des variables explicatives pralablement slectionnes et nous liminons du
modle celle(s) dont le t du Student est infrieur au seuil critique.

120  CONOMTRIE
La rgression par tage ( Stagewise Regression )
Cest un processus de slection de variables explicatives permettant de mini-
miser les intercorrlations entre les sries explicatives par tude du rsidu.

1re tape
La variable explicative dont le coefficient de corrlation simple est le plus
lev avec la variable y est slectionne, soit xi cette variable.

2e tape
Calcul du rsidu de la rgression de y sur xi :
e1 = y 
a0 
a1 x i
Les coefficients de corrlation simple entre le rsidu e1 et les variables expli-
catives sont calculs, nous retenons la variable explicative dont le coefficient est
le plus lev. Soit x j cette variable explicative.

3e tape
Nous calculons un nouveau rsidu :

e2 = y 
a0 
a1 x i 
a2 x j

Les coefficients de corrlation simple entre le rsidu e2 et les variables expli-


catives sont calculs, nous retenons la variable explicative dont le coefficient est
le plus lev, ce qui permet de dgager un nouveau rsidu.
La procdure est arrte lorsque les coefficients de corrlation ne sont plus
significativement diffrents de 0 .

Exercice n 5
fichier C4EX4

Mthodes de slection de variables explicatives


En utilisant les cinq procdures dcrites prcdemment et en reprenant les donnes
du tableau 2, on demande de slectionner, parmi la (ou les) variable(s) explicative(s) can-
didate(s), celle(s) dont le pouvoir explicatif est le plus important.

Solution

a) Toutes les rgressions possibles


Nous devons estimer (2k 1 = 24 1) 15 modles.

Multicolinarit et slection du modle optimal  121


Tableau 3 Rsultats des 15 rgressions (les coefficients non significativement
diffrents de 0 sont en caractres gras, italiques)

M1 Sries X1 R2 AIC 1 SC
Coefs. 0,118 0,995 2,185 2,125
t de Student 41,9
M2 Sries X2
Coefs. 0,327 0,967 0,199 0,138
t de Student 15,3
M3 Sries X3
Coefs. 0,516 0,952 0,185 0,245
t de Student 12,5
M4 Sries X4
Coefs. 0,663 0,978 0,583 0,523
t de Student 18,6
M5 Sries X1 X2
Coefs. 0,132 0,039 0,996 2,058 1,967
t de Student 6,91 0,72
M6 Sries X1 X3
Coefs. 0,126 0,036 0,996 2,026 1,936
t de Student 8,42 0,53
M7 Sries X1 X4
Coefs. 0,102 0,090 0,996 2,087 1,996
t de Student 5,60 0,86
M8 Sries X2 X3
Coefs. 0,209 0,194 0,975 0,273 0,183
t de Student 2,55 1,48
M9 Sries X2 X4
Coefs. 0,137 0,395 0,988 0,993 0,903
t de Student 2,42 3,45
M10 Sries X3 X4
Coefs. 0,166 0,871 0,979 0,457 0,366
t de Student 0,73 3,04
M11 Sries X1 X2 X3
Coefs. 0,139 0,038 0,035 0,996 1,898 1,778
t de Student 5,58 0,66 0,49
M12 Sries X1 X2 X4
Coefs. 0,115 0,028 0,074 0,996 1,926 1,805
t de Student 3,55 0,48 0,64
M13 Sries X1 X3 X4
Coefs. 0,104 0,188 0,319 0,998 2,59 2,469
t de Student 7,46 2,47 2,62
M14 Sries X2 X3 X4
Coefs. 0,164 0,300 0,720 0,993 1,304 1,183
t de Student 3,32 1,99 3,81
M15 Sries X1 X2 X3 X4
Coefs. 0,097 0,015 0,199 0,340 0,998 2,408 1,804
t de Student 3,66 0,30 2,20 2,27

1. Nous utilisons les formules de la section IV afin de calculer les critres dinformation de Akaike
et de Schwarz, le logiciel Eviews utilise des formules lgrement diffrentes.

122  CONOMTRIE
Parmi ces 15 quations, laquelle est la meilleure ?
Il faut liminer celles dont un ou plusieurs ratios de Student (sauf en ce qui concer-
ne le terme constant dont nous acceptons quil soit non significativement diffrent
de 0) sont infrieurs au seuil critique (environ 2,30) : M5, M6, M7, M8, M10, M11,
M12, M14, M15.
Parmi les 6 quations restantes, on slectionne celle dont le critre de Akaike et de
Schwarz est le plus faible1, do M13 :

choix : x1 x3 x4

partir de cet exemple, nous prenons la dimension du travail mener2 et les limites,
donc, de cette mthode.

b) Llimination progressive

Estimation du modle complet


partir du modle estim avec 4 variables explicatives, nous retirons la variable dont
le ratio de Student est le plus faible, soit x2 .

Estimation 3 variables
Le modle estim est le modle [M13], toutes les variables sont significatives
(t > 2,30) , la procdure de slection sarrte :
choix : x1 x3 x4

c) La slection progressive

Calcul des coefficients de corrlation entre y et x1 , x2 , x3 , x4


yx1 = 0,997 ; yx2 = 0,983 ; yx3 = 0,975 ; yx4 = 0,988
La premire variable slectionne est x1 .

Estimation des 3 modles deux variables explicatives : x1 et x2 , x1 et x3 , x1 et x4 .


Modles : [M5], [M6] et [M7]. Dans ces trois modles la nouvelle variable explicative
nest jamais significative, la procdure est termine :
choix x1

d) La rgression pas pas

Calcul des coefficients de corrlation entre y et x1 , x2 , x3 , x4 . La premire variable


slectionne est x1 .
Estimation des 3 modles deux variables explicatives : x1 et x2 , x1 et x3 , x1 et x4 ,
dans chacun de ces modles au moins une des variables nest pas significative, la
procdure est donc termine et nous sommes ramens au cas prcdent :
choix x1

1. Nous constatons quil sagit aussi de lquation dont le R 2 est le plus lev.
2. Et pourtant nous navons que quatre variables explicatives candidates.

Multicolinarit et slection du modle optimal  123


e) La rgression par tage

Calcul des coefficients de corrlation entre y et x1 , x2 , x3 , x4 . La premire variable


slectionne est x1 .
Rgression et calcul de e1 = y + 1,24 0,11 x1 (modle [M1])

e1

1 0,123762
2 0,475231
3 0,127120
4 0,236519
5 0,424754
6 0,007913
7 0,419014
8 0,078300
9 0,017027
10 0,279659

Calcul des coefficients de corrlation entre e1 et x1 , x2 , x3 , x4


e1 x1 = 0,000 ; e1 x2 = 0,040 ; e1 x3 = 0,039 ; e1 x4 = 0,048
Le coefficient de corrlation entre e1 et x1 est par construction nul puisque linfor-
mation relative x1 nest plus contenue dans le rsidu (ou encore les vecteurs e1 et x1
sont orthogonaux).
Les autres coefficients de corrlation ne sont pas significativement diffrents de 0 , la
procdure de slection est donc termine :
choix x1

Commentaires :

Seule la procdure de llimination progressive ne fournit pas les mmes rsultats de


slection que les quatre autres procdures. Il apparat au vu de ces rsultats que si lli-
mination progressive ne maximise pas le R 2 , elle permet, en revanche, de slectionner
une information plus abondante en terme de variables explicatives.
Dans la pratique, la procdure la plus utilise est la rgression pas pas, cest cette
dernire qui est disponible dans la plupart des logiciels dconomtrie.

124  CONOMTRIE
5. Problmes particuliers :
la violation
des hypothses

C
e chapitre est consacr aux problmes particuliers lis au non-
respect des hypothses. Nous nous attachons particulirement
deux formes classiques :
en I., lautocorrlation des erreurs ;
en II., lhtroscdasticit.
Ltude de ces deux phnomnes nous permet de dfinir un nouvel esti-
mateur : lestimateur des moindres carrs gnraliss, utilis lorsque la
matrice des variances et covariances de lerreur ne rpond plus aux hypo-
thses classiques, telles que nous les avons supposes ralises jusqu
maintenant.
Pour chacun de ces deux cas, nous prsentons les mthodes dinvestiga-
tion : tests de dtection, consquences et procdures destimation.
Enfin, la section III. est consacre au cas o les variables sont observes
avec erreur.

I. Lautocorrlation des erreurs


A. Prsentation du problme
Jusqu maintenant, nous avons considr que, lors de lestimation des para-
mtres du modle, les hypothses suivantes sont toutes respectes.

Problmes particuliers : la violation des hypothses  125


H1 : le modle est linaire en xt .
H2 : les valeurs xt sont observes sans erreur.
H3 : E(t ) = 0 .
H4 : E(t2 ) = 2 .
H5 : E(t t ) = 0 si t = t .
H6 : Cov (xt , t ) = 0 .
La spcification de la matrice des variances-covariances de lerreur est :

E(1 1 ) E(1 2 ) ... E(1 n )
E(2 1 ) E(2 2 ) ... E(2 n )
= E( ) = =
...
E(n 1 ) E(n 2 ) . . . E(n n )

2 0 0 ... 0
0 2 0 ... 0
=
...
0 0 0 . . . 2

Lorsque lhypothse H5 nest plus vrifie, la matrice E( ) = = 2 I na


plus cette forme particulire (elle nest plus compose de 0 lextrieur de la
premire diagonale, puisque Cov (t , t ) = 0 ) et les estimateurs obtenus par la
mthode des MCO sont sans biais mais ne sont plus variance minimale, en
effet :
a = E{( a a) } = (X X)1 X E( ) X (X X)1 =
a a)(
= (X X)1 (X X)(X X)1
Cest--dire que a est un estimateur dont la premire diagonale de la matri-
ce des variances et covariances est suprieure celle de 2 (X X)1 .
Nous sommes donc amens nous poser trois questions :
Comment dterminer un nouvel estimateur pour a ?
Comment dtecter une ventuelle autocorrlation des erreurs ?
Quelles mthodes destimation doit-on utiliser ?

B. Lestimateur des Moindres Carrs Gnraliss (MCG)


Considrons le modle linaire gnral
Y = X a +
(n, 1) (n, k + 1) (k + 1,1) (n,1)
dans lequel E( ) = = 2 I ( est de dimension n , n ).
Nous dsirons dterminer un estimateur de a qui ait les mmes proprits
que lestimateur des MCO : sans biais, fonction linaire de Y et variance mini-
male. Il est dmontr que cet estimateur est donn par :

126  CONOMTRIE
a = (X 1
 X)
1
(X 1
Y) [1]
1 1
a = (X X) [2]

Cet estimateur est appel estimateur des Moindres Carrs Gnraliss


(MCG) ou encore estimateur de Aitken.
Remarque : lorsque les hypothses classiques sont satisfaites, nous retrou-
vons lestimateur des MCO :
a = (X 1
 X)
1
(X 1
Y) =


1

1 1
= X I X X
I Y = (X X)1 (X Y )
2 2
Dans la pratique, nous ne connaissons pas la matrice , les formules ci-des-
sus ne sont pas utilisables, sauf dans des cas exceptionnels. Il convient donc de
prsenter des procdures destimation oprationnelles.

C. Les causes et la dtection


de lautocorrlation des erreurs
1) Dfinition et causes
Nous sommes en prsence dune autocorrlation des erreurs lorsque les erreurs
sont lies par un processus de reproduction1. Nous pouvons distinguer lauto-
corrlation positive (graphique 1) qui est caractrise par des successions de
rsidus de mme signe, de lautocorrlation ngative (graphique 2) qui est carac-
trise par une alternance positive et ngative des rsidus.

Graphique 1 Autocorrlation positive

1. Nous pouvons parler de processus mmoire , par comparaison des processus purement
alatoires.

Problmes particuliers : la violation des hypothses  127


Graphique 2 Autocorrlation ngative

Lautocorrlation des erreurs peut tre observe pour plusieurs raisons :


labsence dune variable explicative importante dont lexplication rsi-
duelle permettrait de blanchir 1 les erreurs ;
une mauvaise spcification du modle, les relations entre la variable
expliquer et les variables explicatives ne sont pas linaires et sexpriment
sous une autre forme que celle du modle estim (logarithmes, diffrences
premires, etc.) ;
un lissage par moyenne mobile ou une interpolation des donnes cre une
autocorrlation artificielle des erreurs due lusage de ces deux oprateurs.
Lautocorrlation des erreurs se rencontre essentiellement dans les modles
en srie temporelle o linfluence dune erreur due une mauvaise spcifica-
tion dune priode sur lautre est plausible. Dans le cas de modle spcifi en
coupe instantane, nous ne pouvons concevoir une autocorrlation des erreurs
que si les observations ont t pralablement tries en fonction croissante (ou
dcroissante) de la variable expliquer. En effet, la collecte des donnes sef-
fectue de manire alatoire et la succession des valeurs de la variable expliquer
na donc aucune raison de gnrer une autocorrlation des erreurs.

2) Dtection
La dtection dune ventuelle dpendance des erreurs ne peut seffectuer qu
partir de lanalyse des rsidus, en effet eux seuls sont connus.

a) Examen visuel des rsidus


Lanalyse graphique des rsidus permet le plus souvent de dtecter un processus
de reproduction des erreurs lorsque :

1. Ce terme de blanchir vient de la notion de bruit blanc ( White Noise ), qui qualifie des
processus purement alatoires.

128  CONOMTRIE
les rsidus sont pendant plusieurs priodes conscutives soit positifs, soit
ngatifs : autocorrlation positive (graphique 1) ;
les rsidus sont alterns : autocorrlation ngative (graphique 2).
Cependant, le plus souvent, lanalyse graphique est dlicate dinterprtation
car le dessin des rsidus ne prsente pas des caractristiques toujours videntes.

b) Test de Durbin et Watson


Le test de Durbin et Watson (DW ) permet de dtecter une autocorrlation des
erreurs dordre 1 selon la forme :
t = t1 + vt avec vt N (0, v2 )

Le test dhypothses est le suivant :


H0 : = 0
H1 : = 0
(ou < 0 ou > 0 , attention le seuil nest alors pas le mme).
Pour tester lhypothse nulle H0, nous calculons la statistique de Durbin et
Watson :

n
(et et1 )2
t=2
DW = [3]

n
2
e
t
t=1

o et sont les rsidus de lestimation du modle.


De par sa construction, cette statistique varie entre 0 et 4 et nous avons
DW = 2 lorsque  = 0 ( est le observ). Afin de tester lhypothse H0,
Durbin et Watson ont tabul les valeurs critiques de DW au seuil de 5 % en fonc-
tion de la taille de lchantillon n et du nombre de variables explicatives (k ). La
lecture de la table permet de dterminer deux valeurs d1 et d2 comprises entre 0
et 2 qui dlimitent lespace entre 0 et 4 selon le schma 1 :

Schma 1 Interprtation du test de Durbin et Watson

Selon la position du DW empirique dans cet espace, nous pouvons conclure :


d2 < DW < 4 d2 , on accepte lhypothse H0 = 0 ;
0 < DW < d1 , on rejette lhypothse H0 > 0 ;

Problmes particuliers : la violation des hypothses  129


4 d1 < DW < 4 , on rejette lhypothse H0 < 0 ;
d1 < DW < d2 ou 4 d2 < DW < 4 d1 ;
nous sommes dans une zone dindtermination, ou zone de doute, cest--dire
que nous ne pouvons pas conclure1 dans un sens comme dans lautre.
Le graphique 3 illustre ces rgles de dcision.

Graphique 3 Densits de probabilit de d1 et d2

Conditions dutilisation :
le modle doit comporter imprativement un terme constant2 ;
la variable expliquer ne doit pas figurer parmi les variables explicatives (en
tant que variable retarde), il faut alors recourir la statistique h de Durbin
(cf. chapitre 7, I. B.) ou au test de Breusch-Godfrey (cf. ci-dessous) ;
pour les modles en coupe instantane, les observations doivent tre ordon-
nes en fonction des valeurs croissantes ou dcroissantes de la variable
expliquer ou dune variable explicative souponne tre la cause de lauto-
corrlation ;
le nombre dobservations doit tre suprieur ou gal 15.
Le test de Durbin et Watson est un test prsomptif dindpendance des
erreurs du fait quil utilise les rsidus ; de plus, il ne teste quune autocorrla-
tion dordre 13.

c) Test de Breusch-Godfrey4
Ce test, fond sur un test de Fisher de nullit de coefficients ou de Multiplicateur
de Lagrange ( LM test , cf. chapitre 3), permet de tester une autocorrlation

1. Dans la pratique, on accepte lhypothse la plus dsastreuse ! Cependant il serait licite dac-
cepter lhypothse dindpendance.
2. Les tables de DW sont gnralement tabules pour des modles comportant un terme constant,
cependant il existe des tables pour des modles sans terme constant.
3. Cela signifie que le test de Durbin et Watson ne dtecte pas une autocorrlation dordre suprieur
1 , par exemple entre t et t + 4 pour une srie trimestrielle qui ne serait pas dsaisonnalise.
4. Breusch (1978) et Godfrey (1978).

130  CONOMTRIE
dun ordre suprieur 1 et reste valide en prsence de la variable dpendante
dcale en tant que variable explicative. Lide gnrale de ce test rside dans la
recherche dune relation significative entre le rsidu et ce mme rsidu dcal.
Une autocorrlation des erreurs dun ordre p scrit :
t = 1 t1 + 2 t2 + . . . + p t p + vt
Soit le modle gnral erreurs autocorrles dordre p :
yt = a1 x1t + a2 x2t + . . . + ak xkt + a0 + 1 t1 + 2 t2 + . . . + p t p + vt

Ce test est men en trois tapes :


Estimation par les MCO du modle et calcul du rsidu et , puisque les
erreurs sont inconnues, le test porte sur les rsidus.
Estimation par les MCO de lquation intermdiaire :
et = a1 x1t + a2 x2t + . . . + ak xkt + a0 + 1 et1 + 2 et2 + . . . + p et p + vt
Soit n le nombre dobservations disponibles (attention chaque dcalage
entrane la perte dune observation) pour estimer les paramtres du modle et R 2
le coefficient de dtermination. Certains auteurs prconisent, afin de ne pas
perdre dobservations, de mettre 0 les premires valeurs du rsidu dcal. La
diffrence nest perceptible que pour des petits chantillons.
Test dhypothses sur lquation intermdiaire.
Lhypothse H0 dabsence dautocorrlation des erreurs tester est :
H0 : 1 = 2 = . . . = p = 0
Si on refuse lhypothse nulle, alors il existe un risque dautocorrlation des
erreurs lordre p .
Pour mener ce test, nous avons deux possibilits : soit effectuer un test de Fisher
classique de nullit des coefficients i (cf. chapitre 3), soit recourir la statistique
LM qui est distribue comme un 2 p degrs de libert ; si n R 2 > 2 ( p) lu
dans la table au seuil , on rejette lhypothse dindpendance des erreurs.
d) Tests de Box-Pierce et Ljung-Box
Ces tests prsents au chapitre 9 (section I. C.) permettent de tester un ensemble
de coefficients dautocorrlation des rsidus dun ordre gal ou suprieur 1.

Exercice n 1
fichier C5EX1

Tests dindpendance des erreurs


Soit le modle trois variables explicatives :

yt = a0 + a1 x1t + a2 x2t + a3 x3t + t

Problmes particuliers : la violation des hypothses  131


Nous disposons des observations annuelles (tableau 1) sur 20 ans :

Tableau 1 Donnes annuelles (extrait)

Anne y x1 x2 x3
1 87,40 98,60 99,10 108,5
2 97,60 101,20 99,10 110,1

19 110,70 105,30 93,00 108,5
20 127,10 107,60 106,60 111,3

Nous nous proposons de dceler une ventuelle autocorrlation dordre 1 des erreurs,
pour cela on demande :
1) destimer les coefficients du modle ;
2) deffectuer lanalyse graphique des rsidus ;
3) de calculer la statistique de Durbin et Watson et deffectuer le test ;
4) enfin, deffectuer le test de Breusch-Godfrey.

Solution
1) Les rsultats de lestimation partir de Eviews sont les suivants :

Dependent Variable : Y
Included observations : 20

Variable Coefficient Std. Error t-Statistic Prob.


C 242.7951 26.79995 9.059538 0.0000
X1 3.897408 0.400325 9.735616 0.0000
X2 0.404365 0.061351 6.590977 0.0000
X3 0.878886 0.240216 3.658727 0.0021

R-squared 0.938895 Mean dependent var 97.53500


Adjusted R-squared 0.927438 S.D. dependent var 11.83048
S.E. of regression 3.186826 Akaike info criterion 5.332784
Sum squared resid 162.4937 Schwarz criterion 5.531931
Log likelihood 49.32784 F-statistic 81.94784
Durbin-Watson stat 1.053794 Prob(F-statistic) 0.000000

Les trois coefficients des variables explicatives sont significativement diffrents de 0


0,05 0,05
(t16 = 2,12 ), le Fisher empirique est suprieur au Fisher lu (F3,16 = 3,24 ), le modle
semble satisfaisant.

132  CONOMTRIE
2) Eviews fournit directement le graphique des rsidus.

Lanalyse de ce graphique rvle des rsidus qui semblent cycliques, ceci est symp-
tomatique dune autocorrlation positive des rsidus.

3) Les conditions dutilisation du test de Durbin et Watson sont bien respectes : le


modle est spcifi en srie temporelle, le nombre dobservations (n = 20 ) est
suprieur 15 et, enfin, le modle estim comporte un terme constant.
Le calcul de la statistique partir des rsidus est alors :


n
(et et1 )2
t=2 171,23
DW = = = 1,053

n
162,49
et2
t=1

Cette valeur est comparer celles lues dans la table de Durbin et Watson n = 20
et k = 3 , soit d1 = 1,00 et d2 = 1,68 . La valeur DW se situe dans la zone de doute
(d1 < DW < d2 incertitude), cependant proximit immdiate de la zone de rejet de
H0, nous pouvons plutt conclure une autocorrlation positive des rsidus, donc une
prsomption de dpendance des erreurs.
4) Les donnes tant annuelles, nous testons une autocorrlation dordre 2, un ordre
suprieur deux ans ne semble pas justifi. Nous estimons donc le modle :
et = a1 x1t + a2 x2t + a3 x3t + a0 + 1 et1 + 2 et2 + vt
Soit : et = 17,26 + 0,5287x1t 0,0369x2t 0,3149x3t + 0,589 et1 0,497et2
avec : R 2 = 0,33 et n = 18 (car nous avons perdu deux observations du fait du dca-
lage).

Problmes particuliers : la violation des hypothses  133


2
L M = n R 2 = 18 0,33 = 5,94 < 0,05 (2) = 5,99 , nous sommes la limite dac-
ceptation de lhypothse H0 pour un seuil de 5 %.
Nous testons alors un ordre 1, soit lestimation suivante :
et = 11,82 + 0,087 x1t 0,0158 x2t 0,044 x3t + 0,507 et1
2 2
avec : R = 0,196 et n = 19 , do L M = 19 0,196 = 3,72 < 0,05 (1) = 3,84 .
Nous sommes, l encore, la limite dacceptation (probabilit critique c = 5,37 %)
de lhypothse H0, compte tenu de toutes ces informations (test de Durbin-Watson, test
de Breusch-Godfrey), nous sommes enclins accepter lhypothse dautocorrlation des
erreurs.
Les estimateurs que nous avons trouvs sont sans biais mais non variance mini-
male, il convient donc de dterminer une procdure adquate destimation.
Il est noter que tous les commentaires de la question 1 concernant la validit sta-
tistique du modle sont maintenant caducs.

D. Les procdures destimation en cas


dautocorrlation des erreurs
1) Principes gnraux
Si nous retenons lhypothse dune autocorrlation des erreurs dordre 1, le
modle linaire scrit :

Y = Xa +
avec
t = t1 + vt || < 1 [4]
(processus autorgressif dordre 1 : AR(1) )1 o vt N (0; v2 ) et E(vt vt ) = 0
pour t = t .
En procdant par substitution successive de [4], nous obtenons :
t = ( t2 + vt1 ) + vt = 2 t2 + ( vt1 + vt )
[5]
t = vt + vt1 + 2 vt2 + 3 vt3 + . . .

Ce processus tend vers 0 puisque || < 1 .


Nous allons tudier les proprits de t .

1. On note les processus autorgressifs par : AR( p) , o p est lordre du processus autorgressif.
Le chapitre 9 est consacr ltude gnrale de ce type de processus.

134  CONOMTRIE
E(t ) = E(t1 + vt ) = E(t1 ) + E(vt ) = 0
E(t2 ) = E(t1 + vt )2 = 2 E(t1
2
) + E(vt2 ) car vt est indpendant de t .
2
La variance de t tant homoscdastique, nous avons : E(t2 ) = E(t1 ) = 2 .
v2
Soit : 2 (1 2 ) = v2 2 = [6]
(1 2 )

Cov(t ,t+1 ) = E(t ,t+1 ) = E(t ,(t + vt+1 )) = 2

Cov(t ,t+2 ) = E(t ,t+2 ) = E(t ,(t+1 + vt+2 )) = E(t ,t+1 ) = 2 2



i v2
Cov(t ,t+i ) = E(t ,t+i ) = i 2 =
(1 2 )
La matrice des variances-covariances de lerreur dans ce cas est alors :


1 2 . . . n1
2
v 2 1 . . . n2

= E( ) = 1 . . . n3 avec = 1
1 2 . . .
n1 n2 n3 ... 1

Lestimateur des MCG est gal daprs [1] :

a = (X 1
 X)
1
(X 1
Y)

o

1 0 0 ... ... 0
1 + 2 0 ... ... 0
1
0 1 + 2 ... ...

0
1
= 2
v . . .

0 ... . . . 1 + 2
0 ... 0 1

Cependant, nous ne connaissons ni le terme , ni la variance v2 ; nous allons


donc chercher une transformation matricielle M telle que le modle
MY = M Xa + M ait ses erreurs indpendantes et homoscdastiques.
Soit :
E(M(M) ) = E(M M ) = M E( ) M = M M = v2 I
Dans ce cas, on peut dterminer lestimateur BLUE de a par la mthode des
MCO :
a = ((M X) M X)1 (M X) MY = (X M M X)1 X M MY
 [7]

Problmes particuliers : la violation des hypothses  135


En identifiant terme terme [1] et [7] on obtient :
M M = 1 2 1
= v puisque si lgalit [1] = [7] est vrifie pour
1
M M = , elle lest aussi pour 1

quel que soit .

La matrice
1 0 0 ... 0
0 1 0 ... 0
M
= 0 0 1 0
(n 1, n)
...


0 0 0 ... 1
remplit cette condition puisque :

2 0 0 ... 0
1 + 2 0 ... 0

0 1 + 2 ... 0
M M =
...

0 ... . . . 1 + 2
0 ... 0 1
et v2 1
sont identiques au premier terme prs 2 au lieu de 1 .
Ainsi, nous pouvons substituer la mthode des MCG, la mthode des MCO
(si n est suffisamment grand) applique au modle linaire MY = M Xa + M
qui nest autre que le modle initial dans lequel les variables sont transformes
par un passage aux quasi-diffrences premires1. En effet :

y2 y1 xk2 xk1
y y2 xk3 xk2
MY = 3 et M X k =
... ...
yn yn1 xkn xkn1
Cas particulier : lorsquil y a autocorrlation parfaite ( = 1) , nous
sommes amens appliquer la mthode des MCO sur le modle en diffrences
premires.
Nous allons montrer partir dun exemple le bien-fond de la transformation
en quasi-diffrences.
Soit le modle deux variables explicatives :
yt = a0 + a1 x1t + a2 x2t + t [8]
avec t = t1 + vt avec || < 1 (vt N (0; v2 ) et E(vt vt ) = 0 pour t = t ) .
Le modle [8] peut scrire en t 1 :
yt1 = a0 + a1 x1t1 + a2 x2t1 + t1 [9]
Le calcul de [8] [9] nous donne :
yt yt1 = a0 (1 ) + a1 (x1t x1t1 ) + a2 (x2t x2t1 ) + (t t1 )
dyt = b0 + a1 dx1t + a2 dx2t + vt
1. Cette transformation
entrane la
perte dune observation, toutefois on peut remplacer la premire
observation par 1 2 y1 et 1 2 xk1 .

136  CONOMTRIE
Le terme alatoire vt rpond aux hypothses dapplication de la mthode des
MCO, nous pouvons donc utiliser les procdures destimation des MCO sur les
variables transformes. Les estimations des coefficients calcules partir du
modle en diffrence sinterprtent directement comme tant les coefficients du
modle initial, sauf en ce qui concerne le terme constant :
a0 = b0 /(1 )
Si nous connaissons la technique destimation permettant de lever lautocorr-
lation dordre 1, nous pouvons lappliquer de manire oprationnelle, il convient
destimer le paramtre . Cest lobjet des procdures destimations suivantes.

2) Procdures destimation de

Les procdures suivantes ne sont valides que si : t = t1 + vt .

a) Estimation directe de partir des rsidus de la rgression


sur le modle initial
tape 1 : estimation de de deux manires.
par rgression directe de et sur et1

n
et et1
t=2
=
(e = 0) [10]
et2
t

ou partir de la statistique de Durbin et Watson


DW
 1
[11]
2
En effet, le numrateur de la statistique de Durbin et Watson est gal :

n
n
n
n
(et et1 )2 = et2 + 2
et1 2 et et1
t=2 t=2 t=2 t=2

En divisant par le dnominateur de cette mme statistique et sachant que


n
et et1
t=2 e2 + e2
et et1 = , nous avons DW = 2 2et et1 1n n ,
n
et2 et2
t=1 t=1
2 2
e +e
1 n
si n est grand, tend vers 0.
n
2
et
t=1

Problmes particuliers : la violation des hypothses  137


tape 2 : transformation des variables et rgressions1 sur les quasi-diffrences :
yt1 = b0 + a1 (x1t
yt x1t1 ) + . . . + ak (xkt
xkt1 ) + vt
Les paramtres estims par MCO sont alors : 
a1 , . . . a0 = 
ak et  ) .
b0 /(1

b) Estimation itrative du vecteur a et de (mthode de Cochrane-Orcutt)


tape 1 : initialisation de .
Par une technique destimation directe par rgression [10], on fixe une pre-
mire valeur soit :
0 =

tape 2 : rgression sur les quasi-diffrences :
0 yt1 = b0 + a1 (x1t
yt 0 x1t1 ) + . . . + ak (xkt
0 xkt1 + vt
Les paramtres estims sont alors : 
a1 , . . . a0 = 
ak et  0 ) .
b0 /(1
tape 3 : restimation de .
partir des nouveaux rsidus destimation (et1 ) nous recalculons une nou-
1 :
velle valeur de soit
et(1) = yt 
a0 a1 x 1t . . . 
ak x kt
n
(1)
et(1) et1
t=2
1 = (1) 2

(et )
t

tape 4 : rgression sur les quasi-diffrences :


1 yt1 = b0 + a1 (x1t
yt 1 x1t1 ) + . . . + ak (xkt
1 xkt1 ) + vt
Puis nous calculons un nouveau rsidu (et(2) ) partir de la nouvelle estima-
tion des coefficients, ce qui nous permet dobtenir un 2 .
Et ainsi de suite jusqu la stabilit des coefficients ak estims (en gnral 3
ou 4 itrations).

c) Mthode du balayage ( Hildreth-Lu )


tape 1 : dtermination du type dautocorrlation.
partir de la statistique de Durbin et Watson, on dtermine une autocorrla-
tion positive ou ngative ( < 0 ou > 0 ).
tape 2 : rgression pour lintervalle des valeurs possibles de .
Par exemple, on sait que [0 ; 1] , nous rgressons pour toutes les valeurs
successives de = {0,1 ; 0,2 ; . . . 0,9 ; 1} sur lintervalle [0 ; 1] avec un pas fix
ici gal 0,1 , lquation :
i yt1 = b0 + a1 (x1t
yt i x1t1 ) + . . . + ak (xkt
i xkt1 ) + vit

1. Nous perdrons une observation lors de la transformation en diffrences.

138  CONOMTRIE
et nous
retenons

la valeur de qui minimise la somme des carrs des rsi-

dus vit2 .

t

Il est possible daffiner la valeur estime de en remployant la mme pro-


cdure sur un intervalle restreint et avec un pas plus fin (par exemple 0,01 ).
Il est noter que cette technique est optimale selon le critre des moindres
carrs puisque lon retient le qui minimise la somme des carrs des rsidus.

Exercice n 2
fichier C5EX1

Procdures destimation en cas dautocorrlation des erreurs


dordre 1
En reprenant le modle de lexercice 1 (et les donnes du tableau 1) dans lequel nous
avons dtect une autocorrlation des erreurs, on demande den corriger les effets lai-
de des quatre procdures prsentes. On comparera les rsultats.

Solution

La solution de cet exercice est ralise laide du programme Eviews  C5EX2.PRG

a) Estimation directe de partir des rsidus de la rgression sur le modle initial

tape 1 : rgression, calcul des rsidus et estimation de .


Les rsultats de la rgression ainsi que le calcul des rsidus ont dj t prsents lors
de la rsolution de lexercice 1.
Premire possibilit : par rgression de et sur et1

Rsultats

Dependent Variable : e
Included observations : 19 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 0.065400 0.643073 0.101700 0.9202
e( 1) 0.464845 0.241301 1.926413 0.0709

1 = 0,46

tape 2 : transformations des variables et rgression sur les quasi-diffrences

Calcul des quasi-diffrences :

Problmes particuliers : la violation des hypothses  139


genr dy = y rau1 y(1)
genr dx1 = x1 rau1 x1(1)
genr dx2 = x2 rau1 x2(1)
genr dx3 = x3 rau1 x3(1)

Rgression

Dependent Variable : DY
Included observations : 19 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 135.5132 18.38346 7.371473 0.0000
DX1 3.593675 0.583072 6.163342 0.0000
DX2 0.439019 0.071365 6.151765 0.0000
DX3 0.514596 0.337097 1.526550 0.1477

Calcul du terme constant :


a0 = 
 1 ) = 135,51/(1 0,46) = 253,22
b0 /(1

Deuxime possibilit : estimation de partir de la statistique de Durbin et Watson


DW 1,053
2 = 1
=1 = 0,473
2 2
tape 2 : transformations des variables et rgression sur les quasi-diffrences.
Le calcul est identique au prcdent avec la nouvelle valeur de .

Dependent Variable : DY
Included observations : 19 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 133.4095 18.14245 7.353445 0.0000
DX1 3.580221 0.583673 6.133954 0.0000
DX2 0.440490 0.071400 6.169361 0.0000
DX3 0.503033 0.336991 1.492721 0.1562

Calcul du terme constant :


a0 = 
 2 ) = 133,40/(1 0,47) = 253,20
b0 /(1
b) Estimation itrative du vecteur a et de (mthode de Cochrane-Orcutt)

140  CONOMTRIE
Estimation dun modle autorgressif dordre 1
LS Y C X1 X2 X3 AR(1)

Dependent Variable : Y
Included observations : 19 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 250.3442 38.62520 6.481369 0.0000
X1 3.142385 0.573681 5.477582 0.0001
X2 0.497558 0.069854 7.122783 0.0000
X3 0.144028 0.306106 0.470517 0.6452
AR(1) 0.811373 0.336991 5.048921 0.0002
Durbin-Watson stat = 2.149

3 = 0,81

Il est noter que le logiciel calcule directement la valeur de (assortie de son cart
type) ainsi que lestimation du terme constant du modle initial.
c) Mthode du balayage ( Hildreth-Lu )
Les rsultats sont identiques ceux de la mthode de Cochrane-Orcutt.

Tableau 2 Rcapitulation des rsultats

MTHODES
Paramtres a a b c
Rgression DW C.O. H.L.

0,464 0,473 0,81 0,81
(t) (1,92) (5.04) (5.04)
a0 253,22 253,20 250,3 250,3
(t) (6,49) (6,49)
a1 3,59 3,58 3,14 3,14
(t) (6,16) (6,13) (5,48) (5,48)
a2 0,44 0,44 0,49 0,49
(t) (6,15) (6,16) (7,12) (7,12)
a3 0,51 0,50 0,14 0,14
(t) (1,52) (1,49) (0,47) (0,47)
R2 0,91 0,91 0,96 0,96

Les coefficients de rgression en italique ne sont pas significativement diffrents de 0


(pour un seuil de 5 %).
la lecture des rsultats (tableau 2), nous constatons que :
le coefficient de rgression a3 nest jamais significativement diffrent de 0 , alors
que, dans le modle initial, erreurs autocorrles, tous les coefficients sont signi-
ficatifs ;

Problmes particuliers : la violation des hypothses  141


les deux mthodes destimation directe des rsidus aboutissent des rsultats qua-
siment identiques, il subsiste nanmoins une autocorrlation des erreurs ;
les deux mthodes itratives (C.O. et H.L.) donnent des rsultats identiques, mais
assez diffrents des deux mthodes prcdentes.
Laquelle choisir ? Cette question est sans rponse dfinitive, la plus rpandue est certai-
nement la mthode de Cochrane-Orcutt. Les deux procdures destimation directe sont
plus un artifice de calcul quune mthode proprement dite ; la technique du balayage
aboutit des rsultats similaires celle de Cochrane-Orcutt.
Nous sommes dans le domaine de lestimation statistique donc avec des marges der-
reurs qui peuvent parfois dpasser le raffinement de telle ou telle mthode, cest pour-
quoi nous pouvons recommander dutiliser la technique la plus simple mettre en uvre
donc celle directement utilise par le logiciel habituel.
Il convient de plus de noter que ces mthodes particulires destimation constituent
une rponse technique un problme le plus souvent de spcifications conomiques.
Nous recommandons, donc, plutt que dappliquer immdiatement ces procdures, de
rflchir une spcification plus adapte du modle.

II. Lhtroscdasticit
A. Prsentation du problme
Soit le modle Y = Xa + pour lequel lhypothse H4 nest pas vrifie, la
matrice des erreurs est alors :


E(1 1 ) E(1 2 ) ... E(1 n )
E(2 1 ) E(2 2 ) ... E(2 n )
= E( ) = =
...
E(n 1 ) E(n 2 ) . . . E(n n )


12 0 0 ... 0
0 22 0 ... 0
=
...
0 0 0 . . . n2

Les variances des erreurs ne sont plus constantes sur la premire diagonale.
Ce problme se rencontre plus frquemment pour les modles spcifis en

142  CONOMTRIE
coupe instantane ou bien lorsque les observations sont reprsentatives de
moyennes. La variance de lerreur est alors lie aux valeurs de la variable expli-
cative comme lillustrent les graphiques 4 6.

Graphique 4 Modle homoscdastique

Graphique 5 La variance de lerreur crot avec la variable explicative

Graphique 6 La variance de lerreur dcrot avec la variable explicative

Les consquences de lhtroscdasticit sont identiques celles de lauto-


corrlation des erreurs, cest--dire :
estimateur sans biais ;
lestimateur de MCO nest plus variance minimale.

Problmes particuliers : la violation des hypothses  143


Les causes de lhtroscdasticit sont multiples :
comme nous lavons dj cit, lorsque les observations reprsentent des
moyennes calcules sur des chantillons de taille diffrente ;
un autre cas rsulte de la rptition dune mme valeur de la variable
expliquer pour des valeurs diffrentes dune variable explicative, par
exemple lors de regroupements en tranches (de salaires, deffectifs) ;
lorsque les erreurs sont lies aux valeurs prises par une variable explicati-
ve, dans un modle en coupe instantane la variance de la consommation
crot, par exemple, avec le revenu disponible, etc.
Dans le cas dune htroscdasticit rvle, le test de Chow (cf. chapitre 3,
section B.) est biais, nous risquons alors de rejeter tort1 lhypothse H0 de la
stabilit des coefficients du modle. Si, lors dun test de Chow, nous sommes
amens accepter lhypothse H0, le problme ne se pose donc pas ; en
revanche, dans le cas du rejet de H0, il convient pralablement de corriger
lhtroscdasticit et deffectuer le test de Chow sur le modle transform.

B. Correction de lhtroscdasticit
Lestimateur BLUE du modle htroscdastique est alors celui des MCG :
a = (X 1
 X)
1
(X 1
Y)

avec a = (X 1
X)
1

Il nexiste pas une mthodologie unique de correction, la diffrence de la


correction de lautocorrlation dordre 1 des erreurs, mais des mthodes que
lon applique en fonction de la cause prsume de lhtroscdasticit. La rgle
gnrale consiste dterminer une transformation2 concernant les donnes de
la variable expliquer et des variables explicatives afin de se ramener un
modle variances constantes (homoscdastique). Les exercices 3 et 4 illustrent
les principales mthodes.

Exercice n 3
fichier C5EX3
Correction de lhtroscdasticit lorsque les donnes reprsentent
des moyennes
Afin de tester lefficacit dun nouveau fortifiant sur la croissance des poulets, un le-
veur a retenu 40 poulets rpartis en cinq groupes de tailles ingales et leur a administr
des doses diffrentes de ce fortifiant. Les rsultats sont consigns sur le tableau 3.

1. Cest--dire trop souvent.


2. Cette transformation consiste dterminer un vecteur de pondration pour chaque observation,
do le nom de rgression pondre.

144  CONOMTRIE
Tableau 3 Relation entre le poids des poulets
et la dose de fortifiant

Groupe Nombre Poids moyen Dose moyenne


i de poulets des poulets administre
ni Yi Xi
1 12 1,7 5,8
2 8 1,9 6,4
3 6 1,2 4,8
4 9 2,3 6,9
5 5 1,8 6,2

On demande destimer les coefficients de la relation :


Yi = a0 + a1 X i + i
relation entre le poids de chacun des poulets Yi et la dose individuelle reue X i et de tes-
ter si le coefficient a1 est significativement diffrent de 0.

Solution
Estimation des coefficients
Nous ne connaissons que la relation entre les moyennes, soit : Y i = a0 + a1 X i + i
Les variables reprsentent des moyennes, donc la variance de lerreur i
2
est gale : Var(i ) = .
ni
1 + 2 + . . . + n 1
En effet, Var(i ) = Var( ) = 2 (Var(1 ) + Var(2 ) + . . . + Var(n ))
ni ni
1 2
= 2
(n i 2 ) = (les covariances Cov(i , j ) = 0,i =
/ j ).
ni ni
La matrice des variances et covariances des erreurs est donc la forme :
1
n
1
1

n2


2 1
2
Var(i ) = = V =
n3

1

n
4
1
n5
Puisque le modle est htroscdastique, nous allons utiliser lestimateur des MCG :
1 1
a = (X X)1 (X Y ) = (X V 1 X)1 (X V 1 Y )


n1
n2   
ni ni X i
V 1 1
= n3 do (X V X) =  n X  2
ni X i
n4 i i

n5

Problmes particuliers : la violation des hypothses  145


 
ni Y i
et (X V 1 Y ) = 
ni X i Y i
Le tableau de calcul 4 permet dobtenir les rsultats dont nous avons besoin.
Tableau 4 Exemple de calcul en cas dhtroscdasticit
2 2
. Yi Xi ni ni Y i ni X i ni X i ni Y i ni X i Y i
1,7 5,8 12 20,4 69,6 403,68 34,68 118,32
1,9 6,4 8 15,2 51,2 327,68 28,88 97,28
1,2 4,8 6 7,2 28,8 138,24 8,64 34,56
2,3 6,9 9 20,7 62,1 428,49 47,61 142,83
1,8 6,2 5 9,0 31,0 192,20 16,20 55,8
Total 40 72,5 242,7 1 490,29 136,01 448,79
1 
40 242,7 2,1040 0,3426
. (X V 1 X)1 = =
242,7 1 490,29 0,3426 0,05647
 
72,5 1,23
et (X V 1 Y) = soit a=
448,79 0,502
Nous pouvons remarquer que la matrice M telle que V 1 = M M est gale :

n1

n2

M = n 3



n4

n5
Lestimateur des MCG est alors gal :
a = [(M X) (M X)]1 [(M X) (MY )] = (X M M X)1 (X M MY )

Nous aurions donc trouv les mmes rsultats en employant la technique de la
rgression pondre, cest--dire par multiplication du vecteur des observations de la
variable expliquer (Y ) et du vecteur de la variable explicative (X) par la matrice M

(dont la forme gnrale est n i ). La mthode des MCO applique aux donnes trans-
formes (y compris le terme constant) suivantes conduit donc des rsultats identiques :

Yi : 1,7 12 1,9 8 1,2 6 2,3 9 1,8 5

X i : 5,8 12 6,4 8 4,8 6 6,9 9 6,2 5

Ui : 1 12 1 8 1 6 1 9 1 5
2
Nous remarquons que : Var( n i i ) = , lhtroscdasticit est donc leve.
Estimation de la variance de lerreur
Un estimateur sans biais de 2 peut tre dduit de lapplication des MCO la rela-
tion prcdente :
e e (MY M X a ) (MY M Xa)
2 =
 =
nk1 nk1
(Y X a ) M M(Y X
a)
=
nk1

146  CONOMTRIE
a ) V 1 (Y X
(Y X a)
2 =

nk1

Nous connaissons :

0,0161 12
0,0885 8

Y X a = 1
0,0238 ; V = 6

0,0575 9
0,0869 5
Lestimation de la variance de lerreur est donne par :
(Y X a) V 1 (Y X a) 0,1369
2 = = = 0,0445
nk1 511
(n est le nombre dobservations servant estimer les paramtres, ici n = 5 ).
Estimation de la variance des coefficients
La matrice des variances et covariances des coefficients est :

 2 1 1 2,1040 0,3426
a =  (X V X) = 0,0445
0,3426 0,05647
soit
2 2

a0 = 0,0445 2,1040 = 0,094 et 
a1 = 0,0445 0,0565 = 0,00251
Le coefficient a1 est-il significativement diffrent de 0 ?
t = 0,502/0,05 = 10,04 > t30,05 = 3,18 , nous rejetons lhypothse H0, le fortifiant
a une influence positive sur le poids des poulets.

C. Tests de dtection de lhtroscdasticit


Nous allons prsenter, partir dun exercice, diffrents tests permettant de
dtecter une htroscdasticit.

Exercice n 4
fichier C5EX4
Tests de dtection dune htroscdasticit et correction
Un directeur de la production dune unit de construction automobile dsire dter-
miner une relation entre le nombre de dfauts constats (Yi ) et le temps de vrification
(X i ) dune automobile, selon le modle suivant :

Yi = a0 + a1 X i + u i
Pour ce faire, il procde un test sur 30 vhicules quil regroupe en 6 classes de 5
voitures en demandant chaque chef datelier de passer un nombre dheures de vrifica-
tion fix.
Les rsultats sont consigns dans le tableau 5.

Problmes particuliers : la violation des hypothses  147


Tableau 5 Relation entre temps de vrification
et nombre de dfauts

Nombre de dfauts Yi Temps passs


en heures X i
4 5 6 8 8 4
6 11 13 15 17 3,5
9 13 14 15 21 2
6 13 16 23 26 1,5
11 15 17 22 34 1
7 21 23 28 38 0,5

On demande de procder aux tests de dtection dhtroscdasticit suivants :


1) test dgalit des variances ;
2) test de Goldfeld-Quandt ;
3) test de Gleisjer ;
4) test de White ;
5) puis, en cas dhtroscdasticit, den corriger les effets.

Solution

1) Test dgalit des variances


Les donnes sont constitues de m = 6 groupes dobservations. Nous allons tester
lgalit des variances1, soit lhypothse :
H0 : 12 = 22 = . . . = 62
tape 1 : calcul de la variance empirique pour chaque groupe.


ni
5
(Yi j Y i )2 (Yi j Y i )2
j=1 j=1
i2 =
 =
ni 1 4

tape 2 : calcul de la variance totale.



m
m
i2
(n i 1) i2
vi 
i=1 i=1
T2 =
 =
m
v
(n i 1)
i=1


m
m
avec vi = n i 1 et v = vi = (n i 1)
i=1 i=1

tape 3 : calcul du 2 empirique et test.

1. Kendall M.G. et Stuart A., pages 234-236, 1961.

148  CONOMTRIE

m
T2
La quantit Q = v Ln  i2 suit une loi du 2 m 1 degrs de
vi Ln 
i=1

libert (Ln = logarithme nprien). Cependant, lestimation peut tre amliore en divi-
sant Q par une constante dchelle C :
m

1 1 1 Q
C =1+ ainsi Q = 2 (m 1)
3(m 1) i=1 vi v C
2
Si Q > 0,95 (m 1) , lhypothse H0 est rejete, le modle est htroscdastique.
Le tableau 6 illustre les tapes de calcul.

Tableau 6 tapes de calcul pour un test dgalit de variances

. i Yi Xi i2
 i2 )
vi Ln (
1 4 5 6 8 8 4 3,2 4,65
2 6 11 13 15 17 3,5 17,8 11,51
3 9 13 14 15 21 2 18,8 11,73
4 6 13 16 23 26 1,5 63,7 16,61
5 11 15 17 22 34 1 78,7 17,46
6 7 21 23 28 38 0,5 127,3 19,38
T2 = 51,58333


Q = 13,26 ; C = 1,097 ; 2
Q = 12,09 > 0,95 (m 1) = 11,07 , le modle est
donc htroscdastique.
2) Test de Goldfeld-Quandt1
Ce test nest valable que si lune des variables est la cause de lhtroscdasticit et
que le nombre dobservations est important. Il se compose de trois tapes.
tape 1 : ordonner les observations en fonction des valeurs croissantes ou dcrois-
santes de la variable expliquer ou bien de la variable explicative souponne tre la
source de lhtroscdasticit.
Cette opration est dj effectue puisque le nombre de dfauts constats est class
(tableau 7) en fonction du nombre dheures dcroissant de vrification.

Tableau 7 Classement des observations en fonction


du temps de vrification (extrait des donnes)
. j Yj Xj
1 4 4
2 5 4

29 28 0,5
30 38 0,5

1. Goldfeld S.M. et Quandt R.E., pages 539-547, 1965.

Problmes particuliers : la violation des hypothses  149


tape 2 : omettre C observations centrales.
Nous choisissons arbitrairement C observations situes au centre de lchantillon.
Ces C observations sont exclues de lanalyse. La valeur de C doit tre approximative-
ment gale au quart du nombre dobservations totales.
C = partie entire de (30/4) = 8
tape 3 : rgressions sur les deux sous-chantillons et test.

Premier chantillon : j = 1,11 Deuxime chantillon : j = 20,30

Y j = 16,93 2,13 X j + e j Y j = 9,84 1,32 X j + e j


(2,31) (9,23)
n = 11 n = 11
2
R = 0,08 R 2 = 0,002

SC R1 = e2j = 164,66 SC R2 = e2j = 872,02
j j

(.) = t de Student (.) = t de Student


ddl1 = n 2 = 9 ddl2 = n 2 = 9

Sous lhypothse H0 dhomoscdasticit, le rapport1 :

SC R 2 /ddl2 872,02/9
F = = = 5,29 suit une loi de Fisher ddl2 et ddl1 degrs
SC R 1 /ddl1 164,66/9
de libert.
0,05
F = 5,29 > F9,9 = 3,18, lhypothse dhomoscdasticit H0 est rejete, le mo-
dle est donc htroscdastique.

3) Test de Gleisjer2
Le test de Gleisjer permet non seulement de dceler une ventuelle htroscdastici-
t, mais aussi didentifier la forme que revt cette htroscdasticit. Ce test est fond sur
la relation entre le rsidu de lestimation par les MCO effectue sur le modle de base et
la variable explicative suppose tre la cause de lhtroscdasticit.
tape 1 : rgression par les MCO de Y j en X j ( j = 1,30)

Y j = 24,09 4,12 X j + e j
(4,19)
n = 30
R 2 = 0,38
Le vecteur des rsidus e j est alors connu.

1. La valeur la plus leve des deux SC R se situe toujours au numrateur.


2. Gleisjer H., pages 316-323, 1969.

150  CONOMTRIE
tape 2 : rgression de la valeur absolue |e j | des rsidus sur X j .
Gleisjer suggre de tester diffrentes formes de relation, par exemple :
Forme gnrale Estimation (J = 1,30)
I |e j | = a0 + a1 X j + v j |e j | = 8,09 1,46 X j + v j
n = 30 (2,55)
Htroscdasticit de type : R 2 = 0,19
ej2 = k 2 X 2j (k tant une constante quelconque)

En effet, si nous avons une relation entre la valeur absolue du rsidu (ej) et la variable
Xj, cela signifie que nous avons de fait une relation entre le rsidu au carr et la variable
Xj au carr.
1/2 1/2
II |e j | = a0 + a1 X j + vj |e j | = 10,7 4,15 X j + v j
(2,60)
n = 30
ej2 = k 2 X j

R 2 = 0,19

III |e j | = a0 + a1 X 1
j + vj |e j | = 2,79 + 2,86 X 1
j + v j

(2,30)
n = 30
ej2
 =k 2
X 2
j
R 2 = 0,16
Lhypothse dhomoscdasticit est rejete si le coefficient a1 dune des spcifications
est significativement diffrent de 0 . Les trois t de Student empiriques sont suprieurs
1,96, lhtroscdasticit est donc dtecte. La forme retenue est la II ; en effet, le coeffi-
cient est affect du ratio de Student le plus lev (toutefois, la forme I est trs proche).

4) Test de White1
Le test de White est trs proche du prcdent, il est fond sur une relation significa-
tive entre le carr du rsidu et une ou plusieurs variables explicatives en niveau et au carr
au sein dune mme quation de rgression2 :
et2 = a1 x1t + b1 x1t2 + a2 x2t + b2 x2t2 + . . . + ak xkt + bk xkt2 + a0 + vt

Soit n le nombre dobservations disponibles pour estimer les paramtres du modle et


R 2 le coefficient de dtermination. Si lun de ces coefficients de rgression est significa-
tivement diffrent de 0 , alors on accepte lhypothse dhtroscdasticit. Nous pouvons
procder ce test soit laide dun test de Fisher classique de nullit de coefficients :

H0 : a1 = b1 = a2 = b2 = . . . = ak = bk = 0

Si on refuse lhypothse nulle, alors il existe un risque dhtroscdasticit.


Soit recourir la statistique L M qui est distribue comme un 2 p = 2 k degrs
de libert (autant que de coefficients que nous estimons, hormis le terme constant), si
n R 2 > 2 ( p) lu dans la table au seuil , on rejette lhypothse dhomoscdasticit
des erreurs.

1. White, 1980.
2. En cas de doute sur une influence croise de deux variables comme tant la source de lhtro-
scdasticit, on peut ajouter au modle estimer des termes croiss, par exemple : x1t x2t .

Problmes particuliers : la violation des hypothses  151


Soit ici estimer le modle : e2j = a1 x j + b1 x j2 + a0 + v j

e2j = 78,58 x j + 11,98 x j2 + 136,02 + 


vj

avec n = 30 ; R 2 = 0,226 ; F = 3,956

Test de Fisher F = 3,956 > F20,05


; 27 = 3,35.

2
Test L M n R 2 = 30 0,22 = 6,78 > 0,05 (2) = 5,99 .
Nous sommes, dans les deux cas, amens rejeter lhypothse H0 pour un seuil de 5 %.
Le modle est donc htroscdastique.

5) Correction de lhtroscdasticit
Les quatre tests sont concordants : le modle est htroscdastique, il convient donc
den corriger les effets.
ej2 = k 2 X 2j ; lapplication de
Supposons, par exemple, que lon retienne la forme I : 
la rgression pondre par le facteur 1/ X j conduit un modle homoscdastique :

2
Yj a0 ej ej 1 2
= + a1 + do E =  = k2
Xj Xj Xj Xj X 2j ej

ej2 = k 2 X j . Pour
Or, le test de Gleisjer a mis en vidence une relation (II) du type : 
lever lhtroscdasticit, dans
ce cas, nous employons la rgression pondre sur les
donnes brutes divises par X j . En effet :

Yj a0 Xj ej ej 2 1 2
= + a1 + do E = = k2

Xj Xj Xj Xj Xj X j ej

En gnral, lorsque nous avons dtect une htroscdasticit de type :


ej2 = k 2 f (X j ) , il convient de diviser les donnes par f (X j ) afin de se ramener un

modle homoscdastique.
Dans le cadre de notre exercice, les donnes sont alors transformes (tableau 8).

Tableau 8 Transformation pour une rgression pondre


(extrait des donnes)

Yj 1 Xj
. Zj = X1 j = X2 j =
Xj Xj Xj

2,00 0,50 2,00


2,50 0,50 2,00

39,60 1,41 0,71
53,74 1,41 0,71

152  CONOMTRIE
Le modle estim par les MCO est le suivant :
Z j = b1 X 1 j + b2 X 2 j + j , j rpond aux hypothses classiques. Il est noter lab-
sence du terme constant. Les rsultats fournis par Eviews sont :

a0 = 
Les coefficients du modle initial sont  a1 = 
b1 = 24,96 et  b2 = 4,53. Le
modle estim1 est donc :
Y j = 24,96 4,53 X j + e j
(2,94)
n = 30
(.) = t de Student
Il existe bien une influence significative du temps de vrification sur le nombre de
dfauts constats, chaque heure de vrification permet de supprimer en moyenne
4,5 dfauts.

D. Autre test dhtroscdasticit : le test ARCH


Les modles de type ARCH2 ( AutoRegressive Conditional Heteroscedasti-
city ) permettent de modliser des chroniques (la plupart du temps financires3)
qui ont une volatilit (ou variance ou variabilit) instantane qui dpend du pass.
Il est ainsi possible dlaborer une prvision dynamique de la chronique en
termes de moyenne et de variance. Le test est fond soit sur un test de Fisher clas-
sique, soit sur le test du multiplicateur de Lagrange (L M) .
De manire pratique, on procde de la manire suivante :
1re tape : calcul de et le rsidu du modle de rgression ;

1. Ce modle est comparer celui estim sur les donnes brutes (premier modle du test de
Gleisjer).
Le coefficient de dtermination nest pas prsent, car, dans tout modle estim sans terme
constant, il nest pas interprtable.
2. Engle, 1982.
3. En effet, les sries financires sont particulirement concernes par les modles ARCH, car on
constate des priodes de forte spculation (variabilit leve) suivie de priodes daccalmie (varia-
bilit faible).

Problmes particuliers : la violation des hypothses  153


2e tape : calcul des et2 ;
3e tape : rgression autorgressive des rsidus sur p retards (rsidu dcal)

p
2
o seuls les retards significatifs sont conservs, et2 = 0 + i eti ;
i=1
Soit tester lhypothse H0 : 1 = 2 = = p = 0 .
4e tape : calcul de la statistique du multiplicateur Lagrange, L M = n R 2 avec :
n = nombre dobservations servant au calcul de la rgression de ltape 3,
R 2 = coefficient de dtermination de ltape 3.
Si L M > 2 ( p) p degrs de libert lu dans la table un seuil fix (en
gnral 0,05 ), on rejette H0 ; on considre que le processus est justifiable dun
modle ARCH( p) .
Cest le test de significativit des coefficients i de la rgression et2 sur et
2
p
qui permet de dterminer lordre p du processus ARCH sachant quun proces-
sus ARCH dordre 3 semble un maximum. Une autre approche consiste
calculer le corrlogramme des rsidus aux carrs issus du modle initial. Si des
termes de ce corrlogramme sont significativement diffrents de 0 , alors on peut
conclure une spcification de type ARCH.

III. Modles erreurs sur les variables


A. Consquences lorsque les variables sont entaches
derreurs
Quand nous avons tudi le modle linaire, nous avons admis que la variable
endogne et les variables exognes taient observables sans erreur. Dans la pra-
tique, cette hypothse est rarement vrifie ; cependant, nous pouvons admettre,
gnralement, que lerreur de mesure des observations est faible par rapport
lerreur de spcification.
Toutefois, dans certains modles, les variables conomiques retenues peu-
vent tre entaches dune erreur de mesure relativement importante. Cest le cas,
par exemple, lorsque les donnes proviennent, non pas, dune mesure directe,
mais de donnes denqutes par sondage. Dans ce cas, il convient de distinguer
les variables vraies (et inconnues) : y , x1 , x2 , . . . , xk des valeurs observes
y, x1 , x2 , . . . , xk et dtudier les consquences concernant les proprits de les-
timateur obtenu par les MCO.
Soit le modle Y = X a + avec qui satisfait aux hypothses habituelles.
Posons : X = X + et Y = Y +
avec : E() = 0 ; E() = 0 ; E(X ) = 0 ; E(Y ) = 0 ; E(X ) = 0 ;
E(Y ) = 0 .

154  CONOMTRIE
On a alors :

E( ) = E{(Y X a) } = E(Y ) a E(X ) = 0

E( ) = E{(Y X a) } = E(Y ) a E(X ) = 0

Nous avons donc indpendance entre les erreurs sur les variables et , et ler-
reur de spcification du modle .
La relation entre les variables observes X et Y est la suivante :

Y = Y = (X )a + Y = Xa + a + = Xa +

avec = a +
Les proprits stochastiques de sont :
E() = E( a + ) = E() E()a + E() = 0
E(X ) = E(X ) E(X )a + E(X ) = 0
E(X ) = E{(X + ) } = E( )
= E( ) E( ) a + E( )
= E( )a = 0
Lhypothse H6 du modle gnral nest donc pas vrifie puisque et X sont
corrls, la mthode des MCO fournit des estimateurs biaiss ngativement.

B. La mthode des variables instrumentales


Lorsquon se trouve en prsence dun modle erreurs sur les variables
Y = Xa + , lhypothse H6 est en dfaut et lestimateur 
a ne converge pas
asymptotiquement vers a. Les autres hypothses sont rputes vrifies.
Le but de la technique des variables instrumentales est de dterminer k
variables z 1 , z 2 , . . . , z k telles que :

E(Z ) = 0 et Z = (z 1 , z 2 , . . . , z k )

Cov (Z X) = 0
cest--dire quaucune combinaison linaire des variables z k nest orthogonale
aux variables x1 , x2 , . . . , xk ou encore que les variables Z et X soient corrles.
Nous avons alors :

E(Z Y ) = E{Z (Xa + )} = E(Z X)a + E(Z ) = E(Z X)a

Problmes particuliers : la violation des hypothses  155


soit a = (Z X)1 Z Y
 [12]

On dmontre1 que  a est un estimateur convergent de a , la variance de les-


a est dautant plus faible que la corrlation entre Z X est forte, la
timateur 
matrice des variances et covariances des coefficients est gale :

a = 
2 (Z X)1 (Z Z )(X Z )1 [13]

La difficult de mise en uvre de cette mthode rside dans la slection des


variables instrumentales2 miracles Z qui doivent tre non corrles avec
et fortement corrles avec X . Dans certains cas, nous pouvons simplement rete-
nir, comme variable instrumentale, la variable exogne dcale dune priode.

C. Le test dexognit dHausman


Le test dexognit dHausman (1978) permet de dtecter une ventuelle cor-
rlation entre le terme derreur t et une ou des variables explicatives xit. Dans
cette hypothse, nous ne pouvons plus utiliser lestimateur des MCO qui est non
convergent, il faut alors recourir la mthode des Variables Instrumentales (VI)
ou la Mthode des Moments Gnralise (GMM).
Soit le test dhypothses, H0 : Cov(xt ,t ) = 0 (la variable xt est exogne) contre
lhypothse dendognit H1 : Cov(xt ,t ) = / 0.
Sous lhypothse H0 les estimateurs des MCO et des VI sont convergeant alors
que sous lhypothse H1 la covariance est non nulle et lestimateur des MCO est
biais et non convergeant. Ce test peut tre men de deux manires, soit un test
de diffrence entre lestimateur des VI et des MCO, soit un test partir dune
rgression augmente.

1) Test de diffrence
Nous calculons la statistique :
H = (
aV I
a MC O ) [Var(
aV I ) Var(
a MC O )]1 (
aV I
a MC O ) .
La statistique H est distribue selon un chi-deux k degrs de libert. Si
H < 2 (k) pour un seuil % fix, nous acceptons lhypothse H0, lestimateur
MCO est non biais.
1. Judge G.G. et al., pages 577-579, 1988.
2. Les anglo-saxons emploient le terme de proxy variable , que lon peut traduire littralement par
variable par dlgation .

156  CONOMTRIE
2) Rgression augmente
La procdure propose par Hausman est en quatre tapes :
Estimation dun modle par les MCO avec pour variable expliquer la
variable dont nous dsirons tester lexognit et comme variables explica-
tives le ou les instruments, le plus souvent les variables explicatives dcales
dune priode.
Estimation de la ou des variables ajustes xit partir de la ou des rgressions
prcdentes.
Estimation du modle augment (modle initial dans lequel nous rajoutons la
ou les variables explicatives ajustes xit).
Test de significativit par rapport 0 du ou des coefficients de la ou des
variables explicatives ajustes. Si ce ou ces coefficients ne sont pas significa-
tivement de 0 (test de Student ou de Fisher), alors nous retenons lhypothse
H0 : Cov(xt ,t ) = 0 .

D. La mthode des moments gnralise


La Mthode des Moments Gnralise, GMM (Generalized Method of
Moments), est utilise lorsque la ou les variables explicatives sont supposes
exognes (Cov (xt ,t ) =
/ 0 ) et que, de plus, la matrice des variances covariances
des erreurs est quelconque ( E(t ,t ) =
/ 2 I ). Lestimateur des GMM combine
alors la mthode des moindres carrs gnraliss avec celle des variables instru-
mentales. Lestimateur des GMM est donn par :

)1 Z X)1 X Z (Z Z
a = (X Z (Z Z )1 Z y [14]

avec :
y = la variable expliquer
X = les variables explicatives
Z = les instruments

= la matrice des variances covariances des rsidus estims dans une premire

tape par la mthode des variables instrumentales
Il est noter que dans le cas o les hypothses classiques sont vrifies
(E(t ,t ) = 2 I ) , lestimateur des GMM (expression [14]) se ramne lesti-
mateur VI (expression [13]).

Problmes particuliers : la violation des hypothses  157


Exercice n 5
fichier C5EX5

Test dexognit dHausman, modle erreurs sur les variables : la


technique des variables instrumentales
Un agronome dsire estimer la relation entre le rendement de bl (yi ) et la quantit
utilise dengrais (xi ) . Pour ce faire, il ne dispose que de la quantit dengrais (xi )
dclare par lagriculteur, qui est donc entache dune erreur. Cependant, il pense que la
variable de dpense effective en achat dengrais (z i ) est indpendante de lerreur dob-
servation de la quantit dengrais dclare et bien corrle avec la consommation relle
dengrais.
On dispose des vingt observations prsentes au tableau 9.

Tableau 9 Rendement de bl, quantit dengrais utilise


et dpense en achat dengrais

Observation yi xi zi
1 15,30 17,30 3,00
2 19,91 21,91 7,00
3 20,94 22,96 5,40

18 25,83 29,43 22,20
19 25,15 28,95 24,60
20 25,06 28,86 24,60

On demande :
1) de tester une ventuelle endognit de la variable xi laide du test dHausman ;
2) destimer la relation entre yi et xi par une mthode adapte.

Solution

1) Test de diffrence : Nous calculons la statistique dHausman :



H = ( aV I a MC O ) [Var( aV I ) Var( a MC O )]1 ( aV I a MC O )

Avec :
  
0,795 0,822 0,0004489 0,01106
aV I = ; a MC O = ; Var( aV I ) = ;
2,153 1,471 0,01106 0,27613
 
0,0003486 0,00859 0,0276
Var( a MC O ) = ; ( aV I a MC O = ;
0,00859 0,214867 0,6817

0,0001 0,0024
[Var( aV I ) Var( a MC O )] =
0,0024 0,0612

158  CONOMTRIE
 
1568341,7 63248,1 0,0276
H = [0,0276 0,6817] = 7,63 > 2 (2)
63248,1 2566,99 0,6817
pour un seuil de 5 % = 5,99. Nous rejetons lhypothse H0, lestimateur des MCO est
biais, il convient dutiliser lestimateur des VI.
Rgression augmente
Nous procdons au test dHausman en quatre tapes.
Estimation par les MCO de la rgression de xi sur linstrument z i :

Dependent Variable : X
Method : Least Squares
Included observations : 20
Variable Coefficient Std. Error t-Statistic Prob.
C 18.37253 0.622495 29.51436 0.0000
Z 0.440680 0.039908 11.04238 0.0000

Calcul de la srie ajuste : xi = 18,37 + 0,44z i


Estimation du modle augment avec (XF = xi ) :

Dependent Variable : Y
Method : Least Squares
Included observations : 20
Variable Coefficient Std. Error t-Statistic Prob.
X 1,010328 0,022324 45,25680 0.0000
XF 0,215107 0,023915 8,994504 0.0000
C 2,153561 0,212721 10,12386 0,0000

Le coefficient de la variable XF est significativement diffrent de 0, nous ne sommes


pas en mesure daccepter lhypothse H0, nous avons donc Cov(xt ,t ) = 0 .

2) La rgression de yi sur xi conduit aux rsultats suivants :


yi = 1,47 + 0,82 X i
(41)
R 2 = 0,99
n = 20
(.) = t de Student
Cependant la mthode des MCO nest pas applicable car E(xi ) = 0 . En revanche, nous
savons par hypothses que E(z i ) = 0 et que Cov(xi z i ) = 0 .
Lestimateur 
a est donn par [12], soit :


a = (Z X)1 Z Y
(2,1) (2,20) (20,2) (2,20) (20,1)

Problmes particuliers : la violation des hypothses  159


La matrice Z est compose de 1 pour la premire colonne et des valeurs de z i pour
la deuxime colonne. De mme, la matrice X est compose de 1 pour la premire colon-
ne et des valeurs de xi pour la deuxime colonne.
Nous obtenons :
 
20,00 492,78 1,02 0,07
ZX = ; (Z X)1 = ;
284,40 7 369,53 0,04 0,00

434,94
Z Y =
6472,88
 

a0 2,15
soit 
a= =

a1 0,795
Ces coefficients sont comparer ceux trouvs lors de lestimation du modle par
les MCO.
Nous pouvons calculer lestimation de la variance de lerreur :

ei2
2 i 1,29

= = = 0,071
n2 18
La matrice des variances et covariances de 
a est alors daprs [13] :
 a = 
2 (Z X)1 (Z Z )(X Z )1
 
20,00 284,40  a = 0,071 3,85 0,15
ZZ = ; soit
284,40 4 866,08 0,15 0,00

a1 = 0,0211
Le modle estim partir de la mthode des variables instrumentales est donc le suivant :

yi = 2,15 + 0,795 X i
(37)
n = 20
(.) = t de Student

Exercice n 6
fichier C5EX6
Prvision de part de march
Une entreprise de la grande consommation cherche prvoir la part de march dun
produit apritif (PMt) en fonction de sa prsence dans lunivers de vente 1 (DNt) et de son
indice de prix par rapport aux concurrents (IPt). Les donnes portent sur 41 semaines.

1. La DN ou distribution numrique reprsente le nombre de fois o le produit est prsent dans la


distribution GMS (Grande et Moyennes Surfaces). Si DN = 100, cela signifie que le produit est
prsent dans tous les magasins, si DN = 80, le produit est prsent dans 80 % des magasins. Bien
sr, plus la DN augmente et plus le produit est prsent dans les linaires et donc la probabilit de
vendre le produit saccrot.

160  CONOMTRIE
Le chef de produit estime un premier modle dont les rsultats sont prsents ci-des-
sous :
Log(P Mt ) = 2,91 + 1,03 Log(D Nt ) + et
(48,5) (6,83)
n = 41
R 2 = 0,54
DW = 1,29
(.) = t de Student
Log = Logarithme nprien
1) Que reprsente le coefficient a1 du modle ? Est-il significativement de 0 ?
2) Le graphique des rsidus est le suivant quen pensez-vous ?

Existe-t-il une autocorrlation des erreurs ?


3) Le chef de produit ajoute lindice des prix son quation de rgression et obtient le
rsultat suivant :
Log(P Mt ) = 25,22 + 1,28 Log(D Nt ) 4,71 Log(I Pt ) + et
(6,7) (10,9) (5,9)
n = 41
R 2 = 0,76
DW = 1,83
Commentez dun point de vue statistique et conomique les rsultats obtenus.
4) Connaissant pour la semaine 42 les valeurs de D N42 = 0,60 et I P42 = 100, on vous
demande de calculer une prvision de part de march pour la semaine 42 assortie de son
intervalle 95 %.
On donne la matrice (X X)1

543,63 6,38 114,92
(X X)1 = 6,38 0,54 1,32
114,92 1,32 24,29

Solution
1) Le cofficient a1 du modle reprsente une lasticit car le modle est sous la forme
Log-Log. Ce coefficient est significativement de 0 car la valeur empirique du t de Student
est largement suprieure au t lu dans la table (t 0,05 = 1,96) .
2) Le graphique laisse supposer une autocorrlation des erreurs. Puisque les condi-
tions dapplication du test de Durbin et Watson sont vrifies, nous pouvons interprter

Problmes particuliers : la violation des hypothses  161


cette statistique : DW = 1,29 < 1,44 (valeur lue dans la table). Il existe une prsomp-
tion dautocorrlation des erreurs dordre 1.
3) Commentaires des rsultats
Commentaires statistiques :
la statistique de Fisher indique que le modle est globalement significatif,
les t de Student ont des probabilits critiques infrieures 0,05, les coefficients sont
donc tous significatifs,
la statistique de DW = 1,82 ne laisse plus prsager dune autocorrlation des
erreurs.
Nous constatons que le fait davoir ajouter au modle une variable explicative corri-
ge lautocorrlation des erreurs. Le modle est valid sur le plan statistique.
Commentaires conomiques :
la variable DN agit positivement, plus lentreprise est prsente dans lunivers de
vente plus la part de march augmente (10 % daugmentation entrane 12,5 % daug-
mentation de part de march),
la variable IP agit ngativement, il sagit dun effet prix classique (10 % daug-
mentation entrane 47 % de baisse de part de march),
Les coefficients des variables ont bien le signe attendu.
4) On calcule le logarithme nprien : LN(DV ) = 0,51; LN(I P) = 4,605
La prvision en semaine 42 est donne par :

Log( P M) = 25,22 + 1,285 0,51 4,716 4,605 = 2,84
Do P M = e2,84 = 17,18. La part de march prvue est de 17,18 %
Lcart type de lerreur de prvision est gal :


e2t+h = 
 2 1 + X t+h (X X)1 X t+h = (0,16132)2 (1 + 0,27) = 0,033.

1
avec X t+h = 0,51
4,605

Lintervalle de prvision 95 % de Ln(PM) est donn par : 2,84 1,96 0,033.
Soit I C = [2,483; 3,196]
Nous passons aux exponentiels afin dobtenir lintervalle de confiance de la part de
march : [11,95; 24,43].

Exercice n 7
fichier C5EX7
Un peu de rflexion conomtrique...
Soit trois variables construites artificiellement connues sur n = 40 priodes.
Y1 et Y1 en diffrences premires : DY1 = Y1 Y1(1)
Y2 et Y2 en diffrences premires : DY2 = Y2 Y2(1)
une variable TENDANCE = 1, 2, ... , n

162  CONOMTRIE
Les graphiques 7 montrent les variations des variables Y1, Y2, DY1, DY2 en fonc-
tion du temps.

Graphique 7 volution des variables Y1, Y2, DY1, DY2 en fonction du temps

En vous aidant des graphiques, de la statistique de Durbin-Watson et du coefficient


de dtermination, on demande de marier chacune des 4 rgressions proposes (Rsultats
du modle) avec le couple Variable dpendante/Variable explicative .

Rsultats du modle Variables


Durbin et Watson R2 Dpendante Explicative
Modle 1 1,97 0,52 Y1 TENDANCE
Modle 2 3,91 0,55 DY1 TENDANCE
Modle 3 0,03 0 Y2 TENDANCE
Modle 4 0,053 0,52 Y1 DY2

Solution

On procde par dduction et limination.


Modle 3 : Y1/DY2 car coefficient de dtermination quasi nul et trs forte auto-
corrlation des erreurs.
Modle 2 : Y2/TENDANCE car coefficient de dtermination lev et trs forte
autocorrlation ngative des erreurs.
Modle 1 : DY1/TENDANCE car coefficient de dtermination lev et absence
dautocorrlation.
Modle 4 : Y1/TENDANCE car forte autocorrlation positive des erreurs et coef-
ficient de dtermination lev.

Problmes particuliers : la violation des hypothses  163


Les graphiques 8 suivants illustrent les autocorrlations et les coefficients de dter-
mination.

1000 300 500 50

900 200 400 40

800 100 300 30

700 0 200 20

600 -100 100 10

500 -200 0 0
5 10 15 20 25 30 35 40 5 10 15 20 25 30 35 40

Y1 DY2 Y2 TENDANCE

80 60
1000 50
60 50

900 40
40 40

800 30
20 30

0 20 700 20

-20 10 600 10

-40 0 500 0
5 10 15 20 25 30 35 40 5 10 15 20 25 30 35 40

DY1 TENDANCE Y1 TENDANCE

Graphique 8 Illustrations des modles : autocorrlations


et les coefficients de dtermination

164  CONOMTRIE
6. Les modles
non linaires

N
ous avons examin le cas du modle linaire, cependant, trs
souvent, la thorie conomique doit tre formalise laide de
relations non linaires.
Dans ce chapitre, la part consacre au cours est trs rduite. En effet,
ltude des modles non linaires se prte bien lexercice pratique.
Nous examinons tout dabord en I., les diffrents types de modles non
linaires : ceux qui sont linaires sur leurs paramtres et des modles un
peu plus complexes (modle de diffusion, par exemple) qui font lobjet
dune tude particulire. Puis, les mthodes destimation des paramtres
des modles non linarisables sont prsentes en II.

I. Les diffrents types de modles non linaires


A. Les fonctions de type exponentiel
Nous allons examiner le cas de modles dont la spcification nest pas linaire,
mais qui sont linaires par rapport leurs paramtres.

Exercice n 1
fichier C6EX1
Estimation dune fonction de production de type Cobb-Douglas
Nous avons relev pour 25 entreprises : la production Q , le facteur capital K et le
facteur travail L ; ces variables sont exprimes en millions deuros.

Les modles non linaires  165


Une fonction de production de type Cobb-Douglas est de la forme :
Q = 0 K 1 L 2
On demande :
1) de donner une interprtation conomique des coefficients 1 et 2 ;
2) destimer les paramtres du modle et de commenter les rsultats ;
3) de calculer le risque de premire espce concernant lhypothse des rendements
dchelle constants.
Les donnes collectes sont prsentes dans le tableau 1 suivant :

Tableau 1 Donnes de production pour 25 entreprises


(extrait des donnes)

K L Q
8 23 106,00
9 14 81,08

3 10 43,21
6 71 121,24

Solution

1) Les coefficients 1 et 2 reprsentent respectivement llasticit de la production au


facteur capital et llasticit de la production au facteur travail.
Dmonstration :
Nous avons une relation du type : Q = 0 K 1 L 2 .
Une transformation logarithmique conduit :

Log(Q) = Log(0 ) + 1 Log(K ) + 2 Log(L)

Or llasticit de y x se dfinit comme tant un rapport de variation relative :

y/y Log(y)
e= = = rapport de drives logarithmiques.
x/x Log(x)
Les coefficients 1 et 2 sont donc des lasticits.

 Dans tout modle spcifi sous forme Log-Log, les coefficients sin-
terprtent directement en termes dlasticits.
2) Estimation des coefficients du modle Log-linaire
Le modle estimer est donc le suivant :
Log(Q) = Log(0 ) + 1 Log(K ) + 2 Log(L) +
LQ = a0 + 1 LK + 2 LL +

o les variables L Q , L K et L L (tableau 2) sont les variables Q , K et L transformes.


Les rsultats de lestimation sont les suivants :

166  CONOMTRIE
0,05
Les t de Student calculs sont tous suprieurs au t lu (t22 = 2,07), les coefficients
sont donc significativement diffrents de 0 au seuil de 5 %.

Tableau 2 Donnes transformes en logarithmiques dcimaux


(extrait des donnes)

LK = LL = LQ =
Log(k) Log(L) Log(Q)
0,90 1,36 2,03
0,95 1,15 1,91

0,48 1,00 1,64
0,78 1,85 2,08

Attention, la statistique de Durbin et Watson ne sinterprte pas puisque le modle


est spcifi en coupe instantane.
Lestimation statistique est donc satisfaisante.
Llasticit de la production au capital est gale : 1 = 0,64 .
Llasticit de la production au travail est gale : 2 = 0,25 .
(Si le facteur capital augmente de 10 %, la production augmente de 6,4 % et si le fac-
teur travail augmente de 10 %, la production augmente de 2,5 %.)
Le coefficient 0 est gal : 0 = 101,084 = 12,13 .
 = 12,13 K 0,64 L 0,25.
La fonction de production estime scrit : Q

Les modles non linaires  167


3) Les rendements dchelle sont-ils constants ?
Les rendements dchelle sont :
dcroissants si 1 + 2 < 1 (la production augmente dans une proportion moindre
que les facteurs de production) ;
constants si 1 + 2 = 1 (la production augmente dans une proportion identique aux
facteurs de production) ;
croissants si 1 + 2 > 1 (la production augmente plus vite que les facteurs de pro-
duction).
Or nous avons  1 + 
2 = 0,89 , pour quelle probabilit critique cette valeur est-elle
significativement infrieure 1 ?
On teste donc les hypothses suivantes :
H0 : 1 + 2 = 1
H1 : 1 + 2 < 1
Le t calcul de Student est donc gal, sous H0, :
1 + 
 2 1
t =

1+2
Or la matrice des variances et covariances des coefficients est fournie par Eviews :

2 2 2
Soit 
1+2 = 
1 +
2 1 , 
+ 2 cov ( 2 )
= 0,000749 + 0,001261 + 2 0,000314 = 0,002638


1 + 2 1 0,64 + 0,25 1 0,020
t = = = 2,14 t22

1+2 0,05136

Nous avons 2 % de risques de rejeter lhypothse H0 tort, nous pouvons donc


considrer les rendements dchelle comme significativement dcroissants.

B. Les modles de diffusion


La courbe de vie du produit est une notion utilise en marketing : les ventes
voluent en fonction du temps ; le dmarrage est relativement lent lorsque le
produit est nouveau, puis elles connaissent une croissance rapide. La courbe
passe ensuite par un point dinflexion partir duquel le rythme de croissance des
ventes diminue.
Nous allons examiner deux modles classiquement utiliss.

168  CONOMTRIE
1) Le modle logistique (ou courbe de Verhulst ou courbe de Pearl)
Ce modle est dfini par la formulation suivante :
ymax
yt =
1 + br t
o b et r sont les deux paramtres du modle (0 < r < 1) , r dfinit la vitesse
de diffusion (plus r est proche de 0 , plus vite nous atteindrons lasymptote) ; b
est une caractristique dordonne lorigine ; ymax = seuil de saturation.
Si t alors yt ymax , et si t alors yt 0 .
Le point dinflexion est fixe et est atteint pour yt = ymax /2 .
Le graphique 1 illustre lallure gnrale de la courbe logistique.

Graphique 1 La courbe logistique (ymax = 148,31, b = 10, r = 0,7)

2) Le modle de Gompertz
Ce modle est dfini par la formulation suivante :
t +a
yt = ebr Ln(yt ) = br t + a
(e = base du logarithme nprien).
Avec ymax = ea = seuil de saturation, b et r sont les deux paramtres du
modle (b < 0 et 0 < r < 1) .
Si t alors yt ymax , et si t alors yt 0 .

Les modles non linaires  169


3) Les mthodes destimation

La difficult destimation de ce type de modles1 vient du fait quils ne sont


pas linaires. Lemploi du modle de rgression est donc impossible tel quel.
Lestimation des paramtres dun tel modle doit tre effectue par des
mthodes de rgression non linaire qui ncessitent des procdures numriques
itratives assez complexes, objet du paragraphe suivant.

II. Mthodes destimation


des modles non linaires
Nous avons jusqu maintenant procd des artifices de calcul afin de se rame-
ner des modles linaires. Cependant, pour certaines spcifications de modle
il savre impossible, mme sous certaines hypothses, dutiliser les MCO.
Nous allons prsenter, trs succinctement2, les mthodes destimation non
linaires en essayant den montrer linspiration gnrale et les limites. Des
exemples dutilisation sont prsents, ensuite, partir des logiciels RATS et
Eviews.

A. Initiation aux mthodes destimation non linaires


Linspiration gnrale des techniques destimation non linaires sont les mmes
quel que soit le type dalgorithme. Il sagit de mthodes itratives dans les-
quelles lquation non linaire est linarise laide dun dveloppement limit
de Taylor ( partir dun jeu de valeurs de coefficients initiaux). Les MCO sont
alors utiliss sur cette quation linaire afin destimer des nouveaux coefficients.
Ces nouveaux coefficients permettent, laide dun nouveau dveloppement
limit, de procder une nouvelle linarisation. La procdure est arrte lorsque
les coefficients sont relativement stables dune itration lautre.
Pour ce type de mthode soit efficiente, il convient que les valeurs initiales
ne soient pas trop loignes des valeurs optimales. Dans le cas contraire, il ny
a pas convergence et la procdure est dfaillante.

1. Pour un approfondissement des modles de diffusion cf. Bourbonnais R. et Usunier J. C.


Chapitre 7, (2013).
2. Pour un dveloppement trs complet, le lecteur peut se rfrer Greene W.H., chapitre 10, 2000.

170  CONOMTRIE
Algorithme de Gauss-Newton
Soit le modle non linaire : yt = f (X, a) + t o X est la matrice des observa-
tions des variables explicatives (de dimension n , k + 1 ) et a est le vecteur (de
dimension k + 1 ) des paramtres estimer.
Sous les hypothses classiques concernant t , lestimateur des moindres car-
rs est la valeur de a qui minimise la somme des carrs des rsidus :

S(a) = e e = [yt f (X, a)] [yt f (X, a)]

Nous avons k + 1 conditions du premier ordre ( S/a = 0), soit :

S f (X, a)
= 2 [yt f (X, a)] = 0
a a
f (x1 , a) f (x1 , a)
...
a0 ak
f (X, a) .. .. ..
Avec = Z (a) = . . .
a
f (xn , a) f (xn , a)
...
a0 ak
Soit Z (a 1 ) cette matrice calcule pour les valeurs particulires de a(a = a 1 ) .
Puis, laide dun dveloppement limit de Taylor au voisinage de a 1, nous pou-
vons approximer la t -ime observation



1 f (xt , a)

f (xt , a)

f (xt , a) f (xt , a ) +
...
(a a 1 )
a0
ak

a=a1 a=a1

Ou encore, en notation matricielle :


f (X, a) f (X, a 1 ) + Z (a 1 )(a a 1 )
Soit y = f (X, a 1 ) + Z (a 1 )(a a 1 ) +
ou encore : y = f (X, a 1 ) + Z (a 1 )a Z (a 1 )a 1 +
En posant y(a 1 ) = y f (X, a 1 ) + Z (a 1 )a 1, nous pouvons alors construire un
pseudo-modle linaire qui est gal :
y(a 1 ) = Z (a 1 )a +
Lestimateur des MCO de ce modle linaire est donn par :
a 2 = [Z (a 1 ) Z (a 1 )]1 Z (a 1 ) y(a 1 )
= a 1 + [Z (a 1 ) Z (a 1 )]1 Z (a 1 ) [y f (X, a 1 )]
Ce qui donne k + 1 nouvelles valeurs pour le vecteur a = a 2 . Le processus
est arrt la p -ime itration, lorsque nous observons une relative stabilit des
coefficients ainsi estims : a = a p a p1 .

Les modles non linaires  171


Cette mthode assez complexe connat quelque raffinement par lutilisation
dun dveloppement limit de Taylor du second ordre (algorithme de Newton-
Raphson).

Les logiciels dconomtrie (Eviews, RATS, ) ainsi que les tableurs


laide de la fonction SOLVEUR permettent, trs simplement, dutiliser ces
mthodes destimation des modles non linaires.

Nanmoins, il convient dinsister sur le fait quelles ne sont efficientes que si


nous sommes capables de fournir des valeurs initiales compatibles avec la sp-
cification du modle et les donnes.

B. Exemples dapplication

Exercice n 2
fichier C6EX2
Estimation des paramtres dun modle de diffusion Logistique
et de Gompertz
Le tableau 3 prsente les ventes cumules (en milliers dunits) dun CD audio dun
artiste succs sur 19 semaines.

Tableau 3 Extrait des ventes cumules sur 19 semaines (milliers dunits)

Semaines Ventes
1 44,7
2 61,0

18 607,0
19 633,9

On demande :
1) Destimer les paramtres dun modle de diffusion de type Logistique.
2) Destimer les paramtres dun modle de diffusion de type Gompertz.
Solution
Le graphique 2 prsente lvolution des ventes cumules en fonction des semaines. Ce
graphique peut suggrer une volution selon un modle de diffusion, nous serions alors
proximit du point dinflexion.

172  CONOMTRIE
700

600

500

400

300

200

100

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

Graphique 2 Ventes cumules

1) Estimation dun modle de diffusion de type Logistique (Eviews).


Valeurs initiales compatibles
PARAM 1 600. 2 5. 3 0.5
equation NLS ventes=C(1)/(1+c(2)*c(3)^@trend)

Rsultats (Eviews) :

Dependent Variable: VENTES


Sample: 1 19
Included observations: 19
Convergence achieved after 8 iterations
VENTES=C(1)/(1+C(2)*C(3)^TEND)
Coefficient Std. Error tStatistic Prob.
C(1) 718.0033 11.87762 60.45008 0.0000
C(2) 14.77212 0.536144 27.55254 0.0000
C(3) 0.784909 0.004580 171.3614 0.0000

R-squared 0.999009
ymax 718
Le modle estim scrit : yt = =
1 + br t 1 + 14,77 0,785t

2) Estimation dun modle de diffusion de type Gompertz (RATS).

* Rgression non linaire


nonlin b r a Dfinition des paramtres estimer
frml gompertz = exp(b*r**(t)+a) Formulation du modle

Les modles non linaires  173


*Initialisation des paramtres
eval a = 5.
eval b = -3.5
eval r = 0.5
nlls(frml=gompertz,trace) taux Estimation des coefficients

Rsultats

t t
Soit le modle : yt = ebr +a = e(3,460,88 +6,83) ; le seuil de saturation, selon un
modle de Gompertz, est donc de e6,83 = 927.

Exercice n 3
fichier C6EX1
Estimation des paramtres dune fonction de production de type CES
Les fonctions de production llasticit de substitution constante, appeles CES1
(Constant Elasticity of Substitution), sont de la forme :

Q = 1 [2 K 3 + (1 2 ) L 3 ]4 avec 3 et 4 < 0

o 1/(1 3 ) reprsente llasticit de substitution2.


Nous pouvons aussi lcrire de la manire suivante :

Q = 1 [2 K 3 + (1 2 )] L 3 ]/3

o reprsente alors les rendements dchelle.


En reprenant les donnes du tableau 1, on demande :

1. La fonction de production llasticit de substitution constante (CES) a t introduite par


Arrow K.J. et al., 1961.
2. Llasticit de substitution mesure lincidence de la variation relative des prix des facteurs sur la
combinaison productive (le rapport K /L ).

174  CONOMTRIE
1) de transformer cette fonction de production par un passage aux logarithmes ;
2) destimer les paramtres du modle ;
3) de comparer les rsultats avec ceux obtenus lexercice 1.

Solution

1) Transformation du modle
Q = 1 [2 K 3 + (1 2 )] L 3 ]4

Log(Q) = Log(1 ) + 4 Log [2 K 3 + (1 2 ) L 3 ]


Nous observons que cette fonction de production nest pas linarisable (contraire-
ment la fonction de production de type Cobb-Douglas). Il convient donc dutiliser une
technique destimation des modles non linaires.
2) Estimation des paramtres
Les instructions du logiciel Eviews sont les suivantes :
PARAM 1 12. 2 1. 3 0.5 4 0.5 Initialisation des 4 paramtres
NLS Q = C(1)*(C(3)*K^C(4))+(1C(3))*L^C(4))^C(2) quation
Rsultats

La fonction de production estime scrit :


Q = 1 [2 K 3 + (1 2 ) L 3 ]4
= 11,21 [0,404 K 0,597 + 0,594 L 0,597 ]1,38
3) Comparaison des rsultats entre une fonction de production Cobb-Douglas et une
fonction de production de type CES
Lors de lexercice 1, nous avons estim les rendements dchelle de la fonction
1 + 
Cobb-Douglas ( 2 = 0,89) qui sont significativement dcroissants.
Pour la fonction de type CES, nous avons :

= 3
4 = 1,38 0,597 = 0,82 < 1
Les rendements dchelle sont dcroissants, et llasticit de substitution constante
est gale :
1/(1 3 ) = 0,42

Les modles non linaires  175


7. Les modles
dcalages temporels

J
usqu maintenant, nous avons spcifi des modles o toutes les
variables sont exprimes la mme priode. Cependant, la thorie
conomique postule couramment non pas des effets synchrones
mais des effets retards.
Ces modles dcalages peuvent inclure comme variables retardes aussi
bien la variable endogne que les variables exognes. Nous tudierons,
tout dabord en I., les modles autorgressifs dont la variable retarde
est la variable endogne. Puis, en II., une autre classe de modle est envi-
sage : les modles retards chelonns. Dans cette spcification, les
variables exognes apparaissent plusieurs dcalages.
Enfin, en III., nous prsentons deux exemples de modles dynamiques.

I. Les modles linaires autorgressifs


A. Formulation gnrale
Dans ce type de modles temporels, la variable endogne yt dpend :
de k variables exognes x1t , x2t , . . . , xkt lpoque t ;
des valeurs que prend la variable yt pendant les priodes prcdentes,
yt1 , yt2 , . . . , yth .
Soit la formulation :
yt = b1 yt1 + b2 yt2 + . . . + bh yth + a0 + a1 x1t + a2 x2t + . . . + ak xkt + t
h
ou encore : yt = bj yt j + X a + t
j=1 (n, k + 1) (k + 1, 1)

Les modles dcalages temporels  177


Dans ce modle, lhypothse H5, dindpendance entre les variables expli-
catives et lerreur, nest plus satisfaite car les variables yt1 , yt2 , . . . , yth qui
dpendent de t1 , t2 , . . . , th sont alatoires puisque yt+1 est fonction de yt
qui dpend de t , soit : E(yt+1 t ) = 0 .
Nous remarquons que si les variables exognes xit et les erreurs t sont
fixes, les variables endognes sont solutions de lquation de rcurrence :
yt = b1 yt1 + b2 yt2 + . . . + bh yth + St
avec St = Xa + t .
Il est dmontr que la solution gnrale de cette quation de rcurrence est
explosive si une des h racines de son quation caractristique1 a son module
suprieur 1 .
Or nous devons considrer les processus explosifs que ce soit dune faon
monotone ou oscillatoire comme des phnomnes rares en conomie (les
variables sont limites gnralement dans leur croissance), cest pourquoi il
convient dajouter lhypothse de stabilit du processus.

Cas particulier : le modle autorgressif dordre 1


Le modle gnral spcifi ci-dessus est rarement utilis, le plus souvent
nous nous limitons des processus autorgressifs dordre 12, de la forme :
yt = b1 yt1 + a0 + a1 x1t + a2 x2t + . . . + ak xkt + t [1]
Ce modle est stable si |b1 | < 1 et explosif si |b1 | > 1 .

B. Test dautocorrlation et mthodes destimation


La mthode destimation adquate dpend dune ventuelle dpendance des
erreurs ; or, dans le cas dun modle autorgressif, le test de Durbin et Watson a
une puissance rduite et est biais. Cest pourquoi il convient dutiliser une autre
statistique, celle du h de Durbin.

1) Test dautocorrlation des erreurs

Dans le cas dun modle autorgressif dordre 1, le test classique de Durbin et


Watson sous-estime le risque dautocorrlation, un nouveau test dautocorrla-
tion des erreurs doit alors tre utilis3. La statistique utilise est la suivante :

1. Lquation caractristique scrit r h b1 r h1 b2 r h2 . . . bh = 0 .


2. La variable yt dpend nanmoins des valeurs passes yt1 , yt2 , . . . y0 .
3. Durbin J., 1970.

178  CONOMTRIE

n

h= [2]
b12
1 n

avec  = 1 dw/2 (dw est la statistique de Durbin et Watson calcule sur la


modle [1]) ;
n = nombre dobservations ;
b12 = variance estime du coefficient b1 partir du modle [1].

Cette statistique h est distribue de manire asymptotique comme une
variable normale centre rduite. Ainsi, il y a quivalence entre les deux tests
dhypothses suivants :
H0 : = 0 H0 : h = 0

H1 : = 0 H1 : h = 0
Si |h|  t /2 , nous acceptons lhypothse H0 dindpendance des erreurs.
(t /2 = valeur issue de la loi normale pour un test bilatral au seuil de .)
Nous remarquons que si nb12  1 , la statistique h ne peut pas tre calcu-
le ; dans ce cas, nous pouvons utiliser la statistique de Durbin et Watson en
incluant la zone de doute dans la zone dautocorrlation des erreurs.

2) Estimation si les erreurs ne sont pas corrles

Dans le cas dabsence dautocorrlation des erreurs, les estimateurs des MCO
appliqus au modle [1] convergent asymptotiquement vers les valeurs vraies
des paramtres et ont une variance minimale parmi tous les estimateurs conver-
gents.
Cependant, pour les petits chantillons, lors de lestimation dun modle
autorgressif dordre h , les rsultats asymptotiques sont alors trs approxima-
tifs, car le nombre de priodes destimation est de n h . De plus, les problmes
de colinarit entre les variables explicatives dcales interdisent pratiquement
dutiliser les MCO.
En rsum, pour lestimation des modles autorgressifs erreurs indpen-
dantes, lapplication de la mthode classique des MCO est licite si le nombre
dobservations est suffisant (souvent dans la pratique n > 15 ).

3) Estimation en cas dautocorrlation des erreurs

Le modle scrit alors :


yt = b1 yt1 + a0 + a1 x1t + a2 x2t + . . . + ak xkt + t [3]
avec t = t1 + vt

Les modles dcalages temporels  179


Il sagit dun modle autocorrlation des erreurs, nous avons montr lors
du chapitre 5 que la transformation en quasi-diffrences premires peut lever
lautocorrlation des erreurs dordre 1.
Nous pouvons citer diffrentes mthodes destimation.

a) Rgression sur les diffrences premires


On procde deux rgressions par la mthode des MCO : la premire sur le
modle spcifi avec des variables non transformes et la seconde sur le mod-
le spcifi avec des variables transformes en diffrences premires.
Si les deux rsultats destimation sont proches, nous pouvons conclure que
les paramtres du modle sont suffisamment bien dtermins sans rechercher la
liaison ventuelle des erreurs.
b) Correction de lautocorrlation des erreurs par rgression sur les quasi-
diffrences premires
Par une des mthodes prsentes au chapitre 5, nous procdons la correction
de lautocorrlation des erreurs : estimation directe de , Hildreth-Lu,
Cochrane-Orcutt.
c) Dautres mthodes
Nous pouvons aussi citer :
la mthode des variables instrumentales (cf. chapitre 5), o nous retenons
comme variable instrumentale la variable yt2 ;
la mthode du maximum de vraisemblance.
La mthode des variables instrumentales rsout le problme de convergence
des estimateurs lorsque nous sommes en prsence derreurs moyenne mobile
de type :
t = vt 1 vt1 2 vt2 . . . p vt p

Dans le cas derreurs autocorrles, nous devons utiliser une des mthodes
destimation robuste prsentes au chapitre 5.

4) Prvision dans un modle autorgressif


La prvision de la variable endogne y, lhorizon h , est donne par :
yn+h = 
 b1
yn+h1 + 
a0 + 
a1 x1n+h + 
a2 x2n+h + . . . + 
ak xkn+h

Lerreur qui affecte les valeurs successives de 


yn+h1 se cumule dune prio-
de sur lautre, et ainsi la variance de lerreur de prvision peut devenir trs
importante.
Lutilisation des fins de prvision du modle autorgressif doit donc tre
limite quelques priodes.

180  CONOMTRIE
Exercice n 1
fichier C7EX1
Estimation des paramtres dun modle autorgressif erreurs lies
Un conomtre dsire tester la relation entre les prix officiels (P O) de la tonne de
caf et les prix rellement appliqus lexportation (P E) par les pays producteurs. Il se
propose destimer la relation :

P Ot = a0 + a1 P Ot1 + a2 P E t + t

dans laquelle le prix officiel est fonction de manire instantane du prix observ et sajus-
te avec un retard dun an au prix officiel.
Il dispose des donnes, sur 16 ans, prsentes au tableau 1.

Tableau 1 Prix officiel et prix pratiqu


lexportation de la tonne de caf (en dollars)

t PO PE
1 455,0 615,0
2 500,0 665,0
3 555,0 725,0
4 611,0 795,0
5 672,0 870,0
6 748,5 970,0
7 846,0 1 095,0
8 954,5 1 235,0
9 1 090,0 1 415,0
10 1 243,5 1 615,0
11 1 390,0 1 795,0
12 1 559,0 2 015,0
13 1 781,0 2 315,0
14 2 046,5 2 660,0
15 2 311,0 2 990,0
16 2 551,0 3 280,0

On demande :
1) destimer la relation et de tester une ventuelle autocorrlation des erreurs ;
2) den corriger les effets, le cas chant.

Les modles dcalages temporels  181


Solution

1) Les rsultats de lestimation sont les suivants :

Dependent Variable : PO
Included observations : 15 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob.


C 7.078673 1.851077 3.824084 0.0024
PO(1) 0.224016 0.037090 6.039727 0.0001
PE 0.622340 0.025520 24.38636 0.0000
R-squared 0.999980 Mean dependent var 1257.267
Adjusted R-squared 0.999976 S.D. dependent var 663.5723
S.E. of regression 3.236240 Akaike info criterion 5.363558
Sum squared resid 125.6790 Schwarz criterion 5.505168
Log likelihood 37.22668 F-statistic 294296.0
Durbin-Watson stat 0.625901 Prob(F-statistic) 0.000000

Lquation est estim sur 15 priodes (n 1) car dans le modle figure une variable
retarde dune priode.
La statistique de Durbin et Watson laisse augurer dune autocorrlation des erreurs,
ce qui est confirm par le h de Durbin [2] :
 
n 15

h= 2
= 0,687 = 2,68 > t 0,05 = 1,96
1 n
a1 1 15 0,0013

Nous rejetons lhypothse H0, soit h = 0 = 0 .


2) Nous allons tout dabord comparer les estimations obtenues partir du modle brut
celles obtenues partir du modle en diffrences premires.
Nous procdons lestimation du modle en diffrences premires sur 14 ans car
nous perdons de nouveau une observation lors du calcul des diffrences premires de
P Ot1 .
Les rsultats sont les suivants :

Dependent Variable : D(PO)


Included observations : 14 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob.


C 2.891649 1.298314 2.227234 0.0478
D(PO(1)) 0.240680 0.024114 9.981022 0.0000
D(PE) 0.598017 0.018553 32.23277 0.0000
R-squared 0.999299 Mean dependent var 146.5000
Adjusted R-squared 0.999172 S.D. dependent var 76.37030
S.E. of regression 2.197504 Akaike info criterion 4.599930
Sum squared resid 53.11925 Schwarz criterion 4.736871
Log likelihood 29.19951 F-statistic 7845.105
Durbin-Watson stat 1.781510 Prob(F-statistic) 0.000000

182  CONOMTRIE
Nous observons que les diffrences entre les coefficients de rgression sont assez
faibles pour a1 (0,224 et 0,240) comme pour a2 (0,622 et 0,598); nous pouvons consi-
drer les rsultats obtenus la premire rgression comme valides.
Cependant, titre pdagogique, nous allons utiliser la mthode de correction dauto-
corrlation des erreurs.
Le modle estim, selon la mthode de Hildreth-Lu, est alors :

P Ot = 2,765 + 0,234 P Ot1 + 0,6135 P E t + et


(1,67) (15,5) (57,9)
et = 0,418 et1 + vt
R 2 = 0,99 ; n = 14 ; DW = 2,08 ; (.) = t de Student
Les prix officiels de la priode t sont donc plus influencs par les prix rellement pra-
tiqus en t que par les prix officiels de lanne prcdente.

II. Les modles retards chelonns


A. Formulation gnrale
Dans certaines spcifications de modles conomtriques temporels, nous pou-
vons postuler que la variable endogne dpend des valeurs prises par une
variable exogne des poques antrieures, tel que :

h
yt = b0 + a0 xt + a1 xt1 + a2 xt2 + . . . + ah xth + t = a j xt j + b0 + t [6]
j=0

En gnral, leffet de la variable explicative sestompe avec le temps :


a0 > a1 > a2 > . . . > a h
Ce modle [6] peut se simplifier dans son criture en utilisant un oprateur
dcalage D dfini par : Dxt = xt1 et en gnral : D i xt = xti , soit :
 

h 
h h
j j
yt = a j xt j + b0 + t = a j D xt + b0 + t = aj D xt + b0 + t
j=0 j=0 j=0

yt = A(D)xt + b0 + t [7]
o A(D) est un polynme de degr h , tel que :
A(D) = a0 + a1 D 1 + a2 D 2 + . . . + ah D h
Le nombre de retards, h , peut tre fini ou infini. Cependant, la somme des
coefficients a j tend vers une limite finie, sinon yt serait un processus explosif.

Les modles dcalages temporels  183


Le polynme A(1) = a0 + a1 + a2 + . . . + ah permet de mesurer, long
terme, limpact de la modification de la variable explicative xt dune quantit
x sur la valeur de yt . En effet, les coefficients a j reprsentent les multiplica-
teurs instantans et leur somme le multiplicateur cumul.

Retard moyen

La notion de retard moyen permet dapprhender le laps de temps qui corres-


pond la valeur moyenne des coefficients a j . Il est gal la moyenne pondre
des coefficients, soit :

h
ja j
j=0 a1 + 2 a2 + . . . + hah A (1)
D= = = [8]
h a0 + a1 + a2 + . . . + a h A(1)
aj
j=0

Lestimation des paramtres du modle [6] soulve deux types de difficults :


en pratique, la valeur h qui mesure limportance du nombre de retards est
rarement connue, mme si nous en connaissons lordre de grandeur ;
le second problme rsulte de la colinarit entre les variables exognes
dcales. En effet, lorsque le nombre de retards est important, la colinari-
t entre les variables explicatives dcales risque dentraner une imprci-
sion dans lestimation des coefficients. Cest pourquoi, le plus souvent,
nous mettons des hypothses sur la forme de retards.
Ces deux points sont abords ci-dessous.

B. Dtermination du nombre de retards


Lorsque la valeur h du nombre de retards du modle [6] est inconnue, il existe
des critres statistiques permettant de la dterminer1.

1) Test de Fisher

Le test le plus naturel est celui de Fisher dans lequel nous testons lhypothse de
la nullit des coefficients de rgression pour les retards suprieurs h .
La formulation des hypothses est la suivante, lorsque lon teste, dune manire
descendante, une valeur de h comprise entre 0 et M : 0 < h < M .

1. Il sagit de dterminer quelle est la priode maximum dinfluence de la srie explicative. Il peut
trs bien arriver, cest mme souvent le cas, que des coefficients de rang infrieur au dcalage
h ne soit pas significativement diffrents de 0.

184  CONOMTRIE
H01 : h = M 1 a M = 0 H11 : h = M a M = 0
H02 : h = M 2 a M1 = 0 H12 : h = M 1 a M1 = 0
.. ..
. .
i i
H0 : h = M i a Mi+1 = 0 H1 : h = M i + 1 a Mi+1 = 0
Chacune de ces hypothses fait lobjet du classique test de Fisher, soit :
(SC R Mi SC R Mi+1 )/1
F1 = [9]
SC R Mi+1 /(n M + i 3)
que lon compare au F lu dans la table 1 et (n M + i 3) degrs1 de libert.
Ds que, pour un seuil donn, le F empirique est suprieur au F lu, nous
rejetons alors lhypothse H0 i et la procdure est termine. La valeur du retard
est gale M i + 1 : h = M i + 1 .
Afin de pouvoir procder ce test dans ses conditions dapplication, la
Somme des Carrs Totaux doit rester constante dune estimation lautre. Cela
oblige donc estimer les diffrents modles avec un nombre dobservations iden-
tique correspondant donc au nombre dobservations rellement disponible pour
le dcalage le plus important, chaque dcalage entranant la perte dune donne.

2) Critre de Akaike (AIC)2


Une autre mthode consiste retenir comme valeur de h celle qui minimise la
fonction de Akaike qui est donne par :
 
SC Rh 2h
AI C(h) = Ln + [10]
n n
avec SC Rh = Sommes des Carrs des Rsidus pour le modle h retards
n = nombre dobservations disponible
(chaque retard entrane la perte dune observation)
Ln = logarithme nprien

3) Critre de Schwarz (SC)3


Enfin, une mthode trs proche de la prcdente consiste retenir la valeur de
h qui minimise la fonction de Schwarz :
 
SC Rh h Ln n
SC(h) = Ln + [11]
n n

1. Le degr de libert du dnominateur est gal au nombre dobservations (n) moins le nombre de
paramtres estimer dans le modle [6]. Soit pour h = M i + 1 et en tenant compte du terme
constant et du coefficient de rgression pour la variable x 0 retard :
n (M i + 1) 1 1 = n M + i 3 .
2. Akaike H., 1973 ; 1974.
3. Schwarz G., 1978.

Les modles dcalages temporels  185


Exercice n 2
fichier C7EX2
Dtermination du nombre de retards dans un modle retards
chelonns
La thorie conomique postule que les dpenses dinvestissement (notes yt ) peu-
vent tre expliques par les profits passs (nots x t ). Le modle prend la forme dun
modle retards chelonns tel le modle [6].
Nous disposons dun extrait des donnes trimestrielles du tableau 2 concernant lin-
dustrie chimique franaise.
Ntant pas certains de la spcification exacte du modle, nous dsirons tout dabord
rechercher le nombre de dcalages trimestriels qui semblent avoir un effet sur les
dpenses dinvestissement. Puis aprs avoir dtermin le nombre de retards, nous calcu-
lerons le dlai moyen.
Tableau 2 Dpenses dinvestissement et profit
(en millions deuros)
Trimestre yt xt
1 2 072 1 660
2 2 077 1 926

43 2 840 3 449
44 2 837 3 764

Solution

Nous procdons aux estimations des modles sur 34 trimestres, puisque le dcalage
maximum test est de 10, on limine les 10 premires observations.
Nous calculons les trois critres : Akaike, Schwarz et Fisher laide dun program-
me Eviews en tlchargement (C7EX2).
Les rsultats sont consigns dans le tableau 3.
Tableau 3 Rsultats de la recherche du nombre de dcalages optimal

Dcalage Akaike Schwarz Fisher


0 11,96 11,96 16,82
1 11,50 11,54 18,91
2 11,04 11,12 19,18
3 10,55 10,68 10,89
4 10,25 10,42 8,59
5 9,99 10,21 6,86
6 9,84 10,10 1,09
7 9,88 10,19 0,13
8 9,96 10,31 0,77
9 10,03 10,43 0,25
10 10,10 10,55

186  CONOMTRIE
Nous observons immdiatement que les minima des deux critres (AI C(h) et
SC(h) ) sont situs sur la ligne 6, correspondant donc 6 dcalages. La premire valeur
du Fisher empirique qui est significative en partant du retard 10 est celle de la ligne
5. Elle est gale 6,86, ce qui vient confirmer une influence de la variable explicative
allant jusqu un dcalage de 6 priodes.
Nous allons dtailler le calcul des critres1 de Akaike et Schwarz pour le retard 6. Le
rsultat de lestimation pour 6 retards est le suivant :
Variable expliquer : Y
n = 38

Variable Coefficient cart type t de Student Prob.

C 501,5414 154,8486 3,238915 0,0029


X 0,011389 0,081532 0,139687 0,8898
X( 1) 0,061265 0,124906 0,490487 0,6274
X( 2) 0,227569 0,119635 1,902194 0,0668
X( 3) 0,167932 0,112997 1,486158 0,1477
X( 4) 0,118734 0,127454 0,931580 0,3590
X( 5) 0,000169 0,136907 0,001235 0,9990
X( 6) 0,237174 0,084065 2,821310 0,0084

R2 = 0,92 0,921953 Somme des carrs des rsidus = 521116,1

Daprs [10], nous avons :


521116 26
AI C(6) = Ln + = 9,84
38 38

Et daprs [11] :

521116 6 Ln (38)
SC(6) = Ln + = 10,10
38 38

Nous remarquons que la probabilit critique du coefficient de la variable X(-6) est


largement infrieure 0,05 ; le coefficient est donc significativement diffrent de 0. Ceci
est videment conforme aux rsultats prcdents.
Les trois critres sont (heureusement) cohrents, le modle retards chelonns com-
porte 6 retards : linvestissement des entreprises de ce secteur est fonction des profits ra-
liss sur les six derniers trimestres, soit un an et demi. Il convient de noter que seul le
coefficient du sixime retard est significativement diffrent de 0.
Le graphique 1 illustre la structure de pondration des retards pour le modle ainsi
estim.

1. Nous ne revenons pas sur le test de Fisher qui a t dj abondamment illustr.

Les modles dcalages temporels  187


Graphique 1 Structure de la pondration des retards

Le retard moyen est gal daprs [8] :



6
j
aj
j=0 0,0612 + 2 0,227 + 3 0,168 + . . . + 6 0,237
D= = = 3,64

6 0,011 + 0,227 + 0,168 + . . . + 0,237

aj
j=0

Le dlai moyen de raction est 3,64 trimestres, soit presque une anne.

C. Distribution finie des retards


Considrant que nous avons dtermin la longueur des retards h , il convient
destimer les coefficients ai du modle. Cependant, lutilisation des MCO peut
se rvler impossible du fait de la multicolinarit entre les variables explica-
tives dcales. Cest pourquoi, dans ce contexte, nous allons prsenter une
mthode permettant, moyennant des hypothses sur la forme des coefficients, de
rduire le nombre de paramtres estimer.
Fonction polynomiale des retards (retards dAlmon1)
Nous pouvons imaginer une infinit de formes concernant la distribution des
coefficients ai (graphique 2). La mthode des retards dAlmon est trs utilise,
car elle permet de dgager des profils de retards sadaptant des reprsentations
diffrentes.

1. Almon S., 1965.

188  CONOMTRIE
Cette technique consiste imposer aux coefficients dappartenir un mme
polynme de degr q (graphique 3), tel que :

q
ai = 0 + 1 i + 2 i 2 + . . . + q i q = j i j [12]
j=0

Par exemple, pour un polynme de degr 2 ( q = 2 ), nous avons la squence


des coefficients :
a0 = 0
a0 1 0 0  
a1 = 0 + 1 + 2 0
a1 1 1 1
ou encore = 2 1
a2 = 0 + 21 + 42 a2 1 2 2
2 2
a3 = 0 + 31 + 92 a 3 1 3 3
a = H

Graphique 2 Exemples de structures de retards

Nous pouvons gnraliser la formule prcdente pour h retards et un poly-


nme de degr q .

a0 1 0 0 0 0
a1 1 1 1 1 1
q
a2 1 2 22 2 2
= q [13]
a3 1 3 32 3
. . .. .. .. .. .. .3
.. .. . . . . . ..
ah 1 h h2 hq q
(h + 1, 1) (h + 1, q + 1) (q + 1, 1)

Les modles dcalages temporels  189


Graphique 3 Exemples de retards polynomiaux

Le modle initial Y = Xa + peut alors scrire Y = X H + = Z +


dans lequel X H = Z est la matrice des observations des nouvelles variables
explicatives.
Lestimation par la mthode des MCO des q + 1 coefficients ,
0 , 
( 1 ,. . . , 
q ), permet dobtenir, partir des relations [12], les estimations des
h + 1 paramtres de a ( a0 , 
a1 ,. . . , 
ah ) .
Dans cette mthode, nous sommes confronts un double choix :
la valeur h du nombre de retards (nous avons la rponse, cf. 2),
le degr du polynme.
Le degr du polynme q , q < h , peut tre dtermin laide dun test por-
tant sur la significativit, par rapport 0, du coefficient (q ) de la dernire
nouvelle variable explicative. En partant dune valeur q = h 1 , on teste la
significativit du coefficient du terme le plus lev laide dun t de Student
et on rduit le degr du polynme jusqu ce que ce coefficient soit significatif.
Les logiciels dconomtrie traitant des estimateurs dAlmon offrent la pos-
sibilit dintroduire des contraintes supplmentaires concernant les valeurs des
coefficients a1 et/ou ah+1 afin quelles soient nulles. Cela se justifie par le fait
que a1 est le coefficient thorique de la variable xt+1 qui est sans influence
sur yt .

190  CONOMTRIE
Exercice n 3
fichier C7EX2
Estimation des coefficients laide dun polynme
(mthode dAlmon)
En reprenant le modle Investissement/Profit de lexercice 2, on demande desti-
mer les coefficients par la mthode des retards dAlmon.

Solution
Le corrig de cet exercice est ralis laide de Eviews, qui permet le recours direct
la technique du polynme dAlmon.
Linstruction est la suivante : LS Y C PDL (X, 6, 4, 1)
PDL : Polynomial Distribued Lag
X = srie explicative
h = 6 : nombre de dcalages (rsultat de lexercice 2) ;
q = 4 : degr du polynme (aprs un essai avec q = 5 , le coefficient de la variable
PDL5 nest pas significativement diffrent de 0),
1 = indicateur de la contrainte : a1 = 0 (cet indicateur vaut 0 si lon ne dsire aucu-
ne contrainte, 2 pour la contrainte ah+1 = 0 et 3 pour les deux contraintes simultanes).

Rsultats
Dependent Variable : Y
Method: Least Squares
Included observations : 38 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob.


C 511.6833 143.4181 3.567774 0.0011
PDL01 0.193452 0.120131 1.610334 0.1169
PDL02 0.215794 0.103537 2.084228 0.0450
PDL03 0.055823 0.025884 2.156616 0.0384
PDL04 0.004228 0.001956 2.160957 0.0381
R-squared 0.921681 Mean dependent var 2567.553
Adjusted R-squared 0.912187 S.D. dependent var 424.8027
S.E. of regression 125.8826 Akaike info criterion 12.63066
Sum squared resid 522932.5 Schwarz criterion 12.84613
Log likelihood 234.9825 F-statistic 97.08789
Durbin-Watson stat 0.583162 Prob(F-statistic) 0.000000

Les modles dcalages temporels  191


Les coefficients du polynme (i ) sont reprsents par les variables PDLi, ils sont
(presque) tous significativement diffrents de 0. La prsence dune contrainte entrane la
perte dun degr de polynme.
Le calcul des coefficients et la structure de pondration apparaissent directement
aprs, les coefficients (ai ) sont tous significativement diffrents de 0, sauf ceux des
variables xt et xt5 .
Le graphique 4 prsente les coefficients calculs lors de lexercice 2 et les coeffi-
cients ajusts laide du polynme estim.

Graphique 4 Ajustement des coefficients laide dun polynme de degrs 4

D. Distribution infinie des retards


Dans ce type de modle, leffet de la variable exogne nest plus limit dans le
temps, mais a un effet illimit, bien que, naturellement, cet effet sestompe pour
les priodes anciennes.
 



j j
yt = a j xt j + b0 + t = a j D xt + b0 + t = aj D xt + b0 + t [14]
j=0 j=0 j=0

Afin de se ramener un nombre fini de paramtres estimer, nous devons


postuler une forme particulire que peut prendre la succession des coefficients
a0 ,a1 ,a2 ...
Nous pouvons admettre plusieurs types de spcifications, deux modles par-
ticuliers les plus utiliss font lobjet dune prsentation :

192  CONOMTRIE
une dcroissance gomtrique des effets de la variable exogne avec le
temps ;
une croissance suivie dune dcroissance.

1) Modle de Koyck (progression gomtrique)


Le modle de Koyck1 postule une dcroissance gomtrique de la structure des
retards (graphique 5) telle que, dans le modle [14], les coefficients soient lis
de la manire suivante :
a1 = a0
a2 = 2 a0
et en gnral ai = i a0 avec 0 < < 1
Soit
yt = b0 + a0 xt + a0 xt1 + 2 a0 xt2 + . . . + i a0 xti + . . . + t
ou encore :
yt = b0 + a0 (xt + xt1 + 2 xt2 + . . . + i xti + . . .) + t

Graphique 5 Modle de Koyck :


les coefficients suivent une progression gomtrique

La fonction A(D) associe est alors :


A(D) = a0 + a0 D 1 + 2 a0 D 2 + . . .
Le modle yt = A(D)xt + b0 + t peut alors scrire :
B(D)yt = B(D)A(D)xt + B(D)b0 + B(D)t avec B(D) = A(D)1 .
Or A(D) = a0 (1 + D 1 + 2 D 2 + . . .) = a0 (1 D)1
(somme dune progression gomtrique), nous avons donc B(D) = (1 D)/a0 .

1. Koyck L. M., 1954.

Les modles dcalages temporels  193


Soit (1 D)yt = a0 xt + (1 )b0 + (1 D)t ou encore :
yt = yt1 + a0 xt + (1 )b0 + t t1 [15]

qui est un modle autorgressif erreurs lies dont la procdure destimation a


t expose en I.
Cette transformation qui consiste passer dun modle retards chelon-
ns un modle autorgressif est habituellement appele transformation de
Koyck . Nous pouvons noter que nous passons dun modle retards chelon-
ns, difficile estimer par labondance des paramtres, un modle autorgres-
sif, simple dans sa spcification.

2) Modle de Solow1 (distribution de Pascal)


Les coefficients sont distribus selon :
ai = (1 )r+1 Cr+i
i
i o Cr+i
i
est le coefficient du binme de Newton, r et
sont deux paramtres avec 0 < < 1 et r N .
Pour r = 0 , nous retrouvons la distribution gomtrique de Koyck, le gra-
phique 6 illustre la distribution des coefficients des retards.

Graphique 6 Distribution de Pascal des coefficients pour diffrentes valeurs de r

Le modle gnral scrit :



i=
yt = b0 + (1 )r+1 Cr+i
i
i xti + t ou encore
i=0

yt = A(D)xt + b0 + t [16]
Une dmonstration analogue la prcdente permet dcrire le modle [16]
B(D)yt = B(D)A(D)xt + B(D)b0 + B(D)t avec B(D) = A(D)1

1. Solow R., 1960.

194  CONOMTRIE
avec :
pour r = 0 B(D) = (1 D)/a0 , soit le modle prcdent
pour r = 1 B(D) = (1 D)2 /a0

Soit :
yt = 2yt1 2 yt2 + a0 xt + (1 2 + 2 )b0 + vt [17]

avec vt = (1 2D + 2 D 2 )t = t 2t1 + 2 t2
pour r = 2 B(D) = (1 D)3 /a0
Soit :
yt = 3yt1 32 yt2 + 3 yt3 + a0 xt + (1 3 + 32 3 )b0 + vt [18]

avec vt = (1 3D + 32 D 2 3 D 3 )t = t 3t1 + 32 t2 3 t3
Afin de dterminer les valeurs du paramtre r , Maddala et Rao (1971) sug-
grent lutilisation dune procdure de balayage dont2 la fonction objectif maxi-
miser est le coefficient de dtermination corrig (R )

Exercice n 4
fichier C7EX2

Estimation des coefficients dun modle selon une spcification


des retards de Koyck et une distribution de Pascal
Nous reprenons les donnes du tableau 2 concernant la relation Investissement/Profit,
on demande :
1) destimer les paramtres du modle si on suppose que les coefficients suivent une
spcification de Koyck ;
2) de rechercher lordre dune distribution de Pascal et destimer les paramtres du
modle pour lordre adquat ;
3) de comparer les rsultats obtenus par les diffrentes mthodes employes lors des
exercices 2, 3 et 4 ;
4) enfin, de calculer llasticit de long terme des dpenses dinvestissement au
profit.

Solution

1) On suppose que les coefficients du modle retards chelonns suivent une progres-
sion gomtrique. Daprs [15], lestimation des paramtres du modle seffectue sous la
forme dun modle autorgressif autocorrlation des erreurs.
Les rsultats de lestimation du modle sont les suivants :

Les modles dcalages temporels  195


yt = 222,23 + 0,907yt1 + 0,179xt + et
(2,10) (25,24) (7,59)
n = 43
R 2 = 0,95
(.) = t de Student
DW = 0,97

Nous avons utilis directement la mthode des MCO, car la mthode de correction
dautocorrlation des erreurs envisages en I donne des rsultats quasiment identiques.
Nous obtenons :
 a0 = 0,179 ; 
= 0,907 ;  b0 = 222,23/(1 0,907) = 2 400,23
Le modle peut donc scrire :
yt = 2 400,23 + 0,179 xt + 0,907 0,179 xt1 + 0,9072 0,179 xt2 + . . . + et
ou encore : yt = 0,907 yt1 + 0,179 xt 222,23 + et
2) Nous supposons maintenant que les coefficients suivent une distribution de Pascal.

yt = 40,78 + 1,42yt1 0,54yt2 + 0,096xt + et


(0,40) (13,59) (5,10) (3,83)
n = 42
R 2 = 0,97
(.) = t de Student
DW = 2,22

Il sagit donc destimer des modles autorgressifs dordre 1, 2, 3, etc. Afin de dter-
miner lordre, nous avons procd toutes les estimations de ces modles. partir dun
modle autorgressif dordre 3, les coefficients ne sont plus significativement diffrents
de 0. Le modle autorgressif dordre 1 ayant dj t estim, nous avons procd les-
timation du modle dordre 2.
Daprs [17], nous obtenons en procdant par identification :


0,541 1,426/2 0,72 ; 
a0 = 0,096 ;

b0 = 40,78/(1 2
+
2 ) = 40,78/0,0784 = 520,15

Le modle estim est alors :


yt = 1,426 yt1 0,541 yt2 + 0,096 xt + 40,78 + et


i=
ou encore : yt = 520,15 + (1 0,72)2 C1+i
i
0,72i xti + et
i=0

196  CONOMTRIE
3) Comparaison des mthodes
Nous pouvons construire le tableau 4 dans lequel nous indiquons les valeurs des
coefficients associes chaque retard (limits 6 pour les modles retards infinis), la
somme des retards et le dlai moyen, ceci pour les quatre mthodes employes.

Tableau 4 Comparaison des mthodes de calcul des coefficients

Retard Non Almon Koyck Pascal


i contraint1 q=4 r=1

0 0,01138 0,0292 0,1795 0,0784


1 0,06126 0,09733 0,1623 0,0169
2 0,22756 0,19701 0,1472 0,2438
3 0,16793 0,18851 0,1335 0,2926
4 0,11893 0,0920 0,1211 0,3160
5 0,00016 0,02912 0,1098 0,3185
6 0,23717 0,22298 0,0996 0,3058

Somme 0,0814 0,7977 0,9530 1,7246


Dlai moyen 3,6421 3,6459 2,1026 3,6104

la lecture de ces rsultats, nous constatons la diversit des profils des coefficients
estims. En effet, nous avons tent, des fins pdagogiques, de faire correspondre les
coefficients des structures bien dtermines qui reprsentent des spcifications de
modles diffrentes les unes des autres. Dans la pratique, cette dmarche est absurde car
il convient de tester une seule forme de spcification :
soit celle que la rflexion conomique nous conduit retenir ;
soit celle dont le profil du modle non contraint semble la plus proche.
4) Calcul de llasticit de long terme des dpenses dinvestissement au profit.
En considrant le modle distribution gomtrique des retards o la variable exo-
gne et la variable endogne sont sous forme logarithmique :
Log yt = b0 + a0 Log xt + a0 Log xt1 + 2 a0 Log xt2 + . . . + t

Le modle, sous forme rduite, sexprime par :


Log yt = Log yt1 + a0 Log xt + c0 + vt

Llasticit de long terme est gal 2 : e LT = a0 /(1 ) , llasticit de court terme


est donne par : eC T = a0 , et le paramtre dajustement est .
Lestimation du modle Dpenses dInvestissement/Profit sous forme logarithmique
conduit aux rsultats suivants :

1. Modle non contraint = estimation libre des coefficients.


2. Llasticit de long terme est la somme des lasticits (les coefficients) aux diffrents dcalages,
soit une somme dune progression gomtrique de premier terme a0 et de raison .

Les modles dcalages temporels  197


Log yt = 0,904 Log yt1 + 0,184 Log xt 0,699 + vt
(27,3) (8,48) ( 2,36)
n = 43
R 2 = 0,95
() = t de Student
a0 /(1 
Soit : e LT =  ) = 0,184/(1 0,904) = 1,91.
Llasticit de long terme est donc gale 1,91, nous sommes dans la zone des ren-
dements croissants. Lorsque le profit augmente par exemple de 10 %, linvestissement
long terme augmente de 19,1 %.

III. Deux exemples de modles dynamiques


Les exemples dapplication des modles dcalages sont trs nombreux dans la
littrature. Nous allons en prsenter deux particulirement intressants.

A. Le modle dajustement partiel


Le plus souvent, en conomie, la rigidit des institutions ou des structures
empche les variables expliquer datteindre le niveau dsir en une seule prio-
de. Examinons deux exemples :
Afin de faire face une augmentation de la demande, une entreprise cherche
se doter de moyens de production supplmentaires. Cependant cet investisse-
ment ne peut pas tre ralis immdiatement et demande un certain temps
dajustement.
Lors de laugmentation des prix du ptrole, les consommateurs et les institu-
tions ragissent avec retard cette modification des prix. Il en rsulte qu
court terme le comportement des consommateurs ne reflte pas lajustement
qui sest produit long terme.
La formulation de ce modle est la suivante :
il est ncessaire de distinguer entre la valeur dsire, de la variable expli-
quer (ytD ) , et la valeur vraie de cette mme variable (yt ) . Le niveau dsir de la
variable expliquer est fonction de la variable explicative xt tel que :
ytD = a0 + a1 xt + t [19]

Une modification de la valeur de xt entrane une modification de la valeur


dsire de la variable expliquer. Cependant, malgr une spcification simple,
nous ne pouvons pas appliquer les MCO puisque nous navons aucune mesure

198  CONOMTRIE
de y Dt . En revanche, nous connaissons les valeurs de yt et nous pouvons spci-
fier une relation entre ytD et yt :
yt yt1 = (ytD yt1 ) avec 0   1 [20]

est appel le coefficient dajustement.


La relation [20] reprsente lajustement progressif qui sopre entre la valeur
dsire et la valeur observe.
Ce modle peut se ramener de manire simple un modle de Koyck.
En substituant lquation [19] dans [20], on obtient :
yt yt1 = (a0 + a1 xt + t yt1 ) ou encore
[21]
yt = (1 )yt1 + a0 + a1 xt + t
yt = b1 yt1 + c0 + c1 xt + vt dont on peut estimer les paramtres par la mthode
des MCO, avec b1 = (1 ) ; c0 = c0 ; c1 = a1 .

B. Le modle danticipations adaptatives


Dans cette spcification, les valeurs de la variable expliquer yt sont fonctions
des valeurs, non pas observes dune variable explicative, mais des valeurs
attendues, telles que :
yt = a0 + a1 xtP + t [22]
o xtP est la valeur prvue de la variable explicative xt .
Par exemple, la production dune entreprise est fonction des valeurs prvues
des ventes.
Comme pour le modle prcdent, nous sommes confronts labsence de
mesure de la variable xtP . Pour lever cette difficult, nous devons poser une
hypothse concernant la formation de la variable xtP : celle des anticipations
adaptatives.
Cette relation scrit :
xtP xt1
P P
= (xt xt1 ) avec 0   1 [23]
o est le coefficient danticipation.
Nous remarquons que si = 0 , lanticipation reste constante quelles que
soient les ralisations de xt , le modle ne ragit pas aux nouvelles valeurs rali-
ses. Si = 1, au contraire, les valeurs anticipes sont toujours gales aux
valeurs courantes. Dans la pratique, ce coefficient est donc compris entre ces
deux valeurs en fonction du degr de ractivit de lanticipation.
Lquation [23] peut aussi scrire :
P
xtP = xt + (1 )xt1 en dveloppant cette formule il vient :

Les modles dcalages temporels  199


xtP = xt + (1 )xt1 + (1 )2 xt2 + (1 )3 xt3 + . . .

i=
xtP = (1 )i xti [24]
i=0

En remplaant xtP par son expression dans [22] :



i=
yt = a0 + a1 (1 )i xti + t
i=0

qui est un modle retards chelonnes1 dont une transformation de Koyck per-
met de mettre sous une forme autorgressive :
yt = a0 + a1 xt + (1 )yt1 + [t (1 )t1 ]
Nous pouvons estimer ce modle autorgressif autocorrlation des erreurs,
et ainsi, en dduire une estimation des paramtres , a0 , a1 .
Il est noter que ces deux modles peuvent tre combins, bien qualors
cette spcification semble un peu abondante et dinterprtation dlicate.

Exercice n 5
fichier C7EX2
Estimation dun modle dajustement partiel
et danticipations adaptatives
partir des donnes du tableau 2, on dsire estimer les paramtres dun modle
dajustement partiel et les paramtres dun modle danticipations adaptatives.

Solution
Nous estimons le modle autorgressif dordre 1 avec autocorrlation des erreurs
(mthode Hildreth-Lu) :
yt = 103,07 + 0,882 yt1 + 0,1555 xt + et
(0,47) (11,04) (4,41)
et = 0,5489 et1 + vt
R 2 = 0,96 ; n = 42 ; DW = 1,83 ; () = t de Student
Soit : 
= 1 0,882 = 0,1178 ; 
a0 = 103,07/0,1178 874,9 ;

a1 = 0,1555/0,1178 1,32
Modle dajustement partiel :
ytD = 874,9 + 1,32 xt + et et yt yt1 = 0,118(ytD yt1 )
Modle danticipations adaptatives :
P P
yt = 874,9 + 1,32 xtP + et et xtP xt1 = 0,118(xt xt1 )

1. Nous remarquons que la valeur de la variable expliquer y dpend dune pondration gom-
triquement dcroissante de la variable explicative x . Cette structure de pondration est le fon-
dement de la mthode de prvision appele lissage exponentiel .

200  CONOMTRIE
Exercice n 6
Modlisation du prix dune matire premire
Nous nous intressons modliser lvolution du prix dune matire premire yt
selon un modle autorgressif dordre 1 et une variable exogne xt la demande par-
tir dune quation de la forme : yt = a1 yt1 + a2 xt + t [E1] avec t rpondant aux
hypothses classiques. Les donnes ont t pralablement centres sur leur moyenne.
Lestimation de lquation [E1] sur 22 priodes donne :

yt = 0,757yt1 + 0,256xt + et [E2]


(0,025) (0,02)

R2 = 0,996 ; DW = 2,17 ; n = 22 ; (.) = cart type


1) Le coefficient de dtermination a-t-il une signification dans cette quation ?
2) Le coefficient a2 est-il significativement diffrent de zro ?
3) Les erreurs du modle sont-elles autocorrles lordre 1 ?
4) Quel est, long terme, linfluence dune augmentation de la demande xt de 1 unit
sur le prix yt ?
5) En effectuant une nouvelle rgression de yt sur yt1 seule, on obtient :

yt = 0,615yt1 + et [E3]
(0,044)

R2 = 0,981 ; DW = 1,64 ; n = 22
Est-il normal ou fortuit que le R2 soit plus lev dans lquation [E2] que dans
lquation [E3] ?
6) En tant la variable xt dans la rgression [E3] le coefficient de yt1 a t modifi,
pourquoi ?
7) Que signifierait un modle du type yt = ayt1 + t dans lequel a serait suprieur l ?
8) Lestimation selon une mme spcification mais pour une autre matire premire
donne :

yt = 0,695yt1 + 0,336xt + et [E4]


(0,053) (0,046)

R2 = 0,984 ; DW = 2,27 ; n = 22
Les coefficients a1 sont-ils significativement diffrents entre la rgression [E2] avec
ceux de lquation [E4] ?

Solution

1) Bien que le modle ne possde pas de terme constant, le R2 peut sinterprter car les
donnes ont t pralablement centres sur leurs moyennes.

Les modles dcalages temporels  201


2) Le coefficient a2 est significativement diffrent de zro car t* = 0,256/0,02 = 12,8 >
0,05
t19 = 2,09.
3) Nous sommes dans les conditions dapplication de la statistique de Durbin et Watson
car bien que le modle ne possde pas de terme constant, le DW peut sinterprter car
les donnes ont t pralablement centres. Mais il existe un biais de sous-estimation d
au modle autorgressif. Il faut calculer le h de Durbin :

n DW
h= 2
avec = 1 2,17/2 = 0,085
1 n a1 2
n = nombre dobservations
2
a1 = variance estime du coefficient a1 de la variable dcale
Cette statistique h est distribue de manire asymptotique comme une variable nor-
male centre rduite. Ainsi, il y a quivalence entre les deux tests dhypothses suivants :
H0 : = 0 H0 : h = 0
H1 : 0 H1 : h 0
Si |h| < t /2 nous acceptons lhypothse H0 dindpendance des erreurs.
(t 0,05 = 1,96 valeur issue de la loi normale pour un test bilatral au seuil de 5%).

22
|h| = 0,085 = 0,40 < t 0,05 = 1,96 , nous acceptons lhypo-
1 22 0,0252
thse dindpendance des erreurs.
4) la priode 1 : yt = 0,757yt1 + 0,256xt = 0,757 0 + 0,256 1 = 0,256
la priode 2 : yt = 0,757 0,256 = 0,194
la priode 3 : yt = 0,757 0,194 = 0,146
Il sagit dune progression gomtrique de premier terme U0 = 0,256 et de raison
q = 0,757 < 1.
La somme tend vers une limite finie et est gale : U0 / (1 q) = 0,256 / ( 1 0,757)
= 1,053.
Le prix augmentera de 1,053 unit long terme.
5) Il est normal que le R2 soit plus lev dans lquation [E2] que dans lquation [E3]
car une variable explicative a t retire du modle ce qui entraine une diminution de la
somme des carres des rsidus.
6) cause de la covariance existant entre les variable yt1 et xt .
7) Un modle du type yt = ayt1 + t dans lequel le coefficient a serait suprieur l
conduirait une solution explosive (croissance infinie) ce qui impossible.
8) Tests de comparaison de coefficient
H0 : a1,MP1 = a1,MP2
H1 : a1,MP1 a1,MP2
(a1,M P1 a1,M P2 ) 0 0,757 0,695
t = = = 1,05 suit une Student
a1,M P 1 a1,M P 2 0,0252 + 0,0532
n 1 + n 2 6 = 38 degrs de libert, la covariance entre a1,MP1 et a1,MP2 est nulle car les
deux rgressions sont indpendantes (les deux chantillons sont diffrents),
t = 1,05 < t 0,05
= 1,96 donc non rejet de H0.

202  CONOMTRIE
Exercice n 7
Un modle dvaluation de la politique marketing
Nous intressons mesurer limpact de la publicit et des promotions sur les ventes
dun produit. Les impacts sont mesurs au moyen destimations en coupe instantane
menes sur des chantillons reprsentatifs de produit de grande consommation forte
pression marketing de deux secteurs : les produits cosmtiques et les dtergents.
Les chiffres entre parenthses sous les coefficients de rgression sont les carts types
des coefficients.

Partie A
Le premier modle test est le suivant :

Vit = a0 + a1 Pu it + a2 Prit + it [E1]

Vit = Vente en volume du produit i pour lanne t


Pu it = Dpenses publicitaires en euros pour le produit i pour lanne t
Prit = Dpenses promotionnelles en euros pour le produit i pour lanne t
Les rsultats obtenus pour une anne (t = 1) pour le secteur des cosmtiques est le
suivant :
Vi = 812,86 + 29,94Pu i + 21,31Pri + ei i = 1, ..., 20
(10,73) (8,23)

R2 = 0,868 ; DW = 1,68 ; Somme des Carrs des Rsidus = SCRC = 291


1) Interprter dun point de vue statistique ce rsultat destimation.
2) Thoriquement si lentreprise respecte une politique optimale dallocation de son
budget publi-promotionnel (marketing mix), les effets positifs dun euro dpens en
publicit ou en promotion sont gaux ( a1 = a2 ). Sachant que Cov( a1 , a2) = 6,75, effec-
tuez le test permettant de savoir si cette politique optimale est vrifie.
3) Une interrogation concernant les tudes menes sur des chantillons dentreprises
rside en lexistence de comportements homognes.
Nous procdons donc deux nouvelles estimations.
Les rsultats obtenus pour la mme anne (t = 1) pour le secteur des dtergents est
le suivant :
Vi = 627,32 + 14,27Pu i + 17,87Pri + ei i = 1, ..., 20
(3,12) (5,57)

R2 = 0,41 ; DW = 1,68 ; SCRD = 249


Les rsultats obtenus pour la mme anne (t = 1) pour le secteur des dtergents et
des cosmtiques sont les suivants :
Vi = 785 + 16,56Pu i + 18,91Pri + ei i = 1, ..., 40
SCRT = 926

Les modles dcalages temporels  203


Tester lhomognit des comportements dans ces deux secteurs. Quen concluez-
vous ?
4) Dans le mme esprit nous disposons pour le secteur des cosmtiques dune estima-
tion pour lanne suivante (t = 2), nous allons donc chercher tester la stabilit tempo-
relle pour ce secteur.
Sachant que lestimation du modle en t = 2 indique SCR2 = 316 (i = 1, ... , 20) et
quune estimation pour t = 1 et t = 2 indique SCRT = 1054, quen concluez-vous ?

Partie B
Un des problmes de ce type de modlisation consiste en un biais d des variables
omises, en particulier des variables caractristiques du produit.
1) Supposons que ces variables soient additives et peuvent tre synthtises globalement
par une seule note Fi , cette variable est constante dans le temps car il sagit dune
caractristique permanente du produit. Cependant cette variable nest pas mesurable.
Le modle scrit donc maintenant :

Vit = a0t + a1t Pu it + a2t Prit + Fit + it [E2]

O t dsigne lanne destimation et i le produit.


Sachant que nous disposons des donnes pour 20 produits pour deux annes cons-
cutives, comment estimer les paramtres du modle intgrant cet effet individuel sans
quil apparaisse effectivement ?
2) Si cet effet individuel nest pas additif mais multiplicatif nous considrons alors quil
peut tre fonction du budget marketing Mit du produit i pour lanne t. On appelle
Vt
kt = , le rapport moyen entre les ventes totales et le budget total marketing dans
Mt
lchantillon pour tous les produits pour lanne t.
Sous lhypothse que les effets individuels sont constants dans le temps on peut dfi-
   
V V Vi(t1)
nir une variable telle que = kt1
M M i(t1) Mi(t1)
Interprter le sens de cette variable conomique. En quoi son introduction dans
lquation [E1] permet-elle de mesurer les effets individuels ?
3) On a obtenu pour les secteurs des cosmtiques et des dtergents les rsultats pour
lanne t = 1.
Cosmtique :
 
V
Vi = 582 + 25,19Pu i + 23,81Pri 0,97 + ei i = 1,...,20
M i(t1)
(9,3) (5,7) (0,37)
R2 = 0,967
Dtergent :
 
V
Vi = 328 + 17,78Pu i + 18,74Pri 0,49 + ei i = 1,...,20 .
M i(t1)
(5,7) (8,2) (0,21)
R2 = 0,967

204  CONOMTRIE
Laugmentation des coefficients de dtermination R2 pour chaque quation est-elle
suffisante pour affirmer que la relation estime est de meilleure qualit que lquation
[E1] ? Sinon comment jugez-vous de lamlioration ou la dtrioration des rsultats.
 
V
4) Les coefficients des variables pour le modle cosmtique et dtergent
M i(t1)
sont-ils significativement diffrents ?

Partie C
Un des biais envisageables dans lquation [E1] est que les ventes dun produit
soient fonction dun vnement imprvu. Dans cette situation, cela peut crer un biais
sur les ventes du produit qui diffre de ce quelles seraient dans des conditions normales.
Pour effectuer des prvisions correctes, on peut redresser ce biais en introduisant comme
variable supplmentaire dans [E1] les ventes de la priode prcdente :

Vit = a0 + a1 Pu it + a2 Prit + a3 Vit1 + it [E3]

On a obtenu pour les secteurs des cosmtiques les rsultats pour lanne t = 1.

Vit = 1,52 + 2,52Pu it + 6,36Prit + 0,75Vit1 + eit i = 1,...,20 [E4]


(1,1) (1,7) (0,3)

R2 = 0,979
1) Interprter dun point de vue statistique et conomique ces rsultats, est-il envisa-
geable dans lquation [E3] de tester une ventuelle autocorrlation des erreurs ?
2) Pour ce modle cosmtique nous avons effectu la rgression suivante :

eit2 = 2,1Pu it + 0,18Prit + 5,8 + u it i = 1,...,20


(0,2) (0,5)

eit = Rsidu de la rgression [E4]


Pourquoi procder cette rgression ? Quen concluez-vous et que proposez-vous ?

Solution

A.1) Soit les tests suivants mener.


Test de significativit globale de la rgression : H0 : a1 = a2 = 0
R 2 /k 0,868/2
Soit le test de Fisher : F = =
(1 R 2 )/(n k 1) (1 0,868)/(20 2 1)
0,05
= 55,89 > F2;17 = 3,59 , nous rejetons lhypothse H0, il existe au moins une variables
Pu i ou/et Pri dexplicative de Vi
Tester H0 : a1 = 0 contre lhypothse H1 : a1 0
Le test dhypothses bilatral consiste donc comparer le ratio de Student empi-
a1
rique ta1 = = 2,79 la valeur du t de Student lue dans la table 20 2 1 = 17
a1
0,05
degrs de libert et pour un seuil de probabilit gal 5%, soit t17 = 2,11. Puisque
0,05
ta1 = 2,79 > t17 = 2,11 , nous refusons lhypothse H0, le coefficient a1 est donc
significativement diffrent de 0.

Les modles dcalages temporels  205


Soit tester H0 : a2 = 0 contre lhypothse H1 : a2 0
a2 0,05
ta2 = = 2,59 > t17 = 2,11 nous refusons lhypothse H0, le coefficient a2 est
a2
donc significativement diffrent de 0.
Le modle tant spcifi en coupe instantane et nayant aucune information sur
un ventuel tri des donnes selon un critre, la statistique de Durbin et Watson nest pas
interprtable.
A.2) Le test dhypothse est : H0 : a1 = a2
|(a1 a2 ) 0|
Sous lhypothse H0 t = suit une loi de Student 17 degrs de
a1 a2
libert.
Il convient de calculer : a1 a2

Var(a1 a2 ) = Var(a1 ) + Var(a2 ) 2 Cov(a1 ,a2 )


= 10,732 + 8,232 2 6,75 = 169,36
|29,94 21,31| 0,05
Do : t = = 0,66 < t17 2,11 . Nous acceptons lhypothse
169,36
H0, la politique optimale est donc respecte.
A.3) Soit tester (test de Chow) lhypothse H0 : SC RT = SC R D + SC RC H0 :
SC RT (SC R D + SC RC ) = 0
La statistique du Fisher empirique du test de Chow est donne par :
(SC RT (SC R D + SC RC ))/(k + 1)
F = qui suit alors une loi de Fisher
(SC R D + SC RC )/(n 2(k + 1))
(k + 1) et n 2(k + 1) degrs de libert.
(926 (291 + 249))/3 0,05
Soit, F = 8,10 > F3;34 2,92 . Nous refusons lhypo-
(291 + 249)/(34)
thse H0, les comportements sont htrognes entre les deux secteurs.
A.4) Il sagit toujours du test de Chow mais men maintenant en donnes temporelles.
(1 054 (291 + 316))/3 0,05
Soit, F = 8,34 > F3;34 2,92 . Nous rejetons lhy-
(291 + 316)/(34)
pothse H0, les comportements sont diffrents, sur les deux annes tudies, pour le sec-
teur des cosmtiques.
B.1) Nous avons :
Vit = a0t + a1t Pu it + a2t Prit + Fit + it
Vit1 = a0t1 + a1t1 Pu it1 + a2t1 Prit1 + Fit1 + it1
Puisque les effets sont constants nous avons : Fit = Fit1
Nous pouvons alors crire :
Vit Vit1 = (a0t a0t1 ) + a1t Pu it a1t1 Pu it1 + a2t Prit a2t1 Prit1
+it it1
Lestimation de ce modle permet de lever le biais du aux caractristiques de
produit.

206  CONOMTRIE
 
V Vi(t1) Vi(t1) V(t1)
B.2) La variable = kt1 = mesure les dvia-
M i(t1) Mi(t1) Mi(t1) M(t1)
tions individuelles du produit i par rapport au ratio des ventes totales sur les dpenses
marketing totales pour tous les produits de lanne antrieure. Ainsi cette variable capte
ce qui est spcifique du produit par rapport au comportement moyen tendanciel. Si le
coefficient de cette variable nest pas significativement diffrent de 0, cela signifie que
les produits ont tous le mme comportement et donc quil nexiste pas deffet individuel.
B.3) Le coefficient de dtermination est insuffisant pour valuer la pertinence dajout
dune variable explicative supplmentaire car mme une variable non significative
contribue augmenter la somme des carres expliques. En revanche il convient def-
fectuer un test de significativit par rapport 0 sur la variable nouvellement introduite.
|0,97|
Soit pour le secteur cosmtique : ta3 = = 2,62 et pour le secteur Dtergent :
0,37
|0,49| 0,05
ta3 = = 2,33, les deux ratios sont suprieurs t17 = 2,11. Lajout de la
0,21
 
V
variable contribue significativement lexplication des ventes, il existe des
M i(t1)
effets individuels par produit. De plus, les coefficients des variables Publicit et
Promotion sont significativement diffrents de 0 et leurs valeurs se rapprochent, ce qui
correspond mieux lintuition thorique.
B.4) Le test dhypothse est : H0 : a3C = a3D
|(a3C a3D ) 0|
Sous lhypothse H0, t = suit une loi de Student
a3C a3D
n 1 + n 2 2(k + 1) = 32 degrs de libert.
Il convient de calculer : a3C a3D

Var(a3C a3D ) = Var(a3C ) + Var(a3D ) 2 Cov(a3C ,a3D )


= 0,372 + 0,212 2 0 = 0,181

Les rgressions tant effectues sur des chantillons indpendants la covariance est
nulle.
| 0,97 + 0,49|
Do : t = 1,13 < t 0,05
1,96 . Nous acceptons lhypothse H0,
0,181
les deux coefficients ne sont pas significativement diffrents entre eux.
C.1) Les coefficients du modle sont tous significativement diffrents de 0, les t de
0,05
Student empiriques des trois coefficients sont suprieurs t17 = 2,11 nous refusons
lhypothse H0 de nullit des coefficients. Nous ne pouvons pas interprter la statistique
de Durbin et Watson car le modle est estim en coupe instantane pour lanne t et nous
ne savons pas si les donnes ont t pralablement tries.
C.2) Lestimation de ce modle permet de tester une ventuelle htroscdasticit des
rsidus (test de White), le coefficient de la variable Pu it est significativement diffrent
de 0, il existe donc une htroscdasticit lie la variable Publicit.
Il convient donc de corriger le modle de lhtroscdasticit en procdant une
1
rgression pondre, dont le facteur de pondration est : .
Pu it

Les modles dcalages temporels  207


Exercice n 8
fichier C7EX8
Une comparaison des courbes de Phillips franaise et amricaine1
Soit les donnes annuelles franaises et amricaines concernant les taux dinflation
et de chmage sur 34 ans. Le but de cet exercice est dessayer de valider empiriquement
les courbes de Phillips. Une dmarche progressive est propose. Dans un premier temps,
vous devrez estimer la courbe qui relie le taux dinflation au taux de chmage, puis celle
qui relie linflation et le chmage retarde dune priode. Dans un deuxime temps,
nous prendrons mieux en compte la dynamique qui relie linflation (niveau gnral des
prix) linflation salariale afin de valider empiriquement les mcanismes invoqus par
Phillips. Enfin, dans un dernier temps, les anticipations dinflation formes de manire
adaptative seront prises en compte. Il est noter que les sries peuvent suivre une dyna-
mique dite non-stationnaire , des procdures destimation abordes au chapitre 9 per-
mettent alors den tenir compte.
chofra = Chmage France
chousa = Chmage tats-Unis
inffra = Taux dinflation France
infusa = Taux dinflation tats-Unis

Premire partie : Courbes inflation-chmage

1) Visualiser successivement les deux courbes de chaque pays inflation-chmage dans


le plan (chmage en abscisse et inflation en ordonne). Constater la grande instabilit
de celles-ci.
2) Estimer conomtriquement les deux quations inflation-chmage (respectivement
France et tats-Unis) qui relient le niveau dinflation, variable explique (nomms res-
pectivement inffra et infusa) une constante et au niveau retard du chmage, variable
explicative (nomms respectivement chofra et chousa).
Constater que cela ne modifie pas notablement les rsultats de prendre comme variable
explicative le taux de chmage contemporain et le taux de chmage retard. Dornavant,
nous considrerons le taux de chmage retard.
3) Examiner les rsidus des deux quations (chmage retard). Vous semblent-ils lis
par une dynamique cyclique ? (prsomption dautocorrlation des rsidus). Existe-t-il
des rsidus trs loigns des autres ? (prsomption de valeurs aberrantes).
4) Effectuer les tests de Durbin-Watson. Confirmer vos rsultats en utilisant les tests
dautocorrlation des rsidus de Breusch-Godfrey.

1. Merci Jean-Franois Jacques, professeur lUniversit de Paris-Est-Marne-la-Valle, auteur


de ce cas.

208  CONOMTRIE
Deuxime partie : courbes de Phillips originelles (sans anticipation dinflation)
avec autocorrlation des rsidus et choc ngatif doffre (anne 11 et anne 17)

5) Construire une variable indicatrice appele DUM qui vaut 0 chaque date lexcep-
tion des priodes 11 et 17 pour lesquelles elle vaut 1.
6) Soit les trois quations suivantes :
quation de Phillips originelle qui relie le taux de croissance des salaires nominaux
(wt ) au taux de chmage (u t ) : wt = (u u t1 ) avec u = constante.
quation qui relie inversement le taux de croissance de la production ( yt ) et celui du
1
chmage (pseudo-loi dOkun) : yt = u t avec u t = (u t u t1 ).

quation de quasi-offre ou ce qui identique formellement quation de fixation des prix
(pt ) en taux de croissance en concurrence imparfaite : pt = c yt + wt .
Montrer quil est possible, partir de ces quations, dcrire une dynamique qui relie le
taux dinflation pt une constante, au niveau du chmage u t et au niveau du chmage
retard u t1.
Estimer conomtriquement cette quation. Est-ce que cela amliore les rsultats de la
premire partie ?
7) Estimer de nouveau le modle de la question 6 en introduisant dans la liste des
variables explicatives la variable DUM et en corrigeant de lautocorrlation des rsidus
(cf. chapitre 5).

Troisime partie : courbes de Phillips augmentes des anticipations dinflation

8) On cherche maintenant estimer un modle intgrant des anticipations dinflation :


pt = a0 + a1 pt1 + a2 u t + a3 u t1 + t
Estimer cette relation inflation-chmage en ignorant lautocorrlation des rsidus mais
en conservant la variable DUM. En faisant un test du h de Durbin (prsence de la
variable endogne retarde, cf. chapitre 7, I. B.) confirmer quil nexiste plus dautocor-
rlation des rsidus.
9) Raliser sur ce nouveau modle des tests de Chow la priode 21 pour la France et
la priode 18 pour les tats-Unis (date de dbut des politiques de dsinflation).
Attention : la variable DUM doit tre retire de la rgression.
10) Construire les sries pour la France et les tats-Unis (phifra et phiusa)
phi = pt a1 pt1 a4 dum , les coefficients de rgression proviennent du rsultat de la
question 8. Puis regarder lallure de la courbe dans le plan chmage en abscisse et phi
en ordonn. Que constatez-vous lorsque que lon supprime les dplacements verticaux
de long terme de la courbe de Phillips dus aux anticipations et aux chocs doffre ? Une
politique de dsinflation est-elle plus coteuse, en termes de chmage, en France ou aux
tats-Unis ?

Solution

1) la lecture des reprsentations graphiques (graphique 7) de la relation inflation-ch-


mage pour la France et pour les tats-Unis, nous pouvons penser quil est trs difficile
de trouver une relation significative, pour les deux pays, entre le taux de chmage et le
taux dinflation une date donne car les deux courbes sont trs instables.

Les modles dcalages temporels  209


14 14

12 12

10
10
8

INFUSA
INFFRA

8
6
6
4

4 2

2 0
2 3 4 5 6 4 5 6 7 8

CHOFRA CHOUSA

Graphique 7 Relation inflation-chmage pour la France et pour les tats-Unis

2) Estimations conomtriques.
Les rsultats obtenus pour la France sont les suivants :

Dependent Variable: INFFRA


Included observations: 33 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob.


C 8.918367 1.304888 6.834582 0.0000
CHOFRA(1) 0.442073 0.173685 2.545262 0.0161

DW = 0,23

On remarque que la probabilit critique de la variable chofra(1) est infrieure


5 %, donc le taux de chmage retard est une variable significative et dont le coefficient
est ngatif, ce qui est conforme lintuition conomique.
Estimons maintenant la relation entre linflation et le taux de chmage contemporain.
Dependent Variable: INFFRA
Included observations: 34

Variable Coefficient Std. Error t-Statistic Prob.


C 8.273400 1.322230 6.257158 0.0000
CHOFRA 0.345105 0.171588 2.011250 0.0528

Dans ce cas, nous remarquons que le taux de chmage contemporain nest pas aussi
significatif. En effet, la probabilit critique est lgrement suprieure 5 % mais reste
quand mme acceptable.
Pour les tats-Unis :
Dependent Variable: INFUSA
Included observations: 33 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob.


C 5.718162 2.147358 2.662883 0.0122
CHOUSA(1) 0.093347 0.343655 0.271629 0.7877

DW = 0,42

210  CONOMTRIE
Dependent Variable: INFUSA
Included observations: 34

Variable Coefficient Std. Error t-Statistic Prob.


C 2.329524 2.082007 1.118884 0.2715
CHOUSA 0.449518 0.335099 1.341446 0.1892

On remarque que ni le taux de chmage retard, ni le taux de chmage contempo-


rain ne sont significatifs car leurs probabilits critiques sont suprieures 5 %.
Nous pouvons donc conclure que le fait de prendre le chmage retard ou le ch-
mage contemporain ne change pas significativement les rsultats. Nous prendrons donc
dans la suite le chmage retard afin de rester homogne par rapport la France.

3) La reprsentation graphique (graphique 8) des rsidus de la relation inflation-chma-


ge retard pour la France et pour les tats-Unis laisse supposer une prsence dautocor-
rlation positive des rsidus car il semblerait que les rsidus soient lis par une dyna-
mique cyclique. En ce qui concerne les points aberrants, il apparat des rsidus loigns
pour les priodes 10 et 18 pour la France alors que pour les tats-Unis, les rsidus sont
levs pour les priodes 10 et 17.

8 10
6
8
4
6
2
4
0
2
-2

-4 0

-6 -2

-8 -4
5 10 15 20 25 30 5 10 15 20 25 30

INFFRA Residuals INFUSA Residuals

Graphique 8 Reprsentation des rsidus pour la France et pour les tats-Unis

4) Tests dautocorrlation des erreurs.


Pour la France, il est possible dappliquer le test de Durbin et Watson la relation entre
linflation et le taux de chmage retard car le nombre dobservations est suprieur 15,
la variable expliquer ne figure pas parmi les variables explicatives et le modle est sp-
cifi en sries temporelles. La statistique de Durbin et Watson est gale 0,23. Dans la
table de Durbin et Watson, pour 33 observations et une variable explicative, on trouve
que d1 = 1,38 et d2 = 1,51. La statistique de Durbin et Watson dans ce cas est infrieure
d1, on peut donc conclure une autocorrlation positive des erreurs.
Il est galement possible de faire le test de Breusch-Godfrey.

Breusch-Godfrey : Serial Correlation LM Test:


F-statistic 73.24807 Probability 0.000000

On rejette lhypothse dabsence dautocorrlation car la probabilit critique du


Fisher est trs infrieure 5 %.

Les modles dcalages temporels  211


Pour les tats-Unis, la statistique de Durbin et Watson est gale 0,42. Or d1 et d2
ont les mmes valeurs que pour la France, donc on peut conclure une autocorrlation
des erreurs.

Breusch-Godfrey : Serial Correlation LM Test:


F-statistic 48.13823 Probability 0.000000

On rejette lhypothse dabsence dautocorrlation car la probabilit critique du


Fisher est infrieure 5 %. On peut donc conclure une autocorrlation positive des
erreurs.

5) Construire une variable appel DUM qui vaut 0 chaque date lexception des
priodes 11 et 17 pour lesquelles elle vaut 1.

6) Estimation de la courbe de Philips sans autocorrlation des rsidus.


Soit le systme suivant :
wt = (u u t1 ) (1)
yt = 1 u t (2)
pt = c yt + w (3)
En remplaant dans lexpression (3) yt et wt par les relations (2) et (3), on trouve que :
pt = c( 1 u t ) + (u u t1 )
pt = 1 c(u t u t1 ) + (u u t1 ) car u t = (u t u t1 )
Do pt = c u t ( + 1 c)u t1 + u
Nous pouvons alors estimer cette quation.
Pour la France :
Dependent Variable: INFFRA
Included observations: 33 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob.


C 8.195813 1.341090 6.111305 0.0000
CHOFRA 1.978700 1.187570 1.666176 0.1061
CHOFRA(1) 2.412074 1.194353 2.019565 0.0524
Durbin-Watson stat 0.436616

On remarque que les deux variables ne sont pas significatives car leurs probabilits
critiques sont suprieures 5 %.
Pour les tats-Unis :
Dependent Variable: INFUSA
Included observations: 33 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C 4.123759 2.073971 1.988340 0.0560
CHOUSA 1.363228 0.533217 2.556610 0.0159
CHOUSA(1) 1.192817 0.533991 2.233777 0.0331
Durbin-Watson stat 0.683192

212  CONOMTRIE
En ce qui concerne les tats-Unis, ce modle est plus adapt que les deux prcdents
car les deux variables (chmage et chmage retard) sont significatives.

7) Estimation dun nouveau le modle en introduisant la variable DUM et en prenant en


compte lautocorrlation des rsidus.
Pour la France :
Dependent Variable: INFFRA
Included observations: 32 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C 15.14060 6.269402 2.414999 0.0228
CHOFRA 0.254229 0.522127 0.486910 0.6303
CHOFRA(1) 0.788179 0.495101 1.591958 0.1230
DUM 2.674737 0.797477 3.354000 0.0024
AR(1) 0.866577 0.081842 10.58842 0.0000
Durbin-Watson stat 1.791241

On constate dans ce modle que les chmages retards et contemporains ne sont pas
significatifs.
Pour les tats-Unis :
Dependent Variable: INFUSA
Included observations: 32 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob.


C 12.66870 3.475067 3.645597 0.0011
CHOUSA 0.221311 0.292094 0.757670 0.4552
CHOUSA(1) 0.963667 0.296656 3.248427 0.0031
DUM 2.293875 0.767918 2.987137 0.0059
AR(1) 0.895121 0.086378 10.36288 0.0000
Durbin-Watson stat 1.552390

On remarque que dans ce cas, le chmage contemporain nest plus significatif, alors
que le chmage contemporain ltait dans le modle prcdent, non corrig des auto-
corrlations des rsidus et des points aberrants.

8) On cherche maintenant estimer le modle suivant :


pt = a0 + a1 pt1 + a2 u t + a3 u t1 + t .
Il sagit dun modle autorgressif dordre 1.

Les modles dcalages temporels  213


Pour la France :
Dependent Variable: INFFRA
Included observations: 33 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob.


C 1.663308 0.625929 2.657345 0.0129
INFFRA(1) 0.831080 0.063433 13.10170 0.0000
CHOFRA 0.360813 0.439505 0.820953 0.4186
CHOFRA(1) 0.225252 0.448785 0.501916 0.6197
DUM 4.995335 0.898138 5.561881 0.0000
Durbin-Watson stat 2.195938

Nous remarquons que les variables choffra et choffra(1) ne sont pas significatives ; en
revanche, le terme autorgressif est bien significativement diffrent de 0.
Nous effectuons le test h de Durbin car nous avons un modle autorgressif (prsence
de la variable expliquer comme variable explicative retarde).
Soit le test dhypothses H0 : h = 0 contre H1 : h 0.

n DW
h = || 2
avec = 1 donc = 0,098
1 na1 2

33
h = |0,98| = 0,60 < t 0,05 = 1,96 . Il nexiste donc plus dauto-
1 33 0,06342
corrlation des erreurs.

Pour les tats-Unis :


Dependent Variable: INFUSA
Included observations: 33 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob.


C 3.704137 0.966380 3.833004 0.0007
INFUSA(1) 0.916993 0.115893 7.912443 0.0000
CHOUSA 1.025115 0.356171 2.878159 0.0076
CHOUSA(1) 0.442910 0.295441 1.499151 0.1450
DUM 4.630472 1.005135 4.606815 0.0001
Durbin-Watson stat 2.047469

Dans ce modle, seul le taux de chmage dcal nest pas significatif. On peut ga-
lement effectuer le test du h de Durbin, h = 0,182 qui est trs infrieur 1,96. Il nexis-
te donc plus dautocorrlation des erreurs.

214  CONOMTRIE
9) Tests de Chow1.
Pour la France :
Le test de Chow est effectu la priode 20 comme priode charnire. Comme pour la
deuxime priode, la variable DUM est gale 0 (colinarit avec le terme constant),
nous la retirons pour les deux priodes.
Nous obtenons : SCR = 83,25 ; SCR1 = 70,03 ; SCR2 = 5,056.

Chow Breakpoint Test: 21


F-statistic 0.678912 Probability 0.613020

Pour les tats-Unis :


Nous obtenons : SCR = 80,59 ; SCR1 = 52,04 ; SCR2 = 7,93.

Chow Breakpoint Test: 18


F-statistic 2.148648 Probability 0.104452

Nous acceptons lhypothse que le fait de scinder en deux sous priodes namlio-
re pas le modle pour la France et les tats-Unis.

10) Nous construisons les deux sries phi = pt a1 pt1 a4 dum pour la France et les
tats-Unis :
phi f rat = in f f rat 0,83in f f rat1 4,99dum t
phiusat = in f usat 0,91in f usat1 4,63dum t
la lecture de la reprsentation graphique (graphique 9) pour les tats-Unis et la France
de la relation entre le chmage et phi, nous remarquons que la tendance de la courbe de
la France a une pente moins importante que celle des tats-Unis, ce qui nous permet
dmettre lhypothse quune politique de dsinflation a moins deffets ngatifs aux
tats-Unis quen France. Nous pouvons donc en conclure quune politique de dsinfla-
tion est plus coteuse en termes de chmage en France quaux tats-Unis.

4 5

4
3
3
2
2
1
PHIFRA

PHIUSA

0 0

-1
-1
-2
-2
-3

-3 -4
1 2 3 4 5 6 7 8 9 10 11 12 13 3 4 5 6 7 8 9 10

CHOFRA CHOUSA

Graphique 9 Relation entre le chmage et phi pour la France et pour les tats-Unis

1. titre dexercice, le lecteur vrifiera les rsultats proposs par le logiciel, cf. chapitre 3, IV. B.

Les modles dcalages temporels  215


8. Introduction
aux modles
quations simultanes

e chapitre est une introduction1 aux modles dont la spcification

C ncessite lcriture dquations multiples rlies entre elles au tra-


vers de variables figurant dans plusieurs quations.
Nous ne pouvons pas, sauf cas particulier, utiliser la mthode des MCO
quation par quation comme si chacune de ces quations tait ind-
pendante les unes des autres.
En I., nous envisageons la prsentation matricielle dun modle qua-
tions simultanes et son criture sous forme rduite (les variables
endognes sont exprimes en fonction des seules variables exognes).
Le problme de lidentification, cest--dire la possibilit destimation du
modle sous forme rduite, est tudi en II. Enfin, en III., nous prsentons
les mthodes destimation spcifiques des modles quations simulta-
nes.
Les exercices dapplication se trouvent exceptionnellement tous en fin de
chapitre, la partie thorique tant relativement rduite.

1. Dans le cadre de ce manuel, nous limitons volontairement les dveloppements thoriques qui
peuvent se rvler complexes dans le domaine de lconomtrie en gnral, et des quations
simultanes en particulier. Le lecteur dsirant approfondir ce chapitre peut se rfrer Greene
W.H. chapitre 16, 2000.

Introduction aux modles quations simultanes  217


I. quations structurelles
et quations rduites

Lorsque nous sommes en prsence dun modle linaire quations multiples,


il arrive frquemment quune variable endogne dune quation apparaisse en
tant que variable explicative dune autre quation. Ce double statut de certaines
variables entrane un biais dans les estimations des coefficients lorsque nous
employons les MCO, quation par quation.
Nous allons donc chercher transformer le modle initial en un modle o
les variables endognes ne sont exprimes quen fonction des variables exo-
gnes.

A. Exemple introductif
Considrons le modle macro-conomique trois quations :

Ct = a0 + a1 Yt + 1t [E1]
It = b0 + b1 Yt1 + 2t [E2]
Yt = Ct + It [E3]
avec :
Ct = consommation totale pour lanne t ;
It = investissement total pour lanne t ;
Yt = revenu total pour lanne t .
Ce systme dquations multiples, spcifi par lconomiste, qui traduit
directement les relations entre les variables, sappelle : le systme dquations
structurelles.
Ce modle comporte trois quations dont une identit [E3]. En effet, dans la
relation [E3], il ny a aucun coefficient estimer et par consquent pas de terme
alatoire. Lquation [E1] est une fonction de consommation et lquation [E2]
est relative linvestissement.
Ce systme contient trois variables endognes : Ct , It , Yt et une variable exo-
gne Yt1 . Nous remarquons, par exemple, que la variable Yt apparat comme
variable explicative en [E1], ce qui est contraire son statut de variable endo-
gne.

218  CONOMTRIE
Pour lever ce problme, nous allons exprimer les trois variables endognes
(Ct ,It ,Yt ) en fonction de la seule variable exogne (Yt1 ) .
En substituant [E3] dans [E1], nous obtenons :
Ct = a0 + a1 (Ct + It ) + 1t = a0 + a1 Ct + a1 It + 1t

En remplaant It par son expression [E2] et en faisant passer a1 Ct gauche de


lquation, nous pouvons crire :
(1 a1 )Ct = a0 + a1 b0 + a1 b1 Yt1 + a1 2t + 1t

ou encore :
a0 + a1 b0 a1 b1 a1 2t + 1t
Ct = + Yt1 +
1 a1 1 a1 1 a1
Il en rsulte que :
 
a0 + a1 b0 a1 b1 a1 2t + 1t
Yt = Ct + It = + b0 + + b1 Yt1 + + 2t
1 a1 1 a1 1 a1
a0 + b0 b1 2t + 1t
Yt = + Yt1 +
1 a1 1 a1 1 a1
Les quations structurelles sont alors quivalentes aux quations rduites
(les variables endognes sont exprimes en fonction des seules variables exo-
gnes) :
a0 + a1 b0 a1 b1 a1 2t + 1t
Ct = + Yt1 + [E4]
1 a1 1 a1 1 a1
a0 + b0 b1 2t + 1t
Yt = + Yt1 + [E5]
1 a1 1 a1 1 a1
It = b0 + b1 Yt1 + 2t [E6]

Lquation [E5] indique que la variable Yt est fonction de 1t et par cons-


quent E(Yt 1t ) = 0 . Il en rsulte que, dans lquation [E1], lhypothse dind-
pendance entre la variable explicative Yt et lerreur 1t nest pas respecte et
lapplication des MCO sur le modle [E1] conduit des estimateurs biaiss et
non convergents.
En revanche, lutilisation des MCO sur les quations rduites est licite
puisque la variable Yt1 est indpendante de 1t et 2t .
Il est noter que la forme rduite permet de mesurer leffet total, direct et indi-
rect, dune modification de la variable exogne Yt1 sur les variables endognes.
Par exemple, le schma suivant illustre la cascade des causalits :
[E2] [E3] [E1]
Yt1 It Yt Ct ce qui est rsum dans [E4].

Introduction aux modles quations simultanes  219


B. Le modle gnral
Soit le systme gnral de g quations structurelles liant g variables endognes
k variables prdtermines :
b11 y1t + b12 y2t + . . . + b1g ygt + c11 x1t + c12 x2t + . . . + c1k xkt = 1t
b21 y1t + b22 y2t + . . . + b2g ygt + c21 x1t + c22 x2t + . . . + c2k xkt = 2t
...
bg1 y1t + bg2 y2t + . . . + bgg ygt + cg1 x1t + cg2 x2t + . . . + cgk xkt = gt

Soit, sous forme matricielle :


B Y + C X =
[1]
(g,g) (g,1) (g, k) (k,1) (g,1)
Bien entendu, dans chaque quation, quelques coefficients sont nuls et la
variable dont le coefficient est gal 1 est la variable dpendante. Si une qua-
tion a tous ses coefficients, non nuls, gaux 1 et ne comporte pas de terme ala-
toire, cela signifie quil sagit dune identit (aucun coefficient nest estimer).
Si la matrice B est rgulire, nous passons de la forme structurelle la forme
rduite en exprimant Y en fonction de X , soit :

Y = B 1 C X + B 1 [2]

et nous pouvons appliquer les MCO. En effet, les erreurs B 1 sont indpen-
dantes de X .
Si, sur le plan de la prsentation, la formalisation est simple, sa mise en
uvre pratique est plus complexe. En effet, la connaissance des g k lments
de la matrice (B 1 C) ne permet pas de dterminer didentifier la matrice
B (compose de g g lments) ainsi que la matrice C (compose de g k
lments). Nous sommes alors en prsence de g k quations
(g g) + (g k) inconnues qui, sans restrictions supplmentaires, savrent
impossibles rsoudre, il sagit du problme de lidentification.
Nous allons donc prsenter en II. des rgles simples permettant, partir de
restrictions sur les paramtres, de dterminer des conditions didentification.
titre dillustration le modle introductif peut scrire sous forme matri-
cielle :
      
Ct 1 0 a1 a0 0
U
Y = It ; B= 0 1 0 ; X= ; C= b0 b1 ;
Yt1
Yt 1 1 1 0 0
 
1t
= 2t ( U est le vecteur unit.)
0

220  CONOMTRIE
C. Cas particulier : les modles rcursifs
Un systme dquations est appel rcursif si chaque variable endogne peut
tre dtermine de manire squentielle :
y1t = f (x1t ,x2t . . . xkt ; 1t )
y2t = f (x1t ,x2t . . . xkt ; y1t ; 2t )
y3t = f (x1t ,x2t . . . xkt ; y1t ,y2t ; 3t )
(Les variables alatoires (it ) sont, par hypothse, indpendantes.)
Nous observons que la premire quation ne contient aucune variable endo-
gne. La deuxime quation a pour variable explicative endogne, la
variable de la premire quation, et ainsi de suite.
Lorsquun modle quations simultanes rpond au critre de rcursivit,
il est licite dappliquer la mthode des MCO quation par quation. En effet,
dans ce cas particulier, il y a indpendance entre les variables endognes et les
erreurs. Par exemple, dans la deuxime quation, y1t dpend de 1t mais pas de
2t.
Les modles rcursifs sont aussi appels systme triangulaire car les
coefficients des variables endognes forment un triangle au sein de la matrice B .

II. Le problme de lidentification


A. Restrictions sur les coefficients
Il y a une restriction sur un coefficient de la forme structurelle, chaque fois
quun paramtre est contraint par lcriture du modle tre gal une
valeur dtermine. Nous distinguons deux types de restrictions.

1) Restrictions dexclusion
Nous pouvons considrer que chaque fois quune variable endogne ou exog-
ne napparat pas dans une quation structurelle, cela revient laffecter dun
coefficient nul. Par exemple, dans notre modle introductif, la variable It ne
figure pas dans lquation [E1], son coefficient est donc nul : dans la matrice B ,
llment de la premire ligne et de la deuxime colonne est gal 0.

2) Restrictions linaires
Certaines spcifications de modle imposent que des variables soient affectes
dun coefficient identique, il sagit l encore de restrictions a priori sur les para-
mtres du modle.

Introduction aux modles quations simultanes  221


B. Conditions didentification
Les conditions didentification se dterminent quation par quation. Nous pou-
vons distinguer trois cas didentifications :
le modle est sous-identifi si une quation du modle est sous-identifiable
(il y a moins dquations que de paramtres identifier dans la forme
structurelle, le systme est donc impossible rsoudre) ;
le modle est juste identifi si toutes les quations sont justes identifiables ;
le modle est sur-identifi si les quations du modle sont soit justes iden-
tifiables, soit sur-identifiables.
Si le modle est sous-identifi, il nexiste aucune possibilit destimation des
paramtres du modle, celui-ci doit tre respcifi.
Les conditions didentification peuvent faire lobjet dun dveloppement
complexe, nous nous bornons ici dicter des rgles simples qui sont, dans la
pratique, appliques en premier lieu.
Soit :
g = nombre de variables endognes du modle (ou encore nombre dquations
du modle) ;
k = nombre de variables exognes du modle ;
g = nombre de variables endognes figurant dans une quation ;
k = nombre de variables exognes figurant dans une quation.
Lorsque les restrictions ne sont que des restrictions dexclusion, les condi-
tions ncessaires didentifiabilit snoncent ainsi :
g. 1 > g g + k k lquation est sous-identifie ;
g. 1 = g g + k k lquation est juste identifie ;
g. 1 < g g + k k lquation est sur-identifie.

Ce qui peut se rsumer ainsi : pour quune quation ne soit pas sous-identi-
fie, le nombre de variables exclues de lquation doit tre au moins gal au
nombre dquations du modle moins 1.
Lorsque nous avons r restrictions, autres que celles dexclusion, concernant
les paramtres dune quation (galit de deux coefficients, par exemple), les
conditions prcdentes deviennent :
g. 1 > g g + k k + r lquation est sous-identifie ;
g. 1 = g g + k k + r lquation est juste identifie ;
g. 1 < g g + k k + r lquation est sur-identifie.

Ces conditions ncessaires sont appeles conditions dordre didentifiabilit.

222  CONOMTRIE
Il convient de vrifier des conditions suffisantes, qualifies de conditions de
rang qui, dans la pratique, se rvlent difficiles, voire parfois impossibles
mettre en uvre. En annexe, ces conditions sont exposes.

III. Les mthodes destimation


Les mthodes destimation que nous pouvons utiliser dans le cadre des qua-
tions simultanes sont fonction du critre didentifiabilit du modle.
Si le modle est sous-identifiable ; pas destimation possible.
Dans le cas dun modle juste ou sur-identifiable, nous pouvons distinguer la
mthode employer quation par quation, selon le critre didentifiabilit :
Si lquation est juste identifie : les moindres carrs indirects ou les doubles
moindres carrs.
Si lquation est sur-identifie : les doubles moindres carrs.

A. Les moindres carrs indirects


La mthode des Moindres Carrs Indirects (MCI) consiste appliquer la mtho-
de des MCO aux quations justes identifies du modle sous formes rduite ;
elle se compose de trois tapes :
mise sous forme rduite du modle structurel ;
estimation par les MCO des paramtres de chacune des quations ;
dtermination des coefficients des quations structurelles partir des rela-
tions algbriques entre coefficients rduits et structurels (puisque le mod-
le est juste identifiable, la solution est unique).
Lestimateur des MCI de la forme rduite est BLUE. Cependant, lestimateur
des coefficients de la forme structurelle, obtenu partir de lestimateur optimal
des MCI, est biais pour les petits chantillons. Les proprits asymptotiques
font tendre ce biais vers 0, lorsque la taille de lchantillon augmente.
Cet estimateur des MCI est rarement utilis du fait de la difficult, pour les
modles importants, de dterminer la forme rduite du modle. Nous lui prf-
rons lestimateur des doubles moindres carrs, plus simple mettre en uvre et
qui fournit les mmes rsultats que les MCI pour les quations justes identifies.

B. Les doubles moindres carrs


La procdure destimation des Doubles Moindres Carrs (DMC) est la plus utili-
se en pratique. Elle sapplique pour tous les modles justes ou sur-identifiables.

Introduction aux modles quations simultanes  223


Cette mthode des DMC est fonde, comme son nom lindique, sur lapplica-
tion en deux tapes des MCO.
Soit le modle quations simultanes g variables endognes et k
variables exognes :
b11 y1t + b12 y2t + . . . + b1g ygt + c11 x1t + c12 x2t + . . . + c1k xkt = 1t
b21 y1t + b22 y2t + . . . + b2g ygt + c21 x1t + c22 x2t + . . . + c2k xkt = 2t
...
bg1 y1t + bg2 y2t + . . . + bgg ygt + cg1 x1t + cg2 x2t + . . . + cgk xkt = gt
La premire tape consiste effectuer une rgression de chacune des
variables endognes sur toutes les variables exognes :
y1t = 11 x1t + 12 x2t + . . . + 1k xkt + u 1t
y2t = 21 x1t + 22 x2t + . . . + 2k xkt + u 2t
...
ygt = g1 x1t + g2 x2t + . . . + gk xkt + u gt

Puis, dans une deuxime tape, il convient de remplacer les variables endo-
gnes figurant droite des quations structurelles par leurs valeurs ajustes
laide des modles estims :
y1t = 12
y2t + . . . + 1gygt + c11 x1t + c12 x2t + . . . + c1k xkt + 1t
y2t = 21
y1t + . . . + 2gygt + c21 x1t + c22 x2t + . . . + c2k xkt + 2t
...
y1t + g2
ygt = g1 y2t + . . . + cg1 x1t + cg2 x2t + . . . + cgk xkt + gt

Les proprits de lestimateur des DMC sont identiques, de manire asymp-


totique, celles dun estimateur classique ; cest--dire que pour les petits
chantillons les estimations des paramtres peuvent tre biaises.
Il est noter que lestimateur des DMC peut sinterprter comme tant un
estimateur de la mthode des Variables Instrumentales1, les variables exognes
des autres quations tant les instruments.

C. Autres mthodes destimation


Nous pouvons citer trois mthodes :
La mthode des triples moindres carrs est adapte lorsque les erreurs sont
autocorrles et/ou htroscdastiques, elle consiste dterminer lestima-
teur des doubles moindres carrs puis calculer lestimateur des MCG.
La mthode du maximum de vraisemblance information complte
(MVIC) consiste maximiser la fonction Log-vraisemblance associe au
modle.
1. Greene W.H., pages 681-684, 2000.

224  CONOMTRIE
La mthode des moments gnralise est utilise en cas de prsence dh-
troscdasticit.

Exercice n 1
fichier C8EX1
Comparaison des rsultats par moindres carrs ordinaires,
moindres carrs indirects et doubles moindres carrs
Soit le modle suivant sous forme structurelle :
Y1t = a(Y2t + X 1t ) + 1t [E1]
Y2t = bY1t + cY1t1 + 2t [E2]
avec :
Y1t = Produit National Brut pour lanne t ;
Y2t = consommation des mnages pour lanne t ;
X 1t = demande finale autre que consommation des mnages pour lanne t.
Nous disposons des donnes du tableau 1 dans lequel les variables ont t pralable-
ment centres.

Tableau 1 Variables macro-conomiques centres

t Y1t Y2t X 1t Y1t1

1 30,0 14,0 26,0 20,0


2 4,0 10,0 5,0 30,0
3 19,0 19,0 36,0 4,0
4 6,0 11,0 6,0 19,0
5 9,0 6,0 13,0 6,0
6 11,0 12,0 25,0 9,0
7 9,0 10,0 5,0 11,0
8 19,0 11,0 32,0 9,0
9 29,0 19,0 14,0 19,0

1) Prciser les conditions didentifiabilit du modle.


2) Estimer les quations de la forme structurelle par les MCO et dmontrer que les esti-
mateurs ne sont pas BLUE.
3) Estimer les coefficients par les MCI et les DMC.
4) Comparer les rsultats obtenus.

Solution

1) Nous nous rfrons aux conditions didentification dveloppes en II.


Le modle comporte deux variables endognes, Y1t et Y2t soit g = 2 , et deux
variables exognes, X 1t et Y1t1 soit k = 2.

Introduction aux modles quations simultanes  225


La premire quation [E1] comporte une restriction dexclusion et une restriction de
contrainte (les coefficients de Y2 et X 1 sont gaux). Soit, en appliquant les conditions
didentifiabilit, les variables figurant dans lquation donnent : g = 2 , k = 1 et la
contrainte dgalit des coefficients : r = 1.
Soit : g g + k k + r = 2 2 + 2 1 + 1 = 2 > g 1 = 1 , lquation [E1]
est sur-identifie.
Pour lquation [E2], nous avons g = 2 , k = 1 et r = 0 , soit
g g + k k + r = 2 2 + 2 1 + 0 = 1 = g 1,
lquation [E2] est juste identifie.
Nous pouvons donc estimer les coefficients du modle.
2) Les rsultats de lestimation par les MCO sont les suivants aprs avoir cr la nouvel-
le variable explicative : somme de Y2 et X 1 . Il est noter que le modle ne comporte
pas de terme constant puisque les donnes sont centres.
[E3]
Y1t = 0,516(Y2t + X 1t ) + e1t
(5,89)
2
R = 0,81
n=9
() = t de Student

[E4]
Y2t = 0,518 Y1t + 0,040 Y1t1 + e2t
(2,58) (0,18)
2
R = 0,50
n=9

Ces estimateurs ne sont pas BLUE. En effet, si on explicite Y1t en fonction de X 1t et


de Y1t1, on obtient :
a ac 2t
Y1t = X 1t + Y1t1 +
1 ab 1 ab 1 ab
Or, dans lquation [E2], on rgresse Y2t sur Y1t qui dpend alatoirement de 2t , ce
qui est en contradiction avec lhypothse dindpendance entre la variable explicative et
lerreur. Les estimateurs ne sont donc pas BLUE.
3) Pour appliquer la mthode des MCI, il convient dabord de mettre le modle sous
forme rduite, soit :
a ac 2t 1t
Y1t = X 1t + Y1t1 + + [E5]
1 ab 1 ab 1 ab 1 ab
ab c 2t + b1t
Y2t = X 1t + Y1t1 + [E6]
1 ab 1 ab 1 ab
ou encore :
Y1t = 1 X 1t + 2 Y1t1 + v1t
Y2t = 3 X 1t + 4 Y1t1 + v2t

226  CONOMTRIE
Les rsultats destimation par les MCO sont les suivants :
[E7]
Y1t = 0,717 X 1t + 0,190 Y1t1 + e1t
(4,93) (1,0)
R 2 = 0,78
n=9
() = t de Student

[E8]
Y2t = 0,355 X 1t + 0,139 Y1t1 + e2t
(1,92) (1,0)
R 2 = 0,36
n=9

Or le modle sous forme matricielle scrit :


         
1 a Y1t a 0 X 1t 1t
+ =
b 1 Y2t 0 c Y1t1 2t
B Y + C X =

ou encore Y = B 1 C X + B 1 = AX + v qui est le modle sous forme rduite avec


A = B 1 C (A est la matrice des coefficients estims de la forme rduite).
Nous avons donc B A = C , soit :
    
1 a 0,717 0,190 a 0
=
b 1 0,355 0,139 0 c
ce qui donne :
0,717 a 0,355 = a
0,190 a 0,139 = 0
b 0,717 + 0,355 = 0
b 0,190 + 0,139 = c

Nous pouvons, partir des deux dernires relations, estimer  b = 0,495 et



c = 0,045 (puisque lquation [E2] est juste identifie), mais, en revanche, le coefficient
a est indtermin (lquation [E1] est sur-identifie).
Nous appliquons maintenant la mthode des DMC afin destimer tous les coefficients
de ce modle.
Nous allons dvelopper le calcul pour la premire quation.
tape 1 : rgresser la variable endogne Y2t sur toutes les variables exognes (X 1t et
Y1t1 ).
Le rsultat est dj connu, puisquil sagit de lquation [E8].
2t
tape 2 : calculer la srie ajuste : Y

soit : 2t = 0,355 X 1t + 0,139 Y1t1


Y
2t dans lqua-
tape 3 : la variable endogne Y2t est remplace par sa valeur ajuste Y
2t + X 1t ) + 1t .
tion [E1] : Y1t = a(Y

Introduction aux modles quations simultanes  227


Le rsultat destimation par les MCO est le suivant :
2t + X 1t ) + e1t
Y1t = 0,535(Y
(5,22)
2
R = 0,77
n=9
() = t de Student
Cette procdure des DMC est donc un peu lourde mettre en uvre, cest pourquoi les
logiciels permettent en une seule instruction dutiliser cette mthode. Par exemple, pour
estimer la deuxime quation de notre modle, linstruction de Eviews est la suivante :
TSLS Y2 Y1(-1) Y1 @ X1 Y1( 1)
o TSLS est labrviation de Two-Stage Leasts Squares. La variable expliquer (Y2)
figure suivie des variables exognes Y1( 1), la seule dans cette quation et, enfin, on
cite, la variable endogne que lon dsire remplacer par sa valeur ajuste laide des
sries exognes (elles sont spares de la variable endogne par le signe @).
Le rsultat, fourni par Eviews, est le suivant :
Dependent Variable : Y2
Method: Two-Stage Least Squares
Included observations: 9
Instrument list: X1 Y1D

Variable Coefficient Std. Error t-Statistic Prob.


Y1D 0.045084 0.220336 0.204614 0.8437
Y1 0.495344 0.228271 2.169985 0.0666

R-squared 0.503610 Mean dependent var 0.000000


Adjusted R-squared 0.432697 S.D. dependent var 13.87444
S.E. of regression 10.45016 Sum squared resid 764.4403
F-statistic 5.176628 Durban-Watson stat 3.011822
Prob(F-statistic) 0.057037

Nous remarquons que lestimation des coefficients est exactement la mme que par
la mthode des MCI. En effet, nous rappelons que la mthode des MCI fournit des rsul-
tats strictement identiques la mthode des DMC. Cest pourquoi, dans la pratique, seule
cette dernire est utilise car elle se rvle dun maniement bien plus ais.
4) Nous pouvons au sein du tableau 2 comparer lensemble des rsultats obtenus.

Tableau 2 Rsultats destimation par les MCO et DMC

MCO DMC

a 0,516 0,535
(5,89) (5,29)
b 0,518 0,495
(2,58) (2,17)
c 0,040 0,045
(0,18) (0,20)

228  CONOMTRIE
la lecture de ces rsultats, nous constatons des diffrences assez faibles entre les
estimations des MCO et celles des DMC. En effet, les proprits des estimateurs des
DMC ne sont quasymptotiques, or le nombre dobservations dans cet exemple est limi-
t 9.

Exercice n 2
Le problme de lidentification lorsque la structure
dun modle change
On considre le systme dquations :

Y1t + aY2t + b = 1t [E1]


cY1t + Y2t + dZ t + e = 2t [E2]

dans lequel Y1t et Y2t sont des variables endognes et Z t une variable exogne.
1) Mettre ce systme sous forme matricielle et tudier les conditions didentifiabilit.
2) Vrifier les conditions didentifiabilit partir du calcul matriciel.
3) Rpondre aux mmes questions avec e = 0 .

Solution

1) Le modle sous forme matricielle scrit :


       
1 a Y1t 0 b Zt 1t
+ = soit BY + C X =
c 1 Y2t d e Ut 2t
avec U = vecteur unit.
Nous avons g = 2 variables endognes : Y1t , Y2t et k = 2 variables exognes Z t et
U . Examinons les conditions didentifiabilit :
pour lquation [E1] : g = 2 , k = 1 et r =0 soit
g g + k k + r = 1 = g 1 , lquation [E1] est juste identifie ;
pour lquation [E2] : g = 2 , k = 2 et r =0 soit
g g + k k + r = 0 < g 1 , lquation [E2] est sous-identifie.

2) Par le calcul matriciel, nous allons exprimer les variables endognes par les variables
exognes : Y = B 1 C X + B 1 .
Posons A = B 1 C
   
1
1 1 a 1 ad b ae
B = A=
1 ac c 1 1 ac d bc + e

Cette matrice A correspond la matrice des coefficients estims (nots 


i ) de la
forme rduite.
Nous avons donc la relation B A = C :
     
1 a 
1 2 0 b
=
c 1 
3 4 d e

Introduction aux modles quations simultanes  229


soit en explicitant cette relation matricielle :
 3 = 0
1 + a [E3] 1 + 
c 3 = d [E5]

2 + a
4 = b [E4] 2 + 
c 4 = e [E6]
Les quations [E3] et [E4] constituent deux quations deux inconnues. Les coefficients
a et b sont donc parfaitement identifiables ds lors que lon connat les coefficients de la
forme rduite. Ces deux coefficients a et b appartiennent lquation [E1] qui est juste
identifie, ce qui est une vrification des rgles nonces.
En revanche, les quations [E5] et [E6] forment deux quations trois inconnues,
soit un systme indtermin. Lquation [E3] est bien sous-identifie.
3) Si e = 0 , lquation [E1] reste juste identifie et lquation [E2] devient, ds lors,
juste identifie. Matriciellement, le systme scrit :
     
1 a 
1 2 0 b
=
c 1 
3 3 d 0

Soit, en explicitant cette relation matricielle :

 3 = 0
1 + a [E7] 1 + 
c 3 = d [E9]

2 + a
4 = b [E8] 2 + 
c 4 = 0 [E10]
Soit quatre quations quatre inconnues, le systme est maintenant parfaitement
dtermin.

Exercice n 3
fichier C8EX3
Le modle de Klein
Ce modle1 macro-conomique fournit un excellent exemple pdagogique des pro-
blmes qui peuvent se poser dans le cadre des quations simultanes.
Soit le modle suivant :
Const = a0 + a1 Pt + a2 Pt1 + a3 (Wt + Wt ) + 1t [E1]
It = b0 + b1 Pt + b2 Pt1 + b3 K t1 + 2t [E2]
Wt = c0 + c1 X t + c2 X t1 + c3 t + 3t [E3]
X t = Const + It + G t [E4]
Pt = X t Wt T axt [E5]
K t = It + K t1 [E6]
avec :
Const = consommation pour lanne t ;
Pt = profits de lanne t ;
Wt et Wt = salaires de lanne t verss par lindustrie et ladministration ;
It = investissements de lanne t ;

1. Klein L. R., 1950.

230  CONOMTRIE
Kt = stock de capital la fin de lanne t ;
Xt = production industrielle de lanne t ;
Gt = dpenses publiques de lanne t ;
T axt = impts sur les profits de lanne t.
1) Distinguer les variables endognes et exognes.
2) Estimer les quations par la mthode des MCO.
3) Examiner les conditions didentifiabilit de ce modle.
4) Estimer ce modle laide dune mthode adquate.
Les donnes exprimes dans des units convenablement choisies sont prsentes
sur le tableau 3.
Tableau 3 Donnes du modle de Klein (1950) (extrait des donnes)
Constt Gt It K t1 Pt T axt Wt Wt Xt
1920 39,8 2,4 2,7 180,1 12,7 3,4 28,8 2,2 44,9
1921 41,9 3,9 0,2 182,8 12,4 7,7 25,5 2,7 45,6

1940 65,0 7,4 3,3 201,2 21,1 9,6 45,0 8,0 75,7
1941 69,7 13,8 4,9 204,5 23,5 11,6 53,3 8,5 88,4

(NB : ce tableau indique directement la variable K t1 )

Solution
1) Ce modle comporte six quations et onze variables conomiques (y compris le vec-
teur et la tendance). Les trois dernires quations sont des identits (aucun paramtre
nest estimer).
Les variables exognes sont les variables non expliques par une relation :
les variables retardes : Pt1 , X t1 , K t1 et
les variables vritablement exognes : la tendance t, les dpenses gouverne-
mentales G t , les salaires des administrations Wt , les impts sur les profits T axt et
le vecteur unit U. Soit, k = 8.
Les variables endognes sont celles qui sont dtermines par une relation de com-
portement : Constt , It , Wt . En ce qui concerne les identits, on choisit comme variables
endognes, compte tenu de leur signification, X t , Pt et K t . Soit g = 6.
Nous remarquons que, dans ce choix de variables endognes et exognes, la rflexion
conomique joue un grand rle. Nanmoins, il subsiste une part darbitraire reprsenta-
tive du schma de pense de lconomiste.

2) Les estimations par les MCO sont les suivantes :

Constt = 16,23 + 0,193 Pt + 0,089 Pt1 + 0,796(Wt + Wt ) + e1t [E7]


(12,4) (2,11) (0,99) (19,9)
R 2 = 0,98 n = 21 DW = 1,36 () = t de Student

It = 10,12 + 0,479 Pt + 0,333 Pt1 0,111 K t1 + e2t [E8]


(1,85) (4,93) (3,30) (4,189)
R 2 = 0,93 n = 21 DW = 1,81 () = t de Student

Introduction aux modles quations simultanes  231


Wt = 0,066 + 0,439 X t + 0,146 X t1 + 0,13 t + e3t [E9]
(2,02) (13,5) (3,90) (4,90)
R 2 = 0,98 n = 21 DW = 1,95 () = t de Student
Les estimateurs des MCO sont biaiss, cette mthode destimation est donc inappro-
prie pour ce type de modle. Nous devons tudier les conditions didentification de ce
modle et utiliser, le cas chant, la mthode des DMC.

3) Les conditions didentification conditions dordre studient quation par qua-


tion.
Le modle comporte g = 6 variables endognes et k = 8 variables exognes (cf. la
rponse la question 1).
Pour lquation [E1], nous avons g = 3 , variables endognes prsentes et k = 3 ,
variables exognes prsentes, soit (g g + k k = 8) restrictions dexclusion. De
plus, lgalit entre le coefficient de Wt et Wt introduit une restriction supplmentaire
r = 1.
g g + k k + r = 9 > g 1 = 5 lquation [E1] est sur-identifie.
Pour lquation [E2] : g = 2 , k = 3 et r = 0 soit :
g g + k k + r = 9 > g 1 = 5 , lquation [E2] est sur-identifie.
Pour lquation [E3] : g = 2 , k = 3 et r = 0 soit :
g g + k k + r = 9 > g 1 = 5 , lquation [E3] est sur-identifie.
Les quations tant toutes sur-identifies, il est licite destimer les coefficients de ce
modle laide de la mthode des DMC.

4) Nous avons appliqu la mthode des DMC pour chacune des trois quations estimer
de trois manires diffrentes.
quation [E1] en dcomposant la mthode des DMC.
Les variables endognes Pt et Wt apparaissent droite de lquation ; il convient
donc de les remplacer par leurs valeurs en fonction des 8 variables exognes.
tape 1 : estimation du modle pour Pt et calcul de la variable ajuste P At .

Dependent Variable : P
Sample (adjusted): 1921 1941
Included observations: 21 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob.


C 46.55153 23.15829 2.010145 0.0656
P(-1) 0.802501 0.518856 1.546674 0.1459
K 0.216103 0.119113 1.814267 0.0928
X(-1) 0.022000 0.282164 0.077969 0.9390
WP 0.079608 2.533823 0.031418 0.9754
TREND 0.319405 0.778129 0.410478 0.6881
G 0.439016 0.391143 1.122394 0.2820
TAX 0.923098 0.433759 2.128133 0.0530

232  CONOMTRIE
tape 2 : estimation pour Wt et calcul de la variable ajuste W At .

Dependent Variable : W
Sample (adjusted): 1921 1941
Included observations: 21 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob.


C 34.87254 18.61034 1.873826 0.0836
P(1) 0.871921 0.416960 2.091137 0.0567
K 0.122952 0.095721 1.284477 0.2214
X(1) 0.095329 0.226751 0.420412 0.6811
WP 0.443726 2.036218 0.217917 0.8309
TREND 0.713584 0.625316 1.141158 0.2744
G 0.866220 0.314328 2.755783 0.0164
TAX 0.60415 0.348575 -1.733206 0.1067

tape 3 : estimation du modle final en remplaant dans lquation [1] Pt par P At et


Wt par W At .

Dependent Variable : CONS


Sample (adjusted): 1921 1941
Included observations: 21 after adjusting

Variable Coefficient Std. Error t-Statistic Prob.


C 16.55476 2.571080 6.438834 0.0000
PA 0.017302 0.229797 0.075294 0.9409
P(1) 0.216234 0.208810 1.035554 0.3149
WA + WP 0.810183 0.078351 10.34044 0.0000

quation [E2] par application directe de la mthode des DMC laide de Eviews,
linstruction unique est la suivante (la liste des instruments les variables exognes
figurent aprs @ :

TSLS I C P(1) K P @ C P(1) K X(1) WP TREND G TAX

Dependent Variable : I
Method: Two-Stage Least Squares
Sample (adjusted): 1921 1941
Included observations: 21 after adjusting endpoints
Instrument list: C P(1) K X(1) WP TREND G TAX

Variable Coefficient Std. Error t-Statistic Prob.


C 20.27821 8.383247 2.418897 0.0271
P(1) 0.615943 0.180926 3.404398 0.0034
K 0.157788 0.040152 3.929752 0.0011
P 0.150222 0.192534 0.780238 0.4460

Introduction aux modles quations simultanes  233


quation [E3] par application directe de la mthode des DMC laide de RATS,
les instructions sont les suivantes :
INSTRUMENTS CONSTANT TREND WP TAX G P{1} K X{1}
LINREG(INST) W
# CONSTANT TREND X{1} X
Dependent Variable W Estimation by Instrumental Variables
Annual Data From 1921: 01 To 1941: 01
Usable observations 21 Degrees of Freedom 17
Centered R**2 0.987414 R Bar **2 0.985193
Variable Coeff Std Error T-Stat Signif
1. Constant 0.064451360 1.147038221 0.05619 0.95584607
2. TREND 0.130395687 0.032388389 4.02600 0.00087642
3. X{1} 0.146673821 0.043163948 3.39806 0.00342209
4. X 0.438859065 0.039602662 11.08155 0.00000000

Nous pouvons aussi appliquer la mthode des triples moindres carrs. Le systme
(SYS01) scrit :
cons = C(1) + C(2) P + C(3) P( 1) + C(4) (W + WP)
I = C(5) + C(6) P + C(7) P( 1) + C(8) K
W = C(9) + C(10) X + C(11) X( 1) + C(12) @trend(1919)
inst C @trend(1919) WP TAX G P( 1) K X( 1)
Les rsultats (SYS01.3SLS) sont les suivants :
System : SYS01
Estimation Method : Three-Stage Least Squares
Sample : 1921 1941
Included observations : 21
Total system (balanced) observations 63
Coefficient Std Error t-Statistic Prob.
C(1) 16.44079 1.304549 12.60267 0.0000
C(2) 0.124891 0.108129 1.155014 0.2535
C(3) 0.163144 0.100438 1.624322 0.1105
C(4) 0.790081 0.037938 20.82563 0.0000
C(5) 28.17784 6.793769 4.147601 0.0001
C(6) 0.013079 0.161896 0.080786 0.9359
C(7) 0.755724 0.152933 4.941532 0.0000
C(8) 0.194848 0.032531 5.98974 0.0000
C(9) 0.001128 1.009957 0.001117 0.9991
C(10) 0.400492 0.031813 12.58878 0.0000
C(11) 0.181291 0.034159 5.307308 0.0000
C(12) 0.149674 0.027935 5.357897 0.0000
Equation : CONS = C(1) + C(2) P + C(3) P( 1) + C(4) (W + WP)
Equation : I = C(5) + C(6) P + C(7) P( 1) + C(8) K
Equation : W = C(9) + C(10) X + C(11) X( 1)+C(12) @TREND(1919)
Instruments : C @TREND(1919) WP TAX G P( 1) K X( 1)

234  CONOMTRIE
Enfin la mthode du maximum de vraisemblance information complte (SYS01.fiml)
permet dobtenir les rsultats suivants :

System : SYS01
Estimation Method : Full Information Maximum Likelihood (Marquardt)
Sample : 1921 1941
Included observations : 21
Total system (balanced) observations 63
Coefficient Std Error z-Statistic Prob.
C(1) 15.83050 4.095952 3.864913 0.0001
C(2) 0.300548 0.408091 0.736472 0.4614
C(3) 0.042528 0.164388 0.258707 0.7959
C(4) 0.780851 0.078507 9.946226 0.0000
C(5) 15.70774 14.35232 1.094439 0.2738
C(6) 0.382189 0.341696 1.118507 0.2634
C(7) 0.409626 0.248385 1.649155 0.0991
C(8) 0.137683 0.071215 1.933357 0.0532
C(9) 0.136911 4.099237 0.033399 0.9734
C(10) 0.370767 0.129208 2.869534 0.0041
C(11) 0.207299 0.090622 2.287518 0.0222
C(12) 0.184379 0.101556 1.815549 0.0694
Equation : CONS = C(1) + C(2) P + C(3) P( 1) + C(4) (W + WP)
Equation : I = C(5) + C(6) P + C(7) P( 1) + C(8) K
Equation : W = C(9) + C(10) X + C(11) X( 1) + C(12) @TREND(1919)

Introduction aux modles quations simultanes  235


Annexe
Identification : les conditions de rang
Soit le modle sous forme matricielle :
B Y + C X =
(g,g) (g,1) (g,k) (k,1) (g,1)

On appelle P la matrice des structures qui est forme par la juxtaposition des
matrices B et C, soit P = [BC], P est donc de dimension (g,g + k).
Soit i , une matrice des restriction affrente lquation i construite telle que :
Pi i h = 0, i est la i -ime ligne de la matrice P et h la h -ime colonne de la matrice
i .
Soit i = rang[Pi ] (rang de la matrice Pi ), et g le nombre de variables endo-
gnes du modle, la condition de rang est alors la suivante :
si i < g 1 lquation i est sous-identifie ;
si i = g 1 lquation i est juste identifie ;
si i > g 1 lquation i est sur-identifie.
Cette condition ncessaire et suffisante didentification est, bien entendu, plus lour-
de mettre en uvre, cest pourquoi le plus souvent on se satisfait des conditions
dordre.
partir du modle de lexercice 1, nous allons construire ces matrices et appliquer
les conditions de rang.
Ce modle sous forme matricielle scrit :
         
1 a Y1t a 0 X 1t 1t
+ =
b 1 Y2t 0 c Y1t1 2t
B Y + C X =
 
1 a a 0
Soit P = [BC] = .
b 1 0 c
La matrice 1 , matrice des restrictions de la premire quation, est donc construite
de la manire suivante :
autant de lignes que de variables endognes et exognes, chaque ligne est repr-
sentative dune variable (ligne 1 = Y1t , ligne 2 = Y2t , ligne 3 = X 1t , ligne
4 = Y1t1 ) ;
une colonne par restriction dexclusion (variable endogne ou exogne manquan-
te) et par restriction linaire sur les coefficients ;
pour les relations dexclusion, les colonnes sont composes de 0, sauf pour les
variables dont le coefficient est nul o lon met la valeur 1 ;

236  CONOMTRIE
pour les restrictions de contraintes sur les coefficients, on explicite la relation entre
les coefficients. Dans notre modle, nous avons c11 c12 = 0 (Y2 et X 1 ont le
mme coefficient).
Nous pouvons alors rcrire la condition : Pi i h = 0 .
Soit, pour lquation 1, nous avons une seule variable manquante et une restriction
sur le coefficient des variables Y2 et X 1 qui doit tre identique, soit deux colonnes :


0 0
0 1

i =
0 1 les variables Y2 et X 1 ont le mme coefficient
1 0 la variable Y1t1 est absente

Pour 2 , nous avons une seule restriction : la variable X 1 est absente de lquation
2, soit :

0
0
2 =
1 la variable X 1 est absente de lquation 2
0

0 0
   
1 a a 0
0 1= 0 0
P1 =
b 1 0 c 0 1 c 1
1 0
rang de P1 = 1 = g 1.
Lquation 1 est juste identifie.

0
   
1 a a 0
0 = a
P2 =
b 1 0 c 1 0
0 rang de P2 = 2 = 1 = g 1

Lquation 2 est juste identifie (sauf si a = 0 ).


Nous remarquons que la condition de rang vient modifier la condition dordre de la
premire quation, puisque dun statut de sur-identifie, elle devient juste identifie.
Toutefois, cela ne remet aucunement en cause les rsultats trouvs lors de lexercice 1.

Introduction aux modles quations simultanes  237


9. lments danalyse
des sries temporelles

C
e chapitre est consacr une prsentation sommaire des tech-
niques danalyse des sries chronologiques. Ce thme, lui seul,
peut faire lobjet de longs dveloppements et de nombreux
ouvrages1 y sont intgralement consacrs. Nous tudions en I. les carac-
tristiques statistiques en terme de stationnarit des sries tempo-
relles en prsentant les diffrents tests (Dickey-Fuller, corrlogramme,
etc.) sy rapportant. Puis en II., nous prsentons diffrentes classes de
modles (AR, MA, ARMA) en tudiant leurs proprits. Enfin, la mtho-
de Box et Jenkins qui systmatise une dmarche danalyse des sries tem-
porelles fait lobjet de la section III.

I. Stationnarit
A. Dfinition et proprits
Avant le traitement dune srie chronologique, il convient den tudier les carac-
tristiques stochastiques. Si ces caractristiques cest--dire son esprance et
sa variance se trouvent modifies dans le temps, la srie chronologique est
considre comme non stationnaire ; dans le cas dun processus stochastique
invariant, la srie temporelle est alors stationnaire. De manire formalise, le
processus stochastique yt est stationnaire si :

1. Pour un approndissement de ce chapitre, se rfrer au livre de Bourbonnais R. et Terraza M.,


Dunod, 2010.

lments danalyse des sries temporelles  239


E(yt ) = E(yt+m ) = t et m , la moyenne est constante et indpendante du
temps ;
var(yt ) < t , la variance est finie et indpendante du temps ;
cov(yt ,yt+k ) = E[(yt )(yt+k )] = k , la covariance est indpendante du
temps.
Il apparat, partir de ces proprits, quun processus de bruit blanc1 t dans
lequel les t sont indpendants et de mme loi N (0,2 ) est stationnaire.
Une srie chronologique est donc stationnaire si elle est la ralisation dun
processus stationnaire2. Ceci implique que la srie ne comporte ni tendance, ni
saisonnalit et plus gnralement aucun facteur nvoluant avec le temps.

B. Fonctions dautocorrlation simple et partielle


La fonction dautocorrlation (FAC) est la fonction note k qui mesure la cor-
rlation de la srie avec elle-mme dcale de k priodes, comme lillustre le
tableau 1.
Sa formulation est la suivante :

n
(yt y)(ytk y)
cov(yt ,ytk ) t=k+1
k = =  [1]
yt ytk 
n  n
(yt y)2 (ytk y)2
t=k+1 t=k+1

avec y moyenne de la srie calcule sur n k priodes, n = nombre dobservations.


Nous pouvons en dduire que :
0 = 1 et k = k
Cette formule [1] est malaise manier puisquelle exige de recalculer pour
chaque terme k les moyennes et les variances, cest pourquoi on lui prfre la
fonction dautocorrlation dchantillonnage :

n
(yt y)(ytk y)
t=k+1
k =
[2]

n
(yt y)2
t=1

avec y moyenne de la srie calcule sur n priodes.


1. Un processus de bruit blanc est une suite de variables alatoires de mme distribution et mutuel-
lement indpendantes. Ce terme est emprunt la physique faisant rfrence au spectre de la
lumire blanche.
2. Si les conditions nonces ci-dessous sont vrifies, on dit que la srie est stationnaire de second
ordre, ou encore faiblement stationnaire. Dans le cas o, aux conditions dfinies, sajoute la
constante de la distribution de probabilit, on parle de srie strictement stationnaire.

240  CONOMTRIE
Tableau 1 Exemple de calcul dune fonction dautocorrlation

k 0 1 2 3 4
t yt yt1 yt2 yt3 yt4
1 123
2 130 123
3 125 130 123
4 138 125 130 123
5 145 138 125 130 123
6 142 145 138 125 130
7 141 142 145 138 125
8 146 141 142 145 138
9 147 146 141 142 145
10 157 147 146 141 142
11 150 157 147 146 141
12 145 150 157 147 146

Moyenne yt 140,75 142,36 143,60 145,67 146,63


Moyenne ytk 140,75 140,36 139,40 137,44 136,25
Variance yt 95,02 72,41 62,84 24,11 22,23
Variance ytk 95,02 101,87 101,84 74,91 71,44
k 1 0,77 0,62 0,59 0,55

Lorsque le nombre dobservations n est suffisamment grand, les deux for-


mules [1] et [2] donnent des rsultats trs proches.
La fonction dautocorrlation partielle (FAP) sapparente la notion de cor-
rlation partielle. Nous avons dfini au chapitre 4 le coefficient de corrlation
partielle comme tant le calcul de linfluence de x1 sur x2 en liminant les
influences des autres variables x3 , x4 , . . . , xk .
Par analogie, nous pouvons dfinir lautocorrlation partielle de retard k
comme le coefficient de corrlation partielle entre yt et ytk , cest--dire comme
tant la corrlation entre yt et ytk linfluence des autres variables dcales de k
priodes (yt1 , yt2 , . . . , ytk+1 ) ayant t retire.
Afin dviter par la suite toutes ambiguts entre les deux fonctions dauto-
corrlation, nous appelons fonction dautocorrlation simple, la fonction dauto-
corrlation.

C. Tests de bruit blanc et de stationnarit


Nous ne pouvons identifier clairement les caractristiques stochastiques dune
srie chronologique que si elle est stationnaire. Cette tude de stationnarit

lments danalyse des sries temporelles  241


seffectue essentiellement partir de ltude des fonctions dautocorrlation (ou
de leur reprsentation graphique appele corrlogramme ). Une srie chro-
nologique est stationnaire si elle ne comporte ni tendance ni saisonnalit. Nous
allons donc, partir de ltude du corrlogramme dune srie, essayer de mon-
trer de quelle manire nous pouvons mettre en vidence ces deux composantes.
Nous pouvons distinguer diffrents types de sries stationnaires :
mmoire, cest--dire dont on peut modliser, par une loi de reproduc-
tion, le processus ;
identiquement et indpendamment distribue note i.i.d. ou appele Bruit
Blanc ( White Noise ) ;
normalement (selon une loi normale) et indpendamment distribue note
n.i.d. ou appele Bruit Blanc gaussien.

1) Analyse des fonctions dautocorrlation


Lorsque nous tudions la fonction dautocorrlation dune srie chronologique,
la question qui se pose est de savoir quels sont les termes k qui sont significa-
tivement diffrents de 0.
En effet, par exemple, si aucun terme nest significativement diffrent de 0,
on peut en conclure que le processus tudi est sans mmoire et donc qu ce
titre il nest affect ni de tendance ni de saisonnalit. Ou encore si une srie men-
suelle prsente une valeur leve pour 12 (corrlation entre yt et yt12 ), la srie
tudie est certainement affecte dun mouvement saisonnier1. Nous verrons
partir dexemples diffrents cas de figures.
Le test dhypothses pour un terme k est le suivant :
H0 : k = 0
H1 : k =
/ 0

Nous pouvons utiliser le test dhypothses dun coefficient de corrlation,


prsent au chapitre 1, fond sur la comparaison dun t de Student empirique et
thorique. Toutefois, Quenouille2 a dmontr que pour un chantillon de taille
importante (n > 30) , le coefficient k tendde manire asymptotique vers une loi
normale de moyenne 0 et dcart type 1/ n .
Lintervalle de confiance du coefficient k est alors donn par :

1
k = 0 t /2
n

n = nombre dobservations.

1. Il sagit mme dun test de dtection de saisonnalit.


2. Quenouille M. H., 1949.

242  CONOMTRIE
k est lextrieur de cet intervalle de confiance, il
Si le coefficient calcul
est significativement diffrent de 0 au seuil (en gnral = 0,05 et
t /2 = 1,96) . La plupart des logiciels fournissent, avec le corrlogramme, lin-
tervalle de confiance, ce qui autorise une interprtation instantane.
Nous devons souligner une limite des tests 5 %. En effet, lorsquune fonc-
tion dautocorrlation est calcule pour un nombre important de retards, nous
pouvons nous attendre ce que quelques-uns soient, de manire fortuite, signi-
ficativement diffrents de 0. Si h est le nombre de retards, le nombre possible de
faux rejets est alors de 0,05 h , pour un seuil de confiance de 5 %.
Dans le cas o le corrlogramme ne laisse apparatre aucune dcroissance de
ses termes (absence de cut off ), nous pouvons en conclure que la srie nest
pas stationnaire en tendance.

2) Statistiques de Box-Pierce et Ljung-Box


Le test de Box-Pierce permet didentifier les processus sans mmoire (suite de
variables alatoires indpendantes entre elles). Nous devons donc identifier
cov(yt ,ytk ) = 0 ou encore k = 0 k .
Un processus de bruit blanc implique que 1 = 2 = . . . = h = 0 , soit les
hypothses :
H0 : 1 = 2 = . . . = h = 0
H1 : il existe au moins un i significativement diffrent de 0.
Pour effectuer ce test, on recourt la statistique Q (due Box-Pierce1) qui
est donne par :

h
Q=n k2

k=1

h = nombre de retards, k = autocorrlation empirique dordre k, n = nombre


dobservations.
La statistique Q est distribue de manire asymptotique comme un 2 (chi-
deux) h degrs de libert. Nous rejetons donc lhypothse de bruit blanc, au
seuil , si la statistique Q est suprieure au 2 lu dans la table au seuil (1 )
et h degrs de libert.
Nous pouvons utiliser aussi une autre statistique, dont les proprits asymp-
totiques sont meilleures, drive de la premire qui est le Q de Ljung et Box2 :
h
k2

Q = n(n + 2) qui est aussi distribue selon un 2 h degrs de liber-
k=1
n k
t et dont les rgles de dcisions sont identiques au prcdent. Ces tests sont
appels par les anglo-saxons : portmanteau test soit littralement test
fourre-tout .

1. Box G E. P. et Pierce D. A., 1970.


2. Ljung G. M. et Box G E. P., 1978.

lments danalyse des sries temporelles  243


3) Tests de normalit
Pour calculer des intervalles de confiance prvisionnels et aussi pour effectuer
les tests de Student sur les paramtres, il convient de vrifier la normalit des
erreurs. Le test de Jarque et Bera (1984), fond sur la notion de Skewness (asy-
mtrie) et de Kurtosis (aplatissement), permet de vrifier la normalit dune dis-
tribution statistique.

a) Les tests du Skewness et du Kurtosis


1 n
Soit k = (xi x)k le moment centr dordre k, le coefficient de Skewness
n i=1
3 4
(11/2 ) est gal : 11/2 = 3/2 et le coefficient de Kurtosis : 2 = 2 .
2 2
Si la distribution est normale et le nombre dobservations grand (n > 30) :
     
1/2 6 24
1 N 0; et 2 N 3;
n n
On construit alors les statistiques :
|11/2 0| |2 3|
1 =  et 2 =  que lon compare 1,96 (valeur de la loi nor-
6 24
n n
male au seuil de 5 %).
Si les hypothses H0 : 1 = 0 (symtrie) et 2 = 0 (aplatissement normal)
sont vrifies, alors 1  1,96 et 2  1,96 ; dans le cas contraire, lhypothse de
normalit est rejete.

b) Le test de Jarque et Bera


Il sagit dun test qui synthtise les rsultats prcdents ; si 11/2 et 2 obissent
n n
des lois normales alors la quantit s : s = 1 + (2 3)2 suit un 2 deux
6 24
degrs de libert.
2
Donc si s > 1 (2), on rejette lhypothse H0 de normalit des rsidus au
seuil .
Ces tests de normalit servent galement dans le cas o il y a htroscdaci-
t. En effet, lhtroscdacit se manifeste sur le graphe de la distribution par
des queues de probabilit plus paisses (distribution leptokurtique) que les
queues de la loi normale.

4) Tests dhomoscdasticit

Un processus de bruit blanc doit tre homoscdastique, les tests dhtroscdas-


ticit du chapitre 5, Section II peuvent tre utiliss.

244  CONOMTRIE
Le test de Goldfeld-Quandt a pour but de comparer la somme des carrs
des rsidus destimation aprs avoir scind les rsidus en deux sous-chan-
tillons.
Un autre test consiste tudier la distribution des carrs des rsidus.
Lanalyse des termes du corrlogramme des rsidus au carr permet de tes-
ter lexistence dune htroscdacit. Si certaines valeurs de la FAC (tests
de Box-Pierce ou Ljung-Box) sont significativement diffrentes de 0, nous
pouvons conclure la prsence dune htroscdacit.

II. La non-stationnarit et les tests de racine


unitaire
A. La non-stationnarit : les processus TS et DS
Les chroniques conomiques sont rarement des ralisations de processus ala-
toires stationnaires. Pour analyser la non-stationnarit, deux types de processus
sont distingus :
les processus TS (Trend Stationary) qui reprsentent une non-stationnarit
de type dterministe1 ;
les processus DS (Differency Stationary) pour les processus non station-
naires alatoires.
a) Les processus TS
Un processus TS scrit : xt = f t + t o f t est une fonction polynmiale du
temps, linaire ou non linaire, et t un processus stationnaire. Le processus TS
le plus simple (et le plus rpandu) est reprsent par une fonction polynmiale
de degr 1. Le processus TS porte alors le nom de linaire et scrit :
xt = a0 + a1 t + t .
Si t est un bruit blanc (gaussien ou non), les caractristiques de ce proces-
sus sont alors :
E[x t ] = a0 + a1 t + E[t ] = a0 + a1 t
V [x t ] = 0 + V [t ] = 2
/ t
cov[x t ,x t ] = 0 pour t =

Ce processus TS est non stationnaire car E[xt ] dpend du temps.


Connaissant  a0 et 
a1 , le processus xt peut tre stationnaris en retranchant, de la
valeur de xt en t, la valeur estime  a0 + 
a1 t . Dans ce type de modlisation, lef-

1. Par dfinition, un processus est alatoire do lambigut du terme de processus dterministe.

lments danalyse des sries temporelles  245


fet produit par un choc (ou par plusieurs chocs alatoires) un instant t est tran-
sitoire. Le modle tant dterministe, la chronique retrouve son mouvement de
long terme qui est ici la droite de tendance. Il est possible de gnraliser cet
exemple des fonctions polynmiales de degr quelconque.
b) Les processus DS
Les processus DS sont des processus que lon peut rendre stationnaires par luti-
lisation dun filtre aux diffrences : (1 D)d xt = + t o t est un processus
stationnaire, une constante relle, D loprateur dcalage et d lordre du filtre
aux diffrences.
Ces processus sont souvent reprsents en utilisant le filtre aux diffrences pre-
mires (d = 1) . Le processus est dit alors processus du premier ordre. Il scrit :
(1 D)xt = + t xt = xt1 + + t
Lintroduction de la constante dans le processus DS permet de dfinir deux
processus diffrents :
= 0 : le processus DS est dit sans drive.
Il scrit : xt = xt1 + t .
Comme t est un bruit blanc, ce processus DS porte le nom de modle de
marche au hasard ou de marche alatoire (Random Walk Model). Il est trs fr-
quemment utilis pour analyser lefficience des marchs financiers.
Pour tudier les caractristiques de ce modle, crivons-le sous sa forme
dveloppe :
x t = x t1 + t
x t1 = x t2 + t1 x t = x t2 + t1 + t
x t2 = x t3 + t2 x t = x t3 + t2 + t1 + t
etc.
Si le premier terme de la chronique est x 0 , le modle scrit alors :
 t
xt = x0 + i
i =1

Les caractristiques de ce processus sont (en supposant x 0 certain) :


E[x t ] = x 0
V [x t ] = t2
cov[x t ,x t ] = 2 Min(t,t ) si t =
/ t
Par exemple :
cov(x 4 ,x 2 ) = E[(x 0 + 1 + 2 + 3 + 4 )(x 0 + 1 + 2 )]
= E(1 1 ) + E(2 2 ) = 22 .
/ t .
En effet tous les produits E(t t ) = 0 si t =

246  CONOMTRIE
Ce processus est non stationnaire en variance puisquelle dpend du temps.
Cette non stationnarit est dite alatoire ou stochastique.
Pour stationnariser la marche alatoire, il suffit dappliquer au processus le
filtre aux diffrences premires : xt = xt1 + t (1 D)xt = t .
= 0 : le processus porte alors le nom de processus DS avec drive.
Il scrit : xt = xt1 + + t .
Comme prcdemment, on peut rechercher sa forme quivalente dveloppe :
x t = x t1 + + t
x t1 = x t2 + + t1 x t = x t2 + 2 + t1 + t
x t2 = x t3 + + t2 x t = x t3 + 3 + t2 + t1 + t
etc.
Si on suppose la valeur dorigine x 0 connue et dterministe, on a alors :
t
x t = x 0 + t + i
i =1

On peut analyser les caractristiques de ce processus :


E[x t ] = x 0 + t
V [x t ] = t2
/ t
cov[x t ,x t ] = 2 Min(t,t ) si t =
Le processus est non stationnaire de par son esprance et sa variance.
Lesprance tant de la mme forme que celle dun processus TS, on reconnat
dans ce processus une non stationnarit dterministe et alatoire la fois.
La stationnarisation de ce processus est ralise en utilisant le filtre aux dif-
frences premires :
x t = x t1 + + t (1 B)x t = + t
Soit en employant la forme dveloppe :

t 
t1
x t = x 0 + t + i et en calculant : x t1 = x 0 + (t 1) + i
i =1 i =1

On a : x t x t1 = (1 B)x t = + t .
Dans les processus de type DS, un choc un instant donn se rpercute
linfini sur les valeurs futures de la srie ; leffet du choc est donc permanent et
va en dcroissant.
En rsum, pour stationnariser un processus TS, la bonne mthode est celle
des moindres carrs ordinaires ; pour un processus DS, il faut employer le filtre
aux diffrences. Le choix dun processus DS ou TS comme structure de la chro-
nique nest donc pas neutre.

lments danalyse des sries temporelles  247


c) Consquences dune mauvaise stationnarisation du processus
Pour un processus TS, la bonne mthode de stationnarisation est celle des
moindres carrs ordinaires. Supposons que l'on applique au processus TS du pre-
mier ordre un filtre aux diffrences premires. A priori, comme le degr du poly-
nme est 1, ce filtre peut tre considr comme correct puisqu'un filtre aux dif-
frences d'ordre d limine un polynme de mme degr. Cependant, on dmontre
que l'application du filtre aux diffrences a cr une perturbation artificielle.
Pour un processus DS, la bonne mthode de stationnarisation est le filtre aux
diffrences premires. Supposons que l'on applique la mthode des moindres
carrs ordinaires (rgression sur le temps) sur les observations d'un chantillon
du processus, les paramtres de la tendance sont estims et par consquent le
rsidu de la rgression doit tre un bruit blanc. Nelson et Kang montrent par-
tir de simulations, que l'limination d'une tendance linaire sur un processus de
marche alatoire cre artificiellement une forte autocorrlation des rsidus pour
les premiers retards.
Sur le plan conomtrique, il est donc primordial d'identifier clairement le
processus sous-jacent et d'employer la mthode adquate de stationnarisation.
Sinon le risque de crer des bruits parasites artificiels est trs lev.
Les consquences sont galement importantes sur le plan conomique.
Considrons, par exemple, le PIB d'un pays comme la France en valeur relle.
Si ce PIB est DS plutt que TS, il est alors ncessaire de remettre en cause la
dcomposition traditionnelle (tendance et cycle) et sa justification thorique :
l'indpendance des schmas explicatifs. Si le PIB est en effet DS, la croissance
et le cycle sont lis et ne peuvent tre en consquence tudis de faon spars.
Or, d'aprs les travaux de Nelson et Plosser (1982) sur des chroniques macro-
conomiques amricaines, la variabilit constate de la composante conjonctu-
relle serait due une structure DS. Comme jusqu' prsent, l'analyse de cette
composante s'effectue partir du rsidu d'une rgression entre le PIB et une ten-
dance dterministe, cette analyse surestime l'amplitude du cycle et sous-estime
l'importance de la tendance. Sur ce constat, Beveridge S. et Nelson C.R. (1981)
proposent une dcomposition des processus selon une tendance stochastique
(permanente) qui obit une marche alatoire avec ou sans drive et une com-
posante stationnaire (transitoire). Par la suite Harvey A.C. (1988) utilise les
modles structurels composantes inobservables (modle tendance plus cycle et
tendance-cycle) reprsentes sous forme d'un modle espace d'tats estim par
le filtre de Kalman.

B. Les tests de racine unitaire


et la stratgie squentielle de test
Les tests de racine unitaire Unit Root Test permettent non seulement de
dtecter lexistence dune non-stationnarit mais aussi de dterminer de quelle
non-stationnarit il sagit (processus TS ou DS) et donc la bonne mthode pour
stationnariser la srie.

248  CONOMTRIE
a) Tests de racines unitaires : tests de Dickey-Fuller (1979)
Les tests de Dickey-Fuller (DF) permettent de mettre en vidence le caractre
stationnaire ou non dune chronique par la dtermination dune tendance dter-
ministe ou stochastique.
Les modles servant de base la construction de ces tests sont au nombre de
trois. Le principe des tests est simple : si lhypothse H0 : 1 = 1 est retenue
dans lun de ces trois modles, le processus est alors non stationnaire.
[1] xt = 1 xt1 + t Modle autorgressif dordre 1.
[2] xt = 1 xt1 + + t Modle autorgressif avec constante.
[3] xt = 1 xt1 + bt + c + t Modle autorgressif avec tendance.
Si lhypothse H0 est vrifie, la chronique xt nest pas stationnaire quel que
soit le modle retenu.
Dans le dernier modle [3], si on accepte H1 : 1 < 1 et si le coefficient b est
significativement diffrent de 0, alors le processus est un processus TS ; on peut
le rendre stationnaire en calculant les rsidus par rapport la tendance estime
par les moindres carrs ordinaires.
Sous H0, les rgles habituelles de linfrence statistique ne peuvent pas tre
appliques pour tester cette hypothse, en particulier la distribution de Student
du paramtre 1 ; Dickey et Fuller ont donc tudi la distribution asymptotique
de lestimateur 1 sous lhypothse H0. laide de simulations de Monte-Carlo,
ils ont tabul les valeurs critiques pour des chantillons de tailles diffrentes.
Ces tables sont des tables1 analogues aux tables du t de Student. Les auteurs ont
choisi de tester la valeur ( 1 pour des raisons purement sta-
1 1) au lieu de
tistiques. Cela nest pas gnant pour le test. En effet, xt = 1 xt1 + t scrit
aussi :
xt xt1 = 1 xt1 xt1 + t
xt = (1 1)xt1 + t
Il est donc quivalent de tester comme hypothse H0 : 1 = 1 ou 1 1 = 0 .
Les principes gnraux du test sont les suivants.
On estime par les moindres carrs ordinaires le paramtre 1 not 1 pour les
modles [1], [2] et [3]. Lestimation des coefficients et des carts types du modle
par les moindres carrs ordinaires fournit t1 qui est analogue la statistique de
Student (rapport du coefficient sur son cart type). Si t1  ttabule , alors on accep-
te lhypothse H0 ; il existe une racine unit, le processus nest donc pas
stationnaire.
Remarque : les principaux logiciels danalyse de sries temporelles calculent
automatiquement les valeurs critiques t1 .
b) Les tests de Dickey et Fuller Augments
Dans les modles prcdents, utiliss pour les tests de Dickey-Fuller simples, le
processus t est, par hypothse, un bruit blanc. Or il ny a aucune raison pour

1. Cf. table 7 en fin douvrage.

lments danalyse des sries temporelles  249


que, a priori, lerreur soit non corrle ; on appelle tests de Dickey-Fuller
Augments (ADF, 1981) la prise en compte de cette hypothse.
Les tests ADF sont fonds, sous lhypothse alternative |1 | < 1 , sur lesti-
mation par les MCO des trois modles :

p
Modle [4] : xt = xt1 j xt j+1 + t
j=2

p
Modle [5] : xt = xt1 j xt j+1 + c + t
j=2

p
Modle [6] : xt = xt1 j xt j+1 + c + bt + t
j=2

avec t i.i.d.
Le test se droule de manire similaire aux tests DF simples, seules les tables
statistiques diffrent. La valeur de p peut tre dtermine selon les critres de
Akaike ou de Schwarz, ou encore, en partant dune valeur suffisamment impor-
tante de p, on estime un modle p 1 retards, puis p 2 retards, jusqu ce
que le coefficient du pime retard soit significatif.
c) Le test de Phillips et Perron (1988)
Ce test est construit sur une correction non paramtrique des statistiques de
Dickey-Fuller pour prendre en compte des erreurs htroscdastiques. Il se
droule en quatre tapes :
1) Estimation par les moindres carrs ordinaires des trois modles de base
des tests de Dickey-Fuller et calcul des statistiques associes, soit et le rsidu
estim.
1 n
2 =
2) Estimation de la variance dite de court terme  e2
n t=1 t
3) Estimation d'un facteur correctif st2 (appel variance de long terme) tabli
partir de la structure des covariances des rsidus des modles prcdemment
estims de telle sorte que les transformations ralises conduisent des distri-
butions identiques celles du Dickey-Fuller standard :
l   
1 n  i 1 n
st2 = et2 + 2 1 et eti .
n t=1 i=1
l + 1 n t=i+1
Pour estimer cette variance de long terme, il est ncessaire de dfinir un
nombre de retards l (troncature de Newey-West) estim en fonction du nombre
d'observations n, l 4(n/100)2/9 .
1 1) n(k 1)
( 1
4) Calcul de la statistique de PP : t = k +
1 
1 k
2

avec k = (qui est gal 1 de manire asymptotique si et est un bruit
st2
blanc). Cette statistique est comparer aux valeurs critiques de la table de
MacKinnon.

250  CONOMTRIE
d) Stratgie de tests
Nous constatons que pour raliser un test de racine unitaire, le rsultat nest pas
identique selon lutilisation de lun des trois modles comme processus gnra-
teur de la chronique de dpart. Les conclusions auxquelles on parvient sont donc
diffrentes et peuvent entraner des transformations errones. Cest la raison pour
laquelle Dickey et Fuller, et leur suite dautres auteurs, ont labor des strat-
gies de tests1. Nous prsentons un exemple simplifi (schma 1) dune stratgie
de tests. Les valeurs critiques des tc et tb permettant de tester la nullit des coeffi-
cients c et b des modles [2] et [3] sont donnes en fin douvrage (table 7).
e) Le test KPSS (1992)
Kwiatkowski et al. (1992) propose dutiliser un test du multiplicateur de
Lagrange (L M) fond sur lhypothse nulle de stationnarit. Aprs estimation

t
des modles [2] ou [3], on calcule la somme partielle des rsidus : St = ei et
i=1
on estime la variance de long terme (st2 ) comme pour le test de Phillips et Perron.

Estimation du modle [3]


yt = c + bt + 1yt 1 + at
Test b = 0

non

Test 1 = 1 oui
non oui

Processus TS :1<1 Processus DS


yt = c + bt + 1yt 1 + at
Estimation du modle [2]
yt = c + 1yt 1 + at
Test c = 0
non

Test 1 = 1
oui
oui non

Processus DS Processus stationnaire

Estimation du modle [1]


yt = 1yt 1 + at
Test 1 = 1

oui non

Processus DS Processus stationnaire

Schma 1 Stratgie simplifie des tests de racine unitaire

1. Cf. Bourbonnais R. et Terraza M. Chapitre 5, 2010.

lments danalyse des sries temporelles  251



n
St2
1 t=1
La statistique est alors L M = . On rejette lhypothse de stationna-
st2 n2
rit si cette statistique est suprieure aux valeurs critiques lues dans une table
labore par les auteurs.
Il est noter que les logiciels RATS et Eviews permettent directement l'uti-
lisation de ces tests.

Exercice n 1
fichier C9EX1

Exemple dapplication des tests de racine unitaire au CAC40


On demande dappliquer les tests de non-stationnarit lindice CAC40 (indice
reprsentatif de lvolution des cours de bourse) sur une priode de 1160 jours.

Solution

Nous allons tudier le CAC40 sur 1 160 observations quotidiennes. Le graphique 1


illustre lvolution de lindice CAC40.
Les fonction dautocorrlation simple et partielle, pour h = 15 retards, sont obtenues
directement par une fonction :

252  CONOMTRIE
Graphique 1 volution de lindice boursier CAC40

Eviews fournit les rsultats des fonctions dautocorrlation simple (colonne AC) et par-
tielle (colonne PAC), avec les corrlogrammes respectifs. Les bornes de lintervalle de
confiance sont stylises par des traits pointills horizontaux ; chaque terme qui sort de cet
intervalle est donc significativement diffrent de 0 au seuil de 5 %. Nous nous apercevons
que tous les termes du corrlogramme simple sont extrieurs l'intervalle de confiance. Le
processus n'est pas un bruit blanc (il semble mme caractristique d'un processus non sta-
tionnaire). La statistique Q de Ljung-Box (la seule calcule par Eviews) confirme ce fait :
2
Q-Stat = 14483 (au retard k = 15) > 0,05;15 = 25, on refuse l'hypothse de nullit des coef-
ficients k (la probabilit critique de ce test est indique c = 0,000 < 0,05, donc on refu-
se H0). Le processus CAC40 n'est pas un bruit blanc. A partir des tests de Dickey-Fuller
nous allons examiner si le processus est non stationnaire.
Le test de Dickey-Fuller simple consiste estimer1 les trois modles :
[1] : CACt CACt1 = DCACt = (1 1) CACt1
[2] : CACt CACt1 = DCACt = (1 1) CACt1 + c
[3] : CACt CACt1 = DCACt = (1 1) CACt1 + c + bt
Lestimation par les MCO des paramtres du modle [3] donne :
DCACt = 0,008447 CACt1 + 14,94 + 0,002103 t
(2,053) (2,0) (1,11)
n = 1 159 () = t empirique.
Le coefficient de la droite de tendance nest pas significativement diffrent de 0
(t = 1,11), on rejette lhypothse dun processus TS et t1 = 2,053 > ttabule
= 3,41 (ou n( 1 1) = 1 159 0,008447 = 9,79 > 21,8 ) ; on accepte lhypo-
thse H0 (valeurs critiques au seuil de 5 %) ; le processus nest pas stationnaire.
Lestimation par les MCO des paramtres du modle [2] donne :
DCACt = 0,00709 CACt1 + 13,63
(1,805) (1,85)
n = 1 159 () = t empirique.

1. Ces tests trs brivement prsents ici doivent faire lobjet dune stratgie afin de tester les cas
des hypothses jointes. Cf. Bourbonnais R. et Terraza M., 2010.

lments danalyse des sries temporelles  253


Le terme constant nest pas significativement diffrent de 0 (t = 1,85), on rejette
lhypothse dun processus DS avec drive et t1 = 1,805 > ttabule = 2,86 ; on
accepte lhypothse H0 ; le processus nest pas stationnaire.
Enfin lestimation par les MCO des paramtres du modle [1] donne :
DCACt = 0,000174 CACt1
(0,536)
n = 1 159 () = t empirique.
t1 = 0,536 > ttabule = 1,95 , on accepte lhypothse H0 ; le processus nest pas
stationnaire.
Le test DFA (avec quatre retards) conduit des rsultats similaires :

Hypothse H0 : CAC possde une racine unitaire


Nombre de retards (minimum du critre de Akaike) = 4
Test de Dickey-Fuller Augment t Statistique Probabilit critique
Modle [4] 0,46 0,81
Modle [5] 2,03 0,27
Modle [6] 2,28 0,44

Les probabilits critiques sont toutes suprieures 0,05, nous ne rejetons pas lhy-
pothse H0 ; nous pouvons donc conclure que le processus CAC40 possde une racine
unitaire et nest donc pas stationnaire.
Nous procdons ensuite au test de Phillips-Perron avec une troncature l = 6.

Hypothse H0 : CAC possde une racine unitaire


Troncature l = 6
Test de Phillips-Perron t Statistique ajust Probabilit critique
Modle [1] 0,50 0,82
Modle [2] 1,94 0,31
Modle [3] 2,20 0,49

Les probabilits critiques sont toutes suprieures 0,05, nous ne rejetons pas lhy-
pothse H0 ; le processus CAC40 possde une racine unitaire.
Enfin, nous procdons aux tests KPSS.

Hypothse H0 : CAC ne possde pas une racine unitaire


Troncature l = 6
Test de Kwiatkowski-Phillips-Schmidt-Shin LM Statistique Valeur critique 5%
Modle [2] 2,58 0,46
Modle [3] 1,31 0,14

La statistique LM est suprieure la valeur critique (pour un seuil de 5%) pour les
deux spcifications, nous rejetons lhypothse H0, le processus CAC40 possde donc une
racine unitaire.
Tous les rsultats sont convergents, nous pouvons donc conclure que le processus
CAC40 nest pas stationnaire.
Sagit-il dun processus de marche au hasard sans drive ? Nous allons le vrifier en
calculant le corrlogramme de la srie filtre par les diffrences premires ceci afin de
stationnariser le processus :
DCACt = CACt CACt1.

254  CONOMTRIE
La statistique Q a une probabilit critique de 0,182 (pour k = 15) largement sup-
rieure 0,05 ; nous acceptons lhypothse H0 de nullit des coefficients du corrlogram-
me. Le corrlogramme de la srie CAC40 filtre par les diffrences premires est carac-
tristique dun bruit blanc. La srie CAC40 est donc bien un processus DS sans drive.
Sagit-il dun bruit blanc gaussien ?
Lhistogramme de la distribution et les valeurs empiriques des Skewness, Kurtosis
et de la statistique de Jarque-Bera sont donns par :

Les tests sont effectus partir des valeurs :


1/2
| 0| | 0,39 0|
1 = 1 =  = 5,42 > 1,96
6 6
n 1 159

lments danalyse des sries temporelles  255


|2 3| |6,83 3|
et 2 =  =  = 26,61 > 1,96 .
24 24
n 1 159
Nous rejetons lhypothse de normalit en ce qui concerne la symtrie et laplatissement
de la distribution, ce qui est confirm par la statistique de Jarque-Bera :
2
JB = 741,3 > 0,05 (2) = 5,99 . Le processus CAC40 en diffrences est donc un bruit
blanc non gaussien.

III. Les modles ARIMA


Nous allons prsenter une famille de processus alatoires qui sont censs recou-
vrir une gamme trs large dvolution possible de sries chronologiques : les
processus autorgressifs et les processus de moyenne mobile.

A. Typologie des modles AR, MA et ARMA


1) Modle AR (Auto Rgressif)
a) Formulation
Dans le processus autorgressif dordre p, lobservation prsente yt est gnre
par une moyenne pondre des observations passes jusqu la p-ime priode
sous la forme suivante :
AR(1) : yt = 1 yt1 + t
AR(2) : yt = 1 yt1 + 2 yt2 + t
...
AR( p) : yt = 1 yt1 + 2 yt2 + . . . + p yt p + t [4]
o 1 ,2 ,. . . , p sont des paramtres estimer positifs ou ngatifs, t est un ala
gaussien.
Nous pouvons ajouter ce processus une constante qui ne modifie en rien les
proprits stochastiques. Lquation [4] peut aussi scrire laide de lopra-
teur dcalage D :
(1 1 D 2 D 2 . . . p D p )yt = t

b) Caractristiques des corrlogrammes


Il est dmontr que le corrlogramme simple dun processus AR( p) est caract-
ris par une dcroissance gomtrique de ses termes de type :
k = k
Le corrlogramme partiel a ses seuls p premiers termes diffrents de 0.

256  CONOMTRIE
2) Modle MA (Moving Average : Moyenne Mobile)
a) Formulation
Dans le processus de moyenne mobile dordre q, chaque observation yt est gn-
re par une moyenne pondre dalas jusqu la q-ime priode.
MA(1) : yt = t 1 t1
MA(2) : yt = t 1 t1 2 t2
...
MA(q) : yt = t 1 t1 2 t2 . . . q tq [5]
o 1 ,2 ,. . . ,q sont des paramtres pouvant tre positifs ou ngatifs et t est un
ala gaussien.
Lquation [5] peut aussi scrire :
(1 1 D 2 D 2 . . . q D q )t = yt .
Dans ce processus, tout comme dans le modle auto-rgressif AR, les alas
sont supposs tre engendrs par un processus de type bruit blanc. Nous pou-
vons interprter le modle MA comme tant reprsentatif dune srie chronolo-
gique fluctuant autour de sa moyenne de manire alatoire, do le terme de
moyenne mobile car celle-ci, en lissant la srie, gomme le bruit cr par lala.
Il est noter quil y a quivalence entre un processus MA(1) et un processus
AR dordre p infini :
MA(1) = AR().
b) Caractristiques des corrlogrammes
Le corrlogramme simple dun processus MA(q) est de la forme gnrale :

i=qk
i i+k
i=0
k = pour k = 0,1,. . . ,q et k = 0 pour k > q.

i=q
2
i
i=0

Cest--dire que seuls les q premiers termes du corrlogramme simple sont


significativement diffrents de 0.
Le corrlogramme partiel est caractris par une dcroissance gomtrique
des retards.

3) Modle ARMA (mlange de processus AR et MA)


a) Formulation
Les modles ARMA sont donc reprsentatifs dun processus gnr par une
combinaison des valeurs passes et des erreurs passes. Ils sont dfinis par
lquation :

lments danalyse des sries temporelles  257


ARMA( p,q) : (1 1 D 2 D 2 . . . p D p )yt =
= (1 1 D 2 D 2 . . . q D q )t
Nous avons :
ARMA(1,0) = AR(1); ARMA(0,1) = MA(1).

Dans le cas dun processus ARMA(p, q) avec constante :


yt = + 1 x t1 + 2 x t2 + ... + p x t p + t 1 t1
2 t2 ... q tq

Lesprance du processus est donne1 par E(x t ) =
(1 1 2 ... p )
Donc connaissant lesprance du processus (Eviews calcule directement les-
prance du processus), la constante du processus ARMA est dtermine par :

= E(x t ) (1 1 2 ... p )

b) Caractristiques des corrlogrammes


Les corrlogrammes simples et partiels sont, par voie de consquence, un
mlange des deux corrlogrammes des processus AR et MA purs. Il savre
ainsi plus dlicat didentifier ces processus partir de ltude des fonctions
dautocorrlation empiriques.
Le tableau 2 synthtise les caractristiques, en termes de corrlogrammes,
des processus AR, MA et ARMA.
Tableau 2 Rsum des proprits des fonctions dautocorrlation
simple et partielle

Processus Fonction autocorrlation simple Fonction autocorrlation partielle

AR(1) Dcroissance exponentielle(1 > 0) ou Pic significatif pour le premier retard:


sinusodale amortie (1 < 0) Positif si 1 > 0 et ngatif si 1 < 0,
les autres coefficients nuls pour des
retards > 1

AR(2) Dcroissance exponentielle ou sinuso- Pics significatifs pour le premier et


dale selon les signes de 1 et 2 second retards, les autres coefficients sont
nuls pour des retards > 2

AR(p) Dcroissance exponentielle et/ou sinu- Pics significatifs pour les p premiers
sodale retards, les autres coefficients sont nuls
pour des retards > p

1. Il suffit de remplacer chaque terme E(x t ) = E(x t1 ) = E(x t2 ) = ... = E(x t p ) car la srie
est stationnaire.

258  CONOMTRIE
Processus Fonction autocorrlation simple Fonction autocorrlation partielle

MA(1) Pic significatif pour le premier retard : Dcroissance exponentielle ( 1 > 0) ou


positif si 1 < 0 et ngatif si 1 > 0. sinusodale amortie ( 1 < 0)
Les autres coefficients sont nuls pour
des retards > 1

MA(2) Pics significatifs pour le premier et Dcroissance exponentielle ou sinusoda-


second retards. Les autres coefficients le selon les signes de 1 et 2
sont nuls pour des retards > 2

MA(q) Pics significatifs pour les q premiers Dcroissance exponentielle et/ou sinuso-
retards. Les autres coefficients nuls pour dale
des retards > q

ARMA(1, 1) Dcroissance gomtrique partir du Dcroissance exponentielle ( 1 > 0) ou


premier retard, le signe est dtermin sinusodale amortie ( 1 < 0)
par 1 1

ARMA(p, q) Dcroissance exponentielle ou sinuso- Dcroissance exponentielle ou sinusoda-


dale amortie tronque aprs (q p) le amortie tronque aprs p q retards
retards

4) Conditions dutilisation
Les modles AR, MA, ARMA ne sont reprsentatifs que de chroniques :
stationnaires en tendance ;
corriges des variations saisonnires.

B. Lextension aux processus ARIMA et SARIMA


Les tests de Dickey-Fuller et Dickey-Fuller Augment envisags prcdemment
permettent de dterminer si la srie est stationnaire et dans le cas dune non-
stationnarit de quel type il sagit : TS et DS.
Si la srie tudie est de type TS, il convient de la stationnariser par rgres-
sion sur le temps et le rsidu destimation est alors tudi selon la mthodologie
de Box-Jenkins. Ceci permet de dterminer les ordres p et q des parties AR et
MA du rsidu. Le modle est toujours dans ce cas un ARMA( p, q) .
Si la srie tudie est de type DS, il convient de la stationnariser par passa-
ge aux diffrences selon lordre dintgration I = d (cest--dire le nombre de
fois quil faut diffrencier la srie pour la rendre stationnaire). La srie diff-
rencie est alors tudie selon la mthodologie de Box-Jenkins qui permet de
dterminer les ordres p et q des parties AR et MA. On note ce type de modle
ARIMA( p, d, q) .
Les modles SARIMA permettent dintgrer un ordre de diffrenciation li
une saisonnalit gnralise par la transformation : (1 D s )yt = yt yts o
s correspond la priodicit des donnes (s = 4 pour une srie trimestrielle,
s = 12 pour une srie mensuelle).

lments danalyse des sries temporelles  259


Exercice n 2
Gnration de processus ARMA et analyse des corrlogrammes
On demande de gnrer sur 200 observations, de manire artificielle, les processus
suivants et den tudier les corrlogrammes.
1) MA(1) : yt = 2 + (1 + 0,8 D)t
2) AR(1) : (1 0,9 D)yt = 2 + t
3) MA(2) : yt = 2 + (1 + 0,6 D 0,3 D 2 )t
4) AR(2) : (1 0,9 D + 0,7 D 2 )yt = 2 + t
5) ARMA(1, 1) : (1 0,9 D)yt = 2 + (1 + 0,8 D)t
avec t N (0 ; 1).
Solution
Le programme Eviews ( C9EX2.PRG) permettant de gnrer les processus est dis-
ponible en tlchargement.

IV. La mthode de Box et Jenkins


La partie autorgressive dun processus, note AR, est constitue par une com-
binaison linaire finie des valeurs passes du processus. La partie moyenne
mobile, note MA, est constitue dune combinaison linaire finie en t des
valeurs passes dun bruit blanc. Wold (1954) montre que les modles ARMA
permettent de reprsenter la plupart des processus stationnaires. Lapproche de
Box et Jenkins (1976) consiste en une mthodologie dtude systmatique des
sries chronologiques partir de leurs caractristiques afin de dterminer, dans
la famille des modles ARIMA, le plus adapt reprsenter le phnomne tu-
di. Trois tapes principales sont dfinies.

A. Recherche de la reprsentation adquate :


lidentification1
La phase didentification est la plus importante et la plus difficile : elle consiste
dterminer le modle adquat dans la famille des modles ARIMA. Elle est

1. Attention : il ne faut pas confondre lemploi de ce terme avec son utilisation dans le cadre des
modles quations simultanes.

260  CONOMTRIE
fonde sur ltude des corrlogrammes simple et partiel. Nous pouvons essayer
ddicter quelques rgles simples facilitant la recherche des paramtres p, d, q
du modle ARIMA.

1) Dsaisonnalisation
Dans le cas dune srie affecte dun mouvement saisonnier, il convient de la reti-
rer pralablement tout traitement statistique. Cette saisonnalit est ajoute la
srie prvue la fin du traitement afin dobtenir une prvision en terme brut.

2) Recherche de la stationnarit en terme de tendance


Si ltude du corrlogramme simple et les tests statistiques sy rapportant (statis-
tique Q) prsagent dune srie affecte dune tendance, il convient den tudier les
caractristiques selon les tests de Dickey-Fuller. La mthode dlimination de la
tendance est fonction du processus DS ou TS sous-jacent la chronique tudie.
Aprs stationnarisation, nous pouvons identifier les valeurs des paramtres
p, q du modle ARMA.
Si le corrlogramme simple na que ses q premiers termes (q = 3 maximum)
diffrents de 0 et que les termes du corrlogramme partiel diminuent lente-
ment, nous pouvons pronostiquer un MA(q) .
Si le corrlogramme partiel na que ses p premiers termes (p = 3 maximum)
diffrents de 0 et que les termes du corrlogramme simple diminuent lente-
ment, cela caractrise un AR( p) .
Si les fonctions dautocorrlation simple et partiel ne paraissent pas tronques,
il sagit alors dun processus de type ARMA, dont les paramtres dpendent
de la forme particulire des corrlogrammes.

B. Estimation des paramtres


Les mthodes destimation diffrent selon le type de processus diagnostiqu.
Dans le cas dun modle AR( p), nous pouvons appliquer une mthode des
moindres carrs (cf. chapitre 7) ou bien nous pouvons utiliser les relations exis-
tantes entre les autocorrlations et les coefficients du modle (quations de Yule-
Walker).
Lestimation des paramtres dun modle MA(q) savre plus complexe.
Box et Jenkins suggrent dutiliser une procdure itrative de type balayage que
nous pouvons illustrer de la manire suivante.
Supposons le processus :
(1 1 D 2 D 2 )yt = (1 1 D 2 D 2 )t

que nous pouvons crire :

lments danalyse des sries temporelles  261


1
yt = (1 1 D 2 D 2 )t
1 1 D 2 D 2
1
Nous posons vt = t ,
1 1 D 2 D 2
il vient alors :
vt 1 vt1 2 vt2 = t [6]
Ce qui nous donne :
yt = vt 1 vt1 2 vt2 o vt = yt + 1 vt1 + 2 vt2 [7]
Nous pouvons alors initialiser la procdure de balayage en partant de deux
1 ;
intervalles de valeurs plausibles pour ( 2 ) et dun pas dincrmentation.
2 ), nous posons : 
1 ;
Puis, pour chaque couple de valeurs ( v0 = 0 et 
v1 = 0,
et nous calculons les valeurs estimes de 
vt partir de la relation [7] :

v2 = y2

v3 = y3 + 
1
v2

v4 = y4 + 
1
v3 + 
2
v2 , etc.

Aprs calcul de toutes les valeurs de 


vt , nous estimons les paramtres 1 et
2 par la mthode des moindres carrs applique lquation [6] :

vt = 1 vt1 + 2 vt2 + t [8]

Nous retenons les valeurs  1 , 


2 et 
1 , 
2 qui rendent minimum la somme
des carrs des rsidus issue de la rgression de lquation [8].
Cette mthode destimation nest valide que si le nombre de paramtres
estimer nest pas trop important.
Nous pouvons mentionner des mthodes destimation fondes sur une maxi-
misation de fonctions de vraisemblance recourant alors des procdures itra-
tives de rgression non linaire, telles que celles envisages au chapitre 6.

C. Tests dadquation du modle et prvision


Les paramtres du modle tant estims (on vrifie la convergence de la proc-
dure itrative destimation), nous examinons les rsultats destimation.
Les coefficients du modle doivent tre significativement diffrents de 0 (le test
du t de Student sapplique de manire classique). Si un coefficient nest pas
significativement diffrent de 0, il convient denvisager une nouvelle spcifi-
cation liminant lordre du modle AR ou MA non valide.
Lanalyse des rsidus : si les rsidus obissent un bruit blanc, il ne doit pas
exister dautocorrlation dans la srie et les rsidus doivent tre homoscdas-
tiques. Les tests suivants peuvent tre utiliss.

262  CONOMTRIE
le test de Durbin Watson, bien quil ne permette de dtecter que des auto-
corrlations dordre 1 ;
les tests de Box et Pierce et de Ljung et Box (cf. I, C de ce chapitre) qui
permettent de tester lensemble des termes de la fonction dautocorrla-
tion. Si le rsidu est mmoire, cela signifie que la spcification du mod-
le est incomplte et quil convient dajouter au moins un ordre au proces-
sus ;
le test ARCH dhtroscdasticit (cf. chapitre 5, II, D) effectu partir de
la fonction dautocorrlation du rsidu au carr.
La phase de validation du modle est trs importante et ncessite le plus sou-
vent un retour la phase didentification.
Lorsque le modle est valid, la prvision peut alors tre calcule un hori-
zon de quelques priodes, limites car la variance de lerreur de prvision crot
trs vite avec lhorizon.
Nous pouvons rsumer les diffrentes tapes de la mthodologie de Box et
Jenkins partir du schma 2.

Schma 2 Les tapes de la mthodologie de Box et Jenkins

lments danalyse des sries temporelles  263


Exercice n 3 fichier C9EX3
Analyse par la mthodologie de Box et Jenkins et prvision
de trois processus alatoires
Soit les trois processus x1 , x2 et x3 connus sur 220 priodes, on demande de :
analyser leurs proprits stochastiques ;
dterminer, le cas chant, lordre du processus ARMA(p, q) ;
effectuer une prvision, par une mthode adapte, un horizon de 3 priodes.
Solution
Les rsultats sont fournis sans les calculs intermdiaires.
1) Analyse du processus x1
Le graphique 2 prsente lvolution du processus x1 et son corrlogramme, leur
lecture le processus est non stationnaire.

800

700

600

500

400

300

200

100

0
25 50 75 100 125 150 175 200

X1

Graphique 2 volution et fonction dautocorrlation simple du processus x1

a) Stratgie simplifie de test : tests de Phillips-Perron (fentre de Newey-West = 4)


Estimation du modle [3]

Null Hypothesis: X1 has a unit root


Exogenous: Constant, Linear Trend
Bandwidth: 4 (Fixed using Bartlett kernel)
Adj. t-Stat Prob.
Phillips-Perron test statistic 2.148148 0.5157
Dependent Variable: D(X1)
Included observations: 219 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
X1(-1) 0.039046 0.021398 1.824772 0.0694
C 3.725580 0.811468 4.591160 0.0000
@TREND(1) 0.124280 0.066711 1.862974 0.0638

264  CONOMTRIE
Nous acceptons lhypothse H0 de racine unitaire, nous ne pouvons donc pas inter-
prter les probabilits critiques calcules directement selon les lois de Student. Nous
devons nous rfrer la table statistique 7 en fin douvrage : tb = 1,86 < tb0,05 = 2,79
(valeur lue 5%, modle [3]), acceptation de lhypothse b = 0. Selon la stratgie
squentielle de test nous estimons le modle [2].

Estimation du modle [2]

Null Hypothesis: X1 has a unit root


Exogenous: Constant
Bandwidth: 4 (Fixed using Bartlett kernel)
Adj. t-Stat Prob.
Phillips-Perron test statistic 0.307267 0.9783
Dependent Variable: D(X1)
Included observations: 219 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
X1(-1) 0.000673 0.001830 0.367843 0.7133
C 3.128542 0.749736 4.172860 0.0000

Nous acceptons lhypothse H0 de racine unitaire, nous ne pouvons pas interprter


les probabilits critiques calcules directement selon les lois de Student :
tc = 4,17 > tc0,05 = 2,84 (valeur lue 5%, modle [2]), nous refusons lhypothse
c = 0. Il sagit donc dun processus DS avec drive : x1t = x1t1 + c + t . Nous le sta-
tionarisons par le passage aux diffrences premires.

b) Analyse des fonctions dautocorrlation simple et partielle sur la srie stationnaire

Il ne sagit pas dune marche au hasard (les probabilits critiques de la Q-Stat sont
toutes trs largement infrieures 0,05), le processus est mmoire, il existe donc une
reprsentation dans la classe des processus ARMA.

lments danalyse des sries temporelles  265


c) Recherche des ordres p et q de la reprsentation ARMA
Compte tenu de la forme des corrlogrammes simple et partiel nous slectionnons
un modle ARMA(2, 1). Nous constatons que la constante est significativement diff-
rente de 0, et des essais dautres reprsentations concurrentes (ARMA(1, 1)) indiquent
des valeurs des critres dinformation (AIC ou SC) suprieures au modle retenu.

Dependent Variable: D(X1)


Included observations: 217 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 3.327748 0.346054 9.616272 0.0000
AR(1) 0.760134 0.066149 11.49128 0.0000
AR(2) - 0.604867 0.062249 - 9.716905 0.0000
MA(1) 0.500890 0.073470 6.817644 0.0000

d) Validation de la reprsentation
Tests de Student sur les coefficients :
Les coefficients sont tous significativement diffrents de 0 (probabilits critiques
infrieures 0,05)
Analyse des rsidus
Corrlogramme du rsidu Corrlogramme du rsidu au carr

Le corrlogramme du rsidu indique quil sagit dun processus sans mmoire, le


corrlogramme du rsidu au carr (test ARCH, cf. chapitre 5) nindique aucun terme de
significativement diffrent de 0 ; lhomoscdasticit des rsidus est donc vrifie. Les
rsidus sont donc un processus de bruit blanc.
Les rsidus sont-ils gaussiens ? La statistique de Jarque-Bera (JB = 2,06) indique
une probabilit critique de 0,35, nous acceptons lhypothse H0 de normalit des rsi-
dus.
La reprsentation est valide, x1t est un processus ARIMA(2, 1, 1) avec constante.

e) Prvision
La valeur de la constante est gale : = E(x1t ) (1 1 2 )

266  CONOMTRIE
La prvision est donne par :
x1t = 1 x1t1 + 2 x1t2 + E(x1t ) (1 1 2 ) + t + 1 t1
x1t = 0,76 x1t1 0,60 x1t2 + 3,33 (1 0,76 + 0,60) + t + 0,50 t1
x1t = x1t1 + x1t
x1,221 = 0,76 x1,220 0,60 x1,219 + 2,81 + 221 + 0,50 220
x1,221 = 0,76 7,76 0,60 12,39 + 2,81 + 0 + 0,50 0,87 = 1,65
Jusqu lobservation t = 220 nous prenons t = rsidu, pour t > 220, E(t ) = 0.
x1,221 = x1,220 + x1,221 = 741,90 + 1,65 = 743,55
x1,222 = 0,76 x1,221 0,60 x1,220 + 2,81 + 222 + 0,50 221
x1,222 = 0,76 1,65 0,60 7,76 + 2,81 + 0 + 0 = 0,63
x1,222 = x1,221 + x1,222 = 743,55 0,63 = 742,92

x1,223 = 0,76 x1,222 0,60 x1,221 + 2,81 + 223 + 0,50 222


x1,223 = 0,76 0,63 0,60 1,65 + 2,81 + 0 + 0 = 1,34
x1,223 = x1,222 + x1,223 = 742,92 + 1,34 = 744,26
Les rsultats sont prsents au tableau 3.
Tableau 3 Calcul des prvisions du processus ARIMA(2, 1, 1)

t x1t x1t t = rsidus


218 721,75 10,2 4,07
219 734,14 12,39 2,28
220 741,90 7,76 0,87
221 743,55 1,65 0
222 742,92 0,63 0
223 744,26 1,34 0

2) Analyse du processus x2
Le graphique 3 prsente lvolution du processus x2 et son corrlogramme, leur
lecture le processus semble non stationnaire.

35

30

25

20

15

10

0
25 50 75 100 125 150 175 200

X2

Graphique 3 volution et fonction dautocorrlation simple du processus x2

lments danalyse des sries temporelles  267


a) Stratgie simplifie de test : tests de Dickey-Fuller
Doit-on utiliser le test de Dickey-Fuller simple ou le test de Dickey-Fuller
Augment ?
Pralablement nous dterminons la valeur de p, si p = 0 nous utilisons le test de
Dickey-Fuller. partir du modle [2] (modle avec constante) nous slectionnons
lordre p du modle partir des critres dinformation dAkaike et de Schwarz. Les deux
critres sont convergents1 p = 3.

Null Hypothesis: X2 has a unit root


Exogenous: Constant
Lag Length: 3 (Automatic based on AIC, MAXLAG=8)

Null Hypothesis: X2 has a unit root


Exogenous: Constant
Lag Length: 3 (Automatic based on SIC, MAXLAG=8)

Nous appliquons donc la stratgie squentielle des tests partir des tests de Dickey-
Fuller Augment avec p = 3.

Estimation du modle [3]


Null Hypothesis: X2 has a unit root
Exogenous: Constant, Linear Trend
Lag Length: 3 (Fixed)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic 2.253814 0.4570
Test critical values: 1% level 4.001108
5% level 3.430766
10% level 3.138998
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(X2)
Sample (adjusted): 5 220
Included observations: 216 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
X2( 1) 0.080344 0.035648 2.253814 0.0252
D(X2( 1)) 0.229159 0.070487 3.251071 0.0013
D(X2( 2)) 0.209633 0.069319 3.024181 0.0028
D(X2( 3)) 0.168372 0.067849 2.481571 0.0139
C 1.314041 0.575187 2.284546 0.0233
@TREND(1) 0.002458 0.003842 0.639940 0.5229

Nous acceptons lhypothse H0 de racine unitaire, nous ne pouvons pas interprter


les probabilits critiques calcules directement selon les lois de Student. Nous devons

1. En cas de divergence des critres nous retenons la valeur de p minimum des deux critres.

268  CONOMTRIE
donc nous rfrer la table statistique 7 en fin douvrage : tb = 0,64 < tb0,05 = 3,12
(valeur lue 5 %, modle [3]), acceptation de lhypothse b = 0. Nous estimons le
modle [2].
Estimation du modle [2]
Null Hypothesis: X2 has a unit root
Exogenous: Constant
Lag Length: 3 (Fixed)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic 2.306282 0.1709
Test critical values: 1% level 3.460596
5% level 2.874741
10% level 2.573883
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(X2)
Sample (adjusted): 5 220
Included observations: 216 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
X2( 1) 0.067264 0.029165 2.306282 0.0221
D(X2( 1)) 0.239180 0.068630 3.485076 0.0006
D(X2( 2)) 0.217876 0.068017 3.203270 0.0016
D(X2( 3)) 0.174967 0.066968 2.612710 0.0096
C 1.347763 0.571966 2.356368 0.0194

Nous acceptons lhypothse H0 de racine unitaire, nous ne pouvons pas interprter


les probabilits critiques calcules directement selon les lois de Student :
tc = 2,35 < tc0,05 = 3,39 (valeur lue 5 %, modle [2]), nous acceptons lhypothse
c = 0. Il sagit donc dun processus DS sans drive : x2t = x2t1 + t . Nous le stationa-
risons par le passage aux diffrences premires.

b) Analyse des fonctions dautocorrlation simple et partielle sur la srie stationnaire

lments danalyse des sries temporelles  269


Il ne sagit pas dune marche au hasard (les probabilits critiques de la Q-Stat sont
toutes trs largement infrieures 0,05), le processus est mmoire, il existe donc une
reprsentation dans la classe des processus ARMA.

c) Recherche des ordres p et q de la reprsentation ARMA


Compte tenu de la forme des corrlogrammes simple et partiel nous slectionnons
un modle ARMA(1, 1). Nous constatons que la constante nest pas significativement
diffrente de 0, et des essais dautres reprsentations concurrentes (ARMA(2, 0) ou
ARMA(0, 2)) indiquent des valeurs des critres dinformation (AIC ou SC) suprieures
au modle retenu.

Dependent Variable: D(X2)


Sample (adjusted): 3 220
Included observations: 218 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
AR(1) 0.437628 0.127029 3.445091 0.0007
MA(1) 0.743275 0.094329 7.879625 0.0000

d) Validation de la reprsentation
Tests de Student sur les coefficients
Les coefficients sont tous significativement diffrents de 0 (probabilits critiques
infrieures 0,05).
Analyse des rsidus

Corrlogramme du rsidu Corrlogramme du rsidu au carr

Le corrlogramme du rsidu indique quil sagit dun processus sans mmoire, le


corrlogramme du rsidu au carr nindique aucun terme de significativement diffrent
de 0 ; les rsidus sont donc homoscdastiques. Les rsidus sont donc un bruit blanc.
Les rsidus sont-ils gaussiens ? La statistique de Jarque-Bera (JB = 5,88) indique
une probabilit critique de 0,052, nous acceptons (de justesse !) lhypothse de norma-
lit des rsidus.
La reprsentation est valide, x2t est un processus ARIMA(1, 1, 1) sans constante.

270  CONOMTRIE
e) Prvision
La prvision est donne (E(t ) = 0 pour t > 220) par :
x2t = 1 x2t1 + 1 t1
x2t = 0,437 x2t1 0,743t1
x2t = x2t1 + x2t

x2,221 = 0,437 x2,220 0,743 220


x2,221 = 0,437 1,318 0,743 0,889 = 0,084
x2,221 = x2,220 + x2,221 = 19,61 + 0,084 = 19,69

x2,222 = 0,437 x2,221 0,743 221


x2,222 = 0,437 0,084 0,743 0 = 0,037
x2,222 = x2,221 + x2,222 = 19,69 + 0,037 = 19,73

x2,223 = 0,437 x2,222 0,743 222


x2,223 = 0,437 0,037 0,743 0 = 0,016
x2,223 = x2,222 + x2,223 = 19,73 + 0,016 = 19,75

Les rsultats sont prsents au tableau 4.

Tableau 4 Calcul des prvisions du processus ARIMA(1, 1, 1)

t x2t x2t t = rsidus


218 20,438 3,328 2,464
219 20,930 0,492 0,867
220 19,611 1,318 0,889
221 19,695 0,084 0
222 19,732 0,037 0
223 19,748 0,016 0

3) Analyse du processus x3
Le graphique 4 prsente lvolution du processus x3 et son corrlogramme, leur
lecture le processus est clairement non stationnaire.

700

600

500

400

300

200

100

0
25 50 75 100 125 150 175 200

X3

Graphique 4 volution et fonction dautocorrlation simple du processus x3

lments danalyse des sries temporelles  271


a) Stratgie simplifie de test : tests de Phillips-Perron (choix automatique de la fentre
de Newey-West)

Estimation du modle [3]


Null Hypothesis: X3 has a unit root
Exogenous: Constant, Linear Trend
Bandwidth: 1 (Newey-West using Bartlett kernel)
Adj. t-Stat Prob.*
Phillips-Perron test statistic 15.03107 0.0000
Test critical values: 1% level 4.000511
5% level 3.430477
10% level 3.138828
Phillips-Perron Test Equation
Dependent Variable: D(X3)
Sample (adjusted): 2 220
Included observations: 219 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
X3(- 1) 1.023098 0.068065 15.03108 0.0000
C 10.33495 0.639662 16.15689 0.0000
@TREND(1) 3.065841 0.203980 15.03013 0.0000

Nous refusons lhypothse H0 de racine unitaire, nous pouvons donc interprter


directement les probabilits critiques calcules selon les lois de Student, refus aussi de
lhypothse b = 0.
Le processus x3 est un TS (Trend Stationnary), x3t = a0 + a1 t + t avec
t = 1, 2, ..., n. La bonne mthode de stationnarisation consiste donc effectuer une
rgression sur le temps.

b) Modlisation
Soit la rgression de x3 sur une tendance dterministe t = 1, 2, ... , n

Dependent Variable: X3
Method: Least Squares
Included observations: 220
Variable Coefficient Std. Error t-Statistic Prob.
C 7.171985 0.409466 17.51547 0.0000
TENDANCE 2.996632 0.003213 932.7294 0.0000

c) Validation de la reprsentation
Tests de Student sur les coefficients
Les coefficients sont tous significativement diffrents de 0 (probabilits critiques
infrieures 0,05).

272  CONOMTRIE
Analyse des rsidus
Corrlogramme du rsidu Corrlogramme du rsidu au carr

Le corrlogramme du rsidu indique quil sagit dune marche au hasard, le corr-


logramme du rsidu au carr nindique aucun terme de significativement diffrent de 0 ;
les rsidus sont donc homoscdastiques. Les rsidus sont donc un bruit blanc.
Les rsidus sont-ils gaussiens ? La statistique de Jarque-Bera (JB = 1,249) indique
une probabilit critique de 0,54, nous acceptons lhypothse de normalit des rsidus.
La reprsentation est valide x3t est un processus TS.

d) Prvision
La prvision est donne par :
x3t = a0 + a1 t + t avec (E(t ) = 0) t
x3t = 7,17 + 2,996 t

x3,221 = 7,17 + 2,996 221 = 669,428


x3,222 = 7,17 + 2,996 222 = 672,424
x3,223 = 7,17 + 2,996 223 = 675,421

lments danalyse des sries temporelles  273


10. La modlisation VAR

L
a modlisation conomtrique classique plusieurs quations
structurelles (cf. chapitre 8) a connu beaucoup de critiques
(Granger [1969] et Sims [1980]) et de dfaillances face un envi-
ronnement conomique trs perturb. Les prvisions labores laide
de ces modles se sont rvles trs mdiocres. Les critiques principales
formules lencontre de ces modles structurels concerne la simultani-
t des relations et la notion de variable exogne. La reprsentation1 VAR
(Vector AutoRegressive) gnralisation des modles autorgressifs (AR)
au cas multivari (cf. chapitre 9) apporte une rponse statistique len-
semble de ces critiques. Dans cette reprsentation, les variables slec-
tionnes2 en fonction du problme tudi ont toutes, a priori, le mme
statut et on sintresse alors des relations purement statistiques.
Nous prsentons tout dabord en section I. la spcification gnrale
dun modle VAR, puis nous abordons les mthodes destimation et de
prvision en section II. La dynamique dun modle VAR et lanalyse des
chocs sont traites dans la section III. ; enfin, la section IV est consacre
la recherche du sens de la causalit entre les variables.

1. Le terme de reprsentation convient mieux que le terme de modlisation, car lconomiste ne


spcifie pas des relations conomiques en tant que telles.
2. En gnral celles dun modle thorique.

La modlisation VAR  275


I. Reprsentation dun modle VAR
A. Exemple introductif
Soit une reprsentation VAR dans laquelle on considre deux variables y1t et y2t .
Chacune de ces variables est fonction de ses propres valeurs passes et de
celles de lautre.
Par exemple le modle VAR dun ordre p = 4 , scrit :

4 
4
y1t = a1 + b1i y1ti + c1i y2ti d1 y2t + 1t
i=1 i=1


4 
4
y2t = a2 + b2i y1ti + c2i y2ti d2 y1t + 2t
i=1 i=1

Les variables y1t et y2t sont considres comme tant stationnaires (cf. cha-
pitre 9), les perturbations 1t et 2t (les innovations ou les chocs) sont des bruits
blancs de variances constantes 12 et 22 et non autocorrles. Nous pouvons
immdiatement constater labondance de paramtres estimer (ici 20 coeffi-
cients) et les problmes de perte de degrs de libert qui en rsultent. la lec-
ture de ce modle, il apparat quil nest pas sous forme rduite : en effet, y1t a
un effet immdiat sur y2t et rciproquement y2t a un effet immdiat sur y1t . Ce
systme initial est appel forme structurelle de la reprsentation VAR. Sous
forme matricielle, ce modle devient :

4
BYt = A0 + Ai Yti + t [1]
i=1

avec :
         
1 d1 y1t a b c1i 1t
B= Yt = A0 = 1 Ai = 1i = .
d2 1 y2t a2 b2i c2i 2t
Pour obtenir un modle VAR sous forme standard, on multiplie de part de
dautre dans [1] par B 1 . Le modle sous forme standard scrit :

4 
4
y1t = a10 + a1i1 y1ti + a1i2 y2ti + 1t
i=1 i=1


4 
4
y2t = a20 + a2i1 y1ti + a2i2 y2ti + 2t
i=1 i=1

Dans cette spcification, les erreurs 1t et 2t sont fonction des innovations


1t et 2t ; en effet, puisque = B 1 , on obtient :
1t = (1t d1 2t )/(1 d1 d2 ) et 2t = (2t d2 1t )/(1 d1 d2 )

276  CONOMTRIE
On dmontre que :
E(1t ) = 0; E(2t ) = 0; E(1t 1ti ) = 0; E(2t 2ti ) = 0
Les erreurs ont une esprance nulle et sont non autocorrles.
E(1t2 ) = (12 + d12 22 )/(1 d1 d2 )2 ; E(2t2 ) = (22 + d22 12 )/(1 d1 d2 )2
La variance de lerreur est constante (indpendante du temps).
E(1t 2t ) = (d2 12 + d1 22 )/(1 d1 d2 )2
Si d1 = d2 = 0 , les variables y1t et y2t nont pas dinfluence synchrone lune
sur lautre, les erreurs 1t et 2t sont non corrles. Dans le cas contraire, les
erreurs 1t et 2t sont corrles et donc une variation de lune de ces erreurs un
instant donn a un impact sur lautre.

B. La reprsentation gnrale
La gnralisation de la reprsentation VAR k variables et p dcalages (note
VAR( p) ) scrit sous forme matricielle :
Yt = A0 + A1 Yt1 + A2 Yt2 + . . . + A p Yt p + t
y a0
1,t a1i1 a1i2 . . . a1ik 1 1t
y
2,t a2i1 a2i2 k
a2i 0
a2 2t
avec Yt =
.. ; Ai =/0 =
..
; A0 = . ; t = .
. ..
. . .
yk,t aki1 aki2 k
aki ak0
kt

On note : = E(t t ) , la matrice de dimension (k, k) des variances cova-
riances des erreurs. Cette matrice est bien sr inconnue.
Cette reprsentation peut scrire laide de loprateur retard :
(I A1 D A2 D 2 . . . A P D P )Yt = A0 + t ou encore A(D)Yt = A0 + t

Condition de stationnarit
Un modle VAR est stationnaire, sil satisfait les trois conditions classiques :
E(Yt ) = t ;
Var(Yt ) < ;
Cov(Yt ,Yt+k ) = E[(Yt )(Yt+k )] = k t .
On dmontre1 quun processus VAR( p) est stationnaire si le polynme d-
fini partir du dterminant : det(I A1 z A2 z 2 . . . A p z p ) = 0 a ses racines
lextrieur du cercle unit du plan complexe.

1. Cf. Hamilton J. D., page 259, 1994.

La modlisation VAR  277


Exercice n 1
Recherche des conditions de stationnarit dun modle VAR
Soit le processus :
        
y1t 3 0,2 0,7 y1t1 e1t
= + +
y2t 1 0,3 0,4 y2t1 e2t
On demande dtudier les conditions de stationnarit.

Solution

Le dterminant est gal :


    
1 0 0,2 0,7 2 z 1 = 1,30
det z = 1 0,6 z 0,13 z
0 1 0,3 0,4 z 2 = 5,91
Les deux racines sont en valeur absolue suprieures 1, le processus est donc sta-
tionnaire.

C. La reprsentation ARMAX
La reprsentation prcdente peut tre gnralise1, par analogie avec les pro-
cessus ARMA( p, q) , un modle dont les erreurs sont autocorrles dordre q.
Yt = A0 + A1 Yt1 + A2 Yt2 + . . . + A p Yt p + t + B1 t1 + B2 t2 + . . . + Bq tq

Il sagit dun processus ARMA multivari not : ARMAX ou parfois


VARMA.
Les conditions de stationnarit sont analogues celles dun processus
ARMA univari : un processus VAR est toujours inversible, il est stationnaire
lorsque les racines de son polynme sont lextrieur du cercle unit du plan
complexe.
Un processus VMA est toujours stationnaire. Il est inversible si les racines
de son polynme retard sont lextrieur du cercle unit du plan complexe.
Les conditions de stationnarit et dinversibilit dun ARMAX sont don-
nes par la partie VAR et la partie VMA de lARMAX.

1. Il sagit dune application au cas multivari du thorme de dcomposition de Wold (1954).

278  CONOMTRIE
II. Estimation des paramtres
Les paramtres du processus VAR ne peuvent tre estims que sur des sries
chronologiques stationnaires. Ainsi, aprs tude des caractristiques des sries,
soit les sries sont stationnarises par diffrence, pralablement lestimation
des paramtres dans le cas dune tendance stochastique, soit il est possible
dajouter une composante tendance la spcification VAR, dans le cas dune
tendance dterministe.

A. Mthode destimation
Dans le cas dun processus VAR, chacune des quations peut tre estime par
les MCO, indpendamment les unes des autres (ou par une mthode de maxi-
mum de vraisemblance).
Soit le modle VAR( p) estim :

0 + A
Yt = A 1 Yt1 + A
2 Yt2 + . . . + A
p Yt p + e

e tant le vecteur de dimension (k,1) des rsidus destimation e1t , e2t , . . . , ekt .

Et on note : e la matrice des variances covariances estimes des rsidus du
modle.
Les coefficients du processus VAR ne peuvent tre estims qu partir de
sries stationnaires. Ainsi, aprs tude des caractristiques des chroniques, soit
les sries sont stationnarises par diffrence, pralablement lestimation des
paramtres dans le cas dune tendance stochastique, soit il est possible dajouter
une composante tendance la spcification VAR, dans le cas dune tendance
dterministe.
De mme, nous pouvons ajouter la spcification VAR des variables binaires
afin de corriger un mouvement saisonnier ou une priode anormale.

B. Dtermination du nombre de retards


Pour dterminer le nombre de retards dun modle retards chelonns (cf. cha-
pitre 7), nous avons prsent les critres de Akaike et de Schwarz. Dans le cas
de la reprsentation VAR, ces critres peuvent tre utiliss pour dterminer
lordre p du modle. La procdure de slection de lordre de la reprsentation
consiste estimer tous les modles VAR pour un ordre allant de 0 h (h tant
le retard maximum admissible par la thorie conomique ou par les donnes

La modlisation VAR  279


disponibles). Les fonctions AIC( p) et SC( p) sont calcules de la manire
suivante :
   2k 2 p
AIC( p) = Ln det e  +
n
   k 2 p Ln(n)
SC( p) = Ln det e  +
n
avec : k = nombre de variables du systme ; n = nombre dobservations ;
p = nombre de retards ; e = matrice des variances covariances des rsidus du
modle.
Le retard p qui minimise les critres AIC ou SC est retenu.

C. Prvision
Les coefficients du modle tant estims, la prvision peut tre calcule en n
lhorizon dune priode, par exemple pour un VAR(1), de la manire suivante :
n (1) = A
Y 0 + A
1 Yn

lhorizon de 2 priodes, la prvision est :


n (2) = A
Y 0 + A
1 Y
n (1) = A
0 + A
1 A
0 + A
21 Yn

lhorizon de 3 priodes, la prvision scrit :


n (3) = A
Y 0 + A
1 Y
n (2) = (I + A
1 + A 0 + A
21 ) A 31 Yn

etc.
Lorsque h tend vers linfini, nous constatons que la prvision tend vers une
i1 0 si i .
valeur constante (tat stationnaire) puisque A
Lesprance de la matrice de lerreur de prvision est nulle, sa variance est
donne par :

e (h) = M0 e M0 + M1 e M1 + . . . + Mh1 e

Mh1 o Mi est calcul par la
formule de rcurrence suivante :

min( p,i)
Mi = j Mi j
A i = 1, 2,. . . et M0 = I
j=1
Ainsi, il vient :
1 ; M2 = A
M1 = A 1 M1 + A2 M0 = A21 + A2 ;
1 M2 + A
M3 = A 2 M1 + A3 M0 = A1 + A
3 1 A
2 + A
2 A
1 + A
3
etc.
La variance de lerreur de prvision pour chacune des prvisions des k
variables ( n2 (h)) se lit sur la premire diagonale de la matrice e (h) .
Lintervalle de prvision au seuil de (1 /2) est donn par :
n (h) t /2 
Y n (h) avec t /2 valeur de la loi normale.

280  CONOMTRIE
Exercice n 2
fichier C10EX2
Spcification, estimation et prvision dun modle VAR
Nous cherchons modliser, sous la forme VAR, la demande (y1t ) et les prix (y2t )
dune matire premire. Nous disposons des donnes trimestrielles CVS et en diffrences
premires sur 18 ans (tableau 1).
Tableau 1 Demande et prix CVS et en diffrences premires (extrait des donnes)

Date y1t y2t


0001Q1 146,4 75,6
0001Q2 19,2 1,8

0018Q3 19,2 16,2
0018Q4 50,4 3,6

On demande :
1) de rechercher lordre du modle VAR,
2) destimer les paramtres du modle,
3) de calculer une prvision pour lanne 19 avec son intervalle de confiance 95 %.

Solution
1) Rechercher lordre du modle VAR
Nous allons utiliser les critres de Akaike et de Schwarz pour des dcalages h allant
de 0 4. Nous devons donc estimer quatre modles diffrents et retenir celui dont les cri-
tres AIC et SC sont les plus faibles.
Estimation du modle pour h = 1
   0  1 2
   
y1t a a a11 y1t1 1t
= 10 + 11 1 2 +
y2t a2 a21 a21 y2t1 2t
Ou encore :
1
y1t = a10 + a11 2
y1t1 + a11 y2t1 + 1t
y2t = a20 + a21
1 2
y1t1 + a21 y2t1 + 2t
Pour estimer les paramtres de ce modle, nous pouvons utiliser les MCO quation
par quation.
y1t = 0,00676 y1t1 0,6125 y2t1 + 17,129
y2t = 0,1752 y1t1 + 0,2992 y2t1 12,862
Les deux rsidus destimation sont alors calculs : e1,t et e2,t ainsi la matrice des
variances covariances des rsidus est donne par :
 n n
e12 e1 e2

1 1
1
e = n  n
n
e1 e2 e22
1 1
   
1 106500,16 47878,12 1500,002 674,3398
= =
71 47878,12 85205,25 674,339 1200,074

La modlisation VAR  281


Attention, certains logiciels (par exemple Eviews partir de la version 4) estiment
cette matrice des variances covariances en divisant la somme des carrs ou du produit par
le degr de libert de chaque quation estime soit :
   
1 106500,16 47878,12 1566,18 704,09
e = =
71 2 1 47878,12 85205,25 704,09 1253,02
Dans toute la suite des calculs nous retenons la mthode 1, soit :

Var(e1t ) = 1 500,002 ; Var(e2t ) = 1 200,074 ; Cov(e1t ,e2t ) = 674,339


 
   1 500,002 674,339 
Soit det  
e =  674,339 1 200,074  = 1 345 379 .

Pour p = 1 :
   2k 2 p
AIC( p) = Ln det e + = Ln(1 345 379) + (2 22 1)/71 = 14,28
n
et
   k 2 p Ln(n)
SC( p) = Ln det e + = Ln(1 345 379) + (22 1 Ln(71))/71
n
= 14,47

Nous pouvons calculer de la mme manire :

AIC(2) = 14,31 ; AIC(3) = 14,39 ; AIC(4) = 14,45


SC(2) = 14,56 ; SC(3) = 14,78 ; SC(4) = 14,97

Le nombre de dcalages retenu correspond la valeur la plus faible des critres


soit : p = 1.

2) Estimation des paramtres


Le modle VAR(1) estim scrit :
y1t = 0,00676 y1t1 0,6125 y2t1 + 17,1292 + e1t
(0,06) (4,47) (2,87)
R 2 = 0,28 ; n = 71 ; () = t de Student
y2t = 0,1752 y1t1 + 0,2992 y2t1 12,862 + e2t
(1,84) (2,44) (2,41)
R 2 = 0,21 ; n = 71 ; () = t de Student

3) Prvision
La prvision est calcule en faisant tourner le modle :

y19:1 = 0,0067 y18:4 0,6125 y18:4 + 17,129
.


y19:1 = 0,1752 y18:4 + 0,2992 y18:4 12,862


y19:1 = 0,0067 50,4 0,6125 3,6 + 17,129 = 15,3

y19:1 = 0,1752 50,4 + 0,2992 3,6 12,862 = 20,6


y19:2 = 0,0067 15,3 0,6125 20,6 + 17,129 = 29,9

y19:2 = 0,1752 15,3 + 0,2992 20,6 12,862 = 21,7

282  CONOMTRIE

y19:3 = 0,0067 29,9 0,6125 21,7 + 17,129 = 30,6

y19:3 = 0,1752 29,9 + 0,2992 21,7 12,862 = 24,6


y19:4 = 0,0067 30,6 0,6125 24,6 + 17,129 = 32,4

y19:4 = 0,1752 30,6 + 0,2992 24,6 12,862 = 25,6

La variance de lerreur de prvision est donne par la formule :



e (h) = e M1 + . . . + Mh1 e Mh1
+M1 e

o Mi est calcul par la formule

min( p,i)
de rcurrence suivante : Mi = j Mi j i = 1,2,. . . et M0 = I . Les variances se
A
j=1

lisent sur la premire diagonale de la matrice e (h) .

Ainsi, il vient : M1 = A 1 ; M2 = A 1 M1 = A 21 ; M3 = A1 M2 = A31 ; etc., car le



modle est un VAR(1) et donc seul A1 est estim.
 
1 500,02 674,34
Soit lhorizon h = 1, nous avons e (1) = . La variance de
674,34 1 200,1
lerreur de prvision pour  y19:1 est gale 1 500,02 et la variance de lerreur de prvi-

sion pour y19:1 est gale 1 200,1. Lintervalle de confiance pour y19:1 est donn
par : 15,3 1,96 38,73 = [60,64 ; 91,17] et pour y19:1 est donn par :

20,6 1,96 34,64 = [88,52 ; 47,27] .

Soit lhorizon h = 2, nous avons :



1
+A 1 , soit :
A
e (2) = e e
    
1 500,02
674,34 0,00676 0,6126 1 500,02 674,34
e (2) = +
1 200,1
674,34 0,1753 0,2992 674,34 1 200,1
   
0,00676 0,1753 1 955,99 969,88
=
0,6126 0,2992 969,88 1 424,37
2
Pour h = 3 : (3) = +A1 A1 + A
21 A1
e e e e
    
1 500,02 674,34 0,00676 0,6126 1 500,02 674,34
e (3) = +
674,34 1 200,1 0,1753 0,2992 674,34 1 200,1
   2  
0,00676 0,1753 0,00676 0,6126 1 500,02 674,34
+
0,6126 0,2992 0,1753 0,2992 674,34 1 200,1
 2  
0,00676 0,1753 2 042,63 1 043,88
=
0,6126 0,2992 1 043,88 1 489,48
2 3
1
Pour h = 4 : e (4) = e + A  2  3 
e A1 + A1 e A1 + A1 e A1
    
1 500,02 674,34 0,00676 0,6126 1 500,02 674,34
e (4) = +
674,34 1 200,1 0,1753 0,2992 674,34 1 200,1
   2  
0,00676 0,1753 0,00676 0,6126 1 500,02 674,34
+
0,6126 0,2992 0,1753 0,2992 674,34 1 200,1

La modlisation VAR  283


 2  3  
0,00676 0,1753 0,00676 0,6126 1 500,02 674,34
+
0,6126 0,2992 0,1753 0,2992 674,34 1 200,1
 3  
0,00676 0,1753 2 067,67 1 064,00
=
0,6126 0,2992 1 064,00 1 505,73

IC y19:2 = 29,9 1,96 44,22 = [56,82 ; 116,54]


Ic y19:2 = 21,7 1,96 37,74 = [95,68 ; 52,26]
IC y19:3 = 30,6 1,96 45,19 = [57,95 ; 119,21]
Ic y19:3 = 24,6 1,96 38,59 = [100,23 ; 51,05]
IC y19:4 = 32,4 1,96 45,47 = [56,72 ; 121,52]
Ic y19:4 = 25,6 1,96 38,80 = [101,64 ; 50,46]

III. Dynamique dun modle VAR


Les modles VAR permettent danalyser les effets de la politique conomique,
cela au travers de simulations de chocs alatoires1 et de la dcomposition de la
variance de lerreur. Cependant, cette analyse seffectue en postulant la constan-
ce de lenvironnement conomique toutes choses tant gales par ailleurs .

A. Reprsentation VMA dun processus VAR


Nous avons vu quun modle AR(1) a une reprsentation MA() . Par analogie,
nous pouvons dmontrer quun VAR(1) a une reprsentation VMA() . Le
modle sous cette forme va permettre de mesurer limpact sur les valeurs pr-
sentes dune variation des innovations (ou des chocs) 1t et de 2t .
Soit la reprsentation VAR( p) stationnaire :
Yt = A0 + A1 Yt1 + A2 Yt2 + . . . + A p Yt p + t

Sa reprsentation VMA() est donne par :




Yt = + t + M1 t1 + M2 t2 + . . . = + Mi ti
i=0

avec : = (I A1 A2 . . . A p )1 A0

min( p,i )
et Mi = A j Mi j i = 1,2,. . . et M0 = I
j =1

1. Le terme dinnovation est aussi souvent employ.

284  CONOMTRIE
Sous cette forme, la matrice M apparat comme un multiplicateur dim-
pact , cest--dire que cest au travers de cette matrice quun choc se rpercute
tout le long du processus. Une variation un instant donn t de t affecte toutes
les valeurs suivantes de Yt , leffet dun choc (ou dune innovation) est donc per-
manent et va en samortissant.

B. Analyse et orthogonalisation des chocs


Lanalyse dun choc consiste mesurer limpact de la variation dune innovation
sur les variables. Prenons lexemple du modle estim de lexercice 2 :
y1t = 0,00676 y1t1 0,6125 y2t1 + 17,129 + e1t
y2t = 0,1752 y1t1 + 0,2992 y2t1 12,863 + e2t
Une variation un instant donn de e1t a une consquence immdiate sur y1t
puis sur y2t+1 et y2t+1 , par exemple sil se produit en t un choc sur e1t gal 1,
nous avons limpact suivant :
  

y1t 1
En t : =
y2t 0
      
y1t+1 0,00676 0,6126 1 0,0067
la priode t + 1 : = =
y2t+1 0,1753 0,2992 0 0,175
      
y1t+2 0,00676 0,6126 0,0067 0,107
la priode t + 2 : = =
y2t+2 0,1753 0,2992 0,175 0,054
etc.
Les diffrentes valeurs ainsi calcules constituent la fonction de rponse
impulsionnelle . Dans ce schma, nous faisons lhypothse que les rsidus e1t et
e2t sont indpendants entre eux. Or, cette hypothse est rarement vrifie ; en
effet, nous avons montr en section I., quil peut exister une corrlation entre les
erreurs 1t et de 2t , cette corrlation pouvant tre mesure laide des rsidus
Cov(e1 ,e2 )
destimation : e1 e2 = .
e1 e2
Cependant si ce coefficient nous renseigne bien sur la liaison contemporaine
entre les deux rsidus, il nindique pas le sens de la causalit. Cest pourquoi,
nous devons faire une hypothse supplmentaire concernant la relation entre les
erreurs : par exemple, dans lexercice 2, la rflexion conomique laisse prsager
quune variation du prix (y2t ) a un impact sur la demande (y1t ) . Un choc sur y1t
na donc pas dimpact contemporain sur y2t ; en revanche un choc sur y2t a un
impact contemporain (mesur par le coefficient de corrlation entre les rsidus)
sur y1t . Dans cet exemple, le coefficient de corrlation est gal
Cov(e1 ,e2 )
e1 e2 = = 0,503 ; en faisant lhypothse que e1 e2 , un choc
e1 e2
alatoire de 1 sur y2t se traduit par une baisse de 0,503 sur y1t . Le tableau 2
illustre cette dissymtrie des innovations sur les variables.

La modlisation VAR  285


Tableau 2 Analyse des chocs sur les variables y1t et y2t
avec 1t = 0,503 2t

t y1t y2t t y1t y2t

1 1,000 0,000 1 0,530 1,000


2 0,007 0,175 2 0,616 0,387
3 0,107 0,054 3 0,241 0,224
4 0,034 0,035 4 0,139 0,109
5 0,022 0,016 5 0,068 0,057
6 0,010 0,009 6 0,035 0,029
7 0,005 0,004 7 0,018 0,015
8 0,003 0,002 8 0,009 0,008
9 0,001 0,001 9 0,005 0,004
10 0,001 0,001 10 0,002 0,002
11 0,000 0,000 11 0,001 0,001
12 0,000 0,000 12 0,001 0,001

Le choix du sens de limpact est donc trs important et conditionne les


valeurs obtenues. Nous pouvons observer que leffet dune innovation sestom-
pe au cours du temps. Cela caractrise un processus VAR stationnaire.
Le graphique 1 prsente les deux fonctions de rponses impulsionnelles.
Le problme de la corrlation contemporaine des erreurs et donc de limpact
dun choc sur une variable est trait, dune manire gnrale, par la recherche
dune reprsentation erreurs orthogonales. Reprenons lexemple dun modle
VAR deux variables :
y1,t = a1 y1,t1 + b1 y2,t1 + 1,t
y2,t = a2 y1,t1 + b2 y2,t1 + 2,t

avec Var(1,t ) = 21 , Var(2,t ) = 22 et Cov(1,t ,2,t ) = k =


/ 0.
2
En calculant y2,t (k/1 )y1,t on obtient :
y2,t = k/21 y1,t + (a2 a1 k/21 )y1,t1 + (b2 b1 k/21 )y2,t1 + 2,t k/21 1,t

On pose : t = 2,t k/21 1,t


Cov(1,t ,t ) = E(1,t t ) = Cov(1,t 2,t ) k/21 E(1,t2
2
) = k k = 0.
Les erreurs (ou innovations) ne sont plus corrles. Lanalyse des chocs
peut donc seffectuer sur les deux quations suivantes dont les erreurs sont
orthogonales :
y1,t = a1 y1,t1 + b1 y2,t1 + 1,t
y2,t = k/21 y1,t + (a2 a1 k/21 )y1,t1 + (b2 b1 k/21 )y2,t1 + 2,t k/21 1,t

286  CONOMTRIE
Nous remarquons que, sous cette forme, nous avons fait apparatre dans la
deuxime quation la causalit instantane entre y2,t et y1,t telle quelle existait
dans le VAR structurel (cf. I. A.). Cependant, la causalit instantane entre y1,t et
y2,t napparat pas dans la premire quation. Dans cette procdure dorthogona-
lisation, les rsidus sont indpendants, nous pouvons faire apparatre soit une
causalit instantane entre y2,t et y1,t soit une causalit instantane entre y1,t et
y2,t mais pas les deux la fois : il sagit de lordre de dcomposition.
La gnralisation un modle VAR k variables ncessite le recours des
procdures dorthogonalisation1 de matrice et savre donc complexe. Il
convient de noter que les rsultats sont influencs par le choix de lquation ser-
vant de base la transformation. Les rsultats sont diffrents si la transformation
affecte y1t la place de y2t , cest pourquoi le choix2 de lordre des variables
modifie les rsultats obtenus.

Graphique 1 Fonctions de rponses impulsionnelles

1. Cf. Hamilton J. D. page 318, 1994.


2. Les logiciels dconomtrie offrent la possibilit de choisir lordre des variables et permettent
ainsi de simuler les diffrents cas de figure.

La modlisation VAR  287


C. Dcomposition de la variance
La dcomposition de la variance de lerreur de prvision a pour objectif de cal-
culer pour chacune des innovations sa contribution la variance de lerreur. Par
un technique mathmatique1, on peut crire la variance de lerreur de prvision
un horizon h en fonction de la variance de lerreur attribue chacune des
variables ; il suffit ensuite de rapporter chacune de ces variances la variance
totale pour obtenir son poids relatif en pourcentage.
Reprenons notre modle VAR(1) deux variables y1t et y2t , la variance de
lerreur de prvision pour y1t+h peut scrire :
 
y21 (h) = 21 m 211 (0) + m 211 (1) + . . . + m 211 (h 1)
 
+22 m 222 (0) + m 222 (1) + . . . + m 222 (h 1)

o les m ii sont les termes de la matrice M de la section III.A.


lhorizon h, la dcomposition de la variance, en pourcentage, des propres
innovations de y1t sur y1t , est donne par :
 
21 m 211 (0) + m 211 (1) + . . . + m 211 (h 1)
.
y21 (h)
Et la dcomposition de la variance, en pourcentage, des innovations de y1t sur
 
22 m 222 (0) + m 222 (1) + . . . + m 222 (h 1)
y2t , est donne par :
y21 (h)
Linterprtation des rsultats est importante :
si un choc sur 1t naffecte pas la variance de lerreur de y2t quel que soit
lhorizon de prvision, alors y2t peut tre considr comme exogne car y2t
volue indpendamment de 1t ;
a contrario, si un choc sur 1t affecte fortement voire totalement la
variance de lerreur de y2t , alors y2t est considr comme endogne.
Dans la pratique, les rsultats ne sont pas aussi marqus mais indiquent la
contribution de chacune des variables la variance de lerreur.

D. Choix de lordre de dcomposition


Il est noter que le problme de la corrlation contemporaine des erreurs, et
donc de limpact dun choc sur une variable, implique un choix de dcomposi-


1. La matrice tant toujours dfinie positive, la dcomposition de Cholesky permet de diago-
naliser la matrice des variances covariances de lerreur de prvision, et ainsi didentifier les
variances propres chacune des variables. Nous ne pouvons pas aborder dans le cadre de ce
manuel cette technique, le lecteur peut se rfrer Hamilton J. D. (1994) pour tous les compl-
ments mathmatiques.

288  CONOMTRIE
tion qui fournit des rsultats dissymtriques en fonction de lordre des variables.
Le problme est plus complexe si le nombre de variables est important.
Prenons lexemple dun VAR 4 variables Y1, Y2, Y3 et Y4.
Si nous choisissons lordre de dcomposition de Cholesky suivant : Y3 Y2
Y1 Y4, cela entrane :
un choc en priode 1 sur Y3 (la variable la plus exogne) a un impact sur
lensemble des quatre variables ;
un choc en priode 1 sur Y2 a un impact sur Y2, Y3 et Y4, absence de cor-
rlation contemporaine avec Y3 ;
un choc en priode 1 sur Y1 a un impact sur Y1 et Y4, absence de corrla-
tion contemporaine avec Y3 et Y2 ;
et, enfin, un choc en priode 1 sur Y4 (la moins exogne) na un impact que
sur elle-mme, absence de corrlation contemporaine avec Y3, Y2 et Y1.
Le tableau 3 illustre cet exemple de dcomposition et danalyse des chocs.
Nous ne prsentons que les deux premires priodes.

Tableau 3 Exemple de dcomposition Y3, Y2, Y1, Y4

Cholesky Ordering : Y3 Y2 Y1 Y4
Response of Y1 :
Period Y1 Y2 Y3 Y4
1 1.603662 1.022459 1.402923 0.000000
2 0.395786 0.151091 0.488095 0.275476
Response of Y2 :
Period Y1 Y2 Y3 Y4
1 0.000000 5.434671 4.125310 0.000000
2 0.875767 1.251545 0.115017 0.105811
Response of Y3 :
Period Y1 Y2 Y3 Y4
1 0.000000 0.000000 4.544690 0.000000
2 0.241257 0.954324 1.584595 0.476602
Response of Y4 :
Period Y1 Y2 Y3 Y4
1 0.768803 1.686351 2.315711 2.091513
2 0.129818 1.104756 0.927459 0.186928

Lordre de dcomposition seffectue donc de la variable suppose tre la plus


exogne vers la variable la moins exogne. Dans le doute, il convient deffec-
tuer plusieurs combinaisons diffrentes dordre de dcomposition et danalyser
la robustesse des rsultats.

La modlisation VAR  289


Exercice n 3
fichier C10EX2

Analyse dune fonction de rponse impulsionnelle et dcomposition


de la variance
partir de la reprsentation VAR(1) estime lexercice 2, on demande de calculer
et dinterprter les fonctions de rponses impulsionnelles et la dcomposition de la
variance des erreurs.

Solution

Les rsultats sont issus de Eviews 3 (RATS possde une procdure


IMPULSE.PRG permettant elle aussi de calculer tous ces lments).
Nous considrons quune innovation sur y1,t ninfluence pas de manire instantane
y2,t , en revanche une innovation sur y2,t a une influence contemporaine sur y1,t (un choc
sur la variable prix influence la demande mais pas rciproquement).
La matrice des variances covariances des rsidus est gale (cf. exercice 2)

1 500,002 674,3398
e = .
674,3398 1 200,074
Calcul des chocs initiaux
Lordre de dcomposition des variables est le suivant Y2 Y1. Lanalyse des chocs doit
donc seffectuer sur les deux quations suivantes dont les rsidus sont orthogonaliss
(cf. III. B.) :
y1,t dpend de v1,t = (e1,t k/22 e2,t )
y2,t dpend de v2,t = e2,t
Var(v1,t ) = Var(e1,t Cov(e1,t ,e2,t )/22 e2,t )

2Cov(e1t ,e2t ) [Cov(e1t ,e2t )]2


Var(v1,t ) = Var(e1t ) Cov(e1t ,e2t ) + Var(e2t )
Var(e2t ) [Var(e2t )]2
2[Cov(e1t ,e2t )]2 [Cov(e1t ,e2t )]2
Var(v1,t ) = Var(e1t ) +
Var(e2t ) [Var(e2t )]
Var(v1,t ) = Var(e1t ) Cov(e1t ,e2t )2 /Var(e2t )
Lamplitude du choc sur y1,t est gale une fois lcart type orthogonalis de v1,t soit
 
Var(e1t ) Cov(e1t ,e2t )2 /Var(e2t ) = 1 500,002 674,33982 /1 200,074 = 33,48 .
Ce choc na pas deffet instantan sur y2,t .
Lamplitude du choc sur y2,t est gale une fois lcart type orthogonalis :
Or, Var(v2,t ) = Var(e2,t ) = 1 200,074 , le choc sur y2,t est donc gal 34,62.
Ce choc se rpercute instantanment sur y1,t , il est donc gal, aprs orthogonalisa-
tion, 34,62 Cov(e1 ,e2 )/Var(e2,t ) soit 34,62 674,3398/1 200,074 = 19,4659.
Une fois les chocs initiaux calculs, nous calculons les fonctions de rponse impul-
sionnelle comme prcdemment, les chocs se rpercutent ensuite sur les deux processus
en samortissant, signe de la stationnarit du processus VAR.

290  CONOMTRIE
Fonctions de rponse impulsionnelle un cart type orthogonalis (Eviews 3)
Rponse de Y1 : Rponse de Y2 :
Priode un choc sur Y1 un choc sur Y2 Priode un choc sur Y1 un choc sur Y2
1 33,48254 19,46591 1 0,000000 34,64208
2 0,226363 21,35271 2 5,868694 13,77894
3 3,596584 8,585080 3 1,795947 7,866119
4 1,124479 4,876681 4 1,167853 3,858783
5 0,723007 2,396789 5 0,546587 2,009549
6 0,339717 1,247217 6 0,290298 1,021480
7 0,180128 0,634172 7 0,146419 0,524297
8 0,090912 0,325462 8 0,075390 0,268057
9 0,046797 0,166407 9 0,038496 0,137265
10 0,023898 0,085211 10 0,019723 0,070245
Ordre : Y2 Y1 (Y2 est la cause de Y1)

Le graphique 2 prsente ces fonctions de rponse impulsionnelles.


Response of Y1 to One S.D. Innnovations Response of Y2 to One S.D. Innnovations
40 40
30
30
20

10 20

0 10
10
0
20

30 10
1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
Y1 Y2 Y1 Y2

Graphique 2 Fonctions de rponses impulsionnelles


Dcomposition de la variance (Eviews 3)
Dcomposition de la variance de Y1 : Dcomposition de la variance de Y2 :
Priode SE Y1 Y2 Priode SE Y1 Y2
1 38,72986 74,73859 25,26141 1 34,64208 0,000000 100,0000
2 44,22659 57,31782 42,68218 2 37,74089 2,418013 97,58199
3 45,19547 55,51993 44,48007 3 38,59373 2,528876 97,47112
4 45,47172 54,90856 45,09144 4 38,80374 2,592156 97,40784
5 45,54058 54,76783 45,23217 5 38,85958 2,604496 97,39550
6 45,55892 54,72930 45,27070 6 38,87409 2,608129 97,39187
7 45,56369 54,71940 45,28060 7 38,87790 2,609036 97,39096
8 45,56494 54,71679 45,28321 8 38,87889 2,609278 97,39072
9 45,56527 54,71611 45,28389 9 38,87916 2,609341 97,39066
10 45,56536 54,71593 45,28407 10 38,87922 2,609358 97,39064
Ordre : Y2 Y1 (Y2 est la cause de Y1)

La modlisation VAR  291


La dcomposition de la variance indique que la variance de lerreur de prvision de
y1,t est due 55 % ses propres innovations et 45 % celles de y2,t . La variance de
lerreur de prvision de y2,t est due 2,6 % y1,t et 97,4 % y2,t . Cette dissymtrie
deffet va tre tudie par lanalyse de la causalit.
Enfin, nous remarquons que ce tableau nous indique les carts types de lerreur de pr-
vision pour y1,t et y2,t que nous avions calculs de manire fastidieuse lors de lexercice 2.

IV. La causalit
Au niveau thorique, la mise en vidence de relations causales entre les
variables conomiques fournit des lments de rflexion propices une meilleu-
re comprhension des phnomnes conomiques. De manire pratique, the
causal knowledge est ncessaire une formulation correcte de la politique
conomique. En effet, connatre le sens de la causalit est aussi important que
de mettre en vidence une liaison entre des variable conomiques.

A. Causalit au sens de Granger


Granger (1969) a propos les concepts de causalit et dexognit : la variable
y2t est la cause de y1t , si la prdictibilit1 de y1t est amliore lorsque linforma-
tion relative y2t est incorpore dans lanalyse. Soit le modle VAR( p) pour
lequel les variables y1t et y2t sont stationnaires :
     1    1  
y1t a0 a b11 y1t1 a b21 y1t2
= + 12 + 22 + ...
y2t b0 a1 b12 y2t1 a2 b22 y2t2
 1    
a b1p y1t p
+ p2 + 1t
a p b2p y2t p 2t
Le bloc de variables (y2t1 ,y2t2 ,. . . ,y2t p ) est considr comme exogne par
rapport au bloc de variables (y1t1 ,y1t2 ,. . . ,y1t p ) si le fait de rajouter le bloc y2t
namliore pas significativement la dtermination des variables y1t . Ceci consis-
te effectuer un test de restrictions sur les coefficients des variables y2t de la
reprsentation VAR (not RVAR = Restricted VAR). La dtermination du retard
p est effectue par les critres AIC ou SC (cf. II.B). Soit :
y2t ne cause pas y1t si lhypothse suivante est accepte H0 :
b11 = b21 = . . . = b1p = 0 .
y1t ne cause pas y2t si lhypothse suivante est accepte H0 :
a12 = a22 = . . . = a p2 = 0 .
Si nous somme amens accepter les deux hypothses que y1t cause y2t et
que y2t cause y1t , on parle de boucle rtroactive feedback effect .

1. Le terme de prdictibilit semble prfrable au terme de causalit ; en effet, dire que yt cause
xt , signifie seulement quil est prfrable de prdire xt en connaissant yt que sans le connatre.

292  CONOMTRIE
Ces tests peuvent tre conduits laide dun test de Fisher classique (cf. cha-
pitre 3, test de Wald) de nullit des coefficients, quation par quation ou bien
directement par comparaison entre un modle VAR non contraint (UVAR) et le
modle VAR contraint (RVAR). On calcule le ratio de vraisemblance suivant :
 
L = (n c) Ln| RVAR | Ln| UVAR | qui suit un 2 2 p degrs de
libert avec :

RVAR = matrice des variances covariances des rsidus du modle contraint,

UVAR = matrice des variances covariances des rsidus du modle non contraint,

n = nombre dobservations,
c = nombre de paramtres estims dans chaque quation du modle non
contraint.
Si L > 2 lu dans la table, alors on rejette lhypothse de validit de la
contrainte.

B. Causalit au sens de Sims


Sims (1980) prsente une spcification de test lgrement diffrente, en consi-
drant que si les valeurs futures de y1t permettent dexpliquer les valeurs pr-
sentes de y2t , alors y2t est la cause de y1t .
Ceci se traduit par la reprsentation suivante :

p 
p 
p
y1t = a10 + a1i1 y1ti + a1i2 y2ti + bi2 y2t+i + 1t
i=1 i=1 i=1

p 
p 
p
y2t = a20 + a2i1 y1ti + a2i2 y2ti + bi1 y1t+i + 2t
i=1 i=1 i=1

y1t ne cause pas y2t si lhypothse suivante est accepte H0 :


b12 = b22 = . . . = b2p = 0 .
y2t ne cause pas y1t si lhypothse suivante est accepte H0 :
b11 = b21 = . . . = b1p = 0 .
Il sagit l encore dun test de Fisher classique de nullit de coefficients.

Exercice n 4
fichier C10EX2

Tests de causalit de Granger et de Sims


On demande, partir de la reprsentation VAR(1) estime lors de lexercice 2, de
procder aux tests de Granger et de Sims.

La modlisation VAR  293


Solution

Nous procdons au test de Fisher quation par quation.


Test de Granger
H0 : y2t ne cause pas y1t
Nous estimons les modles suivants :
y1t = 0,006760 y1t1 0,6125 y2t1 + 17,129632 + e1t
R 2 = 0,28 ; n = 71 ; SC RU = 106500,2 (non contraint)
y1t = 0,2359 y1t1 + 26,9448 + e1t
R 2 = 0,067 ; n = 71 ; SC R R = 13792,6 (contraint)
(SC R R SC RU )/c 137924,6 106500,2)/1
F = = = 20,064
SC RU/(n k 1) 106500,2/(71 2 1)
c = nombre de restrictions (nombre de coefficients dont on teste la nullit).
0.05
F > F1;68 4 , on rejette lhypothse H0, y2t explique significativement la variable
y1t , il y a donc causalit au sens de Granger de y2t vers y1t .
Ou bien :


L = (n c)(Ln| RV AR | Ln| U V AR |) = (71 1)(14,44 14,11) = 23,29
> 2 (2) = 5,99 , on rejette lhypothse de validit de la contrainte.
H0 : y1t ne cause pas y2t
y2t = 0,17527 y1t1 + 0,29926096 y2t1 12,862837 + e2t
R 2 = 0,21 ; n = 71 ; SC RU = 85205,25 (non contraint)
y2t = 0,4075 y2t1 15,391 + e2t
R 2 = 0,168 ; n = 71 ; SC R R = 89452,77 (contraint)
(SC R R SC RU )/c (89452,77 85205,25)/1
F = = = 3,389
SC RU/(n k 1) 85205,22/(71 2 1)
0.05
F < F1;68 4 , on accepte lhypothse H0, y1t nexplique pas significativement la
variable y2t , il ny a donc pas causalit au sens de Granger de y1t vers y2t .
Ou bien :

L = (n c)(Ln| RV AR | Ln| U V AR |) = (71 1)(14,17 14,11) = 4,52
< 2 (2) = 5,99 , on accepte lhypothse de validit de la contrainte.
Ce rsultat ne doit pas nous surprendre puisque y1t est la variable reprsentative de la
demande et y2t du prix.
Test de Sims
H0 : y1t ne cause pas y2t
Nous estimons les modles suivants (sur la mme priode de 78:2 95:3) :
y1t = 0,01435 y1t1 0,579 y2t1 0,357 y2t+1 + 8,713 + e1t
R 2 = 0,37 ; n = 70 ; SC RU = 92676,66 (non contraint)
y1t = 0,007654 y1t1 0,6145 y2t1 + 16,714 + e1t
R 2 = 0,28 ; n = 70 ; SC R R = 105952,6 (contraint)

294  CONOMTRIE
(105952,6 92676,66)/1
F = = 9,45
92676,66/(70 3 1)
0.05
F > F1;66 4 , on rejette lhypothse H0, y2t+1 explique significativement la
variable y1t , il y a donc causalit au sens de Sims de y1t vers y2t .
H0 : y2t ne cause pas y1t
y2t = 0,0967 y1t1 + 0,2259 y2t1 0,390 y1t+1 3,328 + e2t
R 2 = 0,40 ; n = 70 ; SC RU = 63742,31 (non contraint)
y2t = 0,174 y1t1 + 0,297 y2t1 13,30 + e2t
R 2 = 0,21 ; n = 71 ; SC R R = 84586,73 (contraint)
(84586,73 63742,31)/1
F = = 21,58
84586,73/(70 3 1)
0.05
F > F1;66 4 , on refuse lhypothse H0, y1t+1 explique significativement la
variable y2t , il y a donc causalit au sens de Sims de y2t vers y1t .
Nous observons une divergence dans ces tests, en ce qui concerne la causalit de y1t
sur y2t ; le test de Granger nous fait rejeter lhypothse de causalit et celui de Sims lais-
se prsager dun lien de causalit de type feedback : les prix de la priode suivante
influencent la demande de la priode actuelle, sagit-il dune anticipation des agents ?

La modlisation VAR  295


11. La cointgration
et le modle
correction derreur

L
analyse de la cointgration, prsente par Granger (1983) et Engle
et Granger (1987), est considre par beaucoup dconomistes
comme un des concepts nouveaux les plus importants dans le
domaine de lconomtrie et de lanalyse de sries temporelles. Dans ce
chapitre, nous abordons en section I. des exemples permettant une intro-
duction au problme de la cointgration. La section II. est consacre la
prsentation de la cointgration en termes de dfinition et de spcifica-
tion. Les tests de cointgration ainsi que les mthodologies destimation
sont ensuite dvelopps dans le cas deux variables (section III.) et enfin
(section IV) dans les cas k variables.

I. Exemples introductifs
Premier exemple
Soit les variables yt et xt dfinies de la manire suivante :
y1 = 1 avec comme variable explicative : x1 = 1
y2 = 2 avec comme variable explicative : x2 = 22

yn = n avec comme variable explicative : xn = n 2
La tendance de yt est de type linaire et celle de xt est quadratique.
Le rsultat de la rgression de yt sur xt (n = 30) conduit lestimation suivante :
yt = 5,92 + 0,03xt
(8,5) (19,8)
2
R = 0,94 DW = 0,057

La cointgration et le modle correction derreur  297


Les coefficients de rgression sont significatifs, la valeur du R 2 est leve,
cependant il apparat vident que ce modle a un pouvoir prdictif trs mauvais.
En effet, sur le plan statistique, la statistique de Durbin et Watson (proche de 0)
prsage dune autocorrlation forte des erreurs1.
Ce premier exemple illustre le danger dinterprter et dutiliser une rgres-
sion entre deux variables affectes de tendances dterministes de degr diffrent.
Le graphique 1 prsente la srie brute (tendance linaire) et la srie ajuste par
une tendance quadratique.

Graphique 1 Rgression dune tendance linaire


sur une tendance quadratique

Deuxime exemple
On gnre deux processus alatoires :
 
yt = yt1 + 1t avec t N 0; 21
 
xt = xt1 + 2t avec t N 0; 22
Sur 1 000 rgressions, nous obtenons les rsultats suivants : 670 sont signi-
ficatives daprs la statistique du t de Student, cependant la statistique de DW
est toujours faible (la moyenne sur les 1 000 rgressions est : DW = 0,33 ).
Donc apparemment, ces rgressions donnent de bons rsultats (hormis la statis-
tique DW ). Mais ces rsultats sont purement fortuits : ils dcoulent de la corr-
lation entre les sries qui sont affectes dune tendance stochastique. En effet, si
on passe en diffrences premires (yt = f (xt ) ), plus aucune rgression nest
significative.
yt = yt yt1 = 1t
xt = xt xt1 = 2t

1. Cela souligne limportance ne pas oublier dinterprter la statistique de Durbin et Watson.

298  CONOMTRIE
En rgressant une srie non stationnaire (de type DS) sur une autre srie du
mme type, on obtient des coefficients significatifs mais avec une statistique
DW proche de 0 . Ce deuxime exemple illustre le risque de rgresser entre elles
deux sries affectes dune tendance stochastique. Il faut donc toujours, au pra-
lable, stationnariser des sries non stationnaires ; dans le cas contraire, il existe
un risque de rgression fallacieuse ( spurious regression ).

II. Le concept de cointgration


Lanalyse de la cointgration permet didentifier clairement la relation vritable
entre deux variables en recherchant lexistence dun vecteur de cointgration et
en liminant son effet, le cas chant.

A. Proprits de lordre dintgration dune srie


Une srie est intgre dordre d (note xt I (d) ), sil convient de la diffren-
cier d fois afin de la stationnariser1.
Soit une srie x1t stationnaire et une srie x2t intgre dordre 1 :
x1t I (0)
x1t + x2t I (1)
x2t I (1)
La srie yt = x1t + x2t est non stationnaire puisque lon somme une srie
affecte dune tendance et une srie stationnaire.
Soit deux sries x1t et x2t intgres dordre d :
x1t I (d)
x1t + x2t I (?)
x2t I (d)

La combinaison linaire x1t + x2t I (?) .


En effet, le rsultat dpend des signes des coefficients , et de lexistence
dune dynamique non stationnaire commune.
Examinons un autre cas de figure :
x1t I (d)
x1t + x2t I (?)
x2t I (d ) d = d

Il savre impossible de conclure car on somme deux sries dordre dint-


gration diffrent.

1. Cf. le test de Dickey-Fuller du chapitre 9 afin de dterminer lexistence dune tendance sto-
chastique ou dterministe et de rechercher les ordres dintgration dune srie.

La cointgration et le modle correction derreur  299


Soit deux sries affectes dune tendance :
dans un premier cas, les deux sries ont une tendance dvolution constan-
te sur une premire priode et puis une tendance dvolution divergente en
une deuxime priode, les sries ne sont pas cointgres (cf. graphique 2) ;
dans un deuxime cas, les deux sries ont une volution constante sur toute
la priode, les sries sont cointgres (cf. graphique 3), il existe une vo-
lution de long terme constante entre les chroniques.

Graphique 2 Les variables xt et z t ne sont pas cointgres

Graphique 3 Les variables xt et yt sont cointgres

300  CONOMTRIE
B. Conditions de cointgration
Deux sries xt et yt sont dites cointgres si les deux conditions sont vrifies :
elles sont affectes dune tendance stochastique de mme ordre dintgra-
tion d ,
une combinaison linaire de ces sries permet de se ramener une srie
dordre dintgration infrieur.
Soit :
xt I (d)
yt I (d)
tel que 1 xt + 2 yt I (d b),
avec d  b > 0.
On note : xt , yt C I (d, b)
o [1 2 ] est le vecteur de cointgration.
Dans le cas gnral k variables, on a :
x1, t I (d)
x2, t I (d)
on note X t = [x1, t x2, t . . . xk, t ]
...
xk, t I (d)
sil existe un vecteur de cointgration = [1 2 . . . k ] de dimension (k, 1) tel
que X t I (d b) , alors les k variables sont cointgres et le vecteur de coin-
tgration est . On note que X t C I (d, b) avec b > 0 .

C. Le modle correction derreur (ECM)


Examinons le cas particulier suivant : xt , yt C I (1, 1) et [, 1] (on normali-
1
se en posant = soit xt yt I (0) ) est le vecteur de cointgration.
2
Dans ce type de spcification, le fait que les sries soient cointgres et non sta-
tionnaires soulve un problme destimation. La bonne qualit statistique du
modle ( R 2 lev et coefficients significatifs) est due au fait que les sries sont
non stationnaires (puisque cointgres). En rgression directe de yt sur xt
lorsque yt , xt C I (1, 1) lutilisation de ce modle des fins prvisionnelles
savre dsastreuse ; en effet, la relation mise en vidence par cette rgression
nest pas relle, elle dcoule simplement dune relation entre deux tendances1.
Le problme est donc, dune part de retirer la relation commune de coint-
gration (la tendance commune), dautre part, de rechercher la liaison relle entre

1. Cf. les exemples introductifs sur les problmes de rgressions fallacieuses.

La cointgration et le modle correction derreur  301


les variables : cest lobjectif du Modle Correction dErreur (ECM1). Cette
reprsentation est la fois un modle statique (1  xt ) et un modle dynamique
(2 (yt1 xt1 )) .

Nous pouvons spcifier la relation : yt = 1  xt + 2 (yt1 xt1 )


I(0) I(0) I(0)
Autour de la relation de long terme, le modle correction derreur permet
dintgrer les fluctuations de court terme. Le coefficient 2 qui doit tre nga-
tif rend compte dune force de rappel vers lquilibre de long terme.
Le graphique 4 illustre la relation de long terme entre xt et yt (yt xt = 0),
cette ligne reprsente lquilibre de long terme du systme ; la zone dvolution
du systme en dehors de lquilibre (dynamique de court terme) est dfinie par
lerreur constate entre yt1 et xt1 .

Graphique 4 Reprsentation du modle correction derreur

III. Cointgration entre deux variables


Le traitement de sries chronologiques longues impose de tester une ventuelle
cointgration entre les variables. En effet, le risque destimer des relations
fallacieuses et dinterprter les rsultats de manire errone est trs lev.
Nous allons tout dabord examiner le cas deux variables : test de cointgration
et estimation du modle correction derreur.

1. Nous utilisons labrviation anglo-saxonne Error Correction Model .

302  CONOMTRIE
A. Test de cointgration entre deux variables
Nous reprenons ici lalgorithme en deux tapes de Engle et Granger.

tape 1 : tester lordre dintgration des variables


Une condition ncessaire de cointgration est que les sries doivent tre int-
gres de mme ordre. Si les sries ne sont pas intgres de mme ordre, elles ne
peuvent pas tre cointgres.
Il convient donc (cf. tests de Dickey-Fuller et Dickey-Fuller Augment) de
dterminer trs soigneusement le type de tendance dterministe ou stochastique
de chacune des variables, puis lordre dintgration d des chroniques tudies.
Si les sries statistiques tudies ne sont pas intgres de mme ordre, la proc-
dure est arrte, il ny a pas de risque de cointgration.
Soit :
xt I (d) et yt I (d)

tape 2 : estimation de la relation de long terme


Si la condition ncessaire est vrifie, on estime par les MCO la relation de
long terme entre les variables : yt = a1 xt + a0 + t .
Pour que la relation de cointgration soit accepte, le rsidu et issu de cette
rgression doit tre stationnaire : et = yt  a1 x t 
a0 .
La stationnarit du rsidu est teste laide des tests DF ou DFA (cf. chapitre 9).
Dans ce cas, nous ne pouvons plus utiliser les tables de Dickey et Fuller. En
effet, le test porte sur les rsidus estims partir de la relation statique et non
pas sur les vrais rsidus de la relation de cointgration. MacKinnon (1991)
a donc simul des tables qui dpendent du nombre dobservations et du nombre
de variables explicatives figurant dans la relation statistique.
Si le rsidu est stationnaire nous pouvons alors estimer le modle correc-
tion derreur.

B. Estimation du modle correction derreur


Lorsque des sries sont non stationnaires et cointgres, il convient destimer
leurs relations au travers dun modle correction derreur (ECM, Error
Correction Model ). Engle et Granger (1987) ont dmontr que toutes les
sries cointgres peuvent tre reprsentes par un ECM (thorme de la repr-
sentation de Granger).
Nous allons prsenter la mthode la plus rpandue destimation dun ECM.
Nous nous bornons, ici, au cas dune seule variable explicative. La gnralisa-
tion k variables est aborde la section suivante.

La cointgration et le modle correction derreur  303


Soit les sries yt et xt I (1) , lestimation par les MCO de la relation de long
terme indique une stationnarit du rsidu. Les sries yt et xt sont donc notes :
CI(1, 1).
Nous pouvons, ds lors, estimer le modle correction derreur.

Estimation du modle correction derreur (ECM) en deux tapes


tape 1 : estimation par les MCO de la relation de long terme :

yt =   xt + et
+ (ECM) [1]

tape 2 : estimation par les MCO de la relation du modle dynamique


(court terme) :
yt = 1 xt + 2 et1 + u t 2 < 0 [2]

Le coefficient 2 (force de rappel vers lquilibre) doit tre significativement


ngatif ; dans le cas contraire, il convient de rejeter une spcification de type
ECM. En effet, le mcanisme de correction derreur (rattrapage qui permet de
tendre vers la relation de long terme) irait alors en sens contraire et sloignerait
de la cible de long terme. La procdure en deux tapes conduit une estimation
convergente des coefficients du modle et les carts types des coefficients peu-
vent sinterprter de manire classique1.
Lestimation dun modle correction derreur ne pose donc pas de probl-
me particulier et ncessite simplement le recours une technique de moindres
carres ordinaires.
En cas de variables explicatives supplmentaires dont lhypothse de coint-
gration ne peut pas tre retenue (comme des variables indicatrices par exemple),
la procdure destimation est la mme sauf pour lestimation du modle [1]
(quation de long terme) dans lequel figurent ces variables explicatives.

Exercice n 1fichier C11EX1


Test de cointgration et estimation dun modle correction
derreur
Soit deux sries statistiques yt et xt dont les observations sont prsentes au
tableau 1. On demande destimer la relation entre ces deux variables
(yt = 
a0 + 
a1 xt + et ) en testant une ventuelle cointgration (dans ce cas estimer le
modle correction derreur).

1. Engle et Granger, 1987.

304  CONOMTRIE
Tableau 1 Valeurs observes de xt et yt (extrait des donnes)

Obs xt yt
1 0,000 10,890
2 2,851 12,188

29 6,744 12,347
30 7,270 15,194

Solution

La premire tape consiste tudier les proprits des deux sries en termes de sta-
tionnarit. Le tableau 2 prsente les rsultats des tests :
de Dickey-Fuller (aucun retard nest significatif dans lventualit dun test de
Dickey-Fuller Augment),
de Phillips-Perron (troncature = 2),
et de KPSS (troncature = 2).
Ces tests sont prsents au chapitre 9.

Tableau 2 Rsultats des tests de Dickey-Fuller, Phillips-Perron et KPSS

Test Type de Modle xt en niveau t statistique yt en niveau t statistique


Test DF [1] 0,81 0,17
Test DF [2] 0,05 2,67
Test DF [3] 0,82 3,05
Test PP [1] 0,88 0,62
Test PP [2] 0,11 2,60
Test PP [3] 0,80 2,96
xt en niveau yt en niveau
LM statistique LM statistique
Test KPSS [2] 0,53 0,39
Test KPSS [3] 0,22 0,20

La comparaison des t1 calculs aux t lus (Tables de MacKinnon) ou des LM statis-


tiques aux valeurs critiques indique que les deux sries xt et yt sont non stationnaires en
niveau1. Des tests similaires sur les diffrentes premires de xt et yt indiquent quelles
sont stationnaires, les deux sries tudies sont I (1), il existe donc un risque de coint-
gration.
Le test de cointgration est effectu partir du rsidu destimation du modle :
yt = a1 xt + a0 + t

Soit : yt = 0,55xt + 10,38 + et


(6,3) (41,46)
n = 30 ; R 2 = 0,58 ; (.) = t de Student.

1. Nous rejetons lhypothse dune tendance dterministe.

La cointgration et le modle correction derreur  305


Nous pouvons vrifier que le rsidu est bien stationnaire, il existe donc un risque de
cointgration entre les deux variables.

Test DF Test PP (l = 2)
et Modle [1] Modle [2] Modle [1] Modle [2]
t1 5,39 5,30 5,42 5,31

Nous procdons donc maintenant lestimation du modle correction derreur.


Nous calculons, dabord, le rsidu (provenant du modle prcdent) dcal dune
priode, soit : et1 = yt1 0,55xt1 10,38
Puis nous estimons (par les MCO) le modle :
yt = 1 xt + 2 et1 + u t

yt = 0,610 xt 1,02 et1 + 


ut
(3,09) (5,22)
n = 29 ; R 2 = 0,60 ; (.) = t de Student.

Le coefficient (terme de rappel) de et1 est bien significativement ngatif, la repr-


sentation correction derreur est valide.

IV. Gnralisation k variables


La littrature conomique rcente concernant la thorie de lquilibre dmontre
quune srie macro-conomique stationnaire peut tre le rsultat dune combi-
naison de variables non stationnaires, do limportance actuelle de lanalyse de
la cointgration k variables. La gnralisation de deux k variables savre
assez complexe du fait du nombre de possibilits de vecteurs de cointgration
possibles.

A. La cointgration entre k variables


Dans un modle conomtrique k variables explicatives :
yt = 0 + 1 x1t + 2 x2t + . . . + k xkt + t

si les variables ( yt et xkt ) sont non stationnaires, I (1) par exemple, il existe alors
un risque de cointgration. En effet, lexistence dune ventuelle cointgration
implique que les variables doivent tre non stationnaires1. Comme dans le cas

1. Gnralement, en conomie, les variables sont I (1) ; cependant certaines sries financires
peuvent tre de type I (2) .

306  CONOMTRIE
deux variables, si une combinaison linaire de ces variables est stationnaire,
elles sont alors cointgres. Lestimation par les MCO du modle permet de cal-
culer le rsidu :
0
et = yt 1 x1t . . .
k xkt
Si ce rsidu est stationnaire, nous acceptons lhypothse dune cointgration
entre les variables. Les tests de Dickey-Fuller de stationnarit sur le rsidu doi-
vent seffectuer partir des valeurs critiques tabules par MacKinnon (1991) en
fonction du nombre de variables total du modle. Le vecteur de cointgration est
donn par : [1, 0 , 1 , . . . , k ] .
Cependant, le cas multivari est plus complexe que le cas deux variables du
fait des possibilits combinatoires de cointgration. En effet si, par exemple, les
variables yt , x1t , x2t et x3t sont cointgres par paires yt , x1t C I (1, 1) et x2t ,
x3 C I (1,1) , leur combinaison linaire est I (0).
Nous avons : et1 = yt  1 x1t et et2 = x2t 
0  0 
1 x3t et par consquent :

et = et1 + et2 = yt 
0 
1 x1t + x2t 
0 
1 x3t I (0)

Nous obtenons, dans ce cas de figure, un autre vecteur de cointgration pos-


0 
sible : [1,  0 , 
1 , 1, 
1 ]. Dune manire gnrale, dans un modle une
variable expliquer et k variables explicatives (soit k + 1 variables au total), il
peut exister k vecteurs de cointgration linairement indpendants. Le nombre
de vecteurs de cointgration linairement indpendants est appel le rang de la
cointgration.
Si les variables sont de mme ordre dintgration I (1) par exemple
lexistence dun seul vecteur de cointgration est possible ; en revanche, si les
sries ne sont pas toutes intgres du mme ordre, nous pouvons tre certains
que le vecteur de cointgration nest pas unique.
De manire pratique, pour tester une ventuelle cointgration entre plusieurs
variables, il convient tout dabord de la tester sur lensemble des k + 1 variables,
puis en cas de cointgration de la tester par combinatoire entre les variables.

B. Estimation du modle correction derreur


La cointgration ayant t rvle par les tests prcdents, deux cas de figure
sont envisager :
il existe un vecteur unique de cointgration,
plusieurs vecteurs de cointgration existent.
Si le vecteur de cointgration est unique, nous pouvons employer les
mthodes destimation envisages la section prcdente, par exemple, celle en
deux tapes de Engle et Granger.

La cointgration et le modle correction derreur  307


tape 1 : estimation par les MCO de la relation de long terme et calcul du
rsidu :
0
et = yt 1 x1t . . .
k xkt

tape 2 : estimation par les MCO de la relation du modle dynamique


(court terme) :
yt = 1  x1t + 2  x2t + . . . + k  xkt + 1 et1 + u t

Le coefficient 1 (force de rappel vers lquilibre) doit tre, comme dans le


cas une variable explicative, significativement ngatif.
Cependant, le plus souvent, le vecteur de cointgration nest pas unique et la
mthode de Engle-Granger nest plus valide. En effet, les estimateurs des MCO
ne sont plus consistants quels que soient les vecteurs de cointgration. Nous
devons, dans ce cas, faire appel la reprsentation vectorielle correction der-
reur (VECM, Vector Error Correction Model ).

C. Le modle correction derreur vectoriel


Examinons au pralable le cas dun processus VAR(2) k variables sous forme
matricielle :
Yt = A0 + A1 Yt1 + A2 Yt2 +
avec :
Yt : vecteur de dimension (k 1 ) constitu des k variables ( y1t ,y2t . . . ,ykt ) ,
A0 : vecteur de dimension (k 1 ),
Ai : matrice de dimension (k k ).
Ce modle peut scrire en diffrence premire :
Yt Yt1 = A0 + A1 Yt1 Yt1 + A2 Yt2 +
Yt = A0 + (A1 I )Yt1 + A2 Yt2 + [3]

Afin de faire apparatre des diffrences premires droite de lquation, nous


ajoutons et soustrayons A1 Yt2 Yt2 de la manire suivante
Yt = A0 + (A1 I )Yt1 + A1 Yt2 Yt2 A1 Yt2 + Yt2 + A2 Yt2 +
Yt = A0 + A1 Yt1 Yt1 + A1 Yt2 Yt2 A1 Yt2 + Yt2 + A2 Yt2 + [4]

Or Yt1 = Yt1 Yt2 .


En regroupant les termes en Yt1 et aprs simplification, on obtient :
Yt = A0 + (A1 I )Yt1 + (A1 + A2 I )Yt2 + [5]

308  CONOMTRIE
Cependant, afin de faire figurer les relations de cointgration qui relient
entre elles les variables en niveau dcales dune priode nous cherchons
crire lquation [4] en fonction de Yt1 , soit dans lquation [3] nous pouvons
ajouter et soustraire A2 Yt1 et aprs simplification nous obtenons :
Yt = A0 A2 Yt1 + (A1 + A2 I )Yt1 + [6]
Ou encore :
Yt = A0 + B1 Yt1 + Yt1 + [7]
avec : A2 = B1 et = (A1 + A2 I ).
Ce rsultat peut tre gnralis une reprsentation VAR(p) k variables
sous forme matricielle :
Yt = A0 + A1 Yt1 + A2 Yt2 + . . . + A p Yt p +
avec :
Yt : vecteur de dimension (k 1 ) constitu des k variables (y1t ,y2t . . . ,ykt ) ,
A0 : vecteur de dimension (k 1 ),
Ai : matrice de dimension (k k ).
Ce modle peut scrire en diffrences premires de deux manires :
Yt = A0