Bourbonnais 2015

9782100721511-Bourbo-lim.
qxd 22/10/14 10:34 Page I
conomtrie
Cours et exercices corrigs

Rgis Bourbonnais
9e dition
9782100721511-Bourbo-lim.qxd 14/11/14 9:11 Page II
Dunod, 2015
5 rue Laromiguire, 75005 Paris
www.dunod.com
ISBN 978-2-10-072151-1
9782100721511-Bourbo-tdm.qxd 22/10/14 10:35 Page III
Table des matires

Avant-propos IX
1. Quest-ce que lconomtrie ? 1

I. La notion de modle 1
A. Dfinition 1
B. La construction des modles en conomtrie 2
II. Le rle de lconomtrie 5
A. Lconomtrie comme validation de la thorie 5
B. Lconomtrie comme outil dinvestigation 5
III. La thorie de la corrlation 6
A. Prsentation gnrale 6
B. Mesure et limite du coefficient de corrlation 8
2. Le modle de rgression simple 13

I. Prsentation du modle 13
A. Exemple introductif 13
B. Rle du terme alatoire 14
C. Consquences du terme alatoire 16
II. Estimation des paramtres 17
A. Modle et hypothses 17
B. Formulation des estimateurs 18
C. Les diffrentes critures du modle : erreur et rsidu 21
D. Proprits des estimateurs 22
III. Consquences des hypothses : construction des tests 24
A. Hypothse de normalit des erreurs 24
B. Consquences de lhypothse de normalit des erreurs 25
C. Test bilatral, test unilatral et probabilit critique dun test 27
IV. quation et tableau danalyse de la variance 33
A. quation danalyse de la variance 33
B. Tableau danalyse de la variance 34
V. La prvision dans le modle de rgression simple 39
Table des matires III

9782100721511-Bourbo-tdm.qxd 22/10/14 10:35 Page IV
3. Le modle de rgression multiple 47

I. Le modle linaire gnral 47
A. Prsentation 47
B. Forme matricielle 48
II. Estimation et proprits des estimateurs 49
A. Estimation des coefficients de rgression 49
B. Hypothses et proprits des estimateurs 51
C. quation danalyse de la variance et qualit dun ajustement 54
III. Les tests statistiques 59
A. Le rle des hypothses 59
B. Construction des tests 60
C. Tests sur les rsidus : valeur anormale, effet de levier
et point dinfluence 62
IV. Lanalyse de la variance 67
A. Construction du tableau danalyse de la variance
et test de signification globale dune rgression 67
B. Autres tests partir du tableau danalyse de la variance 68
C. Gnralisation des tests par analyse de la variance 73
V. Lutilisation de variables indicatrices 75
A. Constitution et finalits des variables indicatrices 75
B. Exemples dutilisation 76
VI. La prvision laide du modle linaire gnral
et la rgression rcursive 81
A. Prdiction conditionnelle 81
B. Fiabilit de la prvision et intervalle de prvision 82
C. Les tests de stabilit par la rgression rcursive 84
D. Le test de spcification de Ramsey 86
VII. Exercices rcapitulatifs 90
Annexe 102
A) Interprtation gomtrique de la mthode des moindres carrs 102
B) Rsolution de lexercice 1 par des logiciels informatiques
de rgression multiple 103
C) Estimation de la variance de lerreur 105
4. Multicolinarit et slection du modle optimal 107

I. Corrlation partielle 107
B. Gnralisation de la notion de corrlation partielle 108
II. Relation entre coefficients de corrlation simple,
partielle et multiple 112
IV CONOMTRIE
9782100721511-Bourbo-tdm.qxd 22/10/14 10:35 Page V
III. Multicolinarit : consquences et dtection 114

A. Consquences de la multicolinarit 114
B. Tests de dtection dune multicolinarit 115
C. Comment remdier la multicolinarit ? 118
IV. Slection du modle optimal 119
5. Problmes particuliers : la violation des hypothses 125

I. Lautocorrlation des erreurs 125
A. Prsentation du problme 125
B. Lestimateur des Moindres Carrs Gnraliss (MCG) 126
C. Les causes et la dtection de lautocorrlation des erreurs 127
D. Les procdures destimation en cas dautocorrlation des erreurs 134
II. Lhtroscdasticit 142
A. Prsentation du problme 142
B. Correction de lhtroscdasticit 144
C. Tests de dtection de lhtroscdasticit 147
D. Autre test dhtroscdasticit : le test ARCH 153
III. Modles erreurs sur les variables 154
A. Consquences lorsque les variables sont entaches derreurs 154
B. La mthode des variables instrumentales 155
C. Le test dexognit dHausman 156
D. La mthode des moments gnralise 157
6. Les modles non linaires 165

I. Les diffrents types de modles non linaires 165
A. Les fonctions de type exponentiel 165
B. Les modles de diffusion 168
II. Mthodes destimation des modles non linaires 170
A. Initiation aux mthodes destimation non linaires 170
B. Exemples dapplication 172
7. Les modles dcalages temporels 177

I. Les modles linaires autorgressifs 177
A. Formulation gnrale 177
B. Test dautocorrlation et mthodes destimation 178
II. Les modles retards chelonns 183
A. Formulation gnrale 183
B. Dtermination du nombre de retards 184
Table des matires V

9782100721511-Bourbo-tdm.qxd 22/10/14 10:35 Page VI
C. Distribution finie des retards 188

D. Distribution infinie des retards 192
III. Deux exemples de modles dynamiques 198
A. Le modle dajustement partiel 198
B. Le modle danticipations adaptatives 199
8. Introduction aux modles quations simultanes 217

I. quations structurelles et quations rduites 218
B. Le modle gnral 220
C. Cas particulier : les modles rcursifs 221
II. Le problme de lidentification 221
A. Restrictions sur les coefficients 221
B. Conditions didentification 222
III. Les mthodes destimation 223
A. Les moindres carrs indirects 223
B. Les doubles moindres carrs 223
C. Autres mthodes destimation 224
Annexe 236
Identification : les conditions de rang 236
9. lments danalyse des sries temporelles 239

I. Stationnarit 239
A. Dfinition et proprits 239
B. Fonctions dautocorrlation simple et partielle 240
C. Tests de bruit blanc et de stationnarit 241
II. La non-stationnarit et les tests de racine unitaire 245
A. La non-stationnarit : les processus TS et DS 245
B. Les tests de racine unitaire et la stratgie squentielle de test 248
III. Les modles ARIMA 256
A. Typologie des modles AR, MA et ARMA 256
B. Lextension aux processus ARIMA et SARIMA 259
IV. La mthode de Box et Jenkins 260
A. Recherche de la reprsentation adquate : lidentification 260
B. Estimation des paramtres 261
C. Tests dadquation du modle et prvision 262
10. La modlisation VAR 275

I. Reprsentation dun modle VAR 276
VI CONOMTRIE
9782100721511-Bourbo-tdm.qxd 22/10/14 10:35 Page VII
B. La reprsentation gnrale 277

C. La reprsentation ARMAX 278
II. Estimation des paramtres 279
A. Mthode destimation 279
B. Dtermination du nombre de retards 279
C. Prvision 280
III. Dynamique dun modle VAR 284
A. Reprsentation VMA dun processus VAR 284
B. Analyse et orthogonalisation des chocs 285
C. Dcomposition de la variance 288
D. Choix de lordre de dcomposition 288
IV. La causalit 292
A. Causalit au sens de Granger 292
B. Causalit au sens de Sims 293
11. La cointgration et le modle correction derreur 297

I. Exemples introductifs 297
II. Le concept de cointgration 299
A. Proprits de lordre dintgration dune srie 299
B. Conditions de cointgration 301
C. Le modle correction derreur (ECM) 301
III. Cointgration entre deux variables 302
A. Test de cointgration entre deux variables 303
B. Estimation du modle correction derreur 303
IV. Gnralisation k variables 306
A. La cointgration entre k variables 306
B. Estimation du modle correction derreur 307
C. Le modle correction derreur vectoriel 308
D. Tests de relation de cointgration 310
E. Test dexognit faible 313
F. Synthse de la procdure destimation 314
12. Introduction lconomtrie des variables qualitatives 319

I. Les problmes et les consquences de la spcification binaire 320
II. Les modles de choix binaires 322
A. Le modle linaire sur variable latente 322
B. Les modles Probit et Logit 323
C. Interprtation des rsultats et tests statistiques 325
III. Les modles choix multiples 330
A. Les modles Probit et Logit ordonns 331
Table des matires VII

9782100721511-Bourbo-tdm.qxd 22/10/14 10:35 Page VIII
B. Le modle de choix multiples non ordonn :

le Logit multinomial 335
IV. Les modles variable dpendante limite : le modle Tobit 337
A. Le modle Tobit simple : modle de rgression tronqu
ou censur 338
B. Estimation et interprtation des rsultats 340
13. Introduction lconomtrie des donnes de panel 345

I. Prsentation des modles donnes de panel 346
A. Spcificits des donnes de panel 346
B. La mthode SUR 347
C. Le modle linaire simple 348
II. Les tests dhomognit 349
A. Procdure squentielle de tests 349
B. Construction des tests 350
III. Spcifications et estimations des modles effets individuels 355
A. Le modle effets fixes individuels 355
B. Le modle effets alatoires 357
C. Effets fixes ou effets alatoires ? Le test dHausman 358
Liste des exercices 363
Tables statistiques 367
Bibliographie 375
Index 379
VIII CONOMTRIE
9782100721511-Bourbo-avtpro.qxd 20/10/14 15:06 Page IX
Avant-propos
Cette neuvime dition est enrichie de nouveaux exercices et des dveloppe-
ments les plus rcents de lconomtrie. Ce livre couvre tous les champs de
lconomtrie : rgression simple et multiple, violation des hypothses (ht-
roscdasticit, autocorrlation des erreurs, variables explicatives alatoires),
modle dcalage, analyse des sries temporelles, tests de racine unitaire, qua-
tions multiples, VAR, cointgration, VECM, conomtrie des variables qualita-
tives et des donnes de panel
Sur lensemble de ces thmes, ce livre vous propose un cours, des exercices cor-
rigs, et une prsentation des logiciels dconomtrie les plus rpandus.
Souhaitons quil corresponde votre attente.
En effet, nous avons voulu, par une alternance systmatique de cours et
dexercices, rpondre un besoin pdagogique qui est de mettre rapidement en
pratique les connaissances thoriques et ainsi, dutiliser de manire opration-
nelle les acquis du cours ; les exercices sont reprs grce un bandeau gris.
De surcrot, le recours des logiciels1, lors de la rsolution des exercices, per-
met une dcouverte de ces outils et donne une dimension pratique que recher-
chent ltudiant et le praticien.
Afin que le lecteur puisse lui-mme refaire les exercices, les donnes utili-
ses (sous format Excel, ASCII, RATS et Eviews) ainsi que les programmes de
traitement Batch de Eviews ou de RATS sont disponibles gratuitement par
tlchargement sur le serveur web :
http://regisbourbonnais.dauphine.fr
Pour chaque exercice faisant appel un fichier de donnes, le nom du fichier
est cit en tte de lexercice et repr par licne suivante :
Nous avons voulu faire de ce manuel un livre dapprentissage facilement
accessible ; cest pourquoi les dmonstrations les plus complexes font lobjet de
renvois une bibliographie plus spcialise. Cependant, il convient de prciser
que lconomtrie fait appel des notions dalgbre linaire et dinduction sta-
tistique quil est souhaitable de connatre.
1. Trois logiciels sont utiliss : EXCEL ( Microsoft), RATS ( Var Econometrics version 3 et
Estima version 4), Eviews ( Quantitative Micro Software). Nous recommandons aussi parti-
culirement le logiciel GRETL (http://gretl.sourceforge.net) qui est un logiciel dconomtrie
gratuit, complet et trs facile dapprentissage.
Avant-propos IX
9782100721511-Bourbo-avtpro.qxd 20/10/14 15:06 Page X
Dans le terme conomtrie figure la racine du mot conomie car son

utilisation est surtout destine des fins de traitement de donnes conomiques ;
cependant, dautres domaines tels que la finance, la recherche agronomique, la
mdecine, etc., font maintenant le plus souvent appel ces techniques.
Ce livre sadresse en premier lieu aux tudiants (sciences conomiques, ges-
tion, coles de commerce et dingnieurs, etc.) dont la formation requiert une
connaissance de lconomtrie. Gageons quil sera un support de cours indis-
pensable et un alli prcieux pour prparer les sances de travaux dirigs.
Noublions pas cependant le praticien de lconomtrie (conomiste dentre-
prise, chercheur, etc.) qui, confront des problmes destimation statistique,
trouvera dans ce livre les rponses pratiques aux diffrentes questions quil peut
se poser.
Enfin, jexprime toute ma gratitude toutes les personnes collgues et tu-
diants qui ont eu la gentillesse de me faire des commentaires et dont les
conseils et suggestions contribuent la qualit pdagogique de ce livre. Je reste,
bien entendu, le seul responsable des erreurs qui subsisteraient1.
1. Les lecteurs souhaitant faire des commentaires ou des remarques peuvent me contacter : Rgis
Bourbonnais, universit de Paris-Dauphine, place du Marchal de Lattre de Tassigny, 75775
Paris Cedex 16, E-mail : regis.bourbonnais@dauphine.fr
X CONOMTRIE
9782100721511-Bourbo-C01.qxd 20/10/14 15:07 Page 1
1. Quest-ce que
lconomtrie ?
C
e premier chapitre est consacr la prsentation de lconomtrie
et sa liaison avec la thorie conomique. Nous abordons tout
dabord la notion de modle ainsi que les diffrentes tapes de la
modlisation. Lapport de lconomtrie en tant quoutil de validation
est tudi en II. Enfin, la thorie de la corrlation fondement de lco-
nomtrie fait lobjet de la section III.
I. La notion de modle
A. Dfinition
Il est dlicat de fournir une dfinition unique de la notion de modle1. Dans le
cadre de lconomtrie, nous pouvons considrer quun modle consiste en une
prsentation formalise dun phnomne sous forme dquations dont les
variables sont des grandeurs conomiques. Lobjectif du modle est de repr-
senter les traits les plus marquants dune ralit quil cherche styliser. Le
modle est donc loutil que le modlisateur utilise lorsquil cherche com-
prendre et expliquer des phnomnes. Pour ce faire, il met des hypothses et
explicite des relations.
1. La notion de modle est relative au point de vue auquel nous nous plaons : la physique,
lpistmologie...
Quest-ce que lconomtrie ? 1

9782100721511-Bourbo-C01.qxd 20/10/14 15:07 Page 2
Pourquoi des modles ?
Nombreux sont ceux sociologues, conomistes ou physiciens qui

fondent leurs analyses ou leurs jugements sur des raisonnements
construits et labors. Ces constructions refrent implicitement des
modles ; alors pourquoi ne pas expliciter clairement les hypothses et
les relations au sein dun modle ?
Le modle est donc une prsentation schmatique et partielle dune ralit
naturellement plus complexe. Toute la difficult de la modlisation consiste ne
retenir que la ou les reprsentations intressantes pour le problme que le mod-
lisateur cherche expliciter. Ce choix dpend de la nature du problme, du type
de dcision ou de ltude effectuer. La mme ralit peut ainsi tre formalise
de diverses manires en fonction des objectifs.
B. La construction des modles en conomtrie

Dans les sciences sociales, et particulirement en conomie, les phnomnes
tudis concernent le plus souvent des comportements afin de mieux com-
prendre la nature et le fonctionnement des systmes conomiques. Lobjectif du
modlisateur est, dans le cadre de lconomtrie et au travers dune mesure sta-
tistique, de permettre aux agents conomiques (mnages, entreprises, tat...)
dintervenir de manire plus efficace. La construction dun modle comporte un
certain nombre dtapes qui sont toutes importantes. En effet, en cas de faibles-
se dun des maillons , le modle peut se trouver invalid pour cause dhypo-
thses manquantes, de donnes non reprsentatives ou observes avec des
erreurs, etc. Examinons les diffrentes tapes suivre lors de la construction
dun modle, ceci partir de lexemple du modle keynsien simplifi.
1) Rfrence une thorie
Une thorie sexprime au travers dhypothses auxquelles le modle fait rf-

rence. Dans la thorie keynsienne, quatre propositions sont fondamentales :
1. la consommation et le revenu sont lis ;
2. le niveau dinvestissement priv et le taux dintrt sont galement lis ;
3. il existe un investissement autonome public ;
4. enfin, le produit national est gal la consommation plus linvestissement
priv et public.
2 CONOMTRIE
9782100721511-Bourbo-C01.qxd 20/10/14 15:07 Page 3
2) Formalisation des relations et choix de la forme des fonctions
partir des propositions prcdentes, nous pouvons construire des relations :

1. la consommation est fonction du revenu : C = f (Y ) avec f > 0 ;
2. linvestissement priv dpend du taux dintrt : I = g(r) avec g < 0 ;
3. il existe un investissement autonome public : I ;
4. enfin, le produit national (ou le revenu national) est gal la consomma-
tion plus linvestissement : Y C + I + I .
ce stade, nous navons postul aucune forme particulire en ce qui concer-
ne les fonctions f et g . Ainsi, bien que des considrations dordre thorique nous
renseignent sur le signe des drives, il existe une multitude de fonctions de
formes trs diffrentes et ayant des signes de drives identiques, par exemple
C = a0 + a1 Y et C = a0 Y a1 . Cependant ces deux relations ne refltent pas le
mme comportement ; une augmentation du revenu provoque un accroissement
proportionnel pour la premire relation, alors que, dans la seconde, leffet ses-
tompe avec laugmentation du revenu (si 0 < a1 < 1 ). Nous appelons forme
fonctionnelle ce choix (arbitraire ou fond) de spcification prcise du mod-
le. Dans notre exemple, le modle explicit scrit :
C = a0 + a1 Y avec a0 > 0 et 0 < a1 < 1

a1 = propension marginale consommer
et a0 = consommation incompressible ;
I = b0 + b1 r avec b0 > 0 et b1 < 0 ;
Y C+I+I
Les deux premires quations refltent des relations de comportements alors

que la troisime est une identit (aucun paramtre nest estimer).
3) Slection et mesure des variables

Le modle tant spcifi, il convient de collecter les variables reprsentatives
des phnomnes conomiques. Ce choix nest pas neutre et peut conduire des
rsultats diffrents, les questions quil convient de se poser sont par exemple :
Faut-il raisonner en euros constants ou en euros courants ?
Les donnes sont-elles brutes ou CVS 1 ?
Quel taux dintrt faut-il retenir (taux au jour le jour, taux directeur de la
Banque Centrale Europenne,...) ? etc.
1. Corriges des Variations Saisonnires.

9782100721511-Bourbo-C01.qxd 20/10/14 15:07 Page 4
Nous distinguons plusieurs types de donnes selon que le modle est spci-
fi en :
srie temporelle : cest le cas le plus frquent en conomtrie, il sagit de
variables observes intervalles de temps rguliers (la consommation
annuelle, totale France, exprime en euros courants sur 20 ans) ;
coupe instantane : les donnes sont observes au mme instant et concer-
nent les valeurs prises par la variable pour un groupe dindividus1 spci-
fiques (consommation observe des agriculteurs pour une anne donne) ;
panel : la variable reprsente les valeurs prises par un chantillon dindivi-
dus intervalles rguliers (la consommation dun chantillon de mnages
de la rgion parisienne sur 20 ans) ;
cohorte : trs proches des donnes de panel, les donnes de cohorte se dis-
tinguent de la prcdente par la constance de lchantillon, les individus
sonds sont les mmes dune priode sur lautre.
4) Dcalages temporels
Dans le cadre de modle spcifi en sries temporelles, les relations entre les
variables ne sont pas toujours synchrones mais peuvent tre dcales dans le
temps. Nous pouvons concevoir que la consommation de lanne t est explique
par le revenu de lanne t 1 et non celui de lanne t . Pour lever cette ambi-
gut, il est dusage dcrire le modle en le spcifiant laide dun indice
de temps : Ct = a0 + a1 Yt1 . La variable Yt1 est appele variable endogne
retarde .
On appelle variable exogne une variable dont les valeurs sont pr-
dtermines, et variable endogne une variable dont les valeurs
dpendent des variables exognes.
5) Validation du modle
La dernire tape est celle de la validation2 du modle :
Les relations spcifies sont-elles valides ?
Peut-on estimer avec suffisamment de prcision les coefficients ?
Le modle est-il vrifi sur la totalit de la priode ?
Les coefficients sont-ils stables ? Etc.
toutes ces questions, les techniques conomtriques sefforcent dapporter
des rponses.
1. Le terme dindividu est employ au sens statistique, cest--dire comme un lment dune popu-
lation : une personne, une parcelle de terre...
2. Validation, cest--dire en conformit avec les donnes disponibles.
4 CONOMTRIE
9782100721511-Bourbo-C01.qxd 20/10/14 15:07 Page 5
II. Le rle de lconomtrie

A. Lconomtrie comme validation de la thorie
Lconomtrie est un outil la disposition de lconomiste qui lui permet din-
firmer ou de confirmer les thories quil construit. Le thoricien postule des
relations ; lapplication de mthodes conomtriques fournit des estimations sur
la valeur des coefficients ainsi que la prcision attendue.
Une question se pose alors : pourquoi estimer ces relations, et les tester
statistiquement ? Plusieurs raisons incitent cette dmarche : tout dabord cela
force lindividu tablir clairement et estimer les interrelations sous-jacentes.
Ensuite, la confiance aveugle dans lintuition peut mener lignorance de
liaisons importantes ou leur mauvaise utilisation. De plus, des relations mar-
ginales mais nanmoins explicatives, qui ne sont quun lment dun modle
global, doivent tre testes et valides afin de les mettre leur vritable place.
Enfin, il est ncessaire de fournir, en mme temps que lestimation des relations,
une mesure de la confiance que lconomiste peut avoir en celles-ci, cest--dire
la prcision que lon peut en attendre. L encore, lutilisation de mthodes pure-
ment qualitatives exclut toute mesure quantitative de la fiabilit dune relation.
B. Lconomtrie comme outil dinvestigation

Lconomtrie nest pas seulement un systme de validation, mais galement un
outil danalyse. Nous pouvons citer quelques domaines o lconomtrie appor-
te une aide la modlisation, la rflexion thorique ou laction conomique
par :
la mise en vidence de relations entre des variables conomiques qui
ntaient pas a priori videntes ou pressenties ;
linduction statistique ou linfrence statistique consiste infrer, partir
des caractristiques dun chantillon, les caractristiques dune population.
Elle permet de dterminer des intervalles de confiance pour des paramtres
du modle ou de tester si un paramtre est significativement1 infrieur,
suprieur ou simplement diffrent dune valeur fixe ;
1. Au sens statistique, cest--dire avec un seuil (risque derreur ne pas dpasser, souvent 5 %).

9782100721511-Bourbo-C01.qxd 20/10/14 15:07 Page 6
la simulation qui mesure limpact de la modification de la valeur dune

variable sur une autre (Ct = a1 Yt ) ;
la prvision1, par lutilisation de modles conomtriques, qui est utilise
par les pouvoirs publics ou lentreprise afin danticiper et ventuellement
de ragir lenvironnement conomique.
Dans cet ouvrage, nous nous efforcerons de montrer, laide dexemples, les
diffrentes facettes de lutilisation des techniques conomtriques dans des
contextes et pour des objectifs diffrents.
III. La thorie de la corrlation

A. Prsentation gnrale
Lorsque deux phnomnes ont une volution commune, nous disons quils sont
corrls . La corrlation simple mesure le degr de liaison existant entre ces
deux phnomnes reprsents par des variables. Si nous cherchons une relation
entre trois variables ou plus, nous ferons appel alors la notion de corrlation
multiple.
Nous pouvons distinguer la corrlation linaire, lorsque tous les points du
couple de valeurs (x,y) des deux variables semblent aligns sur une droite, de
la corrlation non linaire lorsque le couple de valeurs se trouve sur une mme
courbe dallure quelconque.
Deux variables peuvent tre :
en corrlation positive ; on constate alors une augmentation (ou diminu-
tion, ou constance) simultane des valeurs des deux variables ;
en corrlation ngative, lorsque les valeurs de lune augmentent, les valeurs
de lautre diminuent ;
non corrles, il ny a aucune relation entre les variations des valeurs de
lune des variables et les valeurs de lautre.
Le tableau 1, en croisant les critres de linarit et de corrlation, renvoie
une reprsentation graphique.
1. Pour dcouvrir lutilisation de lconomtrie des fins de prvision de ventes, voir Bourbonnais
R. et Usunier J. C. (2013).
6 CONOMTRIE
9782100721511-Bourbo-C01.qxd 20/10/14 15:07 Page 7
Tableau 1 Linarit et corrlation
Corrlation Corrlation Absence de

positive ngative corrlation
Relation linaire Graphe 1 Graphe 2 Graphe 5
Relation non linaire Graphe 3 Graphe 4 Graphe 5
y
y
x x
Graphe 1 Graphe 2
y
y
x x
Graphe 3 Graphe 4
y
x
Graphe 5

9782100721511-Bourbo-C01.qxd 20/10/14 15:07 Page 8
B. Mesure et limite du coefficient de corrlation

1) Le coefficient de corrlation linaire
La reprsentation graphique ne donne quune impression de la corrlation
entre deux variables sans donner une ide prcise de lintensit de la liaison,
cest pourquoi nous calculons une statistique appele coefficient de corrlation
linaire simple, not r x,y . Il est gal :

n
(xi x)(yi y)
Cov (x,y)
r x,y = =
i=1
[1]
x y n n
(xi x )2
(yi y )2
i=1 i=1
avec :
Cov (x,y) = covariance entre x et y ;
x et y = cart type de x et cart type de y ;
n = nombre dobservations.
En dveloppant la formule [1], il vient :

n
n
n
n xi yi xi yi
r x,y =
i=1 i=1 i=1
[2]

n
n 2
n
n 2
n x
2
i xi n yi2 yi
i=1 i=1 i=1 i=1
On peut dmontrer que, par construction ce coefficient reste compris entre

1 et 1 :
proche de 1, les variables sont corrles positivement ;
proche de 1 , les variables sont corrles ngativement ;
proche de 0, les variables ne sont pas corrles.
Dans la pratique, ce coefficient est rarement trs proche de lune de ces trois
bornes et il est donc difficile de proposer une interprtation fiable la simple
lecture de ce coefficient. Ceci est surtout vrai en conomie o les variables sont
toutes plus au moins lies entre elles. De plus, il nest calcul qu partir dun
chantillon dobservations et non pas sur lensemble des valeurs. On appelle x,y
8 CONOMTRIE
9782100721511-Bourbo-C01.qxd 20/10/14 15:07 Page 9
ce coefficient empirique qui est une estimation du coefficient vrai r x,y . La tho-
rie des tests statistiques nous permet de lever cette indtermination.
Soit tester lhypothse H0 : r x,y = 0 , contre lhypothse H1 : r x,y = 0 .
x,y
Sous lhypothse H0, nous pouvons dmontrer que suit une loi
1 x,y
2
n2
de Student n 2 degrs de libert1. Nous calculons alors une statistique, appe-
l le t de Student empirique :
|x,y |
t = [3]
1 x,y 2
n2
/2
Si t > tn2 valeur lue dans une table de Student2 au seuil = 0,05 (5 %)
n 2 degrs de libert3, nous rejetons lhypothse H0, le coefficient de corrla-
tion est donc significativement diffrent de 0 ; dans le cas contraire, lhypoth-
se dun coefficient de corrlation nul est accepte. La loi de Student tant sym-
trique, nous calculons la valeur absolue du t empirique et nous procdons au test
par comparaison avec la valeur lue directement dans la table.
1. La notion de degrs de libert est explicite au chapitre 2.

2. Les lois de probabilit sont en fin douvrage.
3. Si le nombre dobservations n est suprieur 30, on peut approximer la loi de Student par une
loi normale, soit t /2 1,96 .

9782100721511-Bourbo-C01.qxd 20/10/14 15:07 Page 10
Exercice n 1
fichier C1EX1
Calcul dun coefficient de corrlation
Un agronome sintresse la liaison pouvant exister entre le rendement de mas x
(en quintal) dune parcelle de terre et la quantit dengrais y (en kilo). Il relve 10 cou-
ples de donnes consigns dans le tableau 2
Tableau 2 Rendement de mas et quantit dengrais
Rendement x 16 18 23 24 28 29 26 31 32 34
Engrais y 20 24 28 22 32 28 32 36 41 41
1) Tracer le nuage de points et le commenter.

2) Calculer le coefficient de corrlation simple et tester sa signification par rapport 0
pour un seuil = 0,05 .
Solution
1) Le nuage de points (graphique 6) indique que les couples de valeurs sont approxima-
tivement aligns : les deux variables semblent corrles positivement.
Quantit dengrais
Rendement
Graphique 6 Nuage du couple de valeurs :

rendement-quantit dengrais
10 CONOMTRIE
9782100721511-Bourbo-C01.qxd 20/10/14 15:07 Page 11
2) Afin dappliquer la formule [2], nous dressons le tableau de calcul 3.
Tableau 3 Calcul dun coefficient de corrlation
. x y x2 y2 xy
16 20 256 400 320

18 24 324 576 432
23 28 529 784 644
24 22 576 484 528
28 32 784 1 024 896
29 28 841 784 812
26 32 676 1 024 832
31 36 961 1 296 1 116
32 41 1 024 1 681 1 312
34 41 1 156 1 681 1 394
Somme 261 304 7 127 9 734 8 286
(10)(8 286) (261)(304) 3 516

x,y = =
(10)(7 127) 261 (10)(9 734) 304
2 2 (56,11)(70,17)
soit x,y = 0,89 et x,y

2
= 0,79
Le t de Student empirique (daprs [3]) est gal :
|x,y | 0,89
t = = = 5,49 > t80,025 = 2,306
(1 x,y
2
) 0,1 620
n2
le coefficient de corrlation entre x et y est significativement diffrent de 0.
2) Limites de la notion de corrlation
a) La relation teste est linaire

Lapplication de la formule [1] ou [2] ne permet de dterminer que des corrla-
tions linaires entre variables. Un coefficient de corrlation nul indique que la
covariance entre la variable x et la variable y est gale 0. Cest ainsi que deux
variables en totale dpendance peuvent avoir un coefficient de corrlation nul,
comme lillustre lexemple suivant : lquation dun cercle nous est donne
par (x x1 )2 + (y y1 )2 = R 2 , les variables x et y sont bien lies entre elles
fonctionnellement (graphique 7) et pourtant leur covariance est nulle et donc
leur coefficient de corrlation gal 0.
Pour pallier cette limite, il convient ventuellement de transformer les
variables, pralablement au calcul du coefficient de corrlation, afin de linariser

9782100721511-Bourbo-C01.qxd 20/10/14 15:07 Page 12
leur relation, par exemple au moyen dune transformation de type logarith-

mique.
Graphique 7 Relation fonctionnelle nest pas corrlation linaire
b) Corrlation nest pas causalit

Le fait davoir un coefficient de corrlation lev entre deux variables ne signi-
fie pas quil existe un autre lien que statistique. En dautres termes, une cova-
riance significativement diffrente de 0 nimplique pas une liaison dordre co-
nomique, physique ou autre. Nous appelons corrlation fortuite ce type de cor-
rlation que rien ne peut expliquer.
Lexemple le plus fameux concerne la forte corrlation existante entre le
nombre de taches solaires observes et le taux de criminalit aux tats-Unis.
Cela ne signifie pas quil existe une relation entre les deux variables, mais
quune troisime variable, lvolution de long terme (la tendance) ici, explique
conjointement les deux phnomnes. La thorie de la cointgration traite de ce
problme (cf. chapitre 11).
12 CONOMTRIE
9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 13
2. Le modle
de rgression simple
N
ous commenons notre tude par le modle le plus simple : une
variable endogne est explique par une variable exogne.
Aprs avoir tudi les consquences probabilistes de lerreur
dobservation, nous prsentons en I. les formules de base permettant
destimer les paramtres du modle. Les hypothses stochastiques et
leurs consquences sont tudies au paragraphe II.
En III. et IV., la qualit de lestimation dun modle est examine laide
des premiers tests statistiques (Student, Fisher).
Enfin, en V., le modle de rgression simple est tudi en tant quoutil de
prvision avec le degr de confiance que nous pouvons en attendre.
I. Prsentation du modle
A. Exemple introductif
Soit la fonction de consommation keynsienne :
C = a0 + a1 Y
o :
C = consommation,
Y = revenu,
a1 = propension marginale consommer,
a0 = consommation autonome ou incompressible.
Le modle de rgression simple 13

9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 14
1) Vocabulaire
La variable consommation est appele variable expliquer ou variable

endogne .
La variable revenu est appele variable explicative ou variable exogne
(cest le revenu qui explique la consommation).
a1 et a0 sont les paramtres du modle ou encore les coefficients de rgression.
2) Spcification
Nous pouvons distinguer deux types de spcifications :

Les modles en srie temporelle, les variables reprsentent des phnomnes
observs intervalles de temps rguliers, par exemple la consommation et le
revenu annuel sur 20 ans pour un pays donn. Le modle scrit alors :
Ct = a0 + a1 Yt t = 1,. . . , 20
o :
Ct = consommation au temps t ,
Yt = revenu au temps t .
Les modles en coupe instantane, les variables reprsentent des phnomnes
observs au mme instant mais concernant plusieurs individus, par exemple la
consommation et le revenu observs sur un chantillon de 20 pays. Le modle
scrit alors :
Ci = a0 + a1 Yi i = 1,. . . , 20
o :
Ci = consommation du pays i pour une anne donne,
Yi = revenu du pays i pour une anne donne.
B. Rle du terme alatoire

Le modle tel quil vient dtre spcifi nest quune caricature de la ralit.
En effet ne retenir que le revenu pour expliquer la consommation est lvi-
dence mme insuffisant ; il existe une multitude dautres facteurs susceptibles
dexpliquer la consommation. Cest pourquoi nous ajoutons un terme (t )
qui synthtise lensemble de ces informations non explicites dans le mo-
dle : Ct = a0 + a1 Yt + t si le modle est spcifi en srie temporelle
(Ci = a0 + a1 Yi + i si le modle est spcifi en coupe instantane), o t repr-
sente lerreur de spcification du modle, cest--dire lensemble des phno-
mnes explicatifs de la consommation non lis au revenu. Le terme t mesure la
14 CONOMTRIE
9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 15
diffrence entre les valeurs rellement observes de Ct et les valeurs qui auraient
t observes si la relation spcifie avait t rigoureusement exacte. Le terme
t regroupe donc trois erreurs :
une erreur de spcification, cest--dire le fait que la seule variable expli-
cative nest pas suffisante pour rendre compte de la totalit du phnom-
ne expliqu ;
une erreur de mesure, les donnes ne reprsentent pas exactement le ph-
nomne ;
une erreur de fluctuation dchantillonnage, dun chantillon lautre les
observations, et donc les estimations, sont lgrement diffrentes.
Exercice n 1
fichier C2EX1
Gnration dune consommation alatoire

Le tableau 1 prsente le revenu moyen par habitant sur 10 ans exprim en dollars
pour un pays.
Tableau 1 volution du revenu moyen par habitant en dollars
Anne Revenu
1 8 000
2 9 000
3 9 500
4 9 500
5 9 800
6 11 000
7 12 000
8 13 000
9 15 000
10 16 000
Sachant que la propension marginale consommer est de 0,8 et que la consomma-

tion incompressible est 1 000, on demande :
1) de calculer la consommation thorique sur les 10 ans ;
2) considrant que notre erreur dobservation suit une loi normale de moyenne 0 et de
variance 20 000, de gnrer cette variable alatoire et de calculer une consommation
observe tenant compte de cette erreur.
Solution
Les calculs des questions 1) et 2) sont prsents dans le tableau 2.

La consommation thorique (colonne 3) est calcule par application directe de la
formule : Ct = 1 000 + 0,8 Yt .

9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 16
La gnration de la variable alatoire t (t N (0 ; 20 000)) ne pose pas de diffi-

cult particulire ; bien entendu il en existe une infinit, un exemple en est prsent en
colonne 4.
La consommation observe (colonne 5) est donc gale Ct = 1 000 + 0,8 Yt + t ,
soit la somme de la colonne 3 et de la colonne 4.
Tableau 2 Calcul de la consommation observe
(1) (2) (3) (4) (5)

Anne Revenu Consommation Ala Consommation
disponible thorique t observe
1 8 000 7 400 10,01 7 389,99

2 9 000 8 200 30,35 8 169,65
3 9 500 8 600 231,71 8 831,71
4 9 500 8 600 52,84 8 652,84
5 9 800 8 840 51,92 8 788,08
6 11 000 9 800 183,79 9 616,21
7 12 000 10 600 6,55 10 593,45
8 13 000 11 400 213,89 11 186,11
9 15 000 13 000 241,91 12 758,09
10 16 000 13 800 69,62 13 869,62
Moyenne : 38,42
cart type : 137,24
Nous observons que la moyenne de t , = 38,42 et la variance de t , Var(t ) =

18 834,81 sont lgrement diffrentes des valeurs thoriques. Cela est la consquence
du tirage particulier dun chantillon de taille assez faible (dix observations).
C. Consquences du terme alatoire

Dans lexercice prcdent, les valeurs vraies a0 et a1 sont parfaitement connues,
cependant, dans la ralit, nous ne connaissons pas ces valeurs mais seulement
les deux sries dobservations Ct et Rt . Les estimateurs1 de a0 et a1 , nots res-
pectivement a0 et
a1 , sont des variables alatoires, qui suivent les mmes lois de
probabilit, celle de t , puisquils sont fonctions de la variable alatoire t . Les
caractristiques de moyenne et dcart type de ces coefficients permettent de
construire des tests de validit du modle estim.
1. Il ne faut pas confondre : estimateur

a de a et estimation de
a qui est la valeur particulire de
lestimateur pour un chantillon.
16 CONOMTRIE
9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 17
Si laide dun programme informatique ( C2EX1.PRG) nous construi-

sons 150 chantillons de valeurs diffrentes pour la variable alatoire
t N (0 ; 20 000), nous allons alors trouver 150 estimations de a1 lgrement
diffrentes entre elles dont la distribution aura la forme de lhistogramme du
graphique 1.
Cette distribution a pour moyenne 0,801 et cart type 0,032, nous pouvons
observer quelle est peu prs symtrique par rapport la moyenne et quelle a
la forme dune courbe en cloche : tous ces lments suggrent bien une dis-
tribution normale de : a1 N (0,801 ; 0,032) . Cela est la consquence directe
de la normalit des erreurs.
Frquence
Coefficient 1
Graphique 1 Histogramme de la distribution de 150

a1
II. Estimation des paramtres

A. Modle et hypothses
Soit le modle suivant :
yt = a0 + a1 xt + t pour t = 1,. . . ,n

9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 18
avec :
yt = variable expliquer au temps t ;
xt = variable explicative au temps t ;
a0 ,a1 = paramtres du modle ;
t = erreur de spcification (diffrence entre le modle vrai et le modle
spcifi), cette erreur est inconnue et restera inconnue ;
Hypothses
H1 : le modle est linaire en xt (ou en nimporte quelle transformation de xt ).
H2 : les valeurs xt sont observes sans erreur (xt non alatoire).
H3 : E(t ) = 0 , lesprance mathmatique de lerreur est nulle : en moyenne le
modle est bien spcifi et donc lerreur moyenne est nulle.
H4 : E(t2 ) = 2 , la variance de lerreur est constante1 : le risque de lamplitu-
de de lerreur est le mme quelle que soit la priode.
H5 : E(t t ) = 0 si t = t , les erreurs sont non corrles (ou encore indpen-
dantes) : une erreur linstant t na pas dinfluence sur les erreurs sui-
vantes.
H6 : Cov(xt ,t ) = 0 , lerreur est indpendante de la variable explicative.
B. Formulation des estimateurs

En traant un graphique (2) des couples de donnes liant le revenu et la consom-
mation observe, nous obtenons un nuage de points que nous pouvons ajuster
laide dune droite.
Lestimateur des coefficients a0 et a1 est obtenu en minimisant la distance au
carr entre chaque observation et la droite, do le nom destimateur des
moindres carrs ordinaires (MCO).
La rsolution analytique est la suivante :

t=n
t=n
Min t2 = Min (yt a0 a1 xt )2 = Min S
t=1 t=1
1. Cette hypothse sappelle lhypothse dhomoscdasticit ; dans le cas o cette hypothse nest
pas vrifie, on parle alors de modle htroscdastique.
18 CONOMTRIE
9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 19
Graphique 2 Ajustement dun nuage de points par une droite
En oprant par drivation par rapport a0 et a1 afin de trouver le minimum1

de cette fonction, on obtient les rsultats suivants :
S S
= 2 (yt a 0 a 1 x t ) = 0 et = 2 x t (yt a 0 a 1 x t ) = 0
a0 t
a1 t
Sommant par rapport t , il vient :

xt yt
a0 xt
a1 xt2 = 0

t t t
a0
yt n a1 xt = 0
t t
quon appelle les quations normales et qui impliquent que :

t=n
t=n
(xt x)(yt y) xt yt nx y
[1]

a1 = =
t=1 t=1
t=n t=n
(xt x)2 xt2 nx 2
t=1 t=1

a0 = y
a1 x [2]
1. Nous considrons les conditions du deuxime ordre comme vrifies car la fonction est convexe.

9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 20
Nous pouvons faire deux remarques :

lcriture du modle nest pas neutre ;
La spcification : yt = a0 + a1 xt + t nest pas quivalente :
xt = a0 + a1 yt + t . Dans le premier modle, xt est la cause de yt , alors que dans
la deuxime spcification, cest yt qui est la cause de xt .
Nous remarquons que : a1

a1 = 2
( = coefficient de corrlation entre x et y ) ;
le coefficient a1 reprsente la pente de la droite ou encore une propension

marginale.
Nous avons :
yt = a1
xt . Limpact dune variation de xt se mesure direc-
tement sur yt au travers du coefficient
a1 .
Cas particulier : modle sans terme constant

La thorie conomique postule parfois des relations dans lesquelles a0 = 0 :
cest le cas par exemple pour une fonction de production de produit industriel
o le facteur de production (unique) nul entrane une production nulle.
Lestimation de a1 est alors donne par la formule suivante :

t=n
xt yt

a1 =
t=1
[3]
t=n
2
x t
t=1
Nous remarquons quil sagit de lapplication de la formule [1] dans laquel-

le x et y sont nulles. Dans le cas de variables centres1, cest donc cette formu-
le [3] quil convient demployer car le terme constant est nul.
Exercice n 2
fichier C2EX2
Estimation des coefficients de rgression
partir des donnes du tableau 2 de lexercice 1, on demande de calculer les esti-
mations de
a0 et
a1 .
Solution
Le tableau 3 prsente les calculs effectuer.
1. Les donnes sont centres lorsque les observations sont centres sur leur moyenne : (xt x) ,
la somme des donnes centres est donc par construction nulle.
20 CONOMTRIE
9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 21
Tableau 3 Calcul dun coefficient de rgression
(1) (2) (3) (4) (5) (6) (7)

t yt xt yt y xt x (5)* (5) (4)* (5)
1 7 389,99 8 000 2 595,59 3 280 10 758 400 8 513 518

2 8 169,65 9 000 1 815,93 2 280 5 198 400 4 140 300
3 8 831,71 9 500 1 153,87 1 780 3 168 400 2 053 879
4 8 652,84 9 500 1 332,74 1 780 3 168 400 2 372 268
5 8 788,08 9 800 1 197,50 1 480 2 190 400 1 772 292
6 9 616,21 11 000 369,37 280 78 400 103 422
7 10 593,45 12 000 607,88 720 518 400 437 670
8 11 186,11 13 000 1 200,54 1 720 2 958 400 2 064 920
9 12 758,09 15 000 2 772,52 3 720 13 838 400 10 313 755
10 13 869,62 16 000 3 884,05 4 720 22 278 400 18 332 692
Somme 99 855,75 112 800 0 0 64 156 000 50 104 729

Moyenne 9 985,57 11 280 0 0 6 415 600 5 010 472

t=n
(xt x)(yt y)
t=1 50 104 729

a1 = = = 0,78

t=n 64 156 000
(xt x)2
t=1

a0 = y
a1 x = 9 985,57 0,78 11 280 = 1 176,08
Ces estimations sont comparer aux valeurs vraies (respectivement 0,8 et 1 000),
les diffrences importantes en ce qui concerne surtout le terme constant sont imputables
lala dobservation qui perturbe lestimation des coefficients.
C. Les diffrentes critures du modle :

erreur et rsidu
Le modle de rgression simple peut scrire sous deux formes selon quil sagit
du modle thorique spcifi par lconomiste ou du modle estim partir dun
chantillon.
Modle thorique spcifi par lconomiste avec t lerreur inconnue :
yt = a0 + a1 xt + t
Modle estim partir dun chantillon dobservations :
yt =
a0 +
a1 xt + et =
yt + et et = rsidu
(Bien noter les chapeaux sur les a .)

9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 22
Le rsidu observ et est donc la diffrence entre les valeurs observes de la

variable expliquer et les valeurs ajustes laide des estimations des coeffi-
cients du modle ;
ou encore :

yt =
a0 +
a1 x t
D. Proprits des estimateurs

yt = a0 + a1 xt + t [4]
y = a0 + a1 x + [5]
[4] [5] = yt y = a1 (xt x) + (t )
En remplaant dans la formule [1] de lestimateur

a1 , yt y par son expression,
on obtient :
t=n t=n
(x t x)(t ) (x t x)t
t=1 t=1

a1 = a1 + = a1 + [6]

t=n
t=n
(x t x) 2
(x t x) 2
t=1 t=1

n
xt

n
n
t=1
car (x t x) = x t n x = nx nx = 0 avec x =
t=1 t=1
n
Les estimateurs sont-ils sans biais ?

a ) = a.)
(Rappel : un estimateur est sans biais si E(

t=n
(x t x)t
t=1

a1 = a1 + [7]
t=n
(x t x) 2
t=1

t=n
(xt x)E(t )
a1 ) = E(a1 ) +
t=1
do : E(
t=n
(xt x)2
t=1
a1 ) = a1 car E(t ) = 0
Soit E(
a0 ) = a0 .
De mme on dmontre que E(
22 CONOMTRIE
9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 23
y =a0 +
a1 x

a0 = a0 + (
a1 a1 )x
y = a0 + a1 x +
a0 ) = a0 + E() E((
E( a1 a1 )x) = a0
a1 a1 ) = 0 et E() = 0
car E(

n
car E() est par hypothse nulle, E t = 0
t=1
Les estimateurs sont sans biais.

Les estimateurs sont-ils convergents ?
Puisque les estimateurs sont sans biais, il suffit pour quils soient convergents
que :
Lim V (a1 ) 0 lorsque n o V ( a1 ) est la variance de
a1 .
t=n 2

(x t x)t
t=1
V (
a1 ) = E{a1 E(
a1 )} = E(
2
a1 a1 ) = E t=n
2 (daprs [7])

(x t x)2
t=1
2

V (
a1 ) = E wt t =E w +2
2
t
2
t wt wt t t
t t t<t
(xt x)
avec wt =

t=n
(xt x)2
t=1

V (
a1 ) = wt2 E(t2 ) + 2 wt wt E(t t )
t t<t
Or, daprs les hypothses :

H4 E(t2 ) = 2 ;
H5 E(t t ) = 0 si t = t .
2
V (
a1 ) = wt2 2 = [8]
t (xt x)2
t

Lorsque n alors (xt x)2 tend galement vers , do V (
a1 ) tend
t
vers 0 puisque est constant.

2

Nous pouvons observer sur lexpression de la variance de a1 que cet estima-

teur est dautant plus prcis que (xt x) est lev, cest--dire lorsque :
2

9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 24
le nombre dobservations est important ;

et/ou les valeurs de la variable explicative sont trs disperses autour de la
moyenne.
Une dmonstration analogue pour a0 conduit aux rsultats suivant :

2
1 x
a0 ) = 2 +
V ( [9]
n (xt x)2
Lim V (
a0 ) 0 lorsque n .
Nous remarquons que :
2
V (
a0 ) = + x 2 V (
a1 ) a0 ,
Cov( a1 ) = x V (
a1 )
n
Les estimateurs sont convergents.
III. Consquences des hypothses :

construction des tests
A. Hypothse de normalit des erreurs
Nous allons maintenant introduire de nouveau lhypothse qui est celle de la
normalit des erreurs (cf. exercice 1). Cette hypothse nest pas indispensable
afin dobtenir des estimateurs convergents mais elle va nous permettre de
construire des tests statistiques1 concernant la validit du modle estim.
Soit t N (0, 2 )
Le graphique 3 illustre cette hypothse sur la distribution des valeurs proje-
tes sur la droite des moindres carrs.
Graphique 3 Les erreurs suivent une loi normale
1. En effet, cette hypothse permet de dfinir la loi de probabilit des estimateurs.
24 CONOMTRIE
9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 25
B. Consquences de lhypothse de normalit des erreurs

En prliminaire, cherchons un estimateur de la variance de lerreur.
Le rsidu est donn par :
et = yt yt = yt a 1 xt a 0
Sans rien changer lexpression prcdente, nous pouvons crire :
et = yt a 1 xt a 0 a 1 x + a 1 x
Ou encore : et = yt a 1 x a 0 a 1 xt + a 1 x
Or y = a 1 x + a 0
Do : et = yt y a 1 (xt x)
En remplaant yt et y par leurs expressions [4] et [5], il vient :
et = (a1
a1 )(xt x) + (t )
Nous obtenons en levant ce terme au carr et effectuant la somme sur les n
observations :

et2 = (a1
a1 )2 (xt x)2 + (t )2 + 2(a1
a1 ) (xt x)(t )
t t t t
Or daprs lexpression [6], nous avons :

(xt x)(t ) = (a1
a1 ) (xt x)2
t t
que nous remplaons dans lexpression prcdente et aprs simplification :

et2 = (t )2 (a1
a1 )2 (xt x)2
t t t
En prenant lesprance mathmatique de cette dernire expression :

E et2 = E (t )2 E (a1
a1 )2 (xt x)2
t t t
Examinons les deux membres de cette quation.

a) E (t ) = E
2
(t 2t + ) = E
2 2
t 2
2
t + 2
t

t

t t
t
=E t 2n + n = E
2 2
t 2n + n
2 2 2

t
t

=E t2 n2 = E t2 t
t t t
2
t
1 2
=E = E( ) E t
2 t 2
t t
t
n t
n t

9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 26
Nous savons que : E[t2 ] = 2

1 2
E (t ) = n2 E 1 + 2 + . . . + n
2
t
n
Or, daprs lhypothse dindpendance des erreurs, les doubles produits

sont donc tous nuls. Nous obtenons alors :

1
E (t ) = n2 n2 = n2 2
2
t
n

b) E (a1
a1 )2 (xt x)2 = 2
t
2
a1 )2 =
En effet E (a1
(xt x)2
Do : t

E et2 = (n 1)2 2 = (n 2)2
t
Lestimateur de la variance de lerreur (2 ) not

2 est donc gal :
1 2

2 = e [10]
n2 t t
Ce qui nous permet de dfinir, en remplaant la variance des erreurs par son
estimateur dans les expressions [8] et [9], les estimateurs empiriques1 de la
variance de chacun des coefficients.

2
a21 =

(xt x)2
t
[11]
2
1 x
2 +
a20 =
n (xt x)2
Lhypothse de normalit des erreurs implique que :

a1 a1
a0 a0
et
a1 a0
suivent une loi normale centre rduite N(0, 1).
1. Bien noter les chapeaux qui diffrencient les estimateurs thoriques (inconnus) des estima-
tions empiriques (calculables).
26 CONOMTRIE
9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 27

n
et2

2
= (n 2)
t=1
2
2
suit une loi du 2 (chi-deux) n 2 degrs de libert1 (somme au carr de n 2

variables alatoires indpendantes normales centres rduites).
n
et2

2

2
Nous pouvons remarquer que (n 2) 2 = (n 2) a2 = 2
t=1
a a (x t x)2
t
suit donc aussi une loi du 2 (chi-deux) n 2 degrs de libert.
Il en rsulte que :

a1 a1
a0 a0
et (lcart type thorique est remplac par lcart type

a1
a0
empirique) suivent une loi de Student n 2 degrs de libert.

a1 a1

a1 a1 a1
En effet = est le rapport dune loi normale

a1
a2 1
(n 2) 21
a1 (n 2)
centre rduite la racine carre dun chi-deux divis par son degr de libert.
Il est donc possible maintenant de mettre en place des tests statistiques afin
dapporter des rponses des problmes tels que :
comparaison dun coefficient de rgression par rapport une valeur fixe ;
comparaison de deux coefficients de rgression provenant de deux chan-
tillons diffrents ;
dtermination dun intervalle de confiance pour un coefficient.
C. Test bilatral, test unilatral et probabilit critique dun test

1) Test bilatral
Soit tester, un seuil de 5 %, lhypothse H0 : a1 = 0 contre lhypothse
H1 : a1 0.

a1 a1
Nous savons que suit une loi de Student n 2 degrs de libert.

a 1
1. La notion de degr de libert correspond au nombre de valeurs restant rellement disposition
aprs une procdure destimaton statistique. Si un chantillon comprend 10 observations et
quon dispose en plus de la moyenne de cet chantillon, on ne peut choisir librement les valeurs
que pour 9 de ces observations, la dixime se dduisant de la valeur de la moyenne. Dans le
cas prsent, le modle de rgression simple, le nombre de degrs de libert est donc de
n 2 car nous avons estim deux paramtres a0 et a1.

9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 28

a1 0
Sous H0 (a1 = 0) le ratio appel ratio de Student suit donc une loi de

a 1
Student n 2 degrs de libert. Le test dhypothses bilatral consiste donc com-
|
a1 |
parer le ratio de Student empirique t = la valeur du t de Student lue dans la

a 1
table n 2 degrs de libert1 et pour un seuil de probabilit gal 5 %, soit si n
0,05
2 > 30, t = 1,96 (la table 2. de Student en fin du livre est tabule pour les tests
bilatraux). Si t* > t
0,05
= 1,96 , nous rejetons lhypothse H0 (cf. graphique 4), le
coefficient thorique et inconnu a1 est significativement diffrent de 0.
Graphique 4 Test bilatral 5 %
2) Test unilatral
Soit tester, un seuil de 5 %, lhypothse H0 : a1 = 0 contre lhypothse

H1 : a1 > 0 ou a1 < 0 selon que le coefficient estim soit positif ou ngatif.
Le test dhypothses unilatral consiste donc comparer le ratio de Student
|
a1 |
empirique t = la valeur du t de Student lue dans la table n 2 degrs

a 1
de libert et pour un seuil de probabilit gal 5 %, soit si n 2 > 30,
0,05
t = 1,65 . Si t* > t0,05
= 1,65 nous rejetons lhypothse H0 (cf. graphique 5),
le coefficient thorique et inconnu a1 est significativement diffrent de 0.
Attention, la table de Student en fin du livre est tabule pour les tests bilatraux,
il faut donc lire 10 % = 2 0,05.
1. Si le degr de libert est suprieur 30, la loi de Student peut tre approxime par une loi nor-
male.
28 CONOMTRIE
9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 29
Graphique 5 Test unilatral 5 % (H1 : a1 > 0)
Remarque : si nous rejetons lhypothse H0 pour un test bilatral, alors nous

rejetons forcment (pour un mme seuil de probabilit) lhypothse H0 pour un
test unilatral.
3) Probabilit critique dun test
La probabilit critique risque de rejeter tort lhypothse H0 ou encore

risque de premire espce est donne par la valeur de la probabilit c telle que :
c

a1
tn2 = t = , par la lecture sur une table de Student n 2 degrs de libert.

a 1
La probabilit critique dun test unilatral peut directement se dduire de la
probabilit critique dun test bilatral par une simple division par 2
unilatr
c
al = bilatr al /2 (opration inverse de celle de la lecture de la table).
c
Exemple : Pour t = 2,53 et n 2 = 20, soit dterminer c tel que

c
t = 2,53 . Par lecture de la table de Student 20 degrs de libert, nous trou-
20
vons c = 2 % pour un test bilatral et donc 1 % pour un test unilatral.
Exercice n 3fichier C2EX2

Test de coefficient et intervalle de confiance
En reprenant les rsultats de lexercice 2, on demande de rpondre aux questions
suivantes.
1) La propension marginale consommer est-elle significativement diffrente de 0 ?

9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 30
2) Quel est lintervalle de confiance au seuil (ou niveau) de 95 % pour la propension

marginale consommer ?
Solution
1) La propension marginale consommer est-elle significativement diffrente de 0 ?

Cette question est trs importante en conomtrie. En effet, dans le cas dune rpon-
se ngative le coefficient nest pas significativement diffrent de 0 la variable expli-
cative Revenu ne sera pas considre comme tant explicative de la consommation
puisque son coefficient de pondration est nul.
Il peut paratre tonnant de tester la diffrence par rapport zro et non pas seule-
ment la positivit ou la ngativit du coefficient de rgression. En effet, il est commode
de ne sinterroger que sur la contribution de la variable explicative, quelle soit positive
ou ngative.
Ce problme peut tre formul laide de la thorie des tests partir des deux hypo-
thses suivantes :
H0 : a1 = 0
H1 : a1 = 0
Si nous rejetons lhypothse H0, un seuil 1 fix, alors la propension marginale

consommer est considre comme tant significativement diffrente de 0. Le seuil le
plus communment employ est = 0,05 , soit un risque de rejeter tort H0 de 5 %.
Nous savons que :

a1 a1
suit une loi de Student n 2 degrs de libert.

a1

Sous lhypothse H0, cette relation devient :

a1 0
a1
= = ta1
loi de Student n 2 degrs de libert.
a1

a1

ta1
est appel le ratio de Student.
Nous avons calcul

a1 lors de lexercice 2, il convient donc de calculer
a1
; or,
daprs [11],

2

a1
=
2 , nous connaissons (xt x)2 = 64 156 000
(xt x)2 t
t
(colonne 6 du tableau de calcul 3). Lestimateur de la variance de lerreur nous est donn
par [10] :

et2
t
2 =
, o et est le rsidu de lestimation (et = yt
yt )
n2
1. Le seuil est aussi appel risque de premire espce : cest la probabilit de rejeter lhypo-
thse H0 bien quelle soit vraie.
30 CONOMTRIE
9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 31
a) Calcul de
yt et de et
La srie ajuste
yt est calcule par application des estimations
a0 et
a1 :

yt =
a0 +
a1 x t
soit
y1 =
a0 +
a1 x1 e1 = y1
y1

y1 = 1 176,08 + 0,78 8 000 = 7 423,95 1 e1 = 7 389,99 7 423,95 = 33,96

y2 = 1 176,08 + 0,78 9 000 = 8 204,93 e2 = 8 169,65 8 204,93 = 35,28
Les rsultats sont consigns dans le tableau 4. Nous remarquons bien que
et = 0 (proprit de la mthode des moindres carrs).
t
Tableau 4 Calcul du rsidu destimation

yt et et2
7 423,95 33,96 1 153,38

8 204,93 35,28 1 244,98
8 595,43 236,28 55 830,26
8 595,43 57,41 3 296,40
8 829,72 41,64 1 733,93
9 766,90 150,69 22 707,42
10 547,88 45,57 2 076,39
11 328,87 142,76 20 379,08
12 890,83 132,74 17 620,12
13 671,81 197,81 39 127,38
Somme 0,00 165 169,30
Moyenne 0,00 16 516,93
b) Calcul de lestimation de la variance de lerreur et de lcart type du coefficient

de rgression.
Lestimation de la variance de lerreur est donc gale :

et2
t 165 169,3
=
2
= = 20 646,16
n2 10 2
ce qui nous permet de calculer la variance estime de a1 :

2 20 646,16
=
a1
2 = = 0,000 321 8
(xt x)2 64 156 000
t
soit = 0,017 9
a1
c) Calcul du ratio de Student et rgle de dcision.
a1
Nous savons que = ta1
est distribu selon une loi de Student n 2

a1

degrs de libert, la distribution dchantillonnage sous H0 est donc reprsente par le
graphe 6.
1. Les petites diffrences constates sont dues des problmes darrondi.

9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 32
/2 /2
H1 tn2 + tn2 H1

H0
Graphique 6 Distribution dchantillonnage sous lhypothse H0
La rgle de dcision pour un seuil est alors la suivante :

a 1
=
On calcule le ratio empirique de Student ta1 (rapport du coefficient sur son
cart type) a1

/2 /2
Si ta1 est infrieur tn2 ou suprieur +tn2 alors on rejette lhypothse H0
(nous sommes dans la zone hachure H1), le coefficient a1 est alors significativement
diffrent de 0 (on accepte a1 = 0) ; la variable explicative Rt est donc contributive
lexplication de la variable Ct.
/2
est compris dans lintervalle tn2 , alors nous ne sommes pas en mesure de
Si ta1
rejeter lhypothse H0 (donc on laccepte), le coefficient a1 nest pas significativement
diffrent de 0 (on accepte a1 = 0) ; la variable explicative Rt nest donc pas explicati-
ve de la variable Ct.
Il est plus simple de profiter de la symtrie de la loi de Student et donc de calculer
la valeur absolue du ratio de Student et de la comparer directement la valeur lue dans
la table.
La rgle de dcision pour un seuil = 0,05 est alors la suivante :
a1 |
|
= > tn2 on rejette lhypothse H0, le coefficient a1 est alors
0,025
si ta1

a1
significativement diffrent de 0 (on accepte a1 = 0 ) ; la variable explicative Rt est donc
contributive lexplication de la variable Ct ;
|a1 |
= tn2 on accepte lhypothse H0, le coefficient a1 nest donc
0,025
si ta1
a1

pas significativement diffrent de 0 (on accepte a1 = 0 ) ; la variable explicative Rt
nest donc pas contributive lexplication de Ct .
Nous voyons limportance que revt ce test dans linvestigation conomtrique ; en
effet, il permet de tester la pertinence dune variable explicative qui figure dans un
modle et sa contribution lexplication du phnomne que lon cherche modliser.
Dans notre exemple, nous calculons le ratio de Student :
a1 |
| 0,78
=
ta1 = = 43,57 > t80,025 = 2,306 1 a1 = 0

a1
0,017 9
La propension marginale consommer est donc significativement diffrente de 0,
la variable Revenu est bien explicative de la variable Consommation.
2) Dtermination dun intervalle de confiance, au seuil de 95 %, pour la propension
marginale consommer.
1. Les tables statistiques sont en fin douvrage. Dans le cas dun test unilatral, il convient duti-
liser une table correspondant ce type de test, cest--dire dont seule la partie de gauche est
hachure. Dans le cas dun test bilatral, ce sont les tables dont les deux parties extrmes sont
hachures. Bien entendu, cela nest vrai que pour les lois de probabilit symtriques.
32 CONOMTRIE
9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 33
Nous savons que :

a1 a1
a1 a1
suit une loi de Student n 2 degrs de libert, soit = tn2 , lintervalle de

a1
a1

confiance nous est donn (cf. graphe 4) par :
a1 a1 /2 /2
= tn2 a1 = a1
a 1 tn2

a1

Application numrique pour un seuil = 0,95 :
a1 = 0,78 2,306 0,0179
Nous avons donc un risque de 5 % que le vritable coefficient a1 se trouve lextrieur
de lintervalle [0,74 ; 0,82] ; nous constatons que 0 ne figure pas dans cet intervalle de confian-
ce, ce qui est bien entendu cohrent avec la question prcdente.
IV. quation et tableau danalyse

de la variance
A. quation danalyse de la variance

Dmontrons les deux relations suivantes :

et = 0 : la somme des rsidus est nulle (la droite de rgression passe
t
par le point moyen 1
).
yt = a0 +
a1 xt + et yt = a0 +
a1 xt + et
t t t t
yt na0 a1 xt = et or
a0 = y a1 x , en divisant par n il apparat que
t t t
et = 0 .
t

yt = yt , il y a galit entre la moyenne de la srie expliquer et la
t t
moyenne de la srie ajuste.

yt
yt = et yt
yt = et = 0 y =
y
t t t
De ces deux relations nous pouvons en dduire lquation fondamentale
danalyse de la variance :

(yt y)2 = yt
( y)2 + et2
t t t [12]
SC T = SC E +SC R
1. Cela nest vrai que pour les modles comportant un terme constant, ou bien, pour les modles
sans terme constant, si les donnes sont centres sur leur moyenne.

9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 34
La variabilit totale (SCT) est gale la variabilit explique (SCE) + la

variabilit des rsidus (SCR).
Cette quation va nous permettre de juger de la qualit de lajustement dun
modle. En effet, plus la variance explique est proche de la variance totale,
meilleur est lajustement du nuage de points par la droite des moindres carrs.
Il est dusage de calculer le rapport :

(
yt y)2 et2
R2 = =1
t t
[13]
(yt y)2 (yt y)2
t t
R 2 est appel le coefficient de dtermination, et R le coefficient de corrlation

multiple (dans le cas particulier du modle de rgression une seule variable
explicative, il est gal au coefficient de corrlation linaire simple entre x et y ).
B. Tableau danalyse de la variance

Le tableau 5 prsente lanalyse de la variance pour un modle de rgression simple.
Tableau 5 Analyse de la variance par une rgression simple
Source Somme Degr Carrs
de variation des carrs de libert moyens

x SC E = (
yt y)2 1 SC E/1
t

Rsidu SC R = et2 n2 SC R/(n 2)
t

Total SC T = (yt y)2 n1
t
Les degrs de libert correspondent au nombre de valeurs que nous pouvons

choisir arbitrairement (par exemple, pour la variabilit totale, connaissant n 1
valeurs, nous pourrons en dduire la n -ime, puisque nous connaissons la
moyenne y ).
Le test H0 : a1 = 0 est quivalent au test dhypothse1 H0 : SC E = 0 (la
variable explicative xt ne contribue pas lexplication du modle).
Soit le test dhypothses H0 : SC E = 0 contre lhypothse H1 : SC E =
/ 0.
La statistique2 de ce test est donne par :
1. Cela nest vrai que dans le cas du modle de rgression simple.

2. Nous comparons la somme des carrs expliqus SCE la somme des carrs des rsidus SCR
qui est reprsentative de la somme des carrs thoriquement la plus faible.
34 CONOMTRIE
9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 35

(
yt y)2
SC E t
ddl SC E 1
F = = [14]
SC R et2
ddl SC R t
(n 2)
Ou encore :

(
yt y)2
SC E t R2
ddl SC E 1 1
F = = = [15]
SC R et2 (1 R 2 )
ddl SC R t (n 2)
(n 2)
La statistique F est le rapport de la somme des carrs expliqus par xt sur la

somme des carrs des rsidus, chacune de ces sommes tant divise par son
degr de libert respectif. Ainsi, si la variance explique est significativement
suprieure la variance rsiduelle, la variable xt est considre comme tant une
variable rellement explicative.
F suit une statistique de Fisher 1 et n 2 degrs de libert. Si F > F1;n2

nous rejetons au seuil lhypothse H0 dgalit des variances, la variable xt est

significative ; dans le cas contraire, nous acceptons lhypothse dgalit des
variances, la variable xt nest pas explicative de la variable yt .
2
a 1 a1
En effet, 2 ! suit une loi du 2 (chi-deux) un degr de li-
/ t (xt x)2
bert (carr dune variable alatoire normale centre rduite) et

n
et2
2 a2i
= (n 2) = (n
t=1
2) suit une loi du 2 (chi-deux) n 2 degrs de
2 2 a2i
libert (somme au carr de n 2 variables alatoires indpendantes normales
centres rduites).

(a 1 a1 )2 (xt x)2
En effectuant le rapport des deux chi-deux on obtient : F = t ,
et2
t
(n 2)

a 12 (xt x)2 SC E
soit sous H0 (a1 = 0) F =
t
= 1 suit une loi de Fisher 1
et2 SC R
t (n 2)
(n 2)

9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 36
et n 2 degrs de libert (rapport de chi-deux diviss par leurs degrs de

libert).

En effet, nous avons SC E = ( yt y)2 = a 12 (xt x)2 car
t t
yt y = a 0 + a 1 xt a 0 a 1 x = a 1 (xt x) .
Nous remarquons :
2 a 12 (xt x)2
2 a 1 a2
= 2
t
F = ta1
= = 1
a1
2 / (xt x)2 et /(n 2)
t t
Exercice n 4
quivalence des tests et analyse de la variance
Un agronome cherche estimer la relation liant la production de mas yi au taux de
bauxite xi se trouvant dans la terre en formalisant la relation :
yi = a0 + a1 xi + i
partir dune tude statistique portant sur 85 parcelles de terre, un conomtre lui
fournit les rsultats suivants :
yi = 132,80 1,1 xi + ei i = 1,. . . , 85
(4,3) (10,2)
() = ratio de Student

ei2 = 6 234,32
i
1) Montrer que tester lhypothse H0 : a1 = 0 revient tester lhypothse r = 0 , o r

est le coefficient de corrlation linaire simple entre yi et xi ; le calculer.
2) Construire le tableau danalyse de la variance et vrifier les rsultats obtenus en 1)
partir du test de Fisher.
3) Le coefficient a1 est-il significativement infrieur 1 ?
Solution
1) Les observations ne sont pas dates, le modle est spcifi en coupe instantane.
Pour tester lhypothse H0 : a1 = 0 , nous comparons le ratio de Student empirique
t = 10,2 la valeur critique t83
0,05
= 1,96 1.
1. Le degr de libert de la loi de Student tant suprieur 30, il est licite de lapproximer par
une loi normale, 1,96 est la valeur de la loi normale un seuil de 0,05 (test bilatral).
36 CONOMTRIE
9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 37
Puisque t est largement suprieur 1,96, nous rejetons lhypothse H0, a1 est donc
significativement diffrent de 0. Le taux de bauxite est un facteur explicatif (ngatif) de
la production de mas.
Lcart type du coefficient
a1 est gal :
a1 a1 /t = 0,107.
=
Montrons lquivalence de ce test avec H0 : r = 0 .

Le coefficient de corrlation linaire simple est gal :
2

(xi x)(yi y) (xi x)(yi y)
i
r2 =
i
r = "
(xi x)2 (yi y)2 (xi x)2 (yi y)2
i i i i
Or, daprs [1], nous savons que :

(xi x)(yi y)
a1 (xi x)(yi y)
SC E

a1 =
i
r2 =
i
= = R2
(xi x)2 (yi y)2 SC T
i i
En effet :

a1 (xi x)(yi y) = a1 a1 (xi x)2 =
a12 (xi x)2
i
i
i

= a1 x i
( a1 x)2 = yi
( a0 y +
a0 )2 = (
yi y)2 = SC E
i i i
Pour le modle de rgression simple, nous avons galit entre le coefficient de dter-
mination et le carr du coefficient de corrlation.
Nous avons la relation :
R2 r2
F = = = (t )2
(1 R 2 )/(n 2) (1 r 2 )/(n 2)
donc on en dduit :

r (n 2)
t = # qui suit une loi de Student n 2 degrs de libert.
(1 r 2 )
Ceci permet de tester si la relation entre yi et xi est significative, ou encore si le

coefficient r est significativement diffrent de 0. Le calcul du coefficient de corrlation
ne pose alors plus de problme :

r 83
t = 10,2 = # r 2 = 0,556 |r| = 0,745 1
(1 r 2 )
1. Nous savons que le coefficient r est en ralit ngatif puisque le coefficient de rgression
a1
est lui-mme ngatif.

9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 38
2) Pour construire le tableau danalyse de la variance, il nous faut connatre :

SC E = (
yi y)2
i

SC R = ei2
i

SC T = (yi y)2
i

ei2
SC R
Or, daprs [13], nous avons : R 2 = 1
i
=1
(yi y)2 SC T
i

R = r = 0,556 , la connaissance de SC R =
2 2
ei2 = 6 234,32 permet de dterminer
i
SC T = 14 041,26 ainsi que, daprs [12], SC E = 7 806,94 . Nous pouvons mainte-
nant construire le tableau 6 danalyse de la variance.
Tableau 6 Analyse de la variance

xi SC E = 7 806,94 1 7 806,94
Rsidu SC R = 6 234,32 85 2 75,11
Total SC T = 14 041,26 85 1
SC E/1 7 806,94
F = = = 103,94 > F1,83
0,05
= 3,96
SC R/(n 2)
.
75,11
Nous remarquons que F = (t )2.

Dans le modle de rgression simple, il y a quivalence tester :
H0 H1
a1 = 0 a1 = 0
r x,y = 0 r x,y = 0
SC E = 0 SC E = 0
Le premier test porte sur la pente de la droite de rgression, le deuxime test sur le
coefficient de corrlation entre x et y et, enfin, le troisime a pour but de juger si la
somme des carrs expliqus est significative, ces trois tests nanmoins rpondent la
mme interrogation.
La formulation des hypothses est la suivante :
H0 : a1 = 1
H1 : a1 < 1
38 CONOMTRIE
9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 39
Sous lhypothse H0, nous avons :
a1 a1 |
| a1 (1)|
| | 1,1 + 1|
= = = 0,92 < t 0,05 = 1.651

a1

a1
0,107 8
Nous acceptons lhypothse H0, a1 nest pas significativement diffrent de 1.

Nous pouvons aussi rpondre cette question en vrifiant que la valeur 1 est compri-
se dans lintervalle de confiance :
a1 =
a1 1,96
a1
a1 [ 1,31 ; 0,89]
(Attention : t 0,05 = 1,96 car le test est maintenant bilatral.)
V. La prvision dans le modle

de rgression simple
Lorsque les coefficients du modle ont t estims, il est possible de cal-
culer une prvision un horizon h .
Soit le modle estim sur la priode t = 1,. . . , n : yt = a0 + a1 xt + et ,
si la valeur de la variable explicative xt est connue en n + 1(xn+1 ) , la pr-
vision est donne par : yn+1 =
a0 + a1 xn+1 .
Montrons que cette prvision est sans biais.
Lerreur de prvision est gale : en+1 = yn+1 yn+1
que lon peut crire : en+1 = (a0 + a1 xn+1 + n+1 ) ( a0 +
a1 xn+1 )
soit : en+1 = (a0
a0 ) + (a1
a1 )xn+1 + n+1 . En se rfrant aux hypothses
du modle, on a :
E(en+1 ) = 0
Une dmonstration analogue permet dobtenir E(en+h ) = 0 .

La prvision sans biais est donc obtenue par lapplication directe du
modle de rgression estim. Cependant, dans la pratique, il nest que de
peu dutilit de connatre la prvision si nous ne savons pas quel degr de
confiance nous pouvons lui accorder. Nous allons donc calculer la varian-
ce de lerreur de prvision qui nous permet de dterminer un intervalle de
1. Valeur de la loi normale au seuil de 5 % ; en effet il sagit dun test unilatral.

9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 40
confiance1 bornant la prvision. La variance de lerreur de prvision est donne

par :

V (en+1 ) = V (
a0 a0 ) + (
a1 a1 )xn+1 + n+1
Puisque la variable xn+1 est certaine et lerreur n+1 est non autocorrle avec les
t cette expression peut scrire :
V (en+1 ) = V (
a0 ) + xn+1
2
V (
a1 ) + 2xn+1 Cov(
a0 ,
a1 ) + V (n+1 )
En remplaant les variances et la covariance des coefficients par leurs expres-

sions daprs [9] et connaissant V (n+1 ) = 2 , nous obtenons :

2
V (en+1 ) = + x 2 V (
a1 ) + xn+1
2
V (
a1 ) 2xn+1 x V (
a1 ) + 2
n
ou encore :
1 (xn+1 x)2
V (en+1 ) = V (yn+1 2 +
yn+1 ) = + 1 [16]
n (xt x)2
t
Nous pouvons observer que, dans cette formule, la variance de lerreur de

prvision est fonction de lcart quadratique entre la variable exogne prvue et
la moyenne de cette mme variable : plus la valeur prvue sloigne de cette
moyenne, plus le risque derreur est important. De mme, nous remarquons que
la variance de lerreur de prvision est une fonction inverse de la variabilit de
la srie explicative.
Lhypothse de normalit de t permet alors de dterminer un intervalle
(1 ) % pour la prvision :
1 (xn+1 x)2
yn+1 N 0, 2 +
en+1 = yn+1 + 1
n (xt x)2
t

a0 +
a1 xn+1 yn+1
Soit $ tn2 (Student n 2 d.d.l.)
%
%1 (xn+1 x)2
% +
+1
&n (xt x)2
t
$
%
%1 (x x)2
yn+1 =
yn+1 t /2
n2 %
&n + n+1 +1 [17]
(xt x)2
t
1. Il est plus juste de parler dintervalle de prdiction.
40 CONOMTRIE
9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 41
Cas particulier
Lorsque nous utilisons le modle de rgression simple pour calculer une droite
de tendance (moindres carrs sur le temps), le modle est spcifi ainsi :
Tt =
a0 +
a1 t + et pour t = 1,. . . , n
Pour calculer la prvision lhorizon h , nous employons la formule dextra-
polation :
n+h =
T a0 +
a1 (n + h) , et lintervalle de prdiction se trouve alors sur deux bran-
ches dhyperbole1 (n + h t)2 illustr par le graphique 7.
Graphique 7 Intervalle de la prvision par extrapolation de tendance

Exercice n 5
fichier C2EX2
Prvision dans un modle de rgression simple

Nous reprenons le modle consommation-revenu estim lors de lexercice 2 :
yt = 1 176,08 + 0,78 xt + et
(0,21) (43,53)
n = 10
() = t de Student
1) Calculer le coefficient de dtermination et effectuer le test de Fisher permettant de

dterminer si la rgression est globalement significative.
1. Cest leffet trompette , le lecteur devinera pourquoi...

9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 42
2) Quelle est la consquence sur la consommation de laugmentation du revenu de 8 % ?

3) Pour les annes 11 et 12, on prvoit respectivement 16 800 et 17 000 dollars de reve-
nu par habitant. Dterminer la prvision de consommation pour ces deux annes
ainsi que lintervalle de prdiction au seuil de 95 %.
Solution
1) Pour calculer le coefficient de dtermination, nous nous rfrons la relation [15] :

R2 r2
F = = = (t )2 = 43,52
(1 R 2 )/(n 2) (1 r 2 )/(n 2)
Soit : r 2 = 0,99 , nous pouvons alors calculer le Fisher empirique :
F = 1895,3 > F1,8
0,05
= 5,32 , la variable explicative est significative.
2) Augmentation de 8 % du revenu.
Nous avons :

yt =
a1
xt soit
yt = 0,78
xt = 0,78 0,08 = 0,062 4
La consommation augmente de 6,24 %, soit un peu moins que le revenu.
3) Les prvisions sont calcules par lutilisation du modle estim.

y11 = 1 176,08 + 0,78 x11 = 1 176,08 + 0,78 16 800
= 14 280,08
Lintervalle de prvision [17] peut alors tre calcul :
$
%
/2 %1 (x x)2
y11 = %
y11 tn2 &n + 11 +1
(xt x)2
t
avec :
n = 10

= 143,69 (daprs lexercice 3)
(xt x)2 = 64 156 000 (daprs lexercice 3)
t x = 11 280 (daprs lexercice 2)
/2
tn2 = 2,306
x11 = 16 800
y11 = 14 280,08 2,306 180,32
IC = [13 864,24 ; 14 695,91]
La ralisation a 95 % de chance de se trouver lintrieur de cet intervalle1.
De mme, pour lanne 12, nous obtenons :

y12 = 1 176,08 + 0,78 x12 = 1 176,08 + 0,78 17 000
= 14 436,08
y12 = 14 436,08 2,306 182,32
IC = [14 015,65 ; 14 856,51]
1. La distribution tant normale (loi continue), il est clair que la probabilit dapparition de cha-
cune des valeurs de lintervalle nest pas identique. La valeur la plus probable se trouve au
centre de lintervalle.
42 CONOMTRIE
9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 43
Exercice n 6
Comparaison de coefficients de rgression
Un conomiste spcialis en conomie du travail sintresse la relation liant la
rmunration et la dure des tudes (thorie du capital humain). Pour ce faire, il dispo-
se dun chantillon de 40 hommes et 25 femmes ayant le mme ge, dont il relve la
rmunration annuelle (yi ) , exprime en milliers deuros, et le nombre dannes
dtudes (xi ) .
Les estimations conomtriques conduisent aux rsultats suivants :
Pour les hommes :
yi = 18,60 + 1,8 xi + ei i = 1,. . . , 40 n 1 = 40
(9,3) (5,2)
R 2 = 0,42
Pour les femmes :

yi = 14,50 + 0,7 xi + ei i = 1,. . . , 25 n 2 = 25
(12,8) (2,5)
R 2 = 0,22
1) Linfluence de la dure des tudes sur la rmunration vous semble-t-elle signifi-

cative ?
2) Existe-t-il une diffrence significative de limpact de la dure des tudes sur la rmu-
nration des hommes et des femmes ?
Solution
1) Pour rpondre cette premire question, nous pouvons analyser soit les ratios de
Student, soit le coefficient de dtermination.
Le ratio de Student empirique de la variable annes dtudes est gal :
Pour les hommes :

ah
= = 5,2 > t38 = 1,96
0,05
tah

ah

Pour les femmes :

af
ta f = = 2,5 > t23
0,05
= 2,06

a f
Les carts types sont :

= 0,34
ah et
a f = 0,28
Les deux coefficients de rgression sont donc significativement diffrents de 0. Il est

noter que, pour les femmes, le coefficient de pondration des annes dtudes est plus

9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 44
faible et moins significatif que celui des hommes. Les probabilits critiques1 sont, pour
les hommes, de c = 0,000 1 et de c = 0,02 pour les femmes (nous considrons le
coefficient comme non significativement diffrent de 0 au seuil de 2 %).
Le test de Fisher men sur les coefficients de dtermination conduit aux mmes
rsultats.
2) Ce problme se ramne un test de diffrence de moyennes de variables alatoires
normales indpendantes et de variances ingales.
H0 : ah = a f H0 : d = ah a f = 0
H1 : ah = a f H1 : d = ah a f = 0
ah
( a f ) (ah a f )
Le rapport suit une loi de Student n 1 + n 2 4 degrs de

a h a f
libert.
Avec
d2 =
a2 f +
ah
2
et d =
ah
a f et sous lhypothse H0, le rapport scrit :
d (1,8 0,7)
= t = = 2,49 > t61
0,05
= 1,96

d 0,342 + 0,282
Rappel : Var(a x1 + b x2 ) = a 2 Var(x1 ) + b2 Var(x2 ) + 2abCov(x1 ,x2 ) o x1 et x2

sont deux variables alatoires et a et b sont deux scalaires. Ici Cov(a h ,a f ) = 0 car les
deux rgressions sont indpendantes. Do Var(a f a h ) = Var(a f ) + Var(a h ) .
Nous rejetons lhypothse H0, il existe une diffrence significative des coefficients
de rgression : la dure des tudes des femmes a moins dimpact sur la rmunration
que la dure des tudes des hommes (sur cet chantillon...)
Nous pouvons dterminer la probabilit critique de ce test (probabilit partir de
laquelle nous sommes amens accepter lhypothse H0). La lecture de la table de
Student 61 degrs de libert (sur la table ) indique une probabilit comprise entre
0,01 et 0,02 (la valeur exacte dtermine par la fonction Excel loi.student
est 0,0154). Le risque de se tromper en rejetant lhypothse H0 est donc de 1,54 % ;
compte tenu de ce trs faible risque, nous rejetons lhypothse H0. Evidemment, plus la
probabilit critique est faible plus nous sommes conforts dans notre dcision.
Exercice n 7
Apprendre manipuler les formules
Soit les rsultats dune estimation conomtrique :
yt = 1,251 xt 32,95 + et
n = 20
R 2 = 0,23
= 10,66
1. Cette notion est importante : il sagit de dterminer le seuil de probabilit partir duquel on
accepte lhypothse H0. Plus ce seuil est faible, moins le risque de se tromper est important.
44 CONOMTRIE
9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 45
1) A partir des informations connues, on demande de retrouver les statistiques sui-

vantes : la somme des carrs des rsidus (SCR), la somme des carrs totaux (SCT),
la somme des carrs expliqus (SCE), la valeur de la statistique du Fisher empirique
(F ) et lcart type du coefficient a 1 ( a1
).
2) Le coefficient de la variable x est-il significativement suprieur 1 ?
Solution
"
SCR
1) On sait que = = 10,66 SCR = (10,66)2 18 = 2 045,44
n2
Nous pouvons calculer SCE et SCT laide du coefficient de dtermination.
R 2 = 0,23 = 1 SC R/SC T
SC T = SC R/(1 R 2 ) = 2045,44/(1 0,23) = 2 656,42
Or SCT = SCE + SCR SCE = 610,98
Nous pouvons calculer maintenant :
R2 SC E
F = = = 5,40 t = F = 2,32
(1 R )/(n 2)
2 SC R/(n 2)
(dans le cas dun modle de rgression simple t 2 = F ). Nous pouvons en dduire

a 1 1,251
lcart type du coefficient : a1
= = = 0,54.
t 2,32
2) On pose le test dhypothses :
H0 : a1 = 1 contre lhypothse H1 : a1 > 1
Sous H0, nous pouvons crire :
a 1 a1 1,25 1
ta1 = = = 0,46 < t18
0,05
= 1,734 1 nous sommes donc dans la
a1
0,54
zone de lacceptation de H0, le coefficient a1 nest pas significativement suprieur
1.
Exercice n 8
Apprendre utiliser les formules
partir dun chantillon de 190 observations, on tudie la relation entre la variable
expliquer yi et la variable explicative xi .
laide des informations fournies ci-dessous reconstituez les huit valeurs man-
quantes signales par VM1, ...VM8.
1. Attention, comme le test est unilatral et que la table de Student de cet ouvrage est tabule direc-
tement pour /2 (cas le plus gnral dun test bilatral), il convient donc ici de lire sur la table
un seuil de 0,10 = 2 0,05 .

9782100721511-Bourbo-C02.qxd 20/10/14 15:09 Page 46
Dependent Variable: Y
Method: Least Squares
Sample: 1 190
Included observations: 190
Variable Coefficient Std. Error t-Statistic Prob.
C 4364.928 VM1 16.61141 0.0000
X VM4 VM3 VM2 0.0000
R-squared VM5 Mean dependent var VM6
S.E. of regression 322.8850 S.D. dependent var VM8
Sum squared resid VM7 F-statistic 778.9623
On donne x = 3,447 et x = 38,416
Solution
a 0
VM1 : directement par a 0 = = 262,76
ta0

VM2 : ta1 = F = 778,96 = 27,91

VM3 : a 1 = #! , or = 322,88 ;
(xi x)2

(xi x)2 !
x = do1 (xi x)2 = (n 1) x2 = 189 (3,447)2 = 2245,66
n1
322,88
a 1 = #! = = 6,81
(xi x)2 2245,66
do VM4 = VM3 VM2 = 190,15
R 2 /1 R2
VM5 : on sait que F = =
(1 R )/(n 2)
2 (1 R 2 )/188
778,96
= 778,96 R 2 = = 0,80
778,96 + 188
VM6 : y = a 0 + a 1 x = 4364,928 + 190,15 38,416 = 2939,8
! 2
! ei
VM7 : SCR = ei2 , or 2 =
n2
!
do ei2 = (n 2) 2 = 188 (322,88)2 = 19 599 280 .
SC E SC R SC R
VM8 : R 2 = =1 SC T = = 98 986 262
SC T SC T 1 R2
! "
(yi y)2 SC T
y = = = 723,7
n1 n1
1. Nous prenons ici la formule de lestimateur de lcart type calcul partir dun chantillon,
donc nous divisons par n 1.
46 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 47
3. Le modle
de rgression multiple
L
e modle linaire gnral est une extension du modle de rgres-
sion simple abord au chapitre prcdent. Aprs avoir prsent le
modle linaire gnral (I), nous envisageons une procdure des-
timation des paramtres en tudiant les proprits statistiques des esti-
mateurs (II). Les diffrents tests dhypothses concernant les coefficients
du modle sont proposs en (III), et la section (IV) est consacre lanaly-
se de la variance ainsi quaux tests sy rattachant.
En (V) nous prsentons une classe particulire de sries explicatives : les
variables indicatrices, puis la prvision laide du modle linaire gn-
ral fait lobjet de la section (VI).
Enfin nous terminons ce chapitre par quelques exercices rcapitulatifs.
I. Le modle linaire gnral

A. Prsentation
Lors du chapitre prcdent, nous avons considr quune variable endogne est
explique laide dune seule variable exogne. Cependant, il est extrmement
rare quun phnomne conomique ou social puisse tre apprhend par une
seule variable. Le modle linaire gnral est une gnralisation du modle de
rgression simple dans lequel figurent plusieurs variables explicatives :
yt = a0 + a1 x1t + a2 x2t + . . . + ak xkt + t pour t = 1,. . . , n
Le modle de rgression multiple 47

9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 48
avec :
yt = variable expliquer la date t ;
x1t = variable explicative 1 la date t ;
x2t = variable explicative 2 la date t ;
...
xkt = variable explicative k la date t ;
a0 , a1 ,. . . , ak = paramtres du modle ;
t = erreur de spcification (diffrence entre le modle vrai et le modle sp-
cifi), cette erreur est inconnue et restera inconnue ;
B. Forme matricielle
Lcriture prcdente du modle est dun maniement peu pratique. Afin den
allger lcriture et de faciliter lexpression de certains rsultats, on a habituel-
lement recours aux notations matricielles. En crivant le modle, observation
par observation, nous obtenons :
y1 = a0 + a1 x11 + a2 x21 + . . . + ak xk1 + 1

y2 = a0 + a1 x12 + a2 x22 + . . . + ak xk2 + 2
...
yt = a0 + a1 x1t + a2 x2t + . . . + ak xkt + t
...
yn = a0 + a1 x1n + a2 x2n + . . . + ak xkn + n
Soit, sous forme matricielle : Y = X a +

(n,1) (n,k+1) (k+1,1) (n,1)
avec :

y1 1 x11 x21 ... xk1 1
y2 1 x12 x22 ... xk2 a 0 2
. . .. .. a1 .
. . .
. . . . ... a .
Y = ; X = ; a = 2 ; =
yt 1 x1t x2t ... xkt ... t
. . .. .. .
. .. . . ... ..
. ak
yn 1 x1n x2n ... xkn n
Nous remarquons la premire colonne de la matrice X , compose de 1, qui
correspond au coefficient a0 (coefficient du terme constant).
La dimension de la matrice X est donc de n lignes et k + 1 colonnes (k tant
le nombre de variables explicatives relles, cest--dire constante exclue).
48 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 49
Lcriture sous forme matricielle rend plus aise la manipulation du modle

linaire gnral, cest pourquoi nous ladoptons par la suite.
II. Estimation et proprits

des estimateurs
A. Estimation des coefficients de rgression

Soit le modle sous forme matricielle k variables explicatives et n observa-
tions :
Y = Xa + [1]
Afin destimer le vecteur a compos des coefficients a0 , a1 . . . ak , nous appli-
quons la mthode des Moindres Carrs Ordinaires (MCO) qui consiste mini-
miser la somme des carrs des erreurs, soit :

n
Min t2 = Min = Min (Y Xa) (Y Xa) = Min S [2]
t=1
avec transpos1 du vecteur .

Pour minimiser cette fonction par rapport a , nous diffrencions2 S par
rapport a :
S
= 2 X Y + 2 X X
a=0 a = (X X)1 X Y [3]
a
Cette solution est ralisable3 si la matrice carre X X de dimension
(k + 1, k + 1) est inversible. La matrice X X est la matrice des produits croiss
des variables explicatives ; en cas de colinarit parfaite entre deux variables
explicatives, la matrice X X est singulire et la mthode des MCO dfaillante.
On appelle quations normales les quations issues de la relation :
X X
a = X Y
1. Nous dsignerons par le signe les transposs de vecteur ou de matrice.

2. S = (Y Xa) (Y Xa) = Y Y Y Xa a X Y + a X Xa
= Y Y 2 a X Y + a X Xa .
3. Les conditions de second ordre sont vrifies du fait que X X est une matrice dfinie semi-
positive.

9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 50
Soit, sous forme matricielle :

n x1t x2t ... xkt
yt
a0
x1t x1t2 x1t x2t ... x1t xkt
a1 x1t yt

x2t xkt =
x2t x2t x1t x2t2 ...
a2 x y
. ... 2t t
. ...
. ... ... ... ...

ak xkt yt
xkt xkt x1t xkt x2t ... 2
xkt
Le modle estim scrit :

yt =
a0 +
a1 x1t +
a2 x2t + . . . +
ak xkt + et
avec et = yt yt o et est le rsidu, cest--dire lcart entre la valeur observe

de la variable expliquer et sa valeur estime (ajuste).
Attention : il convient de bien distinguer entre lerreur de spcification du
modle (not t ) qui est et restera inconnue et le rsidu (et ) qui, lui, est connu.
1) Cas particulier
Si nous raisonnons sur des donnes centres, lestimateur de a peut scrire en
fonction des matrices des variances et covariances empiriques :
1

a1 Var(x1 ) Cov(x1 , x2 ) Cov(x1 , x3 ) . . . Cov(x1 xk )

a Cov(x2 , x1 ) Var(x2 ) Cov(x2 , x3 ) . . . Cov(x2 , xk )
2
= . . . Cov(x3 , xk )
a3 Cov(x3 , x1 ) Cov(x3 , x2 ) Var(x3 )
... ...

ak Cov(xk , x1 ) Cov(xk , x2 ) Cov(xk , x3 ) . . . Var(xk )

Cov (x1 ,y)

Cov(x2 , y)

Cov(x3 , y)
...
Cov(xk , y)
avec a0 = y
a1 x 1
a2 x 2 . . .
ak x k .
Que sont des donnes centres sur la moyenne ? Soit xt une variable connue
sur n observations et x sa moyenne, nous pouvons calculer une nouvelle variable

n
n
(X t = xt x) dont la somme est par construction nulle : (xt x) = Xt = 0 .
t=1 t=1
Nous avons donc X = 0 .
2) Effet de la variation dune seule des variables explicatives

Soit le modle estim : yt =
a0 +
a1 x1t +
a2 x2t + . . . +
ak xkt + et .
50 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 51
Si la variable x2 passe de la valeur x2t (x2t + x2t ) , toutes choses tant

gales par ailleurs (les k 1 autres variables restant constantes), alors la
a2 x2 : yt =
variable expliquer varie de a2 x2t .
Les coefficients sinterprtent donc directement en terme de propension mar-
ginale.
B. Hypothses et proprits des estimateurs

Par construction, le modle est linaire en X (ou sur ces coefficients) et nous dis-
tinguons les hypothses stochastiques (lies lerreur ) des hypothses struc-
turelles.
1) Hypothses stochastiques
H1 : les valeurs xi, t sont observes sans erreur.

H2 : E(t ) = 0 , lesprance mathmatique de lerreur est nulle.
H3 : E(t2 ) = 2 , la variance de lerreur est constante (t) (homoscdasticit).
H4 : E(t t ) = 0 si t = t , les erreurs sont non corrles (ou encore ind-
pendantes).
H5 : Cov(xit , t ) = 0 , lerreur est indpendante des variables explicatives.
2) Hypothses structurelles
H6 : absence de colinarit entre les variables explicatives, cela implique

que la matrice (X X) est rgulire et que la matrice inverse (X X)1
existe.
H7 : (X X)/n tend vers une matrice finie non singulire.
H8 : n > k + 1, le nombre dobservations est suprieur1 au nombre des
sries explicatives.
3) Proprits des estimateurs
Considrons les proprits de lestimateur [3].

Le modle sous forme matricielle peut scrire, comme pour le modle de
rgression simple, de diffrentes manires :
1. Dans le cas dune galit, nous aurions un systme de n quations n inconnues, donc parfai-
tement dtermin.

9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 52
Y = Xa +
Y = X
a+e (e = rsidu)
e =Y Y
= X
Y a
Nous obtenons :

a = (X X)1 X Y = (X X)1 X (Xa + )

a = (X X)1 X (Xa) + (X X)1 X [4]

a = a + (X X)1 X
a ) = a + (X X)1 X E() = a
do E( car E() = 0
Lestimateur est donc sans biais : a) = a
E(
Calculons maintenant la matrice des variances et covariances des coefficients

de rgression a .
a = E{( a a) }
a a)(
Or, daprs [4], (

a a) = (X X)1 X et (
a a) = X (X X)1 puisque
(X X) est symtrique .
1 1
(
a a)(
a a) = (X X)1 X X (X X)1 do
a = (X X)1 X E( )X (X X)1 avec E( ) = = 2 I = matrice des

variances et covariances de lerreur .
En effet, daprs les hypothses H3 et H4 nous avons :

E(1 1 ) E(1 2 ) ... E(1 n )

= E( ) = E(2 1 ) E(2 2 ) ... E(2 n ) =
...
E(n 1 ) E(n 2 ) . . . E(n n )

2 0 0 ... 0

= 0 2 0 ... 0
...
0 0 0 . . . 2
Soit : a = 2 (X X)1 X X (X X)1
a = 2 (X X)1 [5]
1. Nous rappelons quelques rgles du calcul matriciel : (ABC) = C B A et si A est symtrique

A = A et donc [(X X)1 ] = (X X)1 .
52 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 53
1
2 XX
a = Lim a = 0 si n (daprs les hypothses H3
n n
et H7). Lestimateur est donc convergent.
Thorme de Gauss-Markov : Lestimateur [3] des moindres carrs est qua-
lifi de BLUE (Best Linear Unbiaised Estimator), car il sagit du meilleur esti-
mateur linaire sans biais (au sens quil fournit les variances les plus faibles pour
les estimateurs).
Il est noter que lestimateur du maximum de vraisemblance des paramtres
fournit des rsultats identiques ceux de lestimateur des MCO si lhypothse
de normalit des erreurs est vrifie.
Aprs un calcul matriciel1, il apparat que nous pouvons estimer sans biais
par :
2
e e

2 = [6]
nk1
En remplaant la variance de lerreur par son estimateur, nous obtenons :
a =
2 (X X)1 [7]
4) Le thorme de Frisch, Waugh et Lovell (FWL)
Supposons que les variables explicatives soient spares en deux groupes repr-
sents par les matrices X 1 et X 2 . Le modle scrit : Y = X 1 a1 + X 2 a2 + .
Le thorme de FWL nous dit que lestimateur des MCO du paramtre a2 et
des rsidus sont les mmes que ceux du modle : M1 Y = M1 X 2 a2 + v avec
M1 = I X 1 (X 1 X 1 )1 X 1 .
La matrice M1 est symtrique et idempotente (M1 M1 = M1 ) , de plus
M1 X 1 = 0 .
Ce thorme permet de bien comprendre le problme de la spcification dun
modle : si une variable Y est effectivement explique par le groupe de variables
X 1 et X 2 , il faut imprativement faire figurer dans le modle ces deux groupes
de variables mme si seul le groupe de variables X 1 nous intresse.
1. Voir dmonstration en annexe C.

9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 54
C. quation danalyse de la variance

et qualit dun ajustement
Comme pour le modle de rgression simple, nous avons :

a) yt = yt y =
y
t t

b) et = 0
t
De ces deux relations, nous en dduisons lquation fondamentale danalyse

de la variance :

(yt y)2 = yt
( y)2 + et2
t t t [8]
SC T = SC E + SC R
La variabilit totale (SCT) est gale la variabilit explique (SCE) + la

variabilit des rsidus (SCR).
Cette quation va nous permettre de juger de la qualit de lajustement dun
modle ; en effet, plus la variance explique est proche de la variance tota-
le, meilleur est lajustement global du modle. Cest pourquoi nous calculons le
rapport SCE sur SCT :

(
yt y)2 et2
R2 = =1
t t
[9]
(yt y)2 (yt y)2
t t
R 2 est appel le coefficient de dtermination, et R le coefficient de corrla-

tion multiple. R 2 mesure la proportion de la variance de Y explique par la
rgression de Y sur X .
Dans le cas de donnes centres (moyenne nulle) et seulement dans ce cas,
le coefficient de dtermination est gal :
Y
Y e e
R2 = = 1 [10]
Y Y Y Y
Cette qualit de lajustement et lapprciation que lon a du R 2 doivent tre

tempres par le degr de libert de lestimation. En effet, lorsque le degr de
54 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 55
libert est faible1, il convient de corriger le R 2 afin de tenir compte du relative-

ment faible nombre dobservations compar 2
au nombre de facteurs explicatifs
par le calcul dun R 2 corrig not R :
2 n1
R =1 (1 R 2 ) [11]
nk1
2 2
On a R < R 2 et si n est grand R R 2 .
Nous verrons au chapitre 4 section IV deux critres (Akaike et Schwarz) per-
mettant darbitrer, lors de lintroduction dune ou plusieurs variables explica-
tives, entre la perte de degrs de libert et lapport dinformation.
Exercice n 1
fichier C3EX1
Mise sous forme matricielle dun modle et calcul des coefficients

de rgression
Soit le modle trois variables explicatives :
yt = a0 + a1 x1t + a2 x2t + a3 x3t + t
Nous disposons des donnes du tableau 1.

1) Mettre le modle sous forme matricielle en spcifiant bien les dimensions de cha-
cune des matrices.
2) Estimer les paramtres du modle.
3) Calculer lestimation de la variance de lerreur ainsi que les carts types de chacun
des coefficients.
2
4) Calculer le R 2 et le R corrig.
1. Dans le cas dun modle o le nombre dobservations est gal au nombre de variables explica-
tives (degr de libert = 0 ), le R 2 = 1 . Cependant, le pouvoir explicatif de ce modle est nul.

9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 56
Tableau 1 Valeurs observes de y , x1 , x2 et x3

t y x1 x2 x3
1 12 2 45 121
2 14 1 43 132
3 10 3 43 154
4 16 6 47 145
5 14 7 42 129
6 19 8 41 156
7 21 8 32 132
8 19 5 33 147
9 21 5 41 128
10 16 8 38 163
11 19 4 32 161
12 21 9 31 172
13 25 12 35 174
14 21 7 29 180
Solution
1) Forme matricielle
Nous disposons de 14 observations et trois variables explicatives, le modle peut
donc scrire :
Y = Xa + avec :
1
12 1 2 45 121 2
14 1 1 43 132 a0 .
.
a .
Y = 10 ; X = 1 3 43 154 ; a =
1
a2 ; = t
.. .. .. .. ..
.
. . .
. . .
a3 ..
21 1 7 29 180
14
Dimensions :
(14,1) (14,4) (4,1) (14,1)
2) Estimation des paramtres

a = (X X)1 X Y .
Nous savons daprs [3] que
Calcul de X X et de (X X)1
X X

1 2 45 121
1 1 1 ... 1 1 1 43 132
2 ... 7
1 3 1 154
45 3 43 =
43 43 . . . 29 .. .. .. ..
. . . .
121 132 154 . . . 180
1 7 29 180

14 85 532 2 094
85 631 3 126 13 132
=
532

3 126 20 666 78 683
2 094 13 132 78 683 317 950
56 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 57

20,16864 0,015065 0,23145 0,07617
0,015065 0,013204 0,001194 0,00094
(X X)1
=
0,23145 0,001194 0,003635 0,000575
0,07617 0,00094 0,000575 0,000401
Calcul de X Y
X Y
12
1 1 1 ... 1 14 248
2 7
1 3 ... 1 622
45 10 =
43 43 ... 29 .. 9 202
.
121 132 154 ... 180 37 592
21
Calcul de
a
(X X)1

X Y

20,16864 0,015065 0,23145 0,07617 248
0,015065 0,013204 0,001194 0,00094
1 622 =
a
0,23145 0,001194 0,003635 0,000575 9 202
0,07617 0,00094 0,000575 0,000401 37 592

32,89132
0,801900
= 0,38136

0,03713
Soit
a0 = 32,89 ;
a1 = 0,80 ;
a2 = 0,38 ;
a3 = 0,03
Les calculs que nous venons de dvelopper sont longs et fastidieux et mettent en vi-
dence lintrt incontestable dutiliser un ordinateur.
3) Calcul de
2 et de
a2
e e
Daprs [6]
2 = , nous devons donc calculer le rsidu e .
nk1
e =Y Y = Y X a
Soit a0 +
et = yt ( a1 x1t +
a2 x2t +
a3 x3t )
et = yt 32,89 0,80 x1t + 0,38 x2t + 0,03 x3t
Par exemple pour e1 :
e1 = y1 32,89 0,80 x11 + 0,38 x21 + 0,03 x31
e1 = 12 32,89 0,80 2 + 0,38 45 + 0,03 121 = 0,84
Le tableau 2 prsente lensemble des rsultats.
Par construction, la somme des rsidus est bien nulle.

t=14
et2
e e t=1 67,45

2 = = = = 6,745
nk1 14 3 1 10

9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 58
Tableau 2 Calcul du rsidu
t
. yt
yt et et2
1 12 12,84 0,84 0,71

2 14 12,39 1,61 2,58
3 10 13,18 3,18 10,11
4 16 13,39 1,61 2,58
5 14 17,70 3,70 13,67
6 19 17,88 1,12 1,26
7 21 22,20 1,20 1,44
8 19 18,86 0,14 0,02
9 21 16,51 4,49 20,14
10 16 18,76 2,76 7,63
11 19 17,92 1,08 1,17
12 21 21,90 0,90 0,81
13 25 22,71 2,29 5,27
14 21 20,76 0,24 0,06
Somme 0 67,45
La matrice des variances et covariances estimes des coefficients nous est donne
par [7], soit :
a =
2 (X X)1

20,16864 0,015065 0,23145 0,07617
0,015065 0,013204 0,001194 0,00094
a = 6,745

0,23145 0,001194 0,003635 0,000575
0,07617 0,00094 0,000575 0,000401
Les variances des coefficients de rgression se trouvent sur la premire diagonale :

a20 = 6,745 20,17 = 136,04
a 0 = 11,66

a21 = 6,745 0,013 = 0,087
a1
= 0,29

a2

2
= 6,745 0,0036 = 0,024
a2
= 0,15

a3

2
= 6,745 0,0004 = 0,0026
a3
= 0,05
4) Le calcul du R 2 est effectu partir de la formule [9].

Nous connaissons e e = 67,45 , il convient de calculer (yt y)2 = 226,86 .
t
et2
67,45
R =1
t
2
=1 = 0,702
(yt y) 2 226,86
t
2
Le R corrig est donn par [11] :
2 n1 14 1
R =1 (1 R 2 ) = 1 (1 0,702) = 0,613
nk1 14 4
58 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 59
Nous observons la baisse du coefficient de dtermination lorsque nous le corrigeons

par le degr de libert.
III. Les tests statistiques

A. Le rle des hypothses
Lhypothse de normalit des erreurs implique1 que :

n
et2

2
a2i
= (n k 1) 2 = (n k 1) 2
t=1
[12] suit une loi du 2 (chi-deux)
2 ai
n k 1 degrs de libert (somme au carr de n k 1 variables alatoires ind-
pendantes normales centres rduites).
Il en rsulte que :
ai ai
(lcart type thorique est remplac par lcart type empirique) suit

ai
une loi de Student n k 1 degrs de libert.

ai ai

ai ai ai
En effet, = est le rapport dune loi nor-

ai a2i 1
(n k 1) 2
ai (n k 1)
male centre rduite la racine carre dun chi-deux divis par son degr de
libert.
a a) a1
( (
a a) suit une loi du 2 (chi-deux) k + 1 degrs de libert
(somme au carr de k + 1 variables alatoires normales centres rduites, les
k + 1 coefficients).
Si on remplace la matrice des variances covariances thoriques des coefficients, par
a = 1 a1
son estimateur 2 (X X)1 , la loi de probabilit de (
a a) (
a a)
k+1
est alors un Fisher k + 1 et n k 1 degrs de libert.
1. Lensemble de ces rsultats sont une gnralisation k variables explicatives des rsultats pr-
sents au chapitre 2, paragraphe III.B.

9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 60
1 1
a a) 2 (X X )1 (
( a a)
k + 1
En effet, F = est le rapport de deux

2 1
(n k 1) 2
(n k 1)
chi-deux diviss par leurs degrs de libert (caractristique dune loi de Fisher
k + 1 et n k 1 degrs de libert).
B. Construction des tests

partir des diffrentes relations dfinies ci-dessus, nous pouvons mettre en
place un certain nombre de tests statistiques que nous allons expliciter.
1) Comparaison dun paramtre ai une valeur fixe a

Le test dhypothses est le suivant :
H0 : ai = a
H1 : ai = a
Nous savons que :

ai ai
suit une loi de Student n k 1 degrs de libert.

ai
Sous lhypothse H0, cette relation devient1 :
|
ai a|
= tai loi de Student n k 1 degrs de libert [13]

ai
/2
Si tai > tnk1 alors nous rejetons lhypothse H0, ai est significativement
diffrent de a (au seuil de ).
/2
Si tai tnk1 alors nous acceptons lhypothse H0, ai nest pas significati-
vement diffrent de a (au seuil de ).
Cas particulier : test par rapport une valeur particulire a = 0 .
Si nous dsirons savoir si une variable explicative figurant dans un modle
est rellement significativement contributive pour expliquer la variable endo-
gne, il convient de tester si son coefficient de rgression est significativement
diffrent de 0 pour un seuil choisi, en gnral = 5 %.
1. Comme il sagit dun test bilatral, on calcule la valeur absolue du t empirique.
60 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 61
La relation [13], sous H0 ( ai = 0 ), devient :

ai = t loi de Student n k 1 degrs de libert [14]

ai
ai
tai est appel le ratio de Student, les rgles de dcision cites plus haut sappli-
quent alors.
Ce test est trs important ; en effet, si dans un modle estim, un des coeffi-
cients (hormis le terme constant) nest pas significativement diffrent de 0, il
convient dliminer cette variable1 et de r-estimer les coefficients du modle.
La cause de cette non-significativit, est due :
soit une absence de corrlation avec la variable expliquer,
soit une colinarit trop leve avec une des variables explicatives.
2) Comparaison dun ensemble de paramtres

un ensemble de valeurs fixes
Nous cherchons tester simultanment lgalit dun sous-ensemble de coeffi-

cients de rgression des valeurs fixes.
H0 : aq = a q
H1 : aq = a q
q tant le nombre de coefficients retenus, cest--dire la dimension de chacun

des vecteurs aq .
1 a1
Nous avons dmontr que (
a a) (
a a) suit une loi de Fisher
k+1
k + 1 et n k 1 degrs de libert ; pour un sous-ensemble de paramtres q,
1 a1
lexpression ( aq aq ) q,q (
aq aq ) suit alors une loi de Fisher q et
q
n k 1 degrs de libert.
Pour accepter H0, il suffit que :
1 a1
aq a q )
( aq a q ) F (q, n k 1)
q,q ( [15]
q
F (q, n k 1) = loi de Fisher au seuil q et n k 1 degrs de libert.
1. En effet, elle napporte aucune contribution et dgrade lestimation des autres variables.

9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 62
3) Intervalle de confiance de la variance de lerreur
Lintervalle de confiance de la variance de lerreur permet de dterminer une

fourchette de variation de lamplitude de lerreur. Pour un intervalle (1 ) %,
il est donn par :

(n k 1)
2 (n k 1)
2
IC = ; [16]
1
2
2
2
Avec 12 n k 1 degrs de libert et /2 de probabilit1 dtre dpasse

et 22 n k 1 degrs de libert et (1 /2) de probabilit dtre
dpasse.
C. Tests sur les rsidus : valeur anormale, effet de levier

et point dinfluence
Nous nabordons pas ici les tests sur les rsidus remettant en cause les hypo-
thses dhomoscdasticit ou dindpendance, qui sont traits au chapitre 5,
mais trois notions qui sont proches et nanmoins diffrentes dans leur cons-
quence sur lestimation des paramtres du modle et leurs prcisions.
1) La matrice HAT
La matrice HAT2 , note H, joue un rle essentiel dans la dtection de leffet

de levier.
Nous calculons la matrice HAT H = X (X X )1 X .
Les lments de la premire diagonale de cette matrice H sont appels les
leviers, qui dterminent linfluence de lobservation i sur les estimations obte-
nues par la rgression.
Le levier est situ sur la premire diagonale de cette matrice soit
h i = xi (X X )1 xi
n
Deux proprits : 0 h i 1 et h i = k + 1 , la somme des lments de
i =1
la premire diagonale de la matrice H est gale au nombre de paramtres esti-
ms du modle.
1. Attention, la loi du chi-deux nest pas symtrique, il convient donc de lire sur la table les deux
probabilits 1 /2 et /2 .
2. Cette matrice permet de passer du vecteur Y au vecteur Y do le nom de matrice HAT (chapeau
en anglais), en effet nous avons Y = X a = X (X X )1 X Y = H Y .
62 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 63
Si chaque observation pse le mme poids, alors les valeurs des h i doivent
k+1
tre proches de .
n
k+1
Le levier dune observation i est donc anormalement lev si : h i > 2 ,
n
lobservation est alors considre comme un point de levier (leverage point) ou
point dinfluence.
2) Point de levier et valeur anormale
Une observation exerce un effet de levier si elle est loigne des autres en
termes de combinaison des variables explicatives ; cest--dire que les valeurs
prises par les variables explicatives, pour cette observation de la variable expli-
quer, sont inattendues. Par exemple, un pays dont la population est faible mais
le PIB lev, chaque facteur explicatif pris individuellement nest pas surpre-
nant, mais la survenance de deux valeurs la fois pour un pays est insolite.
Le point dinfluence est une observation qui contribue trs fortement au pou-
voir explicatif du modle (sans cette valeur la rgression peut tre non signifi-
cative !), lobservation pse de manire exagre dans la rgression, au point
que les rsultats obtenus sont trs diffrents selon que nous lintgrons ou non
dans la rgression.
La valeur prise par la variable explicative est anormale si le rsidu de cette
observation est beaucoup plus lev que les autres rsidus, pour identifier une
valeur anormale nous pouvons calculer le rsidu standardis (ou encore appel
le rsidu studentis). Une autre approche permettant de dtecter des valeurs
anormales laide de variables indicatrices sera prsente dans ce chapitre la
section V.
3) Rsidu standardis (ou studentis)
Les rsidus standardiss1 nots eiS permettent de dtecter des valeurs anor-
males. Le rsidu ei est divis par son cart type estim pondr par le levier2 :
ei
eiS = suit une loi de Student n k 1 degrs de libert, avec
1 h
e i

ei2
t
e = . Si, par exemple, les rsidus standardiss eiS sont compris
nk1
0,025
dans lintervalle tnk1 , on ne suspecte pas de valeurs anormales pour un seuil
de confiance 95 %.
1. Dans cette mthode de calcul nous parlons de rsidus studentiss internes car le calcul porte sur
lensemble des observations. ei
2. Certains auteurs divisent le rsidu par son cart type eiS = sans intgrer la valeur du levier.
e

9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 64
Il est aussi possible de calculer des rsidus studentiss externes, ils sont cal-
culs de la mme manire mais en excluant du calcul lobservation i.
Exercice n 2
fichier C3EX1
Tests statistiques sur les coefficients et la variance de lerreur : calcul

des leviers et des rsidus studentiss
En reprenant les donnes du tableau 1 et les rsultats de lexercice 1, on demande de
rpondre aux questions suivantes :
1) Les variables explicatives sont-elles significativement contributives pour expliquer
la variable endogne ?
3) Les coefficients a1 et a2 sont-ils simultanment et significativement diffrents de
1 et 0,5 ?
4) Quel est lintervalle de confiance pour la variance de lerreur ?
5) Calculer les leviers et les rsidus standardiss, existe-t-il des valeurs aberrantes ?
(Les seuils choisis seront de 5 %.)
Solution
1) Il convient de calculer les trois ratios de Student et de les comparer la valeur lue
dans la table pour un seuil de 5 % (la table de Student en fin douvrage indique direc-
tement les valeurs de pour un test bilatral).
Daprs [14], nous obtenons :

a1 0,80
= = 2,75 > t10 = 2,228 a1 = 0 , la variable explicative x 1 est
= ta1 0,05

a1
0,29
contributive lexplication de y ; de mme :

a2 0,38
= = t = 2,53 > t 0,05 = 2,228 a2 = 0

a2
0,15
a2 10

a3 0,03

= = t = 0,60 < t 0,05 = 2,228 a3 = 0

a3
0,05
a3 10
la variable x2 est explicative de y alors que la variable x3 nest pas contributive

lexplication de y , il convient donc de la retirer de ce modle et de procder une nou-
velle estimation.
Nous aurions pu tout aussi bien rpondre cette question en calculant les intervalles
de confiance de chacun des coefficients :
64 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 65
I Ca1 = 0,05
a1 tnk1
a1
= 0,80 2,228 0,29 = [0,14 ; 1,45]
De mme nous obtenons :
I Ca2 = [0,71 ; 0,04] et I Ca3 = [0,14 ; 0,08]
La valeur 0 nappartient pas lintervalle de confiance 95 % de a1 et a2 , donc ces

deux coefficients sont significativement diffrents de 0 ; en revanche, 0 appartient lin-
tervalle de confiance de a3 , ce coefficient nest pas significativement diffrent de 0.
2) Nous posons le test dhypothses suivant :
H0 : a1 = 1
H1 : a1 < 1
Sous H0, la relation [13] scrit :

a1 a1 0,80 1
= = 0,68 > t10
0,05
= 1,811 acceptation de H0

a1
0,29
Nous sommes bien dans la zone dacceptation de H0 (cf. graphique 4 du chapitre 2).
Par souci de simplification, nous pouvons procder au test de Student en profitant
de la symtrie de cette loi, soit calculer :
a1 a1 |
| |0,80 1|
= = 0,68 < t10
0,05
= 1,81 acceptation de H0

a1
0,29
Le fait de raisonner sur la valeur absolue du numrateur entrane une lecture direc-
te de la table et ainsi une construction et interprtation immdiate du test.
3) Le test dhypothses est le suivant :

a1 1
H0 : =
a2 0,5

a1 1
H1 : =
a2 0,5
Examinons les diffrents lments de la relation [15] sous H0 :

1 1 (
aq aq )
( aq aq )
aq
q

0,80 1
Nous avons : q = 2 , aq = et aq = . La matrice des variances
0,38 0,5
et covariances des coefficients a t calcule lors de lexercice 1, nous ne retenons que
la sous-matrice de dimension 2 2 correspondant aux deux coefficients de rgression
faisant lobjet du test.

aq = 6,745 0,013204 0,001194 1 = 11,57140 3,80213

0,001194 0,003635 aq
3,80213 42,03506
1. Attention, le test est unilatral, il convient de lire sur la table de Student tabule pour /2 un
seuil de 0,10 = 2 0,05 .

9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 66

1 11,57140 3,80213 0,80 1
F = (0,80 1; 0,38 + 0,5)
2 3,80213 42,03506 0,38 + 0,5
F = 0,612 est comparer F (q, n k 1) = F2,100,05

= 4,10 , le F empirique est
infrieur au F lu dans la table, on accepte lhypothse H0. Les donnes ne sont pas
incompatibles avec la possibilit que les coefficients a1 et a2 soient simultanment et
respectivement gaux 1 et 0,5.
4) Lintervalle de confiance de la variance de lerreur un seuil (1 )% = 95%

( = 0,05) est calcul partir de la formule [16] pour 10 degrs de libert :

(n k 1)
2 (n k 1) 2 10 6,745 10 6,745
IC = ; = ;
0,025
2
0,975
2
20,48 3,25
Soit 3,30 2 20,75. La variance vraie (mais inconnue) 2 de lerreur a 95 % de

chance de se situer lintrieur de cet intervalle.
5) Le calcul de h i et des rsidus standardiss sont effectus laide du programme
C3EX2.PRG. Les rsultats sont prsents sur le tableau 3.
Tableau 3 Valeur des leviers hi et des rsidus standardiss eiS
Rsidus
i ei hi eiS
1 0,8408 0,2790 0,3813
2 1,6068 0,2966 0,7377
3 3,1800 0,3091 1,4732
4 1,6055 0,3248 0,7523
5 3,6973 0,2609 1,6559
6 1,1220 0,1825 0,4778
7 1,2015 0,5327 0,6768
8 0,1426 0,2025 0,0615
9 4,4880 0,1804 1,9088
10 2,7622 0,1442 1,1497
11 1,0830 0,3066 0,5008
12 0,8994 0,2115 0,3900
13 2,2946 0,4086 1,1489
14 0,2387 0,3605 0,1149
k+1 4
Le seuil du levier est gal 2 =2 = 0,57 , aucune valeur nest suprieure
n 14
0,57, nous ne dtectons pas de point de levier (ou de point dinfluence).
0,025
Les rsidus studentiss sont tous dans lintervalle t10 = 2,228, nous ne dtec-
tons pas de valeur anormale.
66 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 67
IV. Lanalyse de la variance

A. Construction du tableau danalyse de la variance
et test de signification globale dune rgression
Dans cette section, nous allons nous interroger sur la signification globale du
modle de rgression, cest--dire si lensemble des variables explicatives a une
influence sur la variable expliquer. Ce test peut tre formul de la manire
suivante : existe-t-il au moins une variable explicative significative ? Soit le test
dhypothses :
H0 : a1 = a2 = . . . = ak = 0 (tous les coefficients sont nuls1)
H1 : il existe au moins un des coefficients non nul
Nous ne testons pas le cas o le terme constant a0 est nul, car seules nous
intressent les variables explicatives. Un modle dans lequel seul le terme
constant est significatif na aucun sens conomique.
Le cas o lhypothse H0 est accepte signifie quil nexiste aucune relation
linaire significative entre la variable expliquer et les variables explicatives (ou
encore que la Somme des Carrs Expliqus nest pas significativement diffren-
te de 0).
Nous reprenons lquation fondamentale [8] danalyse de la variance :

(yt y)2 = (
yt y)2 + et2
t t t
La rgression est juge significative si la variabilit explique est signi-

ficativement diffrente de 0. Le tableau 4 prsente le tableau danalyse de la
variance2 permettant deffectuer le test de Fisher.

(
yt y)2 /k
R 2 /k
F = 2 =
t
(daprs [9])
et /(n k 1) (1 R 2 )/(n k 1)
t
[17]
1. Nous remarquons que nous pouvons rpondre cette question par le test dun sous-ensemble
de coefficients [15], le test ici prsent conduit videmment des rsultats identiques.
2. Voir chapitre 2, paragraphe 4, pour la construction de ce tableau.

9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 68
Tableau 4 Analyse de la variance pour une rgression multiple
Source de variation Somme des carrs Degr de libert Carrs moyens

. x1 , x2 ,. . . , xk SC E = (
yt y)2 k SC E/k
t

Rsidu SC R = et2 nk1 SC R/(n k 1)
t

Total SC T = (yt y)2 n1
t
Lhypothse de normalit des erreurs implique que sous lhypothse H0, F

suit une loi de Fisher (rapport de deux chi-deux). Nous comparons donc ce F
calcul au F thorique k et (n k 1) degrs de libert : si F > F nous reje-
tons lhypothse H0, le modle est globalement explicatif.
Dans la pratique, ce test est effectu immdiatement grce la connaissance
du coefficient de dtermination R 2 (seulement si le modle comporte un terme
constant) qui permet de calculer le Fisher empirique (calcul).
B. Autres tests partir du tableau danalyse

de la variance
partir dun exercice, nous allons prsenter quatre tests usuels se rfrant
lanalyse de la variance, la gnralisation de ces tests ne posera par la suite aucu-
ne difficult au lecteur.
1) Introduction dune ou de plusieurs variables explicatives

supplmentaires
Lajout dun bloc supplmentaire de variables explicatives amliore-t-il signifi-
cativement la qualit de lajustement ?
2) Stabilit des coefficients du modle dans le temps (test de CHOW)

Peut-on considrer le modle comme tant stable sur la totalit de la priode, ou
bien doit-on considrer deux sous-priodes distinctes destimation (changement
structurel du modle) ? La spcification du modle est la mme, mais les valeurs
estimes des coefficients pour les deux chantillons sont diffrentes.
3) Test de restrictions et de contraintes sur les coefficients

Les contraintes souhaites ou envisages sur les coefficients sont-elles justifies
et valides par lestimation conomtrique ?
68 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 69
4) Augmentation de la taille de lchantillon servant estimer le modle

Lorsque la taille de lchantillon aug mente (le nombre dobservations dispo-
sition est plus important), le modle reste-t-il stable ? Ce test se ramne au test
de Chow de stabilit des coefficients sur deux sous-priodes. Lestimation sur la
sous-priode 1 est effectue partir de lchantillon initial et lestimation de la
sous-priode 2 partir des nouvelles observations.
Nous voyons lintrt pratique de ces tests et lapport pour lconomiste des
rponses ces questions.
Exercice n 3
fichier C3EX1
Tests partir de lanalyse de la variance
En reprenant les donnes de lexercice 1 (tableau 1), dont nous rappelons les rsul-
tats de lestimation du modle1 :
yt = 32,89 + 0,80 x1t 0,38 x2t 0,03 x3t + et

(11,66) (0,29) (0,15) (0,05)
R 2 = 0,702
n = 14
() = cart type des coefficients
on demande de tester les hypothses suivantes.
1) Lajout des variables explicatives x2 et x3 amliore-t-il significativement la qualit de
lestimation par rapport x1 seul ?
2) Peut-on considrer le modle ( trois variables explicatives) comme stable sur len-
semble de la priode, ou doit-on procder deux estimations, lune de la priode 1
7, et lautre de la priode 8 14 ?
3) Un conomiste suggre que dans ce modle a1 = 1 et a2 = a3 , quen pensez-vous ?
Solution2
Nous pouvons tout dabord appliquer le test de Fisher [17] afin de tester la signifi-
cation globale de la rgression trois variables x1 , x2 et x3 .
R 2 /k 0,702/3
F = = = 7,878 > F3,10
0,05
= 3,71
(1 R 2 )/(n k 1) (1 0,702)/10
1. Le lecteur notera la prsentation standard des rsultats destimation dun modle. Les infor-
mations listes ici doivent imprativement figurer. noter que le t de Student est souvent indi-
qu la place de lcart type des coefficients afin de pouvoir, sans aucun calcul, procder aux
tests de significativit des coefficients.
2. Les calculs sont effectus partir dun logiciel, il peut apparatre de lgres diffrences entre
les calculs manuels et les rsultats, imputables au fait que le logiciel tient compte dun nombre
lev de dcimales.

9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 70
Nous rejetons lhypothse H0 de nullit de tous les coefficients, la rgression est

globalement significative.
1) Test dajout de variables
tape 1 : calcul de la variabilit totale, explique et rsiduelle sur le modle complet.

Les rsultats calculs prcdemment lors de lexercice 1 nous ont donn :

SC T = (yt y)2 = 226,86 ; SC E = ( yt y)2 = 159,41 ;
t t SC R = e e = 67,45
tape 2 : calcul de la variabilit totale, explique et rsiduelle sur le modle une seule
variable explicative x1 .
Le modle estim est le suivant :
yt = 1,011x1,t + 11,57 + et
(0,281)
n = 14
R 2 = 0,52
(.) = Ecart type

= 3,0165
Nous calculons dabord

SC R 1 = e e = d.d.l.
2 = 12 3,01652 = 109,20
puis partir du coefficient de dtermination R 2 , nous dduisons :
SC T 1 = 226,86 et SC E 1 = 117,65
H0 : a2 = a3 = 0
H1 : il existe au moins un des deux coefficients non nul.
Ce test se ramne un test par analyse de la variance : le fait dajouter des variables
explicatives dans un modle entrane automatiquement une augmentation1 de SCE
(et donc une diminution de SC R ) ; on souhaite donc tester que la diffrence entre SCE
et SC E 1 soit significativement positive (ou bien que la diffrence entre SC R 1 et SC R
soit significativement positive, il sagit du mme test). On compare donc la diffrence
par rapport la somme des carrs la plus faible, soit ici SC R . Le tableau 5 danalyse de
la variance permet de procder au test de Fisher.
tape 3 : tableau danalyse de la variance.

Tableau 5 Tableau danalyse de la variance pour tester lajout
dun bloc de variables explicatives

x1 SC E 1 = 117,65 1 117,65
x1 , x2 , x3 SC E = 159,41 3 53,14
Rsidu SC R = 67,45 10 6,74
Total SC T = 226,85 13
1. Sauf si la ou les variables ajoutes sont orthogonales la variable expliquer, SC E reste alors
identique. Ce cas est videmment rare.
70 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 71
tape 4 : calcul du Fisher empirique.

(SC E SC E 1 )/(k k ) 41,67/(3 1)
F = = = 3,09 < F2,10
0,05
= 4,10
SC R/(n k 1) 67,45/10
(SC R 1 SC R)/(k k ) (109,2 67,45)/2

Ou encore : F : = = 3,09
SC R/(n k 1) 67,45/10
Avec k = nombre de variables explicatives du modle complet et k = nombre de
variables explicatives du modle sans lajout du bloc de variables. Nous acceptons lhy-
pothse H0, il ny a donc pas de diffrence significative entre les deux variances expli-
ques, lajout des variables explicatives x2 et x3 namliore pas de manire significati-
ve au seuil de 5 % le pouvoir explicatif du modle.
2) Le modle est-il stable sur la totalit de la priode ?
Soit le modle estim sur une seule priode :
yt =
a1 x1t +
a2 x2t +
a3 x3t +
a0 + et pour t = 1, . . . , 14
ou le modle estim sur deux sous-priodes :
yt =
a11 x1t +
a21 x2t +
a31 x3t +
a01 + et pour t = 1, . . . , 7
yt =
a12 x1t +
a22 x2t +
a32 x3t +
a02 + et pour t = 8, . . . , 14
Le test dhypothses jointes est alors le suivant :

a = a1 = a2
1 1 1
a2 = a 1 = a 2
2 2
H0 :
a3 = a31 = a32
a0 = a01 = a02
Ce test de stabilit des coefficients (test de Chow) se ramne la question suivante :
existe-t-il une diffrence significative entre la somme des carrs des rsidus (SC R) de
lensemble de la priode et laddition de la somme des carrs des rsidus calcule par-
tir des deux sous-priodes (SC R 1 + SC R 2 ) ?
En effet, dans le cas dune rponse ngative, cela signifie que le fait de scinder en
deux chantillons namliore pas la qualit du modle, donc quil est stable sur la tota-
lit de la priode.
Les tapes sont alors les suivantes.
tape 1 : estimation du modle sur chacune des deux sous-priodes1 et calcul des
sommes des carrs de rsidus.
sous-priode 1 : donnes de 1 7
yt = 0,774x1,t 0,293x2,t 0,012x3,t + 25,27 + et

(0,53) (0,31) (0,10)
n = 7
R 2 = 0,692
(.) = Ecart type

= 3,01759
1. Les deux sous-priodes peuvent tre de longueur ingale, cependant elles doivent imprative-
ment recouvrir la totalit des observations de la priode.

9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 72
Nous pouvons en dduire comme prcdemment :

SC T 1 = 88,85 ; SC E 1 = 61,54 ; SC R 1 = 27,31
sous-priode 2 : donnes de 8 14
yt = 1,228x1,t 0,620x2,t 0,184x3,t + 62,63 + et

(0,69) (0,52) (0,15)
n = 7
R 2 = 0,543
(.) = Ecart type

= 2,6281
Do SC T 2 = 45,43 ; SC E 2 = 24,70 ; SC R 2 = 20,73.

tape 2 : calcul du Fisher empirique.
En prenant au dnominateur la plus faible des sommes des carrs (soit
SC R 1 + SC R 2 ) , le Fisher empirique est gal :
[SC R (SC R 1 + SC R 2 )]/ddln

F =
(SC R 1 + SC R 2 )/ddld
avec ddln = (n k 1) [(n 1 k 1) + (n 2 k 1)] = k + 1 = 4

car n = n 1 + n 2
ddld = (n 1 k 1) + (n 2 k 1) = n 2(k + 1) = 6
do
[(67,45 (27,31 + 20,73))]/4 4,852
F = = ; 6 = 4,53
= 0,606 < F40,05
(27,31 + 20,73)/6 8,00
Lhypothse H0 est accepte, les coefficients sont significativement stables sur len-
semble de la priode.
Attention, en cas dhtroscdasticit (cf. chapitre 5), le test de Chow est biais dans
le sens dune surestimation du seuil de rejet du test, nous rejetons trop souvent lhypo-
thse H0.
3) Test de a1 = 1 et a2 = a3
Si cette hypothse est vrifie, le modle :
yt = a0 + a1 x1t + a2 x2t + a3 x3t + t
peut scrire :
yt = a0 + 1 x1t + a2 x2t + a2 x3t + t
ou encore :
yt x1t = a0 + a2 (x2t + x3t ) + t
z t = a0 + a2 vt + t
Il convient de constituer la nouvelle variable expliquer, z t , et la nouvelle variable

explicative vt , puis deffectuer la rgression de z t sur vt .
Le tableau 6 prsente ces nouvelles variables.
Lestimation des deux (k + 1) coefficients du modle conduit aux rsultats suivants :
72 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 73
z t = 0,0111vt + 13,74 + et
(0,051)
n = 14
R 2 = 0,0389
(.) = Ecart type

= 3,0109
Tableau 6 Variables transformes sous lhypothse

de vrification des contraintes
t z t = yt x1t vt = x2t + x3t
1 10 166
2 13 175
3 7 197
4 10 192
5 7 171
6 11 197
7 13 164
8 14 180
9 16 169
10 8 201
11 15 193
12 12 203
13 13 209
14 14 209
Nous pouvons en dduire :

SC T 1 = 109,21 ; SC E 1 = 0,425 ; SC R 1 = 108,78
Lhypothse tester est donc :
H0 : les restrictions sont toutes vrifies (SC R 1 = SC R) .
H1 : il existe au moins une restriction non vrifie (SC R 1 = SC R) .
Le Fisher empirique est donn par :
(SC R 1 SC R)/ddln (108,78 67,45)/2
F = = = 3,06 < F2,10
0,05
= 4,10
SC R/(n k 1) 67,45/10
avec ddln = (n k 1) (n k 1) = k k = 2 .
Lhypothse H0 est accepte, les contraintes envisages sur les coefficients sont com-
patibles avec les donnes.
C. Gnralisation des tests par analyse de la variance

Nous pouvons remarquer que tous ces tests par analyse de la variance se ram-
nent un test unique, tel que les lments du vecteur des coefficients a vrifient
un ensemble de q contraintes linaires :

9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 74
H0 : Ra = r
H1 : Ra = r
Ainsi le Fisher empirique est donn par :
{(R
a r) [R(X X)1 R ]1 (R
a r)}/q
F =
SC R/(n k 1)
o
a est le vecteur des coefficients estims sur le modle non contraint.
On rejette H0 si le F est suprieur au F lu q et n k degrs de libert.
Quelques exemples dutilisation pour un modle k variables explicatives :
Test sur un coefficient de rgression. Hypothse H0 : a3 = 0,5 .
Soit tester lgalit du 3e coefficient par rapport 0,5 ; la contrainte scrit
Ra = r avec R = (0 0 0 10 0 0) et r = (0 0 0 0,50 0 0) . Le premier lment
des vecteurs correspond au terme constant a0. Ce test peut aussi tre men par
un classique test de Student.
Test dgalit de coefficients. Hypothse H0 : a1 = a3 a1 a3 = 0 .
La contrainte scrit Ra = r avec R = (0 1 0 1 . . . 0 0 0)
et r = (0 0 0 0 . . . 0 0 0) .
Test de significativit globale de la rgression.
Hypothse H0 : a1 = a2 = a3 = = ak = 0 .
Ce test de Fisher (cf. quation [17]) est quivalent lcriture contrainte Ra = r
avec R = (0 1 1 11 1) et r = (0 0 0 00 0 0) .
De manire quivalente, nous pouvons utiliser la statistique :
(SC Rc SC R)/q
F = o SC Rc est la somme des carrs des rsidus du
SC R/(n k 1)
modle contraint.
Une autre manire de procder consiste comparer le ratio de vraisem-
blance1 du modle contraint et non contraint : si la contrainte est valide, nous
devons avoir L c < L nc o L nc est la fonction de vraisemblance du modle non
contraint et L c est la fonction de vraisemblance du modle contraint. Soit
L c /L nc < 1 , sous forme logarithmique Ln(L c ) Ln(L nc ) < 0 ou encore
lc lnc < 0 , la diffrence entre les logarithmes des fonctions doit tre significa-
tivement ngative. On dmontre que ce test se ramne un test du 2 par calcul
de la statistique L R = 2(lc lnc ) qui suit un 2 r degrs de libert ( r tant
le nombre de contraintes). Ainsi, si L R est suprieur au 2 lu dans la table au
seuil choisi et r degrs de libert, on rejette lhypothse H0, les restrictions
ne sont pas vrifies.
Enfin, nous pouvons citer le test du multiplicateur de Lagrange ( L M test )
fond sur lestimation dune quation intermdiaire et de la valeur dune statis-
tique L M = n R 2 (n = nombre dobservations et R 2 = coefficient de dtermi-
1. Dans un modle de rgression classique, la maximisation de la fonction de vraisemblance four-

nit des estimations identiques celle de la mthode des MCO.
74 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 75
nation issu de lestimation de lquation intermdiaire) qui suit un 2 r degrs

de libert ( r tant le nombre de contraintes) ; nous verrons des applications de
cette statistique au chapitre 5 concernant les tests de dtection de lautocorrla-
tion des erreurs et de lhtroscdasticit.
V. Lutilisation de variables indicatrices1

A. Constitution et finalits des variables indicatrices
Une variable indicatrice est une variable explicative particulire qui nest com-
pose que de 0 ou de 1. Cette variable est utilise lorsque, dans un modle, nous
dsirons intgrer un facteur explicatif binaire : le phnomne a lieu ou na pas
lieu pour corriger, par exemple, dune valeur anormale ; ou bien lorsque le fac-
teur explicatif est qualitatif : le genre dun individu, homme ou femme . Il
sagit donc dincorporer une ou des variables explicatives supplmentaires au
modle spcifi initialement et dappliquer les mthodes classiques destima-
tion.
Le modle de rgression diffre selon lapparition du phnomne par les valeurs
dun ou plusieurs coefficients alors que les autres paramtres sont identiques. En
cas de modification structurelle dun coefficient de rgression, la variable muette
affecte alors le coefficient de la ou des variables explicatives considres.
Par exemple, soit le modle deux variables explicatives x1t et x2t :
yt = a0 + a1 x1t + a2 x2t + b0 Dt + b1 Dt x1t + b2 Dt x2t + t
Si le phnomne existe, Dt = 1 et Dt = 0 sinon.
Si Dt = 0 , le modle scrit : yt = a0 + a1 x1t + a2 x2t + t
Si Dt = 1 , le modle scrit : yt = (a0 + b0 ) + (a1 + b1 )x1t + (a2 + b2 )x2t + t
Si b1 = b2 = 0 , le modle ne diffre que par la valeur du terme constant.
Domaine dutilisation des variables indicatrices.

Le domaine dutilisation des variables indicatrices est trs vaste, nous pou-
vons citer : la correction des valeurs anormales (cf. exercice n 4), la modifica-
tion structurelle (0 pour la priode avant le changement structurel, 1 aprs le
changement structurel), lintgration de la saisonnalit (cf. exercice n 6), la
caractrisation dun individu (genre, situation matrimoniale), lintgration de
facteurs qualitatifs (appartenance dun pays la zone euro, promotion non quan-
tifiable), etc.
1. Les termes de variables indicatrices, de variables auxiliaires ou de variables muettes sont indif-
fremment employs en franais. Le terme anglo-saxon dummy est le plus couramment
utilis.

9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 76
B. Exemples dutilisation
1) Correction de valeurs anormales
Les sries statistiques sont parfois affectes de valeurs anormales lies la sur-
venance dvnements exceptionnels : grve, guerre, aberration climatique, etc.
Deux problmes se posent alors : dtecter la valeur anormale et la corriger afin
quelle ne perturbe pas lestimation statistique des autres variables.
Exercice n 4
Dtection et correction de valeurs anormales par variable indicatrice
Un modle de production de service du secteur du tourisme est spcifi de la mani-
re suivante :
Q P St = a0 + a1 V At + a2 P O Pt + t
avec :
Q P St = production du secteur tourisme pour lanne t ;
V At = valeur ajoute du secteur tourisme pour lanne t ;
P O Pt = population pour lanne t .
Lconomtre charg de lestimation de ce modle sur 18 ans sinterroge sur la per-

turbation entrane par leffet dune guerre pour lanne 16. Pour rpondre cette ques-
tion, il intgre son modle de base une variable indicatrice Dt tel que :
Dt = 0 pour t = 1 15 et t = 17 18
Dt = 1 pour t = 16
Lestimation du modle conomtrique est la suivante :
Q P St = 2 340,4 + 23,5 V At + 0,3 P O Pt 120,56 Dt + et

(4,5) (2,2) (2,9) (5,8)
n = 18
R 2 = 0,65
() = t de Student
Leffet guerre a-t-il une influence significative sur la production du service du

secteur du tourisme ?
76 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 77
Solution
La variable indicatrice Dt a un ratio de Student de t = 5,8 > t14

0,05
= 2,14 , le coef-
ficient de rgression de cette variable est significativement diffrent de 0, la production
de service pour lanne 16 est donc anormalement basse (120,56) . Cette baisse est,
sans doute imputable leffet de la guerre.
Gnralisation
Dans le cas dun phnomne se produisant de manire sporadique, la variable indi-
catrice prend la valeur 1 pour la ou les priodes que lon dsire corriger et 0 pour les
autres.
Nous remarquons que nous pouvons procder au test de Chow (stabilit du modle
sur lensemble de la priode) en recourant une variable indicatrice prenant la valeur 1
pour la premire sous-priode et la valeur 0 pour la deuxime sous-priode. Le test de
Student portant sur le coefficient de la variable indicatrice permet alors de se dtermi-
ner sur un modle un rgime ou un modle deux rgimes.
2) Variable qualitative
Il peut savrer important dans certaines spcifications de modle de tenir comp-

te de leffet, sur la variable endogne, de variables qualitatives : tre titulaire
dun diplme, genre dun individu, appartenance politique, etc. Lutilisation
dune variable indicatrice permet de segmenter les individus en deux groupes et
de dterminer si le critre de segmentation est rellement discriminant.
Attention, dans le cas de variables qualitatives plusieurs modalits, par
exemple la couleur des yeux (bleu, vert, marron, autres), ou bien la situation
familiale (clibataire, mari, divorc, veuf, autres), etc. Il convient alors de
coder autant de variables indicatrices que de modalits moins une. En reprenant
lexemple de la couleur des yeux nous dfinissons trois variables indicatrices :
bleu (= 1 si lindividu les yeux bleus, 0 sinon), vert (= 1 si lindividu les yeux
verts, 0 sinon), marron (= 1 si lindividu les yeux marrons, 0 sinon), le cas des
autres individus nappartenant pas lune des trois premires catgories est
implicitement contenu dans le terme constant. Une erreur ne pas commettre
consiste crer une seule variable explicative code, par exemple, de la mani-
re suivante : bleu = 1, vert = 2, marron = 3,
Au chapitre 12 nous traitons du cas particulier des variables qualitatives qui
figurent en tant que variables expliquer.

9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 78
Exercice n 5
Intgration dune variable qualitative
Afin de dterminer les facteurs explicatifs de la russite de la licence en sciences
conomiques, on spcifie le modle suivant :
N L = a0 + a1 N D + a2 DS +
o :
N L = note moyenne obtenue en licence,
N D = note moyenne obtenue en fin de deuxime anne,
DS = variable indicatrice de genre (1 pour les hommes et 0 pour les femmes).
Lestimation partir dun chantillon de 60 tudiants conduit aux rsultats suivants :
N L = 8,5 + 0,3 N D 1,2 DS + e
(4,5 ) (7,1) (2,3)
n = 60
R 2 = 0,72
() = t de Student
Le fait dtre homme ou femme a-t-il une influence sur la note obtenue en licence
de sciences conomiques ?
Solution
La variable indicatrice DS a un ratio de Student de
t = 2,3 > t57
0,05
= 1,96
le coefficient de rgression a2 est significativement diffrent de 0, le facteur sexe est
donc bien un facteur discriminant de la note obtenue en licence. La probabilit critique,
associe au risque de premire espce (risque de rejeter lhypothse H0 tort), est gale
0,025. Nous avons donc 2,5 % de risque de nous tromper en rejetant lhypothse H0.
Le risque derreur est trs faible, nous la rejetons.
Il est noter que le coefficient ngatif indique quil est pnalisant dtre un
homme (DS = 1) et quen moyenne, sur notre chantillon, les hommes ont une note
infrieure de 1,2 point celle des femmes.
Toutefois le facteur explicatif le plus important reste bien la note obtenue en fin de
deuxime anne (t = 7,1) .
78 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 79
3) Analyse de saisonnalit
Exercice n 6
fichier C3EX6
tude de saisonnalit par variables indicatrices

Une entreprise cherche apprhender une relation entre ses ventes et ses dpenses
publicitaires. Le directeur du marketing dispose des donnes (tableau 7) de ventes et de
dpenses publicitaires sur 5 ans par trimestre.
1) Ce directeur du marketing commence par estimer la relation :
Vt = a0 + a1 Pubt + t
Commenter les rsultats obtenus.
2) Tracer le graphique de la srie des ventes, que pouvez-vous en conclure ?
3) Spcifier et estimer le modle adquat.
Tableau 7 Ventes et dpenses publicitaires
Annes T1 T2 T3 T4
1 Ventes 164 198 85 179
Pub. 34 36 32 29
2 Ventes 168 201 98 197
Pub. 45 67 76 75
3 Ventes 197 209 100 216
Pub. 75 78 72 75
4 Ventes 223 245 119 260
Pub. 78 81 84 83
5 Ventes 298 309 124 267
Pub. 89 82 81 83
Solution
1) Lestimation du modle de rgression simple

Vt = a0 + a1 Pubt + t
conduit aux rsultats suivants :
Vt = 104,89 + 1,29 Pubt + et
(1,85)
n = 20
R 2 = 0,16
() = t de Student
La publicit a-t-elle un effet significatif sur les ventes ? La valeur du ratio du Student
empirique permet de rpondre cette question.
t = 1,85 < t18
0,05
= 2,10 le coefficient a1 nest pas significativement diffrent
de 0, la publicit na pas, a priori, dimpact sur les ventes.

9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 80
2) Le graphique 1 de la srie des ventes et des dpenses publicitaires indique une srie
des ventes fortement saisonnire avec un creux trs affirm au troisime trimestre
alors que la variable publicit ne semble pas affecte de variations saisonnires.
La relation entre les ventes et la publicit ne peut tre dtermine puisque le mou-
vement saisonnier vient occulter lestimation conomtrique1. Il convient donc dint-
grer ce mouvement saisonnier laide de variables muettes.
3) Le modle tenant compte de ce mouvement saisonnier scrit :
Vt = a0 + a1 Pubt + a2 D1t + a3 D2t + a4 D3t + t
avec D1t = variable indicatrice du trimestre 1 : cette variable est compose de 0, sauf
pour les premiers trimestres pour lesquels la valeur 1 figure ; D2t = variable indicatrice
du trimestre 2 : cette variable est compose de 0, sauf pour les deuximes trimestres pour
lesquels la valeur 1 figure ; D3t = variable indicatrice du trimestre 3 : cette variable est
compose de 0, sauf pour les troisimes trimestres pour lesquels la valeur 1 figure.
Graphique 1 Srie des ventes et de dpenses publicitaires

La variable indicatrice du quatrime trimestre ne doit pas tre incorpore au mod-
le. En effet, nous aurions dans le cas de son existence
D1t + D2t + D3t + D4t = U
U tant le vecteur unit qui serait par construction colinaire au vecteur unit du terme
constant, ce qui rendrait la matrice X X singulire (non inversible).
La valeur du coefficient saisonnier du quatrime trimestre est donc implicitement
incorpore la valeur du terme constant.
Nous pourrions, dans une solution alternative, utiliser les quatre variables indica-
trices et procder une rgression sans terme constant. Les donnes utilises pour les-
timation sont prsentes dans le tableau 8.
Lestimation du modle est la suivante :
Vt = 129,10 + 1,37 Pubt 7,21 D1t + 8,87 D2t 118,6 D3t + et
(3,97) (0,38) (0,47) (6,25)
1. Dans un modle conomtrique, les variables doivent tre non saisonnires ou Corriges des
Variations Saisonnires (CVS).
80 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 81
n = 20
R 2 = 0,83
() = t de Student
Les dpenses publicitaires, dont le ratio de Student est gal 3,97, sont maintenant
explicatives1 des ventes ; la variable indicatrice D3t est la seule variable muette signifi-
cative (t = 6,25), ce qui implique que la saisonnalit des ventes est lie essentielle-
ment au creux du troisime trimestre.
Tableau 8 Variables indicatrices

pour une dsaisonnalisation trimestrielle
. Vt Pubt D1t D2t D3t
T1 164 34 1 0 0
T2 198 36 0 1 0
T3 85 32 0 0 1
T4 179 29 0 0 0
T1 168 45 1 0 0
T2 201 67 0 1 0
T3 98 76 0 0 1
T4 197 75 0 0 0
T1 197 75 1 0 0
T2 209 78 0 1 0
T3 100 72 0 0 1
T4 216 75 0 0 0
T1 223 78 1 0 0
T2 245 81 0 1 0
T3 119 84 0 0 1
T4 260 83 0 0 0
T1 298 89 1 0 0
T2 309 82 0 1 0
T3 124 81 0 0 1
T4 267 83 0 0 0
VI. La prvision laide du modle

linaire gnral et la rgression rcursive
A. Prdiction2 conditionnelle
Le problme consiste dterminer quelle valeur doit tre attribue la variable
endogne lorsque nous connaissons les valeurs des variables exognes.
1. Ceci est noter : dans un modle, labsence dune ou de plusieurs variables explicatives impor-
tantes peut entraner une mauvaise estimation des variables figurant dj dans le modle.
2. Il ne sagit pas toujours de prvoir une valeur dans le futur, mais dans le cadre de sries tem-
porelles de simuler le pass ou bien dans les modles en coupe instantane de prdire des
valeurs.

9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 82
Le modle gnral estim est le suivant :

yt =
a0 +
a1 x1t +
a2 x2t + . . . +
ak xkt + et
La prvision pour la donne t + h (respectivement i + h pour les modles en
coupe instantane) est la suivante :

yt+h =
a0 +
a1 x1t+h +
a2 x2t+h + . . . +
ak xkt+h
Lerreur de prvision est donne par :
et+h = yt+h
yt+h
Considrant que les hypothses du modle linaire gnral sont vrifies, la
prvision yt+h est sans biais.
Nous avons postul que nous connaissons sans erreur les valeurs en t + h
des variables explicatives. Si pour un modle en coupe instantane cette hypo-
thse est raliste, il nen est pas de mme dans les modles en sries temporelles
pour lesquelles les valeurs futures des variables explicatives sont estimes avec
imprcision et donc introduisent un lment supplmentaire dincertitude dans
le calcul de la prvision. Ce problme est exclu du champ de notre analyse,
puisque nous traitons de prdiction conditionnelle.
B. Fiabilit de la prvision et intervalle de prvision

Lerreur de prvision calcule en t lhorizon h peut scrire aussi :
et+h = yt+h
yt+h = X t+h

(a a ) + t+h

Calculons la variance de cette expression : V (et+1 ) = V X t+h (a
a ) + t+h

X t+h (a
a ) est une combinaison linaire des yt et puisque t+h est sans corrla-

tion avec les yt , nous avons Cov X t+h (a a ),t+h = 0 .

On a alors : V (et+h ) = V X t+h (a a)
+ V (t+h )
!
V X t+h (a a) = X t+h

V (a a)X
t+h = 2 X t+h
(X X)1 X t+h
(puisque V (a)
= 2 (X X)1 ) )
On connat : V (t+h ) = 2
La variance de lerreur de prvision est donc gale :

et+h
2
= 2 [X t+h (X X)1 X t+h + 1] [18]

1
x1t+h

Avec X t+h =
x2t+h vecteur des valeurs prvues des variables explicatives.
...
xkt+h
82 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 83
Or lerreur de prvision (et+h = yt+h yt+h ) est distribue suivant une loi nor-
male N (0, et+h
2
) , en remplaant la variance thorique 2 par la variance empi-
rique
2 dans lexpression [18], nous pouvons en dduire que :

yt+h yt+h
suit une loi de Student n k 1 degrs de libert.

[X t+h

(X X)1 X t+h + 1]1/2
Nous remarquons que, comme pour le modle de rgression simple, la va-

riance de lerreur de prvision est dautant plus faible lorsque :
la variance rsiduelle est faible ;
les valeurs prvues des variables explicatives se rapprochent de leur
moyennes.
Lintervalle au seuil (1 ) de la prvision est alors :
/2
"
yt+h =
yt+h tnk1
2 [X t+h

(X X)1 X t+h + 1] [19]
Exercice n 7
fichier C3EX1
Prvision partir du modle linaire

En reprenant les donnes de lexercice 1 (tableau 1), on demande :
1) destimer le modle deux variables explicatives :
yt = a0 + a1 x1t + a2 x2t + t (puisque nous avons montr que la variable x3 nest
pas significative) ;
2) de calculer une prvision et son intervalle 95 % pour les priodes 15 et 16, sachant
que :
x1 15 = 3 ; x1 16 = 6 et x2 15 = 24 ; x2 16 = 38
Solution
1) Lestimation du modle deux variables explicatives conduit aux rsultats suivants :
yt = 25,84 + 0,715x1,t 0,328x2,t + et

(0,26) (0,13)
n = 14
R 2 = 0,687
(.) = Ecart type

= 2,538
Nous remarquons les t de Student suprieurs 2,201, les coefficients a1 et a2 sont

significativement diffrents de 0.
2) La prvision pour la priode 15 est calcule partir du modle estim :

9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 84

y15 = 25,84 + 0,71 x1 15 0,33 x2 15 = 25,84 + 0,71 3 0,33 24

y15 = 20,25
De mme, pour la priode 16, on obtient :

y16 = 25,84 + 0,71 x1 16 0,33 x2 16 = 25,84 + 0,71 6 0,33 38

y16 = 17,26
Les carts types de lerreur de prvision sont donns par [18] :

e15
2
= 2 [X 15 (X X)1 X 15 + 1] . Nous devons calculer (X X)1, les autres l-
ments tant connus.

14 85 532
X X = 85

631 3 126 (X X)1 =
532 3 126 20 666
5,707687 0,16341 0,12221
= 0,16341 0,011001 0,002542
0,12221 0,002542 0,002809

5,707687 0,16341 0,1222 1
e215 = (2,538)2 (1 3 24) 0,16341
0,011001 0,002542 3 + 1
0,12221 0,002542 0,0022809 24

e15
2
= 6,44 [0,94 + 1] = 12,53
e15 = 3,54
De mme, nous pouvons dterminer :

e16
2
= 6,44 [0,071 + 1] = 6,90
e16 = 2,62
Les intervalles de prvision peuvent tre calculs par [19] :
#
/2
yt+h =
yt+h tnk1 2 [X t+h (X X)1 X t+h + 1]
y15 = 0,025
y15 t1421
e15 = 20,05 2,201 3,54
0,05
I C15 = [12,26 ; 27,84] , la prvision pour la priode 15 a 95 % de chances de se
situer dans cet intervalle et la prvision de la priode 16 :
0,05
I C16 = [11,49 ; 23,03]
Les intervalles de la prvision semblent assez larges, cependant il convient de sou-
ligner que la distribution de probabilit suit une loi de Student et qu ce titre la valeur
la plus probable demeure la valeur centrale (la prvision estime) et que la probabilit
dapparition diminue lorsque lon sloigne de cette valeur centrale.
Nous remarquons que lcart type de lerreur de prvision de la priode 16 est inf-
rieur celui de la priode 15. Cela est la consquence des valeurs des variables explica-
tives pour la priode 16 que nous avons choisies sensiblement gales leur moyenne.
C. Les tests de stabilit par la rgression rcursive

On appelle rgression rcursive la procdure qui consiste estimer une succes-
sion de rgressions en augmentant progressivement le nombre dobservations.
84 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 85
On estime dabord le modle avec les k + 2 premires observations (modle

un degr de libert) puis on incorpore lobservation suivante et on re-estime le
modle, et ainsi de suite jusqu n (le nombre dobservations total disponible).
Un simple examen graphique de lvolution des coefficients du modle
assortis de leurs intervalles de confiance deux carts types permet ven-
tuellement de dterminer des changements structurels.
Les tests du CUSUM sont fonds sur la dynamique de lerreur de
prvision.
Ces tests permettent de dtecter les instabilits structurelles des quations de
rgression au cours du temps. Contrairement au test de Chow, ils ne ncessitent
pas de connatre a priori la date de modification structurelle. Lide gnrale de
ces tests est dtudier lvolution au cours du temps de lerreur de prvision nor-
malise, on appelle rsidu rcursif cette succession derreur de prvision calcu-
le en t 1 pour t.
Le rsidu rcursif wt au temps t est donc dfini comme le rapport :
de lcart entre la prvision calcule en t 1 pour t et la ralisation en t,
et une variable dchelle1 calcule pour cette mme priode t,
soit :
et = yt
yt yt xt at1
wt = =#
Se (1 + xt (X t
X 1
1 t1 ) x t )
avec t = K + 2,K + 3,K + 4,. . . , n(K = k + 1 est le nombre total de para-

mtres estims du modle). Ce rsidu rcursif suit donc une loi normale N (0, 2 ) .
Soit les deux tests :
le CUSUM (CUmulative SUM) fond sur la somme cumule des rsidus
rcursifs,
le CUSUM SQ fond sur la somme cumule du carr des rsidus rcursifs.
partir du rsidu rcursif wt , on calcule la statistique CUSUM :
nK t
Wt = wj
SC R j=K +2
avec t = K + 2,. . . , n(K = k + 1 est le nombre total de paramtres estims du
modle) et SCR la somme des carrs des rsidus calcule partir du modle n
observations.
Si les coefficients sont stables au cours du temps, alors les rsidus
rcursifs
rester dans lintervalle dfini par les deux droites : [K , n K ] et
doivent
[n, 3 n K ] avec = 1,143 0,948 et 0,850 respectivement pour des
seuils de confiance de 1 %, 5 % et 10 %. Dans le cas contraire, le modle est
rput instable.
1. On remarque quil sagit de la formule [18], hormis la variance rsiduelle.

9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 86
La statistique du CUSUM SQ est donne par le carr du rsidu rcursif :

t
w2j
j=K +2
St = avec t = K + 2,. . . ,n et 0 St 1 ;

n
w 2
j
j=K +2
ce test permet de dtecter des modifications alatoires (ponctuelles) dans le

comportement du modle. Si les coefficients sont stables au cours du temps,
alors les rsidus rcursifs carrs doivent rester dans lintervalle dfini par :

(t K )
C
nK
o C est la statistique de Kolmogorov-Smirnov1.
D. Le test de spcification de Ramsey

Le test de Ramsey, aussi appel le test de RESET (Regression Error
Specification Test), porte sur la pertinence de la forme fonctionnelle du modle,
telle que :
une relation fonctionnelle non adapte (passage aux logarithmes, fonctions
inverses) entre la variable expliquer et les variables explicatives ;
labsence dune variable explicative dans le modle ;
la corrlation entre la variable explicative et le terme derreur ;

Plutt que destimer des spcifications alternatives (par exemple linaire ou non
linaire), le test porte sur la significativit dun ou des coefficients dune qua-
tion intermdiaire dans laquelle figure la srie expliquer ajuste et leve la
puissance 2, 3, 4 Le test RESET est men en trois tapes :
1) Estimation par les MCO du modle initial et calcul de la srie ajuste :

yt = a 0 + a 1 x1 + a 2 x2 + . . . + a k xk
2) Estimation par les MCO de lquation intermdiaire :

yt = b0 + b1 x1 + b2 x2 + . . . + bk xk + 2 yt2 + 3 yt3 + . . . + h yth + vt
1. Pour la table, cf. Johnston J. et Dinardo J., pages 379-380, 1999.
86 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 87
3) Test de lhypothse H0 : 2 = 3 = . . . = h par un classique test de Fisher

dun sous-ensemble de coefficients (ou si h = 2, par un test de Student portant
sur le coefficient unique, H0 : 2 = 0 ).
Si lhypothse H0 est accepte, le modle est bien linaire et il nexiste pas
de problme de spcification.
Exercice n 8
fichier C3EX1
Tests de stabilit structurelle, Test de spcification de Ramsey

Soit les donnes de lexercice 1 (tableau 1) et le modle :
yt = a0 + a1 x1t + a2 x2t + t
On demande :
1) partir dune rgression rcursive de tester un ventuel changement structurel en
examinant la stabilit des coefficients et en procdant aux tests CUSUM ;
2) De procder au test de spcifications de Ramsey.
Solution
1) Stabilit des coefficients
Nous procdons lestimation des coefficients a0 , a1 et a2 avec leur intervalle de
confiance deux carts types, sur 4, 5, , 14 observations, soit 11 coefficients diffrents.
Le programme Eviews (C3EX8) est en tlchargement.
Les graphiques 2, 3 et 4 illustrent lvolution des trois coefficients partir de la sep-
time observation ; en effet compte tenu du degr de libert trs faible, lestimation de
lcart type des coefficients (et donc lintervalle de confiance) pour les trois premiers
calculs nest pas significatif.
Graphique 2 volution de a0 et de son intervalle de confiance deux carts types

9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 88
0,4
0,2
0,2
0,4
0,6
0,8
1,0
7 8 9 10 11 12 13 14
Nous constatons que les trois coefficients restent toujours dans leur intervalle de
confiance, nous rejetons lhypothse dun changement structurel.
Tests CUSUM
Les tests CUSUM et CUSUM SQ peuvent tre effectus directement sur Eviews :
Graphique 5 Test CUSUM pour un seuil de confiance de 5%
88 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 89
Graphique 6 Test CUSUM SQ pour un seuil de confiance de 5%
Hormis la priode 9 du test CUSUM pour laquelle nous constatons un trs lger
franchissement de lintervalle de confiance, les statistiques CUSUM et CUSUM SQ
restent dans leur intervalle ; l encore nous rejetons donc lhypothse dun changement
structurel. Ces rsultats sont en conformit avec ceux de lexercice n3 (test de Chow).
2) Le test de Ramsey est conduit de la manire suivante :
Calculer la srie expliquer ajuste : yt = 25,84 + 0,71x1t 0,33x2t
lever au carr la srie expliquer : yt2 = ( yt )2 , nous ne testons quune spcification
non linaire de type quadratique.
Estimer le modle en ajoutant comme variable explicative supplmentaire yt2 :
yt = b0 + b1 x1t + b2 x2t + 2 yt2 + t
Effectuer le test dhypothses H0 : 2 = 0 (H1 : 2 = 0 ). La probabilit critique du

coefficient 2 est gale 0,827. Nous acceptons lhypothse H0, le modle est donc cor-
rectement spcifi.
Le test de Ramsey peut tre effectu directement sur Eviews :
Ramsey RESET Test :

F-statistic 0.049866 Probability 0.827792
Test Equation :
Dependent Variable : Y
Included observations : 14
C 16.40322 42.74223 0.383771 0.7092
X1 0.326961 1.759415 0.185835 0.8563
X2 0.150146 0.809298 0.185526 0.8565
FITTED^2 = yt2 0.015484 0.069342 0.223308 0.8278
Remarque : La F -statistique est gale F = 0,0498 = (t )2 = (0,223)2 .

9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 90
VII. Exercices rcapitulatifs

Exercice n 9
Estimation dun modle et tests de validit partir de la connais-
sance de quelques lments statistiques
Sur n = 100 observations et pour trois sries (y, x1 et x2 ), nous avons les rsultats
numriques suivants :
V (y) = 1 000 ; r y,
2
x1 = 0,75 ; r x1, x2 = 0,45 ; r y, x2 = 0,85 ; y = 12
2 2
1) Nous avons effectu la rgression :

y = 10 x1 6.
Le coefficient de x1 est-il significativement diffrent de 0 ?
2) La rgression de y sur x2 a donn
y = 4 x2 + 8 , le coefficient de x2 est-il significa-
tivement diffrent de 0 ?
3) Calculer les coefficients du modle : y = a0 + a1 x1 + a2 x2 + , et le coefficient de
corrlation multiple.
4) Les coefficients a1 et a2 sont-ils significativement diffrents de 0 ? La rgression est-
elle globalement significative ?
Solution
1) La variance estime du coefficient de rgression est donne par :

2
a2 =

(x1t x 1 )2
t
Nous savons que dans le cadre de la rgression simple, il y a galit entre corrla-
tion simple et corrlation multiple, soit :
2

(yt y)(x1t x 1 )
Cov (y, x1 )2 t
r y, x1 =
2
=
V (y) V (x1 ) (yt y)2 (x1t x 1 )2
t t
et2
= R =1
t
2
= 0,75
(yt y)2
t
Or :
(yt y)2 (yt y)2
t t

V (y) = 1 000 = = (yt y)2 = 100 000
n 100 t
Nous utilisons ici la formule de la variance dune population (division par n) et non
la formule de la variance dun chantillon (division par n 1).
Do :

et2 = (1 0,75) 100 000 = 25 000 2 = 25 000/(n 2) = 255,1
t
90 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:12 Page 91
Pour calculer la variance de x1 , nous utilisons les relations :

(yt y)(x1t x 1 )

a=
t
= 10
(x1t x 1 )2
t
et 2

(yt y)(x1t x 1 )
t
2
r y, x1 =
= 0,75
(yt y)2 (x1t x 1 )2
t t

Connaissant (yt y)2 = 100 000 , nous trouvons :
t

(x1t x 1 )2 = 750 et (yt y)(x1t x 1 ) = 7 500
t t
Soit : Var (x1 ) = 7,5 et Cov (y, x1 ) = 75

2 255,1 10
a2 =
= = 0,34 t = = 17,14 > t 0,05 = 1,96
(x1t x 1 )2 750 0,58
t
Le coefficient de rgression de y sur x1 est significativement diffrent de 0.
2) Un calcul analogue pour lcart type du coefficient de rgression de y sur x2 conduit

aux rsultats suivants :

et2 = (1 0,85) 100 000 = 15 000
2 = 15 000/98 = 153,06
t

(x2t x 2 )2 = 5 312,5 et (yt y)(x2t x 2 ) = 21 250
t t
Soit : Var (x2 ) = 53,12 et Cov (y, x2 ) = 212,50

2 153,06 4
a2 =
= = 0,03 t = = 23,5 > t 0,05 = 1,96
(x2t x 2 )2 5 312,5 0,17
t
Le coefficient de rgression de y sur x2 est significativement diffrent de 0.

3) Calculer les coefficients du modle :
y = a0 + a1 x 1 + a2 x 2 +
Nous avons la relation daprs les quations normales (cf. section II, p. 50) :
1

a1 Var(x1 ) Cov(x1 , x2 ) Cov(y, x1 )
=

a2 Cov(x1 , x2 ) Var(x2 ) Cov(y, x2 )

9782100721511-Bourbo-C03.qxd 20/10/14 15:13 Page 92
Nous connaissons tous les lments de ce calcul sauf Cov(x1 , x2 ), or :

2

(x1t x 1 )(x2t x 2 )
[Cov(x1 , x2 )]2 t
2
r x1, x2 = = = 0,45
V(x1 ) V(x2 ) (x1t x 1 )2 (x2t x 2 )2
t t
Var(x1 ) = 7,5 et Var(x2 ) = 53,12 Cov(x1 , x2 ) = 13,389 , en effet la covariance

entre x1 et x2 est positive puisque les covariances entre y et x1 , et y et x2 sont positives.
1

a1 7,5 13,39 75 0,242 0,061 75 5,19
= = =

a2 13,39 53,12 212,5 0,061 0,034 212,5 2,69
Le terme constant est donn par

a0 = y
a1 x 1
a2 x 2 .
Or y = 12 ;
a1 = 5,19 ; a2 = 2,69 , de plus x 1 = 1,8 car y = 10 x 1 6 (modle 1)
et x 2 = 1 car y = 4 x 2 + 8 (modle 2) a0 = 0,032 .
Le coefficient de dtermination est gal, si lon raisonne sur des donnes centres, :

7 500
Y
(5,19 2,69)
Y a X Y 21 250 96 087,5
R2 = = = = = 0,96

Y Y Y Y (yt y) 2 100 000
t
Car Y Y
= (X a ) (X a) = a X (X (X X)1 X Y ) =
a X Y
Le coefficient de corrlation multiple est gal R = 0,98
4) Analyse des rsultats et tests statistiques.
Significativit des coefficients
Pour calculer les ratios de Student, il convient dabord de connatre les carts types
de chacun des coefficients.
1
1 1 Var(x1 ) Cov(x1 , x2 )

ai =
2
(X X) =
2

2
n Cov(x1 , x2 ) Var(x2 )
Or :
(1 R 2 ) (yt y)2
SC R (1 R 2
) SC T t (1 0,96) 100 000

2 = = = =
nk1 nk1 nk1 100 2 1
2 = 41,23

0,242
5,19
= 41,23
a1
2
= 0,097 = 0,316 t =
a1 = 16,4 > t 0,05 = 1,96
100 0,316
0,034
2,69

a2
= 41,23
2
= 0,014 = 0,118 t =
a2 = 22,8 > t 0,05 = 1,96
100 0,118
Les coefficients a1 et a2 sont significativement diffrents de 0. Nous pouvons obser-

ver des diffrences par rapport aux valeurs estimes prcdemment, sur les coefficients
et sur leurs carts types. Cela est la consquence de la colinarit1 entre x1 et
x2 (r x1, x2 = 0,67) .
92 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:13 Page 93
Analyse de la rgression dans son ensemble

Nous calculons la statistique de Fisher :
R 2 /k 0,96/2
F = = = 1 164 > F2,97
0,05
= 3,10
(1 R 2 )/(n k 1) (1 0,96)/97
La rgression est globalement significative.
Exercice n 10
Test dune combinaison linaire de coefficients de rgression (test de
contrainte linaire)
Pendant 23 ans nous avons relev, sur une parcelle de terre situe en Auvergne, les
rendements de la culture de bl (y) , la temprature moyenne (x1 ) et le niveau des pr-
cipitations (x2 ) .
Lajustement de ce modle conduit aux rsultats suivants :
y = 0,510 x1 0,350 x2 + 27,3 + e
n = 23
R 2 = 0,937

0,0009 0,08 0,3
(X X)1 = 0,08 0,0025 0,02
0,3 0,02 0,2

et SC T = (yt y)2 = 317,46
t
On demande de tester les deux hypothses suivantes :

1) Existe-t-il une influence dau moins un des facteurs ?
2) Le coefficient de la temprature est-il significativement deux fois plus lev que celui
des prcipitations ?
Solution
1) Nous procdons au test de Fisher :

H0 : a1 = a2 = 0
1. Les diffrents aspects de la colinarit sont tudis au chapitre 4.

9782100721511-Bourbo-C03.qxd 20/10/14 15:13 Page 94
H1 : il existe au moins un des coefficients non nul

R 2 /k 0,937/2
F = = = 148,731 > F2,20
0,05
= 3,49
(1 R )/(n k 1)
2 (1 0,937)/20
Nous rejetons lhypothse a1 = a2 = 0 , il existe au moins un des coefficients non nul.
2) Le test dhypothses est le suivant1 :

H0 : a1 2 a2 = 0
H1 : a1 2 a2 = 0
a1 2
( a2 ) 0
Sous H0, le rapport suit une loi de Student n k 1 degrs de

a12

a2
libert.
a1 2
Il convient tout dabord de calculer la variance de ( a2 ) :
On rappelle que Var(a x + b y) = a 2 Var(x) + b2 Var(y) + 2a b Cov(x,y) (a et b
sont deux nombres rels ; x et y sont deux variables alatoires).
a1 2
Var( a1 ) + Var(2
a2 ) = Var( a1 , 2
a2 ) + 2 Cov( a2 )
a1 2
Var( a2 ) = Var(
a1 ) + (2)2 Var ( a1 ,
a2 ) + 2 2 Cov( a2 )
De plus, la variance rsiduelle est donne par :

et2 = (1 R 2 ) SC T = (1 0,937) 317,46
2 = 20/(n 3) = 1
t
Do
a12
2
=
a2 a1
+4
2
a2 a1 ,
4 Cov (
2
a2 )

a12
2
= 0,0009 + 4 0,0025 4(0,08) = 0,33
a2
a1 2
( a2 ) 0 (0,51 + 2 0,35)
= = 2,10 > t20
0,05
= 2,08

a12

a2 0,57
Nous rejetons (de justesse !), au seuil de 5 %, lhypothse H0. Cependant, pour un
seuil de 4 %, lhypothse H0 est accepte.
Remarque : Nous pouvons aussi procder ce test en calculant la statistique

a1 2 a2 2
qui suit un 2 1 degr de libert ; cest ainsi que ce test de restriction

a 1 2 a 2
linaire sur les coefficients du modle peut tre gnralis des restrictions non linaires
(test de Wald). Par analogie, prenons par exemple une contrainte du type

a1 a2 2
a1 a2 = 1 , la statistique suit un 2 1 degr de libert. Cependant, la
a 1 a 2
variance de ( a1
a2 ) nest plus directement calculable, elle est alors estime par une
approximation de Taylor. Sans procder deux estimations diffrentes, lune sur le
modle non contraint et lautre sur le modle contraint (cf. exercice 3), le test de Wald
permet, donc en une seule tape, de tester des restrictions sur les valeurs des coefficients.
Les logiciels dconomtrie proposent directement ce test.
1. Nous pouvons rpondre cette question par un test danalyse de la variance (section IV).
94 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:13 Page 95
Exercice n 11
Reconstitution dinformations manquantes
Un conomtre recherche une relation entre le taux de mortalit (TX), les dpenses
de sant (DS), le pourcentage de plus de 60 ans dans la population (POP) et la densit de
mdecins (DM).
Une estimation sur 10 pays effectue partir du logiciel RATS conduit aux rsultats
suivants (les donnes ont t pralablement centres sur leur moyenne) :

0,0034229

(X X) 1
= 0,00074442 0,1031686
0,018265 0,125482 ????
1) On demande de calculer les valeurs manquantes notes par : ???.

2) Les coefficients des dpenses de sant et de la densit mdicale sont-ils respective-
ment et simultanment diffrents 0,10 et 0,30 ?
Solution
1) Les rsultats complets sont les suivants :

0,0034229
(X X)1 = 0,00074442 0,1031686
0,018265 0,125482 0,26286

9782100721511-Bourbo-C03.qxd 20/10/14 15:13 Page 96
2) Le test dhypothses est le suivant :

a1 0,1
H0 : =
a3 0,3

a1 0,1
H1 : =
a3 0,3
La relation [15] sous H0 scrit :
1 1 (
aq aq )
( aq aq )
aq
q

0,103 0,1
Nous avons q = 2 ,
aq = et aq = . La matrice des variances
0,318 0,3
covariances des coefficients est gale :

0,0034229
a = 0,0482 0,00074442 0,1031686
0,018265 0,125482 0,26286
do :

aq 0,0034229 0,018265
= 0,0482
0,018265 0,26286

1 = 9632,962 669,3578

aq
669,3578 125,4386
1
F = (0,103 0,1 0,318 0,3)
2
9632,962 669,3578 0,103 0,1

669,3578 125,4386 0,318 0,3
F = 0,172 est comparer F (q, n k 1) = F2,70,05

= 4,74 , le F empirique
est infrieur au F lu dans la table, on accepte lhypothse H0.
Les coefficients a1 et a3 sont simultanment et respectivement gaux 0,1 et 0,3.
Exercice n 12
Modle deux rgimes : estimation par variable muette
ou par analyse de la variance
Nous reprenons lexercice 6 du chapitre 2 concernant la relation liant la rmunra-
tion et la dure des tudes. Nous disposons dun chantillon de 40 hommes et 25 femmes
ayant le mme ge dont nous connaissons la rmunration annuelle (yi ) et le nombre
danne dtudes (xi ) .
96 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:13 Page 97
Pour tudier linfluence du genre sur la rmunration, nous avions compar les coef-
ficients de rgression.
1) Quel type de variable peut-on introduire pour tudier cet effet ?
2) Nous avons procd trois estimations :
sur lchantillon global et nous obtenons : SC R ;
sur lchantillon des 40 hommes : SC Rh ;
sur lchantillon des 25 femmes : SC R f .
Comment construire le test dhomognit ?
Solution
1) Une variable muette prenant la valeur 1 pour les hommes et 0 pour les femmes permet
destimer leffet du genre sur la rmunration. Si le coefficient de cette variable indi-
catrice est significativement diffrent de 0, alors le genre est un facteur discriminant.
2) Il sagit dune application du test de Chow un modle en coupe instantane (test
dhomognit de comportement).
Le Fisher empirique est gal :
[SC R (SC Rh + SC R f )]/ddln
F =
(SC Rh + SC R f )/ddld
avec ddln = (n k 1) [(n 1 k 1) + (n 2 k 1)] = 2

ddld = (n 1 k 1) + (n 2 k 1) = n 2(k + 1) = 65 4 = 61
Si F < F 0,05 = 3,15 , lhypothse H0 est accepte, les coefficients sont stables sur
lensemble de lchantillon ; dans le cas contraire, il existe une diffrence significative
entre la rmunration des hommes et des femmes (cest le cas ici, cf. les rsultats de
lexercice 6, chapitre 2).
Nous avons donc dvelopp trois mthodes diffrentes danalyse pour rpondre la
mme question.
Exercice n 13
fichier C3EX13
Estimation dune fonction de production : impact de la privati-
sation
Soit une fonction de production de type Cobb-Douglas :
Log Q = Log a0 + a1 Log K + a2 Log L + t
Q = production
K = facteur capital

9782100721511-Bourbo-C03.qxd 20/10/14 15:13 Page 98
L = facteur travail
t = terme derreur rpondant aux hypothses classiques.
Nous disposons de donnes concernant 50 entreprises du secteur des tlcommuni-
cations en Europe pour une anne donne. Le tableau 9 prsente un extrait des donnes.
Tableau 9 Extrait des donnes de production, facteur travail, facteur capital

et variable indicatrice
Entreprise Q K L DU M
1 5 192 511 11 523 4 610 1
2 8 717 373 22 476,2 6 948 1

49 3 701 601 10 147,4 4 760 0
50 440 380 835 248 0
1) crire le modle sous sa forme originale, cest--dire non linaire. Comment sinter-
prtent les coefficients a1 et a2 de ce modle ?
2) On dsire mesurer lhomognit des comportements entre les entreprises publiques
et les entreprises prives, pour ce faire nous intgrons une variable muette (nomme
DUM) qui prend les valeurs 0 pour les entreprises publiques et 1 pour les entreprises pri-
ves.
Soit estimer le modle suivant :
Log Q = Log a0 + a1 Log K + a2 Log L + b0 DU M + b1 DU M Log K
+ b2 DU M Log L +
Existe-t-il une diffrence des fonctions de production entre les entreprises publiques
et prives ? Si oui, pouvez-vous la quantifier ?
3) Proposer et expliciter une autre mthode afin de tester lhomognit des comporte-
ments des entreprises.
4) Nous proposons maintenant destimer une fonction de production de type
Translog en ngligeant les spcificits public/priv :
Log Q = Log a0 + a1 Log K + a2 Log L + a3 0,5 (Log K )2

+ a4 0,5 (Log L)2 + a5 Log L Log K +
La spcification Translog vous semble-t-elle mieux adapte que la spcification
Cobb-Douglas ? Vous justifierez votre rponse par un test appropri.
Solution
1) le modle sous sa forme initiale scrit : Q = a0 K a1 L a2 e

Les coefficients sinterprtent comme tant des lasticits :
a1 = lasticit de la production au facteur capital
a2 = lasticit de la production au facteur travail
98 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:13 Page 99
Il sagit dun modle linaire sur ses coefficients, cest--dire non linaire sous sa
forme initiale mais linarisable par une simple transformation logarithmique, le modle
est Log-linaire.
2) Les rsultats destimation sont les suivants :
Dependent Variable : LOG(Q)

C 6.477194 0.287830 22.50358 0.0000
LOG(L) 0.230860 0.143231 1.611803 0.1142
LOG(K) 0.747993 0.143545 5.210878 0.0000
DUM 1.018567 0.457088 2.228384 0.0310
DUM*LOG(L) 0.212946 0.241356 0.882290 0.3824
DUM*LOG(K) 0.091142 0.225917 0.403431 0.6886
Les variables LOG(L), DUM*LOG(L) et DUM*LOG(K) ne sont pas significatives

(probabilits critiques suprieures 5 %) nous commenons par retirer du modle la
moins significative DUM*LOG(K). La nouvelle estimation est la suivante.

C 6.517159 0.267719 24.34327 0.0000
LOG(L) 0.266781 0.111144 2.400321 0.0206
LOG(K) 0.711198 0.109808 6.476720 0.0000
DUM 1.072324 0.433148 2.475654 0.0171
DUM*LOG(L) 0.118229 0.055440 2.132570 0.0385
Les variables sont maintenant toutes significatives, nous constatons que les variables
indicatrices DUM sont explicatives : il existe donc une diffrence significative entre les
fonctions de production des entreprises publiques et prives.
Pour les entreprises publiques, la fonction de production scrit (DUM = 0) :
Log Q = 6,52 + 0,266 Log L + 0,711 Log K + e
Pour les entreprises prives, la fonction de production scrit (DUM = 1) :
Log Q = 6,52 + 0,266 Log L + 0,711 Log K 1,07DU M

+ 0,11DU M Log L + e
Log Q = 5,44 + 0,384 Log L + 0,711 Log K + e
Nous remarquons que le facteur travail contribue plus la production pour les entre-
prises du secteur priv que pour les entreprises du secteur public.

9782100721511-Bourbo-C03.qxd 20/10/14 15:13 Page 100
3) Nous pouvons procder au test de Chow en segmentant notre chantillon entre les
entreprises du secteur priv et les entreprises du secteur public.
(SC R (SC R Priv + SC R Publique ))/(k + 1)
Soit calculer la statistique : F =
(SC R Priv + SC R Publique )/(n 2(k + 1))
qui suit alors une loi de Fisher (k + 1) et n 2 (k + 1) degrs de libert.
SCR = somme des carrs des rsidus calcule sur la totalit de lchantillon
des 50 entreprises.
SCR Priv = somme des carrs des rsidus calcule sur les 21 entreprises prives.
SC R Publique = somme des carrs des rsidus calcule sur les 29 entreprises
publiques.
k = 2 et n = 50.
(1,853 (0,795 + 0,629))/3
Soit F = 4,42 > F3;44
0,05
2,84 . Nous rejetons
(0,795 + 0,629)/44
lhypothse H0, le modle est instable, il existe une diffrence significative entre les
fonctions de production des entreprises publiques et des entreprises prives.
4) Les rsultats destimation de la fonction Tranlog sont les suivants :

C 5.404574 1.957160 2.761437 0.0084
LOG(K) 1.686188 1.201063 1.403913 0.1674
LOG(L) 0.612883 1.071805 0.571823 0.5704
0.5*LOG(K)^2 0.031900 0.939072 0.033970 0.9731
0.5*LOG(L)^2 0.289379 1.031212 0.280620 0.7803
LOG(L)*LOG(K) 0.156205 0.978803 0.159588 0.8739
La fonction Translog se ramne une fonction Cobb-Douglas si a3 = a4 = a5 = 0,

soit tester lhypothse H0 : a3 = a4 = a5 = 0. Si nous rejetons lhypothse H0 (au
moins un coefficient non nul), cela signifie que la spcification Translog est mieux adap-
te que la spcification Cobb-Douglas. Il sagit dun test de Fisher de contrainte (test de
Wald) dun sous-ensemble de coefficients, le rsultat est le suivant :
Wald Test :
Equation : TRANSLOG
Test Statistic Value df Probability
F-statistic 0.401096 (3.44) 0.7529
La probabilit critique du test est de 75 %, nous acceptons donc lhypothse H0, la

spcification Translog nest donc pas mieux adapte que la spcification Cobb-Douglas.
100 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:13 Page 101
Exercice n 14
Fonction conomtrique dinvestissement
Une estimation conomtrique de la part des emprunts dans les investissements
dune importante entreprise ptrolire donne :
EMP INVO
= 0,6645 TIR + 179,07 + 36,31 + e
INV INVI
(1,26) (4,69)
R 2 = 0,65 ; n = 17 (nombre dannes de la priode destimation)
Les chiffres entre parenthses sous les coefficients sont les t de Student avec :
EMP = emprunts totaux
INV = investissements totaux
TIR = taux dintrt rel
INVO = investissements de la socit dans les forages offshore
INVI = investissements industriels
e = rsidu destimation
1) Commentez les rsultats obtenus, les coefficients des variables explicatives ont-ils le
signe attendu ?
2) Quel est leffet dun passage de 13 % 15 % de INVO/INVI sur la variable endog-
ne ?
3) Le coefficient de la variable TIR nest pas significativement diffrent de zro. Quelle
explication conomique peut-on donner ce rsultat ?
4) On estime de nouveau ce modle en retirant la variable TIR, les rsultats sont les sui-
vants :
EMP INVO
= 162,15 + 41,28 + e
INV INVI
(7,20)
R 2 = 0,57
Pourquoi a-t-on retir la variable explicative TIR (donnez deux raisons possibles de
la non-significativit statistique de cette variable) ?
Le coefficient de dtermination a diminu, est ce fortuit ?
Les coefficients du modle sont lgrement diffrents de la premire estimation,
pourquoi ?
5) Lestimation conomtrique de lquation de la question 4 permet-elle de donner une
approximation du taux dautofinancement de cette entreprise ? Donner le cas chant
une valeur lorsque INVO/INVI = 13%.

9782100721511-Bourbo-C03.qxd 20/10/14 15:13 Page 102
Solution
1) Le taux demprunt dpend :

ngativement du taux dintrt, ce qui est conforme lintuition conomique ; mais
le coefficient de cette variable nest pas significativement diffrent de 0
(t = 1,26 < t14
0,05
= 2,14) ;
positivement de linvestissement dans les forages offshore, ce qui est logique car
linvestissement dans les forages offshore est trs important ; le coefficient est signi-
ficativement diffrent de 0 (t = 4,69 > t14
0,05
= 2,14).
2) Par application du modle estim, il vient :
EMP
= 179,07 (0,15 0,13) = 3,58
INV
3) La compagnie ptrolire doit pratiquer lautofinancement, donc il nexiste pas de sen-
sibilit au taux dintrt.
4) La variable explicative TIR nest pas significative car elle nest peut tre pas assez
corrle avec la variable expliquer ou bien colinaire avec lautre variable explicative.
Le coefficient de dtermination a diminu car le fait de retirer une variable explica-
tive mme non significative fait augmenter mcaniquement la Somme des Carrs des
Rsidus.
Les coefficients du modle sont lgrement diffrents car la colinarit entre les
variables explicatives entraine une modification de la valeur estime des coefficients.
5) Par application du modle estim il vient :
EMP
= 162,15 0,13 + 41,28 = 62,35
INV
Autofinancement 100 62,35 = 37,65 %
Annexe
A. Interprtation gomtrique de la mthode
des moindres carrs
Soit les vecteurs Y , X 1 , X 2 ,. . . , X k composs de n lments que nous pouvons donc
reprsenter dans R n.
Nous cherchons minimiser :
n
Min t2 = Min = Min (Y Xa) (Y Xa) = Min S
t=1
102 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:13 Page 103
Avec X = (X 1 , X 2 ,. . . , X k ) .
a0
a1

Le vecteur Xa = (X 1 , X 2 ,. . . , X k ) a2 appartient au sous-espace vectoriel
.
..
ak
(L) de R n engendr par X 1 , X 2 ,. . . , X k .
La quantit S est minimale lorsque le vecteur e = Y Xa est orthogonal au sous-
espace (L) .
Le graphique 7 illustre ce propos.
Graphique 7 Interprtation gomtrique de la rgression multiple
B. Rsolution de lexercice 1 par des logiciels

informatiques de rgression multiple
Logiciel RATS

9782100721511-Bourbo-C03.qxd 20/10/14 15:13 Page 104
Nous retrouvons bien lensemble des rsultats de lexercice 1.
Logiciel Eviews
Tableur EXCEL
par la fonction DROITEREG
0.03713 0.38136 0.801901 32.89132

0.052023 0.156581 0.298436 11.66331
0.702687 2.597069 #N/A #N/A
7.878181 10 #N/A #N/A
159.4095 67.44767 #N/A #N/A
Interprtation et correspondance des informations issues du tableau EXCEL

a3
a2
a1
a0

a 3 a 2
a 1
a 0
R2
#N/A #N/A
F ddl #N/A #N/A
SC E SC R #N/A #N/A
Par lutilitaire danalyse Rgression Linaire (Macro-complmentaire)
RAPPORT DTAILL
Statistiques de la rgression
Coefficient de dtermination multiple 0,838

Coefficient de dtermination R^2 0,702
Coefficient de dtermination R^2 (ajust) 0,613
Erreur-type 2,597
Observations 14
104 CONOMTRIE
9782100721511-Bourbo-C03.qxd 20/10/14 15:13 Page 105
ANALYSE DE VARIANCE
Degr Somme Moyenne F
de libert des carrs des carrs
Rgression 3 159,409 53,1368 7,8786
Rsidus 10 67,447 6,74476
Total 13 226,857
Coefficients Erreur-type Statistique t Probabilit
Constante 32,891 11,663 2,820 0,0181
X1 0,80190 0,298 2,687 0,0228
X2 0,3813 0,156 2,435 0,0351
X3 0,0371 0,05202 0,713 0,4916
C. Estimation de la variance de lerreur

La variance de lerreur est inconnue, nous allons donc lestimer partir de la somme des
carrs des rsidus.
Soit : e = Y X a = Y X (X X)1 X Y = PY avec P = I X (X X)1 X .
Cette matrice P est symtrique et idempotente (P 2 = P) . Elle est aussi telle que
P X = 0 et Pe = e .
e = PY = P(Xa + ) = P puisque P X = 0.
Do lesprance de lerreur est donne par : E(e e) = E( P P) = E( P) car
(P = P) .
2
En utilisant le fait que la trace1 dun scalaire est un scalaire, il vient :

E( P) = E[Trace( P)] = E[Trace( P)]
= 2 Trace(P) = 2 Trace(I X (X X)1 X )
= 2 Trace(I )2 Trace[X (X X)1 X ]
= 2 Trace(I )2 Trace[(X X)1 (X X)] = 2 (n(k + 1)) = 2 (nk1) .
Trace(I ) = n et Trace[(X X)1 (X X)] = k + 1 car (X X) est de dimension
(k + 1,k + 1).
Do lestimateur de la variance de lerreur (appele aussi la variance rsiduelle)
scrit donc :

et2

ee t
=
2
=
nk1 nk1
1. La trace dune matrice est gale la somme des valeurs de la premire diagonale.

9782100721511-Bourbo-C03.qxd 20/10/14 15:13 Page 106
9782100721511-Bourbo-C04.qxd 20/10/14 15:16 Page 107
4. Multicolinarit
et slection
du modle optimal
D
ans ce chapitre, nous examinons comment grer labondance de
linformation. En effet, il est frquent, lorsque lconomiste sp-
cifie un modle, quil hsite intgrer telle ou telle variable
explicative. La question essentielle quil se pose est la suivante : comment
dterminer le mix optimal des variables explicatives ? Formule en terme
statistique, cette question se rsume trouver les variables explicatives
qui maximisent leur coefficient de corrlation avec la srie expliquer,
tout en tant les moins corrles entre elles.
Nous prsentons, en I., tout dabord la notion de corrlation partielle qui
permet de dterminer lapport relatif de chaque srie explicative lex-
plication de la srie endogne.
Les relations entre les coefficients de corrlation simple, partielle et mul-
tiple sont examines en II.
Les consquences de la multicolinarit sur lestimation des coefficients
de rgression font lobjet du III.
Enfin, les techniques de slection de variables explicatives sont exposes
et illustres partir dexemples en IV.
I. Corrlation partielle
Un marchand de glaces, situ prs de la tour Eiffel, cherche calculer le coeffi-
cient de corrlation entre ses ventes (x1 ) et le nombre de touristes visitant ce
monument (x2 ) . Ces deux variables sont influences par le climat : la consom-
Multicolinarit et slection du modle optimal 107

9782100721511-Bourbo-C04.qxd 20/10/14 15:16 Page 108
mation de glaces est plus importante lorsquil fait chaud et les touristes sont peu
enclins visiter un monument extrieur en cas de froid ou de pluie, on appelle
x3 cette variable climatique.
Nous pouvons penser que la corrlation entre x1 et x2 est positive, cependant
un calcul de coefficient de corrlation simple nest pas rvlateur du degr de liai-
son relle entre ces deux variables ; en effet, la variable climat influence la vente
des glaces et la frquentation des touristes. En dautres termes, le coefficient de
corrlation simple calcul ainsi intgre lapport de la variabilit des conditions
climatiques sans pouvoir isoler linfluence relative du nombre de touristes.
B. Gnralisation de la notion de corrlation partielle

Le coefficient de corrlation partielle mesure la liaison entre deux variables
lorsque linfluence dune ou des autres variables explicatives est retire.
Soit y une variable expliquer, et x1 , x2 et x3 des variables explicatives :
r y,2 x1 , r y,2 x2 et r y,2 x3 mesurent respectivement la variance de y explique par
la variable x1 seule, x2 seule et x3 seule.
Nous pouvons calculer six coefficients de corrlation partielle du premier
ordre :
2 2 2 2 2 2
r yx1.x2 ; r yx1.x3 ; r yx2.x1 ; r yx2.x3 ; r yx3.x1 ; r yx3.x2 ;
ainsi que trois coefficients de corrlation partielle du deuxime ordre :
2 2 2
r yx1.x2 x3 ; r yx2.x1 x3 ; r yx3.x1 x2 .
Cette notion de corrlation partielle est trs importante car elle permet de
juger de la pertinence dinclure une variable explicative dans un modle.
Plus le coefficient de corrlation partielle dune variable est lev, plus la
contribution de cette variable est importante lexplication globale du modle.
Le coefficient de corrlation partielle peut se calculer de deux manires
partir :
1) Du coefficient de corrlation simple

Entre le rsidu de la rgression de la variable expliquer sur le sous-
ensemble des k 1 autres variables explicatives,
et le rsidu de la rgression de la variable explicative xi sur les k 1
variables explicatives.
2
Exemple de calcul de r yx3.x1 x2
tape 1 : calcul de rsidu e1 de la rgression de y sur x1 et x2

a0 +
e1 = y ( a1 x 1 +
a2 x 2 )
108 CONOMTRIE
9782100721511-Bourbo-C04.qxd 20/10/14 15:16 Page 109
tape 2 : calcul de rsidu e2 de la rgression de x3 sur x1 et x2

e2 = x3 (a 0 + a 1 x1 + a 2 x2 )
tape 3 : calcul du coefficient de corrlation simple entre e1 et e2
3.x 1 x 2 = re1,e2
2 2
r yx
2) Du t de Student
Dans un modle k variables explicatives, il existe une relation entre le coeffi-
cient de corrlation partielle et le t de Student1 :
ti2
variables) =
2
r yxi.(autres [1]
ti2 + (n k 1)
Attention : cette relation nest vrifie que pour un coefficient de corrlation

partielle dordre k 1 .
Exercice n 1
fichier C4EX1
Calcul des coefficients de corrlation partielle du premier ordre et
du deuxime ordre
Une entreprise cherche dterminer quelles sont les influences respectives de la
publicit (x1 ) , de la promotion auprs des distributeurs (x2 ) , et de la promotion auprs
des consommateurs (x3 ) exprimes en milliers deuros sur les ventes en tonnes (y) .
Pour ce faire, elle dispose, sur 10 ans, des sries statistiques du tableau 1.
Tableau 1 Ventes, publicit et promotions
Anne y x1 x2 x3
1 49,0 35,0 53,0 200,0
2 40,0 35,0 53,0 212,0
3 41,0 38,0 50,0 211,0
4 46,0 40,0 64,0 212,0
5 52,0 40,0 70,0 203,0
6 59,0 42,0 68,0 194,0
7 53,0 44,0 59,0 194,0
8 61,0 46,0 73,0 188,0
9 55,0 50,0 59,0 196,0
10 64,0 50,0 71,0 190,0
1. Greene W.H., pages 234-235, 2000.

9782100721511-Bourbo-C04.qxd 20/10/14 15:16 Page 110
Pour rpondre cette question, on demande de calculer les coefficients de corrla-

tion partielle du premier ordre et du deuxime ordre et de commenter les rsultats obte-
nus.
Solution
2 2
Nous traitons compltement le calcul de r yx1.x2 et r yx3.x1 x2 , les rsultats des autres
coefficients sont fournis afin que le lecteur puisse vrifier ses propres calculs.
2
a) Calcul de r yx1.x2 par corrlation entre les rsidus
tape 1 : rgression de y sur x2
Rsidu e1 = y (0,7809 x2 + 3,5809)
tape 2 : rgression de x1 sur x2
Rsidu e2 = x1 (0,3809 x2 + 18,3809)
tape 3 : calcul du coefficient de corrlation entre e1 et e2

e1 e2

1 4,02857 3,57143
2 4,97143 3,57143
3 1,62857 0,57142
4 7,56190 2,76190
5 6,24762 5,04762
6 2,31429 2,28571
7 3,34286 3,14286
8 0,40952 0,19047
9 5,34286 9,14286
10 4,97143 4,57143
re1,e2 = 0,6798 r yx1.x2
2
= re1,e2
2
= 0,4621
La corrlation entre les ventes et la publicit est donc gale 0,46 , lorsque lin-
fluence de la promotion auprs des distributeurs est retire.
2
b) Calcul de r yx3.x1 x2 par corrlation entre les rsidus
tape 1 : rgression de y sur x1 et x2
110 CONOMTRIE
9782100721511-Bourbo-C04.qxd 20/10/14 15:16 Page 111
Rsidu e1 = y (0,7368 x1 + 0,50 x2 9,9621)
tape 2 : rgression de x3 sur x1 et x2
Rsidu e2 = x3 (0,952 x1 0,304 x2 + 258,932)
tape 3 : calcul du coefficient de corrlation entre e1 et e2

e1 e2

1 6,66000 9,4000
2 2,34000 2,6000
3 2,04960 3,5440
4 5,52693 10,7040
5 2,52853 3,5280
6 3,99840 4,1760
7 1,02720 5,0080
8 0,54986 4,8480
9 1,39360 2,7040
10 1,60320 0,3520
re1,e2 = 0,921 r yx3.x1

2
x2 = re1,e2 = 0,848
2
La corrlation entre les ventes et la promotion consommateur est donc gale

0,84 , lorsque les influences de la publicit et de la promotion distributeur sont reti-
res.
2
c) Calcul de r yx3.x1 x2 partir du t Student
tape 1 : rgression de y sur x1 , x2 et x3

9782100721511-Bourbo-C04.qxd 20/10/14 15:16 Page 112
tape 2 : calcul du coefficient de corrlation partielle

Daprs [1], nous avons :
ti2 5,792
x2 = = = 0,848
2
r yx3.x1
ti2 + (n k 1) 5,792 + (10 4)
d) Autres rsultats
2
r yx1.x2 = 0,461 2
r yx1.x3 = 0,212 2
r yx2.x1 = 0,480
2
r yx2.x3 = 0,698 2
r yx3.x1 = 0,734 2
r yx3.x2 = 0,895
x3 = 0,225 x3 = 0,703 x2 = 0,848
2 2 2
r yx1.x2 r yx2.x1 r yx3.x1
la lecture de ces chiffres, lapport intrinsque de la variable promotion consom-
mateur semble le plus important pour expliquer les ventes : r yx3.x1 2
= 0,734 ;
r yx3.x2 = 0,895 et r yx3.x1 x2 = 0,848 sont les trois coefficients de corrlation partielle
2 2
les plus levs.
II. Relation entre coefficients de corrlation

simple, partielle et multiple
Dans le cas dun modle une seule variable explicative x1 , la somme des car-
rs des rsidus est gale :

SC R = et2 = (yt y)2 (1 R 2y.x 1 ) = (yt y)2 (1 r yx
2
1)
t t t
2
R y.x1 = coefficient de dtermination de la rgression de y sur x1 .
Supposons maintenant un modle deux variables explicatives :
y =
a0 +
a1 x 1 +
a2 x 2 + e
La somme des carrs des rsidus, aprs avoir retir linfluence de x1 et x2 , est
gale :
SC R = et2 = (yt y)2 (1 R 2y.x 1x 2 )
t t
R 2
y.x1 x2 = coefficient de dtermination de la rgression de y sur x1 et x2 .
2
Or r est la proportion du rsidu explique par la variable x2 seule, cette
yx2.x1
dernire expression peut donc scrire :

(yt y)2 (1 R y.x1x2
2
) = (1 r yx2.x1
2
) (yt y)2 (1 r yx1
2
) [2]
t t
Do 1 R y.x1
2
x2 = (1 r yx2.x1 )(1 r yx1 )
2 2
[3]
112 CONOMTRIE
9782100721511-Bourbo-C04.qxd 20/10/14 15:16 Page 113
Nous avons ainsi la dcomposition de linfluence relative de chacune des

variables : lapport de x2 sur y lorsque linfluence de x1 est retire et lapport de
x1 sur y (certains auteurs emploient le terme de rendement pour qualifier ces
apports relatifs).
Cette formule [3] peut tre gnralise pour un modle trois variables
explicatives :
1 R y.x1
2
x2 x3 = (1 r yx1 )(1 r yx2.x1 )(1 r yx3.x1 x2 )
2 2 2
[4]
Pour un modle quatre variables explicatives, nous obtenons :

1 R y.x1
2
x2 x3 x4 = (1 r yx1 )(1 r yx2.x1 )(1 r yx3.x1 x2 )(1 r yx4.x1 x2 x3 )
2 2 2 2
Il est noter que les indices peuvent permuter, ainsi, dans lordre, 3, 4, 1, 2 ;
la relation prcdente devient :
1 R y.x1
2
x2 x3 x4 = (1 r yx3 )(1 r yx4.x3 )(1 r yx1.x3 x4 )(1 r yx2.x1 x3 x4 )
2 2 2 2
Exercice n 2
Relation entre coefficients de corrlation simple, partielle et multiple
Un conomtre estime un modle trois variables explicatives :

y = 348,4 + 56,3 x1 9,5 x2 + 234,8 x3
(4,5) (8,3) (2,1) (4,6)
R = 0,76
2
n = 65
(.) = t de Student
2
Le coefficient de corrlation linaire entre y et x1 est connu, r yx1 = 0,52 .
2
On demande de calculer le coefficient de corrlation partielle r yx2.x1 .
Solution
2
ta3
4,62
2
Le coefficient r yx3.x1 x2 est gal : =
2
ta3
+ (n k 1) 4,6 + (65 4)
2
x2 = 0,257
2
r yx3.x1
Nous pouvons alors utiliser la relation suivante :
1 R 2y.x1 x2 x3 = (1 r yx1
2
)(1 r yx2.x1
2
)(1 r yx3.x1
2
x2 )
1 0,76 = (1 0,52)(1 r yx2,

2
x1 )(1 0,257)
2
do r yx2.x1 = 0,324

9782100721511-Bourbo-C04.qxd 20/10/14 15:16 Page 114
III. Multicolinarit :
consquences et dtection
Le terme de multicolinarit est employ dans le cas dun modle incorporant

des sries explicatives qui sont lies entre elles.
loppos, pour des sries explicatives de covariance nulle (Cov (x1 , x2 ) = 0) ,
nous dirons quelles sont orthogonales. Si, pour des tudes thoriques, nous
pouvons supposer que deux sries statistiques sont orthogonales, dans la pra-
tique, lorsque lconomiste modlise des phnomnes conomiques, les sries
explicatives sont toujours plus ou moins lies entre elles. Nous allons donc exa-
miner les consquences de la multicolinarit.
A. Consquences de la multicolinarit
Nous pouvons citer trois effets principaux :
a) augmentation de la variance estime de certains coefficients lorsque la
colinarit entre les variables explicatives augmente (le t de Student dimi-
nue) ;
b) instabilit des estimations des coefficients des moindres carrs, des faibles
fluctuations concernant les donnes entranent des fortes variations des
valeurs estimes des coefficients ;
c) en cas de multicolinarit parfaite, la matrice X X est singulire (le dter-
minant est nul), lestimation des coefficients est alors impossible et leur
variance est infinie.
Exercice n 3
Consquences de la multicolinarit
Soit un modle deux variables explicatives dont les matrices X X et X Y sont
calcules partir dun chantillon dobservations de variables centres.

200 150 350
X X = X Y =
150 113 263
114 CONOMTRIE
9782100721511-Bourbo-C04.qxd 20/10/14 15:16 Page 115
La suppression dune observation modifie les rsultats de la manire suivante :

199 149 347,5
X X = X Y =
149 112 261,5
On demande :
1) de calculer les coefficients de rgression du modle dans les deux cas ;
2) puis de calculer le coefficient de corrlation entre x1 et x2 ;
3) de commenter les rsultats.
Solution
1) Calcul des coefficients de rgression

a) Estimation des coefficients partir des donnes de base. Les quations normales
scrivent :
200 a1 + 150 a2 = 350
a1 = 1

150 a1 + 113 a2 = 263
a2 = 1
b) Estimation des coefficients aprs suppression dune observation. Les quations
normales scrivent :
199 a1 + 149
a2 = 347,5 a1 = 0,5

149 a1 + 112
a2 = 261,5 a2 = 3
2) Calcul du coefficient de corrlation

[Cov (x1 , x2 )]2
x21 ,x2 = = 0,995 x1 ,x2 = 0,995 = 0,997
Var (x1 ) Var (x2 )
3) Commentaires : une faible modification dune des observations ou du nombre dob-

servations entrane une profonde modification des valeurs estimes des coefficients,
cela est la consquence directe de la trs forte colinarit entre x1 et x2 (0,997).
Afin dviter ce problme, il convient alors de dtecter une ventuelle multicolina-
rit lors de lestimation dun modle.
B. Tests de dtection dune multicolinarit

1) Test de Klein1
Le test de Klein est fond sur la comparaison du coefficient de dtermination R y2

calcul sur le modle k variables :
y =
a0 +
a1 x 1 +
a2 x 2 + . . . +
ak x k + e
1. Klein L.R., page 101, 1962.

9782100721511-Bourbo-C04.qxd 20/10/14 15:16 Page 116
2
et les coefficients de corrlation simple r xi, x j entre les variables explicatives
pour i
= j .
Si R y2 < r xi,
2
x j , il y a prsomption de multicolinarit.
Il ne sagit pas dun test statistique au sens test dhypothses mais simple-
ment dun critre de prsomption de multicolinarit.
2) Test de Farrar et Glauber1

La premire tape consiste calculer le dterminant de la matrice des coeffi-
cients de corrlation entre les variables explicatives.

1 r x1 x2 r x1 x3 . . . r x1 xk

r 1 r x2 x3 . . . r x2 xk
D = x2 x1
... ... ... ... ...

r xk x1 r xk x2 r xk x3 ... 1
Lorsque la valeur du dterminant D tend vers zro, le risque de multicoli-
narit est important.
Par exemple, pour un modle deux variables explicatives, si les deux sries
sont parfaitement corrles, le dterminant D scrit :

1 r x1 x2 1 1
D = = =0
r x2 x1 1 1 1
Dans le cas oppos o les sries explicatives sont orthogonales, le dtermi-
nant devient :
1 r x1 x2 1 0
D = = =1
r x2 x1 1 0 1
La deuxime tape consiste effectuer un test du 2 , en posant les hypo-
thses suivantes :
H0 : D = 1 (les sries sont orthogonales) ;
H1 : D < 1 (les sries sont dpendantes).
La valeur empirique du 2 calcule partir de lchantillon est gale :

1
= n 1 (2 K + 5) . Ln D
2
6
o n est la taille de lchantillon, K le nombre de variables explicatives (terme
constant inclus, K = k + 1 ) et Ln le logarithme nprien.
1
Si 2 2 lu dans la table K (K 1) degrs de libert et au seuil choisi,
2
alors lhypothse H0 est rejete, il y a donc prsomption de multicolinarit.
Si 2 < 2 , alors nous acceptons lhypothse dorthogonalit.
1. Farrar D.E. et Glauber R.R., 1967.
116 CONOMTRIE
9782100721511-Bourbo-C04.qxd 20/10/14 15:16 Page 117
Exercice n 4 fichier C4EX4

Tests de multicolinarit
Un conomiste cherche expliquer la variable y laide de quatre sries explicatives
x1 , x2 , x3 et x4 . Il dsire auparavant tester une ventuelle multicolinarit entre ces
quatre sries ; pour ce faire, il dispose des donnes du tableau 2.
Tableau 2 Ces sries statistiques sont-elles colinaires ?
. y x1 x2 x3 x4
8,40 82,90 17,10 92,00 94,00
9,60 88,00 21,30 93,00 96,00
10,40 99,90 25,10 96,00 97,00
11,40 105,30 29,00 94,00 97,00
12,20 117,70 34,00 100,00 100,00
14,20 131,00 40,00 101,00 101,00
15,80 148,20 44,00 105,00 104,00
17,90 161,80 49,00 112,00 109,00
19,30 174,20 51,00 112,00 111,00
20,80 184,70 53,00 112,00 111,00
On demande donc dappliquer les tests suivants :

1) test de Klein,
2) test de Farrar-Glauber.
Solution
1) Test de Klein
a) Rgression : y = a0 + a1 x1 + a2 x2 + a3 x3 + a4 x4 + .
Les rsultats de lestimation sont les suivants :
y = 13,53 + 0,096 x1 + 0,015 x2 0,199 x3 + 0,34 x4 + e
(1,80) (3,66) (0,30) (2,20) (2,27)
n = 10
R 2 = 0,998
(.) = t de Student
b) Calcul des coefficients de corrlation simple entre les variables explicatives :
x2 = 0,976 x3 = 0,960 x4 = 0,974
2 2 2
r x1, r x1, r x1,
x3 = 0,938 x4 = 0,938 x4 = 0,982
2 2 2
r x2, r x2, r x3,
la lecture de ces coefficients il ne semble pas ressortir des risques graves de mul-
ticolinarit puisque tous les coefficients de corrlation simple sont infrieurs au coeffi-
cient de dtermination. Toutefois, nous observons quils sont tous trs levs.

9782100721511-Bourbo-C04.qxd 20/10/14 15:16 Page 118
2) Test de Farrar-Glauber
Calcul du dterminant

1 r x1 x2 r x1 x3 r x1 x4

r 1 r x2 x3 r x2 x4
D = x2 x1 =
r x3 x1 r x3 x2 1 r x3 x4

r x4 x1 r x4 x2 r x4 x3 1

1 0,988 0,980 0,987

0,988 1 0,969 0,969
= = 0,92198 105
0,980 0,969 1 0,991
0,987 0,969 0,991 1
La valeur empirique du 2 calcule partir de lchantillon est :

1
2 = n 1 (2 K + 5) Ln D
6

2 1
= 10 1 (2 5 + 5) 11,59 = 75,33
6
Cette valeur est comparer la valeur lue dans la table :

1
2 K (K 1) = 10 degrs de libert et pour un seuil = 0,05 , soit :
2
2 = 18,31
Puisque 2 > 2 , nous rejetons lhypothse H0 , il y a prsomption de multicoli-

narit.
Ces deux tests conduisent donc des rsultats diffrents, cependant le test de Farrar-
Glauber, dont le fondement thorique est plus affirm, semble devoir tre privilgi.
C. Comment remdier la multicolinarit ?

Nous ne ferons que citer les diffrentes techniques permettant dapporter des
solutions au problme de multicolinarit, le lecteur intress par les dvelop-
pements mthodologiques peut se rapporter Judge1.
Augmenter la taille de lchantillon : cette technique nest efficace que si
lajout dobservations diffre significativement de celles figurant dj dans le
modle, sinon il y aura reconduction de la multicolinarit.
La Ridge Regression est une rponse purement numrique, il sagit de
transformer la matrice X X en ( X X + cI ) o c est une constante choisie arbi-
trairement qui, en augmentant les valeurs de la premire diagonale, rduit les
effets numriques de la multicolinarit.
1. Judge G.G. et al, pages 874-882, 1988.
118 CONOMTRIE
9782100721511-Bourbo-C04.qxd 20/10/14 15:16 Page 119
Face ces artifices de calcul, la seule parade vraiment efficace consiste, lors
de la spcification de modle, liminer les sries explicatives susceptibles de
reprsenter les mmes phnomnes et donc dtre corrles entre elles, ceci afin
dviter leffet de masque.
Au paragraphe suivant, nous prsentons des mthodes permettant de dter-
miner le mix optimal de variables explicatives.
IV. Slection du modle optimal

Dans la pratique, lconomtre est souvent confront au choix de plusieurs
variables explicatives x1 , x2 , , xk candidates pour expliquer la variable y . Des
procdures statistiques permettent de dterminer quelles variables retirer ou
quelles variables ajouter dans un modle. Cette dmarche exclut tout raisonne-
ment conomique car elle permet daboutir des modles conomtriques qui
sont souvent bons sur le plan statistique mais dont linterprtation conomique
savre nulle, voire aberrante. Ces techniques automatiques de slection de
variables explicatives sont donc manier avec prudence.
Au problme de la slection des variables explicatives sajoute celui du choix
effectuer entre plusieurs modles concurrents, cest--dire des modles dont
les variables sont toutes significatives mais qui ne sont pas les mmes.
La question se pose alors de slectionner le meilleur modle.
Le critre de maximisation du R 2 (coefficient de dtermination) consiste
retenir le modle dont le R 2 est le plus lev. Ce critre prsente linconvnient
de ne pas arbitrer entre la perte de degrs de libert du modle et lajustement
qui en rsulte. Cest pourquoi on prfre utiliser les critres de Akaike1 ou de
Schwarz2 afin de comparer des modles impliquant un nombre diffrents de
Nous retenons le modle qui minimise la fonction de Akaike (Akaike
Information Criterion) :

SC R 2k
AI C = Ln +
n n
ou de Schwarz (Schwarz Criterion) :

SC R k Ln (n)
SC = Ln +
n n
1. Akaide H., 1973 ; 1974.

2. Schwarz, 1978.

9782100721511-Bourbo-C04.qxd 20/10/14 15:16 Page 120
Avec :
Ln = Logarithme nprien,
SCR = somme des carrs des rsidus du modle,
n = nombre dobservations,
k = nombre de variables explicatives.
Nous allons examiner cinq mthodes qui vont nous permettre de retenir le
meilleur modle, celui qui est compos des variables qui sont :
les plus corrles avec la variable expliquer ;
les moins corrles entre elles.
Toutes les rgressions possibles

Il sagit de la mthode la plus simple dans son expos : nous estimons toutes
les combinaisons de rgressions possibles (2k 1 possibilits, k = nombre de
variables explicatives candidates) et le modle retenu est celui dont le critre de
Akaike ou de Schwarz est minimum pour un modle comportant des variables
explicatives toutes significatives. La limite dutilisation de cette mthode est lie
au nombre initial de variables explicatives candidates, par exemple si k = 10 , le
nombre de combinaisons possibles est de 1023 .
Llimination progressive ( Backward Elimination )

Cette procdure consiste, sur le modle complet k variables explicatives,
liminer de proche en proche (cest--dire en restimant lquation aprs chaque
limination) les variables explicatives dont les t de Student sont en dessous du
seuil critique. Cette procdure nest utilisable que si la premire quation peut
tre effectivement estime, ce qui nest pas toujours le cas. En effet, lorsque le
modle comporte un nombre important de variables explicatives, le risque de
colinarit entre ces variables est lev et la matrice X X peut tre singulire.
La slection progressive ( Forward Regression )

Dans cette procdure, on slectionne, dans une premire tape, la variable
explicative dont le coefficient de corrlation simple est le plus lev avec la
variable y , soit xi cette variable. La deuxime tape consiste alors calculer les
2
coefficients de corrlation partielle r yx j xi
pour j
= i et retenir la variable expli-
cative ayant le coefficient le plus lev. La slection sarrte lorsque les t de
Student des variables explicatives sont infrieurs au seuil critique.
La rgression pas pas ( Stepwise Regression )

Cette procdure est identique la prcdente, sauf quaprs avoir incorpor
une nouvelle variable explicative, nous examinons les t de Student de chacune
des variables explicatives pralablement slectionnes et nous liminons du
modle celle(s) dont le t du Student est infrieur au seuil critique.
120 CONOMTRIE
9782100721511-Bourbo-C04.qxd 20/10/14 15:16 Page 121
La rgression par tage ( Stagewise Regression )

Cest un processus de slection de variables explicatives permettant de mini-
miser les intercorrlations entre les sries explicatives par tude du rsidu.
1re tape
La variable explicative dont le coefficient de corrlation simple est le plus
lev avec la variable y est slectionne, soit xi cette variable.
2e tape
Calcul du rsidu de la rgression de y sur xi :
e1 = y
a0
a1 x i
Les coefficients de corrlation simple entre le rsidu e1 et les variables expli-
catives sont calculs, nous retenons la variable explicative dont le coefficient est
le plus lev. Soit x j cette variable explicative.
3e tape
Nous calculons un nouveau rsidu :
e2 = y
a0
a1 x i
a2 x j
Les coefficients de corrlation simple entre le rsidu e2 et les variables expli-

catives sont calculs, nous retenons la variable explicative dont le coefficient est
le plus lev, ce qui permet de dgager un nouveau rsidu.
La procdure est arrte lorsque les coefficients de corrlation ne sont plus
significativement diffrents de 0 .
Exercice n 5
fichier C4EX4
Mthodes de slection de variables explicatives

En utilisant les cinq procdures dcrites prcdemment et en reprenant les donnes
du tableau 2, on demande de slectionner, parmi la (ou les) variable(s) explicative(s) can-
didate(s), celle(s) dont le pouvoir explicatif est le plus important.
Solution
a) Toutes les rgressions possibles

Nous devons estimer (2k 1 = 24 1) 15 modles.

9782100721511-Bourbo-C04.qxd 20/10/14 15:16 Page 122
Tableau 3 Rsultats des 15 rgressions (les coefficients non significativement

diffrents de 0 sont en caractres gras, italiques)
M1 Sries X1 R2 AIC 1 SC
Coefs. 0,118 0,995 2,185 2,125
t de Student 41,9
M2 Sries X2
Coefs. 0,327 0,967 0,199 0,138
t de Student 15,3
M3 Sries X3
Coefs. 0,516 0,952 0,185 0,245
t de Student 12,5
M4 Sries X4
Coefs. 0,663 0,978 0,583 0,523
t de Student 18,6
M5 Sries X1 X2
Coefs. 0,132 0,039 0,996 2,058 1,967
t de Student 6,91 0,72
M6 Sries X1 X3
Coefs. 0,126 0,036 0,996 2,026 1,936
M7 Sries X1 X4
Coefs. 0,102 0,090 0,996 2,087 1,996
M8 Sries X2 X3
Coefs. 0,209 0,194 0,975 0,273 0,183
M9 Sries X2 X4
Coefs. 0,137 0,395 0,988 0,993 0,903
M10 Sries X3 X4
Coefs. 0,166 0,871 0,979 0,457 0,366
M11 Sries X1 X2 X3
Coefs. 0,139 0,038 0,035 0,996 1,898 1,778
t de Student 5,58 0,66 0,49
M12 Sries X1 X2 X4
Coefs. 0,115 0,028 0,074 0,996 1,926 1,805
t de Student 3,55 0,48 0,64
M13 Sries X1 X3 X4
Coefs. 0,104 0,188 0,319 0,998 2,59 2,469
t de Student 7,46 2,47 2,62
M14 Sries X2 X3 X4
Coefs. 0,164 0,300 0,720 0,993 1,304 1,183
t de Student 3,32 1,99 3,81
M15 Sries X1 X2 X3 X4
Coefs. 0,097 0,015 0,199 0,340 0,998 2,408 1,804
t de Student 3,66 0,30 2,20 2,27
1. Nous utilisons les formules de la section IV afin de calculer les critres dinformation de Akaike
et de Schwarz, le logiciel Eviews utilise des formules lgrement diffrentes.
122 CONOMTRIE
9782100721511-Bourbo-C04.qxd 20/10/14 15:16 Page 123
Parmi ces 15 quations, laquelle est la meilleure ?

Il faut liminer celles dont un ou plusieurs ratios de Student (sauf en ce qui concer-
ne le terme constant dont nous acceptons quil soit non significativement diffrent
de 0) sont infrieurs au seuil critique (environ 2,30) : M5, M6, M7, M8, M10, M11,
M12, M14, M15.
Parmi les 6 quations restantes, on slectionne celle dont le critre de Akaike et de
Schwarz est le plus faible1, do M13 :
choix : x1 x3 x4
partir de cet exemple, nous prenons la dimension du travail mener2 et les limites,
donc, de cette mthode.
b) Llimination progressive
Estimation du modle complet

partir du modle estim avec 4 variables explicatives, nous retirons la variable dont
le ratio de Student est le plus faible, soit x2 .
Estimation 3 variables
Le modle estim est le modle [M13], toutes les variables sont significatives
(t > 2,30) , la procdure de slection sarrte :
choix : x1 x3 x4
c) La slection progressive
Calcul des coefficients de corrlation entre y et x1 , x2 , x3 , x4

yx1 = 0,997 ; yx2 = 0,983 ; yx3 = 0,975 ; yx4 = 0,988
La premire variable slectionne est x1 .
Estimation des 3 modles deux variables explicatives : x1 et x2 , x1 et x3 , x1 et x4 .

Modles : [M5], [M6] et [M7]. Dans ces trois modles la nouvelle variable explicative
nest jamais significative, la procdure est termine :
choix x1
d) La rgression pas pas
Calcul des coefficients de corrlation entre y et x1 , x2 , x3 , x4 . La premire variable

slectionne est x1 .
Estimation des 3 modles deux variables explicatives : x1 et x2 , x1 et x3 , x1 et x4 ,
dans chacun de ces modles au moins une des variables nest pas significative, la
procdure est donc termine et nous sommes ramens au cas prcdent :
choix x1
1. Nous constatons quil sagit aussi de lquation dont le R 2 est le plus lev.
2. Et pourtant nous navons que quatre variables explicatives candidates.

9782100721511-Bourbo-C04.qxd 20/10/14 15:16 Page 124
e) La rgression par tage
Calcul des coefficients de corrlation entre y et x1 , x2 , x3 , x4 . La premire variable

slectionne est x1 .
Rgression et calcul de e1 = y + 1,24 0,11 x1 (modle [M1])
e1

1 0,123762
2 0,475231
3 0,127120
4 0,236519
5 0,424754
6 0,007913
7 0,419014
8 0,078300
9 0,017027
10 0,279659
Calcul des coefficients de corrlation entre e1 et x1 , x2 , x3 , x4

e1 x1 = 0,000 ; e1 x2 = 0,040 ; e1 x3 = 0,039 ; e1 x4 = 0,048
Le coefficient de corrlation entre e1 et x1 est par construction nul puisque linfor-
mation relative x1 nest plus contenue dans le rsidu (ou encore les vecteurs e1 et x1
sont orthogonaux).
Les autres coefficients de corrlation ne sont pas significativement diffrents de 0 , la
procdure de slection est donc termine :
choix x1
Commentaires :
Seule la procdure de llimination progressive ne fournit pas les mmes rsultats de

slection que les quatre autres procdures. Il apparat au vu de ces rsultats que si lli-
mination progressive ne maximise pas le R 2 , elle permet, en revanche, de slectionner
une information plus abondante en terme de variables explicatives.
Dans la pratique, la procdure la plus utilise est la rgression pas pas, cest cette
dernire qui est disponible dans la plupart des logiciels dconomtrie.
124 CONOMTRIE
9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 125
5. Problmes particuliers :
la violation
des hypothses
C
e chapitre est consacr aux problmes particuliers lis au non-
respect des hypothses. Nous nous attachons particulirement
deux formes classiques :
en I., lautocorrlation des erreurs ;
en II., lhtroscdasticit.
Ltude de ces deux phnomnes nous permet de dfinir un nouvel esti-
mateur : lestimateur des moindres carrs gnraliss, utilis lorsque la
matrice des variances et covariances de lerreur ne rpond plus aux hypo-
thses classiques, telles que nous les avons supposes ralises jusqu
maintenant.
Pour chacun de ces deux cas, nous prsentons les mthodes dinvestiga-
tion : tests de dtection, consquences et procdures destimation.
Enfin, la section III. est consacre au cas o les variables sont observes
avec erreur.
I. Lautocorrlation des erreurs

A. Prsentation du problme
Jusqu maintenant, nous avons considr que, lors de lestimation des para-
mtres du modle, les hypothses suivantes sont toutes respectes.
Problmes particuliers : la violation des hypothses 125

9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 126
H1 : le modle est linaire en xt .

H2 : les valeurs xt sont observes sans erreur.
H3 : E(t ) = 0 .
H4 : E(t2 ) = 2 .
H5 : E(t t ) = 0 si t = t .
H6 : Cov (xt , t ) = 0 .
La spcification de la matrice des variances-covariances de lerreur est :

E(1 1 ) E(1 2 ) ... E(1 n )
E(2 1 ) E(2 2 ) ... E(2 n )
= E( ) = =
...
E(n 1 ) E(n 2 ) . . . E(n n )

2 0 0 ... 0
0 2 0 ... 0
=
...
0 0 0 . . . 2
Lorsque lhypothse H5 nest plus vrifie, la matrice E( ) = = 2 I na

plus cette forme particulire (elle nest plus compose de 0 lextrieur de la
premire diagonale, puisque Cov (t , t ) = 0 ) et les estimateurs obtenus par la
mthode des MCO sont sans biais mais ne sont plus variance minimale, en
effet :
a = E{( a a) } = (X X)1 X E( ) X (X X)1 =
a a)(
= (X X)1 (X X)(X X)1
Cest--dire que a est un estimateur dont la premire diagonale de la matri-
ce des variances et covariances est suprieure celle de 2 (X X)1 .
Nous sommes donc amens nous poser trois questions :
Comment dterminer un nouvel estimateur pour a ?
Comment dtecter une ventuelle autocorrlation des erreurs ?
Quelles mthodes destimation doit-on utiliser ?
B. Lestimateur des Moindres Carrs Gnraliss (MCG)

Considrons le modle linaire gnral
Y = X a +
(n, 1) (n, k + 1) (k + 1,1) (n,1)
dans lequel E( ) = = 2 I ( est de dimension n , n ).
Nous dsirons dterminer un estimateur de a qui ait les mmes proprits
que lestimateur des MCO : sans biais, fonction linaire de Y et variance mini-
male. Il est dmontr que cet estimateur est donn par :
126 CONOMTRIE
9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 127
a = (X 1
X)
1
(X 1
Y) [1]
1 1
a = (X X) [2]
Cet estimateur est appel estimateur des Moindres Carrs Gnraliss

(MCG) ou encore estimateur de Aitken.
Remarque : lorsque les hypothses classiques sont satisfaites, nous retrou-
vons lestimateur des MCO :
a = (X 1
X)
1
(X 1
Y) =

1

1 1
= X I X X
I Y = (X X)1 (X Y )
2 2
Dans la pratique, nous ne connaissons pas la matrice , les formules ci-des-
sus ne sont pas utilisables, sauf dans des cas exceptionnels. Il convient donc de
prsenter des procdures destimation oprationnelles.
C. Les causes et la dtection

de lautocorrlation des erreurs
1) Dfinition et causes
Nous sommes en prsence dune autocorrlation des erreurs lorsque les erreurs
sont lies par un processus de reproduction1. Nous pouvons distinguer lauto-
corrlation positive (graphique 1) qui est caractrise par des successions de
rsidus de mme signe, de lautocorrlation ngative (graphique 2) qui est carac-
trise par une alternance positive et ngative des rsidus.
Graphique 1 Autocorrlation positive
1. Nous pouvons parler de processus mmoire , par comparaison des processus purement
alatoires.

9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 128
Graphique 2 Autocorrlation ngative
Lautocorrlation des erreurs peut tre observe pour plusieurs raisons :

labsence dune variable explicative importante dont lexplication rsi-
duelle permettrait de blanchir 1 les erreurs ;
une mauvaise spcification du modle, les relations entre la variable
expliquer et les variables explicatives ne sont pas linaires et sexpriment
sous une autre forme que celle du modle estim (logarithmes, diffrences
premires, etc.) ;
un lissage par moyenne mobile ou une interpolation des donnes cre une
autocorrlation artificielle des erreurs due lusage de ces deux oprateurs.
Lautocorrlation des erreurs se rencontre essentiellement dans les modles
en srie temporelle o linfluence dune erreur due une mauvaise spcifica-
tion dune priode sur lautre est plausible. Dans le cas de modle spcifi en
coupe instantane, nous ne pouvons concevoir une autocorrlation des erreurs
que si les observations ont t pralablement tries en fonction croissante (ou
dcroissante) de la variable expliquer. En effet, la collecte des donnes sef-
fectue de manire alatoire et la succession des valeurs de la variable expliquer
na donc aucune raison de gnrer une autocorrlation des erreurs.
2) Dtection
La dtection dune ventuelle dpendance des erreurs ne peut seffectuer qu
partir de lanalyse des rsidus, en effet eux seuls sont connus.
a) Examen visuel des rsidus

Lanalyse graphique des rsidus permet le plus souvent de dtecter un processus
de reproduction des erreurs lorsque :
1. Ce terme de blanchir vient de la notion de bruit blanc ( White Noise ), qui qualifie des
processus purement alatoires.
128 CONOMTRIE
9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 129
les rsidus sont pendant plusieurs priodes conscutives soit positifs, soit
ngatifs : autocorrlation positive (graphique 1) ;
les rsidus sont alterns : autocorrlation ngative (graphique 2).
Cependant, le plus souvent, lanalyse graphique est dlicate dinterprtation
car le dessin des rsidus ne prsente pas des caractristiques toujours videntes.
b) Test de Durbin et Watson

Le test de Durbin et Watson (DW ) permet de dtecter une autocorrlation des
erreurs dordre 1 selon la forme :
t = t1 + vt avec vt N (0, v2 )

H0 : = 0
H1 : = 0
(ou < 0 ou > 0 , attention le seuil nest alors pas le mme).
Pour tester lhypothse nulle H0, nous calculons la statistique de Durbin et
Watson :

n
(et et1 )2
DW =
t=2
[3]

n
2
e
t
t=1
o et sont les rsidus de lestimation du modle.

De par sa construction, cette statistique varie entre 0 et 4 et nous avons
DW = 2 lorsque = 0 ( est le observ). Afin de tester lhypothse H0,
Durbin et Watson ont tabul les valeurs critiques de DW au seuil de 5 % en fonc-
tion de la taille de lchantillon n et du nombre de variables explicatives (k ). La
lecture de la table permet de dterminer deux valeurs d1 et d2 comprises entre 0
et 2 qui dlimitent lespace entre 0 et 4 selon le schma 1 :
Schma 1 Interprtation du test de Durbin et Watson
Selon la position du DW empirique dans cet espace, nous pouvons conclure :

d2 < DW < 4 d2 , on accepte lhypothse H0 = 0 ;
0 < DW < d1 , on rejette lhypothse H0 > 0 ;

9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 130
4 d1 < DW < 4 , on rejette lhypothse H0 < 0 ;

d1 < DW < d2 ou 4 d2 < DW < 4 d1 ;
nous sommes dans une zone dindtermination, ou zone de doute, cest--dire
que nous ne pouvons pas conclure1 dans un sens comme dans lautre.
Le graphique 3 illustre ces rgles de dcision.
Graphique 3 Densits de probabilit de d1 et d2
Conditions dutilisation :
le modle doit comporter imprativement un terme constant2 ;
la variable expliquer ne doit pas figurer parmi les variables explicatives (en
tant que variable retarde), il faut alors recourir la statistique h de Durbin
(cf. chapitre 7, I. B.) ou au test de Breusch-Godfrey (cf. ci-dessous) ;
pour les modles en coupe instantane, les observations doivent tre ordon-
nes en fonction des valeurs croissantes ou dcroissantes de la variable
expliquer ou dune variable explicative souponne tre la cause de lauto-
corrlation ;
le nombre dobservations doit tre suprieur ou gal 15.
Le test de Durbin et Watson est un test prsomptif dindpendance des
erreurs du fait quil utilise les rsidus ; de plus, il ne teste quune autocorrla-
tion dordre 13.
c) Test de Breusch-Godfrey4
Ce test, fond sur un test de Fisher de nullit de coefficients ou de Multiplicateur
de Lagrange ( LM test , cf. chapitre 3), permet de tester une autocorrlation
1. Dans la pratique, on accepte lhypothse la plus dsastreuse ! Cependant il serait licite dac-
cepter lhypothse dindpendance.
2. Les tables de DW sont gnralement tabules pour des modles comportant un terme constant,
cependant il existe des tables pour des modles sans terme constant.
3. Cela signifie que le test de Durbin et Watson ne dtecte pas une autocorrlation dordre suprieur
1 , par exemple entre t et t + 4 pour une srie trimestrielle qui ne serait pas dsaisonnalise.
4. Breusch (1978) et Godfrey (1978).
130 CONOMTRIE
9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 131
dun ordre suprieur 1 et reste valide en prsence de la variable dpendante

dcale en tant que variable explicative. Lide gnrale de ce test rside dans la
recherche dune relation significative entre le rsidu et ce mme rsidu dcal.
Une autocorrlation des erreurs dun ordre p scrit :
t = 1 t1 + 2 t2 + . . . + p t p + vt
Soit le modle gnral erreurs autocorrles dordre p :
yt = a1 x1t + a2 x2t + . . . + ak xkt + a0 + 1 t1 + 2 t2 + . . . + p t p + vt
Ce test est men en trois tapes :

Estimation par les MCO du modle et calcul du rsidu et , puisque les
erreurs sont inconnues, le test porte sur les rsidus.
Estimation par les MCO de lquation intermdiaire :
et = a1 x1t + a2 x2t + . . . + ak xkt + a0 + 1 et1 + 2 et2 + . . . + p et p + vt
Soit n le nombre dobservations disponibles (attention chaque dcalage
entrane la perte dune observation) pour estimer les paramtres du modle et R 2
le coefficient de dtermination. Certains auteurs prconisent, afin de ne pas
perdre dobservations, de mettre 0 les premires valeurs du rsidu dcal. La
diffrence nest perceptible que pour des petits chantillons.
Test dhypothses sur lquation intermdiaire.
Lhypothse H0 dabsence dautocorrlation des erreurs tester est :
H0 : 1 = 2 = . . . = p = 0
Si on refuse lhypothse nulle, alors il existe un risque dautocorrlation des
erreurs lordre p .
Pour mener ce test, nous avons deux possibilits : soit effectuer un test de Fisher
classique de nullit des coefficients i (cf. chapitre 3), soit recourir la statistique
LM qui est distribue comme un 2 p degrs de libert ; si n R 2 > 2 ( p) lu
dans la table au seuil , on rejette lhypothse dindpendance des erreurs.
d) Tests de Box-Pierce et Ljung-Box
Ces tests prsents au chapitre 9 (section I. C.) permettent de tester un ensemble
de coefficients dautocorrlation des rsidus dun ordre gal ou suprieur 1.
Exercice n 1
fichier C5EX1
Tests dindpendance des erreurs

Soit le modle trois variables explicatives :
yt = a0 + a1 x1t + a2 x2t + a3 x3t + t

9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 132
Nous disposons des observations annuelles (tableau 1) sur 20 ans :
Tableau 1 Donnes annuelles (extrait)
Anne y x1 x2 x3
1 87,40 98,60 99,10 108,5
2 97,60 101,20 99,10 110,1

19 110,70 105,30 93,00 108,5
20 127,10 107,60 106,60 111,3
Nous nous proposons de dceler une ventuelle autocorrlation dordre 1 des erreurs,
pour cela on demande :
1) destimer les coefficients du modle ;
2) deffectuer lanalyse graphique des rsidus ;
3) de calculer la statistique de Durbin et Watson et deffectuer le test ;
4) enfin, deffectuer le test de Breusch-Godfrey.
Solution
1) Les rsultats de lestimation partir de Eviews sont les suivants :

C 242.7951 26.79995 9.059538 0.0000
X1 3.897408 0.400325 9.735616 0.0000
X2 0.404365 0.061351 6.590977 0.0000
X3 0.878886 0.240216 3.658727 0.0021
R-squared 0.938895 Mean dependent var 97.53500

Adjusted R-squared 0.927438 S.D. dependent var 11.83048
S.E. of regression 3.186826 Akaike info criterion 5.332784
Sum squared resid 162.4937 Schwarz criterion 5.531931
Log likelihood 49.32784 F-statistic 81.94784
Durbin-Watson stat 1.053794 Prob(F-statistic) 0.000000
Les trois coefficients des variables explicatives sont significativement diffrents de 0

0,05
(t16 = 2,12 ), le Fisher empirique est suprieur au Fisher lu (F3,160,05
= 3,24 ), le modle
semble satisfaisant.
132 CONOMTRIE
9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 133
2) Eviews fournit directement le graphique des rsidus.
Lanalyse de ce graphique rvle des rsidus qui semblent cycliques, ceci est symp-
tomatique dune autocorrlation positive des rsidus.
3) Les conditions dutilisation du test de Durbin et Watson sont bien respectes : le

modle est spcifi en srie temporelle, le nombre dobservations (n = 20 ) est
suprieur 15 et, enfin, le modle estim comporte un terme constant.
Le calcul de la statistique partir des rsidus est alors :

n
(et et1 )2
t=2 171,23
DW = = = 1,053

n
162,49
et2
t=1
Cette valeur est comparer celles lues dans la table de Durbin et Watson n = 20
et k = 3 , soit d1 = 1,00 et d2 = 1,68 . La valeur DW se situe dans la zone de doute
(d1 < DW < d2 incertitude), cependant proximit immdiate de la zone de rejet de
H0, nous pouvons plutt conclure une autocorrlation positive des rsidus, donc une
prsomption de dpendance des erreurs.
4) Les donnes tant annuelles, nous testons une autocorrlation dordre 2, un ordre
suprieur deux ans ne semble pas justifi. Nous estimons donc le modle :
et = a1 x1t + a2 x2t + a3 x3t + a0 + 1 et1 + 2 et2 + vt
Soit : et = 17,26 + 0,5287x1t 0,0369x2t 0,3149x3t + 0,589 et1 0,497et2
avec : R 2 = 0,33 et n = 18 (car nous avons perdu deux observations du fait du dca-
lage).

9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 134
L M = n R 2 = 18 0,33 = 5,94 < 0,05

2
(2) = 5,99 , nous sommes la limite dac-
ceptation de lhypothse H0 pour un seuil de 5 %.
Nous testons alors un ordre 1, soit lestimation suivante :
et = 11,82 + 0,087 x1t 0,0158 x2t 0,044 x3t + 0,507 et1
avec : R = 0,196 et n = 19 , do L M = 19 0,196 = 3,72 < 0,05
2 2
(1) = 3,84 .
Nous sommes, l encore, la limite dacceptation (probabilit critique c = 5,37 %)
de lhypothse H0, compte tenu de toutes ces informations (test de Durbin-Watson, test
de Breusch-Godfrey), nous sommes enclins accepter lhypothse dautocorrlation des
erreurs.
Les estimateurs que nous avons trouvs sont sans biais mais non variance mini-
male, il convient donc de dterminer une procdure adquate destimation.
Il est noter que tous les commentaires de la question 1 concernant la validit sta-
tistique du modle sont maintenant caducs.
D. Les procdures destimation en cas

dautocorrlation des erreurs
1) Principes gnraux
Si nous retenons lhypothse dune autocorrlation des erreurs dordre 1, le
modle linaire scrit :
Y = Xa +
avec
t = t1 + vt || < 1 [4]
(processus autorgressif dordre 1 : AR(1) )1 o vt N (0; v2 ) et E(vt vt ) = 0
pour t = t .
En procdant par substitution successive de [4], nous obtenons :
t = ( t2 + vt1 ) + vt = 2 t2 + ( vt1 + vt )
[5]
t = vt + vt1 + 2 vt2 + 3 vt3 + . . .
Ce processus tend vers 0 puisque || < 1 .

Nous allons tudier les proprits de t .
1. On note les processus autorgressifs par : AR( p) , o p est lordre du processus autorgressif.
Le chapitre 9 est consacr ltude gnrale de ce type de processus.
134 CONOMTRIE
9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 135
E(t ) = E(t1 + vt ) = E(t1 ) + E(vt ) = 0

E(t2 ) = E(t1 + vt )2 = 2 E(t1
2
) + E(vt2 ) car vt est indpendant de t .
La variance de t tant homoscdastique, nous avons : E(t2 ) = E(t1
2
) = 2 .
v2
Soit : 2 (1 2 ) = v2 2 = [6]
(1 2 )
Cov(t ,t+1 ) = E(t ,t+1 ) = E(t ,(t + vt+1 )) = 2
Cov(t ,t+2 ) = E(t ,t+2 ) = E(t ,(t+1 + vt+2 )) = E(t ,t+1 ) = 2 2

i v2
Cov(t ,t+i ) = E(t ,t+i ) = i 2 =
(1 2 )
La matrice des variances-covariances de lerreur dans ce cas est alors :

1 2 . . . n1

v 2 1 . . . n2

2
= E( ) = 1 . . . n3 avec = 1
1 2 . . .
n1 n2 n3 ... 1
Lestimateur des MCG est gal daprs [1] :
a = (X 1
X)
1
(X 1
Y)
o

1 0 0 ... ... 0
1 + 2 0 ... ... 0
1
0 1 + 2 ... ...

0
1 = 2

v . . .

0 ... . . . 1 + 2
0 ... 0 1
Cependant, nous ne connaissons ni le terme , ni la variance v2 ; nous allons

donc chercher une transformation matricielle M telle que le modle
MY = M Xa + M ait ses erreurs indpendantes et homoscdastiques.
Soit :
E(M(M) ) = E(M M ) = M E( ) M = M M = v2 I
Dans ce cas, on peut dterminer lestimateur BLUE de a par la mthode des
MCO :
a = ((M X) M X)1 (M X) MY = (X M M X)1 X M MY
[7]

9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 136
En identifiant terme terme [1] et [7] on obtient :

M M = 1 2 1
= v puisque si lgalit [1] = [7] est vrifie pour
1
M M = , elle lest aussi pour 1

quel que soit .
La matrice
1 0 0 ... 0
0 1 0 ... 0
M
= 0 0 1 0
(n 1, n)
...

0 0 0 ... 1
remplit cette condition puisque :

2 0 0 ... 0
1 + 2 0 ... 0

0 1 + 2 ... 0
M M =
...

0 ... . . . 1 + 2
0 ... 0 1
et v2 1
sont identiques au premier terme prs 2 au lieu de 1 .
Ainsi, nous pouvons substituer la mthode des MCG, la mthode des MCO
(si n est suffisamment grand) applique au modle linaire MY = M Xa + M
qui nest autre que le modle initial dans lequel les variables sont transformes
par un passage aux quasi-diffrences premires1. En effet :

y2 y1 xk2 xk1
y y2 xk3 xk2
MY = 3 et M X k =
... ...
yn yn1 xkn xkn1
Cas particulier : lorsquil y a autocorrlation parfaite ( = 1) , nous
sommes amens appliquer la mthode des MCO sur le modle en diffrences
premires.
Nous allons montrer partir dun exemple le bien-fond de la transformation
en quasi-diffrences.
Soit le modle deux variables explicatives :
yt = a0 + a1 x1t + a2 x2t + t [8]
avec t = t1 + vt avec || < 1 (vt N (0; v2 ) et E(vt vt ) = 0 pour t = t ) .
Le modle [8] peut scrire en t 1 :
yt1 = a0 + a1 x1t1 + a2 x2t1 + t1 [9]
Le calcul de [8] [9] nous donne :
yt yt1 = a0 (1 ) + a1 (x1t x1t1 ) + a2 (x2t x2t1 ) + (t t1 )
dyt = b0 + a1 dx1t + a2 dx2t + vt
entrane la
1. Cette transformation perte dune observation, toutefois on peut remplacer la premire
observation par 1 2 y1 et 1 2 xk1 .
136 CONOMTRIE
9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 137
Le terme alatoire vt rpond aux hypothses dapplication de la mthode des

MCO, nous pouvons donc utiliser les procdures destimation des MCO sur les
variables transformes. Les estimations des coefficients calcules partir du
modle en diffrence sinterprtent directement comme tant les coefficients du
modle initial, sauf en ce qui concerne le terme constant :
a0 = b0 /(1 )
Si nous connaissons la technique destimation permettant de lever lautocorr-
lation dordre 1, nous pouvons lappliquer de manire oprationnelle, il convient
destimer le paramtre . Cest lobjet des procdures destimations suivantes.
2) Procdures destimation de
Les procdures suivantes ne sont valides que si : t = t1 + vt .
a) Estimation directe de partir des rsidus de la rgression

sur le modle initial
tape 1 : estimation de de deux manires.
par rgression directe de et sur et1

n
et et1

=
t=2
(e = 0) [10]
et2
t
ou partir de la statistique de Durbin et Watson

DW

1 [11]
2
En effet, le numrateur de la statistique de Durbin et Watson est gal :

n
n
n
n
(et et1 )2 = et2 + 2
et1 2 et et1
t=2 t=2 t=2 t=2
En divisant par le dnominateur de cette mme statistique et sachant que

n
et et1
t=2 e2 + e2
et et1 = , nous avons DW = 2 2et et1 1n n ,
n
et2 et2
t=1 t=1
e +e
2
1
2
n
si n est grand, tend vers 0.
n
2
et
t=1

9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 138
tape 2 : transformation des variables et rgressions1 sur les quasi-diffrences :

yt
yt1 = b0 + a1 (x1t
x1t1 ) + . . . + ak (xkt
xkt1 ) + vt
Les paramtres estims par MCO sont alors :
a1 , . . . a0 =
ak et b0 /(1
) .
b) Estimation itrative du vecteur a et de (mthode de Cochrane-Orcutt)

tape 1 : initialisation de .
Par une technique destimation directe par rgression [10], on fixe une pre-
mire valeur soit :

0 =

tape 2 : rgression sur les quasi-diffrences :
yt
0 yt1 = b0 + a1 (x1t
0 x1t1 ) + . . . + ak (xkt
0 xkt1 + vt
Les paramtres estims sont alors :
a1 , . . . a0 =
ak et b0 /(1
0 ) .
tape 3 : restimation de .
partir des nouveaux rsidus destimation (et1 ) nous recalculons une nou-
velle valeur de soit
1 :
et(1) = yt
a0 a1 x 1t . . .
ak x kt
n
(1)
et(1) et1
1 = (1) 2
t=2

(et )
t
tape 4 : rgression sur les quasi-diffrences :

yt
1 yt1 = b0 + a1 (x1t
1 x1t1 ) + . . . + ak (xkt
1 xkt1 ) + vt
Puis nous calculons un nouveau rsidu (et(2) ) partir de la nouvelle estima-
tion des coefficients, ce qui nous permet dobtenir un 2 .
Et ainsi de suite jusqu la stabilit des coefficients ak estims (en gnral 3
ou 4 itrations).
c) Mthode du balayage ( Hildreth-Lu )

tape 1 : dtermination du type dautocorrlation.
partir de la statistique de Durbin et Watson, on dtermine une autocorrla-
tion positive ou ngative ( < 0 ou > 0 ).
tape 2 : rgression pour lintervalle des valeurs possibles de .
Par exemple, on sait que [0 ; 1] , nous rgressons pour toutes les valeurs
successives de = {0,1 ; 0,2 ; . . . 0,9 ; 1} sur lintervalle [0 ; 1] avec un pas fix
ici gal 0,1 , lquation :
yt
i yt1 = b0 + a1 (x1t
i x1t1 ) + . . . + ak (xkt
i xkt1 ) + vit
1. Nous perdrons une observation lors de la transformation en diffrences.
138 CONOMTRIE
9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 139
et nous
retenons

la valeur de qui minimise la somme des carrs des rsi-

dus
vit2 .
t
Il est possible daffiner la valeur estime de en remployant la mme pro-

cdure sur un intervalle restreint et avec un pas plus fin (par exemple 0,01 ).
Il est noter que cette technique est optimale selon le critre des moindres
carrs puisque lon retient le qui minimise la somme des carrs des rsidus.
Exercice n 2
fichier C5EX1
Procdures destimation en cas dautocorrlation des erreurs

dordre 1
En reprenant le modle de lexercice 1 (et les donnes du tableau 1) dans lequel nous
avons dtect une autocorrlation des erreurs, on demande den corriger les effets lai-
de des quatre procdures prsentes. On comparera les rsultats.
Solution
La solution de cet exercice est ralise laide du programme Eviews C5EX2.PRG
a) Estimation directe de partir des rsidus de la rgression sur le modle initial
tape 1 : rgression, calcul des rsidus et estimation de .

Les rsultats de la rgression ainsi que le calcul des rsidus ont dj t prsents lors
de la rsolution de lexercice 1.
Premire possibilit : par rgression de et sur et1
Rsultats
Dependent Variable : e
Included observations : 19 after adjustments
C 0.065400 0.643073 0.101700 0.9202
e( 1) 0.464845 0.241301 1.926413 0.0709

1 = 0,46
tape 2 : transformations des variables et rgression sur les quasi-diffrences
Calcul des quasi-diffrences :

9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 140
genr dy = y rau1 y(1)

genr dx1 = x1 rau1 x1(1)
Rgression
Dependent Variable : DY
C 135.5132 18.38346 7.371473 0.0000
DX1 3.593675 0.583072 6.163342 0.0000
DX2 0.439019 0.071365 6.151765 0.0000
DX3 0.514596 0.337097 1.526550 0.1477
Calcul du terme constant :

a0 =
b0 /(1
1 ) = 135,51/(1 0,46) = 253,22
Deuxime possibilit : estimation de partir de la statistique de Durbin et Watson

DW 1,053

2 = 1 =1 = 0,473
2 2
tape 2 : transformations des variables et rgression sur les quasi-diffrences.
Le calcul est identique au prcdent avec la nouvelle valeur de .
Dependent Variable : DY
C 133.4095 18.14245 7.353445 0.0000
DX1 3.580221 0.583673 6.133954 0.0000
DX2 0.440490 0.071400 6.169361 0.0000
DX3 0.503033 0.336991 1.492721 0.1562
Calcul du terme constant :

a0 =
b0 /(1
2 ) = 133,40/(1 0,47) = 253,20
b) Estimation itrative du vecteur a et de (mthode de Cochrane-Orcutt)
140 CONOMTRIE
9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 141
Estimation dun modle autorgressif dordre 1

LS Y C X1 X2 X3 AR(1)
C 250.3442 38.62520 6.481369 0.0000
X1 3.142385 0.573681 5.477582 0.0001
X2 0.497558 0.069854 7.122783 0.0000
X3 0.144028 0.306106 0.470517 0.6452
AR(1) 0.811373 0.336991 5.048921 0.0002
Durbin-Watson stat = 2.149

3 = 0,81
Il est noter que le logiciel calcule directement la valeur de (assortie de son cart
type) ainsi que lestimation du terme constant du modle initial.
c) Mthode du balayage ( Hildreth-Lu )
Les rsultats sont identiques ceux de la mthode de Cochrane-Orcutt.
Tableau 2 Rcapitulation des rsultats
MTHODES
Paramtres a a b c
Rgression DW C.O. H.L.

0,464 0,473 0,81 0,81
(t) (1,92) (5.04) (5.04)
a0 253,22 253,20 250,3 250,3
(t) (6,49) (6,49)
a1 3,59 3,58 3,14 3,14
(t) (6,16) (6,13) (5,48) (5,48)
a2 0,44 0,44 0,49 0,49
(t) (6,15) (6,16) (7,12) (7,12)
a3 0,51 0,50 0,14 0,14
(t) (1,52) (1,49) (0,47) (0,47)
R2 0,91 0,91 0,96 0,96
Les coefficients de rgression en italique ne sont pas significativement diffrents de 0

(pour un seuil de 5 %).
la lecture des rsultats (tableau 2), nous constatons que :
le coefficient de rgression a3 nest jamais significativement diffrent de 0 , alors
que, dans le modle initial, erreurs autocorrles, tous les coefficients sont signi-
ficatifs ;

9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 142
les deux mthodes destimation directe des rsidus aboutissent des rsultats qua-
siment identiques, il subsiste nanmoins une autocorrlation des erreurs ;
les deux mthodes itratives (C.O. et H.L.) donnent des rsultats identiques, mais
assez diffrents des deux mthodes prcdentes.
Laquelle choisir ? Cette question est sans rponse dfinitive, la plus rpandue est certai-
nement la mthode de Cochrane-Orcutt. Les deux procdures destimation directe sont
plus un artifice de calcul quune mthode proprement dite ; la technique du balayage
aboutit des rsultats similaires celle de Cochrane-Orcutt.
Nous sommes dans le domaine de lestimation statistique donc avec des marges der-
reurs qui peuvent parfois dpasser le raffinement de telle ou telle mthode, cest pour-
quoi nous pouvons recommander dutiliser la technique la plus simple mettre en uvre
donc celle directement utilise par le logiciel habituel.
Il convient de plus de noter que ces mthodes particulires destimation constituent
une rponse technique un problme le plus souvent de spcifications conomiques.
Nous recommandons, donc, plutt que dappliquer immdiatement ces procdures, de
rflchir une spcification plus adapte du modle.
II. Lhtroscdasticit
A. Prsentation du problme
Soit le modle Y = Xa + pour lequel lhypothse H4 nest pas vrifie, la
matrice des erreurs est alors :

E(1 1 ) E(1 2 ) ... E(1 n )
E(2 1 ) E(2 2 ) ... E(2 n )
= E( ) = =
...
E(n 1 ) E(n 2 ) . . . E(n n )

12 0 0 ... 0
0 22 0 ... 0
=
...
0 0 0 . . . n2
Les variances des erreurs ne sont plus constantes sur la premire diagonale.
Ce problme se rencontre plus frquemment pour les modles spcifis en
142 CONOMTRIE
9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 143
coupe instantane ou bien lorsque les observations sont reprsentatives de

moyennes. La variance de lerreur est alors lie aux valeurs de la variable expli-
cative comme lillustrent les graphiques 4 6.
Graphique 4 Modle homoscdastique
Graphique 5 La variance de lerreur crot avec la variable explicative
Graphique 6 La variance de lerreur dcrot avec la variable explicative
Les consquences de lhtroscdasticit sont identiques celles de lauto-

corrlation des erreurs, cest--dire :
estimateur sans biais ;
lestimateur de MCO nest plus variance minimale.

9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 144
Les causes de lhtroscdasticit sont multiples :

comme nous lavons dj cit, lorsque les observations reprsentent des
moyennes calcules sur des chantillons de taille diffrente ;
un autre cas rsulte de la rptition dune mme valeur de la variable
expliquer pour des valeurs diffrentes dune variable explicative, par
exemple lors de regroupements en tranches (de salaires, deffectifs) ;
lorsque les erreurs sont lies aux valeurs prises par une variable explicati-
ve, dans un modle en coupe instantane la variance de la consommation
crot, par exemple, avec le revenu disponible, etc.
Dans le cas dune htroscdasticit rvle, le test de Chow (cf. chapitre 3,
section B.) est biais, nous risquons alors de rejeter tort1 lhypothse H0 de la
stabilit des coefficients du modle. Si, lors dun test de Chow, nous sommes
amens accepter lhypothse H0, le problme ne se pose donc pas ; en
revanche, dans le cas du rejet de H0, il convient pralablement de corriger
lhtroscdasticit et deffectuer le test de Chow sur le modle transform.
B. Correction de lhtroscdasticit
Lestimateur BLUE du modle htroscdastique est alors celui des MCG :
a = (X 1
X)
1
(X 1
Y)
avec a = (X 1
X)
1
Il nexiste pas une mthodologie unique de correction, la diffrence de la

correction de lautocorrlation dordre 1 des erreurs, mais des mthodes que
lon applique en fonction de la cause prsume de lhtroscdasticit. La rgle
gnrale consiste dterminer une transformation2 concernant les donnes de
la variable expliquer et des variables explicatives afin de se ramener un
modle variances constantes (homoscdastique). Les exercices 3 et 4 illustrent
les principales mthodes.
Exercice n 3
fichier C5EX3
Correction de lhtroscdasticit lorsque les donnes reprsentent
des moyennes
Afin de tester lefficacit dun nouveau fortifiant sur la croissance des poulets, un le-
veur a retenu 40 poulets rpartis en cinq groupes de tailles ingales et leur a administr
des doses diffrentes de ce fortifiant. Les rsultats sont consigns sur le tableau 3.
1. Cest--dire trop souvent.

2. Cette transformation consiste dterminer un vecteur de pondration pour chaque observation,
do le nom de rgression pondre.
144 CONOMTRIE
9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 145
Tableau 3 Relation entre le poids des poulets

et la dose de fortifiant
Groupe Nombre Poids moyen Dose moyenne

i de poulets des poulets administre
ni Yi Xi
1 12 1,7 5,8
2 8 1,9 6,4
3 6 1,2 4,8
4 9 2,3 6,9
5 5 1,8 6,2
On demande destimer les coefficients de la relation :

Yi = a0 + a1 X i + i
relation entre le poids de chacun des poulets Yi et la dose individuelle reue X i et de tes-
ter si le coefficient a1 est significativement diffrent de 0.
Solution
Estimation des coefficients
Nous ne connaissons que la relation entre les moyennes, soit : Y i = a0 + a1 X i + i
Les variables reprsentent des moyennes, donc la variance de lerreur i
2
est gale : Var(i ) = .
ni
1 + 2 + . . . + n 1
En effet, Var(i ) = Var( ) = 2 (Var(1 ) + Var(2 ) + . . . + Var(n ))
ni ni
1 2
= 2
(n i 2 ) = (les covariances Cov(i , j ) = 0,i =
/ j ).
ni ni
La matrice des variances et covariances des erreurs est donc la forme :
1
1
n
1

n2

2 1
Var(i ) = = V =
2

n3
1

n
4
1
n5
Puisque le modle est htroscdastique, nous allons utiliser lestimateur des MCG :
1 1
a = (X X)1 (X Y ) = (X V 1 X)1 (X V 1 Y )

n1
n2
ni ni X i
V 1 1
= n3 do (X V X) = n X 2
ni X i
n4 i i
n5

9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 146

ni Y i
et (X V 1 Y ) =
ni X i Y i
Le tableau de calcul 4 permet dobtenir les rsultats dont nous avons besoin.
Tableau 4 Exemple de calcul en cas dhtroscdasticit
2 2
. Yi Xi ni ni Y i ni X i ni X i ni Y i ni X i Y i
1,7 5,8 12 20,4 69,6 403,68 34,68 118,32
1,9 6,4 8 15,2 51,2 327,68 28,88 97,28
1,2 4,8 6 7,2 28,8 138,24 8,64 34,56
2,3 6,9 9 20,7 62,1 428,49 47,61 142,83
1,8 6,2 5 9,0 31,0 192,20 16,20 55,8
Total 40 72,5 242,7 1 490,29 136,01 448,79
1
40 242,7 2,1040 0,3426
(X V 1 X)1 = =
0,3426
.
242,7 1 490,29 0,05647

72,5 1,23
et (X V 1 Y) = soit a=
448,79 0,502
Nous pouvons remarquer que la matrice M telle que V 1 = M M est gale :

n1

n2

M = n 3

n4

n5
Lestimateur des MCG est alors gal :
a = [(M X) (M X)]1 [(M X) (MY )] = (X M M X)1 (X M MY )

Nous aurions donc trouv les mmes rsultats en employant la technique de la
rgression pondre, cest--dire par multiplication du vecteur des observations de la
variable expliquer (Y ) et du vecteur de la variable explicative (X) par la matrice M

(dont la forme gnrale est n i ). La mthode des MCO applique aux donnes trans-
formes (y compris le terme constant) suivantes conduit donc des rsultats identiques :

Yi : 1,7 12 1,9 8 1,2 6 2,3 9 1,8 5

X i : 5,8 12 6,4 8 4,8 6 6,9 9 6,2 5

Ui : 1 12 1 8 1 6 1 9 1 5

Nous remarquons que : Var( n i i ) = , lhtroscdasticit est donc leve.
2
Estimation de la variance de lerreur

Un estimateur sans biais de 2 peut tre dduit de lapplication des MCO la rela-
tion prcdente :
e e (MY M X a ) (MY M Xa)
2 =
=
nk1 nk1
(Y X a ) M M(Y X
a)
=
nk1
146 CONOMTRIE
9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 147
a ) V 1 (Y X
(Y X a)

2 =
nk1
Nous connaissons :

0,0161 12
0,0885 8

Y X a = 1
0,0238 ; V = 6

0,0575 9
0,0869 5
Lestimation de la variance de lerreur est donne par :
V 1 (Y X a)
(Y X a) 0,1369
2 = = = 0,0445
nk1 511
(n est le nombre dobservations servant estimer les paramtres, ici n = 5 ).
Estimation de la variance des coefficients
La matrice des variances et covariances des coefficients est :

1 1 2,1040 0,3426
a = (X V X) = 0,0445
2
0,3426 0,05647
soit

a0
= 0,0445 2,1040 = 0,094 et
2
a1
= 0,0445 0,0565 = 0,00251
2
Le coefficient a1 est-il significativement diffrent de 0 ?

t = 0,502/0,05 = 10,04 > t30,05 = 3,18 , nous rejetons lhypothse H0, le fortifiant
a une influence positive sur le poids des poulets.
C. Tests de dtection de lhtroscdasticit

Nous allons prsenter, partir dun exercice, diffrents tests permettant de
dtecter une htroscdasticit.
Exercice n 4
fichier C5EX4
Tests de dtection dune htroscdasticit et correction
Un directeur de la production dune unit de construction automobile dsire dter-
miner une relation entre le nombre de dfauts constats (Yi ) et le temps de vrification
(X i ) dune automobile, selon le modle suivant :
Yi = a0 + a1 X i + u i
Pour ce faire, il procde un test sur 30 vhicules quil regroupe en 6 classes de 5
voitures en demandant chaque chef datelier de passer un nombre dheures de vrifica-
tion fix.
Les rsultats sont consigns dans le tableau 5.

9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 148
Tableau 5 Relation entre temps de vrification

et nombre de dfauts
Nombre de dfauts Yi Temps passs

en heures X i
4 5 6 8 8 4
6 11 13 15 17 3,5
9 13 14 15 21 2
6 13 16 23 26 1,5
11 15 17 22 34 1
7 21 23 28 38 0,5
On demande de procder aux tests de dtection dhtroscdasticit suivants :

1) test dgalit des variances ;
2) test de Goldfeld-Quandt ;
3) test de Gleisjer ;
4) test de White ;
5) puis, en cas dhtroscdasticit, den corriger les effets.
Solution
1) Test dgalit des variances

Les donnes sont constitues de m = 6 groupes dobservations. Nous allons tester
lgalit des variances1, soit lhypothse :
H0 : 12 = 22 = . . . = 62
tape 1 : calcul de la variance empirique pour chaque groupe.

ni
5
(Yi j Y i )2 (Yi j Y i )2
j=1 j=1
i2 =
=
ni 1 4
tape 2 : calcul de la variance totale.

m
m
(n i 1)
i2 vi
i2
i=1 i=1

T2 = =
m
v
(n i 1)
i=1

m
m
avec vi = n i 1 et v = vi = (n i 1)
i=1 i=1
tape 3 : calcul du 2 empirique et test.
1. Kendall M.G. et Stuart A., pages 234-236, 1961.
148 CONOMTRIE
9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 149

m
La quantit Q = v Ln
T2 i2 suit une loi du 2 m 1 degrs de
vi Ln
i=1
libert (Ln = logarithme nprien). Cependant, lestimation peut tre amliore en divi-
sant Q par une constante dchelle C :

1 m
1 1 Q
C =1+ ainsi Q = 2 (m 1)
3(m 1) i=1 vi v C
Si Q > 0,95
2
(m 1) , lhypothse H0 est rejete, le modle est htroscdastique.
Le tableau 6 illustre les tapes de calcul.
Tableau 6 tapes de calcul pour un test dgalit de variances
. i Yi Xi
i2 vi Ln (
i2 )
1 4 5 6 8 8 4 3,2 4,65
2 6 11 13 15 17 3,5 17,8 11,51
3 9 13 14 15 21 2 18,8 11,73
4 6 13 16 23 26 1,5 63,7 16,61
5 11 15 17 22 34 1 78,7 17,46
6 7 21 23 28 38 0,5 127,3 19,38

T2 = 51,58333
Q = 13,26 ; C = 1,097 ; Q = 12,09 > 0,95

2
(m 1) = 11,07 , le modle est
donc htroscdastique.
2) Test de Goldfeld-Quandt1
Ce test nest valable que si lune des variables est la cause de lhtroscdasticit et
que le nombre dobservations est important. Il se compose de trois tapes.
tape 1 : ordonner les observations en fonction des valeurs croissantes ou dcrois-
santes de la variable expliquer ou bien de la variable explicative souponne tre la
source de lhtroscdasticit.
Cette opration est dj effectue puisque le nombre de dfauts constats est class
(tableau 7) en fonction du nombre dheures dcroissant de vrification.
Tableau 7 Classement des observations en fonction

du temps de vrification (extrait des donnes)
. j Yj Xj
1 4 4
2 5 4

29 28 0,5
30 38 0,5
1. Goldfeld S.M. et Quandt R.E., pages 539-547, 1965.

9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 150
tape 2 : omettre C observations centrales.

Nous choisissons arbitrairement C observations situes au centre de lchantillon.
Ces C observations sont exclues de lanalyse. La valeur de C doit tre approximative-
ment gale au quart du nombre dobservations totales.
C = partie entire de (30/4) = 8
tape 3 : rgressions sur les deux sous-chantillons et test.
Premier chantillon : j = 1,11 Deuxime chantillon : j = 20,30
Y j = 16,93 2,13 X j + e j Y j = 9,84 1,32 X j + e j

(2,31) (9,23)
n = 11 n = 11
R = 0,08
2
R 2 = 0,002

SC R1 = e2j = 164,66 SC R2 = e2j = 872,02
j j
(.) = t de Student (.) = t de Student

ddl1 = n 2 = 9 ddl2 = n 2 = 9
Sous lhypothse H0 dhomoscdasticit, le rapport1 :
SC R 2 /ddl2 872,02/9
F = = = 5,29 suit une loi de Fisher ddl2 et ddl1 degrs
SC R 1 /ddl1 164,66/9
de libert.
F = 5,29 > F9,9

0,05
= 3,18, lhypothse dhomoscdasticit H0 est rejete, le mo-
dle est donc htroscdastique.
3) Test de Gleisjer2
Le test de Gleisjer permet non seulement de dceler une ventuelle htroscdastici-
t, mais aussi didentifier la forme que revt cette htroscdasticit. Ce test est fond sur
la relation entre le rsidu de lestimation par les MCO effectue sur le modle de base et
la variable explicative suppose tre la cause de lhtroscdasticit.
tape 1 : rgression par les MCO de Y j en X j ( j = 1,30)
Y j = 24,09 4,12 X j + e j
(4,19)
n = 30
R 2 = 0,38
Le vecteur des rsidus e j est alors connu.
1. La valeur la plus leve des deux SC R se situe toujours au numrateur.

2. Gleisjer H., pages 316-323, 1969.
150 CONOMTRIE
9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 151
tape 2 : rgression de la valeur absolue |e j | des rsidus sur X j .

Gleisjer suggre de tester diffrentes formes de relation, par exemple :
Forme gnrale Estimation (J = 1,30)
I |e j | = a0 + a1 X j + v j |e j | = 8,09 1,46 X j + v j
n = 30 (2,55)
Htroscdasticit de type : R 2 = 0,19
ej2 = k 2 X 2j (k tant une constante quelconque)

En effet, si nous avons une relation entre la valeur absolue du rsidu (ej) et la variable
Xj, cela signifie que nous avons de fait une relation entre le rsidu au carr et la variable
Xj au carr.
1/2
II |e j | = a0 + a1 X j
1/2
+ vj |e j | = 10,7 4,15 X j + v j
(2,60)
n = 30

ej2 = k 2 X j
R 2 = 0,19
III |e j | = a0 + a1 X 1
j + vj |e j | = 2,79 + 2,86 X 1
j +v
j
(2,30)
n = 30

ej2 =k 2
X 2
j
R 2 = 0,16
Lhypothse dhomoscdasticit est rejete si le coefficient a1 dune des spcifications
est significativement diffrent de 0 . Les trois t de Student empiriques sont suprieurs
1,96, lhtroscdasticit est donc dtecte. La forme retenue est la II ; en effet, le coeffi-
cient est affect du ratio de Student le plus lev (toutefois, la forme I est trs proche).
4) Test de White1
Le test de White est trs proche du prcdent, il est fond sur une relation significa-
tive entre le carr du rsidu et une ou plusieurs variables explicatives en niveau et au carr
au sein dune mme quation de rgression2 :
et2 = a1 x1t + b1 x1t2 + a2 x2t + b2 x2t2 + . . . + ak xkt + bk xkt2 + a0 + vt
Soit n le nombre dobservations disponibles pour estimer les paramtres du modle et

R 2 le coefficient de dtermination. Si lun de ces coefficients de rgression est significa-
tivement diffrent de 0 , alors on accepte lhypothse dhtroscdasticit. Nous pouvons
procder ce test soit laide dun test de Fisher classique de nullit de coefficients :
H0 : a1 = b1 = a2 = b2 = . . . = ak = bk = 0
Si on refuse lhypothse nulle, alors il existe un risque dhtroscdasticit.

Soit recourir la statistique L M qui est distribue comme un 2 p = 2 k degrs
de libert (autant que de coefficients que nous estimons, hormis le terme constant), si
n R 2 > 2 ( p) lu dans la table au seuil , on rejette lhypothse dhomoscdasticit
des erreurs.
1. White, 1980.
2. En cas de doute sur une influence croise de deux variables comme tant la source de lhtro-
scdasticit, on peut ajouter au modle estimer des termes croiss, par exemple : x1t x2t .

9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 152
Soit ici estimer le modle : e2j = a1 x j + b1 x j2 + a0 + v j
e2j = 78,58 x j + 11,98 x j2 + 136,02 +

vj
avec n = 30 ; R 2 = 0,226 ; F = 3,956
Test de Fisher F = 3,956 > F20,05

; 27 = 3,35.
Test L M n R 2 = 30 0,22 = 6,78 > 0,05

2
(2) = 5,99 .
Nous sommes, dans les deux cas, amens rejeter lhypothse H0 pour un seuil de 5 %.
Le modle est donc htroscdastique.
5) Correction de lhtroscdasticit
Les quatre tests sont concordants : le modle est htroscdastique, il convient donc
den corriger les effets.
Supposons, par exemple, que lon retienne la forme I :
ej2 = k 2 X 2j ; lapplication de
la rgression pondre par le facteur 1/ X j conduit un modle homoscdastique :

2
Yj a0 ej ej 1 2
= + a1 + do E = = k2
Xj Xj Xj Xj X 2j ej
Or, le test de Gleisjer a mis en vidence une relation (II) du type :

ej2 = k 2 X j . Pour
lever lhtroscdasticit, dans
ce cas, nous employons la rgression pondre sur les
donnes brutes divises par X j . En effet :

Yj a0 Xj ej ej 2 1 2
= + a1 + do E =
= k2
Xj Xj Xj Xj Xj X j ej
En gnral, lorsque nous avons dtect une htroscdasticit de type :

ej2 = k 2 f (X j ) , il convient de diviser les donnes par f (X j ) afin de se ramener un
modle homoscdastique.
Dans le cadre de notre exercice, les donnes sont alors transformes (tableau 8).
Tableau 8 Transformation pour une rgression pondre

(extrait des donnes)
Yj 1 Xj
. Zj = X1 j = X2 j =
Xj Xj Xj
2,00 0,50 2,00

2,50 0,50 2,00

39,60 1,41 0,71
53,74 1,41 0,71
152 CONOMTRIE
9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 153
Le modle estim par les MCO est le suivant :

Z j = b1 X 1 j + b2 X 2 j + j , j rpond aux hypothses classiques. Il est noter lab-
sence du terme constant. Les rsultats fournis par Eviews sont :
a0 =
Les coefficients du modle initial sont a1 =
b1 = 24,96 et b2 = 4,53. Le
modle estim1 est donc :
Y j = 24,96 4,53 X j + e j
(2,94)
n = 30
(.) = t de Student
Il existe bien une influence significative du temps de vrification sur le nombre de
dfauts constats, chaque heure de vrification permet de supprimer en moyenne
4,5 dfauts.
D. Autre test dhtroscdasticit : le test ARCH

Les modles de type ARCH2 ( AutoRegressive Conditional Heteroscedasti-
city ) permettent de modliser des chroniques (la plupart du temps financires3)
qui ont une volatilit (ou variance ou variabilit) instantane qui dpend du pass.
Il est ainsi possible dlaborer une prvision dynamique de la chronique en
termes de moyenne et de variance. Le test est fond soit sur un test de Fisher clas-
sique, soit sur le test du multiplicateur de Lagrange (L M) .
De manire pratique, on procde de la manire suivante :
1re tape : calcul de et le rsidu du modle de rgression ;
1. Ce modle est comparer celui estim sur les donnes brutes (premier modle du test de
Gleisjer).
Le coefficient de dtermination nest pas prsent, car, dans tout modle estim sans terme
constant, il nest pas interprtable.
2. Engle, 1982.
3. En effet, les sries financires sont particulirement concernes par les modles ARCH, car on
constate des priodes de forte spculation (variabilit leve) suivie de priodes daccalmie (varia-
bilit faible).

9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 154
2e tape : calcul des et2 ;

3e tape : rgression autorgressive des rsidus sur p retards (rsidu dcal)

p
o seuls les retards significatifs sont conservs, et2 = 0 + i eti
2
;
i=1
Soit tester lhypothse H0 : 1 = 2 = = p = 0 .
4e tape : calcul de la statistique du multiplicateur Lagrange, L M = n R 2 avec :
n = nombre dobservations servant au calcul de la rgression de ltape 3,
R 2 = coefficient de dtermination de ltape 3.
Si L M > 2 ( p) p degrs de libert lu dans la table un seuil fix (en
gnral 0,05 ), on rejette H0 ; on considre que le processus est justifiable dun
modle ARCH( p) .
Cest le test de significativit des coefficients i de la rgression et2 sur et
2
p
qui permet de dterminer lordre p du processus ARCH sachant quun proces-
sus ARCH dordre 3 semble un maximum. Une autre approche consiste
calculer le corrlogramme des rsidus aux carrs issus du modle initial. Si des
termes de ce corrlogramme sont significativement diffrents de 0 , alors on peut
conclure une spcification de type ARCH.
III. Modles erreurs sur les variables

A. Consquences lorsque les variables sont entaches
derreurs
Quand nous avons tudi le modle linaire, nous avons admis que la variable
endogne et les variables exognes taient observables sans erreur. Dans la pra-
tique, cette hypothse est rarement vrifie ; cependant, nous pouvons admettre,
gnralement, que lerreur de mesure des observations est faible par rapport
lerreur de spcification.
Toutefois, dans certains modles, les variables conomiques retenues peu-
vent tre entaches dune erreur de mesure relativement importante. Cest le cas,
par exemple, lorsque les donnes proviennent, non pas, dune mesure directe,
mais de donnes denqutes par sondage. Dans ce cas, il convient de distinguer
les variables vraies (et inconnues) : y , x1 , x2 , . . . , xk des valeurs observes
y, x1 , x2 , . . . , xk et dtudier les consquences concernant les proprits de les-
timateur obtenu par les MCO.
Soit le modle Y = X a + avec qui satisfait aux hypothses habituelles.
Posons : X = X + et Y = Y +
avec : E() = 0 ; E() = 0 ; E(X ) = 0 ; E(Y ) = 0 ; E(X ) = 0 ;
E(Y ) = 0 .
154 CONOMTRIE
9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 155
On a alors :
E( ) = E{(Y X a) } = E(Y ) a E(X ) = 0
E( ) = E{(Y X a) } = E(Y ) a E(X ) = 0
Nous avons donc indpendance entre les erreurs sur les variables et , et ler-
reur de spcification du modle .
La relation entre les variables observes X et Y est la suivante :
Y = Y = (X )a + Y = Xa + a + = Xa +
avec = a +
Les proprits stochastiques de sont :
E() = E( a + ) = E() E()a + E() = 0
E(X ) = E(X ) E(X )a + E(X ) = 0
E(X ) = E{(X + ) } = E( )
= E( ) E( ) a + E( )
= E( )a = 0
Lhypothse H6 du modle gnral nest donc pas vrifie puisque et X sont
corrls, la mthode des MCO fournit des estimateurs biaiss ngativement.
B. La mthode des variables instrumentales

Lorsquon se trouve en prsence dun modle erreurs sur les variables
Y = Xa + , lhypothse H6 est en dfaut et lestimateur
a ne converge pas
asymptotiquement vers a. Les autres hypothses sont rputes vrifies.
Le but de la technique des variables instrumentales est de dterminer k
variables z 1 , z 2 , . . . , z k telles que :
E(Z ) = 0 et Z = (z 1 , z 2 , . . . , z k )
Cov (Z X) = 0
cest--dire quaucune combinaison linaire des variables z k nest orthogonale
aux variables x1 , x2 , . . . , xk ou encore que les variables Z et X soient corrles.
Nous avons alors :
E(Z Y ) = E{Z (Xa + )} = E(Z X)a + E(Z ) = E(Z X)a

9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 156
soit a = (Z X)1 Z Y
[12]
On dmontre1 que a est un estimateur convergent de a , la variance de les-

timateur
a est dautant plus faible que la corrlation entre Z X est forte, la
matrice des variances et covariances des coefficients est gale :
a =
2 (Z X)1 (Z Z )(X Z )1 [13]
La difficult de mise en uvre de cette mthode rside dans la slection des

variables instrumentales2 miracles Z qui doivent tre non corrles avec
et fortement corrles avec X . Dans certains cas, nous pouvons simplement rete-
nir, comme variable instrumentale, la variable exogne dcale dune priode.
C. Le test dexognit dHausman

Le test dexognit dHausman (1978) permet de dtecter une ventuelle cor-
rlation entre le terme derreur t et une ou des variables explicatives xit. Dans
cette hypothse, nous ne pouvons plus utiliser lestimateur des MCO qui est non
convergent, il faut alors recourir la mthode des Variables Instrumentales (VI)
ou la Mthode des Moments Gnralise (GMM).
Soit le test dhypothses, H0 : Cov(xt ,t ) = 0 (la variable xt est exogne) contre
lhypothse dendognit H1 : Cov(xt ,t ) = / 0.
Sous lhypothse H0 les estimateurs des MCO et des VI sont convergeant alors
que sous lhypothse H1 la covariance est non nulle et lestimateur des MCO est
biais et non convergeant. Ce test peut tre men de deux manires, soit un test
de diffrence entre lestimateur des VI et des MCO, soit un test partir dune
rgression augmente.
1) Test de diffrence
Nous calculons la statistique :
H = (
aV I
a MC O ) [Var(
aV I ) Var(
a MC O )]1 (
aV I
a MC O ) .
La statistique H est distribue selon un chi-deux k degrs de libert. Si
H < 2 (k) pour un seuil % fix, nous acceptons lhypothse H0, lestimateur
MCO est non biais.
1. Judge G.G. et al., pages 577-579, 1988.
2. Les anglo-saxons emploient le terme de proxy variable , que lon peut traduire littralement par
variable par dlgation .
156 CONOMTRIE
9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 157
2) Rgression augmente
La procdure propose par Hausman est en quatre tapes :
Estimation dun modle par les MCO avec pour variable expliquer la
variable dont nous dsirons tester lexognit et comme variables explica-
tives le ou les instruments, le plus souvent les variables explicatives dcales
dune priode.
Estimation de la ou des variables ajustes xit partir de la ou des rgressions
prcdentes.
Estimation du modle augment (modle initial dans lequel nous rajoutons la
ou les variables explicatives ajustes xit).
Test de significativit par rapport 0 du ou des coefficients de la ou des
variables explicatives ajustes. Si ce ou ces coefficients ne sont pas significa-
tivement de 0 (test de Student ou de Fisher), alors nous retenons lhypothse
H0 : Cov(xt ,t ) = 0 .
D. La mthode des moments gnralise

La Mthode des Moments Gnralise, GMM (Generalized Method of
Moments), est utilise lorsque la ou les variables explicatives sont supposes
exognes (Cov (xt ,t ) =
/ 0 ) et que, de plus, la matrice des variances covariances
des erreurs est quelconque ( E(t ,t ) =
/ 2 I ). Lestimateur des GMM combine
alors la mthode des moindres carrs gnraliss avec celle des variables instru-
mentales. Lestimateur des GMM est donn par :
)1 Z X)1 X Z (Z Z
a = (X Z (Z Z )1 Z y [14]
avec :
y = la variable expliquer
X = les variables explicatives
Z = les instruments
= la matrice des variances covariances des rsidus estims dans une premire

tape par la mthode des variables instrumentales
Il est noter que dans le cas o les hypothses classiques sont vrifies
(E(t ,t ) = 2 I ) , lestimateur des GMM (expression [14]) se ramne lesti-
mateur VI (expression [13]).

9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 158
Exercice n 5
fichier C5EX5
Test dexognit dHausman, modle erreurs sur les variables : la

technique des variables instrumentales
Un agronome dsire estimer la relation entre le rendement de bl (yi ) et la quantit
utilise dengrais (xi ) . Pour ce faire, il ne dispose que de la quantit dengrais (xi )
dclare par lagriculteur, qui est donc entache dune erreur. Cependant, il pense que la
variable de dpense effective en achat dengrais (z i ) est indpendante de lerreur dob-
servation de la quantit dengrais dclare et bien corrle avec la consommation relle
dengrais.
On dispose des vingt observations prsentes au tableau 9.
Tableau 9 Rendement de bl, quantit dengrais utilise

et dpense en achat dengrais
Observation yi xi zi
1 15,30 17,30 3,00
2 19,91 21,91 7,00
3 20,94 22,96 5,40

18 25,83 29,43 22,20
19 25,15 28,95 24,60
20 25,06 28,86 24,60
On demande :
1) de tester une ventuelle endognit de la variable xi laide du test dHausman ;
2) destimer la relation entre yi et xi par une mthode adapte.
Solution
1) Test de diffrence : Nous calculons la statistique dHausman :

H = ( aV I a MC O ) [Var( aV I ) Var( a MC O )]1 ( aV I a MC O )
Avec :

0,795 0,822 0,0004489 0,01106
aV I = ; a MC O = ; Var( aV I ) = ;
2,153 1,471 0,01106 0,27613

0,0003486 0,00859 0,0276
Var( a MC O ) = ; ( aV I a MC O = ;
0,00859 0,214867 0,6817

0,0001 0,0024
[Var( aV I ) Var( a MC O )] =
0,0024 0,0612
158 CONOMTRIE
9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 159

1568341,7 63248,1 0,0276
H = [0,0276 0,6817] = 7,63 > 2 (2)
63248,1 2566,99 0,6817
pour un seuil de 5 % = 5,99. Nous rejetons lhypothse H0, lestimateur des MCO est
biais, il convient dutiliser lestimateur des VI.
Rgression augmente
Nous procdons au test dHausman en quatre tapes.
Estimation par les MCO de la rgression de xi sur linstrument z i :
Dependent Variable : X
Method : Least Squares
C 18.37253 0.622495 29.51436 0.0000
Z 0.440680 0.039908 11.04238 0.0000
Calcul de la srie ajuste : xi = 18,37 + 0,44z i

Estimation du modle augment avec (XF = xi ) :
Method : Least Squares
X 1,010328 0,022324 45,25680 0.0000
XF 0,215107 0,023915 8,994504 0.0000
C 2,153561 0,212721 10,12386 0,0000
Le coefficient de la variable XF est significativement diffrent de 0, nous ne sommes

pas en mesure daccepter lhypothse H0, nous avons donc Cov(xt ,t ) = 0 .
2) La rgression de yi sur xi conduit aux rsultats suivants :

yi = 1,47 + 0,82 X i
(41)
R 2 = 0,99
n = 20
(.) = t de Student
Cependant la mthode des MCO nest pas applicable car E(xi ) = 0 . En revanche, nous
savons par hypothses que E(z i ) = 0 et que Cov(xi z i ) = 0 .
Lestimateur
a est donn par [12], soit :

a = (Z X)1 Z Y
(2,1) (2,20) (20,2) (2,20) (20,1)

9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 160
La matrice Z est compose de 1 pour la premire colonne et des valeurs de z i pour

la deuxime colonne. De mme, la matrice X est compose de 1 pour la premire colon-
ne et des valeurs de xi pour la deuxime colonne.
Nous obtenons :

20,00 492,78 1,02 0,07
ZX = ; (Z X)1 = ;
284,40 7 369,53 0,04 0,00

434,94
Z Y =
6472,88

a0 2,15
soit
a= =

a1 0,795
Ces coefficients sont comparer ceux trouvs lors de lestimation du modle par
les MCO.
Nous pouvons calculer lestimation de la variance de lerreur :

ei2
i 1,29

=
2
= = 0,071
n2 18
La matrice des variances et covariances de
a est alors daprs [13] :
a =
2 (Z X)1 (Z Z )(X Z )1

20,00 284,40 a = 0,071 3,85 0,15
ZZ = ; soit
284,40 4 866,08 0,15 0,00
= 0,0211
a1
Le modle estim partir de la mthode des variables instrumentales est donc le suivant :

yi = 2,15 + 0,795 X i
(37)
n = 20
(.) = t de Student
Exercice n 6
fichier C5EX6
Prvision de part de march
Une entreprise de la grande consommation cherche prvoir la part de march dun
produit apritif (PMt) en fonction de sa prsence dans lunivers de vente 1 (DNt) et de son
indice de prix par rapport aux concurrents (IPt). Les donnes portent sur 41 semaines.
1. La DN ou distribution numrique reprsente le nombre de fois o le produit est prsent dans la

distribution GMS (Grande et Moyennes Surfaces). Si DN = 100, cela signifie que le produit est
prsent dans tous les magasins, si DN = 80, le produit est prsent dans 80 % des magasins. Bien
sr, plus la DN augmente et plus le produit est prsent dans les linaires et donc la probabilit de
vendre le produit saccrot.
160 CONOMTRIE
9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 161
Le chef de produit estime un premier modle dont les rsultats sont prsents ci-des-
sous :
Log(P Mt ) = 2,91 + 1,03 Log(D Nt ) + et
(48,5) (6,83)
n = 41
R 2 = 0,54
DW = 1,29
(.) = t de Student
Log = Logarithme nprien
1) Que reprsente le coefficient a1 du modle ? Est-il significativement de 0 ?
2) Le graphique des rsidus est le suivant quen pensez-vous ?
Existe-t-il une autocorrlation des erreurs ?

3) Le chef de produit ajoute lindice des prix son quation de rgression et obtient le
rsultat suivant :
Log(P Mt ) = 25,22 + 1,28 Log(D Nt ) 4,71 Log(I Pt ) + et
(6,7) (10,9) (5,9)
n = 41
R 2 = 0,76
DW = 1,83
Commentez dun point de vue statistique et conomique les rsultats obtenus.
4) Connaissant pour la semaine 42 les valeurs de D N42 = 0,60 et I P42 = 100, on vous
demande de calculer une prvision de part de march pour la semaine 42 assortie de son
intervalle 95 %.
On donne la matrice (X X)1

543,63 6,38 114,92
(X X)1 = 6,38 0,54 1,32
114,92 1,32 24,29
Solution
1) Le cofficient a1 du modle reprsente une lasticit car le modle est sous la forme
Log-Log. Ce coefficient est significativement de 0 car la valeur empirique du t de Student
est largement suprieure au t lu dans la table (t 0,05 = 1,96) .
2) Le graphique laisse supposer une autocorrlation des erreurs. Puisque les condi-
tions dapplication du test de Durbin et Watson sont vrifies, nous pouvons interprter

9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 162
cette statistique : DW = 1,29 < 1,44 (valeur lue dans la table). Il existe une prsomp-
tion dautocorrlation des erreurs dordre 1.
3) Commentaires des rsultats
Commentaires statistiques :
la statistique de Fisher indique que le modle est globalement significatif,
les t de Student ont des probabilits critiques infrieures 0,05, les coefficients sont
donc tous significatifs,
la statistique de DW = 1,82 ne laisse plus prsager dune autocorrlation des
erreurs.
Nous constatons que le fait davoir ajouter au modle une variable explicative corri-
ge lautocorrlation des erreurs. Le modle est valid sur le plan statistique.
Commentaires conomiques :
la variable DN agit positivement, plus lentreprise est prsente dans lunivers de
vente plus la part de march augmente (10 % daugmentation entrane 12,5 % daug-
mentation de part de march),
la variable IP agit ngativement, il sagit dun effet prix classique (10 % daug-
mentation entrane 47 % de baisse de part de march),
Les coefficients des variables ont bien le signe attendu.
4) On calcule le logarithme nprien : LN(DV ) = 0,51; LN(I P) = 4,605
La prvision en semaine 42 est donne par :

Log( P M) = 25,22 + 1,285 0,51 4,716 4,605 = 2,84
Do P M = e2,84 = 17,18. La part de march prvue est de 17,18 %
Lcart type de lerreur de prvision est gal :

e2t+h =
2 1 + X t+h (X X)1 X t+h = (0,16132)2 (1 + 0,27) = 0,033.

1
avec X t+h = 0,51
4,605

Lintervalle de prvision 95 % de Ln(PM) est donn par : 2,84 1,96 0,033.
Soit I C = [2,483; 3,196]
Nous passons aux exponentiels afin dobtenir lintervalle de confiance de la part de
march : [11,95; 24,43].
Exercice n 7
fichier C5EX7
Un peu de rflexion conomtrique...
Soit trois variables construites artificiellement connues sur n = 40 priodes.
Y1 et Y1 en diffrences premires : DY1 = Y1 Y1(1)
Y2 et Y2 en diffrences premires : DY2 = Y2 Y2(1)
une variable TENDANCE = 1, 2, ... , n
162 CONOMTRIE
9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 163
Les graphiques 7 montrent les variations des variables Y1, Y2, DY1, DY2 en fonc-
tion du temps.
Graphique 7 volution des variables Y1, Y2, DY1, DY2 en fonction du temps
En vous aidant des graphiques, de la statistique de Durbin-Watson et du coefficient

de dtermination, on demande de marier chacune des 4 rgressions proposes (Rsultats
du modle) avec le couple Variable dpendante/Variable explicative .
Rsultats du modle Variables

Durbin et Watson R2 Dpendante Explicative
Modle 1 1,97 0,52 Y1 TENDANCE
Modle 2 3,91 0,55 DY1 TENDANCE
Modle 3 0,03 0 Y2 TENDANCE
Modle 4 0,053 0,52 Y1 DY2
Solution
On procde par dduction et limination.

Modle 3 : Y1/DY2 car coefficient de dtermination quasi nul et trs forte auto-
corrlation des erreurs.
Modle 2 : Y2/TENDANCE car coefficient de dtermination lev et trs forte
autocorrlation ngative des erreurs.
Modle 1 : DY1/TENDANCE car coefficient de dtermination lev et absence
dautocorrlation.
Modle 4 : Y1/TENDANCE car forte autocorrlation positive des erreurs et coef-
ficient de dtermination lev.

9782100721511-Bourbo-C05.qxd 20/10/14 15:19 Page 164
Les graphiques 8 suivants illustrent les autocorrlations et les coefficients de dter-

mination.
1000 300 500 50
900 200 400 40
800 100 300 30
700 0 200 20
600 -100 100 10
500 -200 0 0
5 10 15 20 25 30 35 40 5 10 15 20 25 30 35 40
Y1 DY2 Y2 TENDANCE
80 60
1000 50
60 50
900 40
40 40
800 30
20 30
0 20 700 20
-20 10 600 10
-40 0 500 0
5 10 15 20 25 30 35 40 5 10 15 20 25 30 35 40
DY1 TENDANCE Y1 TENDANCE
Graphique 8 Illustrations des modles : autocorrlations

et les coefficients de dtermination
164 CONOMTRIE
9782100721511-Bourbo-C06.qxd 20/10/14 15:21 Page 165
6. Les modles
non linaires
N
ous avons examin le cas du modle linaire, cependant, trs
souvent, la thorie conomique doit tre formalise laide de
relations non linaires.
Dans ce chapitre, la part consacre au cours est trs rduite. En effet,
ltude des modles non linaires se prte bien lexercice pratique.
Nous examinons tout dabord en I., les diffrents types de modles non
linaires : ceux qui sont linaires sur leurs paramtres et des modles un
peu plus complexes (modle de diffusion, par exemple) qui font lobjet
dune tude particulire. Puis, les mthodes destimation des paramtres
des modles non linarisables sont prsentes en II.
I. Les diffrents types de modles non linaires

A. Les fonctions de type exponentiel
Nous allons examiner le cas de modles dont la spcification nest pas linaire,
mais qui sont linaires par rapport leurs paramtres.
Exercice n 1
fichier C6EX1
Estimation dune fonction de production de type Cobb-Douglas
Nous avons relev pour 25 entreprises : la production Q , le facteur capital K et le
facteur travail L ; ces variables sont exprimes en millions deuros.
Les modles non linaires 165

9782100721511-Bourbo-C06.qxd 20/10/14 15:21 Page 166
Une fonction de production de type Cobb-Douglas est de la forme :

Q = 0 K 1 L 2
On demande :
1) de donner une interprtation conomique des coefficients 1 et 2 ;
2) destimer les paramtres du modle et de commenter les rsultats ;
3) de calculer le risque de premire espce concernant lhypothse des rendements
dchelle constants.
Les donnes collectes sont prsentes dans le tableau 1 suivant :
Tableau 1 Donnes de production pour 25 entreprises

K L Q
8 23 106,00
9 14 81,08

3 10 43,21
6 71 121,24
Solution
1) Les coefficients 1 et 2 reprsentent respectivement llasticit de la production au

facteur capital et llasticit de la production au facteur travail.
Dmonstration :
Nous avons une relation du type : Q = 0 K 1 L 2 .
Une transformation logarithmique conduit :
Log(Q) = Log(0 ) + 1 Log(K ) + 2 Log(L)
Or llasticit de y x se dfinit comme tant un rapport de variation relative :
y/y Log(y)
e= = = rapport de drives logarithmiques.
x/x Log(x)
Les coefficients 1 et 2 sont donc des lasticits.
Dans tout modle spcifi sous forme Log-Log, les coefficients sin-
terprtent directement en termes dlasticits.
2) Estimation des coefficients du modle Log-linaire
Le modle estimer est donc le suivant :
Log(Q) = Log(0 ) + 1 Log(K ) + 2 Log(L) +
LQ = a0 + 1 LK + 2 LL +
o les variables L Q , L K et L L (tableau 2) sont les variables Q , K et L transformes.

Les rsultats de lestimation sont les suivants :
166 CONOMTRIE
9782100721511-Bourbo-C06.qxd 20/10/14 15:21 Page 167
Les t de Student calculs sont tous suprieurs au t lu (t22

0,05
= 2,07), les coefficients
sont donc significativement diffrents de 0 au seuil de 5 %.
Tableau 2 Donnes transformes en logarithmiques dcimaux

LK = LL = LQ =
Log(k) Log(L) Log(Q)
0,90 1,36 2,03
0,95 1,15 1,91

0,48 1,00 1,64
0,78 1,85 2,08
Attention, la statistique de Durbin et Watson ne sinterprte pas puisque le modle

est spcifi en coupe instantane.
Lestimation statistique est donc satisfaisante.
Llasticit de la production au capital est gale : 1 = 0,64 .
Llasticit de la production au travail est gale : 2 = 0,25 .
(Si le facteur capital augmente de 10 %, la production augmente de 6,4 % et si le fac-
teur travail augmente de 10 %, la production augmente de 2,5 %.)
Le coefficient 0 est gal : 0 = 101,084 = 12,13 .
= 12,13 K 0,64 L 0,25.
La fonction de production estime scrit : Q

9782100721511-Bourbo-C06.qxd 20/10/14 15:21 Page 168
3) Les rendements dchelle sont-ils constants ?

Les rendements dchelle sont :
dcroissants si 1 + 2 < 1 (la production augmente dans une proportion moindre
que les facteurs de production) ;
constants si 1 + 2 = 1 (la production augmente dans une proportion identique aux
facteurs de production) ;
croissants si 1 + 2 > 1 (la production augmente plus vite que les facteurs de pro-
duction).
Or nous avons 1 +
2 = 0,89 , pour quelle probabilit critique cette valeur est-elle
significativement infrieure 1 ?
On teste donc les hypothses suivantes :
H0 : 1 + 2 = 1
H1 : 1 + 2 < 1
Le t calcul de Student est donc gal, sous H0, :
1 +
2 1
t =

1+
2
Or la matrice des variances et covariances des coefficients est fournie par Eviews :
Soit
1+
2
2 =
1
+
2
2
+ 2 cov (
2
1 ,
2 )
= 0,000749 + 0,001261 + 2 0,000314 = 0,002638
1 +
2 1 0,64 + 0,25 1
t = = = 2,14 t22
0,020

1+
2 0,05136
Nous avons 2 % de risques de rejeter lhypothse H0 tort, nous pouvons donc

considrer les rendements dchelle comme significativement dcroissants.
B. Les modles de diffusion

La courbe de vie du produit est une notion utilise en marketing : les ventes
voluent en fonction du temps ; le dmarrage est relativement lent lorsque le
produit est nouveau, puis elles connaissent une croissance rapide. La courbe
passe ensuite par un point dinflexion partir duquel le rythme de croissance des
ventes diminue.
Nous allons examiner deux modles classiquement utiliss.
168 CONOMTRIE
9782100721511-Bourbo-C06.qxd 20/10/14 15:21 Page 169
1) Le modle logistique (ou courbe de Verhulst ou courbe de Pearl)

Ce modle est dfini par la formulation suivante :
ymax
yt =
1 + br t
o b et r sont les deux paramtres du modle (0 < r < 1) , r dfinit la vitesse
de diffusion (plus r est proche de 0 , plus vite nous atteindrons lasymptote) ; b
est une caractristique dordonne lorigine ; ymax = seuil de saturation.
Si t alors yt ymax , et si t alors yt 0 .
Le point dinflexion est fixe et est atteint pour yt = ymax /2 .
Le graphique 1 illustre lallure gnrale de la courbe logistique.
Graphique 1 La courbe logistique (ymax = 148,31, b = 10, r = 0,7)
2) Le modle de Gompertz
Ce modle est dfini par la formulation suivante :
t +a
yt = ebr Ln(yt ) = br t + a
(e = base du logarithme nprien).
Avec ymax = ea = seuil de saturation, b et r sont les deux paramtres du
modle (b < 0 et 0 < r < 1) .
Si t alors yt ymax , et si t alors yt 0 .

9782100721511-Bourbo-C06.qxd 20/10/14 15:21 Page 170
3) Les mthodes destimation
La difficult destimation de ce type de modles1 vient du fait quils ne sont

pas linaires. Lemploi du modle de rgression est donc impossible tel quel.
Lestimation des paramtres dun tel modle doit tre effectue par des
mthodes de rgression non linaire qui ncessitent des procdures numriques
itratives assez complexes, objet du paragraphe suivant.
II. Mthodes destimation

des modles non linaires
Nous avons jusqu maintenant procd des artifices de calcul afin de se rame-
ner des modles linaires. Cependant, pour certaines spcifications de modle
il savre impossible, mme sous certaines hypothses, dutiliser les MCO.
Nous allons prsenter, trs succinctement2, les mthodes destimation non
linaires en essayant den montrer linspiration gnrale et les limites. Des
exemples dutilisation sont prsents, ensuite, partir des logiciels RATS et
Eviews.
A. Initiation aux mthodes destimation non linaires

Linspiration gnrale des techniques destimation non linaires sont les mmes
quel que soit le type dalgorithme. Il sagit de mthodes itratives dans les-
quelles lquation non linaire est linarise laide dun dveloppement limit
de Taylor ( partir dun jeu de valeurs de coefficients initiaux). Les MCO sont
alors utiliss sur cette quation linaire afin destimer des nouveaux coefficients.
Ces nouveaux coefficients permettent, laide dun nouveau dveloppement
limit, de procder une nouvelle linarisation. La procdure est arrte lorsque
les coefficients sont relativement stables dune itration lautre.
Pour ce type de mthode soit efficiente, il convient que les valeurs initiales
ne soient pas trop loignes des valeurs optimales. Dans le cas contraire, il ny
a pas convergence et la procdure est dfaillante.
1. Pour un approfondissement des modles de diffusion cf. Bourbonnais R. et Usunier J. C.

Chapitre 7, (2013).
2. Pour un dveloppement trs complet, le lecteur peut se rfrer Greene W.H., chapitre 10, 2000.
170 CONOMTRIE
9782100721511-Bourbo-C06.qxd 20/10/14 15:21 Page 171
Algorithme de Gauss-Newton
Soit le modle non linaire : yt = f (X, a) + t o X est la matrice des observa-
tions des variables explicatives (de dimension n , k + 1 ) et a est le vecteur (de
dimension k + 1 ) des paramtres estimer.
Sous les hypothses classiques concernant t , lestimateur des moindres car-
rs est la valeur de a qui minimise la somme des carrs des rsidus :
S(a) = e e = [yt f (X, a)] [yt f (X, a)]
Nous avons k + 1 conditions du premier ordre ( S/a = 0), soit :
S f (X, a)
= 2 [yt f (X, a)] = 0
a a
f (x1 , a) f (x1 , a)
...
a0 ak
f (X, a) .. .. ..
Avec = Z (a) = . . .
a
f (xn , a) f (xn , a)
...
a0 ak
Soit Z (a 1 ) cette matrice calcule pour les valeurs particulires de a(a = a 1 ) .
Puis, laide dun dveloppement limit de Taylor au voisinage de a 1, nous pou-
vons approximer la t -ime observation

f (xt , a)
f (xt , a)
f (xt , a) f (xt , a ) +
1

...
(a a 1 )
a0
ak
a=a1 a=a1
Ou encore, en notation matricielle :

f (X, a) f (X, a 1 ) + Z (a 1 )(a a 1 )
Soit y = f (X, a 1 ) + Z (a 1 )(a a 1 ) +
ou encore : y = f (X, a 1 ) + Z (a 1 )a Z (a 1 )a 1 +
En posant y(a 1 ) = y f (X, a 1 ) + Z (a 1 )a 1, nous pouvons alors construire un
pseudo-modle linaire qui est gal :
y(a 1 ) = Z (a 1 )a +
Lestimateur des MCO de ce modle linaire est donn par :
a 2 = [Z (a 1 ) Z (a 1 )]1 Z (a 1 ) y(a 1 )
= a 1 + [Z (a 1 ) Z (a 1 )]1 Z (a 1 ) [y f (X, a 1 )]
Ce qui donne k + 1 nouvelles valeurs pour le vecteur a = a 2 . Le processus
est arrt la p -ime itration, lorsque nous observons une relative stabilit des
coefficients ainsi estims : a = a p a p1 .

9782100721511-Bourbo-C06.qxd 20/10/14 15:21 Page 172
Cette mthode assez complexe connat quelque raffinement par lutilisation

dun dveloppement limit de Taylor du second ordre (algorithme de Newton-
Raphson).
Les logiciels dconomtrie (Eviews, RATS, ) ainsi que les tableurs

laide de la fonction SOLVEUR permettent, trs simplement, dutiliser ces
mthodes destimation des modles non linaires.
Nanmoins, il convient dinsister sur le fait quelles ne sont efficientes que si

nous sommes capables de fournir des valeurs initiales compatibles avec la sp-
cification du modle et les donnes.
B. Exemples dapplication
Exercice n 2
fichier C6EX2
Estimation des paramtres dun modle de diffusion Logistique
et de Gompertz
Le tableau 3 prsente les ventes cumules (en milliers dunits) dun CD audio dun
artiste succs sur 19 semaines.
Tableau 3 Extrait des ventes cumules sur 19 semaines (milliers dunits)
Semaines Ventes
1 44,7
2 61,0

18 607,0
19 633,9
On demande :
1) Destimer les paramtres dun modle de diffusion de type Logistique.
2) Destimer les paramtres dun modle de diffusion de type Gompertz.
Solution
Le graphique 2 prsente lvolution des ventes cumules en fonction des semaines. Ce
graphique peut suggrer une volution selon un modle de diffusion, nous serions alors
proximit du point dinflexion.
172 CONOMTRIE
9782100721511-Bourbo-C06.qxd 20/10/14 15:21 Page 173
700
600
500
400
300
200
100
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Graphique 2 Ventes cumules
1) Estimation dun modle de diffusion de type Logistique (Eviews).

Valeurs initiales compatibles
PARAM 1 600. 2 5. 3 0.5
equation NLS ventes=C(1)/(1+c(2)*c(3)^@trend)
Rsultats (Eviews) :
Dependent Variable: VENTES

Sample: 1 19
Convergence achieved after 8 iterations
VENTES=C(1)/(1+C(2)*C(3)^TEND)
Coefficient Std. Error tStatistic Prob.
C(1) 718.0033 11.87762 60.45008 0.0000
C(2) 14.77212 0.536144 27.55254 0.0000
C(3) 0.784909 0.004580 171.3614 0.0000
R-squared 0.999009
ymax 718
Le modle estim scrit : yt = =
1 + br t 1 + 14,77 0,785t
2) Estimation dun modle de diffusion de type Gompertz (RATS).
* Rgression non linaire

nonlin b r a Dfinition des paramtres estimer
frml gompertz = exp(b*r**(t)+a) Formulation du modle

9782100721511-Bourbo-C06.qxd 20/10/14 15:21 Page 174
*Initialisation des paramtres

eval a = 5.
eval b = -3.5
eval r = 0.5
nlls(frml=gompertz,trace) taux Estimation des coefficients
Rsultats
Soit le modle : yt = ebr +a = e(3,460,88 +6,83) ; le seuil de saturation, selon un

t t
modle de Gompertz, est donc de e6,83 = 927.
Exercice n 3
fichier C6EX1
Estimation des paramtres dune fonction de production de type CES
Les fonctions de production llasticit de substitution constante, appeles CES1
(Constant Elasticity of Substitution), sont de la forme :
Q = 1 [2 K 3 + (1 2 ) L 3 ]4 avec 3 et 4 < 0
o 1/(1 3 ) reprsente llasticit de substitution2.

Nous pouvons aussi lcrire de la manire suivante :
Q = 1 [2 K 3 + (1 2 )] L 3 ]/3
o reprsente alors les rendements dchelle.

En reprenant les donnes du tableau 1, on demande :
1. La fonction de production llasticit de substitution constante (CES) a t introduite par

Arrow K.J. et al., 1961.
2. Llasticit de substitution mesure lincidence de la variation relative des prix des facteurs sur la
combinaison productive (le rapport K /L ).
174 CONOMTRIE
9782100721511-Bourbo-C06.qxd 20/10/14 15:21 Page 175
1) de transformer cette fonction de production par un passage aux logarithmes ;

2) destimer les paramtres du modle ;
3) de comparer les rsultats avec ceux obtenus lexercice 1.
Solution
1) Transformation du modle
Q = 1 [2 K 3 + (1 2 )] L 3 ]4
Log(Q) = Log(1 ) + 4 Log [2 K 3 + (1 2 ) L 3 ]

Nous observons que cette fonction de production nest pas linarisable (contraire-
ment la fonction de production de type Cobb-Douglas). Il convient donc dutiliser une
technique destimation des modles non linaires.
Les instructions du logiciel Eviews sont les suivantes :
PARAM 1 12. 2 1. 3 0.5 4 0.5 Initialisation des 4 paramtres
NLS Q = C(1)*(C(3)*K^C(4))+(1C(3))*L^C(4))^C(2) quation
Rsultats
La fonction de production estime scrit :

Q = 1 [2 K 3 + (1 2 ) L 3 ]4
= 11,21 [0,404 K 0,597 + 0,594 L 0,597 ]1,38
3) Comparaison des rsultats entre une fonction de production Cobb-Douglas et une
fonction de production de type CES
Lors de lexercice 1, nous avons estim les rendements dchelle de la fonction
1 +
Cobb-Douglas ( 2 = 0,89) qui sont significativement dcroissants.
Pour la fonction de type CES, nous avons :

= 3
4 = 1,38 0,597 = 0,82 < 1
Les rendements dchelle sont dcroissants, et llasticit de substitution constante
est gale :
1/(1 3 ) = 0,42

9782100721511-Bourbo-C06.qxd 20/10/14 15:21 Page 176
9782100721511-Bourbo-C07.qxd 20/10/14 15:24 Page 177
7. Les modles
dcalages temporels
J
usqu maintenant, nous avons spcifi des modles o toutes les
variables sont exprimes la mme priode. Cependant, la thorie
conomique postule couramment non pas des effets synchrones
mais des effets retards.
Ces modles dcalages peuvent inclure comme variables retardes aussi
bien la variable endogne que les variables exognes. Nous tudierons,
tout dabord en I., les modles autorgressifs dont la variable retarde
est la variable endogne. Puis, en II., une autre classe de modle est envi-
sage : les modles retards chelonns. Dans cette spcification, les
variables exognes apparaissent plusieurs dcalages.
Enfin, en III., nous prsentons deux exemples de modles dynamiques.
I. Les modles linaires autorgressifs

A. Formulation gnrale
Dans ce type de modles temporels, la variable endogne yt dpend :
de k variables exognes x1t , x2t , . . . , xkt lpoque t ;
des valeurs que prend la variable yt pendant les priodes prcdentes,
yt1 , yt2 , . . . , yth .
Soit la formulation :
yt = b1 yt1 + b2 yt2 + . . . + bh yth + a0 + a1 x1t + a2 x2t + . . . + ak xkt + t
h
ou encore : yt = bj yt j + X a + t
j=1 (n, k + 1) (k + 1, 1)
Les modles dcalages temporels 177

9782100721511-Bourbo-C07.qxd 20/10/14 15:24 Page 178
Dans ce modle, lhypothse H5, dindpendance entre les variables expli-

catives et lerreur, nest plus satisfaite car les variables yt1 , yt2 , . . . , yth qui
dpendent de t1 , t2 , . . . , th sont alatoires puisque yt+1 est fonction de yt
qui dpend de t , soit : E(yt+1 t ) = 0 .
Nous remarquons que si les variables exognes xit et les erreurs t sont
fixes, les variables endognes sont solutions de lquation de rcurrence :
yt = b1 yt1 + b2 yt2 + . . . + bh yth + St
avec St = Xa + t .
Il est dmontr que la solution gnrale de cette quation de rcurrence est
explosive si une des h racines de son quation caractristique1 a son module
suprieur 1 .
Or nous devons considrer les processus explosifs que ce soit dune faon
monotone ou oscillatoire comme des phnomnes rares en conomie (les
variables sont limites gnralement dans leur croissance), cest pourquoi il
convient dajouter lhypothse de stabilit du processus.
Cas particulier : le modle autorgressif dordre 1

Le modle gnral spcifi ci-dessus est rarement utilis, le plus souvent
nous nous limitons des processus autorgressifs dordre 12, de la forme :
yt = b1 yt1 + a0 + a1 x1t + a2 x2t + . . . + ak xkt + t [1]
Ce modle est stable si |b1 | < 1 et explosif si |b1 | > 1 .
B. Test dautocorrlation et mthodes destimation

La mthode destimation adquate dpend dune ventuelle dpendance des
erreurs ; or, dans le cas dun modle autorgressif, le test de Durbin et Watson a
une puissance rduite et est biais. Cest pourquoi il convient dutiliser une autre
statistique, celle du h de Durbin.
1) Test dautocorrlation des erreurs
Dans le cas dun modle autorgressif dordre 1, le test classique de Durbin et

Watson sous-estime le risque dautocorrlation, un nouveau test dautocorrla-
tion des erreurs doit alors tre utilis3. La statistique utilise est la suivante :
1. Lquation caractristique scrit r h b1 r h1 b2 r h2 . . . bh = 0 .

2. La variable yt dpend nanmoins des valeurs passes yt1 , yt2 , . . . y0 .
3. Durbin J., 1970.
178 CONOMTRIE
9782100721511-Bourbo-C07.qxd 20/10/14 15:24 Page 179

n
h=
[2]
1 n
b1
2

avec
= 1 dw/2 (dw est la statistique de Durbin et Watson calcule sur la
modle [1]) ;
n = nombre dobservations ;

b1
= variance estime du coefficient b1 partir du modle [1].
2
Cette statistique h est distribue de manire asymptotique comme une

variable normale centre rduite. Ainsi, il y a quivalence entre les deux tests
dhypothses suivants :
H0 : = 0 H0 : h = 0
H1 : = 0 H1 : h = 0
Si |h| t /2 , nous acceptons lhypothse H0 dindpendance des erreurs.
(t /2 = valeur issue de la loi normale pour un test bilatral au seuil de .)
Nous remarquons que si nb1
1 , la statistique h ne peut pas tre calcu-
2
le ; dans ce cas, nous pouvons utiliser la statistique de Durbin et Watson en

incluant la zone de doute dans la zone dautocorrlation des erreurs.
2) Estimation si les erreurs ne sont pas corrles
Dans le cas dabsence dautocorrlation des erreurs, les estimateurs des MCO
appliqus au modle [1] convergent asymptotiquement vers les valeurs vraies
des paramtres et ont une variance minimale parmi tous les estimateurs conver-
gents.
Cependant, pour les petits chantillons, lors de lestimation dun modle
autorgressif dordre h , les rsultats asymptotiques sont alors trs approxima-
tifs, car le nombre de priodes destimation est de n h . De plus, les problmes
de colinarit entre les variables explicatives dcales interdisent pratiquement
dutiliser les MCO.
En rsum, pour lestimation des modles autorgressifs erreurs indpen-
dantes, lapplication de la mthode classique des MCO est licite si le nombre
dobservations est suffisant (souvent dans la pratique n > 15 ).
3) Estimation en cas dautocorrlation des erreurs
Le modle scrit alors :

yt = b1 yt1 + a0 + a1 x1t + a2 x2t + . . . + ak xkt + t [3]
avec t = t1 + vt

9782100721511-Bourbo-C07.qxd 20/10/14 15:24 Page 180
Il sagit dun modle autocorrlation des erreurs, nous avons montr lors
du chapitre 5 que la transformation en quasi-diffrences premires peut lever
lautocorrlation des erreurs dordre 1.
Nous pouvons citer diffrentes mthodes destimation.
a) Rgression sur les diffrences premires

On procde deux rgressions par la mthode des MCO : la premire sur le
modle spcifi avec des variables non transformes et la seconde sur le mod-
le spcifi avec des variables transformes en diffrences premires.
Si les deux rsultats destimation sont proches, nous pouvons conclure que
les paramtres du modle sont suffisamment bien dtermins sans rechercher la
liaison ventuelle des erreurs.
b) Correction de lautocorrlation des erreurs par rgression sur les quasi-
diffrences premires
Par une des mthodes prsentes au chapitre 5, nous procdons la correction
de lautocorrlation des erreurs : estimation directe de , Hildreth-Lu,
Cochrane-Orcutt.
c) Dautres mthodes
Nous pouvons aussi citer :
la mthode des variables instrumentales (cf. chapitre 5), o nous retenons
comme variable instrumentale la variable yt2 ;
la mthode du maximum de vraisemblance.
La mthode des variables instrumentales rsout le problme de convergence
des estimateurs lorsque nous sommes en prsence derreurs moyenne mobile
de type :
t = vt 1 vt1 2 vt2 . . . p vt p
Dans le cas derreurs autocorrles, nous devons utiliser une des mthodes
destimation robuste prsentes au chapitre 5.
4) Prvision dans un modle autorgressif

La prvision de la variable endogne y, lhorizon h , est donne par :
yn+h =
b1
yn+h1 +
a0 +
a1 x1n+h +
a2 x2n+h + . . . +
ak xkn+h
Lerreur qui affecte les valeurs successives de

yn+h1 se cumule dune prio-
de sur lautre, et ainsi la variance de lerreur de prvision peut devenir trs
importante.
Lutilisation des fins de prvision du modle autorgressif doit donc tre
limite quelques priodes.
180 CONOMTRIE
9782100721511-Bourbo-C07.qxd 20/10/14 15:24 Page 181
Exercice n 1
fichier C7EX1
Estimation des paramtres dun modle autorgressif erreurs lies
Un conomtre dsire tester la relation entre les prix officiels (P O) de la tonne de
caf et les prix rellement appliqus lexportation (P E) par les pays producteurs. Il se
propose destimer la relation :
P Ot = a0 + a1 P Ot1 + a2 P E t + t
dans laquelle le prix officiel est fonction de manire instantane du prix observ et sajus-
te avec un retard dun an au prix officiel.
Il dispose des donnes, sur 16 ans, prsentes au tableau 1.
Tableau 1 Prix officiel et prix pratiqu

lexportation de la tonne de caf (en dollars)
t PO PE
1 455,0 615,0
2 500,0 665,0
3 555,0 725,0
4 611,0 795,0
5 672,0 870,0
6 748,5 970,0
7 846,0 1 095,0
8 954,5 1 235,0
9 1 090,0 1 415,0
10 1 243,5 1 615,0
11 1 390,0 1 795,0
12 1 559,0 2 015,0
13 1 781,0 2 315,0
14 2 046,5 2 660,0
15 2 311,0 2 990,0
16 2 551,0 3 280,0
On demande :
1) destimer la relation et de tester une ventuelle autocorrlation des erreurs ;
2) den corriger les effets, le cas chant.

9782100721511-Bourbo-C07.qxd 20/10/14 15:24 Page 182
Solution
1) Les rsultats de lestimation sont les suivants :
Dependent Variable : PO
Included observations : 15 after adjusting endpoints

C 7.078673 1.851077 3.824084 0.0024
PO(1) 0.224016 0.037090 6.039727 0.0001
PE 0.622340 0.025520 24.38636 0.0000
Lquation est estim sur 15 priodes (n 1) car dans le modle figure une variable
retarde dune priode.
La statistique de Durbin et Watson laisse augurer dune autocorrlation des erreurs,
ce qui est confirm par le h de Durbin [2] :

n 15
h=
= 0,687 = 2,68 > t 0,05 = 1,96
1 n
a1
2
1 15 0,0013
Nous rejetons lhypothse H0, soit h = 0 = 0 .

2) Nous allons tout dabord comparer les estimations obtenues partir du modle brut
celles obtenues partir du modle en diffrences premires.
Nous procdons lestimation du modle en diffrences premires sur 14 ans car
nous perdons de nouveau une observation lors du calcul des diffrences premires de
P Ot1 .
Les rsultats sont les suivants :
Dependent Variable : D(PO)


C 2.891649 1.298314 2.227234 0.0478
D(PO(1)) 0.240680 0.024114 9.981022 0.0000
D(PE) 0.598017 0.018553 32.23277 0.0000
182 CONOMTRIE
9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 183
Nous observons que les diffrences entre les coefficients de rgression sont assez
faibles pour a1 (0,224 et 0,240) comme pour a2 (0,622 et 0,598); nous pouvons consi-
drer les rsultats obtenus la premire rgression comme valides.
Cependant, titre pdagogique, nous allons utiliser la mthode de correction dauto-
Le modle estim, selon la mthode de Hildreth-Lu, est alors :
P Ot = 2,765 + 0,234 P Ot1 + 0,6135 P E t + et

(1,67) (15,5) (57,9)
et = 0,418 et1 + vt
R 2 = 0,99 ; n = 14 ; DW = 2,08 ; (.) = t de Student
Les prix officiels de la priode t sont donc plus influencs par les prix rellement pra-
tiqus en t que par les prix officiels de lanne prcdente.
II. Les modles retards chelonns

A. Formulation gnrale
Dans certaines spcifications de modles conomtriques temporels, nous pou-
vons postuler que la variable endogne dpend des valeurs prises par une
variable exogne des poques antrieures, tel que :

h
yt = b0 + a0 xt + a1 xt1 + a2 xt2 + . . . + ah xth + t = a j xt j + b0 + t [6]
j=0
En gnral, leffet de la variable explicative sestompe avec le temps :

a0 > a1 > a2 > . . . > a h
Ce modle [6] peut se simplifier dans son criture en utilisant un oprateur
dcalage D dfini par : Dxt = xt1 et en gnral : D i xt = xti , soit :

h
h h
yt = a j xt j + b0 + t = a j D xt + b0 + t =
j
aj D j
xt + b0 + t
j=0 j=0 j=0
yt = A(D)xt + b0 + t [7]
o A(D) est un polynme de degr h , tel que :
A(D) = a0 + a1 D 1 + a2 D 2 + . . . + ah D h
Le nombre de retards, h , peut tre fini ou infini. Cependant, la somme des
coefficients a j tend vers une limite finie, sinon yt serait un processus explosif.

9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 184
Le polynme A(1) = a0 + a1 + a2 + . . . + ah permet de mesurer, long

terme, limpact de la modification de la variable explicative xt dune quantit
x sur la valeur de yt . En effet, les coefficients a j reprsentent les multiplica-
teurs instantans et leur somme le multiplicateur cumul.
Retard moyen
La notion de retard moyen permet dapprhender le laps de temps qui corres-

pond la valeur moyenne des coefficients a j . Il est gal la moyenne pondre
des coefficients, soit :

h
ja j
j=0 a1 + 2 a2 + . . . + hah A (1)
D= = = [8]
h a0 + a1 + a2 + . . . + a h A(1)
aj
j=0
Lestimation des paramtres du modle [6] soulve deux types de difficults :

en pratique, la valeur h qui mesure limportance du nombre de retards est
rarement connue, mme si nous en connaissons lordre de grandeur ;
le second problme rsulte de la colinarit entre les variables exognes
dcales. En effet, lorsque le nombre de retards est important, la colinari-
t entre les variables explicatives dcales risque dentraner une imprci-
sion dans lestimation des coefficients. Cest pourquoi, le plus souvent,
nous mettons des hypothses sur la forme de retards.
Ces deux points sont abords ci-dessous.
B. Dtermination du nombre de retards

Lorsque la valeur h du nombre de retards du modle [6] est inconnue, il existe
des critres statistiques permettant de la dterminer1.
1) Test de Fisher
Le test le plus naturel est celui de Fisher dans lequel nous testons lhypothse de
la nullit des coefficients de rgression pour les retards suprieurs h .
La formulation des hypothses est la suivante, lorsque lon teste, dune manire
descendante, une valeur de h comprise entre 0 et M : 0 < h < M .
1. Il sagit de dterminer quelle est la priode maximum dinfluence de la srie explicative. Il peut
trs bien arriver, cest mme souvent le cas, que des coefficients de rang infrieur au dcalage
h ne soit pas significativement diffrents de 0.
184 CONOMTRIE
9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 185
H01 : h = M 1 a M = 0 H11 : h = M a M = 0
H02 : h = M 2 a M1 = 0 H12 : h = M 1 a M1 = 0
.. ..
. .
H0 : h = M i a Mi+1 = 0
i
H1 : h = M i + 1 a Mi+1 = 0
i
Chacune de ces hypothses fait lobjet du classique test de Fisher, soit :

(SC R Mi SC R Mi+1 )/1
F1 = [9]
SC R Mi+1 /(n M + i 3)
que lon compare au F lu dans la table 1 et (n M + i 3) degrs1 de libert.
Ds que, pour un seuil donn, le F empirique est suprieur au F lu, nous
rejetons alors lhypothse H0 i et la procdure est termine. La valeur du retard
est gale M i + 1 : h = M i + 1 .
Afin de pouvoir procder ce test dans ses conditions dapplication, la
Somme des Carrs Totaux doit rester constante dune estimation lautre. Cela
oblige donc estimer les diffrents modles avec un nombre dobservations iden-
tique correspondant donc au nombre dobservations rellement disponible pour
le dcalage le plus important, chaque dcalage entranant la perte dune donne.
2) Critre de Akaike (AIC)2

Une autre mthode consiste retenir comme valeur de h celle qui minimise la
fonction de Akaike qui est donne par :

SC Rh 2h
AI C(h) = Ln + [10]
n n
avec SC Rh = Sommes des Carrs des Rsidus pour le modle h retards
n = nombre dobservations disponible
(chaque retard entrane la perte dune observation)
Ln = logarithme nprien
3) Critre de Schwarz (SC)3

Enfin, une mthode trs proche de la prcdente consiste retenir la valeur de
h qui minimise la fonction de Schwarz :

SC Rh h Ln n
SC(h) = Ln + [11]
n n
1. Le degr de libert du dnominateur est gal au nombre dobservations (n) moins le nombre de
paramtres estimer dans le modle [6]. Soit pour h = M i + 1 et en tenant compte du terme
constant et du coefficient de rgression pour la variable x 0 retard :
n (M i + 1) 1 1 = n M + i 3 .
2. Akaike H., 1973 ; 1974.
3. Schwarz G., 1978.

9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 186
Exercice n 2
fichier C7EX2
Dtermination du nombre de retards dans un modle retards
chelonns
La thorie conomique postule que les dpenses dinvestissement (notes yt ) peu-
vent tre expliques par les profits passs (nots x t ). Le modle prend la forme dun
modle retards chelonns tel le modle [6].
Nous disposons dun extrait des donnes trimestrielles du tableau 2 concernant lin-
dustrie chimique franaise.
Ntant pas certains de la spcification exacte du modle, nous dsirons tout dabord
rechercher le nombre de dcalages trimestriels qui semblent avoir un effet sur les
dpenses dinvestissement. Puis aprs avoir dtermin le nombre de retards, nous calcu-
lerons le dlai moyen.
Tableau 2 Dpenses dinvestissement et profit
(en millions deuros)
Trimestre yt xt
1 2 072 1 660
2 2 077 1 926

43 2 840 3 449
44 2 837 3 764
Solution
Nous procdons aux estimations des modles sur 34 trimestres, puisque le dcalage
maximum test est de 10, on limine les 10 premires observations.
Nous calculons les trois critres : Akaike, Schwarz et Fisher laide dun program-
me Eviews en tlchargement (C7EX2).
Les rsultats sont consigns dans le tableau 3.
Tableau 3 Rsultats de la recherche du nombre de dcalages optimal
Dcalage Akaike Schwarz Fisher

0 11,96 11,96 16,82
1 11,50 11,54 18,91
2 11,04 11,12 19,18
3 10,55 10,68 10,89
4 10,25 10,42 8,59
5 9,99 10,21 6,86
6 9,84 10,10 1,09
7 9,88 10,19 0,13
8 9,96 10,31 0,77
9 10,03 10,43 0,25
10 10,10 10,55
186 CONOMTRIE
9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 187
Nous observons immdiatement que les minima des deux critres (AI C(h) et
SC(h) ) sont situs sur la ligne 6, correspondant donc 6 dcalages. La premire valeur
du Fisher empirique qui est significative en partant du retard 10 est celle de la ligne
5. Elle est gale 6,86, ce qui vient confirmer une influence de la variable explicative
allant jusqu un dcalage de 6 priodes.
Nous allons dtailler le calcul des critres1 de Akaike et Schwarz pour le retard 6. Le
rsultat de lestimation pour 6 retards est le suivant :
Variable expliquer : Y
n = 38
Variable Coefficient cart type t de Student Prob.
C 501,5414 154,8486 3,238915 0,0029

X 0,011389 0,081532 0,139687 0,8898
X( 1) 0,061265 0,124906 0,490487 0,6274
X( 2) 0,227569 0,119635 1,902194 0,0668
X( 3) 0,167932 0,112997 1,486158 0,1477
X( 4) 0,118734 0,127454 0,931580 0,3590
X( 5) 0,000169 0,136907 0,001235 0,9990
X( 6) 0,237174 0,084065 2,821310 0,0084
R2 = 0,92 0,921953 Somme des carrs des rsidus = 521116,1
Daprs [10], nous avons :

521116 26
AI C(6) = Ln + = 9,84
38 38
Et daprs [11] :

521116 6 Ln (38)
SC(6) = Ln + = 10,10
38 38
Nous remarquons que la probabilit critique du coefficient de la variable X(-6) est

largement infrieure 0,05 ; le coefficient est donc significativement diffrent de 0. Ceci
est videment conforme aux rsultats prcdents.
Les trois critres sont (heureusement) cohrents, le modle retards chelonns com-
porte 6 retards : linvestissement des entreprises de ce secteur est fonction des profits ra-
liss sur les six derniers trimestres, soit un an et demi. Il convient de noter que seul le
coefficient du sixime retard est significativement diffrent de 0.
Le graphique 1 illustre la structure de pondration des retards pour le modle ainsi
estim.
1. Nous ne revenons pas sur le test de Fisher qui a t dj abondamment illustr.

9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 188
Graphique 1 Structure de la pondration des retards
Le retard moyen est gal daprs [8] :

6
j
aj
j=0 0,0612 + 2 0,227 + 3 0,168 + . . . + 6 0,237
D= = = 3,64

6 0,011 + 0,227 + 0,168 + . . . + 0,237

aj
j=0
Le dlai moyen de raction est 3,64 trimestres, soit presque une anne.
C. Distribution finie des retards

Considrant que nous avons dtermin la longueur des retards h , il convient
destimer les coefficients ai du modle. Cependant, lutilisation des MCO peut
se rvler impossible du fait de la multicolinarit entre les variables explica-
tives dcales. Cest pourquoi, dans ce contexte, nous allons prsenter une
mthode permettant, moyennant des hypothses sur la forme des coefficients, de
rduire le nombre de paramtres estimer.
Fonction polynomiale des retards (retards dAlmon1)
Nous pouvons imaginer une infinit de formes concernant la distribution des
coefficients ai (graphique 2). La mthode des retards dAlmon est trs utilise,
car elle permet de dgager des profils de retards sadaptant des reprsentations
diffrentes.
1. Almon S., 1965.
188 CONOMTRIE
9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 189
Cette technique consiste imposer aux coefficients dappartenir un mme

polynme de degr q (graphique 3), tel que :

q
ai = 0 + 1 i + 2 i 2 + . . . + q i q = j i j [12]
j=0
Par exemple, pour un polynme de degr 2 ( q = 2 ), nous avons la squence

des coefficients :
a0 = 0
a0 1 0 0
= 0 + 1 + 2 0
a1 a1 1 1 1
ou encore = 2 1
a2 = 0 + 21 + 42 a2 1 2 2
2
2
a3 = 0 + 31 + 92 a 3 1 3 3
a = H
Graphique 2 Exemples de structures de retards
Nous pouvons gnraliser la formule prcdente pour h retards et un poly-

nme de degr q .

a0 1 0 0 0 0
a1 1 1 1 1 1
q
a2 1 2 22 2 2
= q [13]
a3 1 3 32 3
. . .. .. .. .. .. .3
.. .. . . . . . ..
ah 1 h h2 hq q
(h + 1, 1) (h + 1, q + 1) (q + 1, 1)

9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 190
Graphique 3 Exemples de retards polynomiaux
Le modle initial Y = Xa + peut alors scrire Y = X H + = Z +

dans lequel X H = Z est la matrice des observations des nouvelles variables
explicatives.
Lestimation par la mthode des MCO des q + 1 coefficients ,
(
0 ,
1 ,. . . ,
q ), permet dobtenir, partir des relations [12], les estimations des
h + 1 paramtres de a ( a0 ,
a1 ,. . . ,
ah ) .
Dans cette mthode, nous sommes confronts un double choix :
la valeur h du nombre de retards (nous avons la rponse, cf. 2),
le degr du polynme.
Le degr du polynme q , q < h , peut tre dtermin laide dun test por-
tant sur la significativit, par rapport 0, du coefficient (q ) de la dernire
nouvelle variable explicative. En partant dune valeur q = h 1 , on teste la
significativit du coefficient du terme le plus lev laide dun t de Student
et on rduit le degr du polynme jusqu ce que ce coefficient soit significatif.
Les logiciels dconomtrie traitant des estimateurs dAlmon offrent la pos-
sibilit dintroduire des contraintes supplmentaires concernant les valeurs des
coefficients a1 et/ou ah+1 afin quelles soient nulles. Cela se justifie par le fait
que a1 est le coefficient thorique de la variable xt+1 qui est sans influence
sur yt .
190 CONOMTRIE
9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 191
Exercice n 3
fichier C7EX2
Estimation des coefficients laide dun polynme
(mthode dAlmon)
En reprenant le modle Investissement/Profit de lexercice 2, on demande desti-
mer les coefficients par la mthode des retards dAlmon.
Solution
Le corrig de cet exercice est ralis laide de Eviews, qui permet le recours direct
la technique du polynme dAlmon.
Linstruction est la suivante : LS Y C PDL (X, 6, 4, 1)
PDL : Polynomial Distribued Lag
X = srie explicative
h = 6 : nombre de dcalages (rsultat de lexercice 2) ;
q = 4 : degr du polynme (aprs un essai avec q = 5 , le coefficient de la variable
PDL5 nest pas significativement diffrent de 0),
1 = indicateur de la contrainte : a1 = 0 (cet indicateur vaut 0 si lon ne dsire aucu-
ne contrainte, 2 pour la contrainte ah+1 = 0 et 3 pour les deux contraintes simultanes).
Rsultats

C 511.6833 143.4181 3.567774 0.0011
PDL01 0.193452 0.120131 1.610334 0.1169
PDL02 0.215794 0.103537 2.084228 0.0450
PDL03 0.055823 0.025884 2.156616 0.0384
PDL04 0.004228 0.001956 2.160957 0.0381

9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 192
Les coefficients du polynme (i ) sont reprsents par les variables PDLi, ils sont
(presque) tous significativement diffrents de 0. La prsence dune contrainte entrane la
perte dun degr de polynme.
Le calcul des coefficients et la structure de pondration apparaissent directement
aprs, les coefficients (ai ) sont tous significativement diffrents de 0, sauf ceux des
variables xt et xt5 .
Le graphique 4 prsente les coefficients calculs lors de lexercice 2 et les coeffi-
cients ajusts laide du polynme estim.
Graphique 4 Ajustement des coefficients laide dun polynme de degrs 4
D. Distribution infinie des retards

Dans ce type de modle, leffet de la variable exogne nest plus limit dans le
temps, mais a un effet illimit, bien que, naturellement, cet effet sestompe pour
les priodes anciennes.

yt = a j xt j + b0 + t = a j D xt + b0 + t =
j
aj D j
xt + b0 + t [14]
j=0 j=0 j=0
Afin de se ramener un nombre fini de paramtres estimer, nous devons

postuler une forme particulire que peut prendre la succession des coefficients
a0 ,a1 ,a2 ...
Nous pouvons admettre plusieurs types de spcifications, deux modles par-
ticuliers les plus utiliss font lobjet dune prsentation :
192 CONOMTRIE
9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 193
une dcroissance gomtrique des effets de la variable exogne avec le

temps ;
une croissance suivie dune dcroissance.
1) Modle de Koyck (progression gomtrique)

Le modle de Koyck1 postule une dcroissance gomtrique de la structure des
retards (graphique 5) telle que, dans le modle [14], les coefficients soient lis
de la manire suivante :
a1 = a0
a2 = 2 a0
et en gnral ai = i a0 avec 0 < < 1
Soit
yt = b0 + a0 xt + a0 xt1 + 2 a0 xt2 + . . . + i a0 xti + . . . + t
ou encore :
yt = b0 + a0 (xt + xt1 + 2 xt2 + . . . + i xti + . . .) + t
Graphique 5 Modle de Koyck :

les coefficients suivent une progression gomtrique
La fonction A(D) associe est alors :

A(D) = a0 + a0 D 1 + 2 a0 D 2 + . . .
Le modle yt = A(D)xt + b0 + t peut alors scrire :
B(D)yt = B(D)A(D)xt + B(D)b0 + B(D)t avec B(D) = A(D)1 .
Or A(D) = a0 (1 + D 1 + 2 D 2 + . . .) = a0 (1 D)1
(somme dune progression gomtrique), nous avons donc B(D) = (1 D)/a0 .
1. Koyck L. M., 1954.

9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 194
Soit (1 D)yt = a0 xt + (1 )b0 + (1 D)t ou encore :

yt = yt1 + a0 xt + (1 )b0 + t t1 [15]
qui est un modle autorgressif erreurs lies dont la procdure destimation a

t expose en I.
Cette transformation qui consiste passer dun modle retards chelon-
ns un modle autorgressif est habituellement appele transformation de
Koyck . Nous pouvons noter que nous passons dun modle retards chelon-
ns, difficile estimer par labondance des paramtres, un modle autorgres-
sif, simple dans sa spcification.
2) Modle de Solow1 (distribution de Pascal)

Les coefficients sont distribus selon :
ai = (1 )r+1 Cr+i
i
i o Cr+i
i
est le coefficient du binme de Newton, r et
sont deux paramtres avec 0 < < 1 et r N .
Pour r = 0 , nous retrouvons la distribution gomtrique de Koyck, le gra-
phique 6 illustre la distribution des coefficients des retards.
Graphique 6 Distribution de Pascal des coefficients pour diffrentes valeurs de r
Le modle gnral scrit :

i=
yt = b0 + (1 )r+1 Cr+i
i
i xti + t ou encore
i=0
yt = A(D)xt + b0 + t [16]
Une dmonstration analogue la prcdente permet dcrire le modle [16]
B(D)yt = B(D)A(D)xt + B(D)b0 + B(D)t avec B(D) = A(D)1
1. Solow R., 1960.
194 CONOMTRIE
9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 195
avec :
pour r = 0 B(D) = (1 D)/a0 , soit le modle prcdent
pour r = 1 B(D) = (1 D)2 /a0
Soit :
yt = 2yt1 2 yt2 + a0 xt + (1 2 + 2 )b0 + vt [17]
avec vt = (1 2D + 2 D 2 )t = t 2t1 + 2 t2
pour r = 2 B(D) = (1 D)3 /a0
Soit :
yt = 3yt1 32 yt2 + 3 yt3 + a0 xt + (1 3 + 32 3 )b0 + vt [18]
avec vt = (1 3D + 32 D 2 3 D 3 )t = t 3t1 + 32 t2 3 t3
Afin de dterminer les valeurs du paramtre r , Maddala et Rao (1971) sug-
grent lutilisation dune procdure de balayage dont2 la fonction objectif maxi-
miser est le coefficient de dtermination corrig (R )
Exercice n 4
fichier C7EX2
Estimation des coefficients dun modle selon une spcification

des retards de Koyck et une distribution de Pascal
Nous reprenons les donnes du tableau 2 concernant la relation Investissement/Profit,
on demande :
1) destimer les paramtres du modle si on suppose que les coefficients suivent une
spcification de Koyck ;
2) de rechercher lordre dune distribution de Pascal et destimer les paramtres du
modle pour lordre adquat ;
3) de comparer les rsultats obtenus par les diffrentes mthodes employes lors des
exercices 2, 3 et 4 ;
4) enfin, de calculer llasticit de long terme des dpenses dinvestissement au
profit.
Solution
1) On suppose que les coefficients du modle retards chelonns suivent une progres-
sion gomtrique. Daprs [15], lestimation des paramtres du modle seffectue sous la
forme dun modle autorgressif autocorrlation des erreurs.
Les rsultats de lestimation du modle sont les suivants :

9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 196
yt = 222,23 + 0,907yt1 + 0,179xt + et

(2,10) (25,24) (7,59)
n = 43
R 2 = 0,95
(.) = t de Student
DW = 0,97
Nous avons utilis directement la mthode des MCO, car la mthode de correction
dautocorrlation des erreurs envisages en I donne des rsultats quasiment identiques.
Nous obtenons :
a0 = 0,179 ;
= 0,907 ; b0 = 222,23/(1 0,907) = 2 400,23
Le modle peut donc scrire :
yt = 2 400,23 + 0,179 xt + 0,907 0,179 xt1 + 0,9072 0,179 xt2 + . . . + et
ou encore : yt = 0,907 yt1 + 0,179 xt 222,23 + et
2) Nous supposons maintenant que les coefficients suivent une distribution de Pascal.
yt = 40,78 + 1,42yt1 0,54yt2 + 0,096xt + et

(0,40) (13,59) (5,10) (3,83)
n = 42
R 2 = 0,97
(.) = t de Student
DW = 2,22
Il sagit donc destimer des modles autorgressifs dordre 1, 2, 3, etc. Afin de dter-
miner lordre, nous avons procd toutes les estimations de ces modles. partir dun
modle autorgressif dordre 3, les coefficients ne sont plus significativement diffrents
de 0. Le modle autorgressif dordre 1 ayant dj t estim, nous avons procd les-
timation du modle dordre 2.
Daprs [17], nous obtenons en procdant par identification :

0,541 1,426/2 0,72 ;
a0 = 0,096 ;

b0 = 40,78/(1 2
+
2 ) = 40,78/0,0784 = 520,15
Le modle estim est alors :

yt = 1,426 yt1 0,541 yt2 + 0,096 xt + 40,78 + et

i=
ou encore : yt = 520,15 + (1 0,72)2 C1+i
i
0,72i xti + et
i=0
196 CONOMTRIE
9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 197
3) Comparaison des mthodes

Nous pouvons construire le tableau 4 dans lequel nous indiquons les valeurs des
coefficients associes chaque retard (limits 6 pour les modles retards infinis), la
somme des retards et le dlai moyen, ceci pour les quatre mthodes employes.
Tableau 4 Comparaison des mthodes de calcul des coefficients
Retard Non Almon Koyck Pascal

i contraint1 q=4 r=1
0 0,01138 0,0292 0,1795 0,0784

1 0,06126 0,09733 0,1623 0,0169
2 0,22756 0,19701 0,1472 0,2438
3 0,16793 0,18851 0,1335 0,2926
4 0,11893 0,0920 0,1211 0,3160
5 0,00016 0,02912 0,1098 0,3185
6 0,23717 0,22298 0,0996 0,3058
Somme 0,0814 0,7977 0,9530 1,7246

Dlai moyen 3,6421 3,6459 2,1026 3,6104
la lecture de ces rsultats, nous constatons la diversit des profils des coefficients
estims. En effet, nous avons tent, des fins pdagogiques, de faire correspondre les
coefficients des structures bien dtermines qui reprsentent des spcifications de
modles diffrentes les unes des autres. Dans la pratique, cette dmarche est absurde car
il convient de tester une seule forme de spcification :
soit celle que la rflexion conomique nous conduit retenir ;
soit celle dont le profil du modle non contraint semble la plus proche.
4) Calcul de llasticit de long terme des dpenses dinvestissement au profit.
En considrant le modle distribution gomtrique des retards o la variable exo-
gne et la variable endogne sont sous forme logarithmique :
Log yt = b0 + a0 Log xt + a0 Log xt1 + 2 a0 Log xt2 + . . . + t
Le modle, sous forme rduite, sexprime par :

Log yt = Log yt1 + a0 Log xt + c0 + vt
Llasticit de long terme est gal 2 : e LT = a0 /(1 ) , llasticit de court terme

est donne par : eC T = a0 , et le paramtre dajustement est .
Lestimation du modle Dpenses dInvestissement/Profit sous forme logarithmique
conduit aux rsultats suivants :
1. Modle non contraint = estimation libre des coefficients.

2. Llasticit de long terme est la somme des lasticits (les coefficients) aux diffrents dcalages,
soit une somme dune progression gomtrique de premier terme a0 et de raison .

9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 198
Log yt = 0,904 Log yt1 + 0,184 Log xt 0,699 + vt

(27,3) (8,48) ( 2,36)
n = 43
R 2 = 0,95
() = t de Student
a0 /(1
Soit : e LT = ) = 0,184/(1 0,904) = 1,91.
Llasticit de long terme est donc gale 1,91, nous sommes dans la zone des ren-
dements croissants. Lorsque le profit augmente par exemple de 10 %, linvestissement
long terme augmente de 19,1 %.
III. Deux exemples de modles dynamiques

Les exemples dapplication des modles dcalages sont trs nombreux dans la
littrature. Nous allons en prsenter deux particulirement intressants.
A. Le modle dajustement partiel

Le plus souvent, en conomie, la rigidit des institutions ou des structures
empche les variables expliquer datteindre le niveau dsir en une seule prio-
de. Examinons deux exemples :
Afin de faire face une augmentation de la demande, une entreprise cherche
se doter de moyens de production supplmentaires. Cependant cet investisse-
ment ne peut pas tre ralis immdiatement et demande un certain temps
dajustement.
Lors de laugmentation des prix du ptrole, les consommateurs et les institu-
tions ragissent avec retard cette modification des prix. Il en rsulte qu
court terme le comportement des consommateurs ne reflte pas lajustement
qui sest produit long terme.
La formulation de ce modle est la suivante :
il est ncessaire de distinguer entre la valeur dsire, de la variable expli-
quer (ytD ) , et la valeur vraie de cette mme variable (yt ) . Le niveau dsir de la
variable expliquer est fonction de la variable explicative xt tel que :
ytD = a0 + a1 xt + t [19]
Une modification de la valeur de xt entrane une modification de la valeur

dsire de la variable expliquer. Cependant, malgr une spcification simple,
nous ne pouvons pas appliquer les MCO puisque nous navons aucune mesure
198 CONOMTRIE
9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 199
de y Dt . En revanche, nous connaissons les valeurs de yt et nous pouvons spci-

fier une relation entre ytD et yt :
yt yt1 = (ytD yt1 ) avec 0 1 [20]
est appel le coefficient dajustement.

La relation [20] reprsente lajustement progressif qui sopre entre la valeur
dsire et la valeur observe.
Ce modle peut se ramener de manire simple un modle de Koyck.
En substituant lquation [19] dans [20], on obtient :
yt yt1 = (a0 + a1 xt + t yt1 ) ou encore
[21]
yt = (1 )yt1 + a0 + a1 xt + t
yt = b1 yt1 + c0 + c1 xt + vt dont on peut estimer les paramtres par la mthode
des MCO, avec b1 = (1 ) ; c0 = c0 ; c1 = a1 .
B. Le modle danticipations adaptatives

Dans cette spcification, les valeurs de la variable expliquer yt sont fonctions
des valeurs, non pas observes dune variable explicative, mais des valeurs
attendues, telles que :
yt = a0 + a1 xtP + t [22]
o xtP est la valeur prvue de la variable explicative xt .
Par exemple, la production dune entreprise est fonction des valeurs prvues
des ventes.
Comme pour le modle prcdent, nous sommes confronts labsence de
mesure de la variable xtP . Pour lever cette difficult, nous devons poser une
hypothse concernant la formation de la variable xtP : celle des anticipations
adaptatives.
Cette relation scrit :
xtP xt1
P
= (xt xt1
P
) avec 0 1 [23]
o est le coefficient danticipation.
Nous remarquons que si = 0 , lanticipation reste constante quelles que
soient les ralisations de xt , le modle ne ragit pas aux nouvelles valeurs rali-
ses. Si = 1, au contraire, les valeurs anticipes sont toujours gales aux
valeurs courantes. Dans la pratique, ce coefficient est donc compris entre ces
deux valeurs en fonction du degr de ractivit de lanticipation.
Lquation [23] peut aussi scrire :
xtP = xt + (1 )xt1
P
en dveloppant cette formule il vient :

9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 200
xtP = xt + (1 )xt1 + (1 )2 xt2 + (1 )3 xt3 + . . .

i=
xtP = (1 )i xti [24]
i=0
En remplaant xtP par son expression dans [22] :

i=
yt = a0 + a1 (1 )i xti + t
i=0
qui est un modle retards chelonnes1 dont une transformation de Koyck per-
met de mettre sous une forme autorgressive :
yt = a0 + a1 xt + (1 )yt1 + [t (1 )t1 ]
Nous pouvons estimer ce modle autorgressif autocorrlation des erreurs,
et ainsi, en dduire une estimation des paramtres , a0 , a1 .
Il est noter que ces deux modles peuvent tre combins, bien qualors
cette spcification semble un peu abondante et dinterprtation dlicate.
Exercice n 5
fichier C7EX2
Estimation dun modle dajustement partiel
et danticipations adaptatives
partir des donnes du tableau 2, on dsire estimer les paramtres dun modle
dajustement partiel et les paramtres dun modle danticipations adaptatives.
Solution
Nous estimons le modle autorgressif dordre 1 avec autocorrlation des erreurs
(mthode Hildreth-Lu) :
yt = 103,07 + 0,882 yt1 + 0,1555 xt + et
(0,47) (11,04) (4,41)
et = 0,5489 et1 + vt
R 2 = 0,96 ; n = 42 ; DW = 1,83 ; () = t de Student
Soit :
= 1 0,882 = 0,1178 ;
a0 = 103,07/0,1178 874,9 ;

a1 = 0,1555/0,1178 1,32
Modle dajustement partiel :
ytD = 874,9 + 1,32 xt + et et yt yt1 = 0,118(ytD yt1 )
Modle danticipations adaptatives :
yt = 874,9 + 1,32 xtP + et et xtP xt1
P
= 0,118(xt xt1
P
)
1. Nous remarquons que la valeur de la variable expliquer y dpend dune pondration gom-
triquement dcroissante de la variable explicative x . Cette structure de pondration est le fon-
dement de la mthode de prvision appele lissage exponentiel .
200 CONOMTRIE
9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 201
Exercice n 6
Modlisation du prix dune matire premire
Nous nous intressons modliser lvolution du prix dune matire premire yt
selon un modle autorgressif dordre 1 et une variable exogne xt la demande par-
tir dune quation de la forme : yt = a1 yt1 + a2 xt + t [E1] avec t rpondant aux
hypothses classiques. Les donnes ont t pralablement centres sur leur moyenne.
Lestimation de lquation [E1] sur 22 priodes donne :
yt = 0,757yt1 + 0,256xt + et [E2]

(0,025) (0,02)
R2 = 0,996 ; DW = 2,17 ; n = 22 ; (.) = cart type

1) Le coefficient de dtermination a-t-il une signification dans cette quation ?
2) Le coefficient a2 est-il significativement diffrent de zro ?
3) Les erreurs du modle sont-elles autocorrles lordre 1 ?
4) Quel est, long terme, linfluence dune augmentation de la demande xt de 1 unit
sur le prix yt ?
5) En effectuant une nouvelle rgression de yt sur yt1 seule, on obtient :
yt = 0,615yt1 + et [E3]
(0,044)
R2 = 0,981 ; DW = 1,64 ; n = 22
Est-il normal ou fortuit que le R2 soit plus lev dans lquation [E2] que dans
lquation [E3] ?
6) En tant la variable xt dans la rgression [E3] le coefficient de yt1 a t modifi,
pourquoi ?
7) Que signifierait un modle du type yt = ayt1 + t dans lequel a serait suprieur l ?
8) Lestimation selon une mme spcification mais pour une autre matire premire
donne :
yt = 0,695yt1 + 0,336xt + et [E4]

(0,053) (0,046)
R2 = 0,984 ; DW = 2,27 ; n = 22
Les coefficients a1 sont-ils significativement diffrents entre la rgression [E2] avec
ceux de lquation [E4] ?
Solution
1) Bien que le modle ne possde pas de terme constant, le R2 peut sinterprter car les
donnes ont t pralablement centres sur leurs moyennes.

9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 202
2) Le coefficient a2 est significativement diffrent de zro car t* = 0,256/0,02 = 12,8 >

0,05
t19 = 2,09.
3) Nous sommes dans les conditions dapplication de la statistique de Durbin et Watson
car bien que le modle ne possde pas de terme constant, le DW peut sinterprter car
les donnes ont t pralablement centres. Mais il existe un biais de sous-estimation d
au modle autorgressif. Il faut calculer le h de Durbin :

n DW
h= avec = 1 2,17/2 = 0,085
1 n a1
2
2
n = nombre dobservations
a1
2
1 de la variable dcale
= variance estime du coefficient a
Cette statistique h est distribue de manire asymptotique comme une variable nor-
male centre rduite. Ainsi, il y a quivalence entre les deux tests dhypothses suivants :
H0 : = 0 H0 : h = 0
H1 : 0 H1 : h 0
/2
Si |h| < t nous acceptons lhypothse H0 dindpendance des erreurs.
(t 0,05 = 1,96 valeur issue de la loi normale pour un test bilatral au seuil de 5%).

22
|h| = 0,085 = 0,40 < t 0,05 = 1,96 , nous acceptons lhypo-
1 22 0,0252
thse dindpendance des erreurs.
4) la priode 1 : yt = 0,757yt1 + 0,256xt = 0,757 0 + 0,256 1 = 0,256
la priode 2 : yt = 0,757 0,256 = 0,194
la priode 3 : yt = 0,757 0,194 = 0,146
Il sagit dune progression gomtrique de premier terme U0 = 0,256 et de raison
q = 0,757 < 1.
La somme tend vers une limite finie et est gale : U0 / (1 q) = 0,256 / ( 1 0,757)
= 1,053.
Le prix augmentera de 1,053 unit long terme.
5) Il est normal que le R2 soit plus lev dans lquation [E2] que dans lquation [E3]
car une variable explicative a t retire du modle ce qui entraine une diminution de la
somme des carres des rsidus.
6) cause de la covariance existant entre les variable yt1 et xt .
7) Un modle du type yt = ayt1 + t dans lequel le coefficient a serait suprieur l
conduirait une solution explosive (croissance infinie) ce qui impossible.
8) Tests de comparaison de coefficient
H0 : a1,MP1 = a1,MP2
H1 : a1,MP1 a1,MP2
(a 1,M P1 a 1,M P2 ) 0 0,757 0,695
t = = = 1,05 suit une Student
a 1,M P 1 a 1,M P 2 0,0252 + 0,0532
n 1 + n 2 6 = 38 degrs de libert, la covariance entre a1,MP1 et a1,MP2 est nulle car les
deux rgressions sont indpendantes (les deux chantillons sont diffrents),
t = 1,05 < t 0,05
= 1,96 donc non rejet de H0.
202 CONOMTRIE
9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 203
Exercice n 7
Un modle dvaluation de la politique marketing
Nous intressons mesurer limpact de la publicit et des promotions sur les ventes
dun produit. Les impacts sont mesurs au moyen destimations en coupe instantane
menes sur des chantillons reprsentatifs de produit de grande consommation forte
pression marketing de deux secteurs : les produits cosmtiques et les dtergents.
Les chiffres entre parenthses sous les coefficients de rgression sont les carts types
des coefficients.
Partie A
Le premier modle test est le suivant :
Vit = a0 + a1 Pu it + a2 Prit + it [E1]
Vit = Vente en volume du produit i pour lanne t

Pu it = Dpenses publicitaires en euros pour le produit i pour lanne t
Prit = Dpenses promotionnelles en euros pour le produit i pour lanne t
Les rsultats obtenus pour une anne (t = 1) pour le secteur des cosmtiques est le
suivant :
Vi = 812,86 + 29,94Pu i + 21,31Pri + ei i = 1, ..., 20
(10,73) (8,23)
R2 = 0,868 ; DW = 1,68 ; Somme des Carrs des Rsidus = SCRC = 291

1) Interprter dun point de vue statistique ce rsultat destimation.
2) Thoriquement si lentreprise respecte une politique optimale dallocation de son
budget publi-promotionnel (marketing mix), les effets positifs dun euro dpens en
publicit ou en promotion sont gaux ( a1 = a2 ). Sachant que Cov( a 1 , a 2) = 6,75, effec-
tuez le test permettant de savoir si cette politique optimale est vrifie.
3) Une interrogation concernant les tudes menes sur des chantillons dentreprises
rside en lexistence de comportements homognes.
Nous procdons donc deux nouvelles estimations.
Les rsultats obtenus pour la mme anne (t = 1) pour le secteur des dtergents est
le suivant :
Vi = 627,32 + 14,27Pu i + 17,87Pri + ei i = 1, ..., 20
(3,12) (5,57)
R2 = 0,41 ; DW = 1,68 ; SCRD = 249

Les rsultats obtenus pour la mme anne (t = 1) pour le secteur des dtergents et
des cosmtiques sont les suivants :
Vi = 785 + 16,56Pu i + 18,91Pri + ei i = 1, ..., 40
SCRT = 926

9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 204
Tester lhomognit des comportements dans ces deux secteurs. Quen concluez-
vous ?
4) Dans le mme esprit nous disposons pour le secteur des cosmtiques dune estima-
tion pour lanne suivante (t = 2), nous allons donc chercher tester la stabilit tempo-
relle pour ce secteur.
Sachant que lestimation du modle en t = 2 indique SCR2 = 316 (i = 1, ... , 20) et
quune estimation pour t = 1 et t = 2 indique SCRT = 1054, quen concluez-vous ?
Partie B
Un des problmes de ce type de modlisation consiste en un biais d des variables
omises, en particulier des variables caractristiques du produit.
1) Supposons que ces variables soient additives et peuvent tre synthtises globalement
par une seule note Fi , cette variable est constante dans le temps car il sagit dune
caractristique permanente du produit. Cependant cette variable nest pas mesurable.
Le modle scrit donc maintenant :
Vit = a0t + a1t Pu it + a2t Prit + Fit + it [E2]
O t dsigne lanne destimation et i le produit.

Sachant que nous disposons des donnes pour 20 produits pour deux annes cons-
cutives, comment estimer les paramtres du modle intgrant cet effet individuel sans
quil apparaisse effectivement ?
2) Si cet effet individuel nest pas additif mais multiplicatif nous considrons alors quil
peut tre fonction du budget marketing Mit du produit i pour lanne t. On appelle
Vt
kt = , le rapport moyen entre les ventes totales et le budget total marketing dans
Mt
lchantillon pour tous les produits pour lanne t.
Sous lhypothse que les effets individuels sont constants dans le temps on peut dfi-

V V Vi(t1)
nir une variable telle que = kt1
M M i(t1) Mi(t1)
Interprter le sens de cette variable conomique. En quoi son introduction dans
lquation [E1] permet-elle de mesurer les effets individuels ?
3) On a obtenu pour les secteurs des cosmtiques et des dtergents les rsultats pour
lanne t = 1.
Cosmtique :

V
Vi = 582 + 25,19Pu i + 23,81Pri 0,97 + ei i = 1,...,20
M i(t1)
(9,3) (5,7) (0,37)
R2 = 0,967
Dtergent :

V
Vi = 328 + 17,78Pu i + 18,74Pri 0,49 + ei i = 1,...,20 .
M i(t1)
(5,7) (8,2) (0,21)
R2 = 0,967
204 CONOMTRIE
9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 205
Laugmentation des coefficients de dtermination R2 pour chaque quation est-elle

suffisante pour affirmer que la relation estime est de meilleure qualit que lquation
[E1] ? Sinon comment jugez-vous de lamlioration ou la dtrioration des rsultats.

V
4) Les coefficients des variables pour le modle cosmtique et dtergent
M i(t1)
sont-ils significativement diffrents ?
Partie C
Un des biais envisageables dans lquation [E1] est que les ventes dun produit
soient fonction dun vnement imprvu. Dans cette situation, cela peut crer un biais
sur les ventes du produit qui diffre de ce quelles seraient dans des conditions normales.
Pour effectuer des prvisions correctes, on peut redresser ce biais en introduisant comme
variable supplmentaire dans [E1] les ventes de la priode prcdente :
Vit = a0 + a1 Pu it + a2 Prit + a3 Vit1 + it [E3]
On a obtenu pour les secteurs des cosmtiques les rsultats pour lanne t = 1.
Vit = 1,52 + 2,52Pu it + 6,36Prit + 0,75Vit1 + eit i = 1,...,20 [E4]

(1,1) (1,7) (0,3)
R2 = 0,979
1) Interprter dun point de vue statistique et conomique ces rsultats, est-il envisa-
geable dans lquation [E3] de tester une ventuelle autocorrlation des erreurs ?
2) Pour ce modle cosmtique nous avons effectu la rgression suivante :
eit2 = 2,1Pu it + 0,18Prit + 5,8 + u it i = 1,...,20

(0,2) (0,5)
eit = Rsidu de la rgression [E4]

Pourquoi procder cette rgression ? Quen concluez-vous et que proposez-vous ?
Solution
A.1) Soit les tests suivants mener.

Test de significativit globale de la rgression : H0 : a1 = a2 = 0
R 2 /k 0,868/2
Soit le test de Fisher : F = =
(1 R 2 )/(n k 1) (1 0,868)/(20 2 1)
= 55,89 > F2;17
0,05
= 3,59 , nous rejetons lhypothse H0, il existe au moins une variables
Pu i ou/et Pri dexplicative de Vi
Tester H0 : a1 = 0 contre lhypothse H1 : a1 0
Le test dhypothses bilatral consiste donc comparer le ratio de Student empi-
a 1
=
rique ta1 = 2,79 la valeur du t de Student lue dans la table 20 2 1 = 17
a 1
0,05
degrs de libert et pour un seuil de probabilit gal 5%, soit t17 = 2,11. Puisque

ta1
= 2,79 > t 0,05
17 = 2,11 , nous refusons lhypothse H0, le coefficient a1 est donc
significativement diffrent de 0.

9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 206
Soit tester H0 : a2 = 0 contre lhypothse H1 : a2 0

a 2
= = 2,59 > t17 = 2,11 nous refusons lhypothse H0, le coefficient a2 est
0,05
ta2
a 2
donc significativement diffrent de 0.
Le modle tant spcifi en coupe instantane et nayant aucune information sur
un ventuel tri des donnes selon un critre, la statistique de Durbin et Watson nest pas
interprtable.
A.2) Le test dhypothse est : H0 : a1 = a2
|(a 1 a 2 ) 0|
Sous lhypothse H0 t = suit une loi de Student 17 degrs de
a 1 a 2
libert.
Il convient de calculer : a 1 a 2
Var(a 1 a 2 ) = Var(a 1 ) + Var(a 2 ) 2 Cov(a 1 ,a 2 )

= 10,732 + 8,232 2 6,75 = 169,36
|29,94 21,31|
Do : t = = 0,66 < t170,05
2,11 . Nous acceptons lhypothse
169,36
H0, la politique optimale est donc respecte.
A.3) Soit tester (test de Chow) lhypothse H0 : SC RT = SC R D + SC RC H0 :
SC RT (SC R D + SC RC ) = 0
La statistique du Fisher empirique du test de Chow est donne par :
(SC RT (SC R D + SC RC ))/(k + 1)
F = qui suit alors une loi de Fisher
(SC R D + SC RC )/(n 2(k + 1))
(k + 1) et n 2(k + 1) degrs de libert.
(926 (291 + 249))/3
Soit, F = 8,10 > F3;34
0,05
2,92 . Nous refusons lhypo-
(291 + 249)/(34)
thse H0, les comportements sont htrognes entre les deux secteurs.
A.4) Il sagit toujours du test de Chow mais men maintenant en donnes temporelles.
(1 054 (291 + 316))/3
Soit, F = 8,34 > F3;340,05
2,92 . Nous rejetons lhy-
(291 + 316)/(34)
pothse H0, les comportements sont diffrents, sur les deux annes tudies, pour le sec-
teur des cosmtiques.
B.1) Nous avons :
Vit = a0t + a1t Pu it + a2t Prit + Fit + it
Vit1 = a0t1 + a1t1 Pu it1 + a2t1 Prit1 + Fit1 + it1
Puisque les effets sont constants nous avons : Fit = Fit1
Nous pouvons alors crire :
Vit Vit1 = (a0t a0t1 ) + a1t Pu it a1t1 Pu it1 + a2t Prit a2t1 Prit1
+it it1
Lestimation de ce modle permet de lever le biais du aux caractristiques de
produit.
206 CONOMTRIE
9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 207

V Vi(t1) Vi(t1) V(t1)
B.2) La variable = kt1 = mesure les dvia-
M i(t1) Mi(t1) Mi(t1) M(t1)
tions individuelles du produit i par rapport au ratio des ventes totales sur les dpenses
marketing totales pour tous les produits de lanne antrieure. Ainsi cette variable capte
ce qui est spcifique du produit par rapport au comportement moyen tendanciel. Si le
coefficient de cette variable nest pas significativement diffrent de 0, cela signifie que
les produits ont tous le mme comportement et donc quil nexiste pas deffet individuel.
B.3) Le coefficient de dtermination est insuffisant pour valuer la pertinence dajout
dune variable explicative supplmentaire car mme une variable non significative
contribue augmenter la somme des carres expliques. En revanche il convient def-
fectuer un test de significativit par rapport 0 sur la variable nouvellement introduite.
|0,97|
Soit pour le secteur cosmtique : ta3 = = 2,62 et pour le secteur Dtergent :
0,37
|0,49|
= = 2,33, les deux ratios sont suprieurs t17 = 2,11. Lajout de la
0,05
ta3
0,21

V
variable contribue significativement lexplication des ventes, il existe des
M i(t1)
effets individuels par produit. De plus, les coefficients des variables Publicit et
Promotion sont significativement diffrents de 0 et leurs valeurs se rapprochent, ce qui
correspond mieux lintuition thorique.
B.4) Le test dhypothse est : H0 : a3C = a3D
|(a 3C a 3D ) 0|
Sous lhypothse H0, t = suit une loi de Student
a 3C a 3D
n 1 + n 2 2(k + 1) = 32 degrs de libert.
Il convient de calculer : a 3C a 3D
Var(a3C a3D ) = Var(a 3C ) + Var(a 3D ) 2 Cov(a 3C ,a 3D )

= 0,372 + 0,212 2 0 = 0,181
Les rgressions tant effectues sur des chantillons indpendants la covariance est
nulle.
| 0,97 + 0,49|
Do : t = 1,13 < t 0,05
1,96 . Nous acceptons lhypothse H0,
0,181
les deux coefficients ne sont pas significativement diffrents entre eux.
C.1) Les coefficients du modle sont tous significativement diffrents de 0, les t de
0,05
Student empiriques des trois coefficients sont suprieurs t17 = 2,11 nous refusons
lhypothse H0 de nullit des coefficients. Nous ne pouvons pas interprter la statistique
de Durbin et Watson car le modle est estim en coupe instantane pour lanne t et nous
ne savons pas si les donnes ont t pralablement tries.
C.2) Lestimation de ce modle permet de tester une ventuelle htroscdasticit des
rsidus (test de White), le coefficient de la variable Pu it est significativement diffrent
de 0, il existe donc une htroscdasticit lie la variable Publicit.
Il convient donc de corriger le modle de lhtroscdasticit en procdant une
1
rgression pondre, dont le facteur de pondration est : .
Pu it

9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 208
Exercice n 8
fichier C7EX8
Une comparaison des courbes de Phillips franaise et amricaine1
Soit les donnes annuelles franaises et amricaines concernant les taux dinflation
et de chmage sur 34 ans. Le but de cet exercice est dessayer de valider empiriquement
les courbes de Phillips. Une dmarche progressive est propose. Dans un premier temps,
vous devrez estimer la courbe qui relie le taux dinflation au taux de chmage, puis celle
qui relie linflation et le chmage retarde dune priode. Dans un deuxime temps,
nous prendrons mieux en compte la dynamique qui relie linflation (niveau gnral des
prix) linflation salariale afin de valider empiriquement les mcanismes invoqus par
Phillips. Enfin, dans un dernier temps, les anticipations dinflation formes de manire
adaptative seront prises en compte. Il est noter que les sries peuvent suivre une dyna-
mique dite non-stationnaire , des procdures destimation abordes au chapitre 9 per-
mettent alors den tenir compte.
chofra = Chmage France
chousa = Chmage tats-Unis
inffra = Taux dinflation France
infusa = Taux dinflation tats-Unis
Premire partie : Courbes inflation-chmage
1) Visualiser successivement les deux courbes de chaque pays inflation-chmage dans

le plan (chmage en abscisse et inflation en ordonne). Constater la grande instabilit
de celles-ci.
2) Estimer conomtriquement les deux quations inflation-chmage (respectivement
France et tats-Unis) qui relient le niveau dinflation, variable explique (nomms res-
pectivement inffra et infusa) une constante et au niveau retard du chmage, variable
explicative (nomms respectivement chofra et chousa).
Constater que cela ne modifie pas notablement les rsultats de prendre comme variable
explicative le taux de chmage contemporain et le taux de chmage retard. Dornavant,
nous considrerons le taux de chmage retard.
3) Examiner les rsidus des deux quations (chmage retard). Vous semblent-ils lis
par une dynamique cyclique ? (prsomption dautocorrlation des rsidus). Existe-t-il
des rsidus trs loigns des autres ? (prsomption de valeurs aberrantes).
4) Effectuer les tests de Durbin-Watson. Confirmer vos rsultats en utilisant les tests
dautocorrlation des rsidus de Breusch-Godfrey.
1. Merci Jean-Franois Jacques, professeur lUniversit de Paris-Est-Marne-la-Valle, auteur

de ce cas.
208 CONOMTRIE
9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 209
Deuxime partie : courbes de Phillips originelles (sans anticipation dinflation)

avec autocorrlation des rsidus et choc ngatif doffre (anne 11 et anne 17)
5) Construire une variable indicatrice appele DUM qui vaut 0 chaque date lexcep-
tion des priodes 11 et 17 pour lesquelles elle vaut 1.
6) Soit les trois quations suivantes :
quation de Phillips originelle qui relie le taux de croissance des salaires nominaux
(w t ) au taux de chmage (u t ) : w t = (u u t1 ) avec u = constante.
quation qui relie inversement le taux de croissance de la production ( yt ) et celui du
1
chmage (pseudo-loi dOkun) : yt = u t avec u t = (u t u t1 ).

quation de quasi-offre ou ce qui identique formellement quation de fixation des prix
(p t ) en taux de croissance en concurrence imparfaite : p t = c yt + w t .
Montrer quil est possible, partir de ces quations, dcrire une dynamique qui relie le
taux dinflation p t une constante, au niveau du chmage u t et au niveau du chmage
retard u t1.
Estimer conomtriquement cette quation. Est-ce que cela amliore les rsultats de la
premire partie ?
7) Estimer de nouveau le modle de la question 6 en introduisant dans la liste des
variables explicatives la variable DUM et en corrigeant de lautocorrlation des rsidus
(cf. chapitre 5).
Troisime partie : courbes de Phillips augmentes des anticipations dinflation
8) On cherche maintenant estimer un modle intgrant des anticipations dinflation :

p t = a0 + a1 p t1 + a2 u t + a3 u t1 + t
Estimer cette relation inflation-chmage en ignorant lautocorrlation des rsidus mais
en conservant la variable DUM. En faisant un test du h de Durbin (prsence de la
variable endogne retarde, cf. chapitre 7, I. B.) confirmer quil nexiste plus dautocor-
rlation des rsidus.
9) Raliser sur ce nouveau modle des tests de Chow la priode 21 pour la France et
la priode 18 pour les tats-Unis (date de dbut des politiques de dsinflation).
Attention : la variable DUM doit tre retire de la rgression.
10) Construire les sries pour la France et les tats-Unis (phifra et phiusa)
phi = pt a 1 pt1 a 4 dum , les coefficients de rgression proviennent du rsultat de la
question 8. Puis regarder lallure de la courbe dans le plan chmage en abscisse et phi
en ordonn. Que constatez-vous lorsque que lon supprime les dplacements verticaux
de long terme de la courbe de Phillips dus aux anticipations et aux chocs doffre ? Une
politique de dsinflation est-elle plus coteuse, en termes de chmage, en France ou aux
tats-Unis ?
Solution
1) la lecture des reprsentations graphiques (graphique 7) de la relation inflation-ch-

mage pour la France et pour les tats-Unis, nous pouvons penser quil est trs difficile
de trouver une relation significative, pour les deux pays, entre le taux de chmage et le
taux dinflation une date donne car les deux courbes sont trs instables.

9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 210
14 14
12 12
10
10
8
INFUSA
INFFRA
8
6
6
4
4 2
2 0
2 3 4 5 6 4 5 6 7 8
CHOFRA CHOUSA
Graphique 7 Relation inflation-chmage pour la France et pour les tats-Unis
2) Estimations conomtriques.
Les rsultats obtenus pour la France sont les suivants :
Dependent Variable: INFFRA

Included observations: 33 after adjusting endpoints

C 8.918367 1.304888 6.834582 0.0000
CHOFRA(1) 0.442073 0.173685 2.545262 0.0161
DW = 0,23
On remarque que la probabilit critique de la variable chofra(1) est infrieure

5 %, donc le taux de chmage retard est une variable significative et dont le coefficient
est ngatif, ce qui est conforme lintuition conomique.
Estimons maintenant la relation entre linflation et le taux de chmage contemporain.

C 8.273400 1.322230 6.257158 0.0000
CHOFRA 0.345105 0.171588 2.011250 0.0528
Dans ce cas, nous remarquons que le taux de chmage contemporain nest pas aussi
significatif. En effet, la probabilit critique est lgrement suprieure 5 % mais reste
quand mme acceptable.
Pour les tats-Unis :
Dependent Variable: INFUSA

C 5.718162 2.147358 2.662883 0.0122
CHOUSA(1) 0.093347 0.343655 0.271629 0.7877
DW = 0,42
210 CONOMTRIE
9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 211


C 2.329524 2.082007 1.118884 0.2715
CHOUSA 0.449518 0.335099 1.341446 0.1892
On remarque que ni le taux de chmage retard, ni le taux de chmage contempo-

rain ne sont significatifs car leurs probabilits critiques sont suprieures 5 %.
Nous pouvons donc conclure que le fait de prendre le chmage retard ou le ch-
mage contemporain ne change pas significativement les rsultats. Nous prendrons donc
dans la suite le chmage retard afin de rester homogne par rapport la France.
3) La reprsentation graphique (graphique 8) des rsidus de la relation inflation-chma-

ge retard pour la France et pour les tats-Unis laisse supposer une prsence dautocor-
rlation positive des rsidus car il semblerait que les rsidus soient lis par une dyna-
mique cyclique. En ce qui concerne les points aberrants, il apparat des rsidus loigns
pour les priodes 10 et 18 pour la France alors que pour les tats-Unis, les rsidus sont
levs pour les priodes 10 et 17.
8 10
6
8
4
6
2
4
0
2
-2
-4 0
-6 -2
-8 -4
5 10 15 20 25 30 5 10 15 20 25 30
INFFRA Residuals INFUSA Residuals
Graphique 8 Reprsentation des rsidus pour la France et pour les tats-Unis
4) Tests dautocorrlation des erreurs.

Pour la France, il est possible dappliquer le test de Durbin et Watson la relation entre
linflation et le taux de chmage retard car le nombre dobservations est suprieur 15,
la variable expliquer ne figure pas parmi les variables explicatives et le modle est sp-
cifi en sries temporelles. La statistique de Durbin et Watson est gale 0,23. Dans la
table de Durbin et Watson, pour 33 observations et une variable explicative, on trouve
que d1 = 1,38 et d2 = 1,51. La statistique de Durbin et Watson dans ce cas est infrieure
d1, on peut donc conclure une autocorrlation positive des erreurs.
Il est galement possible de faire le test de Breusch-Godfrey.
Breusch-Godfrey : Serial Correlation LM Test:

On rejette lhypothse dabsence dautocorrlation car la probabilit critique du

Fisher est trs infrieure 5 %.

9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 212
Pour les tats-Unis, la statistique de Durbin et Watson est gale 0,42. Or d1 et d2

ont les mmes valeurs que pour la France, donc on peut conclure une autocorrlation
des erreurs.
Breusch-Godfrey : Serial Correlation LM Test:

On rejette lhypothse dabsence dautocorrlation car la probabilit critique du

Fisher est infrieure 5 %. On peut donc conclure une autocorrlation positive des
erreurs.
5) Construire une variable appel DUM qui vaut 0 chaque date lexception des
priodes 11 et 17 pour lesquelles elle vaut 1.
6) Estimation de la courbe de Philips sans autocorrlation des rsidus.

Soit le systme suivant :
w t = (u u t1 ) (1)
yt = 1 u t (2)
p t = c yt + w (3)
En remplaant dans lexpression (3) yt et w t par les relations (2) et (3), on trouve que :
p t = c( 1 u t ) + (u u t1 )
p t = 1 c(u t u t1 ) + (u u t1 ) car u t = (u t u t1 )
Do p t = c u t ( + 1 c)u t1 + u
Nous pouvons alors estimer cette quation.
Pour la France :

C 8.195813 1.341090 6.111305 0.0000
CHOFRA 1.978700 1.187570 1.666176 0.1061
CHOFRA(1) 2.412074 1.194353 2.019565 0.0524
Durbin-Watson stat 0.436616
On remarque que les deux variables ne sont pas significatives car leurs probabilits
critiques sont suprieures 5 %.
C 4.123759 2.073971 1.988340 0.0560
CHOUSA 1.363228 0.533217 2.556610 0.0159
CHOUSA(1) 1.192817 0.533991 2.233777 0.0331
212 CONOMTRIE
9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 213
En ce qui concerne les tats-Unis, ce modle est plus adapt que les deux prcdents
car les deux variables (chmage et chmage retard) sont significatives.
7) Estimation dun nouveau le modle en introduisant la variable DUM et en prenant en

compte lautocorrlation des rsidus.
Pour la France :
C 15.14060 6.269402 2.414999 0.0228
CHOFRA 0.254229 0.522127 0.486910 0.6303
CHOFRA(1) 0.788179 0.495101 1.591958 0.1230
DUM 2.674737 0.797477 3.354000 0.0024
AR(1) 0.866577 0.081842 10.58842 0.0000
On constate dans ce modle que les chmages retards et contemporains ne sont pas
significatifs.

C 12.66870 3.475067 3.645597 0.0011
CHOUSA 0.221311 0.292094 0.757670 0.4552
CHOUSA(1) 0.963667 0.296656 3.248427 0.0031
DUM 2.293875 0.767918 2.987137 0.0059
AR(1) 0.895121 0.086378 10.36288 0.0000
On remarque que dans ce cas, le chmage contemporain nest plus significatif, alors
que le chmage contemporain ltait dans le modle prcdent, non corrig des auto-
corrlations des rsidus et des points aberrants.
8) On cherche maintenant estimer le modle suivant :

p t = a0 + a1 p t1 + a2 u t + a3 u t1 + t .
Il sagit dun modle autorgressif dordre 1.

9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 214
Pour la France :

C 1.663308 0.625929 2.657345 0.0129
INFFRA(1) 0.831080 0.063433 13.10170 0.0000
CHOFRA 0.360813 0.439505 0.820953 0.4186
CHOFRA(1) 0.225252 0.448785 0.501916 0.6197
DUM 4.995335 0.898138 5.561881 0.0000
Nous remarquons que les variables choffra et choffra(1) ne sont pas significatives ; en
revanche, le terme autorgressif est bien significativement diffrent de 0.
Nous effectuons le test h de Durbin car nous avons un modle autorgressif (prsence
de la variable expliquer comme variable explicative retarde).
Soit le test dhypothses H0 : h = 0 contre H1 : h 0.

n DW
h = || avec = 1 donc = 0,098
1 na1
2
2

33
h = |0,98| = 0,60 < t 0,05 = 1,96 . Il nexiste donc plus dauto-
1 33 0,06342


C 3.704137 0.966380 3.833004 0.0007
INFUSA(1) 0.916993 0.115893 7.912443 0.0000
CHOUSA 1.025115 0.356171 2.878159 0.0076
CHOUSA(1) 0.442910 0.295441 1.499151 0.1450
DUM 4.630472 1.005135 4.606815 0.0001
Dans ce modle, seul le taux de chmage dcal nest pas significatif. On peut ga-
lement effectuer le test du h de Durbin, h = 0,182 qui est trs infrieur 1,96. Il nexis-
te donc plus dautocorrlation des erreurs.
214 CONOMTRIE
9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 215
9) Tests de Chow1.
Pour la France :
Le test de Chow est effectu la priode 20 comme priode charnire. Comme pour la
deuxime priode, la variable DUM est gale 0 (colinarit avec le terme constant),
nous la retirons pour les deux priodes.
Nous obtenons : SCR = 83,25 ; SCR1 = 70,03 ; SCR2 = 5,056.
Chow Breakpoint Test: 21


Nous obtenons : SCR = 80,59 ; SCR1 = 52,04 ; SCR2 = 7,93.
Chow Breakpoint Test: 18

Nous acceptons lhypothse que le fait de scinder en deux sous priodes namlio-
re pas le modle pour la France et les tats-Unis.
10) Nous construisons les deux sries phi = pt a 1 pt1 a 4 dum pour la France et les
tats-Unis :
phi f rat = in f f rat 0,83in f f rat1 4,99dum t
phiusat = in f usat 0,91in f usat1 4,63dum t
la lecture de la reprsentation graphique (graphique 9) pour les tats-Unis et la France
de la relation entre le chmage et phi, nous remarquons que la tendance de la courbe de
la France a une pente moins importante que celle des tats-Unis, ce qui nous permet
dmettre lhypothse quune politique de dsinflation a moins deffets ngatifs aux
tats-Unis quen France. Nous pouvons donc en conclure quune politique de dsinfla-
tion est plus coteuse en termes de chmage en France quaux tats-Unis.
4 5
4
3
3
2
2
1
PHIFRA
PHIUSA
0 0
-1
-1
-2
-2
-3
-3 -4
1 2 3 4 5 6 7 8 9 10 11 12 13 3 4 5 6 7 8 9 10
CHOFRA CHOUSA
Graphique 9 Relation entre le chmage et phi pour la France et pour les tats-Unis
1. titre dexercice, le lecteur vrifiera les rsultats proposs par le logiciel, cf. chapitre 3, IV. B.

9782100721511-Bourbo-C07.qxd 20/10/14 15:25 Page 216
9782100721511-Bourbo-C08.qxd 22/10/14 9:23 Page 217
8. Introduction
aux modles
quations simultanes
C
e chapitre est une introduction1 aux modles dont la spcification
ncessite lcriture dquations multiples rlies entre elles au tra-
vers de variables figurant dans plusieurs quations.
Nous ne pouvons pas, sauf cas particulier, utiliser la mthode des MCO
quation par quation comme si chacune de ces quations tait ind-
pendante les unes des autres.
En I., nous envisageons la prsentation matricielle dun modle qua-
tions simultanes et son criture sous forme rduite (les variables
endognes sont exprimes en fonction des seules variables exognes).
Le problme de lidentification, cest--dire la possibilit destimation du
modle sous forme rduite, est tudi en II. Enfin, en III., nous prsentons
les mthodes destimation spcifiques des modles quations simulta-
nes.
Les exercices dapplication se trouvent exceptionnellement tous en fin de
chapitre, la partie thorique tant relativement rduite.
1. Dans le cadre de ce manuel, nous limitons volontairement les dveloppements thoriques qui
peuvent se rvler complexes dans le domaine de lconomtrie en gnral, et des quations
simultanes en particulier. Le lecteur dsirant approfondir ce chapitre peut se rfrer Greene
W.H. chapitre 16, 2000.
Introduction aux modles quations simultanes 217

9782100721511-Bourbo-C08.qxd 22/10/14 9:23 Page 218
I. quations structurelles
et quations rduites
Lorsque nous sommes en prsence dun modle linaire quations multiples,

il arrive frquemment quune variable endogne dune quation apparaisse en
tant que variable explicative dune autre quation. Ce double statut de certaines
variables entrane un biais dans les estimations des coefficients lorsque nous
employons les MCO, quation par quation.
Nous allons donc chercher transformer le modle initial en un modle o
les variables endognes ne sont exprimes quen fonction des variables exo-
gnes.
Considrons le modle macro-conomique trois quations :
Ct = a0 + a1 Yt + 1t [E1]
It = b0 + b1 Yt1 + 2t [E2]
Yt = Ct + It [E3]
avec :
Ct = consommation totale pour lanne t ;
It = investissement total pour lanne t ;
Yt = revenu total pour lanne t .
Ce systme dquations multiples, spcifi par lconomiste, qui traduit
directement les relations entre les variables, sappelle : le systme dquations
structurelles.
Ce modle comporte trois quations dont une identit [E3]. En effet, dans la
relation [E3], il ny a aucun coefficient estimer et par consquent pas de terme
alatoire. Lquation [E1] est une fonction de consommation et lquation [E2]
est relative linvestissement.
Ce systme contient trois variables endognes : Ct , It , Yt et une variable exo-
gne Yt1 . Nous remarquons, par exemple, que la variable Yt apparat comme
variable explicative en [E1], ce qui est contraire son statut de variable endo-
gne.
218 CONOMTRIE
9782100721511-Bourbo-C08.qxd 22/10/14 9:23 Page 219
Pour lever ce problme, nous allons exprimer les trois variables endognes
(Ct ,It ,Yt ) en fonction de la seule variable exogne (Yt1 ) .
En substituant [E3] dans [E1], nous obtenons :
Ct = a0 + a1 (Ct + It ) + 1t = a0 + a1 Ct + a1 It + 1t
En remplaant It par son expression [E2] et en faisant passer a1 Ct gauche de

lquation, nous pouvons crire :
(1 a1 )Ct = a0 + a1 b0 + a1 b1 Yt1 + a1 2t + 1t
ou encore :
a0 + a1 b0 a1 b1 a1 2t + 1t
Ct = + Yt1 +
1 a1 1 a1 1 a1
Il en rsulte que :

a0 + a1 b0 a1 b1 a1 2t + 1t
Yt = Ct + It = + b0 + + b1 Yt1 + + 2t
1 a1 1 a1 1 a1
a0 + b0 b1 2t + 1t
Yt = + Yt1 +
1 a1 1 a1 1 a1
Les quations structurelles sont alors quivalentes aux quations rduites
(les variables endognes sont exprimes en fonction des seules variables exo-
gnes) :
a0 + a1 b0 a1 b1 a1 2t + 1t
Ct = + Yt1 + [E4]
1 a1 1 a1 1 a1
a0 + b0 b1 2t + 1t
Yt = + Yt1 + [E5]
1 a1 1 a1 1 a1
It = b0 + b1 Yt1 + 2t [E6]
Lquation [E5] indique que la variable Yt est fonction de 1t et par cons-

quent E(Yt 1t ) = 0 . Il en rsulte que, dans lquation [E1], lhypothse dind-
pendance entre la variable explicative Yt et lerreur 1t nest pas respecte et
lapplication des MCO sur le modle [E1] conduit des estimateurs biaiss et
non convergents.
En revanche, lutilisation des MCO sur les quations rduites est licite
puisque la variable Yt1 est indpendante de 1t et 2t .
Il est noter que la forme rduite permet de mesurer leffet total, direct et indi-
rect, dune modification de la variable exogne Yt1 sur les variables endognes.
Par exemple, le schma suivant illustre la cascade des causalits :
[E2] [E3] [E1]
Yt1 It Yt Ct ce qui est rsum dans [E4].

9782100721511-Bourbo-C08.qxd 22/10/14 9:23 Page 220
B. Le modle gnral
Soit le systme gnral de g quations structurelles liant g variables endognes
k variables prdtermines :
b11 y1t + b12 y2t + . . . + b1g ygt + c11 x1t + c12 x2t + . . . + c1k xkt = 1t
...
bg1 y1t + bg2 y2t + . . . + bgg ygt + cg1 x1t + cg2 x2t + . . . + cgk xkt = gt
Soit, sous forme matricielle :

B Y + C X =
[1]
(g,g) (g,1) (g, k) (k,1) (g,1)
Bien entendu, dans chaque quation, quelques coefficients sont nuls et la
variable dont le coefficient est gal 1 est la variable dpendante. Si une qua-
tion a tous ses coefficients, non nuls, gaux 1 et ne comporte pas de terme ala-
toire, cela signifie quil sagit dune identit (aucun coefficient nest estimer).
Si la matrice B est rgulire, nous passons de la forme structurelle la forme
rduite en exprimant Y en fonction de X , soit :
Y = B 1 C X + B 1 [2]
et nous pouvons appliquer les MCO. En effet, les erreurs B 1 sont indpen-
dantes de X .
Si, sur le plan de la prsentation, la formalisation est simple, sa mise en
uvre pratique est plus complexe. En effet, la connaissance des g k lments
de la matrice (B 1 C) ne permet pas de dterminer didentifier la matrice
B (compose de g g lments) ainsi que la matrice C (compose de g k
lments). Nous sommes alors en prsence de g k quations
(g g) + (g k) inconnues qui, sans restrictions supplmentaires, savrent
impossibles rsoudre, il sagit du problme de lidentification.
Nous allons donc prsenter en II. des rgles simples permettant, partir de
restrictions sur les paramtres, de dterminer des conditions didentification.
titre dillustration le modle introductif peut scrire sous forme matri-
cielle :

Ct 1 0 a1 a0 0
U
Y = It ; B= 0 1 0 ; X= ; C= b0 b1 ;
Yt1
Yt 1 1 1 0 0

1t
= 2t ( U est le vecteur unit.)
0
220 CONOMTRIE
9782100721511-Bourbo-C08.qxd 22/10/14 9:23 Page 221
C. Cas particulier : les modles rcursifs

Un systme dquations est appel rcursif si chaque variable endogne peut
tre dtermine de manire squentielle :
y1t = f (x1t ,x2t . . . xkt ; 1t )
y2t = f (x1t ,x2t . . . xkt ; y1t ; 2t )
y3t = f (x1t ,x2t . . . xkt ; y1t ,y2t ; 3t )
(Les variables alatoires (it ) sont, par hypothse, indpendantes.)
Nous observons que la premire quation ne contient aucune variable endo-
gne. La deuxime quation a pour variable explicative endogne, la
variable de la premire quation, et ainsi de suite.
Lorsquun modle quations simultanes rpond au critre de rcursivit,
il est licite dappliquer la mthode des MCO quation par quation. En effet,
dans ce cas particulier, il y a indpendance entre les variables endognes et les
erreurs. Par exemple, dans la deuxime quation, y1t dpend de 1t mais pas de
2t.
Les modles rcursifs sont aussi appels systme triangulaire car les
coefficients des variables endognes forment un triangle au sein de la matrice B .
II. Le problme de lidentification

A. Restrictions sur les coefficients
Il y a une restriction sur un coefficient de la forme structurelle, chaque fois
quun paramtre est contraint par lcriture du modle tre gal une
valeur dtermine. Nous distinguons deux types de restrictions.
1) Restrictions dexclusion
Nous pouvons considrer que chaque fois quune variable endogne ou exog-
ne napparat pas dans une quation structurelle, cela revient laffecter dun
coefficient nul. Par exemple, dans notre modle introductif, la variable It ne
figure pas dans lquation [E1], son coefficient est donc nul : dans la matrice B ,
llment de la premire ligne et de la deuxime colonne est gal 0.
2) Restrictions linaires
Certaines spcifications de modle imposent que des variables soient affectes
dun coefficient identique, il sagit l encore de restrictions a priori sur les para-
mtres du modle.

9782100721511-Bourbo-C08.qxd 22/10/14 9:23 Page 222
B. Conditions didentification
Les conditions didentification se dterminent quation par quation. Nous pou-
vons distinguer trois cas didentifications :
le modle est sous-identifi si une quation du modle est sous-identifiable
(il y a moins dquations que de paramtres identifier dans la forme
structurelle, le systme est donc impossible rsoudre) ;
le modle est juste identifi si toutes les quations sont justes identifiables ;
le modle est sur-identifi si les quations du modle sont soit justes iden-
tifiables, soit sur-identifiables.
Si le modle est sous-identifi, il nexiste aucune possibilit destimation des
paramtres du modle, celui-ci doit tre respcifi.
Les conditions didentification peuvent faire lobjet dun dveloppement
complexe, nous nous bornons ici dicter des rgles simples qui sont, dans la
pratique, appliques en premier lieu.
Soit :
g = nombre de variables endognes du modle (ou encore nombre dquations
du modle) ;
k = nombre de variables exognes du modle ;
g = nombre de variables endognes figurant dans une quation ;
k = nombre de variables exognes figurant dans une quation.
Lorsque les restrictions ne sont que des restrictions dexclusion, les condi-
tions ncessaires didentifiabilit snoncent ainsi :
g. 1 > g g + k k lquation est sous-identifie ;
g. 1 = g g + k k lquation est juste identifie ;
g. 1 < g g + k k lquation est sur-identifie.
Ce qui peut se rsumer ainsi : pour quune quation ne soit pas sous-identi-
fie, le nombre de variables exclues de lquation doit tre au moins gal au
nombre dquations du modle moins 1.
Lorsque nous avons r restrictions, autres que celles dexclusion, concernant
les paramtres dune quation (galit de deux coefficients, par exemple), les
conditions prcdentes deviennent :
g. 1 > g g + k k + r lquation est sous-identifie ;
g. 1 = g g + k k + r lquation est juste identifie ;
g. 1 < g g + k k + r lquation est sur-identifie.
Ces conditions ncessaires sont appeles conditions dordre didentifiabilit.
222 CONOMTRIE
9782100721511-Bourbo-C08.qxd 22/10/14 9:23 Page 223
Il convient de vrifier des conditions suffisantes, qualifies de conditions de

rang qui, dans la pratique, se rvlent difficiles, voire parfois impossibles
mettre en uvre. En annexe, ces conditions sont exposes.
III. Les mthodes destimation

Les mthodes destimation que nous pouvons utiliser dans le cadre des qua-
tions simultanes sont fonction du critre didentifiabilit du modle.
Si le modle est sous-identifiable ; pas destimation possible.
Dans le cas dun modle juste ou sur-identifiable, nous pouvons distinguer la
mthode employer quation par quation, selon le critre didentifiabilit :
Si lquation est juste identifie : les moindres carrs indirects ou les doubles
moindres carrs.
Si lquation est sur-identifie : les doubles moindres carrs.
A. Les moindres carrs indirects

La mthode des Moindres Carrs Indirects (MCI) consiste appliquer la mtho-
de des MCO aux quations justes identifies du modle sous formes rduite ;
elle se compose de trois tapes :
mise sous forme rduite du modle structurel ;
estimation par les MCO des paramtres de chacune des quations ;
dtermination des coefficients des quations structurelles partir des rela-
tions algbriques entre coefficients rduits et structurels (puisque le mod-
le est juste identifiable, la solution est unique).
Lestimateur des MCI de la forme rduite est BLUE. Cependant, lestimateur
des coefficients de la forme structurelle, obtenu partir de lestimateur optimal
des MCI, est biais pour les petits chantillons. Les proprits asymptotiques
font tendre ce biais vers 0, lorsque la taille de lchantillon augmente.
Cet estimateur des MCI est rarement utilis du fait de la difficult, pour les
modles importants, de dterminer la forme rduite du modle. Nous lui prf-
rons lestimateur des doubles moindres carrs, plus simple mettre en uvre et
qui fournit les mmes rsultats que les MCI pour les quations justes identifies.
B. Les doubles moindres carrs

La procdure destimation des Doubles Moindres Carrs (DMC) est la plus utili-
se en pratique. Elle sapplique pour tous les modles justes ou sur-identifiables.

9782100721511-Bourbo-C08.qxd 22/10/14 9:23 Page 224
Cette mthode des DMC est fonde, comme son nom lindique, sur lapplica-
tion en deux tapes des MCO.
Soit le modle quations simultanes g variables endognes et k
variables exognes :
...
bg1 y1t + bg2 y2t + . . . + bgg ygt + cg1 x1t + cg2 x2t + . . . + cgk xkt = gt
La premire tape consiste effectuer une rgression de chacune des
variables endognes sur toutes les variables exognes :
y1t = 11 x1t + 12 x2t + . . . + 1k xkt + u 1t
y2t = 21 x1t + 22 x2t + . . . + 2k xkt + u 2t
...
ygt = g1 x1t + g2 x2t + . . . + gk xkt + u gt
Puis, dans une deuxime tape, il convient de remplacer les variables endo-
gnes figurant droite des quations structurelles par leurs valeurs ajustes
laide des modles estims :
y1t = 12
y2t + . . . + 1gygt + c11 x1t + c12 x2t + . . . + c1k xkt + 1t
y2t = 21
y1t + . . . + 2gygt + c21 x1t + c22 x2t + . . . + c2k xkt + 2t
...
ygt = g1
y1t + g2 y2t + . . . + cg1 x1t + cg2 x2t + . . . + cgk xkt + gt
Les proprits de lestimateur des DMC sont identiques, de manire asymp-

totique, celles dun estimateur classique ; cest--dire que pour les petits
chantillons les estimations des paramtres peuvent tre biaises.
Il est noter que lestimateur des DMC peut sinterprter comme tant un
estimateur de la mthode des Variables Instrumentales1, les variables exognes
des autres quations tant les instruments.
C. Autres mthodes destimation

Nous pouvons citer trois mthodes :
La mthode des triples moindres carrs est adapte lorsque les erreurs sont
autocorrles et/ou htroscdastiques, elle consiste dterminer lestima-
teur des doubles moindres carrs puis calculer lestimateur des MCG.
La mthode du maximum de vraisemblance information complte
(MVIC) consiste maximiser la fonction Log-vraisemblance associe au
modle.
1. Greene W.H., pages 681-684, 2000.
224 CONOMTRIE
9782100721511-Bourbo-C08.qxd 22/10/14 9:23 Page 225
La mthode des moments gnralise est utilise en cas de prsence dh-

troscdasticit.
Exercice n 1
fichier C8EX1
Comparaison des rsultats par moindres carrs ordinaires,
moindres carrs indirects et doubles moindres carrs
Soit le modle suivant sous forme structurelle :
Y1t = a(Y2t + X 1t ) + 1t [E1]
Y2t = bY1t + cY1t1 + 2t [E2]
avec :
Y1t = Produit National Brut pour lanne t ;
Y2t = consommation des mnages pour lanne t ;
X 1t = demande finale autre que consommation des mnages pour lanne t.
Nous disposons des donnes du tableau 1 dans lequel les variables ont t pralable-
ment centres.
Tableau 1 Variables macro-conomiques centres
t Y1t Y2t X 1t Y1t1
1 30,0 14,0 26,0 20,0

2 4,0 10,0 5,0 30,0
3 19,0 19,0 36,0 4,0
4 6,0 11,0 6,0 19,0
5 9,0 6,0 13,0 6,0
6 11,0 12,0 25,0 9,0
7 9,0 10,0 5,0 11,0
8 19,0 11,0 32,0 9,0
9 29,0 19,0 14,0 19,0
1) Prciser les conditions didentifiabilit du modle.

2) Estimer les quations de la forme structurelle par les MCO et dmontrer que les esti-
mateurs ne sont pas BLUE.
3) Estimer les coefficients par les MCI et les DMC.
4) Comparer les rsultats obtenus.
Solution
1) Nous nous rfrons aux conditions didentification dveloppes en II.

Le modle comporte deux variables endognes, Y1t et Y2t soit g = 2 , et deux
variables exognes, X 1t et Y1t1 soit k = 2.

9782100721511-Bourbo-C08.qxd 22/10/14 9:23 Page 226
La premire quation [E1] comporte une restriction dexclusion et une restriction de

contrainte (les coefficients de Y2 et X 1 sont gaux). Soit, en appliquant les conditions
didentifiabilit, les variables figurant dans lquation donnent : g = 2 , k = 1 et la
contrainte dgalit des coefficients : r = 1.
Soit : g g + k k + r = 2 2 + 2 1 + 1 = 2 > g 1 = 1 , lquation [E1]
est sur-identifie.
Pour lquation [E2], nous avons g = 2 , k = 1 et r = 0 , soit
g g + k k + r = 2 2 + 2 1 + 0 = 1 = g 1,
lquation [E2] est juste identifie.
Nous pouvons donc estimer les coefficients du modle.
2) Les rsultats de lestimation par les MCO sont les suivants aprs avoir cr la nouvel-
le variable explicative : somme de Y2 et X 1 . Il est noter que le modle ne comporte
pas de terme constant puisque les donnes sont centres.
[E3]
Y1t = 0,516(Y2t + X 1t ) + e1t
(5,89)
R = 0,81
2
n=9
() = t de Student
[E4]
Y2t = 0,518 Y1t + 0,040 Y1t1 + e2t
(2,58) (0,18)
R = 0,50
2
n=9
Ces estimateurs ne sont pas BLUE. En effet, si on explicite Y1t en fonction de X 1t et

de Y1t1, on obtient :
a ac 2t
Y1t = X 1t + Y1t1 +
1 ab 1 ab 1 ab
Or, dans lquation [E2], on rgresse Y2t sur Y1t qui dpend alatoirement de 2t , ce
qui est en contradiction avec lhypothse dindpendance entre la variable explicative et
lerreur. Les estimateurs ne sont donc pas BLUE.
3) Pour appliquer la mthode des MCI, il convient dabord de mettre le modle sous
forme rduite, soit :
a ac 2t 1t
Y1t = X 1t + Y1t1 + + [E5]
1 ab 1 ab 1 ab 1 ab
ab c 2t + b1t
Y2t = X 1t + Y1t1 + [E6]
1 ab 1 ab 1 ab
ou encore :
Y1t = 1 X 1t + 2 Y1t1 + v1t
Y2t = 3 X 1t + 4 Y1t1 + v2t
226 CONOMTRIE
9782100721511-Bourbo-C08.qxd 22/10/14 9:23 Page 227
Les rsultats destimation par les MCO sont les suivants :

[E7]
Y1t = 0,717 X 1t + 0,190 Y1t1 + e1t
(4,93) (1,0)
R 2 = 0,78
n=9
() = t de Student
[E8]
Y2t = 0,355 X 1t + 0,139 Y1t1 + e2t
(1,92) (1,0)
R 2 = 0,36
n=9
Or le modle sous forme matricielle scrit :

1 a Y1t a 0 X 1t 1t
+ =
b 1 Y2t 0 c Y1t1 2t
B Y + C X =
ou encore Y = B 1 C X + B 1 = AX + v qui est le modle sous forme rduite avec

A = B 1 C (A est la matrice des coefficients estims de la forme rduite).
Nous avons donc B A = C , soit :

1 a 0,717 0,190 a 0
=
b 1 0,355 0,139 0 c
ce qui donne :
0,717 a 0,355 = a
0,190 a 0,139 = 0
b 0,717 + 0,355 = 0
b 0,190 + 0,139 = c
Nous pouvons, partir des deux dernires relations, estimer b = 0,495 et

c = 0,045 (puisque lquation [E2] est juste identifie), mais, en revanche, le coefficient
a est indtermin (lquation [E1] est sur-identifie).
Nous appliquons maintenant la mthode des DMC afin destimer tous les coefficients
de ce modle.
Nous allons dvelopper le calcul pour la premire quation.
tape 1 : rgresser la variable endogne Y2t sur toutes les variables exognes (X 1t et
Y1t1 ).
Le rsultat est dj connu, puisquil sagit de lquation [E8].
2t
tape 2 : calculer la srie ajuste : Y
soit : 2t = 0,355 X 1t + 0,139 Y1t1

Y
2t dans lqua-
tape 3 : la variable endogne Y2t est remplace par sa valeur ajuste Y
2t + X 1t ) + 1t .
tion [E1] : Y1t = a(Y

9782100721511-Bourbo-C08.qxd 22/10/14 9:23 Page 228
Le rsultat destimation par les MCO est le suivant :

2t + X 1t ) + e1t
Y1t = 0,535(Y
(5,22)
R = 0,77
2
n=9
() = t de Student
Cette procdure des DMC est donc un peu lourde mettre en uvre, cest pourquoi les
logiciels permettent en une seule instruction dutiliser cette mthode. Par exemple, pour
estimer la deuxime quation de notre modle, linstruction de Eviews est la suivante :
TSLS Y2 Y1(-1) Y1 @ X1 Y1( 1)
o TSLS est labrviation de Two-Stage Leasts Squares. La variable expliquer (Y2)
figure suivie des variables exognes Y1( 1), la seule dans cette quation et, enfin, on
cite, la variable endogne que lon dsire remplacer par sa valeur ajuste laide des
sries exognes (elles sont spares de la variable endogne par le signe @).
Le rsultat, fourni par Eviews, est le suivant :
Dependent Variable : Y2
Method: Two-Stage Least Squares
Instrument list: X1 Y1D

Y1D 0.045084 0.220336 0.204614 0.8437
Y1 0.495344 0.228271 2.169985 0.0666

S.E. of regression 10.45016 Sum squared resid 764.4403
F-statistic 5.176628 Durban-Watson stat 3.011822
Prob(F-statistic) 0.057037
Nous remarquons que lestimation des coefficients est exactement la mme que par
la mthode des MCI. En effet, nous rappelons que la mthode des MCI fournit des rsul-
tats strictement identiques la mthode des DMC. Cest pourquoi, dans la pratique, seule
cette dernire est utilise car elle se rvle dun maniement bien plus ais.
4) Nous pouvons au sein du tableau 2 comparer lensemble des rsultats obtenus.
Tableau 2 Rsultats destimation par les MCO et DMC
MCO DMC
a 0,516 0,535
(5,89) (5,29)
b 0,518 0,495
(2,58) (2,17)
c 0,040 0,045
(0,18) (0,20)
228 CONOMTRIE
9782100721511-Bourbo-C08.qxd 22/10/14 9:23 Page 229
la lecture de ces rsultats, nous constatons des diffrences assez faibles entre les
estimations des MCO et celles des DMC. En effet, les proprits des estimateurs des
DMC ne sont quasymptotiques, or le nombre dobservations dans cet exemple est limi-
t 9.
Exercice n 2
Le problme de lidentification lorsque la structure
dun modle change
On considre le systme dquations :
Y1t + aY2t + b = 1t [E1]

cY1t + Y2t + dZ t + e = 2t [E2]
dans lequel Y1t et Y2t sont des variables endognes et Z t une variable exogne.
1) Mettre ce systme sous forme matricielle et tudier les conditions didentifiabilit.
2) Vrifier les conditions didentifiabilit partir du calcul matriciel.
3) Rpondre aux mmes questions avec e = 0 .
Solution
1) Le modle sous forme matricielle scrit :

1 a Y1t 0 b Zt 1t
+ = soit BY + C X =
c 1 Y2t d e Ut 2t
avec U = vecteur unit.
Nous avons g = 2 variables endognes : Y1t , Y2t et k = 2 variables exognes Z t et
U . Examinons les conditions didentifiabilit :
pour lquation [E1] : g = 2 , k = 1 et r =0 soit
g g + k k + r = 1 = g 1 , lquation [E1] est juste identifie ;
pour lquation [E2] : g = 2 , k = 2 et r =0 soit
g g + k k + r = 0 < g 1 , lquation [E2] est sous-identifie.
2) Par le calcul matriciel, nous allons exprimer les variables endognes par les variables
exognes : Y = B 1 C X + B 1 .
Posons A = B 1 C

1
1 1 a 1 ad b ae
B = A=
1 ac c 1 1 ac d bc + e
Cette matrice A correspond la matrice des coefficients estims (nots

i ) de la
forme rduite.
Nous avons donc la relation B A = C :

1 a
1 2 0 b
=
c 1
3 4 d e

9782100721511-Bourbo-C08.qxd 22/10/14 9:23 Page 230
soit en explicitant cette relation matricielle :

1 + a
3 = 0 [E3] 1 +
c 3 = d [E5]

2 + a
4 = b [E4] 2 +
c 4 = e [E6]
Les quations [E3] et [E4] constituent deux quations deux inconnues. Les coefficients
a et b sont donc parfaitement identifiables ds lors que lon connat les coefficients de la
forme rduite. Ces deux coefficients a et b appartiennent lquation [E1] qui est juste
identifie, ce qui est une vrification des rgles nonces.
En revanche, les quations [E5] et [E6] forment deux quations trois inconnues,
soit un systme indtermin. Lquation [E3] est bien sous-identifie.
3) Si e = 0 , lquation [E1] reste juste identifie et lquation [E2] devient, ds lors,
juste identifie. Matriciellement, le systme scrit :

1 a
1 2 0 b
=
c 1
3 3 d 0
Soit, en explicitant cette relation matricielle :

1 + a
3 = 0 [E7] 1 +
c 3 = d [E9]

2 + a
4 = b [E8] 2 +
c 4 = 0 [E10]
Soit quatre quations quatre inconnues, le systme est maintenant parfaitement
dtermin.
Exercice n 3
fichier C8EX3
Le modle de Klein
Ce modle1 macro-conomique fournit un excellent exemple pdagogique des pro-
blmes qui peuvent se poser dans le cadre des quations simultanes.
Soit le modle suivant :
Const = a0 + a1 Pt + a2 Pt1 + a3 (Wt + Wt ) + 1t [E1]
It = b0 + b1 Pt + b2 Pt1 + b3 K t1 + 2t [E2]
Wt = c0 + c1 X t + c2 X t1 + c3 t + 3t [E3]
X t = Const + It + G t [E4]
Pt = X t Wt T axt [E5]
K t = It + K t1 [E6]
avec :
Const = consommation pour lanne t ;
Pt = profits de lanne t ;
Wt et Wt = salaires de lanne t verss par lindustrie et ladministration ;
It = investissements de lanne t ;
1. Klein L. R., 1950.
230 CONOMTRIE
9782100721511-Bourbo-C08.qxd 22/10/14 9:23 Page 231
Kt = stock de capital la fin de lanne t ;

Xt = production industrielle de lanne t ;
Gt = dpenses publiques de lanne t ;
T axt = impts sur les profits de lanne t.
1) Distinguer les variables endognes et exognes.
2) Estimer les quations par la mthode des MCO.
3) Examiner les conditions didentifiabilit de ce modle.
4) Estimer ce modle laide dune mthode adquate.
Les donnes exprimes dans des units convenablement choisies sont prsentes
sur le tableau 3.
Tableau 3 Donnes du modle de Klein (1950) (extrait des donnes)
Constt Gt It K t1 Pt T axt Wt Wt Xt
1920 39,8 2,4 2,7 180,1 12,7 3,4 28,8 2,2 44,9
1921 41,9 3,9 0,2 182,8 12,4 7,7 25,5 2,7 45,6

1940 65,0 7,4 3,3 201,2 21,1 9,6 45,0 8,0 75,7
1941 69,7 13,8 4,9 204,5 23,5 11,6 53,3 8,5 88,4
(NB : ce tableau indique directement la variable K t1 )
Solution
1) Ce modle comporte six quations et onze variables conomiques (y compris le vec-
teur et la tendance). Les trois dernires quations sont des identits (aucun paramtre
nest estimer).
Les variables exognes sont les variables non expliques par une relation :
les variables retardes : Pt1 , X t1 , K t1 et
les variables vritablement exognes : la tendance t, les dpenses gouverne-
mentales G t , les salaires des administrations Wt , les impts sur les profits T axt et
le vecteur unit U. Soit, k = 8.
Les variables endognes sont celles qui sont dtermines par une relation de com-
portement : Constt , It , Wt . En ce qui concerne les identits, on choisit comme variables
endognes, compte tenu de leur signification, X t , Pt et K t . Soit g = 6.
Nous remarquons que, dans ce choix de variables endognes et exognes, la rflexion
conomique joue un grand rle. Nanmoins, il subsiste une part darbitraire reprsenta-
tive du schma de pense de lconomiste.
2) Les estimations par les MCO sont les suivantes :
Constt = 16,23 + 0,193 Pt + 0,089 Pt1 + 0,796(Wt + Wt ) + e1t [E7]

(12,4) (2,11) (0,99) (19,9)
R 2 = 0,98 n = 21 DW = 1,36 () = t de Student
It = 10,12 + 0,479 Pt + 0,333 Pt1 0,111 K t1 + e2t [E8]

(1,85) (4,93) (3,30) (4,189)
R 2 = 0,93 n = 21 DW = 1,81 () = t de Student

9782100721511-Bourbo-C08.qxd 22/10/14 9:23 Page 232
Wt = 0,066 + 0,439 X t + 0,146 X t1 + 0,13 t + e3t [E9]

(2,02) (13,5) (3,90) (4,90)
R 2 = 0,98 n = 21 DW = 1,95 () = t de Student
Les estimateurs des MCO sont biaiss, cette mthode destimation est donc inappro-
prie pour ce type de modle. Nous devons tudier les conditions didentification de ce
modle et utiliser, le cas chant, la mthode des DMC.
3) Les conditions didentification conditions dordre studient quation par qua-

tion.
Le modle comporte g = 6 variables endognes et k = 8 variables exognes (cf. la
rponse la question 1).
Pour lquation [E1], nous avons g = 3 , variables endognes prsentes et k = 3 ,
variables exognes prsentes, soit (g g + k k = 8) restrictions dexclusion. De
plus, lgalit entre le coefficient de Wt et Wt introduit une restriction supplmentaire
r = 1.
g g + k k + r = 9 > g 1 = 5 lquation [E1] est sur-identifie.
Pour lquation [E2] : g = 2 , k = 3 et r = 0 soit :
g g + k k + r = 9 > g 1 = 5 , lquation [E2] est sur-identifie.
Pour lquation [E3] : g = 2 , k = 3 et r = 0 soit :
g g + k k + r = 9 > g 1 = 5 , lquation [E3] est sur-identifie.
Les quations tant toutes sur-identifies, il est licite destimer les coefficients de ce
modle laide de la mthode des DMC.
4) Nous avons appliqu la mthode des DMC pour chacune des trois quations estimer
de trois manires diffrentes.
quation [E1] en dcomposant la mthode des DMC.
Les variables endognes Pt et Wt apparaissent droite de lquation ; il convient
donc de les remplacer par leurs valeurs en fonction des 8 variables exognes.
tape 1 : estimation du modle pour Pt et calcul de la variable ajuste P At .
Dependent Variable : P
Sample (adjusted): 1921 1941

C 46.55153 23.15829 2.010145 0.0656
P(-1) 0.802501 0.518856 1.546674 0.1459
K 0.216103 0.119113 1.814267 0.0928
X(-1) 0.022000 0.282164 0.077969 0.9390
WP 0.079608 2.533823 0.031418 0.9754
TREND 0.319405 0.778129 0.410478 0.6881
G 0.439016 0.391143 1.122394 0.2820
TAX 0.923098 0.433759 2.128133 0.0530
232 CONOMTRIE
9782100721511-Bourbo-C08.qxd 22/10/14 9:23 Page 233
tape 2 : estimation pour Wt et calcul de la variable ajuste W At .
Dependent Variable : W

C 34.87254 18.61034 1.873826 0.0836
P(1) 0.871921 0.416960 2.091137 0.0567
K 0.122952 0.095721 1.284477 0.2214
X(1) 0.095329 0.226751 0.420412 0.6811
WP 0.443726 2.036218 0.217917 0.8309
TREND 0.713584 0.625316 1.141158 0.2744
G 0.866220 0.314328 2.755783 0.0164
TAX 0.60415 0.348575 -1.733206 0.1067
tape 3 : estimation du modle final en remplaant dans lquation [1] Pt par P At et

Wt par W At .
Dependent Variable : CONS

Included observations: 21 after adjusting

C 16.55476 2.571080 6.438834 0.0000
PA 0.017302 0.229797 0.075294 0.9409
P(1) 0.216234 0.208810 1.035554 0.3149
WA + WP 0.810183 0.078351 10.34044 0.0000
quation [E2] par application directe de la mthode des DMC laide de Eviews,
linstruction unique est la suivante (la liste des instruments les variables exognes
figurent aprs @ :
TSLS I C P(1) K P @ C P(1) K X(1) WP TREND G TAX
Dependent Variable : I
Method: Two-Stage Least Squares
Instrument list: C P(1) K X(1) WP TREND G TAX

C 20.27821 8.383247 2.418897 0.0271
P(1) 0.615943 0.180926 3.404398 0.0034
K 0.157788 0.040152 3.929752 0.0011
P 0.150222 0.192534 0.780238 0.4460

9782100721511-Bourbo-C08.qxd 22/10/14 9:23 Page 234
quation [E3] par application directe de la mthode des DMC laide de RATS,
les instructions sont les suivantes :
INSTRUMENTS CONSTANT TREND WP TAX G P{1} K X{1}
LINREG(INST) W
# CONSTANT TREND X{1} X
Dependent Variable W Estimation by Instrumental Variables
Annual Data From 1921: 01 To 1941: 01
Usable observations 21 Degrees of Freedom 17
Centered R**2 0.987414 R Bar **2 0.985193
Variable Coeff Std Error T-Stat Signif
1. Constant 0.064451360 1.147038221 0.05619 0.95584607
2. TREND 0.130395687 0.032388389 4.02600 0.00087642
3. X{1} 0.146673821 0.043163948 3.39806 0.00342209
4. X 0.438859065 0.039602662 11.08155 0.00000000
Nous pouvons aussi appliquer la mthode des triples moindres carrs. Le systme
(SYS01) scrit :
cons = C(1) + C(2) P + C(3) P( 1) + C(4) (W + WP)
I = C(5) + C(6) P + C(7) P( 1) + C(8) K
W = C(9) + C(10) X + C(11) X( 1) + C(12) @trend(1919)
inst C @trend(1919) WP TAX G P( 1) K X( 1)
Les rsultats (SYS01.3SLS) sont les suivants :
System : SYS01
Estimation Method : Three-Stage Least Squares
Sample : 1921 1941
Total system (balanced) observations 63
Coefficient Std Error t-Statistic Prob.
C(1) 16.44079 1.304549 12.60267 0.0000
C(2) 0.124891 0.108129 1.155014 0.2535
C(3) 0.163144 0.100438 1.624322 0.1105
C(4) 0.790081 0.037938 20.82563 0.0000
C(5) 28.17784 6.793769 4.147601 0.0001
C(6) 0.013079 0.161896 0.080786 0.9359
C(7) 0.755724 0.152933 4.941532 0.0000
C(8) 0.194848 0.032531 5.98974 0.0000
C(9) 0.001128 1.009957 0.001117 0.9991
C(10) 0.400492 0.031813 12.58878 0.0000
C(11) 0.181291 0.034159 5.307308 0.0000
C(12) 0.149674 0.027935 5.357897 0.0000
Equation : CONS = C(1) + C(2) P + C(3) P( 1) + C(4) (W + WP)
Equation : I = C(5) + C(6) P + C(7) P( 1) + C(8) K
Equation : W = C(9) + C(10) X + C(11) X( 1)+C(12) @TREND(1919)
Instruments : C @TREND(1919) WP TAX G P( 1) K X( 1)
234 CONOMTRIE
9782100721511-Bourbo-C08.qxd 22/10/14 9:23 Page 235
Enfin la mthode du maximum de vraisemblance information complte (SYS01.fiml)

permet dobtenir les rsultats suivants :
System : SYS01
Estimation Method : Full Information Maximum Likelihood (Marquardt)
Sample : 1921 1941
Total system (balanced) observations 63
Coefficient Std Error z-Statistic Prob.
C(1) 15.83050 4.095952 3.864913 0.0001
C(2) 0.300548 0.408091 0.736472 0.4614
C(3) 0.042528 0.164388 0.258707 0.7959
C(4) 0.780851 0.078507 9.946226 0.0000
C(5) 15.70774 14.35232 1.094439 0.2738
C(6) 0.382189 0.341696 1.118507 0.2634
C(7) 0.409626 0.248385 1.649155 0.0991
C(8) 0.137683 0.071215 1.933357 0.0532
C(9) 0.136911 4.099237 0.033399 0.9734
C(10) 0.370767 0.129208 2.869534 0.0041
C(11) 0.207299 0.090622 2.287518 0.0222
C(12) 0.184379 0.101556 1.815549 0.0694
Equation : CONS = C(1) + C(2) P + C(3) P( 1) + C(4) (W + WP)
Equation : I = C(5) + C(6) P + C(7) P( 1) + C(8) K
Equation : W = C(9) + C(10) X + C(11) X( 1) + C(12) @TREND(1919)

9782100721511-Bourbo-C08.qxd 22/10/14 9:23 Page 236
Annexe
Identification : les conditions de rang
Soit le modle sous forme matricielle :
B Y + C X =
(g,g) (g,1) (g,k) (k,1) (g,1)
On appelle P la matrice des structures qui est forme par la juxtaposition des
matrices B et C, soit P = [BC], P est donc de dimension (g,g + k).
Soit i , une matrice des restriction affrente lquation i construite telle que :
Pi i h = 0, i est la i -ime ligne de la matrice P et h la h -ime colonne de la matrice
i .
Soit i = rang[Pi ] (rang de la matrice Pi ), et g le nombre de variables endo-
gnes du modle, la condition de rang est alors la suivante :
si i < g 1 lquation i est sous-identifie ;
si i = g 1 lquation i est juste identifie ;
si i > g 1 lquation i est sur-identifie.
Cette condition ncessaire et suffisante didentification est, bien entendu, plus lour-
de mettre en uvre, cest pourquoi le plus souvent on se satisfait des conditions
dordre.
partir du modle de lexercice 1, nous allons construire ces matrices et appliquer
les conditions de rang.
Ce modle sous forme matricielle scrit :

1 a Y1t a 0 X 1t 1t
+ =
b 1 Y2t 0 c Y1t1 2t
B Y + C X =

1 a a 0
Soit P = [BC] = .
b 1 0 c
La matrice 1 , matrice des restrictions de la premire quation, est donc construite
autant de lignes que de variables endognes et exognes, chaque ligne est repr-
sentative dune variable (ligne 1 = Y1t , ligne 2 = Y2t , ligne 3 = X 1t , ligne
4 = Y1t1 ) ;
une colonne par restriction dexclusion (variable endogne ou exogne manquan-
te) et par restriction linaire sur les coefficients ;
pour les relations dexclusion, les colonnes sont composes de 0, sauf pour les
variables dont le coefficient est nul o lon met la valeur 1 ;
236 CONOMTRIE
9782100721511-Bourbo-C08.qxd 22/10/14 9:23 Page 237
pour les restrictions de contraintes sur les coefficients, on explicite la relation entre
les coefficients. Dans notre modle, nous avons c11 c12 = 0 (Y2 et X 1 ont le
mme coefficient).
Nous pouvons alors rcrire la condition : Pi i h = 0 .
Soit, pour lquation 1, nous avons une seule variable manquante et une restriction
sur le coefficient des variables Y2 et X 1 qui doit tre identique, soit deux colonnes :

0 0
0 1

i =
0 1 les variables Y2 et X 1 ont le mme coefficient
1 0 la variable Y1t1 est absente
Pour 2 , nous avons une seule restriction : la variable X 1 est absente de lquation
2, soit :

0
0
2 =
1 la variable X 1 est absente de lquation 2
0

0 0

1 a a 0
0 1= 0 0
P1 =
b 1 0 c 0 1 c 1
1 0
rang de P1 = 1 = g 1.
Lquation 1 est juste identifie.

0

1 a a 0
0 = a
P2 =
b 1 0 c 1 0
0 rang de P2 = 2 = 1 = g 1
Lquation 2 est juste identifie (sauf si a = 0 ).

Nous remarquons que la condition de rang vient modifier la condition dordre de la
premire quation, puisque dun statut de sur-identifie, elle devient juste identifie.
Toutefois, cela ne remet aucunement en cause les rsultats trouvs lors de lexercice 1.

9782100721511-Bourbo-C08.qxd 22/10/14 9:23 Page 238
9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 239
9. lments danalyse
des sries temporelles
C
e chapitre est consacr une prsentation sommaire des tech-
niques danalyse des sries chronologiques. Ce thme, lui seul,
peut faire lobjet de longs dveloppements et de nombreux
ouvrages1 y sont intgralement consacrs. Nous tudions en I. les carac-
tristiques statistiques en terme de stationnarit des sries tempo-
relles en prsentant les diffrents tests (Dickey-Fuller, corrlogramme,
etc.) sy rapportant. Puis en II., nous prsentons diffrentes classes de
modles (AR, MA, ARMA) en tudiant leurs proprits. Enfin, la mtho-
de Box et Jenkins qui systmatise une dmarche danalyse des sries tem-
porelles fait lobjet de la section III.
I. Stationnarit
A. Dfinition et proprits
Avant le traitement dune srie chronologique, il convient den tudier les carac-
tristiques stochastiques. Si ces caractristiques cest--dire son esprance et
sa variance se trouvent modifies dans le temps, la srie chronologique est
considre comme non stationnaire ; dans le cas dun processus stochastique
invariant, la srie temporelle est alors stationnaire. De manire formalise, le
processus stochastique yt est stationnaire si :
1. Pour un approndissement de ce chapitre, se rfrer au livre de Bourbonnais R. et Terraza M.,

Dunod, 2010.
lments danalyse des sries temporelles 239

9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 240
E(yt ) = E(yt+m ) = t et m , la moyenne est constante et indpendante du

temps ;
var(yt ) < t , la variance est finie et indpendante du temps ;
cov(yt ,yt+k ) = E[(yt )(yt+k )] = k , la covariance est indpendante du
temps.
Il apparat, partir de ces proprits, quun processus de bruit blanc1 t dans
lequel les t sont indpendants et de mme loi N (0,2 ) est stationnaire.
Une srie chronologique est donc stationnaire si elle est la ralisation dun
processus stationnaire2. Ceci implique que la srie ne comporte ni tendance, ni
saisonnalit et plus gnralement aucun facteur nvoluant avec le temps.
B. Fonctions dautocorrlation simple et partielle

La fonction dautocorrlation (FAC) est la fonction note k qui mesure la cor-
rlation de la srie avec elle-mme dcale de k priodes, comme lillustre le
tableau 1.
Sa formulation est la suivante :

n
(yt y)(ytk y)
cov(yt ,ytk ) t=k+1
k = = [1]
yt ytk
n n
(yt y)2 (ytk y)2
t=k+1 t=k+1
avec y moyenne de la srie calcule sur n k priodes, n = nombre dobservations.

Nous pouvons en dduire que :
0 = 1 et k = k
Cette formule [1] est malaise manier puisquelle exige de recalculer pour
chaque terme k les moyennes et les variances, cest pourquoi on lui prfre la
fonction dautocorrlation dchantillonnage :

n
(yt y)(ytk y)
t=k+1

k = [2]

n
(yt y)2
t=1
avec y moyenne de la srie calcule sur n priodes.

1. Un processus de bruit blanc est une suite de variables alatoires de mme distribution et mutuel-
lement indpendantes. Ce terme est emprunt la physique faisant rfrence au spectre de la
lumire blanche.
2. Si les conditions nonces ci-dessous sont vrifies, on dit que la srie est stationnaire de second
ordre, ou encore faiblement stationnaire. Dans le cas o, aux conditions dfinies, sajoute la
constante de la distribution de probabilit, on parle de srie strictement stationnaire.
240 CONOMTRIE
9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 241
Tableau 1 Exemple de calcul dune fonction dautocorrlation
k 0 1 2 3 4
t yt yt1 yt2 yt3 yt4
1 123
2 130 123
3 125 130 123
4 138 125 130 123
5 145 138 125 130 123
6 142 145 138 125 130
7 141 142 145 138 125
8 146 141 142 145 138
9 147 146 141 142 145
10 157 147 146 141 142
11 150 157 147 146 141
12 145 150 157 147 146
Moyenne yt 140,75 142,36 143,60 145,67 146,63

Moyenne ytk 140,75 140,36 139,40 137,44 136,25
Variance yt 95,02 72,41 62,84 24,11 22,23
Variance ytk 95,02 101,87 101,84 74,91 71,44
k 1 0,77 0,62 0,59 0,55
Lorsque le nombre dobservations n est suffisamment grand, les deux for-

mules [1] et [2] donnent des rsultats trs proches.
La fonction dautocorrlation partielle (FAP) sapparente la notion de cor-
rlation partielle. Nous avons dfini au chapitre 4 le coefficient de corrlation
partielle comme tant le calcul de linfluence de x1 sur x2 en liminant les
influences des autres variables x3 , x4 , . . . , xk .
Par analogie, nous pouvons dfinir lautocorrlation partielle de retard k
comme le coefficient de corrlation partielle entre yt et ytk , cest--dire comme
tant la corrlation entre yt et ytk linfluence des autres variables dcales de k
priodes (yt1 , yt2 , . . . , ytk+1 ) ayant t retire.
Afin dviter par la suite toutes ambiguts entre les deux fonctions dauto-
corrlation, nous appelons fonction dautocorrlation simple, la fonction dauto-
corrlation.
C. Tests de bruit blanc et de stationnarit

Nous ne pouvons identifier clairement les caractristiques stochastiques dune
srie chronologique que si elle est stationnaire. Cette tude de stationnarit

9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 242
seffectue essentiellement partir de ltude des fonctions dautocorrlation (ou

de leur reprsentation graphique appele corrlogramme ). Une srie chro-
nologique est stationnaire si elle ne comporte ni tendance ni saisonnalit. Nous
allons donc, partir de ltude du corrlogramme dune srie, essayer de mon-
trer de quelle manire nous pouvons mettre en vidence ces deux composantes.
Nous pouvons distinguer diffrents types de sries stationnaires :
mmoire, cest--dire dont on peut modliser, par une loi de reproduc-
tion, le processus ;
identiquement et indpendamment distribue note i.i.d. ou appele Bruit
Blanc ( White Noise ) ;
normalement (selon une loi normale) et indpendamment distribue note
n.i.d. ou appele Bruit Blanc gaussien.
1) Analyse des fonctions dautocorrlation

Lorsque nous tudions la fonction dautocorrlation dune srie chronologique,
la question qui se pose est de savoir quels sont les termes k qui sont significa-
tivement diffrents de 0.
En effet, par exemple, si aucun terme nest significativement diffrent de 0,
on peut en conclure que le processus tudi est sans mmoire et donc qu ce
titre il nest affect ni de tendance ni de saisonnalit. Ou encore si une srie men-
suelle prsente une valeur leve pour 12 (corrlation entre yt et yt12 ), la srie
tudie est certainement affecte dun mouvement saisonnier1. Nous verrons
partir dexemples diffrents cas de figures.
Le test dhypothses pour un terme k est le suivant :
H0 : k = 0
H1 : k =
/ 0
Nous pouvons utiliser le test dhypothses dun coefficient de corrlation,

prsent au chapitre 1, fond sur la comparaison dun t de Student empirique et
thorique. Toutefois, Quenouille2 a dmontr que pour un chantillon de taille
importante (n > 30) , le coefficient k tendde manire asymptotique vers une loi
normale de moyenne 0 et dcart type 1/ n .
Lintervalle de confiance du coefficient k est alors donn par :
1
k = 0 t /2
n
1. Il sagit mme dun test de dtection de saisonnalit.

2. Quenouille M. H., 1949.
242 CONOMTRIE
9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 243
Si le coefficient calcul
k est lextrieur de cet intervalle de confiance, il
est significativement diffrent de 0 au seuil (en gnral = 0,05 et
t /2 = 1,96) . La plupart des logiciels fournissent, avec le corrlogramme, lin-
tervalle de confiance, ce qui autorise une interprtation instantane.
Nous devons souligner une limite des tests 5 %. En effet, lorsquune fonc-
tion dautocorrlation est calcule pour un nombre important de retards, nous
pouvons nous attendre ce que quelques-uns soient, de manire fortuite, signi-
ficativement diffrents de 0. Si h est le nombre de retards, le nombre possible de
faux rejets est alors de 0,05 h , pour un seuil de confiance de 5 %.
Dans le cas o le corrlogramme ne laisse apparatre aucune dcroissance de
ses termes (absence de cut off ), nous pouvons en conclure que la srie nest
pas stationnaire en tendance.
2) Statistiques de Box-Pierce et Ljung-Box

Le test de Box-Pierce permet didentifier les processus sans mmoire (suite de
variables alatoires indpendantes entre elles). Nous devons donc identifier
cov(yt ,ytk ) = 0 ou encore k = 0 k .
Un processus de bruit blanc implique que 1 = 2 = . . . = h = 0 , soit les
hypothses :
H0 : 1 = 2 = . . . = h = 0
H1 : il existe au moins un i significativement diffrent de 0.
Pour effectuer ce test, on recourt la statistique Q (due Box-Pierce1) qui
est donne par :

h
Q=n
k2
k=1
h = nombre de retards, k = autocorrlation empirique dordre k, n = nombre

dobservations.
La statistique Q est distribue de manire asymptotique comme un 2 (chi-
deux) h degrs de libert. Nous rejetons donc lhypothse de bruit blanc, au
seuil , si la statistique Q est suprieure au 2 lu dans la table au seuil (1 )
et h degrs de libert.
Nous pouvons utiliser aussi une autre statistique, dont les proprits asymp-
totiques sont meilleures, drive de la premire qui est le Q
de Ljung et Box2 :
h

k2
Q
= n(n + 2) qui est aussi distribue selon un 2 h degrs de liber-
k=1
n k
t et dont les rgles de dcisions sont identiques au prcdent. Ces tests sont
appels par les anglo-saxons : portmanteau test soit littralement test
fourre-tout .
1. Box G E. P. et Pierce D. A., 1970.

2. Ljung G. M. et Box G E. P., 1978.

9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 244
3) Tests de normalit
Pour calculer des intervalles de confiance prvisionnels et aussi pour effectuer
les tests de Student sur les paramtres, il convient de vrifier la normalit des
erreurs. Le test de Jarque et Bera (1984), fond sur la notion de Skewness (asy-
mtrie) et de Kurtosis (aplatissement), permet de vrifier la normalit dune dis-
tribution statistique.
a) Les tests du Skewness et du Kurtosis

1 n
Soit k = (xi x)k le moment centr dordre k, le coefficient de Skewness
n i=1
3 4
(11/2 ) est gal : 11/2 = 3/2 et le coefficient de Kurtosis : 2 = 2 .
2 2
Si la distribution est normale et le nombre dobservations grand (n > 30) :

6 24
1/2
1 N 0; et 2 N 3;
n n
On construit alors les statistiques :
|11/2 0| |2 3|
1 = et 2 = que lon compare 1,96 (valeur de la loi nor-
6 24
n n
male au seuil de 5 %).
Si les hypothses H0 : 1 = 0 (symtrie) et 2 = 0 (aplatissement normal)
sont vrifies, alors 1 1,96 et 2 1,96 ; dans le cas contraire, lhypothse de
normalit est rejete.
b) Le test de Jarque et Bera

Il sagit dun test qui synthtise les rsultats prcdents ; si 11/2 et 2 obissent
n n
des lois normales alors la quantit s : s = 1 + (2 3)2 suit un 2 deux
6 24
degrs de libert.
Donc si s > 1
2
(2), on rejette lhypothse H0 de normalit des rsidus au
seuil .
Ces tests de normalit servent galement dans le cas o il y a htroscdaci-
t. En effet, lhtroscdacit se manifeste sur le graphe de la distribution par
des queues de probabilit plus paisses (distribution leptokurtique) que les
queues de la loi normale.
4) Tests dhomoscdasticit
Un processus de bruit blanc doit tre homoscdastique, les tests dhtroscdas-

ticit du chapitre 5, Section II peuvent tre utiliss.
244 CONOMTRIE
9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 245
Le test de Goldfeld-Quandt a pour but de comparer la somme des carrs

des rsidus destimation aprs avoir scind les rsidus en deux sous-chan-
tillons.
Un autre test consiste tudier la distribution des carrs des rsidus.
Lanalyse des termes du corrlogramme des rsidus au carr permet de tes-
ter lexistence dune htroscdacit. Si certaines valeurs de la FAC (tests
de Box-Pierce ou Ljung-Box) sont significativement diffrentes de 0, nous
pouvons conclure la prsence dune htroscdacit.
II. La non-stationnarit et les tests de racine

unitaire
A. La non-stationnarit : les processus TS et DS
Les chroniques conomiques sont rarement des ralisations de processus ala-
toires stationnaires. Pour analyser la non-stationnarit, deux types de processus
sont distingus :
les processus TS (Trend Stationary) qui reprsentent une non-stationnarit
de type dterministe1 ;
les processus DS (Differency Stationary) pour les processus non station-
naires alatoires.
a) Les processus TS
Un processus TS scrit : xt = f t + t o f t est une fonction polynmiale du
temps, linaire ou non linaire, et t un processus stationnaire. Le processus TS
le plus simple (et le plus rpandu) est reprsent par une fonction polynmiale
de degr 1. Le processus TS porte alors le nom de linaire et scrit :
xt = a0 + a1 t + t .
Si t est un bruit blanc (gaussien ou non), les caractristiques de ce proces-
sus sont alors :
E[x t ] = a0 + a1 t + E[t ] = a0 + a1 t
V [x t ] = 0 + V [t ] = 2
/ t
cov[x t ,x t
] = 0 pour t =
Ce processus TS est non stationnaire car E[xt ] dpend du temps.

Connaissant a0 et
a1 , le processus xt peut tre stationnaris en retranchant, de la
valeur de xt en t, la valeur estime a0 +
a1 t . Dans ce type de modlisation, lef-
1. Par dfinition, un processus est alatoire do lambigut du terme de processus dterministe.

9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 246
fet produit par un choc (ou par plusieurs chocs alatoires) un instant t est tran-
sitoire. Le modle tant dterministe, la chronique retrouve son mouvement de
long terme qui est ici la droite de tendance. Il est possible de gnraliser cet
exemple des fonctions polynmiales de degr quelconque.
b) Les processus DS
Les processus DS sont des processus que lon peut rendre stationnaires par luti-
lisation dun filtre aux diffrences : (1 D)d xt = + t o t est un processus
stationnaire, une constante relle, D loprateur dcalage et d lordre du filtre
aux diffrences.
Ces processus sont souvent reprsents en utilisant le filtre aux diffrences pre-
mires (d = 1) . Le processus est dit alors processus du premier ordre. Il scrit :
(1 D)xt = + t xt = xt1 + + t
Lintroduction de la constante dans le processus DS permet de dfinir deux
processus diffrents :
= 0 : le processus DS est dit sans drive.
Il scrit : xt = xt1 + t .
Comme t est un bruit blanc, ce processus DS porte le nom de modle de
marche au hasard ou de marche alatoire (Random Walk Model). Il est trs fr-
quemment utilis pour analyser lefficience des marchs financiers.
Pour tudier les caractristiques de ce modle, crivons-le sous sa forme
dveloppe :
x t = x t1 + t
x t1 = x t2 + t1 x t = x t2 + t1 + t
x t2 = x t3 + t2 x t = x t3 + t2 + t1 + t
etc.
Si le premier terme de la chronique est x 0 , le modle scrit alors :
t
xt = x0 + i
i =1
Les caractristiques de ce processus sont (en supposant x 0 certain) :

E[x t ] = x 0
V [x t ] = t2
cov[x t ,x t
] = 2 Min(t,t
) si t =
/ t
Par exemple :
cov(x 4 ,x 2 ) = E[(x 0 + 1 + 2 + 3 + 4 )(x 0 + 1 + 2 )]
= E(1 1 ) + E(2 2 ) = 22 .
/ t
.
En effet tous les produits E(t t
) = 0 si t =
246 CONOMTRIE
9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 247
Ce processus est non stationnaire en variance puisquelle dpend du temps.

Cette non stationnarit est dite alatoire ou stochastique.
Pour stationnariser la marche alatoire, il suffit dappliquer au processus le
filtre aux diffrences premires : xt = xt1 + t (1 D)xt = t .
= 0 : le processus porte alors le nom de processus DS avec drive.
Il scrit : xt = xt1 + + t .
Comme prcdemment, on peut rechercher sa forme quivalente dveloppe :
x t = x t1 + + t
x t1 = x t2 + + t1 x t = x t2 + 2 + t1 + t
x t2 = x t3 + + t2 x t = x t3 + 3 + t2 + t1 + t
etc.
Si on suppose la valeur dorigine x 0 connue et dterministe, on a alors :
t
x t = x 0 + t + i
i =1
On peut analyser les caractristiques de ce processus :

E[x t ] = x 0 + t
V [x t ] = t2
cov[x t ,x t
] = 2 Min(t,t
) si t =
/ t
Le processus est non stationnaire de par son esprance et sa variance.

Lesprance tant de la mme forme que celle dun processus TS, on reconnat
dans ce processus une non stationnarit dterministe et alatoire la fois.
La stationnarisation de ce processus est ralise en utilisant le filtre aux dif-
frences premires :
x t = x t1 + + t (1 B)x t = + t
Soit en employant la forme dveloppe :

t
t1
x t = x 0 + t + i et en calculant : x t1 = x 0 + (t 1) + i
i =1 i =1
On a : x t x t1 = (1 B)x t = + t .
Dans les processus de type DS, un choc un instant donn se rpercute
linfini sur les valeurs futures de la srie ; leffet du choc est donc permanent et
va en dcroissant.
En rsum, pour stationnariser un processus TS, la bonne mthode est celle
des moindres carrs ordinaires ; pour un processus DS, il faut employer le filtre
aux diffrences. Le choix dun processus DS ou TS comme structure de la chro-
nique nest donc pas neutre.

9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 248
c) Consquences dune mauvaise stationnarisation du processus

Pour un processus TS, la bonne mthode de stationnarisation est celle des
moindres carrs ordinaires. Supposons que l'on applique au processus TS du pre-
mier ordre un filtre aux diffrences premires. A priori, comme le degr du poly-
nme est 1, ce filtre peut tre considr comme correct puisqu'un filtre aux dif-
frences d'ordre d limine un polynme de mme degr. Cependant, on dmontre
que l'application du filtre aux diffrences a cr une perturbation artificielle.
Pour un processus DS, la bonne mthode de stationnarisation est le filtre aux
diffrences premires. Supposons que l'on applique la mthode des moindres
carrs ordinaires (rgression sur le temps) sur les observations d'un chantillon
du processus, les paramtres de la tendance sont estims et par consquent le
rsidu de la rgression doit tre un bruit blanc. Nelson et Kang montrent par-
tir de simulations, que l'limination d'une tendance linaire sur un processus de
marche alatoire cre artificiellement une forte autocorrlation des rsidus pour
les premiers retards.
Sur le plan conomtrique, il est donc primordial d'identifier clairement le
processus sous-jacent et d'employer la mthode adquate de stationnarisation.
Sinon le risque de crer des bruits parasites artificiels est trs lev.
Les consquences sont galement importantes sur le plan conomique.
Considrons, par exemple, le PIB d'un pays comme la France en valeur relle.
Si ce PIB est DS plutt que TS, il est alors ncessaire de remettre en cause la
dcomposition traditionnelle (tendance et cycle) et sa justification thorique :
l'indpendance des schmas explicatifs. Si le PIB est en effet DS, la croissance
et le cycle sont lis et ne peuvent tre en consquence tudis de faon spars.
Or, d'aprs les travaux de Nelson et Plosser (1982) sur des chroniques macro-
conomiques amricaines, la variabilit constate de la composante conjonctu-
relle serait due une structure DS. Comme jusqu' prsent, l'analyse de cette
composante s'effectue partir du rsidu d'une rgression entre le PIB et une ten-
dance dterministe, cette analyse surestime l'amplitude du cycle et sous-estime
l'importance de la tendance. Sur ce constat, Beveridge S. et Nelson C.R. (1981)
proposent une dcomposition des processus selon une tendance stochastique
(permanente) qui obit une marche alatoire avec ou sans drive et une com-
posante stationnaire (transitoire). Par la suite Harvey A.C. (1988) utilise les
modles structurels composantes inobservables (modle tendance plus cycle et
tendance-cycle) reprsentes sous forme d'un modle espace d'tats estim par
le filtre de Kalman.
B. Les tests de racine unitaire

et la stratgie squentielle de test
Les tests de racine unitaire Unit Root Test permettent non seulement de
dtecter lexistence dune non-stationnarit mais aussi de dterminer de quelle
non-stationnarit il sagit (processus TS ou DS) et donc la bonne mthode pour
stationnariser la srie.
248 CONOMTRIE
9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 249
a) Tests de racines unitaires : tests de Dickey-Fuller (1979)

Les tests de Dickey-Fuller (DF) permettent de mettre en vidence le caractre
stationnaire ou non dune chronique par la dtermination dune tendance dter-
ministe ou stochastique.
Les modles servant de base la construction de ces tests sont au nombre de
trois. Le principe des tests est simple : si lhypothse H0 : 1 = 1 est retenue
dans lun de ces trois modles, le processus est alors non stationnaire.
[1] xt = 1 xt1 + t Modle autorgressif dordre 1.
[2] xt = 1 xt1 + + t Modle autorgressif avec constante.
[3] xt = 1 xt1 + bt + c + t Modle autorgressif avec tendance.
Si lhypothse H0 est vrifie, la chronique xt nest pas stationnaire quel que
soit le modle retenu.
Dans le dernier modle [3], si on accepte H1 : 1 < 1 et si le coefficient b est
significativement diffrent de 0, alors le processus est un processus TS ; on peut
le rendre stationnaire en calculant les rsidus par rapport la tendance estime
par les moindres carrs ordinaires.
Sous H0, les rgles habituelles de linfrence statistique ne peuvent pas tre
appliques pour tester cette hypothse, en particulier la distribution de Student
du paramtre 1 ; Dickey et Fuller ont donc tudi la distribution asymptotique
de lestimateur 1 sous lhypothse H0. laide de simulations de Monte-Carlo,
ils ont tabul les valeurs critiques pour des chantillons de tailles diffrentes.
Ces tables sont des tables1 analogues aux tables du t de Student. Les auteurs ont
choisi de tester la valeur ( 1 1) au lieu de
1 pour des raisons purement sta-
tistiques. Cela nest pas gnant pour le test. En effet, xt = 1 xt1 + t scrit
aussi :
xt xt1 = 1 xt1 xt1 + t
xt = (1 1)xt1 + t
Il est donc quivalent de tester comme hypothse H0 : 1 = 1 ou 1 1 = 0 .
Les principes gnraux du test sont les suivants.
On estime par les moindres carrs ordinaires le paramtre 1 not 1 pour les
modles [1], [2] et [3]. Lestimation des coefficients et des carts types du modle
par les moindres carrs ordinaires fournit t1 qui est analogue la statistique de
Student (rapport du coefficient sur son cart type). Si t1 ttabule , alors on accep-
te lhypothse H0 ; il existe une racine unit, le processus nest donc pas
stationnaire.
Remarque : les principaux logiciels danalyse de sries temporelles calculent
automatiquement les valeurs critiques t1 .
b) Les tests de Dickey et Fuller Augments
Dans les modles prcdents, utiliss pour les tests de Dickey-Fuller simples, le
processus t est, par hypothse, un bruit blanc. Or il ny a aucune raison pour
1. Cf. table 7 en fin douvrage.

9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 250
que, a priori, lerreur soit non corrle ; on appelle tests de Dickey-Fuller

Augments (ADF, 1981) la prise en compte de cette hypothse.
Les tests ADF sont fonds, sous lhypothse alternative |1 | < 1 , sur lesti-
mation par les MCO des trois modles :

p
Modle [4] : xt = xt1 j xt j+1 + t
j=2

p
Modle [5] : xt = xt1 j xt j+1 + c + t
j=2

p
Modle [6] : xt = xt1 j xt j+1 + c + bt + t
j=2
avec t i.i.d.
Le test se droule de manire similaire aux tests DF simples, seules les tables
statistiques diffrent. La valeur de p peut tre dtermine selon les critres de
Akaike ou de Schwarz, ou encore, en partant dune valeur suffisamment impor-
tante de p, on estime un modle p 1 retards, puis p 2 retards, jusqu ce
que le coefficient du pime retard soit significatif.
c) Le test de Phillips et Perron (1988)
Ce test est construit sur une correction non paramtrique des statistiques de
Dickey-Fuller pour prendre en compte des erreurs htroscdastiques. Il se
droule en quatre tapes :
1) Estimation par les moindres carrs ordinaires des trois modles de base
des tests de Dickey-Fuller et calcul des statistiques associes, soit et le rsidu
estim.
1 n
2) Estimation de la variance dite de court terme
2 = e2
n t=1 t
3) Estimation d'un facteur correctif st2 (appel variance de long terme) tabli
partir de la structure des covariances des rsidus des modles prcdemment
estims de telle sorte que les transformations ralises conduisent des distri-
butions identiques celles du Dickey-Fuller standard :
l
1 n i 1 n
st2 = et2 + 2 1 et eti .
n t=1 i=1
l + 1 n t=i+1
Pour estimer cette variance de long terme, il est ncessaire de dfinir un
nombre de retards l (troncature de Newey-West) estim en fonction du nombre
d'observations n, l 4(n/100)2/9 .
1 1) n(k 1)
( 1
4) Calcul de la statistique de PP : t = k +
1
1 k

2
avec k = (qui est gal 1 de manire asymptotique si et est un bruit
st2
blanc). Cette statistique est comparer aux valeurs critiques de la table de
MacKinnon.
250 CONOMTRIE
9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 251
d) Stratgie de tests
Nous constatons que pour raliser un test de racine unitaire, le rsultat nest pas
identique selon lutilisation de lun des trois modles comme processus gnra-
teur de la chronique de dpart. Les conclusions auxquelles on parvient sont donc
diffrentes et peuvent entraner des transformations errones. Cest la raison pour
laquelle Dickey et Fuller, et leur suite dautres auteurs, ont labor des strat-
gies de tests1. Nous prsentons un exemple simplifi (schma 1) dune stratgie
de tests. Les valeurs critiques des tc et tb permettant de tester la nullit des coeffi-
cients c et b des modles [2] et [3] sont donnes en fin douvrage (table 7).
e) Le test KPSS (1992)
Kwiatkowski et al. (1992) propose dutiliser un test du multiplicateur de
Lagrange (L M) fond sur lhypothse nulle de stationnarit. Aprs estimation

t
des modles [2] ou [3], on calcule la somme partielle des rsidus : St = ei et
i=1
on estime la variance de long terme (st2 ) comme pour le test de Phillips et Perron.
Estimation du modle [3]

yt = c + bt + 1yt 1 + at
Test b = 0
non
Test 1 = 1 oui
non oui
Processus TS :1<1 Processus DS

yt = c + bt + 1yt 1 + at
yt = c + 1yt 1 + at
Test c = 0
non
Test 1 = 1
oui
oui non
Processus DS Processus stationnaire

yt = 1yt 1 + at
Test 1 = 1
oui non
Processus DS Processus stationnaire
Schma 1 Stratgie simplifie des tests de racine unitaire
1. Cf. Bourbonnais R. et Terraza M. Chapitre 5, 2010.

9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 252

n
St2
1
La statistique est alors L M =
t=1
. On rejette lhypothse de stationna-
st2 n2
rit si cette statistique est suprieure aux valeurs critiques lues dans une table
labore par les auteurs.
Il est noter que les logiciels RATS et Eviews permettent directement l'uti-
lisation de ces tests.
Exercice n 1
fichier C9EX1
Exemple dapplication des tests de racine unitaire au CAC40

On demande dappliquer les tests de non-stationnarit lindice CAC40 (indice
reprsentatif de lvolution des cours de bourse) sur une priode de 1160 jours.
Solution
Nous allons tudier le CAC40 sur 1 160 observations quotidiennes. Le graphique 1

illustre lvolution de lindice CAC40.
Les fonction dautocorrlation simple et partielle, pour h = 15 retards, sont obtenues
directement par une fonction :
252 CONOMTRIE
9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 253
Graphique 1 volution de lindice boursier CAC40
Eviews fournit les rsultats des fonctions dautocorrlation simple (colonne AC) et par-
tielle (colonne PAC), avec les corrlogrammes respectifs. Les bornes de lintervalle de
confiance sont stylises par des traits pointills horizontaux ; chaque terme qui sort de cet
intervalle est donc significativement diffrent de 0 au seuil de 5 %. Nous nous apercevons
que tous les termes du corrlogramme simple sont extrieurs l'intervalle de confiance. Le
processus n'est pas un bruit blanc (il semble mme caractristique d'un processus non sta-
tionnaire). La statistique Q de Ljung-Box (la seule calcule par Eviews) confirme ce fait :
Q-Stat = 14483 (au retard k = 15) > 0,05;15
2
= 25, on refuse l'hypothse de nullit des coef-
ficients k (la probabilit critique de ce test est indique c = 0,000 < 0,05, donc on refu-
se H0). Le processus CAC40 n'est pas un bruit blanc. A partir des tests de Dickey-Fuller
nous allons examiner si le processus est non stationnaire.
Le test de Dickey-Fuller simple consiste estimer1 les trois modles :
[1] : CACt CACt1 = DCACt = (1 1) CACt1
[2] : CACt CACt1 = DCACt = (1 1) CACt1 + c
[3] : CACt CACt1 = DCACt = (1 1) CACt1 + c + bt
Lestimation par les MCO des paramtres du modle [3] donne :
DCACt = 0,008447 CACt1 + 14,94 + 0,002103 t
(2,053) (2,0) (1,11)
n = 1 159 () = t empirique.
Le coefficient de la droite de tendance nest pas significativement diffrent de 0
(t = 1,11), on rejette lhypothse dun processus TS et t1 = 2,053 > ttabule
= 3,41 (ou n( 1 1) = 1 159 0,008447 = 9,79 > 21,8 ) ; on accepte lhypo-
thse H0 (valeurs critiques au seuil de 5 %) ; le processus nest pas stationnaire.
Lestimation par les MCO des paramtres du modle [2] donne :
DCACt = 0,00709 CACt1 + 13,63
(1,805) (1,85)
1. Ces tests trs brivement prsents ici doivent faire lobjet dune stratgie afin de tester les cas
des hypothses jointes. Cf. Bourbonnais R. et Terraza M., 2010.

9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 254
Le terme constant nest pas significativement diffrent de 0 (t = 1,85), on rejette

lhypothse dun processus DS avec drive et t1 = 1,805 > ttabule = 2,86 ; on
accepte lhypothse H0 ; le processus nest pas stationnaire.
Enfin lestimation par les MCO des paramtres du modle [1] donne :
DCACt = 0,000174 CACt1
(0,536)
t1 = 0,536 > ttabule = 1,95 , on accepte lhypothse H0 ; le processus nest pas
stationnaire.
Le test DFA (avec quatre retards) conduit des rsultats similaires :
Hypothse H0 : CAC possde une racine unitaire

Nombre de retards (minimum du critre de Akaike) = 4
Test de Dickey-Fuller Augment t Statistique Probabilit critique
Modle [4] 0,46 0,81
Modle [5] 2,03 0,27
Modle [6] 2,28 0,44
Les probabilits critiques sont toutes suprieures 0,05, nous ne rejetons pas lhy-
pothse H0 ; nous pouvons donc conclure que le processus CAC40 possde une racine
unitaire et nest donc pas stationnaire.
Nous procdons ensuite au test de Phillips-Perron avec une troncature l = 6.
Hypothse H0 : CAC possde une racine unitaire

Troncature l = 6
Test de Phillips-Perron t Statistique ajust Probabilit critique
Modle [1] 0,50 0,82
Modle [2] 1,94 0,31
Modle [3] 2,20 0,49
Les probabilits critiques sont toutes suprieures 0,05, nous ne rejetons pas lhy-
pothse H0 ; le processus CAC40 possde une racine unitaire.
Enfin, nous procdons aux tests KPSS.
Hypothse H0 : CAC ne possde pas une racine unitaire

Troncature l = 6
Test de Kwiatkowski-Phillips-Schmidt-Shin LM Statistique Valeur critique 5%
Modle [2] 2,58 0,46
Modle [3] 1,31 0,14
La statistique LM est suprieure la valeur critique (pour un seuil de 5%) pour les
deux spcifications, nous rejetons lhypothse H0, le processus CAC40 possde donc une
racine unitaire.
Tous les rsultats sont convergents, nous pouvons donc conclure que le processus
CAC40 nest pas stationnaire.
Sagit-il dun processus de marche au hasard sans drive ? Nous allons le vrifier en
calculant le corrlogramme de la srie filtre par les diffrences premires ceci afin de
stationnariser le processus :
DCACt = CACt CACt1.
254 CONOMTRIE
9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 255
La statistique Q a une probabilit critique de 0,182 (pour k = 15) largement sup-

rieure 0,05 ; nous acceptons lhypothse H0 de nullit des coefficients du corrlogram-
me. Le corrlogramme de la srie CAC40 filtre par les diffrences premires est carac-
tristique dun bruit blanc. La srie CAC40 est donc bien un processus DS sans drive.
Sagit-il dun bruit blanc gaussien ?
Lhistogramme de la distribution et les valeurs empiriques des Skewness, Kurtosis
et de la statistique de Jarque-Bera sont donns par :
Les tests sont effectus partir des valeurs :

1/2
| 0| | 0,39 0|
1 = 1 = = 5,42 > 1,96
6 6
n 1 159

9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 256
|2 3| |6,83 3|
et 2 = = = 26,61 > 1,96 .
24 24
n 1 159
Nous rejetons lhypothse de normalit en ce qui concerne la symtrie et laplatissement
de la distribution, ce qui est confirm par la statistique de Jarque-Bera :
JB = 741,3 > 0,05 2
(2) = 5,99 . Le processus CAC40 en diffrences est donc un bruit
blanc non gaussien.
III. Les modles ARIMA

Nous allons prsenter une famille de processus alatoires qui sont censs recou-
vrir une gamme trs large dvolution possible de sries chronologiques : les
processus autorgressifs et les processus de moyenne mobile.
A. Typologie des modles AR, MA et ARMA

1) Modle AR (Auto Rgressif)
a) Formulation
Dans le processus autorgressif dordre p, lobservation prsente yt est gnre
par une moyenne pondre des observations passes jusqu la p-ime priode
sous la forme suivante :
AR(1) : yt = 1 yt1 + t
AR(2) : yt = 1 yt1 + 2 yt2 + t
...
AR( p) : yt = 1 yt1 + 2 yt2 + . . . + p yt p + t [4]
o 1 ,2 ,. . . , p sont des paramtres estimer positifs ou ngatifs, t est un ala
gaussien.
Nous pouvons ajouter ce processus une constante qui ne modifie en rien les
proprits stochastiques. Lquation [4] peut aussi scrire laide de lopra-
teur dcalage D :
(1 1 D 2 D 2 . . . p D p )yt = t
b) Caractristiques des corrlogrammes

Il est dmontr que le corrlogramme simple dun processus AR( p) est caract-
ris par une dcroissance gomtrique de ses termes de type :
k = k
Le corrlogramme partiel a ses seuls p premiers termes diffrents de 0.
256 CONOMTRIE
9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 257
2) Modle MA (Moving Average : Moyenne Mobile)

a) Formulation
Dans le processus de moyenne mobile dordre q, chaque observation yt est gn-
re par une moyenne pondre dalas jusqu la q-ime priode.
MA(1) : yt = t 1 t1
MA(2) : yt = t 1 t1 2 t2
...
MA(q) : yt = t 1 t1 2 t2 . . . q tq [5]
o 1 ,2 ,. . . ,q sont des paramtres pouvant tre positifs ou ngatifs et t est un
ala gaussien.
Lquation [5] peut aussi scrire :
(1 1 D 2 D 2 . . . q D q )t = yt .
Dans ce processus, tout comme dans le modle auto-rgressif AR, les alas
sont supposs tre engendrs par un processus de type bruit blanc. Nous pou-
vons interprter le modle MA comme tant reprsentatif dune srie chronolo-
gique fluctuant autour de sa moyenne de manire alatoire, do le terme de
moyenne mobile car celle-ci, en lissant la srie, gomme le bruit cr par lala.
Il est noter quil y a quivalence entre un processus MA(1) et un processus
AR dordre p infini :
MA(1) = AR().
Le corrlogramme simple dun processus MA(q) est de la forme gnrale :

i=qk
i i+k
k =
i=0
pour k = 0,1,. . . ,q et k = 0 pour k > q.

i=q
2
i
i=0
Cest--dire que seuls les q premiers termes du corrlogramme simple sont

significativement diffrents de 0.
Le corrlogramme partiel est caractris par une dcroissance gomtrique
des retards.
3) Modle ARMA (mlange de processus AR et MA)

a) Formulation
Les modles ARMA sont donc reprsentatifs dun processus gnr par une
combinaison des valeurs passes et des erreurs passes. Ils sont dfinis par
lquation :

9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 258
ARMA( p,q) : (1 1 D 2 D 2 . . . p D p )yt =

= (1 1 D 2 D 2 . . . q D q )t
Nous avons :
ARMA(1,0) = AR(1); ARMA(0,1) = MA(1).
Dans le cas dun processus ARMA(p, q) avec constante :

yt = + 1 x t1 + 2 x t2 + ... + p x t p + t 1 t1
2 t2 ... q tq

Lesprance du processus est donne1 par E(x t ) =
(1 1 2 ... p )
Donc connaissant lesprance du processus (Eviews calcule directement les-
prance du processus), la constante du processus ARMA est dtermine par :
= E(x t ) (1 1 2 ... p )

Les corrlogrammes simples et partiels sont, par voie de consquence, un
mlange des deux corrlogrammes des processus AR et MA purs. Il savre
ainsi plus dlicat didentifier ces processus partir de ltude des fonctions
dautocorrlation empiriques.
Le tableau 2 synthtise les caractristiques, en termes de corrlogrammes,
des processus AR, MA et ARMA.
Tableau 2 Rsum des proprits des fonctions dautocorrlation
simple et partielle
Processus Fonction autocorrlation simple Fonction autocorrlation partielle
AR(1) Dcroissance exponentielle(1 > 0) ou Pic significatif pour le premier retard:

sinusodale amortie (1 < 0) Positif si 1 > 0 et ngatif si 1 < 0,
les autres coefficients nuls pour des
retards > 1
AR(2) Dcroissance exponentielle ou sinuso- Pics significatifs pour le premier et

dale selon les signes de 1 et 2 second retards, les autres coefficients sont
nuls pour des retards > 2
AR(p) Dcroissance exponentielle et/ou sinu- Pics significatifs pour les p premiers
sodale retards, les autres coefficients sont nuls
pour des retards > p
1. Il suffit de remplacer chaque terme E(x t ) = E(x t1 ) = E(x t2 ) = ... = E(x t p ) car la srie
est stationnaire.
258 CONOMTRIE
9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 259
Processus Fonction autocorrlation simple Fonction autocorrlation partielle
MA(1) Pic significatif pour le premier retard : Dcroissance exponentielle ( 1 > 0) ou

positif si 1 < 0 et ngatif si 1 > 0. sinusodale amortie ( 1 < 0)
Les autres coefficients sont nuls pour
des retards > 1
MA(2) Pics significatifs pour le premier et Dcroissance exponentielle ou sinusoda-

second retards. Les autres coefficients le selon les signes de 1 et 2
sont nuls pour des retards > 2
MA(q) Pics significatifs pour les q premiers Dcroissance exponentielle et/ou sinuso-
retards. Les autres coefficients nuls pour dale
des retards > q
ARMA(1, 1) Dcroissance gomtrique partir du Dcroissance exponentielle ( 1 > 0) ou

premier retard, le signe est dtermin sinusodale amortie ( 1 < 0)
par 1 1
ARMA(p, q) Dcroissance exponentielle ou sinuso- Dcroissance exponentielle ou sinusoda-

dale amortie tronque aprs (q p) le amortie tronque aprs p q retards
retards
4) Conditions dutilisation
Les modles AR, MA, ARMA ne sont reprsentatifs que de chroniques :
stationnaires en tendance ;
corriges des variations saisonnires.
B. Lextension aux processus ARIMA et SARIMA

Les tests de Dickey-Fuller et Dickey-Fuller Augment envisags prcdemment
permettent de dterminer si la srie est stationnaire et dans le cas dune non-
stationnarit de quel type il sagit : TS et DS.
Si la srie tudie est de type TS, il convient de la stationnariser par rgres-
sion sur le temps et le rsidu destimation est alors tudi selon la mthodologie
de Box-Jenkins. Ceci permet de dterminer les ordres p et q des parties AR et
MA du rsidu. Le modle est toujours dans ce cas un ARMA( p, q) .
Si la srie tudie est de type DS, il convient de la stationnariser par passa-
ge aux diffrences selon lordre dintgration I = d (cest--dire le nombre de
fois quil faut diffrencier la srie pour la rendre stationnaire). La srie diff-
rencie est alors tudie selon la mthodologie de Box-Jenkins qui permet de
dterminer les ordres p et q des parties AR et MA. On note ce type de modle
ARIMA( p, d, q) .
Les modles SARIMA permettent dintgrer un ordre de diffrenciation li
une saisonnalit gnralise par la transformation : (1 D s )yt = yt yts o
s correspond la priodicit des donnes (s = 4 pour une srie trimestrielle,
s = 12 pour une srie mensuelle).

9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 260
Exercice n 2
Gnration de processus ARMA et analyse des corrlogrammes
On demande de gnrer sur 200 observations, de manire artificielle, les processus
suivants et den tudier les corrlogrammes.
1) MA(1) : yt = 2 + (1 + 0,8 D)t
2) AR(1) : (1 0,9 D)yt = 2 + t
3) MA(2) : yt = 2 + (1 + 0,6 D 0,3 D 2 )t
4) AR(2) : (1 0,9 D + 0,7 D 2 )yt = 2 + t
5) ARMA(1, 1) : (1 0,9 D)yt = 2 + (1 + 0,8 D)t
avec t N (0 ; 1).
Solution
Le programme Eviews ( C9EX2.PRG) permettant de gnrer les processus est dis-
ponible en tlchargement.
IV. La mthode de Box et Jenkins

La partie autorgressive dun processus, note AR, est constitue par une com-
binaison linaire finie des valeurs passes du processus. La partie moyenne
mobile, note MA, est constitue dune combinaison linaire finie en t des
valeurs passes dun bruit blanc. Wold (1954) montre que les modles ARMA
permettent de reprsenter la plupart des processus stationnaires. Lapproche de
Box et Jenkins (1976) consiste en une mthodologie dtude systmatique des
sries chronologiques partir de leurs caractristiques afin de dterminer, dans
la famille des modles ARIMA, le plus adapt reprsenter le phnomne tu-
di. Trois tapes principales sont dfinies.
A. Recherche de la reprsentation adquate :

lidentification1
La phase didentification est la plus importante et la plus difficile : elle consiste
dterminer le modle adquat dans la famille des modles ARIMA. Elle est
1. Attention : il ne faut pas confondre lemploi de ce terme avec son utilisation dans le cadre des
modles quations simultanes.
260 CONOMTRIE
9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 261
fonde sur ltude des corrlogrammes simple et partiel. Nous pouvons essayer
ddicter quelques rgles simples facilitant la recherche des paramtres p, d, q
du modle ARIMA.
1) Dsaisonnalisation
Dans le cas dune srie affecte dun mouvement saisonnier, il convient de la reti-
rer pralablement tout traitement statistique. Cette saisonnalit est ajoute la
srie prvue la fin du traitement afin dobtenir une prvision en terme brut.
2) Recherche de la stationnarit en terme de tendance

Si ltude du corrlogramme simple et les tests statistiques sy rapportant (statis-
tique Q) prsagent dune srie affecte dune tendance, il convient den tudier les
caractristiques selon les tests de Dickey-Fuller. La mthode dlimination de la
tendance est fonction du processus DS ou TS sous-jacent la chronique tudie.
Aprs stationnarisation, nous pouvons identifier les valeurs des paramtres
p, q du modle ARMA.
Si le corrlogramme simple na que ses q premiers termes (q = 3 maximum)
diffrents de 0 et que les termes du corrlogramme partiel diminuent lente-
ment, nous pouvons pronostiquer un MA(q) .
Si le corrlogramme partiel na que ses p premiers termes (p = 3 maximum)
diffrents de 0 et que les termes du corrlogramme simple diminuent lente-
ment, cela caractrise un AR( p) .
Si les fonctions dautocorrlation simple et partiel ne paraissent pas tronques,
il sagit alors dun processus de type ARMA, dont les paramtres dpendent
de la forme particulire des corrlogrammes.
B. Estimation des paramtres

Les mthodes destimation diffrent selon le type de processus diagnostiqu.
Dans le cas dun modle AR( p), nous pouvons appliquer une mthode des
moindres carrs (cf. chapitre 7) ou bien nous pouvons utiliser les relations exis-
tantes entre les autocorrlations et les coefficients du modle (quations de Yule-
Walker).
Lestimation des paramtres dun modle MA(q) savre plus complexe.
Box et Jenkins suggrent dutiliser une procdure itrative de type balayage que
nous pouvons illustrer de la manire suivante.
Supposons le processus :
(1 1 D 2 D 2 )yt = (1 1 D 2 D 2 )t
que nous pouvons crire :

9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 262
1
yt = (1 1 D 2 D 2 )t
1 1 D 2 D 2
1
Nous posons vt = t ,
1 1 D 2 D 2
il vient alors :
vt 1 vt1 2 vt2 = t [6]
Ce qui nous donne :
yt = vt 1 vt1 2 vt2 o vt = yt + 1 vt1 + 2 vt2 [7]
Nous pouvons alors initialiser la procdure de balayage en partant de deux
intervalles de valeurs plausibles pour (
1 ;
2 ) et dun pas dincrmentation.
Puis, pour chaque couple de valeurs (
1 ;
2 ), nous posons : v0 = 0 et
v1 = 0,
et nous calculons les valeurs estimes de
vt partir de la relation [7] :

v2 = y2

v3 = y3 +
1
v2

v4 = y4 +
1
v3 +
2
v2 , etc.
Aprs calcul de toutes les valeurs de

vt , nous estimons les paramtres 1 et
2 par la mthode des moindres carrs applique lquation [6] :
vt = 1 vt1 + 2 vt2 + t [8]
Nous retenons les valeurs 1 ,

2 et
1 ,
2 qui rendent minimum la somme
des carrs des rsidus issue de la rgression de lquation [8].
Cette mthode destimation nest valide que si le nombre de paramtres
estimer nest pas trop important.
Nous pouvons mentionner des mthodes destimation fondes sur une maxi-
misation de fonctions de vraisemblance recourant alors des procdures itra-
tives de rgression non linaire, telles que celles envisages au chapitre 6.
C. Tests dadquation du modle et prvision

Les paramtres du modle tant estims (on vrifie la convergence de la proc-
dure itrative destimation), nous examinons les rsultats destimation.
Les coefficients du modle doivent tre significativement diffrents de 0 (le test
du t de Student sapplique de manire classique). Si un coefficient nest pas
significativement diffrent de 0, il convient denvisager une nouvelle spcifi-
cation liminant lordre du modle AR ou MA non valide.
Lanalyse des rsidus : si les rsidus obissent un bruit blanc, il ne doit pas
exister dautocorrlation dans la srie et les rsidus doivent tre homoscdas-
tiques. Les tests suivants peuvent tre utiliss.
262 CONOMTRIE
9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 263
le test de Durbin Watson, bien quil ne permette de dtecter que des auto-
corrlations dordre 1 ;
les tests de Box et Pierce et de Ljung et Box (cf. I, C de ce chapitre) qui
permettent de tester lensemble des termes de la fonction dautocorrla-
tion. Si le rsidu est mmoire, cela signifie que la spcification du mod-
le est incomplte et quil convient dajouter au moins un ordre au proces-
sus ;
le test ARCH dhtroscdasticit (cf. chapitre 5, II, D) effectu partir de
la fonction dautocorrlation du rsidu au carr.
La phase de validation du modle est trs importante et ncessite le plus sou-
vent un retour la phase didentification.
Lorsque le modle est valid, la prvision peut alors tre calcule un hori-
zon de quelques priodes, limites car la variance de lerreur de prvision crot
trs vite avec lhorizon.
Nous pouvons rsumer les diffrentes tapes de la mthodologie de Box et
Jenkins partir du schma 2.
Schma 2 Les tapes de la mthodologie de Box et Jenkins

9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 264

Analyse par la mthodologie de Box et Jenkins et prvision
de trois processus alatoires
Soit les trois processus x1 , x2 et x3 connus sur 220 priodes, on demande de :
analyser leurs proprits stochastiques ;
dterminer, le cas chant, lordre du processus ARMA(p, q) ;
effectuer une prvision, par une mthode adapte, un horizon de 3 priodes.
Solution
Les rsultats sont fournis sans les calculs intermdiaires.
1) Analyse du processus x1
Le graphique 2 prsente lvolution du processus x1 et son corrlogramme, leur
lecture le processus est non stationnaire.
800
700
600
500
400
300
200
100
0
25 50 75 100 125 150 175 200
X1
Graphique 2 volution et fonction dautocorrlation simple du processus x1
a) Stratgie simplifie de test : tests de Phillips-Perron (fentre de Newey-West = 4)

Null Hypothesis: X1 has a unit root

Exogenous: Constant, Linear Trend
Bandwidth: 4 (Fixed using Bartlett kernel)
Adj. t-Stat Prob.
Phillips-Perron test statistic 2.148148 0.5157
Dependent Variable: D(X1)
Included observations: 219 after adjustments
X1(-1) 0.039046 0.021398 1.824772 0.0694
C 3.725580 0.811468 4.591160 0.0000
@TREND(1) 0.124280 0.066711 1.862974 0.0638
264 CONOMTRIE
9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 265
Nous acceptons lhypothse H0 de racine unitaire, nous ne pouvons donc pas inter-
prter les probabilits critiques calcules directement selon les lois de Student. Nous
devons nous rfrer la table statistique 7 en fin douvrage : tb = 1,86 < tb0,05 = 2,79
(valeur lue 5%, modle [3]), acceptation de lhypothse b = 0. Selon la stratgie
squentielle de test nous estimons le modle [2].

Exogenous: Constant
Bandwidth: 4 (Fixed using Bartlett kernel)
Adj. t-Stat Prob.
X1(-1) 0.000673 0.001830 0.367843 0.7133
C 3.128542 0.749736 4.172860 0.0000
Nous acceptons lhypothse H0 de racine unitaire, nous ne pouvons pas interprter

les probabilits critiques calcules directement selon les lois de Student :
tc = 4,17 > tc0,05 = 2,84 (valeur lue 5%, modle [2]), nous refusons lhypothse
c = 0. Il sagit donc dun processus DS avec drive : x1t = x1t1 + c + t . Nous le sta-
tionarisons par le passage aux diffrences premires.
b) Analyse des fonctions dautocorrlation simple et partielle sur la srie stationnaire
Il ne sagit pas dune marche au hasard (les probabilits critiques de la Q-Stat sont
toutes trs largement infrieures 0,05), le processus est mmoire, il existe donc une
reprsentation dans la classe des processus ARMA.

9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 266
c) Recherche des ordres p et q de la reprsentation ARMA

Compte tenu de la forme des corrlogrammes simple et partiel nous slectionnons
un modle ARMA(2, 1). Nous constatons que la constante est significativement diff-
rente de 0, et des essais dautres reprsentations concurrentes (ARMA(1, 1)) indiquent
des valeurs des critres dinformation (AIC ou SC) suprieures au modle retenu.

C 3.327748 0.346054 9.616272 0.0000
AR(1) 0.760134 0.066149 11.49128 0.0000
AR(2) - 0.604867 0.062249 - 9.716905 0.0000
MA(1) 0.500890 0.073470 6.817644 0.0000
d) Validation de la reprsentation
Tests de Student sur les coefficients :
Les coefficients sont tous significativement diffrents de 0 (probabilits critiques
infrieures 0,05)
Analyse des rsidus
Corrlogramme du rsidu Corrlogramme du rsidu au carr
Le corrlogramme du rsidu indique quil sagit dun processus sans mmoire, le

corrlogramme du rsidu au carr (test ARCH, cf. chapitre 5) nindique aucun terme de
significativement diffrent de 0 ; lhomoscdasticit des rsidus est donc vrifie. Les
rsidus sont donc un processus de bruit blanc.
Les rsidus sont-ils gaussiens ? La statistique de Jarque-Bera (JB = 2,06) indique
une probabilit critique de 0,35, nous acceptons lhypothse H0 de normalit des rsi-
dus.
La reprsentation est valide, x1t est un processus ARIMA(2, 1, 1) avec constante.
e) Prvision
La valeur de la constante est gale : = E(x1t ) (1 1 2 )
266 CONOMTRIE
9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 267
La prvision est donne par :

x1t = 1 x1t1 + 2 x1t2 + E(x1t ) (1 1 2 ) + t + 1 t1
x1t = 0,76 x1t1 0,60 x1t2 + 3,33 (1 0,76 + 0,60) + t + 0,50 t1
x1t = x1t1 + x1t
x1,221 = 0,76 x1,220 0,60 x1,219 + 2,81 + 221 + 0,50 220
x1,221 = 0,76 7,76 0,60 12,39 + 2,81 + 0 + 0,50 0,87 = 1,65
Jusqu lobservation t = 220 nous prenons t = rsidu, pour t > 220, E(t ) = 0.
x1,221 = x1,220 + x1,221 = 741,90 + 1,65 = 743,55
x1,222 = 0,76 x1,221 0,60 x1,220 + 2,81 + 222 + 0,50 221
x1,222 = 0,76 1,65 0,60 7,76 + 2,81 + 0 + 0 = 0,63
x1,222 = x1,221 + x1,222 = 743,55 0,63 = 742,92
x1,223 = 0,76 x1,222 0,60 x1,221 + 2,81 + 223 + 0,50 222

x1,223 = 0,76 0,63 0,60 1,65 + 2,81 + 0 + 0 = 1,34
x1,223 = x1,222 + x1,223 = 742,92 + 1,34 = 744,26
Les rsultats sont prsents au tableau 3.
Tableau 3 Calcul des prvisions du processus ARIMA(2, 1, 1)
t x1t x1t t = rsidus

218 721,75 10,2 4,07
219 734,14 12,39 2,28
220 741,90 7,76 0,87
221 743,55 1,65 0
222 742,92 0,63 0
223 744,26 1,34 0
lecture le processus semble non stationnaire.
35
30
25
20
15
10
0
25 50 75 100 125 150 175 200
X2

9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 268
a) Stratgie simplifie de test : tests de Dickey-Fuller

Doit-on utiliser le test de Dickey-Fuller simple ou le test de Dickey-Fuller
Augment ?
Pralablement nous dterminons la valeur de p, si p = 0 nous utilisons le test de
Dickey-Fuller. partir du modle [2] (modle avec constante) nous slectionnons
lordre p du modle partir des critres dinformation dAkaike et de Schwarz. Les deux
critres sont convergents1 p = 3.

Exogenous: Constant
Lag Length: 3 (Automatic based on AIC, MAXLAG=8)

Exogenous: Constant
Lag Length: 3 (Automatic based on SIC, MAXLAG=8)
Nous appliquons donc la stratgie squentielle des tests partir des tests de Dickey-
Fuller Augment avec p = 3.

Lag Length: 3 (Fixed)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic 2.253814 0.4570
Test critical values: 1% level 4.001108
5% level 3.430766
10% level 3.138998
Augmented Dickey-Fuller Test Equation
X2( 1) 0.080344 0.035648 2.253814 0.0252
D(X2( 1)) 0.229159 0.070487 3.251071 0.0013
D(X2( 2)) 0.209633 0.069319 3.024181 0.0028
D(X2( 3)) 0.168372 0.067849 2.481571 0.0139
C 1.314041 0.575187 2.284546 0.0233
@TREND(1) 0.002458 0.003842 0.639940 0.5229

les probabilits critiques calcules directement selon les lois de Student. Nous devons
1. En cas de divergence des critres nous retenons la valeur de p minimum des deux critres.
268 CONOMTRIE
9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 269
donc nous rfrer la table statistique 7 en fin douvrage : tb = 0,64 < tb0,05 = 3,12
(valeur lue 5 %, modle [3]), acceptation de lhypothse b = 0. Nous estimons le
modle [2].
Exogenous: Constant
Lag Length: 3 (Fixed)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic 2.306282 0.1709
5% level 2.874741
10% level 2.573883
Augmented Dickey-Fuller Test Equation
X2( 1) 0.067264 0.029165 2.306282 0.0221
D(X2( 1)) 0.239180 0.068630 3.485076 0.0006
D(X2( 2)) 0.217876 0.068017 3.203270 0.0016
D(X2( 3)) 0.174967 0.066968 2.612710 0.0096
C 1.347763 0.571966 2.356368 0.0194

les probabilits critiques calcules directement selon les lois de Student :
tc = 2,35 < tc0,05 = 3,39 (valeur lue 5 %, modle [2]), nous acceptons lhypothse
c = 0. Il sagit donc dun processus DS sans drive : x2t = x2t1 + t . Nous le stationa-
risons par le passage aux diffrences premires.
b) Analyse des fonctions dautocorrlation simple et partielle sur la srie stationnaire

9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 270
Il ne sagit pas dune marche au hasard (les probabilits critiques de la Q-Stat sont
toutes trs largement infrieures 0,05), le processus est mmoire, il existe donc une
reprsentation dans la classe des processus ARMA.
c) Recherche des ordres p et q de la reprsentation ARMA

Compte tenu de la forme des corrlogrammes simple et partiel nous slectionnons
un modle ARMA(1, 1). Nous constatons que la constante nest pas significativement
diffrente de 0, et des essais dautres reprsentations concurrentes (ARMA(2, 0) ou
ARMA(0, 2)) indiquent des valeurs des critres dinformation (AIC ou SC) suprieures
au modle retenu.

AR(1) 0.437628 0.127029 3.445091 0.0007
MA(1) 0.743275 0.094329 7.879625 0.0000
d) Validation de la reprsentation
Tests de Student sur les coefficients
infrieures 0,05).
Analyse des rsidus
Le corrlogramme du rsidu indique quil sagit dun processus sans mmoire, le

corrlogramme du rsidu au carr nindique aucun terme de significativement diffrent
de 0 ; les rsidus sont donc homoscdastiques. Les rsidus sont donc un bruit blanc.
une probabilit critique de 0,052, nous acceptons (de justesse !) lhypothse de norma-
lit des rsidus.
La reprsentation est valide, x2t est un processus ARIMA(1, 1, 1) sans constante.
270 CONOMTRIE
9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 271
e) Prvision
La prvision est donne (E(t ) = 0 pour t > 220) par :
x2t = 1 x2t1 + 1 t1
x2t = 0,437 x2t1 0,743t1
x2t = x2t1 + x2t
x2,221 = 0,437 x2,220 0,743 220

x2,221 = 0,437 1,318 0,743 0,889 = 0,084
x2,221 = x2,220 + x2,221 = 19,61 + 0,084 = 19,69
x2,222 = 0,437 x2,221 0,743 221

x2,222 = 0,437 0,084 0,743 0 = 0,037
x2,222 = x2,221 + x2,222 = 19,69 + 0,037 = 19,73
x2,223 = 0,437 x2,222 0,743 222

x2,223 = 0,437 0,037 0,743 0 = 0,016
x2,223 = x2,222 + x2,223 = 19,73 + 0,016 = 19,75
Les rsultats sont prsents au tableau 4.
Tableau 4 Calcul des prvisions du processus ARIMA(1, 1, 1)
t x2t x2t t = rsidus

218 20,438 3,328 2,464
219 20,930 0,492 0,867
220 19,611 1,318 0,889
221 19,695 0,084 0
222 19,732 0,037 0
223 19,748 0,016 0
lecture le processus est clairement non stationnaire.
700
600
500
400
300
200
100
0
25 50 75 100 125 150 175 200
X3

9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 272
a) Stratgie simplifie de test : tests de Phillips-Perron (choix automatique de la fentre

de Newey-West)

Bandwidth: 1 (Newey-West using Bartlett kernel)
Adj. t-Stat Prob.*
5% level 3.430477
10% level 3.138828
Phillips-Perron Test Equation
X3(- 1) 1.023098 0.068065 15.03108 0.0000
C 10.33495 0.639662 16.15689 0.0000
@TREND(1) 3.065841 0.203980 15.03013 0.0000
Nous refusons lhypothse H0 de racine unitaire, nous pouvons donc interprter

directement les probabilits critiques calcules selon les lois de Student, refus aussi de
lhypothse b = 0.
Le processus x3 est un TS (Trend Stationnary), x3t = a0 + a1 t + t avec
t = 1, 2, ..., n. La bonne mthode de stationnarisation consiste donc effectuer une
rgression sur le temps.
b) Modlisation
Soit la rgression de x3 sur une tendance dterministe t = 1, 2, ... , n
Dependent Variable: X3
C 7.171985 0.409466 17.51547 0.0000
TENDANCE 2.996632 0.003213 932.7294 0.0000
c) Validation de la reprsentation
Tests de Student sur les coefficients
infrieures 0,05).
272 CONOMTRIE
9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 273
Analyse des rsidus

Le corrlogramme du rsidu indique quil sagit dune marche au hasard, le corr-

logramme du rsidu au carr nindique aucun terme de significativement diffrent de 0 ;
les rsidus sont donc homoscdastiques. Les rsidus sont donc un bruit blanc.
une probabilit critique de 0,54, nous acceptons lhypothse de normalit des rsidus.
La reprsentation est valide x3t est un processus TS.
d) Prvision
La prvision est donne par :
x3t = a0 + a1 t + t avec (E(t ) = 0) t
x3t = 7,17 + 2,996 t
x3,221 = 7,17 + 2,996 221 = 669,428

x3,222 = 7,17 + 2,996 222 = 672,424
x3,223 = 7,17 + 2,996 223 = 675,421

9782100721511-Bourbo-C09.qxd 22/10/14 9:34 Page 274
9782100721511-Bourbo-C10.qxd 22/10/14 10:25 Page 275
10. La modlisation VAR
L
a modlisation conomtrique classique plusieurs quations
structurelles (cf. chapitre 8) a connu beaucoup de critiques
(Granger [1969] et Sims [1980]) et de dfaillances face un envi-
ronnement conomique trs perturb. Les prvisions labores laide
de ces modles se sont rvles trs mdiocres. Les critiques principales
formules lencontre de ces modles structurels concerne la simultani-
t des relations et la notion de variable exogne. La reprsentation1 VAR
(Vector AutoRegressive) gnralisation des modles autorgressifs (AR)
au cas multivari (cf. chapitre 9) apporte une rponse statistique len-
semble de ces critiques. Dans cette reprsentation, les variables slec-
tionnes2 en fonction du problme tudi ont toutes, a priori, le mme
statut et on sintresse alors des relations purement statistiques.
Nous prsentons tout dabord en section I. la spcification gnrale
dun modle VAR, puis nous abordons les mthodes destimation et de
prvision en section II. La dynamique dun modle VAR et lanalyse des
chocs sont traites dans la section III. ; enfin, la section IV est consacre
la recherche du sens de la causalit entre les variables.
1. Le terme de reprsentation convient mieux que le terme de modlisation, car lconomiste ne

spcifie pas des relations conomiques en tant que telles.
2. En gnral celles dun modle thorique.
La modlisation VAR 275

9782100721511-Bourbo-C10.qxd 22/10/14 10:25 Page 276
I. Reprsentation dun modle VAR

Soit une reprsentation VAR dans laquelle on considre deux variables y1t et y2t .
Chacune de ces variables est fonction de ses propres valeurs passes et de
celles de lautre.
Par exemple le modle VAR dun ordre p = 4 , scrit :

4
4
y1t = a1 + b1i y1ti + c1i y2ti d1 y2t + 1t
i=1 i=1

4
4
y2t = a2 + b2i y1ti + c2i y2ti d2 y1t + 2t
i=1 i=1
Les variables y1t et y2t sont considres comme tant stationnaires (cf. cha-
pitre 9), les perturbations 1t et 2t (les innovations ou les chocs) sont des bruits
blancs de variances constantes 12 et 22 et non autocorrles. Nous pouvons
immdiatement constater labondance de paramtres estimer (ici 20 coeffi-
cients) et les problmes de perte de degrs de libert qui en rsultent. la lec-
ture de ce modle, il apparat quil nest pas sous forme rduite : en effet, y1t a
un effet immdiat sur y2t et rciproquement y2t a un effet immdiat sur y1t . Ce
systme initial est appel forme structurelle de la reprsentation VAR. Sous
forme matricielle, ce modle devient :

4
BYt = A0 + Ai Yti + t [1]
i=1
avec :

1 d1 y1t a b c1i 1t
B= Yt = A0 = 1 Ai = 1i = .
d2 1 y2t a2 b2i c2i 2t
Pour obtenir un modle VAR sous forme standard, on multiplie de part de
dautre dans [1] par B 1 . Le modle sous forme standard scrit :

4
4
y1t = a10 + a1i1 y1ti + a1i2 y2ti + 1t
i=1 i=1

4
4
y2t = a20 + a2i1 y1ti + a2i2 y2ti + 2t
i=1 i=1
Dans cette spcification, les erreurs 1t et 2t sont fonction des innovations

1t et 2t ; en effet, puisque = B 1 , on obtient :
1t = (1t d1 2t )/(1 d1 d2 ) et 2t = (2t d2 1t )/(1 d1 d2 )
276 CONOMTRIE
9782100721511-Bourbo-C10.qxd 22/10/14 10:25 Page 277
On dmontre que :
E(1t ) = 0; E(2t ) = 0; E(1t 1ti ) = 0; E(2t 2ti ) = 0
Les erreurs ont une esprance nulle et sont non autocorrles.
E(1t2 ) = (12 + d12 22 )/(1 d1 d2 )2 ; E(2t2 ) = (22 + d22 12 )/(1 d1 d2 )2
La variance de lerreur est constante (indpendante du temps).
E(1t 2t ) = (d2 12 + d1 22 )/(1 d1 d2 )2
Si d1 = d2 = 0 , les variables y1t et y2t nont pas dinfluence synchrone lune
sur lautre, les erreurs 1t et 2t sont non corrles. Dans le cas contraire, les
erreurs 1t et 2t sont corrles et donc une variation de lune de ces erreurs un
instant donn a un impact sur lautre.
B. La reprsentation gnrale
La gnralisation de la reprsentation VAR k variables et p dcalages (note
VAR( p) ) scrit sous forme matricielle :
Yt = A0 + A1 Yt1 + A2 Yt2 + . . . + A p Yt p + t
y a0
1,t a1i1 a1i2 . . . a1ik 1 1t
y a2i1 a2i2 a2i
k
a2
0
2t
avec Yt = = ; A0 = . ; t = .
2,t
.. ; Ai =/0 .. . ..
. . .
yk,t aki1 aki2 k
aki ak0
kt

On note : = E(t t ) , la matrice de dimension (k, k) des variances cova-
riances des erreurs. Cette matrice est bien sr inconnue.
Cette reprsentation peut scrire laide de loprateur retard :
(I A1 D A2 D 2 . . . A P D P )Yt = A0 + t ou encore A(D)Yt = A0 + t
Condition de stationnarit
Un modle VAR est stationnaire, sil satisfait les trois conditions classiques :
E(Yt ) = t ;
Var(Yt ) < ;
Cov(Yt ,Yt+k ) = E[(Yt )(Yt+k )] = k t .
On dmontre1 quun processus VAR( p) est stationnaire si le polynme d-
fini partir du dterminant : det(I A1 z A2 z 2 . . . A p z p ) = 0 a ses racines
lextrieur du cercle unit du plan complexe.
1. Cf. Hamilton J. D., page 259, 1994.

9782100721511-Bourbo-C10.qxd 22/10/14 10:25 Page 278
Exercice n 1
Recherche des conditions de stationnarit dun modle VAR
Soit le processus :

y1t 3 0,2 0,7 y1t1 e1t
= + +
y2t 1 0,3 0,4 y2t1 e2t
On demande dtudier les conditions de stationnarit.
Solution
Le dterminant est gal :

1 0 0,2 0,7 z 1 = 1,30
det z = 1 0,6 z 0,13 z
2
0 1 0,3 0,4 z 2 = 5,91
Les deux racines sont en valeur absolue suprieures 1, le processus est donc sta-
tionnaire.
C. La reprsentation ARMAX
La reprsentation prcdente peut tre gnralise1, par analogie avec les pro-
cessus ARMA( p, q) , un modle dont les erreurs sont autocorrles dordre q.
Yt = A0 + A1 Yt1 + A2 Yt2 + . . . + A p Yt p + t + B1 t1 + B2 t2 + . . . + Bq tq
Il sagit dun processus ARMA multivari not : ARMAX ou parfois

VARMA.
Les conditions de stationnarit sont analogues celles dun processus
ARMA univari : un processus VAR est toujours inversible, il est stationnaire
lorsque les racines de son polynme sont lextrieur du cercle unit du plan
complexe.
Un processus VMA est toujours stationnaire. Il est inversible si les racines
de son polynme retard sont lextrieur du cercle unit du plan complexe.
Les conditions de stationnarit et dinversibilit dun ARMAX sont don-
nes par la partie VAR et la partie VMA de lARMAX.
1. Il sagit dune application au cas multivari du thorme de dcomposition de Wold (1954).
278 CONOMTRIE
9782100721511-Bourbo-C10.qxd 22/10/14 10:25 Page 279
II. Estimation des paramtres

Les paramtres du processus VAR ne peuvent tre estims que sur des sries
chronologiques stationnaires. Ainsi, aprs tude des caractristiques des sries,
soit les sries sont stationnarises par diffrence, pralablement lestimation
des paramtres dans le cas dune tendance stochastique, soit il est possible
dajouter une composante tendance la spcification VAR, dans le cas dune
tendance dterministe.
A. Mthode destimation
Dans le cas dun processus VAR, chacune des quations peut tre estime par
les MCO, indpendamment les unes des autres (ou par une mthode de maxi-
mum de vraisemblance).
Soit le modle VAR( p) estim :
0 + A
Yt = A 1 Yt1 + A
2 Yt2 + . . . + A
p Yt p + e
e tant le vecteur de dimension (k,1) des rsidus destimation e1t , e2t , . . . , ekt .

Et on note : e la matrice des variances covariances estimes des rsidus du
modle.
Les coefficients du processus VAR ne peuvent tre estims qu partir de
sries stationnaires. Ainsi, aprs tude des caractristiques des chroniques, soit
les sries sont stationnarises par diffrence, pralablement lestimation des
paramtres dans le cas dune tendance stochastique, soit il est possible dajouter
une composante tendance la spcification VAR, dans le cas dune tendance
dterministe.
De mme, nous pouvons ajouter la spcification VAR des variables binaires
afin de corriger un mouvement saisonnier ou une priode anormale.
B. Dtermination du nombre de retards

Pour dterminer le nombre de retards dun modle retards chelonns (cf. cha-
pitre 7), nous avons prsent les critres de Akaike et de Schwarz. Dans le cas
de la reprsentation VAR, ces critres peuvent tre utiliss pour dterminer
lordre p du modle. La procdure de slection de lordre de la reprsentation
consiste estimer tous les modles VAR pour un ordre allant de 0 h (h tant
le retard maximum admissible par la thorie conomique ou par les donnes

9782100721511-Bourbo-C10.qxd 22/10/14 10:25 Page 280
disponibles). Les fonctions AIC( p) et SC( p) sont calcules de la manire

suivante :
2k 2 p
AIC( p) = Ln det e +
n
k 2 p Ln(n)
SC( p) = Ln det e +
n
avec : k = nombre de variables du systme ; n = nombre dobservations ;
p = nombre de retards ; e = matrice des variances covariances des rsidus du
modle.
Le retard p qui minimise les critres AIC ou SC est retenu.
C. Prvision
Les coefficients du modle tant estims, la prvision peut tre calcule en n
lhorizon dune priode, par exemple pour un VAR(1), de la manire suivante :
n (1) = A
Y 0 + A
1 Yn
lhorizon de 2 priodes, la prvision est :

n (2) = A
Y 0 + A
1 Y
n (1) = A
0 + A
1 A
0 + A
21 Yn
lhorizon de 3 priodes, la prvision scrit :

n (3) = A
Y 0 + A n (2) = (I + A
1 Y 1 + A
21 ) A
0 + A
31 Yn
etc.
Lorsque h tend vers linfini, nous constatons que la prvision tend vers une
i1 0 si i .
valeur constante (tat stationnaire) puisque A
Lesprance de la matrice de lerreur de prvision est nulle, sa variance est
donne par :

e (h) = M0 e M0 + M1 e M1 + . . . + Mh1 e

Mh1 o Mi est calcul par la
formule de rcurrence suivante :

min( p,i)
Mi = j Mi j
A i = 1, 2,. . . et M0 = I
j=1
Ainsi, il vient :
1 ; M2 = A
M1 = A 1 M1 + A2 M0 = A21 + A2 ;
1 M2 + A
M3 = A 2 M1 + A3 M0 = A1 + A
3 1 A
2 + A
2 A
1 + A
3
etc.
La variance de lerreur de prvision pour chacune des prvisionsdes k
variables ( n2 (h)) se lit sur la premire diagonale de la matrice e (h) .
Lintervalle de prvision au seuil de (1 /2) est donn par :
n (h) t /2
Y n (h) avec t /2 valeur de la loi normale.
280 CONOMTRIE
9782100721511-Bourbo-C10.qxd 22/10/14 10:25 Page 281

Spcification, estimation et prvision dun modle VAR
Nous cherchons modliser, sous la forme VAR, la demande (y1t ) et les prix (y2t )
dune matire premire. Nous disposons des donnes trimestrielles CVS et en diffrences
premires sur 18 ans (tableau 1).
Tableau 1 Demande et prix CVS et en diffrences premires (extrait des donnes)
Date y1t y2t

0001Q1 146,4 75,6
0001Q2 19,2 1,8

0018Q3 19,2 16,2
0018Q4 50,4 3,6
On demande :
1) de rechercher lordre du modle VAR,
2) destimer les paramtres du modle,
3) de calculer une prvision pour lanne 19 avec son intervalle de confiance 95 %.
Solution
1) Rechercher lordre du modle VAR
Nous allons utiliser les critres de Akaike et de Schwarz pour des dcalages h allant
de 0 4. Nous devons donc estimer quatre modles diffrents et retenir celui dont les cri-
tres AIC et SC sont les plus faibles.
Estimation du modle pour h = 1
0 1
y1t a a 2
a11 y1t1 1t
= 10 + 11 +
y2t a2 1
a21 2
a21 y2t1 2t
Ou encore :
y1t = a10 + a11
1
y1t1 + a11
2
y2t1 + 1t
y2t = a20 + a21
1
y1t1 + a21
2
y2t1 + 2t
Pour estimer les paramtres de ce modle, nous pouvons utiliser les MCO quation
par quation.
y1t = 0,00676 y1t1 0,6125 y2t1 + 17,129
y2t = 0,1752 y1t1 + 0,2992 y2t1 12,862
Les deux rsidus destimation sont alors calculs : e1,t et e2,t ainsi la matrice des
variances covariances des rsidus est donne par :
n n
e12 e1 e2

1 1

e =
1
n n n
e1 e2 e22
1 1

1 106500,16 47878,12 1500,002 674,3398
= =
71 47878,12 85205,25 674,339 1200,074

9782100721511-Bourbo-C10.qxd 22/10/14 10:25 Page 282
Attention, certains logiciels (par exemple Eviews partir de la version 4) estiment

cette matrice des variances covariances en divisant la somme des carrs ou du produit par
le degr de libert de chaque quation estime soit :

1 106500,16 47878,12 1566,18 704,09
= =
e
71 2 1 47878,12 85205,25 704,09 1253,02
Dans toute la suite des calculs nous retenons la mthode 1, soit :
Var(e1t ) = 1 500,002 ; Var(e2t ) = 1 200,074 ; Cov(e1t ,e2t ) = 674,339

1 500,002 674,339
=
Soit det e 674,339 1 200,074 = 1 345 379 .
Pour p = 1 :
2k 2 p
AIC( p) = Ln det e + = Ln(1 345 379) + (2 22 1)/71 = 14,28
n
et
k 2 p Ln(n)
SC( p) = Ln det e + = Ln(1 345 379) + (22 1 Ln(71))/71
n
= 14,47
Nous pouvons calculer de la mme manire :
AIC(2) = 14,31 ; AIC(3) = 14,39 ; AIC(4) = 14,45

SC(2) = 14,56 ; SC(3) = 14,78 ; SC(4) = 14,97
Le nombre de dcalages retenu correspond la valeur la plus faible des critres

soit : p = 1.

Le modle VAR(1) estim scrit :
y1t = 0,00676 y1t1 0,6125 y2t1 + 17,1292 + e1t
(0,06) (4,47) (2,87)
R 2 = 0,28 ; n = 71 ; () = t de Student
y2t = 0,1752 y1t1 + 0,2992 y2t1 12,862 + e2t
(1,84) (2,44) (2,41)
R 2 = 0,21 ; n = 71 ; () = t de Student
3) Prvision
La prvision est calcule en faisant tourner le modle :

y19:1 = 0,0067 y18:4 0,6125 y18:4 + 17,129
.

y19:1 = 0,1752 y18:4 + 0,2992 y18:4 12,862

y19:1 = 0,0067 50,4 0,6125 3,6 + 17,129 = 15,3

y19:1 = 0,1752 50,4 + 0,2992 3,6 12,862 = 20,6

y19:2 = 0,0067 15,3 0,6125 20,6 + 17,129 = 29,9

y19:2 = 0,1752 15,3 + 0,2992 20,6 12,862 = 21,7
282 CONOMTRIE
9782100721511-Bourbo-C10.qxd 22/10/14 10:25 Page 283

y19:3 = 0,0067 29,9 0,6125 21,7 + 17,129 = 30,6

y19:3 = 0,1752 29,9 + 0,2992 21,7 12,862 = 24,6

y19:4 = 0,0067 30,6 0,6125 24,6 + 17,129 = 32,4

y19:4 = 0,1752 30,6 + 0,2992 24,6 12,862 = 25,6
La variance de lerreur de prvision est donne par la formule :

e (h) = e M1 + . . . + Mh1 e Mh1
+M1 e

o Mi est calcul par la formule

min( p,i)
de rcurrence suivante : Mi = j Mi j i = 1,2,. . . et M0 = I . Les variances se
A
j=1

lisent sur la premire diagonale de la matrice e (h) .
Ainsi, il vient : M1 = A 1 ; M2 = A 1 M1 = A 21 ; M3 = A1 M2 = A31 ; etc., car le

modle est un VAR(1) et donc seul A1 est estim.

1 500,02 674,34
Soit lhorizon h = 1, nous avons e (1) = . La variance de
674,34 1 200,1
lerreur de prvision pour y19:1 est gale 1 500,02 et la variance de lerreur de prvi-

sion pour y19:1 est gale 1 200,1. Lintervalle de confiance pour y19:1 est donn
par : 15,3 1,96 38,73 = [60,64 ; 91,17] et pour y19:1 est donn par :
20,6 1,96 34,64 = [88,52 ; 47,27] .
Soit lhorizon h = 2, nous avons :

1 1 , soit :
e (2) = e +A e A

674,34
1 500,02 0,00676 0,6126 1 500,02 674,34
e (2) = +
674,34
1 200,1 0,1753 0,2992 674,34 1 200,1

0,00676 0,1753 1 955,99 969,88
=
0,6126 0,2992 969,88 1 424,37
2
Pour h = 3 : (3) = +A1 A 21
1 + A A1
e e e e

1 500,02 674,34 0,00676 0,6126 1 500,02 674,34
e (3) = +
674,34 1 200,1 0,1753 0,2992 674,34 1 200,1
2
0,00676 0,1753 0,00676 0,6126 1 500,02 674,34
+
0,6126 0,2992 0,1753 0,2992 674,34 1 200,1
2
0,00676 0,1753 2 042,63 1 043,88
=
0,6126 0,2992 1 043,88 1 489,48
2 3
1
Pour h = 4 : e (4) = e + A 2 3
e A1 + A1 e A1 + A1 e A1

1 500,02 674,34 0,00676 0,6126 1 500,02 674,34
e (4) = +
674,34 1 200,1 0,1753 0,2992 674,34 1 200,1
2
0,00676 0,1753 0,00676 0,6126 1 500,02 674,34
+
0,6126 0,2992 0,1753 0,2992 674,34 1 200,1

9782100721511-Bourbo-C10.qxd 22/10/14 10:25 Page 284
2 3
0,00676 0,1753 0,00676 0,6126 1 500,02 674,34
+
0,6126 0,2992 0,1753 0,2992 674,34 1 200,1
3
0,00676 0,1753 2 067,67 1 064,00
=
0,6126 0,2992 1 064,00 1 505,73
IC y19:2 = 29,9 1,96 44,22 = [56,82 ; 116,54]

Ic y19:2 = 21,7 1,96 37,74 = [95,68 ; 52,26]
IC y19:3 = 30,6 1,96 45,19 = [57,95 ; 119,21]
Ic y19:3 = 24,6 1,96 38,59 = [100,23 ; 51,05]
IC y19:4 = 32,4 1,96 45,47 = [56,72 ; 121,52]
Ic y19:4 = 25,6 1,96 38,80 = [101,64 ; 50,46]
III. Dynamique dun modle VAR

Les modles VAR permettent danalyser les effets de la politique conomique,
cela au travers de simulations de chocs alatoires1 et de la dcomposition de la
variance de lerreur. Cependant, cette analyse seffectue en postulant la constan-
ce de lenvironnement conomique toutes choses tant gales par ailleurs .
A. Reprsentation VMA dun processus VAR

Nous avons vu quun modle AR(1) a une reprsentation MA() . Par analogie,
nous pouvons dmontrer quun VAR(1) a une reprsentation VMA() . Le
modle sous cette forme va permettre de mesurer limpact sur les valeurs pr-
sentes dune variation des innovations (ou des chocs) 1t et de 2t .
Soit la reprsentation VAR( p) stationnaire :
Yt = A0 + A1 Yt1 + A2 Yt2 + . . . + A p Yt p + t
Sa reprsentation VMA() est donne par :

Yt = + t + M1 t1 + M2 t2 + . . . = + Mi ti
i=0
avec : = (I A1 A2 . . . A p )1 A0

min( p,i )
et Mi = A j Mi j i = 1,2,. . . et M0 = I
j =1
1. Le terme dinnovation est aussi souvent employ.
284 CONOMTRIE
9782100721511-Bourbo-C10.qxd 22/10/14 10:25 Page 285
Sous cette forme, la matrice M apparat comme un multiplicateur dim-

pact , cest--dire que cest au travers de cette matrice quun choc se rpercute
tout le long du processus. Une variation un instant donn t de t affecte toutes
les valeurs suivantes de Yt , leffet dun choc (ou dune innovation) est donc per-
manent et va en samortissant.
B. Analyse et orthogonalisation des chocs

Lanalyse dun choc consiste mesurer limpact de la variation dune innovation
sur les variables. Prenons lexemple du modle estim de lexercice 2 :
y1t = 0,00676 y1t1 0,6125 y2t1 + 17,129 + e1t
y2t = 0,1752 y1t1 + 0,2992 y2t1 12,863 + e2t
Une variation un instant donn de e1t a une consquence immdiate sur y1t
puis sur y2t+1 et y2t+1 , par exemple sil se produit en t un choc sur e1t gal 1,
nous avons limpact suivant :

y1t 1
En t : =
y2t 0

y1t+1 0,00676 0,6126 1 0,0067
la priode t + 1 : = =
y2t+1 0,1753 0,2992 0 0,175

y1t+2 0,00676 0,6126 0,0067 0,107
la priode t + 2 : = =
y2t+2 0,1753 0,2992 0,175 0,054
etc.
Les diffrentes valeurs ainsi calcules constituent la fonction de rponse
impulsionnelle . Dans ce schma, nous faisons lhypothse que les rsidus e1t et
e2t sont indpendants entre eux. Or, cette hypothse est rarement vrifie ; en
effet, nous avons montr en section I., quil peut exister une corrlation entre les
erreurs 1t et de 2t , cette corrlation pouvant tre mesure laide des rsidus
Cov(e1 ,e2 )
destimation : e1 e2 = .
e1 e2
Cependant si ce coefficient nous renseigne bien sur la liaison contemporaine
entre les deux rsidus, il nindique pas le sens de la causalit. Cest pourquoi,
nous devons faire une hypothse supplmentaire concernant la relation entre les
erreurs : par exemple, dans lexercice 2, la rflexion conomique laisse prsager
quune variation du prix (y2t ) a un impact sur la demande (y1t ) . Un choc sur y1t
na donc pas dimpact contemporain sur y2t ; en revanche un choc sur y2t a un
impact contemporain (mesur par le coefficient de corrlation entre les rsidus)
sur y1t . Dans cet exemple, le coefficient de corrlation est gal
Cov(e1 ,e2 )
e1 e2 = = 0,503 ; en faisant lhypothse que e1 e2 , un choc
e1 e2
alatoire de 1 sur y2t se traduit par une baisse de 0,503 sur y1t . Le tableau 2
illustre cette dissymtrie des innovations sur les variables.

9782100721511-Bourbo-C10.qxd 04/11/14 8:22 Page 286
Tableau 2 Analyse des chocs sur les variables y1t et y2t

avec 1t = 0,503 2t
t y1t y2t t y1t y2t
1 1,000 0,000 1 0,530 1,000

2 0,007 0,175 2 0,616 0,387
3 0,107 0,054 3 0,241 0,224
4 0,034 0,035 4 0,139 0,109
5 0,022 0,016 5 0,068 0,057
6 0,010 0,009 6 0,035 0,029
7 0,005 0,004 7 0,018 0,015
8 0,003 0,002 8 0,009 0,008
9 0,001 0,001 9 0,005 0,004
10 0,001 0,001 10 0,002 0,002
11 0,000 0,000 11 0,001 0,001
12 0,000 0,000 12 0,001 0,001
Le choix du sens de limpact est donc trs important et conditionne les

valeurs obtenues. Nous pouvons observer que leffet dune innovation sestom-
pe au cours du temps. Cela caractrise un processus VAR stationnaire.
Le graphique 1 prsente les deux fonctions de rponses impulsionnelles.
Le problme de la corrlation contemporaine des erreurs et donc de limpact
dun choc sur une variable est trait, dune manire gnrale, par la recherche
dune reprsentation erreurs orthogonales. Reprenons lexemple dun modle
VAR deux variables :
y1,t = a1 y1,t1 + b1 y2,t1 + 1,t
y2,t = a2 y1,t1 + b2 y2,t1 + 2,t
avec Var(1,t ) = 21 , Var(2,t ) = 22 et Cov(1,t ,2,t ) = k =

/ 0.
En calculant y2,t (k/1 )y1,t on obtient :
2
y2,t = k/21 y1,t + (a2 a1 k/21 )y1,t1 + (b2 b1 k/21 )y2,t1 + 2,t k/21 1,t
On pose : t = 2,t k/21 1,t

Cov(1,t ,t ) = E(1,t t ) = Cov(1,t 2,t ) k/21 E(1,t2
2
) = k k = 0.
Les erreurs (ou innovations) ne sont plus corrles. Lanalyse des chocs
peut donc seffectuer sur les deux quations suivantes dont les erreurs sont
orthogonales :
y1,t = a1 y1,t1 + b1 y2,t1 + 1,t
y2,t = k/21 y1,t + (a2 a1 k/21 )y1,t1 + (b2 b1 k/21 )y2,t1 + 2,t k/21 1,t
286 CONOMTRIE
9782100721511-Bourbo-C10.qxd 22/10/14 10:25 Page 287
Nous remarquons que, sous cette forme, nous avons fait apparatre dans la
deuxime quation la causalit instantane entre y2,t et y1,t telle quelle existait
dans le VAR structurel (cf. I. A.). Cependant, la causalit instantane entre y1,t et
y2,t napparat pas dans la premire quation. Dans cette procdure dorthogona-
lisation, les rsidus sont indpendants, nous pouvons faire apparatre soit une
causalit instantane entre y2,t et y1,t soit une causalit instantane entre y1,t et
y2,t mais pas les deux la fois : il sagit de lordre de dcomposition.
La gnralisation un modle VAR k variables ncessite le recours des
procdures dorthogonalisation1 de matrice et savre donc complexe. Il
convient de noter que les rsultats sont influencs par le choix de lquation ser-
vant de base la transformation. Les rsultats sont diffrents si la transformation
affecte y1t la place de y2t , cest pourquoi le choix2 de lordre des variables
modifie les rsultats obtenus.
Graphique 1 Fonctions de rponses impulsionnelles
1. Cf. Hamilton J. D. page 318, 1994.

2. Les logiciels dconomtrie offrent la possibilit de choisir lordre des variables et permettent
ainsi de simuler les diffrents cas de figure.

9782100721511-Bourbo-C10.qxd 22/10/14 10:25 Page 288
C. Dcomposition de la variance
La dcomposition de la variance de lerreur de prvision a pour objectif de cal-
culer pour chacune des innovations sa contribution la variance de lerreur. Par
un technique mathmatique1, on peut crire la variance de lerreur de prvision
un horizon h en fonction de la variance de lerreur attribue chacune des
variables ; il suffit ensuite de rapporter chacune de ces variances la variance
totale pour obtenir son poids relatif en pourcentage.
Reprenons notre modle VAR(1) deux variables y1t et y2t , la variance de
lerreur de prvision pour y1t+h peut scrire :

y21 (h) = 21 m 211 (0) + m 211 (1) + . . . + m 211 (h 1)

+22 m 222 (0) + m 222 (1) + . . . + m 222 (h 1)
o les m ii sont les termes de la matrice M de la section III.A.

lhorizon h, la dcomposition de la variance, en pourcentage, des propres
innovations de y1t sur y1t , est donne par :

21 m 211 (0) + m 211 (1) + . . . + m 211 (h 1)
.
y21 (h)
Et la dcomposition de la variance, en pourcentage, des innovations de y1t sur

22 m 222 (0) + m 222 (1) + . . . + m 222 (h 1)
y2t , est donne par :
y21 (h)
Linterprtation des rsultats est importante :
si un choc sur 1t naffecte pas la variance de lerreur de y2t quel que soit
lhorizon de prvision, alors y2t peut tre considr comme exogne car y2t
volue indpendamment de 1t ;
a contrario, si un choc sur 1t affecte fortement voire totalement la
variance de lerreur de y2t , alors y2t est considr comme endogne.
Dans la pratique, les rsultats ne sont pas aussi marqus mais indiquent la
contribution de chacune des variables la variance de lerreur.
D. Choix de lordre de dcomposition

Il est noter que le problme de la corrlation contemporaine des erreurs, et
donc de limpact dun choc sur une variable, implique un choix de dcomposi-

1. La matrice tant toujours dfinie positive, la dcomposition de Cholesky permet de diago-
naliser la matrice des variances covariances de lerreur de prvision, et ainsi didentifier les
variances propres chacune des variables. Nous ne pouvons pas aborder dans le cadre de ce
manuel cette technique, le lecteur peut se rfrer Hamilton J. D. (1994) pour tous les compl-
ments mathmatiques.
288 CONOMTRIE
9782100721511-Bourbo-C10.qxd 22/10/14 10:25 Page 289
tion qui fournit des rsultats dissymtriques en fonction de lordre des variables.
Le problme est plus complexe si le nombre de variables est important.
Prenons lexemple dun VAR 4 variables Y1, Y2, Y3 et Y4.
Si nous choisissons lordre de dcomposition de Cholesky suivant : Y3 Y2
Y1 Y4, cela entrane :
un choc en priode 1 sur Y3 (la variable la plus exogne) a un impact sur
lensemble des quatre variables ;
un choc en priode 1 sur Y2 a un impact sur Y2, Y3 et Y4, absence de cor-
rlation contemporaine avec Y3 ;
un choc en priode 1 sur Y1 a un impact sur Y1 et Y4, absence de corrla-
tion contemporaine avec Y3 et Y2 ;
et, enfin, un choc en priode 1 sur Y4 (la moins exogne) na un impact que
sur elle-mme, absence de corrlation contemporaine avec Y3, Y2 et Y1.
Le tableau 3 illustre cet exemple de dcomposition et danalyse des chocs.
Nous ne prsentons que les deux premires priodes.
Tableau 3 Exemple de dcomposition Y3, Y2, Y1, Y4
Cholesky Ordering : Y3 Y2 Y1 Y4
Response of Y1 :
Period Y1 Y2 Y3 Y4
1 1.603662 1.022459 1.402923 0.000000
2 0.395786 0.151091 0.488095 0.275476
Response of Y2 :
Period Y1 Y2 Y3 Y4
1 0.000000 5.434671 4.125310 0.000000
2 0.875767 1.251545 0.115017 0.105811
Response of Y3 :
Period Y1 Y2 Y3 Y4
1 0.000000 0.000000 4.544690 0.000000
2 0.241257 0.954324 1.584595 0.476602
Response of Y4 :
Period Y1 Y2 Y3 Y4
1 0.768803 1.686351 2.315711 2.091513
2 0.129818 1.104756 0.927459 0.186928
Lordre de dcomposition seffectue donc de la variable suppose tre la plus

exogne vers la variable la moins exogne. Dans le doute, il convient deffec-
tuer plusieurs combinaisons diffrentes dordre de dcomposition et danalyser
la robustesse des rsultats.

9782100721511-Bourbo-C10.qxd 22/10/14 10:25 Page 290
Exercice n 3
fichier C10EX2
Analyse dune fonction de rponse impulsionnelle et dcomposition

de la variance
partir de la reprsentation VAR(1) estime lexercice 2, on demande de calculer
et dinterprter les fonctions de rponses impulsionnelles et la dcomposition de la
variance des erreurs.
Solution
Les rsultats sont issus de Eviews 3 (RATS possde une procdure

IMPULSE.PRG permettant elle aussi de calculer tous ces lments).
Nous considrons quune innovation sur y1,t ninfluence pas de manire instantane
y2,t , en revanche une innovation sur y2,t a une influence contemporaine sur y1,t (un choc
sur la variable prix influence la demande mais pas rciproquement).
La matrice des variances covariances des rsidus est gale (cf. exercice 2)

1 500,002 674,3398
e = .
674,3398 1 200,074
Calcul des chocs initiaux
Lordre de dcomposition des variables est le suivant Y2 Y1. Lanalyse des chocs doit
donc seffectuer sur les deux quations suivantes dont les rsidus sont orthogonaliss
(cf. III. B.) :
y1,t dpend de v1,t = (e1,t k/22 e2,t )
y2,t dpend de v2,t = e2,t
Var(v1,t ) = Var(e1,t Cov(e1,t ,e2,t )/22 e2,t )
2Cov(e1t ,e2t ) [Cov(e1t ,e2t )]2

Var(v1,t ) = Var(e1t ) Cov(e1t ,e2t ) + Var(e2t )
Var(e2t ) [Var(e2t )]2
2[Cov(e1t ,e2t )]2 [Cov(e1t ,e2t )]2
Var(v1,t ) = Var(e1t ) +
Var(e2t ) [Var(e2t )]
Var(v1,t ) = Var(e1t ) Cov(e1t ,e2t )2 /Var(e2t )
Lamplitude du choc sur y1,t est gale une fois lcart type orthogonalis de v1,t soit

Var(e1t ) Cov(e1t ,e2t )2 /Var(e2t ) = 1 500,002 674,33982 /1 200,074 = 33,48 .
Ce choc na pas deffet instantan sur y2,t .
Lamplitude du choc sur y2,t est gale une fois lcart type orthogonalis :
Or, Var(v2,t ) = Var(e2,t ) = 1 200,074 , le choc sur y2,t est donc gal 34,62.
Ce choc se rpercute instantanment sur y1,t , il est donc gal, aprs orthogonalisa-
tion, 34,62 Cov(e1 ,e2 )/Var(e2,t ) soit 34,62 674,3398/1 200,074 = 19,4659.
Une fois les chocs initiaux calculs, nous calculons les fonctions de rponse impul-
sionnelle comme prcdemment, les chocs se rpercutent ensuite sur les deux processus
en samortissant, signe de la stationnarit du processus VAR.
290 CONOMTRIE
9782100721511-Bourbo-C10.qxd 22/10/14 10:25 Page 291
Fonctions de rponse impulsionnelle un cart type orthogonalis (Eviews 3)

Rponse de Y1 : Rponse de Y2 :
Priode un choc sur Y1 un choc sur Y2 Priode un choc sur Y1 un choc sur Y2
1 33,48254 19,46591 1 0,000000 34,64208
2 0,226363 21,35271 2 5,868694 13,77894
3 3,596584 8,585080 3 1,795947 7,866119
4 1,124479 4,876681 4 1,167853 3,858783
5 0,723007 2,396789 5 0,546587 2,009549
6 0,339717 1,247217 6 0,290298 1,021480
7 0,180128 0,634172 7 0,146419 0,524297
8 0,090912 0,325462 8 0,075390 0,268057
9 0,046797 0,166407 9 0,038496 0,137265
10 0,023898 0,085211 10 0,019723 0,070245
Ordre : Y2 Y1 (Y2 est la cause de Y1)
Le graphique 2 prsente ces fonctions de rponse impulsionnelles.

Response of Y1 to One S.D. Innnovations Response of Y2 to One S.D. Innnovations
40 40
30
30
20
10 20
0 10
10
0
20
30 10
1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
Y1 Y2 Y1 Y2
Graphique 2 Fonctions de rponses impulsionnelles

Dcomposition de la variance (Eviews 3)
Dcomposition de la variance de Y1 : Dcomposition de la variance de Y2 :
Priode SE Y1 Y2 Priode SE Y1 Y2
1 38,72986 74,73859 25,26141 1 34,64208 0,000000 100,0000
2 44,22659 57,31782 42,68218 2 37,74089 2,418013 97,58199
3 45,19547 55,51993 44,48007 3 38,59373 2,528876 97,47112
4 45,47172 54,90856 45,09144 4 38,80374 2,592156 97,40784
5 45,54058 54,76783 45,23217 5 38,85958 2,604496 97,39550
6 45,55892 54,72930 45,27070 6 38,87409 2,608129 97,39187
7 45,56369 54,71940 45,28060 7 38,87790 2,609036 97,39096
8 45,56494 54,71679 45,28321 8 38,87889 2,609278 97,39072
9 45,56527 54,71611 45,28389 9 38,87916 2,609341 97,39066
10 45,56536 54,71593 45,28407 10 38,87922 2,609358 97,39064
Ordre : Y2 Y1 (Y2 est la cause de Y1)

9782100721511-Bourbo-C10.qxd 22/10/14 10:25 Page 292
La dcomposition de la variance indique que la variance de lerreur de prvision de

y1,t est due 55 % ses propres innovations et 45 % celles de y2,t . La variance de
lerreur de prvision de y2,t est due 2,6 % y1,t et 97,4 % y2,t . Cette dissymtrie
deffet va tre tudie par lanalyse de la causalit.
Enfin, nous remarquons que ce tableau nous indique les carts types de lerreur de pr-
vision pour y1,t et y2,t que nous avions calculs de manire fastidieuse lors de lexercice 2.
IV. La causalit
Au niveau thorique, la mise en vidence de relations causales entre les
variables conomiques fournit des lments de rflexion propices une meilleu-
re comprhension des phnomnes conomiques. De manire pratique, the
causal knowledge est ncessaire une formulation correcte de la politique
conomique. En effet, connatre le sens de la causalit est aussi important que
de mettre en vidence une liaison entre des variable conomiques.
A. Causalit au sens de Granger

Granger (1969) a propos les concepts de causalit et dexognit : la variable
y2t est la cause de y1t , si la prdictibilit1 de y1t est amliore lorsque linforma-
tion relative y2t est incorpore dans lanalyse. Soit le modle VAR( p) pour
lequel les variables y1t et y2t sont stationnaires :
1 1
y1t a0 a b11 y1t1 a b21 y1t2
= + 12 + 22 + ...
y2t b0 a1 b12 y2t1 a2 b22 y2t2
1
a b1p y1t p
+ p2 + 1t
a p b2p y2t p 2t
Le bloc de variables (y2t1 ,y2t2 ,. . . ,y2t p ) est considr comme exogne par
rapport au bloc de variables (y1t1 ,y1t2 ,. . . ,y1t p ) si le fait de rajouter le bloc y2t
namliore pas significativement la dtermination des variables y1t . Ceci consis-
te effectuer un test de restrictions sur les coefficients des variables y2t de la
reprsentation VAR (not RVAR = Restricted VAR). La dtermination du retard
p est effectue par les critres AIC ou SC (cf. II.B). Soit :
y2t ne cause pas y1t si lhypothse suivante est accepte H0 :
b11 = b21 = . . . = b1p = 0 .
a12 = a22 = . . . = a p2 = 0 .
Si nous somme amens accepter les deux hypothses que y1t cause y2t et
que y2t cause y1t , on parle de boucle rtroactive feedback effect .
1. Le terme de prdictibilit semble prfrable au terme de causalit ; en effet, dire que yt cause
xt , signifie seulement quil est prfrable de prdire xt en connaissant yt que sans le connatre.
292 CONOMTRIE
9782100721511-Bourbo-C10.qxd 22/10/14 10:25 Page 293
Ces tests peuvent tre conduits laide dun test de Fisher classique (cf. cha-
pitre 3, test de Wald) de nullit des coefficients, quation par quation ou bien
directement par comparaison entre un modle VAR non contraint (UVAR) et le
modle VAR contraint (RVAR). On calcule le ratio de vraisemblance suivant :

L = (n c) Ln| RVAR | Ln| UVAR | qui suit un 2 2 p degrs de
libert avec :

RVAR = matrice des variances covariances des rsidus du modle contraint,

UVAR = matrice des variances covariances des rsidus du modle non contraint,
n = nombre dobservations,
c = nombre de paramtres estims dans chaque quation du modle non
contraint.
Si L > 2 lu dans la table, alors on rejette lhypothse de validit de la
contrainte.
B. Causalit au sens de Sims

Sims (1980) prsente une spcification de test lgrement diffrente, en consi-
drant que si les valeurs futures de y1t permettent dexpliquer les valeurs pr-
sentes de y2t , alors y2t est la cause de y1t .
Ceci se traduit par la reprsentation suivante :

p
p
p
y1t = a10 + a1i1 y1ti + a1i2 y2ti + bi2 y2t+i + 1t
i=1 i=1 i=1

p
p
p
y2t = a20 + a2i1 y1ti + a2i2 y2ti + bi1 y1t+i + 2t
i=1 i=1 i=1

b12 = b22 = . . . = b2p = 0 .
b11 = b21 = . . . = b1p = 0 .
Il sagit l encore dun test de Fisher classique de nullit de coefficients.
Exercice n 4
fichier C10EX2
Tests de causalit de Granger et de Sims

On demande, partir de la reprsentation VAR(1) estime lors de lexercice 2, de
procder aux tests de Granger et de Sims.

9782100721511-Bourbo-C10.qxd 22/10/14 10:25 Page 294
Solution
Nous procdons au test de Fisher quation par quation.

Test de Granger
H0 : y2t ne cause pas y1t
Nous estimons les modles suivants :
y1t = 0,006760 y1t1 0,6125 y2t1 + 17,129632 + e1t
R 2 = 0,28 ; n = 71 ; SC RU = 106500,2 (non contraint)
y1t = 0,2359 y1t1 + 26,9448 + e1t
R 2 = 0,067 ; n = 71 ; SC R R = 13792,6 (contraint)
(SC R R SC RU )/c 137924,6 106500,2)/1
F = = = 20,064
SC RU/(n k 1) 106500,2/(71 2 1)
c = nombre de restrictions (nombre de coefficients dont on teste la nullit).
F > F1;68
0.05
4 , on rejette lhypothse H0, y2t explique significativement la variable
y1t , il y a donc causalit au sens de Granger de y2t vers y1t .
Ou bien :

L = (n c)(Ln| RV AR | Ln| U V AR |) = (71 1)(14,44 14,11) = 23,29
> 2 (2) = 5,99 , on rejette lhypothse de validit de la contrainte.
y2t = 0,17527 y1t1 + 0,29926096 y2t1 12,862837 + e2t
y2t = 0,4075 y2t1 15,391 + e2t
(SC R R SC RU )/c (89452,77 85205,25)/1
F = = = 3,389
SC RU/(n k 1) 85205,22/(71 2 1)
F < F1;68
0.05
4 , on accepte lhypothse H0, y1t nexplique pas significativement la
variable y2t , il ny a donc pas causalit au sens de Granger de y1t vers y2t .
Ou bien :

L = (n c)(Ln| RV AR | Ln| U V AR |) = (71 1)(14,17 14,11) = 4,52
< 2 (2) = 5,99 , on accepte lhypothse de validit de la contrainte.
Ce rsultat ne doit pas nous surprendre puisque y1t est la variable reprsentative de la
demande et y2t du prix.
Test de Sims
Nous estimons les modles suivants (sur la mme priode de 78:2 95:3) :
y1t = 0,01435 y1t1 0,579 y2t1 0,357 y2t+1 + 8,713 + e1t
y1t = 0,007654 y1t1 0,6145 y2t1 + 16,714 + e1t
294 CONOMTRIE
9782100721511-Bourbo-C10.qxd 22/10/14 10:25 Page 295
(105952,6 92676,66)/1
F = = 9,45
92676,66/(70 3 1)
F > F1;66
0.05
4 , on rejette lhypothse H0, y2t+1 explique significativement la
variable y1t , il y a donc causalit au sens de Sims de y1t vers y2t .
y2t = 0,0967 y1t1 + 0,2259 y2t1 0,390 y1t+1 3,328 + e2t
y2t = 0,174 y1t1 + 0,297 y2t1 13,30 + e2t
(84586,73 63742,31)/1
F = = 21,58
84586,73/(70 3 1)
F > F1;66
0.05
4 , on refuse lhypothse H0, y1t+1 explique significativement la
variable y2t , il y a donc causalit au sens de Sims de y2t vers y1t .
Nous observons une divergence dans ces tests, en ce qui concerne la causalit de y1t
sur y2t ; le test de Granger nous fait rejeter lhypothse de causalit et celui de Sims lais-
se prsager dun lien de causalit de type feedback : les prix de la priode suivante
influencent la demande de la priode actuelle, sagit-il dune anticipation des agents ?

9782100721511-Bourbo-C10.qxd 22/10/14 10:25 Page 296
9782100721511-Bourbo-C11.qxd 22/10/14 10:27 Page 297
11. La cointgration
et le modle
correction derreur
L
analyse de la cointgration, prsente par Granger (1983) et Engle
et Granger (1987), est considre par beaucoup dconomistes
comme un des concepts nouveaux les plus importants dans le
domaine de lconomtrie et de lanalyse de sries temporelles. Dans ce
chapitre, nous abordons en section I. des exemples permettant une intro-
duction au problme de la cointgration. La section II. est consacre la
prsentation de la cointgration en termes de dfinition et de spcifica-
tion. Les tests de cointgration ainsi que les mthodologies destimation
sont ensuite dvelopps dans le cas deux variables (section III.) et enfin
(section IV) dans les cas k variables.
I. Exemples introductifs
Premier exemple
Soit les variables yt et xt dfinies de la manire suivante :
y1 = 1 avec comme variable explicative : x1 = 1
y2 = 2 avec comme variable explicative : x2 = 22

yn = n avec comme variable explicative : xn = n 2
La tendance de yt est de type linaire et celle de xt est quadratique.
Le rsultat de la rgression de yt sur xt (n = 30) conduit lestimation suivante :
yt = 5,92 + 0,03xt
(8,5) (19,8)
R = 0,94 DW = 0,057
2
La cointgration et le modle correction derreur 297

9782100721511-Bourbo-C11.qxd 22/10/14 10:27 Page 298
Les coefficients de rgression sont significatifs, la valeur du R 2 est leve,

cependant il apparat vident que ce modle a un pouvoir prdictif trs mauvais.
En effet, sur le plan statistique, la statistique de Durbin et Watson (proche de 0)
prsage dune autocorrlation forte des erreurs1.
Ce premier exemple illustre le danger dinterprter et dutiliser une rgres-
sion entre deux variables affectes de tendances dterministes de degr diffrent.
Le graphique 1 prsente la srie brute (tendance linaire) et la srie ajuste par
une tendance quadratique.
Graphique 1 Rgression dune tendance linaire

sur une tendance quadratique
Deuxime exemple
On gnre deux processus alatoires :

yt = yt1 + 1t avec t N 0; 21

xt = xt1 + 2t avec t N 0; 22
Sur 1 000 rgressions, nous obtenons les rsultats suivants : 670 sont signi-
ficatives daprs la statistique du t de Student, cependant la statistique de DW
est toujours faible (la moyenne sur les 1 000 rgressions est : DW = 0,33 ).
Donc apparemment, ces rgressions donnent de bons rsultats (hormis la statis-
tique DW ). Mais ces rsultats sont purement fortuits : ils dcoulent de la corr-
lation entre les sries qui sont affectes dune tendance stochastique. En effet, si
on passe en diffrences premires (yt = f (xt ) ), plus aucune rgression nest
significative.
yt = yt yt1 = 1t
xt = xt xt1 = 2t
1. Cela souligne limportance ne pas oublier dinterprter la statistique de Durbin et Watson.
298 CONOMTRIE
9782100721511-Bourbo-C11.qxd 22/10/14 10:27 Page 299
En rgressant une srie non stationnaire (de type DS) sur une autre srie du
mme type, on obtient des coefficients significatifs mais avec une statistique
DW proche de 0 . Ce deuxime exemple illustre le risque de rgresser entre elles
deux sries affectes dune tendance stochastique. Il faut donc toujours, au pra-
lable, stationnariser des sries non stationnaires ; dans le cas contraire, il existe
un risque de rgression fallacieuse ( spurious regression ).
II. Le concept de cointgration

Lanalyse de la cointgration permet didentifier clairement la relation vritable
entre deux variables en recherchant lexistence dun vecteur de cointgration et
en liminant son effet, le cas chant.
A. Proprits de lordre dintgration dune srie

Une srie est intgre dordre d (note xt I (d) ), sil convient de la diffren-
cier d fois afin de la stationnariser1.
Soit une srie x1t stationnaire et une srie x2t intgre dordre 1 :
x1t I (0)
x1t + x2t I (1)
x2t I (1)
La srie yt = x1t + x2t est non stationnaire puisque lon somme une srie
affecte dune tendance et une srie stationnaire.
Soit deux sries x1t et x2t intgres dordre d :
x1t I (d)
x1t + x2t I (?)
x2t I (d)
La combinaison linaire x1t + x2t I (?) .

En effet, le rsultat dpend des signes des coefficients , et de lexistence
dune dynamique non stationnaire commune.
Examinons un autre cas de figure :
x1t I (d)
x1t + x2t I (?)
x2t I (d ) d = d
Il savre impossible de conclure car on somme deux sries dordre dint-

gration diffrent.
1. Cf. le test de Dickey-Fuller du chapitre 9 afin de dterminer lexistence dune tendance sto-
chastique ou dterministe et de rechercher les ordres dintgration dune srie.

9782100721511-Bourbo-C11.qxd 22/10/14 10:27 Page 300
Soit deux sries affectes dune tendance :

dans un premier cas, les deux sries ont une tendance dvolution constan-
te sur une premire priode et puis une tendance dvolution divergente en
une deuxime priode, les sries ne sont pas cointgres (cf. graphique 2) ;
dans un deuxime cas, les deux sries ont une volution constante sur toute
la priode, les sries sont cointgres (cf. graphique 3), il existe une vo-
lution de long terme constante entre les chroniques.
Graphique 2 Les variables xt et z t ne sont pas cointgres
Graphique 3 Les variables xt et yt sont cointgres
300 CONOMTRIE
9782100721511-Bourbo-C11.qxd 22/10/14 10:27 Page 301
B. Conditions de cointgration
Deux sries xt et yt sont dites cointgres si les deux conditions sont vrifies :
elles sont affectes dune tendance stochastique de mme ordre dintgra-
tion d ,
une combinaison linaire de ces sries permet de se ramener une srie
dordre dintgration infrieur.
Soit :
xt I (d)
yt I (d)
tel que 1 xt + 2 yt I (d b),
avec d b > 0.
On note : xt , yt C I (d, b)
o [1 2 ] est le vecteur de cointgration.
Dans le cas gnral k variables, on a :
x1, t I (d)
x2, t I (d)
on note X t = [x1, t x2, t . . . xk, t ]
...
xk, t I (d)
sil existe un vecteur de cointgration = [1 2 . . . k ] de dimension (k, 1) tel
que X t I (d b) , alors les k variables sont cointgres et le vecteur de coin-
tgration est . On note que X t C I (d, b) avec b > 0 .
C. Le modle correction derreur (ECM)

Examinons le cas particulier suivant : xt , yt C I (1, 1) et [, 1] (on normali-
1
se en posant = soit xt yt I (0) ) est le vecteur de cointgration.
2
Dans ce type de spcification, le fait que les sries soient cointgres et non sta-
tionnaires soulve un problme destimation. La bonne qualit statistique du
modle ( R 2 lev et coefficients significatifs) est due au fait que les sries sont
non stationnaires (puisque cointgres). En rgression directe de yt sur xt
lorsque yt , xt C I (1, 1) lutilisation de ce modle des fins prvisionnelles
savre dsastreuse ; en effet, la relation mise en vidence par cette rgression
nest pas relle, elle dcoule simplement dune relation entre deux tendances1.
Le problme est donc, dune part de retirer la relation commune de coint-
gration (la tendance commune), dautre part, de rechercher la liaison relle entre
1. Cf. les exemples introductifs sur les problmes de rgressions fallacieuses.

9782100721511-Bourbo-C11.qxd 22/10/14 10:27 Page 302
les variables : cest lobjectif du Modle Correction dErreur (ECM1). Cette

reprsentation est la fois un modle statique (1 xt ) et un modle dynamique
(2 (yt1 xt1 )) .
Nous pouvons spcifier la relation : yt = 1 xt + 2 (yt1 xt1 )

I(0) I(0) I(0)
Autour de la relation de long terme, le modle correction derreur permet
dintgrer les fluctuations de court terme. Le coefficient 2 qui doit tre nga-
tif rend compte dune force de rappel vers lquilibre de long terme.
Le graphique 4 illustre la relation de long terme entre xt et yt (yt xt = 0),
cette ligne reprsente lquilibre de long terme du systme ; la zone dvolution
du systme en dehors de lquilibre (dynamique de court terme) est dfinie par
lerreur constate entre yt1 et xt1 .
Graphique 4 Reprsentation du modle correction derreur
III. Cointgration entre deux variables

Le traitement de sries chronologiques longues impose de tester une ventuelle
cointgration entre les variables. En effet, le risque destimer des relations
fallacieuses et dinterprter les rsultats de manire errone est trs lev.
Nous allons tout dabord examiner le cas deux variables : test de cointgration
et estimation du modle correction derreur.
1. Nous utilisons labrviation anglo-saxonne Error Correction Model .
302 CONOMTRIE
9782100721511-Bourbo-C11.qxd 22/10/14 10:27 Page 303
A. Test de cointgration entre deux variables

Nous reprenons ici lalgorithme en deux tapes de Engle et Granger.
tape 1 : tester lordre dintgration des variables

Une condition ncessaire de cointgration est que les sries doivent tre int-
gres de mme ordre. Si les sries ne sont pas intgres de mme ordre, elles ne
peuvent pas tre cointgres.
Il convient donc (cf. tests de Dickey-Fuller et Dickey-Fuller Augment) de
dterminer trs soigneusement le type de tendance dterministe ou stochastique
de chacune des variables, puis lordre dintgration d des chroniques tudies.
Si les sries statistiques tudies ne sont pas intgres de mme ordre, la proc-
dure est arrte, il ny a pas de risque de cointgration.
Soit :
xt I (d) et yt I (d)
tape 2 : estimation de la relation de long terme

Si la condition ncessaire est vrifie, on estime par les MCO la relation de
long terme entre les variables : yt = a1 xt + a0 + t .
Pour que la relation de cointgration soit accepte, le rsidu et issu de cette
rgression doit tre stationnaire : et = yt a1 x t
a0 .
La stationnarit du rsidu est teste laide des tests DF ou DFA (cf. chapitre 9).
Dans ce cas, nous ne pouvons plus utiliser les tables de Dickey et Fuller. En
effet, le test porte sur les rsidus estims partir de la relation statique et non
pas sur les vrais rsidus de la relation de cointgration. MacKinnon (1991)
a donc simul des tables qui dpendent du nombre dobservations et du nombre
de variables explicatives figurant dans la relation statistique.
Si le rsidu est stationnaire nous pouvons alors estimer le modle correc-
tion derreur.
B. Estimation du modle correction derreur

Lorsque des sries sont non stationnaires et cointgres, il convient destimer
leurs relations au travers dun modle correction derreur (ECM, Error
Correction Model ). Engle et Granger (1987) ont dmontr que toutes les
sries cointgres peuvent tre reprsentes par un ECM (thorme de la repr-
sentation de Granger).
Nous allons prsenter la mthode la plus rpandue destimation dun ECM.
Nous nous bornons, ici, au cas dune seule variable explicative. La gnralisa-
tion k variables est aborde la section suivante.

9782100721511-Bourbo-C11.qxd 22/10/14 10:27 Page 304
Soit les sries yt et xt I (1) , lestimation par les MCO de la relation de long
terme indique une stationnarit du rsidu. Les sries yt et xt sont donc notes :
CI(1, 1).
Nous pouvons, ds lors, estimer le modle correction derreur.
Estimation du modle correction derreur (ECM) en deux tapes

tape 1 : estimation par les MCO de la relation de long terme :
yt = xt + et
+ (ECM) [1]
tape 2 : estimation par les MCO de la relation du modle dynamique

(court terme) :
yt = 1 xt + 2 et1 + u t 2 < 0 [2]
Le coefficient 2 (force de rappel vers lquilibre) doit tre significativement

ngatif ; dans le cas contraire, il convient de rejeter une spcification de type
ECM. En effet, le mcanisme de correction derreur (rattrapage qui permet de
tendre vers la relation de long terme) irait alors en sens contraire et sloignerait
de la cible de long terme. La procdure en deux tapes conduit une estimation
convergente des coefficients du modle et les carts types des coefficients peu-
vent sinterprter de manire classique1.
Lestimation dun modle correction derreur ne pose donc pas de probl-
me particulier et ncessite simplement le recours une technique de moindres
carres ordinaires.
En cas de variables explicatives supplmentaires dont lhypothse de coint-
gration ne peut pas tre retenue (comme des variables indicatrices par exemple),
la procdure destimation est la mme sauf pour lestimation du modle [1]
(quation de long terme) dans lequel figurent ces variables explicatives.

Test de cointgration et estimation dun modle correction
derreur
Soit deux sries statistiques yt et xt dont les observations sont prsentes au
tableau 1. On demande destimer la relation entre ces deux variables
(yt =
a0 +
a1 xt + et ) en testant une ventuelle cointgration (dans ce cas estimer le
modle correction derreur).
1. Engle et Granger, 1987.
304 CONOMTRIE
9782100721511-Bourbo-C11.qxd 22/10/14 10:27 Page 305
Tableau 1 Valeurs observes de xt et yt (extrait des donnes)
Obs xt yt
1 0,000 10,890
2 2,851 12,188

29 6,744 12,347
30 7,270 15,194
Solution
La premire tape consiste tudier les proprits des deux sries en termes de sta-
tionnarit. Le tableau 2 prsente les rsultats des tests :
de Dickey-Fuller (aucun retard nest significatif dans lventualit dun test de
Dickey-Fuller Augment),
de Phillips-Perron (troncature = 2),
et de KPSS (troncature = 2).
Ces tests sont prsents au chapitre 9.
Tableau 2 Rsultats des tests de Dickey-Fuller, Phillips-Perron et KPSS
Test Type de Modle xt en niveau t statistique yt en niveau t statistique

Test DF [1] 0,81 0,17
Test DF [2] 0,05 2,67
Test DF [3] 0,82 3,05
Test PP [1] 0,88 0,62
Test PP [2] 0,11 2,60
Test PP [3] 0,80 2,96
xt en niveau yt en niveau
LM statistique LM statistique
Test KPSS [2] 0,53 0,39
Test KPSS [3] 0,22 0,20
La comparaison des t1 calculs aux t lus (Tables de MacKinnon) ou des LM statis-

tiques aux valeurs critiques indique que les deux sries xt et yt sont non stationnaires en
niveau1. Des tests similaires sur les diffrentes premires de xt et yt indiquent quelles
sont stationnaires, les deux sries tudies sont I (1), il existe donc un risque de coint-
gration.
Le test de cointgration est effectu partir du rsidu destimation du modle :
yt = a1 xt + a0 + t
Soit : yt = 0,55xt + 10,38 + et

(6,3) (41,46)
n = 30 ; R 2 = 0,58 ; (.) = t de Student.
1. Nous rejetons lhypothse dune tendance dterministe.

9782100721511-Bourbo-C11.qxd 22/10/14 10:27 Page 306
Nous pouvons vrifier que le rsidu est bien stationnaire, il existe donc un risque de
cointgration entre les deux variables.
Test DF Test PP (l = 2)
et Modle [1] Modle [2] Modle [1] Modle [2]
t1 5,39 5,30 5,42 5,31
Nous procdons donc maintenant lestimation du modle correction derreur.

Nous calculons, dabord, le rsidu (provenant du modle prcdent) dcal dune
priode, soit : et1 = yt1 0,55xt1 10,38
Puis nous estimons (par les MCO) le modle :
yt = 1 xt + 2 et1 + u t
yt = 0,610 xt 1,02 et1 +

ut
(3,09) (5,22)
n = 29 ; R 2 = 0,60 ; (.) = t de Student.
Le coefficient (terme de rappel) de et1 est bien significativement ngatif, la repr-

sentation correction derreur est valide.
IV. Gnralisation k variables

La littrature conomique rcente concernant la thorie de lquilibre dmontre
quune srie macro-conomique stationnaire peut tre le rsultat dune combi-
naison de variables non stationnaires, do limportance actuelle de lanalyse de
la cointgration k variables. La gnralisation de deux k variables savre
assez complexe du fait du nombre de possibilits de vecteurs de cointgration
possibles.
A. La cointgration entre k variables

Dans un modle conomtrique k variables explicatives :
yt = 0 + 1 x1t + 2 x2t + . . . + k xkt + t
si les variables ( yt et xkt ) sont non stationnaires, I (1) par exemple, il existe alors
un risque de cointgration. En effet, lexistence dune ventuelle cointgration
implique que les variables doivent tre non stationnaires1. Comme dans le cas
1. Gnralement, en conomie, les variables sont I (1) ; cependant certaines sries financires
peuvent tre de type I (2) .
306 CONOMTRIE
9782100721511-Bourbo-C11.qxd 22/10/14 10:27 Page 307
deux variables, si une combinaison linaire de ces variables est stationnaire,

elles sont alors cointgres. Lestimation par les MCO du modle permet de cal-
culer le rsidu :
0
et = yt 1 x1t . . .
k xkt
Si ce rsidu est stationnaire, nous acceptons lhypothse dune cointgration
entre les variables. Les tests de Dickey-Fuller de stationnarit sur le rsidu doi-
vent seffectuer partir des valeurs critiques tabules par MacKinnon (1991) en
fonction du nombre de variables total du modle. Le vecteur de cointgration est
donn par : [1, 0 , 1 , . . . , k ] .
Cependant, le cas multivari est plus complexe que le cas deux variables du
fait des possibilits combinatoires de cointgration. En effet si, par exemple, les
variables yt , x1t , x2t et x3t sont cointgres par paires yt , x1t C I (1, 1) et x2t ,
x3 C I (1,1) , leur combinaison linaire est I (0).
Nous avons : et1 = yt
0
1 x1t et et2 = x2t
0
1 x3t et par consquent :
et = et1 + et2 = yt
0
1 x1t + x2t
0
1 x3t I (0)
Nous obtenons, dans ce cas de figure, un autre vecteur de cointgration pos-

sible : [1,
0
0 ,
1 , 1,
1 ]. Dune manire gnrale, dans un modle une
variable expliquer et k variables explicatives (soit k + 1 variables au total), il
peut exister k vecteurs de cointgration linairement indpendants. Le nombre
de vecteurs de cointgration linairement indpendants est appel le rang de la
cointgration.
Si les variables sont de mme ordre dintgration I (1) par exemple
lexistence dun seul vecteur de cointgration est possible ; en revanche, si les
sries ne sont pas toutes intgres du mme ordre, nous pouvons tre certains
que le vecteur de cointgration nest pas unique.
De manire pratique, pour tester une ventuelle cointgration entre plusieurs
variables, il convient tout dabord de la tester sur lensemble des k + 1 variables,
puis en cas de cointgration de la tester par combinatoire entre les variables.
B. Estimation du modle correction derreur

La cointgration ayant t rvle par les tests prcdents, deux cas de figure
sont envisager :
il existe un vecteur unique de cointgration,
plusieurs vecteurs de cointgration existent.
Si le vecteur de cointgration est unique, nous pouvons employer les
mthodes destimation envisages la section prcdente, par exemple, celle en
deux tapes de Engle et Granger.

9782100721511-Bourbo-C11.qxd 22/10/14 10:27 Page 308
tape 1 : estimation par les MCO de la relation de long terme et calcul du

rsidu :
0
et = yt 1 x1t . . .
k xkt
tape 2 : estimation par les MCO de la relation du modle dynamique

(court terme) :
yt = 1 x1t + 2 x2t + . . . + k xkt + 1 et1 + u t
Le coefficient 1 (force de rappel vers lquilibre) doit tre, comme dans le

cas une variable explicative, significativement ngatif.
Cependant, le plus souvent, le vecteur de cointgration nest pas unique et la
mthode de Engle-Granger nest plus valide. En effet, les estimateurs des MCO
ne sont plus consistants quels que soient les vecteurs de cointgration. Nous
devons, dans ce cas, faire appel la reprsentation vectorielle correction der-
reur (VECM, Vector Error Correction Model ).
C. Le modle correction derreur vectoriel

Examinons au pralable le cas dun processus VAR(2) k variables sous forme
matricielle :
Yt = A0 + A1 Yt1 + A2 Yt2 +
avec :
Yt : vecteur de dimension (k 1 ) constitu des k variables ( y1t ,y2t . . . ,ykt ) ,
A0 : vecteur de dimension (k 1 ),
Ai : matrice de dimension (k k ).
Ce modle peut scrire en diffrence premire :
Yt Yt1 = A0 + A1 Yt1 Yt1 + A2 Yt2 +
Yt = A0 + (A1 I )Yt1 + A2 Yt2 + [3]
Afin de faire apparatre des diffrences premires droite de lquation, nous

ajoutons et soustrayons A1 Yt2 Yt2 de la manire suivante
Yt = A0 + (A1 I )Yt1 + A1 Yt2 Yt2 A1 Yt2 + Yt2 + A2 Yt2 +
Yt = A0 + A1 Yt1 Yt1 + A1 Yt2 Yt2 A1 Yt2 + Yt2 + A2 Yt2 + [4]
Or Yt1 = Yt1 Yt2 .

En regroupant les termes en Yt1 et aprs simplification, on obtient :
Yt = A0 + (A1 I )Yt1 + (A1 + A2 I )Yt2 + [5]
308 CONOMTRIE
9782100721511-Bourbo-C11.qxd 22/10/14 10:27 Page 309
Cependant, afin de faire figurer les relations de cointgration qui relient

entre elles les variables en niveau dcales dune priode nous cherchons
crire lquation [4] en fonction de Yt1 , soit dans lquation [3] nous pouvons
ajouter et soustraire A2 Yt1 et aprs simplification nous obtenons :
Yt = A0 A2 Yt1 + (A1 + A2 I )Yt1 + [6]
Ou encore :
Yt = A0 + B1 Yt1 + Yt1 + [7]
avec : A2 = B1 et = (A1 + A2 I ).
Ce rsultat peut tre gnralis une reprsentation VAR(p) k variables
sous forme matricielle :
Yt = A0 + A1 Yt1 + A2 Yt2 + . . . + A p Yt p +
avec :
Yt : vecteur de dimension (k 1 ) constitu des k variables (y1t ,y2t . . . ,ykt ) ,
A0 : vecteur de dimension (k 1 ),
Ai : matrice de dimension (k k ).
Ce modle peut scrire en diffrences premires de deux manires :
Yt = A0 + (A1 I )Yt1 + (A2 + A1 I )Yt2 + . . . +
(A p1 + . . . + A2 + A1 I )Yt p+1 + Yt p +
ou encore en fonction de Yt1 :
Yt = A0 + B1 Yt1 + B2 Yt2 + . . . + Bp1 Yt p+1 + Yt1 +
p
Les matrices Bi tant des fonctions des matrices Ai et = Ai I .
i=1
La matrice peut scrire sous la forme = o le vecteur est la force
de rappel vers lquilibre et le vecteur dont les lments sont les coefficients
des relations de long terme des variables. Chaque combinaison linaire repr-
sente donc une relation de cointgration.
Si tous les lments de sont nuls (le rang de la matrice est gal 0 et donc
A p1 + + A2 + A1 = I ) , alors nous ne pouvons pas retenir une spcification
correction derreur, nous estimons un VAR classique en diffrences premires
afin dliminer les tendances. Si le rang de est gal k , cela implique alors que
les variables sont toutes I (0) et le problme de la cointgration ne se pose donc
pas, il convient destimer un modle VAR en niveau.
Si le rang de la matrice (not r) est compris entre 1 et k 1
(1 r k 1) , alors il existe r relations de cointgration et la reprsentation
ECM est valide soit :
Yt = A0 + B1 Yt1 + B2 Yt2 + . . . + Bp1 Yt p+1 + et1 +
avec et = Yt.

9782100721511-Bourbo-C11.qxd 22/10/14 10:27 Page 310
Exemple de spcification : soit un processus VAR(2) trois variables y1,t , y2,t et

y3,t et une relation de cointgration, le VECM scrit alors :
y1,t = a01 + b11 y1,t1 + b21 y2,t1 + b31 y3,t1 + 1 (y1,t1 2 y2,t1 3 y3,t1 0 ) + t1
Nous avons normalis lquation de cointgration par rapport au coefficient

de y1,t .
Selon les caractristiques des donnes traites, ce processus VAR peut
connatre les variantes suivantes :
existence dune constante soit dans la relation de cointgration (0 ) soit
dans le VAR ( a0i ),
existence dune tendance (t = 1,2,. . . ,n ) dans le VAR et/ou dans la rela-
tion de cointgration,
ou encore intgrer des variables exognes de type indicatrice pour corriger
dun mouvement saisonnier.
Sur ce type de modle, nous ne pouvons pas appliquer la mthode des MCO
car nous avons des problmes didentification similaires ceux voqus lors du
chapitre 8 concernant les modles quations simultanes. Il convient dem-
ployer une mthode du maximum de vraisemblance1.
D. Tests de relation de cointgration

Pour dterminer le nombre de relations de cointgration, Johansen (1988) pro-
pose deux tests fonds sur les valeurs propres dune matrice issue dun calcul
en deux tapes :
Etape 1 : calcul de deux rsidus ut et vt
Nous effectuons deux rgressions :
Premire rgression :
0 + A
Yt = A 1 Yt1 + A
2 Yt2 + . . . + A
p Yt p + u t
Deuxime rgression :
+ A
Yt1 = A Yt1 + A
Yt2 + . . . + A
Yt p + vt
0 1 2 p

y1,t
y2,t

Avec Yt = . . .

...
yk,t
1. Johansen, 1988.
310 CONOMTRIE
9782100721511-Bourbo-C11.qxd 22/10/14 10:27 Page 311
Nous avons les mmes variables explicatives, seule la spcification du bloc

de la variable expliquer est modifie.
ut et vt sont donc les matrices des rsidus de dimension (k, n) avec k = nombre
de variables, n = nombre dobservations.
Etape 2 : calcul de la matrice permettant le calcul des valeurs propres
Nous calculons quatre matrices des variances-covariances de dimension
(k, k) partir des rsidus ut et vt.

n
uu = (1/n)
u t u t
t=1

n
vv = (1/n)
vt vt
t=1

n
uv = (1/n)
u t vt
t=1

n
vu = (1/n)
vt u t
t=1
Puis nous extrayons les k valeurs propres de la matrice M de dimension k, k

calcule de la manire suivante :
vv
M= 1 1
vu uu uv
1) Test de la trace
A partir de ces valeurs propres, on calcule une statistique :
k
trace = n Ln (1 i ) avec n = nombre dobservations, i = i me valeur
i =r +1
propre de la matrice M, k = nombre de variables, r = rang de la matrice.
Cette statistique suit une loi de probabilit (similaire un 2 ) tabule
laide de simulations par Johansen et Juselius (1990). Ce test de Johansen fonc-
tionne par exclusion dhypothses alternatives :
rang de la matrice gal 0 (r = 0), soit H0 : r = 0 contre H1 : r > 0 ;
si H0 est refus, on passe au test suivant1 (si trace > la valeur critique lue
dans la table, on rejette H0) ;
si H0 est refus, on passe au test suivant ;
si H0 est refus, on passe au test suivant, etc.
Si, aprs avoir refus les diffrentes hypothses H0 la fin de la procdure,
on teste H0 : r = k 1 contre H1 : r = k et que lon soit amen refuser H0,
alors le rang de la matrice est r = k et il nexiste pas de relation de cointgra-
tion car les variables sont toutes I (0).
Les logiciels dconomtrie fournissent directement lensemble de ces informa-
tions : la statistique trace calcule entre 1 et k ainsi que les valeurs critiques associes.
1. Dans le cas contraire, la procdure est arrte, et le rang de la matrice est r = 0 .

9782100721511-Bourbo-C11.qxd 22/10/14 10:27 Page 312
Pour mener ce test, Johansen propose cinq spcifications concernant soit les
vecteurs cointgrants soit les sries (le VAR proprement dit) :
Absence de tendance linaire dans les donnes (les sries sont toutes DS sans
drive) :
a) Absence dune tendance linaire dans les sries et dune constante dans les
relations de cointgration (la constante dans la relation de long terme est non
significative).
Exemple : y1,t1 = b11 y1,t1 + b21 y2,t1 + b31 y3,t1
+ 1 (y1,t1 2 y2,t1 3 y3,t1 ) + t1
b) Absence dune tendance linaire dans les sries mais prsence dune constan-
te dans les relations de cointgration (la constante dans la relation de long
terme est significative).
Exemple : y1,t = b11 y1,t1 + b21 y2,t1 + b31 y3,t1
+ 1 (y1,t1 2 y2,t1 3 y3,t1 0 ) + t1
Prsence dune tendance linaire dans les donnes (au moins une srie est un
DS avec drive) :
c) Prsence dune tendance linaire dans les sries et dune constante dans les
relations de cointgration.
Ex. : y1,t = a01 + b11 y1,t1 + b21 y2,t1 + b31 y3,t1
+ 1 (y1,t1 2 y2,t1 3 y3,t1 0 ) + t1
d) Prsence dune tendance linaire dans les sries et dans les relations de coin-
tgration (au moins une srie est un TS).
Ex : y1,t = a01 + b11 y1,t1 + b21 y2,t1 + b31 y3,t1
+ 1 (y1,t1 2 y2,t1 3 y3,t1 0 + ct) + t1
Prsence dune tendance quadratique dans les donnes :
e) Prsence dune tendance quadratique dans les sries et dune tendance linai-
re dans les relations de cointgration.
Ex : y1,t = a01 + bt + b11 y1,t1 + b21 y2,t1 + b31 y3,t1
+ 1 (y1,t1 2 y2,t1 3 y3,t1 0 + ct) + t1
Le choix dune de ces spcifications seffectue en fonction des donnes et de la
forme suppose de la tendance (une analyse des proprits stochastiques des
sries ou un simple examen visuel des graphiques permettent de se dterminer).
Le tableau 3 synthtise le choix de la spcification du VECM en fonction de
la typologie des processus.
312 CONOMTRIE
9782100721511-Bourbo-C11.qxd 22/10/14 10:27 Page 313
Tableau 3 Choix de la spcification en fonction du type de processus
Type de processus Spcification

1 2 3 4 5
Tous les processus sont des DS sans drive X X
Au moins un des processus est un DS avec drive X
Au moins un des processus est un TS X
Au moins un processus a une tendance quadratique X
2) Test de la valeur propre maximale
Le deuxime test propos par Johansen est donn par la statistique :

max = nLog(1 r+1 ) r = 0,1,2
Le test seffectue comme prcdemment de manire squentielle par exclu-
sion dhypothses alternatives.
En cas de divergence des deux tests (valeur propre maximum et trace), nous
privilgions le test de la trace dont la puissance est la plus leve.
E. Test dexognit faible

Le test dexognit faible consiste vrifier si les variables sont bien endo-
gnes. Ce test porte sur le coefficient de la force de rappel (sil existe une seule
relation de cointgration) ou les coefficients dans le cas de plusieurs relations
de cointgration. Effectuer un test sur revient vrifier si la relation de coin-
tgration figure dans toutes les quations du modle. Cest un test dexognit
faible des diffrentes variables du systme, pour les paramtres dintrt donns
par la relation de long terme de la matrice = , cest--dire les relations
de cointgration et les poids de ces relations dans chacune des quations du
systme.
Prenons par exemple un VECM deux relations de cointgration :

y1t y1t1 11 12 y1t1
11 21 31
y2t = A y2t1 + 21 22 y2t1
12 22 32
y3t y3t1 31 32 y3t1
Pour tester lexognit de la variable y2t , il convient deffectuer le test dhy-

pothse H0 : 21 = 22 = 0 , si lhypothse H0 est accepte cela signifie que la
force de rappel nintervient dans aucune relation de cointgration et donc que
la variable y2t est faiblement exogne. Dans ce cas nous estimons un VECM par-
tiel en imposant la contrainte 21 = 22 = 0 .

9782100721511-Bourbo-C11.qxd 22/10/14 10:27 Page 314
Ce test est ralis par le calcul de la statistique du ratio de vraisemblance du

modle contraint sous H0 et non contraint.
F. Synthse de la procdure destimation

Nous essayons ici de synthtiser les grandes tapes relatives lestimation dun
modle VECM.
tape 1 : Dtermination du nombre de retards p du modle (en niveau ou en
Log) selon les critres AIC ou SC (cf. chapitre 10).
tape 2 : Estimation de la matrice et test de Johansen permettant de
connatre le nombre de relations de cointgration (les logiciels proposent un cer-
tain nombre de spcifications alternatives, telles que lexistence dun terme
constant dans la relation de cointgration, contraindre A0 = 0 , lexistence dune
tendance dterministe, etc.).
tape 3 : Identification des relations de cointgration, cest--dire des rela-
tions de long terme entre les variables.
tape 4 : Estimation par la mthode du maximum de vraisemblance du
modle vectoriel correction derreur et validation laide des tests usuels :
significativit des coefficients1 et vrification que les rsidus sont des bruits
blancs (test de Ljung-Box), tests dexognit faible.
Enfin, nous pouvons vrifier que lestimation par les MCO de la relation de
long terme fournit des rsultats peu prs similaires (en termes de significativi-
t et de valeurs estimes des coefficients) ceux obtenus par la mthode du
maximum de vraisemblance2.

Tests de cointgration et estimation dun modle vectoriel
correction derreur
Soit trois variables y1t , y2t et y3t observes sur 30 priodes dont les donnes sont
consignes au tableau 3. On demande de tester une ventuelle cointgration et destimer
un modle VAR ou un modle vectoriel correction derreur sil y a lieu.
Solution
Premire tape : dtermination du nombre de retards de la reprsentation VAR en niveau
(la transformation logarithmique ne simpose pas au vue des donnes (cf. graphique 5)
1. videmment on tolre que quelques coefficients ne soient pas significativement de 0.

2. De manire asymptotique, les deux estimateurs sont quivalents
314 CONOMTRIE
9782100721511-Bourbo-C11.qxd 22/10/14 10:27 Page 315
Graphique 5 Reprsentation de y1t , y2t et y3t
Tableau 4 Donnes observes de y1t , y2t et y3t (extrait des donnes)

OBS y1,t y2,t y3,t
1 20,00 20,00 30,00

2 21,39 17,05 31,40

29 26,04 24,61 31,84
30 26,70 23,25 32,22
Le calcul des critres dinformation AIC et SC pour des retards allant de 1 3 nous
nallons pas plus loin compte tenu du faible nombre dobservations ne pose pas de dif-
ficult.
AIC(1) = 2,45 ; SC(1) = 2,88
AIC(2) = 1,93 ; SC(2) = 2,78
AIC(3) = 2,04 ; SC(3) = 3,34
Le retard retenu est donc de 2 (minimum des critres AIC et SC), nous allons donc
procder au test de Johansen sur un VECM(1 ).
Deuxime tape : Test de Johansen
Nous procdons au test de Johansen sous deux hypothses :
a) Existence dune constante dans la relation de long terme et non dans les donnes
(pas de tendance dterministe), spcification b.
Dtaillons ce premier cas.
Premier test : Rang de la matrice gal 0 (r = 0), soit H0 : r = 0 contre H1 : r > 0.
Les trois valeurs propres de la matrice , estime par le maximum de vraisemblan-
ce, sont gales 1 = 0,605 ; 2 = 0,257 ; 3 = 0.139.

9782100721511-Bourbo-C11.qxd 22/10/14 10:27 Page 316

k
Calculons la statistique de Johansen : trace = n Ln (1 i ) pour r = 0 :
i=r+1
trace = n {(Ln (1 1 ) + Ln (1 2 ) + Ln (1 3 ))}
trace = 28 {0,928 + 0,297 + 0,150} = 38,50

Les valeurs critiques sont gales 34,91 pour un seuil de 5 % et 41,07 pour un seuil
de 1 % ; on rejette donc lhypothse H0, le rang de la matrice nest pas 0 (les sries ne
sont donc pas stationnaires).
Rang de la matrice gal 1 (r = 1), soit H0 : r = 1 contre H1 : r > 1.
trace = 28 {0,297 + 0,150} = 12,51
Les valeurs critiques sont gales 19,96 pour un seuil de 5 % et 24,60 pour un seuil
de 1% ; on ne peut pas rejeter lhypothse H0 ni 5 % ni 1 %, on considre donc que
le rang de la matrice est gal 1.
Nous acceptons donc lhypothse dune relation de cointgration.
b) Existence dune constante dans la relation de long terme et dans les donnes, sp-
fication c.
Nous vrifions la robustesse de ce rsultat sur cette autre spcification (compte tenu
des donnes, les autres possibilits sont exclues).
Valeur propre trace Seuil critique 5% Seuil critique 5%
0,603749 37,38888 29,68 35,65

0,229311 11,46904 15,41 20,04
0,138550 4,175870 3,76 6,65
L encore, on constate que le rang de la matrice nest pas 0 (ligne 1), mais quen
revanche, on ne peut pas rejeter lhypothse H0 ni 5 % ni 1 % (ligne 2) dans lhypo-
thse dun rang de la matrice gal 1.
Le test de la valeur propre maximale corrobore les rsultats prcdents :
Hypothesized Max-Eigen 0.05

No. of CE(s) Eigenvalue Statistic Critical Value Prob.**
None * 0.603749 25.91984 21.13162 0.0098
At most 1 0.229311 7.293174 14.26460 0.4550
At most 2 * 0.138550 4.175870 3.841466 0.0410
Lhypothse dune seule relation de cointgration est valide.

- Troisime tape : estimation du modle vectoriel correction derreur
Les deux spcifications prcdentes sont estimes avec ou sans constante dans les
donnes et donc, dans les deux cas, avec une seule relation de cointgration entre y1,t , y2,t
et y3,t .
La premire spcification est rejete du fait que les trois constantes des trois qua-
tions ne sont pas significativement diffrentes de 0.
316 CONOMTRIE
9782100721511-Bourbo-C11.qxd 22/10/14 10:27 Page 317
Lestimation finale du VECM sur 28 observations est donc la suivante :
y1,t = 0,85 (y1,t1 0,87 y2,t1 0,54 y3,t1 + 12,92)

(2,64) (8,9) (7,1) (4,19)
+ 0,77 y1,t1 0,71 y2,t1 0,26 y3,t1
(2,82) (2,61) (1,07)
y2,t = 0,32 (y1,t1 0,87 y2,t1 0,54 y3,t1 + 12,92)

(1,18) (8,9) (7,1) (4,19)
+ 0,10 y1,t1 0,34 y2,t1 0,08 y3,t1
(0,43) (1,44) (0,39)
y3,t = 0,0089 (y1,t1 0,87 y2,t1 0,54 y3,t1 + 12,92)

(0,03) (8,9) (7,1) (4,19)
+ 0,53 y1,t1 0,46 y2,t1 0,25 y3,t1
(2,16) (1,86) (1,13)
Les chiffres entre parenthses sont les t de Student.
Quatrime tape : validation de la reprsentation vectorielle correction derreur

Les coefficients des termes de rappel ont bien le signe attendu (cependant seul le
terme de rappel de lquation est significatif) et les coefficients de la relation de long
terme sont significatifs.
Le fait que seul le coefficient 1 soit significativement diffrent de 0, indique que les
variables y2t et y3t sont faiblement exognes ce qui est confirm par le test de contrainte
portant sur les coefficients de la force de rappel 1 , 2 et 3 :
Cointegration Restrictions :
A(1,1) = 0 A(2,1) = 0 A(3,1) = 0
Not all cointegrating vectors are identified
LR test for binding restrictions (rank = 1) :
Chi-square(1) : 5,557 Chi-square(1) : 1,275770 Chi-square(1) : 0,001005
Probability : 0,0184 Probability : 0,258687 Probability : 0,974714
Nous acceptons lhypothse H0 de nullit pour les coefficients 2 et 3 .

Le VECM partiel est estim en imposant la contrainte 2 = 3 = 0.

9782100721511-Bourbo-C11.qxd 22/10/14 10:27 Page 318
Vector Error Correction Estimates

Sample (adjusted) : 3 30
Standard errors in ( ) & t-statistics in [ ]
Cointegration Restrictions :
A(3,1)=0, A(2,1) = 0
Not all cointegrating vectors are identified
LR test for binding restrictions (rank = 1) :
Chi-square(2) 1.558967
Probability 0.458643
Cointegrating Eq : CointEq1
Y1( 1) 0.997283
Y2( 1) 0.797187
Y3( 1) 0.555922
C 11.94414
Error Correction : D(Y1) D(Y2) D(Y3)
CointEq1 1.187476 0.000000 0.000000
(0.20103) (0.00000) (0.00000)
[ 5.90704] [ NA] [NA]
D(Y1( 1)) 0.813973 0.139232 0.527616
(0.26543) (0.23701) (0.24591)
[3.06663] [ 0.58745] [2.14553]
D(Y2( 1)) 0.715308 0.372227 0.456821
(0.26279) (0.23465) (0.24346)
[ 2.72203] [ 1.58631] [ 1.87634]
D(Y3( 1)) 0.299747 0.097043 0.244642
(0.23644) (0.21113) (0.21906)
[ 1.26773] [ 0.45964] [ 1.11679]
Quelques coefficients du modle ne sont pas significatifs, cela tait probable et ne

remet pas en cause la validit globale du modle.
Enfin, les trois rsidus issus de chaque quation sont des bruits blancs daprs la
Q-statistique de Ljung-Box :
premire quation : Q(12) = 5,87 ( = 0,92) Acceptation de H0 ;
deuxime quation : Q(12) = 4,60 ( = 0,97) Acceptation de H0 ;
troisime quation : Q(12) = 5,99 ( = 0,92) Acceptation de H0 ;
La spcification VECM est donc valide.
318 CONOMTRIE
9782100721511-Bourbo-C12.qxd 22/10/14 10:28 Page 319
12. Introduction
lconomtrie
des variables
qualitatives
N
ous avons, lors des chapitres prcdents (chapitre 3, partie 5), uti-
lis des variables explicatives particulires appeles variables
dichotomiques1, dont la caractristique est de prendre deux
valeurs 0 ou 1. Leurs utilisations ne posent aucun problme en tant que
variable explicative, en revanche lorsquelles sont utilises en tant que
variable expliquer la mthode des moindres carrs ordinaires est
dfaillante.
Dans ce chapitre, qui constitue une simple introduction2 lconomtrie
des variables qualitatives, nous allons donc aborder, dans une premire
partie, la problmatique particulire de lconomtrie des variables qua-
litatives et les problmes rencontrs dans ce type de modlisation. Puis
nous prsentons les modles spcifiques lorsque la variable expliquer
est binaire tels que : dcision dacheter ou de ne pas acheter un produit,
risque de dfaillance de paiement, obtenir un diplme, .... Il sagit des
modles choix binaires (Probit et Logit).
Puis, dans une troisime partie, nous abordons les modles choix mul-
tiples (pour quel candidat voter, quel moyen de transport adopter, ..).
Enfin, la quatrime partie est consacre aux variables tronques et cen-
sures.
1. Les termes de variables indicatrices, binaires, muettes, ou dummy sont aussi utiliss.
2. Pour des dveloppements, nous recommandons au lecteur de se rfrer au livre de Thomas A.
conomtrie des variables qualitatives , Dunod, 2002.
Introduction lconomtrie des variables qualitatives 319

9782100721511-Bourbo-C12.qxd 22/10/14 10:28 Page 320
I. Les problmes et les consquences

de la spcification binaire
Le recours des modles et des mthodes destimation spcifiques lorsque la
variable endogne est qualitative (dichotomique ou choix multiples) est li au
fait que le modle linaire gnral ne peut pas sappliquer dans ce contexte.
Prenons lexemple dun modle de rgression simple permettant de relier le
fait dtre, pour un individu i , propritaire dun logement son revenu :
yi = a0 + a1 xi + i i = 1,...,n [1]
avec :
yi = une variable endogne (variable expliquer) qui prend les valeurs 1 si lin-
dividu i est propritaire de son logement et 0 dans le cas contraire,
xi = une variable exogne (variable explicative) qui reprsente le revenu en
euros de lindividu i ,
i = lerreur de spcification du modle,
a0 et a1 = les paramtres estimer.
Ce modle, appel aussi modle probabilit linaire, prsente les propri-
ts suivantes.
a) En faisant lhypothse classique de lesprance de lerreur nulle :
E(i ) = 0 , alors E(yi ) = a0 + a1 xi .
b) La valeur prvue de la variable expliquer yi peut sinterprter de la

manire suivante :
Soit Pi = Prob(yi = 1) , do Prob(yi = 0) = 1 Pi
E(yi ) = 1 Prob(yi = 1) + 0 Prob(yi = 0) = Pi
Soit : Pi = a0 + a1 xi i , do le nom du modle.

c) La variable yi ne pouvant prendre que deux valeurs (0 et 1), par voie de
consquence, lerreur ne peut donc prendre que deux valeurs :
i = 1 (a0 + a1 xi ) avec la probabilit Pi
i = (a0 + a1 xi ) avec la probabilit 1 Pi
320 CONOMTRIE
9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 321
La variance de lerreur est donne par :

Var(i ) = E(i2 ) = Pi (valeur de i si yi = 1)2 + (1 Pi ) (valeur de i si
yi = 0)2 .
Do : Var(i ) = E(i2 ) = Pi (1 a0 a1 xi )2 + (1 Pi ) (a0 a1 xi )2

Or Pi = a0 + a1 xi
Var(i ) = E(i2 ) = Pi (1 Pi )2 + (1 Pi ) (Pi )2 [2]
Soit : Var(i ) = E(i2 ) = Pi (1 Pi ) [3]
Examinons les problmes soulevs par lapplication dune mthode des

moindres carrs ordinaires afin destimer ce modle.
a) Dans lquation [1], le codage de la variable endogne (0 ou 1) est tota-
lement arbitraire, par exemple si nous prenions un codage sous la forme (0 ou
10) les valeurs estimes des coefficients ak seraient videmment diffrentes
(10 ak ) .
Un examen graphique (cf. graphique 1) de la srie expliquer (yi ) et de la
srie ajuste ( yi ) illustre parfaitement la non adquation de lestimation linaire
des paramtres par la mthode des moindres carrs.
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59
y y ajuste
Graphique 1 Srie brute (yi ) et de la srie ajuste ( yi )

9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 322
b) Puisque lerreur ne peut prendre que deux valeurs, elle suit donc une loi
discrte, lhypothse de normalit des erreurs nest donc pas vrifie.
c) Daprs la relation [3] : E(i2 ) = Pi (1 Pi ) , il existe de fait une ht-
roscdasticit. Cependant nous ne pouvons pas appliquer la mthode des
moindres carrs gnraliss car Pi dpend des paramtres a0 et a1 du modle.
d) Enfin, nous devons imposer une contrainte au modle : 0 Pi =
a0 + a1 xi 1 qui peut se rvler non compatible avec les donnes.
Tous ces lments indiquent clairement que nous sommes dans limpossibi-
lit dutiliser la mthode des moindres carrs ordinaires.
II. Les modles de choix binaires

Les modles de choix binaires (ou encore appels modles dichotomiques) sont
utiliss dans des secteurs trs divers ds que la variable expliquer ne peut
prendre que deux modalits, par exemple :
mdecine : gurison ou non gurison,
marketing : achat ou non achat,
finance : remboursement du prt ou non remboursement, dfaillance dune
entreprise ou non dfaillance,
science politique : rpondre oui ou non un rfrendum, voter pour X ou
Y une lection,
sociologique : russir ou rater un examen,
etc.
Dans un modle de choix binaire, nous cherchons modliser une alterna-
tive ( yi = 0 ou 1) et donc estimer la probabilit Pi associe lvnement
(yi = 1) .
A. Le modle linaire sur variable latente

Les variables latentes sont une premire rponse aux problmes lis lutilisa-
tion des moindres carrs ordinaires dans un modle dont la variable expliquer
est binaire.
Quest-ce quune variable latente ? Il sagit dune variable continue non
observable et reprsentative du phnomne tudi. Par exemple la richesse dun
individu peut tre explique par le fait quil soit propritaire ou non de son
appartement.
322 CONOMTRIE
9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 323
On introduit donc la variable latente yi (la richesse) et on suppose que :

1) lindividu i est propritaire si sa richesse est suffisante, soit yi = 1 si
yi > 0
2) yi est une fonction linaire des xi , yi = a0 + a1 xi + i .
La variable expliquer binaire yi est alors dfinie par le modle de dcision
suivant :

yi = 1 si yi > 0
yi = 0 si yi 0
Intuitivement, cette rgle de dcision consiste simplement supposer que la pro-
portion des (yi = 1) est leve pour a0 + a1 xi + i > 0 .
Soit Pi la probabilit que yi > 0 .
Pi = Prob(yi = 1) = Prob(yi > 0) = Prob(a0 + a1 xi + i > 0)
= Prob(i > (a0 + a1 xi ))
Si la distribution de i est centre par rapport la moyenne, nous avons
lquivalence :
Prob(i > (a0 + a1 xi )) = Prob(i < a0 + a1 xi )
Soit : Pi = Prob(yi = 1) = Prob(i < a0 + a1 xi )
Lensemble de ces rsultats peut tre gnralis dans le cas dun modle
plusieurs variables.
La probabilit Pi dpend ainsi de la distribution du terme de lerreur i du
modle de dcision, nous pouvons alors distinguer deux cas :
le modle Probit si la fonction de rpartition de lerreur suit une loi nor-
male,
le modle Logit si la fonction de rpartition de lerreur suit une loi de type
logistique.
B. Les modles Probit et Logit

Dans un modle Probit la fonction de rpartition de lerreur i est donne par :
a0 +a1 xi
1 2
Pi = et /2 dt
2
Il sagit dune loi normale centre et rduite N (0,1) .

La fonction logistique Logit model ou encore appele courbe en S est
donne par lexpression suivante :

9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 324
Pi = Prob(yi = 1) = Prob(yi > 0) = Prob(a0 + a1 xi + i > 0)

= Prob(i > (a0 + a1 xi )) = (a0 + a1 xi )
avec (.) la fonction de rpartition de la loi logistique.

exp(a0 + a1 xi ) 1
Pi = (a0 + a1 xi ) = =
1 + exp(a0 + a1 xi ) 1 + exp((a0 + a1 xi ))
Les proprits de cette quation sont les suivantes, si 1 > 0 :
Lim Pi 1 et Lim Pi 0 , ce qui assure bien que les valeurs de Pi sont
xi xi
comprises entre 0 et 1, comme lillustre le graphique 2.
1,00
Pi
0,50
0,00
xi
Graphique 2 La fonction logistique
Nous pouvons observer, aprs une transformation analogue celle de lexer-

cice 2 du chapitre 6, que la fonction Logit scrit :

Pi Pi
Ln = y = a0 + a1 xi + i avec

la probabilit relative du
1 Pi i
1 Pi
choix yi = 1 .
Ces spcifications peuvent tre gnralises dans le cas de plusieurs
324 CONOMTRIE
9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 325
Lestimation des paramtres des modles Probit ou Logit est effectue lai-
de des algorithmes de maximisation dune fonction log-vraisemblance1. Quels
que soient les modles retenus (Probit ou Logit) les rsultats destimation sont
relativement proches, cependant les coefficients estims ne sont pas directement
comparables.
C. Interprtation des rsultats et tests statistiques

Contrairement aux modles linaires estims par la mthode des moindres car-
rs ordinaires pour lesquels les coefficients ont des interprtations conomiques
immdiates en termes de propension marginale, les valeurs des coefficients des
modles ne sont pas directement interprtables. Seuls les signes des coefficients
indiquent si la variable agit positivement ou ngativement sur la probabilit Pi.
Cependant, il est possible de calculer les effets marginaux2 afin de connatre
la sensibilit de la variation dune variable explicative sur la probabilit Pi.
La significativit des coefficients est apprcie laide des ratios appels z -
Statistique car la distribution des rapports du coefficient sur son cart type ne
suit pas une loi de Student, comme dans le modle linaire gnral, mais une loi
normale. Cette z -Statistique sinterprte de manire classique partir des pro-
babilits critiques et permet la tenue de tous les tests de significativit concer-
nant les coefficients.
Afin de tester lhypothse : H0 : a1 = a2 = a3 = . . . = ak = 0 , nous utilisons
le ratio du Log vraisemblance. Soit la statistique suivante :
L R = 2(Ln(L R ) Ln(L U )) avec L R = valeur de la fonction du Log-
vraisemblance contrainte sous H0 et L U = valeur de la fonction du Log-
vraisemblance non contrainte.
L R suit, sous lhypothse nulle H0, une distribution dun 2 k degrs de
libert. Si la statistique L R est suprieure au 2 lu dans la table pour un seuil
dtermin, gnralement de 5 %, alors nous refusons lhypothse H0, le modle
estim comporte au moins une variable explicative de significative.
Compte tenu de la caractristique de la variable expliquer code en 0 ou 1,
le coefficient de dtermination R 2 nest pas interprtable en termes dajustement
du modle, cest pourquoi on utilise une statistique appele le pseudo- R 2 don-
Log(Lu)
ne par : R 2 = 1 .
Log(L R )
1. Cf. Thomas A. conomtrie des variables qualitatives , Dunod, 2002, pages 56-57.
2. Cf. Thomas A. (2002), pages 60-61.

9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 326
Exercice n 1
fichier C12EX1
Estimation des modles Probit et Logit binaires explicatifs des fac-

teurs de la russite en Licence
Nous avons relev sur un chantillon de 60 tudiants inscrits en dernire anne de
Licence dconomie, les variables suivantes susceptibles dexpliquer la russite ou
lchec lexamen de Licence (variable REUSSITE = 0 si chec, 1 sinon) :
NENFANTS = variable discrte reprsentant le nombre de frres et soeurs de ltu-
diant,
NECONO = la note dconomtrie sur 20 obtenue en Licence,
NMICRO = la note de micro-conomie sur 20 obtenue en Licence,
GENRE = variable muette, (1 = masculin, 0 = fminin).
Un extrait des donnes est prsent dans le tableau 1.
Tableau 1 Extrait de donnes
OBS REUSSITE NENFANTS NECONO NMICRO GENRE

1 0 2 3,6 0 1
2 0 5 3,8 0 1

59 1 0 16,2 12 0
60 1 2 17 4 0
On demande :
1) destimer un modle de type Logit permettant de prvoir la probabilit de russite
dun tudiant en Licence,
2) de comparer les rsultats avec un modle de type Probit et le modle linaire gn-
ral,
3) de donner la probabilit de russite, laide du modle Logit estim, pour un tu-
diant dont les caractristiques sont les suivantes : NENFANTS = 1 ; NECONO = 12 ;
NMICRO = 13,5 ; GENRE = masculin.
Solution
1) Une premire estimation dun modle Logit, conduit aux rsultats suivants :
326 CONOMTRIE
9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 327
Dependent Variable : REUSSITE

Method: ML Binary Logit
Variable Coefficient Std. Error z-Statistic Prob.

NENFANTS 0.682523 0.378870 1.801470 0.0716
NECONO 0.632062 0.239564 2.638382 0.0083
GENRE 3.761718 1.437068 2.617633 0.0089
NMICRO 0.155322 0.188916 0.822173 0.4110
C 3.265634 2.020060 1.616602 0.1060
la lecture des rsultats, nous constatons que :

la variable NMICRO une probabilit critique de 0,41, elle nest donc pas signifi-
cative,
la variable NENFANTS une probabilit critique de 0,07, elle est donc faiblement
significative.
Nous procdons une nouvelle estimation en retirant la variable NMICRO dont le
coefficient nest pas significativement diffrent de 0.
Les rsultats complets fournis par Eviews sont les suivants :


NENFANTS 0.746742 0.378942 1.970596 0.0488
NECONO 0.695857 0.231789 3.002112 0.0027
GENRE 3.634605 1.410945 2.576008 0.0100
C 2.859277 1.910377 1.496708 0.1345
Mean dependent var 0.516667 S.D. dependent var 0.503939
Log likelihood 15.37669 Hannan-Quinn criter. 0.700504
Restr. log likelihood 41.55549 Avg. log likelihood 0.25627
LR statistic (3 df) 52.35761 McFadden R-squared 0.629972
Probability(LR stat) 2.51E 11
Obs with Dep=0 29 Total obs 60
Obs with Dep=1 31
Avec : L U = Log likelihood ; L R = Restr. log likelihood ; L R = L R statistic ;

L U /n = Avg. log likelihood. Le critre dinformation de Hannan-Quinn permet des
comparaisons entre les modles (comme les critres de Akaike ou Schwarz) en termes
darbitrage : apport dinformation li lajout de variables explicatives et perte de degrs
de libert. En cas de modle concurrent, celui ayant le plus faible critre dinformation
sera retenu.

9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 328
a) Interprtation statistique
Les coefficients sont tous significativement diffrents de 0, hormis le terme constant.
La statistique de la Log vraisemblance est gale L R = 52,35 que lon compare
0,95
un 2 lu dans la table un seuil de 0,95 % et 3 degrs de libert, 32 = 9,28 < 52,35
rejet de H0.
Le pseudo-R 2 est donn par :
Log(Lu) 15,38
R2 = 1 =1 = 1 0,37 = 0,63
Log(L R ) 41,56
Le modle est valid sur le plan statistique.
Le logiciel Eviews propose une table permettant dapprhender les qualits prvi-
sionnelles du modle sur lchantillon en comparant la probabilit estime pour un indi-
vidu i dtre yi = 1(P(Dep = 1)) au seuil arbitraire de 50 % la valeur observe des
yi = 0 ou 1.

Prediction Evaluation (success cutoff C = 0.5)
Estimated Equation Constant Probability
Dep = 0 Dep = 1 Total Dep = 0 Dep = 1 Total
P(Dep =1) <= C 26 4 30 0 0 0
P(Dep =1) > C 3 27 30 29 31 60
Total 29 31 60 29 31 60
Correct 26 27 53 0 31 31
% Correct 89.66 87.10 88.33 0.00 100.00 51.67
% Incorrect 10.34 12.90 11.67 100.00 0.00 48.33
Total Gain* 89.66 12.90 36.67
Percent Gain** 89.66 NA 75.86
Ici, pour les individus (29) pour lesquels yi = 0, le modle indique que 26 individus
ont une probabilit estime de russite infrieure 50 %. Dans 89,66 % des cas, les
checs sont donc correctement prvus.
Pour les individus (31) pour lesquels yi = 1, le modle indique que 27 individus ont
une probabilit estime suprieure 50 %. Dans 87,10 % des cas, les russites sont cor-
rectement prvues.
Le taux derreur est donc faible.
b) Interprtation conomique
Le modle scrit :

Pi
Ln = 0,75 NENFANTS + 0,70 NECONO 3,63 GENRE 2,86 + ei
1 Pi (1,97) (3,00) (2,57)
(.) = z-Statistique
ei = Rsidu destimation
Le nombre de frres et soeurs du foyer agit ngativement, les tudiants issus de
familles nombreuses ont un taux de russite plus faible.
La note dconomtrie est un facteur positif de russite.
328 CONOMTRIE
9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 329
Enfin, les tudiants de genre masculin russissent en gnral moins bien (signe
ngatif) que les tudiants de genre fminin.
2) Estimation dun modle Probit et du modle linaire gnral
a) Lestimation dun modle Probit conduit aux rsultats suivants :

NENFANTS 0.428197 0.219223 1.953247 0.0508
NECONO 0.363148 0.110230 3.294454 0.0010
GENRE 1.824203 0.650426 2.804629 0.0050
C 1.491466 1.108767 1.345157 0.1786
Les valeurs des coefficients sont de mme signe mais diffrentes par rapport au
modle Logit car la spcification nest pas la mme. Cependant, nous pouvons retrouver,
approximativement, les valeurs estimes du modle Logit en multipliant chacun des
coefficients des variables explicatives par la constante1 3 1,81.
b) Sans tenir compte des spcificits du modle variable expliquer binaire et en
utilisant une mthode (non approprie) des moindres carrs avec correction pour ht-
roscdasticit, nous obtenons les rsultats suivants :

White HeteroskedasticityConsistent Standard Errors & Covariance
NENFANTS 0.078499 0.037854 2.073727 0.0427
NECONO 0.066672 0.016580 4.021299 0.0002
GENRE 0.295568 0.092934 3.180407 0.0024
C 0.217243 0.235111 0.924003 0.3594
R-squared 0.611335 F-statistic 29.36094
Les coefficients sont affects du mme signe que dans les modles Probit et Logit,
cependant le graphique des valeurs ajustes (cf. graphique 3) indique que les valeurs sont
parfois ngatives ou suprieures 1 ce qui est videmment incompatible avec la valeur
dune probabilit.
1. Une littrature abondante concerne la comparaison entre les modles Probit et Logit, cf.
Amemiya T., 1981.

9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 330
1,4
1,2
0,8
0,6
0,4
0,2
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59
0,2
0,4
Srie brute Srie ajuste Borne1
Graphique 3 Sries brute et ajuste de la variable binaire Russite
3) Soit les caractristiques de ltudiant : NENFANTS = 1 ; NECONO = 12 ;

NMICRO = 13,5 ; GENRE = masculin.
Le modle Logit estim (la note de micro-conomie ne figurant pas dans le modle
final, elle nest pas intgre dans le calcul, cf. question 1) est le suivant :

Pi
Ln = 0,75 NENFANTS + 0,70 NECONO 3,63 GENRE 2,86 + ei
1 Pi (1,97) (3,00) (2,57)

Pi
Ln = 0,75 1 + 0,70 12 3,63 1 2,86 = 1,109
1 Pi

Pi
= e1,109 = 3,033 Pi = 3,033/(1 + 3,033) = 0,75
1 Pi
La probabilit de russite de cet tudiant de licence est donc de 75 %.
III. Les modles choix multiples

Les modles choix multiples sont une gnralisation des modles binaires.
Dans ces modles la variable expliquer, qualitative, nest donc plus binaire (0
ou 1), mais multinomiale (ou polytomique) comme par exemple :
330 CONOMTRIE
9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 331
le choix lors dun vote entre quatre candidats,

la possibilit pour un bachelier de choisir de sinscrire dans une prpara-
tion aux concours des coles, luniversit, dans un IUT, dans un BTS,
appartenir une classe de revenu,
etc.
Nous diffrencions, en fonction du type de la variable expliquer, les
modles ordonns et les modles non ordonns.
A. Les modles Probit et Logit ordonns

Dans un modle ordonn, les modalits de la variable expliquer sont hirar-
chises. Elles indiquent lappartenance de lindividu une classe ou une cat-
gorie, par exemple lappartenance une tranche de revenu.
Nous pouvons distinguer deux classes de modles choix multiples ordon-
ns en fonction de la variable expliquer qui est issue, soit dune discrtisa-
tion dune variable continue telle que lappartenance une tranche de salaire,
soit directement dune appartenance une catgorie (faire du sport : une fois par
semaine, une fois par mois, une fois par an, ).
Comme pour le modle de choix binaire nous modlisons1 une variable
latente continue :
yi = a0 + a1 xi + i .
Les valeurs prises par la variable yi correspondent des intervalles dans les-
quels se trouve yi dfinissant ainsi le modle de dcision suivant M + 1 moda-
lits :
yi = 0 si yi c1

yi = 1 si c1 < yi c2

yi = 2 si c2 < yi c3

.. ..

. = .

yi = M si c M < yi
Soit Pi la probabilit dapparition de chaque vnement pour lindividu i :
Pi0 = Prob(yi = 0) = (c1 (a0 + a1 xi ))

Pi1 = Prob(yi = 1) = (c2 (a0 + a1 xi ) (c1 (a0 + a1 xi ))
Pi2 = Prob(yi = 2) = (c3 (a0 + a1 xi ) (c2 (a0 + a1 xi ))
...
Pi M = Prob(yi = M) = 1 (c M (a0 + a1 xi ))
1. Afin dallger lcriture nous ne faisons figurer quune seule variable explicative, la gnralisa-
tion k variables ne pose aucun problme comme lillustre lexercice n2.

9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 332
Avec la fonction de rpartition de la loi de probabilit normale ou logis-

M
et
tique (t) = et Pi = 1
1 + et i=0
Comme pour le modle de choix binaire, le recours une fonction de rpar-
tition normale, permet de dfinir un modle de type Probit et une fonction de
rpartition de type logistique permet de dfinir un modle Logit. Lestimation de
tous les paramtres, les coefficients de rgression ( ai ) et les valeurs des seuils
(ci ) des modles ordonns (Probit ou Logit) est effectue laide des algo-
rithmes de maximisation dune fonction de Log-vraisemblance dfinie par les
Pi j .
Les valeurs des coefficients des modles ne sont pas directement interpr-
tables en termes de propension marginale, seuls les signes des coefficients indi-
quent si la variable agit positivement ou ngativement sur la variable latente.
Les rsultats destimation sapprcient de la mme manire que pour les
modles de choix binaires :
la significativit des coefficients laide des ratios z -Statistique,
la significativit globale de lajustement (lhypothse : H0 : a1 = a2 = a3
= . . . = ak = 0) par la statistique L R = 2(Ln(L R ) Ln(L U )) qui suit,
sous lhypothse nulle H0, une distribution dun 2 k degrs de libert.
Log(Lu)
Le pseudo- R 2 est donn par : R 2 = 1 .
Log(L R )
Exercice n 2
fichier C12EX2
Estimation dun modle choix multiples de prvision des ventes

La socit Tl-Ventes (ventes par tlphone lors dune mission la tlvision)
dsire estimer le niveau des ventes par article pour chaque mission afin de dimension-
ner la charge de lentrept et prvoir ainsi le nombre dquipes.
Lmission est diffuse tous les jours sauf le dimanche. Les ventes sont rparties en
trois classes : faible, moyenne, forte.
Lobjectif est destimer un modle permettant de prvoir quelle classe de vente
(faible, moyenne, forte) appartient un article prsent lors dune mission. Pour ce faire,
on dispose des informations suivantes sur 82 missions passes :
VENTES : classe de larticle (faible = 0, moyenne = 1, forte = 2 ),
WE : variable indicatrice du type de jour de diffusion de lmission (1 les jours de
semaine, 0 le samedi),
EXPO : temps dexposition du produit en minutes,
REDUC : % de rduction propos sur le prix,
DIRECT = variable indicatrice dmission enregistre (0 pas direct, 1 direct).
Un extrait des donnes est prsent dans le tableau 2.
332 CONOMTRIE
9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 333

Obs VENTES WE EXPO REDUC DIRECT
1 0 1 3,5 0,20 0
2 1 0 3,5 0,20 0

81 0 1 7 0 0
82 0 1 3,5 0 0
1) On demande destimer un modle Logit multinomial permettant de prvoir la classe

de vente dun article partir des facteurs explicatifs proposs.
2) Deffectuer une prvision pour un article prsent lors dune mission en diffr dif-
fuse en semaine dont le temps dexposition est de 7 minutes et sans rduction.
Solution
1) Une premire estimation laide dun modle de type Logit conduit au rsultat
suivant :
Dependent Variable : VENTES

Method: ML Ordered Logit (Quadratic hill climbing)
Coefficient Std. Error z-Statistic Prob.
DIRECT 0.226809 1.325269 0.171142 0.8641
EXPO 0.644804 0.150121 4.295228 0.0000
REDUC 8.922215 2.759073 3.233772 0.0012
WE 1.395159 0.512093 2.724426 0.0064
Nous constatons que la variable DIRECT dont le coefficient est affect dune proba-
bilit critique de 0,86 nest pas significative (les tlspectateurs ne sont pas sensibles aux
missions diffuses en direct), elle est donc retire du modle. La nouvelle estimation est
alors la suivante.

EXPO 0.641023 0.148189 4.325700 0.0000
REDUC 8.982926 2.735164 3.284237 0.0010
WE 1.377785 0.500824 2.751038 0.0059
Limit Points
LIMIT_1:C(4) 3.679581 0.994565 3.699689 0.0002
LIMIT_2:C(5) 6.170926 1.174856 5.252497 0.0000
Akaike info criterion 1.605306 Schwarz criterion 1.752057
Log likelihood 60.81754 Hannan-Quinn criter. 1.664224
Restr. log likelihood 79.48219 Avg. log likelihood 0.74167
LR statistic (3 df) 37.32930 LR index (Pseudo-R2) 0.234828
Probability(LR stat) 3.92E-08

9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 334
Les coefficients sont maintenant tous significativement diffrents de 0 (probabilits
critiques infrieures 0,05).
La statistique de la Log vraisemblance est gale L R = 37,33 0,95
que lon compare un
2 lu dans la table un seuil de 0,95 % et 3 degrs de libert, 32 < 37,33 rejet
de H0.
Le modle est donc valid sur le plan statistique.
La dure dexposition et le pourcentage de rduction agissent positivement sur les
ventes.
Une mission diffuse un jour de semaine engendre moins de ventes quune mis-
sion diffuse le samedi.
Les seuils c1 et c2 sont respectivement de 3,679 et 6,170.
Les signes des coefficients sont conformes lintuition conomique.
Le logiciel Eviews propose une table permettant dapprhender les qualits prvi-
sionnelles du modle sur lchantillon :

Prediction table for ordored dependent variable
Count of obs Sum of all
Value Count with Max Prob Error Probabilities Error
0 44 47 3 44.381 0.381
1 27 31 4 26.834 0.166
2 11 4 7 10.785 0.215
la lecture des rsultats, nous constatons que les qualits prvisionnelles de ce

modle sont satisfaisantes car le taux derreur est assez faible pour les ventes de niveau
0 et 1. En revanche, pour les ventes de niveau 2 (forte) nous constatons que sur 11 ventes
ralises, le modle en a prvues correctement seulement 4.
Enfin pour chaque individu Eviews indique :
VENTES_0_0 = la probabilit associe la modalit 0,

I_VENTES_0 = la ralisation de lestimation de la variable latente.
Un exemple est donn1 pour les cinq premires ventes :
1. Un exemple de calcul est dtaill lors de la rponse la question 2.
334 CONOMTRIE
9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 335
obs VENTES VENTES_0_0 VENTES_1_0 VENTES_2_0 I_VENTES_0

1 0 0.7342647 0.2366418 0.0290935 2.663212
2 1 0.4106169 0.4831615 0.1062216 4.040996
3 0 0.4106169 0.4831615 0.1062216 4.040996
4 2 0.4106169 0.4831615 0.1062216 4.040996
5 1 0.7342647 0.2366418 0.0290935 2.663212
2) Nous calculons lestimation de la variable latente correspondante aux caractristiques

de lmission avec EXPO = 7, REDUC = 0 et WE = 1 :
y = 0,641 EXPO + 8,982 REDUC 1,377 WE
y = 0,641 7 + 8,982 0 1,377 1 = 3,109

Puis nous calculons les probabilits :

P1 = Prob(yi = 0) = (c1 xi a) = (3,679 3,109)
e0,57
= (0,57) = = 0,639
1 + e0,57
P2 = Prob(yi = 1) = (c2 xi a)
(c1 xi a)
= (6,17 3,109) 0,639
e3,06
P2 = (3,06) 0,639 = 0,639 = 0,955 0,639 = 0,31
1 + e3,06
P3 = Prob(yi = 2) = 1 (6,17 3,109) = 1 0,955 = 0,045
Soit les rsultats suivants :
VENTES = 0 VENTES = 1 VENTES = 2

Pi 0,639 0,316 0,045
Les ventes de lmission prvue ont 64% de probabilit dappartenir la classe 0 de

faible vente.
B. Le modle de choix multiples non ordonn :

le Logit multinomial
Dans les modles non ordonns la variable expliquer reprsente les possibili-
ts de choix dun individu parmi M + 1 possibilits et donc ses prfrences,
cest pourquoi on les dnomme aussi modle utilits alatoires.
Soit lutilit1 de lindividu i pour la possibilit j ( j = 0,1,...,M) :
Ui j = a0 + a1 xi + i
1. Afin dallger lcriture nous ne faisons figurer quune seule variable explicative, la gnralisa-
tion k variables ne pose aucun problme.

9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 336
La dcision yi = j est retenue si Ui j = Max(Ui0 ,Ui1 ,. . . ,Ui M ) .

La loi des utilits peut tre normale (Probit multinomial) ou log-normale
(Logit multinomial).
Dans le cas le plus frquent dun modle Logit multinomial M + 1 moda-
lits, la probabilit du choix j pour lindividu i est donne1 par :
exp(xi a j ) 1
Prob(yi = j) = =

M
M
exp(xi ak ) 1+ exp(xi (ak a j )
k=0 k=0
k=
/j
Avec xi le vecteur des caractristiques de lindividu i et a j le vecteur carac-

tristique de la modalit j .
Dans un modle Logit multinomial, la probabilit dapparition de la j me
modalit dpend de la diffrence ak a j , nous pouvons donc poser sans restric-
tion a0 = 0.
Par exemple, prenons le cas dun individu i qui a trois choix ( M = 2 ), les
probabilits scrivent :
1
Prob(yi = 0) =
1 + exp(x (a1 a0 )) + exp(xi (a2 a0 ))

i
1
Prob(yi = 1) =
1 + exp(xi (a0 a1 )) + exp(xi (a2 a1 ))
1
Prob(yi = 2) =
1 + exp(xi (a0 a2 )) + exp(xi (a1 a2 ))

2
Or, par construction Pi = 1 et comme nous avons pos la contrainte
i=0
a0 = 0 , nous pouvons estimer les deux paramtres a1 et a2 qui sinterprtent
comme tant des carts par rapport au paramtre a0.
Une autre caractristique fondamentale du Logit multinomial rside dans la
proprit dindpendance par rapport aux autres vnements du rapport des
deux probabilits associes deux possibilits j et k :
Prob(yi = j) exp(xi a j )
= = exp(xi (a j ak ))
Prob(yi = k) exp(xi ak )
Ce rapport est indpendant des possibilits autres que j et k , cette hypothse

sappelle lindpendance des alternatives non pertinentes Independance of
1. Cf. Thomas A. (2002), pages 92-93.
336 CONOMTRIE
9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 337
Irrelevant Alternative . Cette proprit est vrifie1 si le fait de changer len-

semble des choix (par exemple ajouter une possibilit) ne modifie pas les ratios
de chances.
Lestimation des paramtres du modle est effectue laide des algorithmes
de maximisation de la fonction log-vraisemblance. Les valeurs des coefficients
ne sont pas directement interprtables en termes de propension marginale, seuls
les signes des coefficients indiquent si la variable agit positivement ou ngati-
vement sur la probabilit relative de choisir j plutt que 0.
Les rsultats destimation sapprcient de la mme manire que pour les
autres modles :
la significativit des coefficients laide des ratios z -Statistique,
la significativit globale de lajustement (lhypothse : H0 : a1 = a2 = a3
= . . . = ak = 0) par la statistique L R = 2(Ln(L R ) Ln(L U )) qui suit,
sous lhypothse nulle H0, une distribution dun 2 k degrs de libert.
Log(Lu)
Le pseudo- R 2 est donn par : R 2 = 1 .
Log(L R )
IV. Les modles variable dpendante

limite : le modle Tobit
Dans les modles variable dpendante limite ( limited dependent variable
models ) les valeurs de la variable expliquer continue ne sont observables que
sur un intervalle donn. Par exemple :
La demande dun produit nest connue (les ventes observes) que si le
magasin possde ce produit en stock, au-del la demande non satisfaite (les
ventes perdues) est inconnue.
Le salaire dun jeune diplm nest observable que si il travaille (salaire
> 0 ).
Lors dune enqute sur les dpenses relatives lachat de biens dquipe-
ment, seules les dpenses des mnages ayant effectivement achet un bien
dquipement sont prises en compte.
etc.
Le recours lconomtrie des variables qualitatives se justifie par lestima-
tion de la probabilit que la variable expliquer se trouve lintrieur de lin-
tervalle pour lequel elle est observable. Ces modles, appels modle Tobit par
rfrence J. Tobin2, ont connu beaucoup dextensions, nous pouvons citer :
1. Cf. Thomas A. (2002), pages 101-103.

2. Tobin J. (1958).

9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 338
le modle censur et le modle tronqu (modle Tobit simple) qui font

seuls lobjet dune prsentation dans le cadre de ce manuel,
le modle de slection (modle Tobit gnralis),
le modle avec censure et slection.
A. Le modle Tobit simple :

modle de rgression tronqu ou censur
Dfinitions prliminaires :
Une distribution est tronque si les valeurs de la variable expliquer et des

variables explicatives ne sont pas observables lorsque les valeurs de la
variable expliquer dpassent un intervalle.
Une distribution est censure si seules les valeurs de la variable expliquer
ne sont pas connues lorsquelles sortent dun intervalle.
Soit une variable latente yi donc non systmatiquement observable et des
variables explicatives xi , le modle scrit de manire classique comme dans le
cas des modles choix discrets : yi = xi a + i avec :
xi la matrice des valeurs des variables explicatives,
a les coefficients du modle,
i le terme derreur avec i (N (0,2 ) et donc yi N (xi a,2 ) .
Les valeurs observes de la variable explicative yi sont donnes par :

yi = yi si yi > 0
yi = 0 si yi 0
Lorsque les valeurs de yi sont nulles ou ngatives, yi est gale 0 mais lon
connat nanmoins les valeurs des variables explicatives. Les donnes dans ce
type de modle sont dites censures gauche, yi suit alors une loi normale cen-
sure.
Comme pour les moindres carrs ordinaires :
E(yi ) = xi a mais E(yi /yi > 0) =
/ xi a et E(yi ) =
/ xi a .
En effet, calculons lesprance de yi dans le cas dun modle censur

gauche, non pas 0, mais une valeur seuil gale c1 , le modle scrit :

yi = yi si yi > c1
yi = c1 si yi c1
y = xi a + i avec i N (0,2 ) .
338 CONOMTRIE
9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 339
Lesprance a pour expression :

E(yi ) = Prob(yi = c1 ) E(yi /yi = c1 ) + Prob(yi > c1 ) E(yi /yi > c1 )
Soit la fonction de rpartition de la loi de probabilit des erreurs (norma-

le ou logistique) et la fonction de densit associe. Nous avons :

yi xi a c1 xi a c1 xi a
Prob(yi = c1 ) = Prob(yi c1 ) = Prob =

1 ci xi a c1 xi a
Prob(yi > c1 ) = Prob(yi = y1 ) = =1

E(yi /yi = c1 ) = c1

[(c1 xi a)/ ]
E(yi /yi > c1 ) = E(yi /yi > c1 ) = xi a +

=
/ xi a
1 [(c1 xi a)/ ]
Soit :

c1 xi a c1 xi a
E(yi ) = c1 + 1

[4]
[(c1 xi a)/ ]
xi a + =
/ xi a
1 [(c1 xi a)/ ]
Le recours la mthode des moindres carrs nest donc pas possible.

Le modle de Tobit peut alors scrire de la manire suivante.
En posant yi = x a le modle estim de la variable latente et en effectuant les
termes du deuxime membre de [4] et aprs simplification, nous obtenons lcri-
ture suivante :
yi = c1 ((c1 yi )/ ) + (1 ((c1 yi )/ ) > 0)
[5]
( yi (1 ((c1 yi )/ )) + (((c1 yi )/ )))
Plus gnralement, et par extension, il est possible de formaliser un modle

de Tobit avec censure gauche et censure droite tel que :

yi = c1 si yi c1
yi = yi si c1 < yi c2
yi = c2 si c2 < yi
Avec c1 et c2 deux valeurs numriques qui reprsentent les seuils de censure,

lune de ces valeurs peut tre gale , si il nexiste pas de seuil droite ou
gauche.
Dans le cas particulier o c1 = 0 et c2 = , nous retrouvons le modle cano-
nique de Tobit.

9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 340
Le modle de Tobit deux seuils scrit laide dune dmonstration ana-

logue la prcdente :
yi = x a
yi = c1 ((c1 yi )/ ) + c2 (1 ((c2 yi )/ ))
+ (((c2 yi )/ ) ((c1 yi )/ ) > 0)
[6]
( yi (((c2 yi )/ ) ((c1 yi )/ )) +
(((c2 yi )/ ) + ((c1 yi )/ )))
B. Estimation et interprtation des rsultats

La mthode des moindres carrs ordinaires nest pas adapte du fait de lappa-
rition frquente, dans les observations de la variable expliquer, des valeurs
seuils. Lestimation des paramtres ( a et ) du modle est effectue laide dun
algorithme de maximisation de la fonction de la Log-vraisemblance.
Les rsultats destimation sapprcient directement par la significativit des
coefficients laide des ratios appels z -Statistique.
Les valeurs des coefficients du modle estim sont directement interprtables
en termes de propension marginale sur yi , du fait de la continuit dans linter-
valle des seuils de la variable expliquer.
Exercice n 3
fichier C12EX3
Prvision de la demande dlectricit pour un fournisseur capacit

limite
Dans le cadre de louverture du march de llectricit destination des industriels,
un fournisseur dlectricit, qui nest pas loprateur historique, propose de lnergie
lectrique bas prix dans la limite de ses capacits fixes 3 000 mgawatts : la deman-
de suprieure ce seuil ne peut donc pas tre servie.
Au-del de ses capacits les clients sont dlests et sont donc dans lobligation de
basculer vers une autre source. La demande (yt ) exprime en mgawatts la priode t
est fonction de trois facteurs explicatifs :
x1t = indicateur dcart de prix par rapport la concurrence en t, la valeur indique
le % de rduction, pour le jour considr, accord par loprateur historique (si 0 pas de
rduction de prix),
x2t = nombre de clients industriels aliments en t,
x3t = variable indicatrice signalant les jours particuliers forte consommation tels
que le lendemain de jour fri,
340 CONOMTRIE
9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 341
Soit les donnes quotidiennes sur 60 jours (cf. un extrait dans le tableau 3) dont cet
oprateur dispose.
Jour y x1 x2 x3
1 2717 0 61 0
2 2126 0 32 0

59 2683 0,1 61 0
60 3000 0 79 0
61 1 98 1
62 0 60 0
On demande :
1) destimer un modle Logit permettant de prvoir la demande quotidienne partir des
facteurs explicatifs proposs et de commenter les rsultats ;
2) de comparer les rsultats avec lestimation par la mthode, non adapte, des moindres
carrs ordinaires ;
3) deffectuer une prvision pour les jours 61 et 62 sachant que :
x1,61 = 1 ; x2,61 = 98 ; x3,61 = 1 et x1,62 = 0 ; x2,62 = 60 ; x3,62 = 0.
Solution
1) La consommation est censure car les valeurs de la variable expliquer (la demande)
ne sont pas connues lorsquelles sortent de lintervalle [0 ; 3 000] puisque au-del de
3 000, la demande ne peut tre satisfaite.
Figure 1 Fentre de paramtrage pour un modle Tobit (logiciel Eviews)

9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 342
Pour estimer le modle Tobit, le logiciel Eviews (cf. figure 1) permet de paramtrer
les seuils de censure gauche (c1 = 0) et droite (c2 = 3 000) et de choisir la distribu-
tion de lerreur (ici normale). Nous ne slectionnons donc pas loption distribution tron-
que puisque la distribution est censure.
Les rsultats destimation sont les suivants :
Method: ML Censored Normal (TOBIT) (Quadratic hill climbing)
Left censoring (value) series: 0
Right censoring (value) series: 3000
X1 27.69316 7.582649 3.652175 0.0003
X2 20.50361 0.480937 42.63261 0.0000
X3 186.2357 34.88046 5.339256 0.0000
C 1473.642 23.60984 62.41642 0.0000
Error Distribution
SCALE: SIG 47.41983 4.617038 10.27062 0.0000
R-squared 0.981952 Mean dependant var 2542.667
Log likelihood 275.6572 Hannan-Quinn criter 9.423507
Avg. log likelihood 4.594286
Left censored obs 0 Right censored obs 8
Uncensored obs 52 Total obs 60
Les coefficients sont tous significativement diffrents de 0 (les probabilits critiques
des coefficients sont toutes infrieures 0,05), le modle est valid sur le plan statistique.
Eviews indique, sur lavant dernire ligne, le nombre de donnes censures : 0
gauche et 8 droite.
Lindicateur dcart de prix agit ngativement sur la demande : en cas de rduction
tarifaire de la concurrence, la demande diminue.
Le nombre de clients connects au rseau et la variable muette type de jour ont
un effet positif sur la demande.
La variable dchelle (estimateur de ) est gale 47,41.
Les coefficients ont bien le signe attendu, le modle est valid sur le plan conomique.
Le modle Tobit scrit daprs [6] :
yt = 27,69 x1t + 20,50 x2t + 186,23 x3t + 1473,64
342 CONOMTRIE
9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 343
yt = 0 ((0 yt )/47,41) + 3000 (1 ((3000 yt )/47,41))

+ (((3000 yt )/47,41) ((0 yt )/47,41) > 0)
( yt (((3000 yt )/47,41) ((0 yt )/47,41))
+ 47,41 (((3000 yt )/47,41) + ((0 yt )/47,41)))
avec la fonction de rpartition de la loi normale et la fonction de densit associe.

Les graphiques (cf. graphique 4) de la srie brute et de la srie ajuste prsentent la qua-
lit de lajustement : les valeurs sont limites par le seuil maximum, soit 3 000 mgawatts.
3300
3000
2700
2400
2100
1800
1500
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58
Demande Demande ajuste
Graphique 4 Sries brute et ajuste de la variable (yt ) demande (Modle Tobit)
2) Lapplication de la mthode des moindres carrs ordinaires conduit aux rsultats sui-
vants :
X1 31.95356 11.44578 2.791732 0.0072
X2 17.83772 0.659615 27.04260 0.0000
X3 156.0019 60.45055 2.580653 0.0125
C 1594.516 34.80522 45.81254 0.0000
R-squared 0.941213 F-statistic 298.8649
Sum squared resid 380662.1 Prob(F-statistic) 0.000000
Les coefficients du modle, tous significativement diffrents de 0, sont biaiss. Nous

constatons que les valeurs estimes des coefficients sont lgrement diffrentes, bien que
de mme signe, de celles des valeurs estimes laide du modle Tobit.

9782100721511-Bourbo-C12.qxd 22/10/14 10:29 Page 344
Les graphiques (cf. graphique 5) de la srie brute et de la srie ajuste indiquent que
lutilisation de la mthode des MCO peut fournir des valeurs estimes parfois suprieures
3 000 mgawatts ce qui est techniquement impossible.
3300
3000
2700
2400
2100
1800
1500
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58
Demande Demande ajuste
Graphique 5 Sries brute et ajuste de la variable (yt )

demande (Mthode MCO)
3) Le calcul de la prvision pour les jours 61 et 62 est directement effectu par applica-
tion du modle Tobit estim.
Sachant que :
x1,61 = 1 ; x2,61 = 98 ; x3,61 = 1 et x1,62 = 0 ; x2,62 = 60 ; x3,62 = 0.
La prvision pour le jour 61 est donne par :

y61 = 27,69 1 + 20,50 98 + 186,23 1 + 1473,64 = 3641,53

y61 > c2 y61 = c2 = 3 000
La prvision pour le jour 62 est donne par :

y62 = 27,69 0 + 20,50 60 + 186,23 0 + 1473,64 = 2703,85

c1 < y62 < c2 y62 = y62 = 2703,85
Le calcul de la prvision laide du modle estim par la mthode des MCO conduit
des rsultats lgrement diffrents comme lillustre le tableau 4.
Tableau 4 Comparaison des prvisions par le modle Tobit

et par la mthode des MCO
Jour Modle Tobit MCO

61 3000 3544,63
62 2703,86 2687,26
344 CONOMTRIE
9782100721511-Bourbo-C13.qxd 22/10/14 10:30 Page 345
13. Introduction
lconomtrie
des donnes
de panel
D
ans le chapitre 1 nous avons prsent les donnes de panel
comme tant des modles dans lesquels les variables reprsen-
tent les valeurs prises par un chantillon dindividus intervalle
de temps rguliers. En conomtrie nous pouvons nous intresser des
donnes temporelles ou des donnes en coupe instantane, les don-
nes de panel mlangent les deux dimensions : sries temporelles et don-
nes en coupe. Les exemples sont nombreux : estimation conomtrique
entre les exportations et louverture commerciale sur 20 ans (le temps) et
15 pays (les individus), le revenu dun chantillon de mnages sur plu-
sieurs annes, lvolution du chiffre daffaires de 30 grandes surfaces sur
36 mois Lintrt de cette spcification rside dans la prise en compte
dun effet temporel et dun effet individuel.
Les individus sont lunit statistique observe (consommateur, entreprise,
rgion, pays, etc.) intervalle de temps rgulier.
Dans ce chapitre, qui constitue une simple introduction lconomtrie
des donnes de panel1, nous prsentons la section I les modles don-
nes de panel et la mthode destimation SUR ; puis en section II, les tests
dhomognit permettant de dterminer la structure du panel. Enfin la
section III traite des panels effets fixes et alatoires, des mthodes des-
timation et du test dHausman de spcification des effets individuels.
1. Le lecteur dsirant approfondir ce chapitre peut se rfrer Sevestre P. 2002.
Introduction lconomtrie des donnes de panel 345

9782100721511-Bourbo-C13.qxd 22/10/14 10:30 Page 346
I. Prsentation des modles donnes

de panel
A. Spcificits des donnes de panel

1) Dfinitions prliminaires
Les donnes de panel (ou donnes longitudinales) sont reprsentatives dune

double dimension : individuelle et temporelle. Un panel quilibr (balanced
panel) a le mme nombre dobservations pour tous les individus, un panel ds-
quilibr (unbalanced panel) est un panel o il manque des observations pour
certains individus.
2) Exemple introductif
Prenons un exemple introductif trs simple, un panel compos de 2 individus

( N = 2) et connu sur 3 priodes (T = 3 ), soit un total de N T = 6 observa-
tions k = 2 variables explicatives.
Le modle gnral scrit :
yit = a0i + a1i x1it + a2i x2it + it ,
yit = variable endogne observe pour lindividu i la priode t ,
x1it, x2it = variables explicatives observes pour lindividu i linstant t ,
a0i = terme constant pour lindividu i ,
a1i ,a2i = coefficients des 2 variables exognes pour lindividu i ,
it = terme derreur pour lindividu i la priode t.
Soit en lcrivant pour lensemble des 6 observations1 :

y11 = a01 + a11 x111 + a21 x211 + 11
Individu n 1 y12 = a01 + a11 x112 + a21 x212 + 12
y13 = a01 + a11 x113 + a21 x213 + 13

y21 = a02 + a12 x121 + a22 x221 + 21
Individu n 2 y22 = a02 + a12 x122 + a22 x222 + 22
y23 = a02 + a12 x123 + a22 x223 + 23
1. Nous constatons que nous avons 6 observations et 6 paramtres estimer, lobjectif de cet
exemple est simplement dillustrer lcriture dun modle en panel
346 CONOMTRIE
9782100721511-Bourbo-C13.qxd 22/10/14 10:30 Page 347
Sous forme matricielle le modle scrit :

y11 1 0 x111 0 x211 0 a01 11
y 1 a
12 0 x112 0 x212 0 02 12

y13 1 0 x113 0 x213 0 a11 13
= +
y 0 x221
21 1 0 x121 0 a12 21

y22 0 1 0 x122 0 x222 a21 22
y23 0 1 0 x123 0 x223 a22 23
Si les hypothses classiques sur les erreurs sont respectes (homoscdasticit et

indpendance temporelle) et quelles sont indpendantes dun individu lautre
(Cov(it ,jt ) = 0 pour i =
/ j ), nous pouvons appliquer la mthode des moindres
carrs pour chacune des N quations relatives aux individus. Dans le cas o
lhypothse dindpendance entre les individus (Cov(it , jt ) = i2j =/ 0 pour
i= / j ) nest plus vrifie, lestimateur des MCO nest plus BLUE, nous devons
appliquer la mthode SUR (Seemingly Unrelated Regressions) de Zellner.
B. La mthode SUR
La mthode SUR, Seemingly Unrelated Regressions, de Zellner (1962) est utilise
lorsque les erreurs des quations individuelles sont corrles : la covariance indivi-
duelle Cov(it , jt) = i2j =
/ 0 pour i =
/ j . Les individus sont alors interdpendants.
Cette mthode consiste appliquer les MCG : a SU R = (X 1 X)1 (X 1 Y )

12 I 12 I . . . 1N I
I 22 I . . . 2N I
21
Avec = , chaque lment i j I tant de
(N T,N T ) ... ... ... ...
N 1 I N 2 I ... N2 I
dimension (T,T ) .
Pratiquement, la procdure est la suivante :
Estimation par les MCO des N quations individuelles.
Calcul des N rsidus eit .

T
T
eit2 eit ejt
Calcul des
i2 = et
i j =
t=1 t=1
.
T T
Application des MCG : 1 X)1 (X
a SU R = (X 1 Y ) .
Si les erreurs sont, de plus, autocorrles dans le temps, la correction peut

seffectuer par une des mthodes prsentes au chapitre 5.

9782100721511-Bourbo-C13.qxd 22/10/14 10:30 Page 348
La mthode destimation SUR prsente lavantage de prendre en compte

lhtrognit individuelle par lintgration de la dpendance entre les indivi-
dus mais prsente linconvnient surtout si le nombre dobservations tempo-
relles T est faible dun grand nombre de paramtres estimer : N (k + 1)
coefficients et N (N + 1)/2 lments de la matrice .
Les modles effets individuels fixes ou alatoires permettent de trouver un
compromis entre le nombre de paramtres estimer et lintgration de lhtro-
gnit individuelle.
C. Le modle linaire simple

Le modle en donnes de panel peut scrire pour N individus (i = 1,,N ) et
T observations temporelles (t = 1,,T ) , soit n = N T observations totales,
yit = a0i + ai xit + it .
yit = variable endogne observe pour lindividu i la priode t ,

xit = vecteur des k variables exognes xit = (x1it ,x2it ,. . . ,xkit ) ; xkit est donc la
valeur observe pour la k e variable exogne pour lindividu i linstant t,
ai = vecteur des k coefficients des k variables exognes ai = (a1i ,a2i ,. . . ,aki ) ,
it = terme derreur.
partir de cette spcification gnrale nous pouvons envisager quatre possi-
bilits.
Cas n 1 : homognit totale.
Les constantes a0i et les coefficients ai sont tous identiques pour tous les indivi-
dus, nous avons a0i = a0 et ai = a pour toutes les valeurs de i . Le modle ne
comporte quune seule quation estime sur n = N T observations empiles
par les MCO (ou les MCG selon la structure de la matrice des variances et cova-
riances des erreurs).
Cas n 2 : htrognit totale.
Les constantes a0i et les coefficients ai sont tous diffrents pour toutes les
valeurs de i , la structure en panel est rejete. Le modle doit tre estim qua-
tion par quation pour les N quations (une quation par individu) par les MCO
(ou les MCG selon la structure de la matrice des variances et covariances des
erreurs).
Cas n 3 : htrognit des coefficients des variables explicatives et homog-
nit des termes constants.
Les constantes a0i sont toutes identiques ( a0i = a0 ) pour les individus, mais les
coefficients ai des variables explicatives sont diffrents pour chaque individu.
348 CONOMTRIE
9782100721511-Bourbo-C13.qxd 22/10/14 10:30 Page 349
Comme au cas n 2, le modle doit tre estim sur les N quations (une qua-
tion par individu) par les MCO (ou les MCG selon la structure de la matrice des
variances et covariances des erreurs).
Cas n 4 : htrognit des termes constants et homognit des coefficients
des variables explicatives le modle effets individuels.
Les constantes a0i sont diffrentes pour les individus, mais les coefficients ai des
variables explicatives sont constants pour les individus ( ai = a ). Ce modle est
appel modle effets individuels et nous le prsenterons la section III.
II. Les tests dhomognit

A. Procdure squentielle de tests
Le choix de la spcification (homognit, htrognit) est donc trs impor-
tant. Afin de dterminer la structure du panel, Hsiao (1986) propose une proc-
dure squentielle de tests (cf. graphique 1) permettant de dfinir le cas dans
lequel nous nous situons.
Test H1O : a0i = a0 et a' = a'i i
H1O rejete H10 vraie
Test H O2 : a' = a'i i Cas n1 : Homognit totale

yit = a0 + a ' xit + it
H 02 rejete H 02 vraie
Cas n2 : Htrognit totale

yit = a0i + ai' xit + it Test H 3O : a0i = a0 i
H 30 rejete H 30 vraie
Cas n1 : Homognit totale

Cas n4 : Modle effets individuels
' yit = a0 + a ' xit + it
yit = a0i + a xit + it
Graphique 1 Procdure squentielle des tests

9782100721511-Bourbo-C13.qxd 22/10/14 10:30 Page 350
B. Construction des tests

Les tests dhypothse sont construits partir des statistiques de Fisher (test de
Wald de restrictions sur les coefficients).
1) Test H10 : a0i = a0 et a = ai i
Ce test dhypothses jointes se ramne un test de Fisher dont la statistique est

donne par :
(SC Rc1 SC R)/N 1)(k + 1)
F1 =
SC R/(N T N (k + 1))
SC Rc1 = somme des carrs des rsidus du modle contraint sous lhypothse
H10 , soit estimer par les MCO le modle en empilant toutes les observations. Le
degr de libert est gal : ( N T = nombre total dobservations)
(k + 1 = nombre de coefficients estimer).
SC R = somme des carrs des rsidus du modle non contraint, elle est gale
la somme des N sommes des carrs des rsidus des modles estims sur les T

N
observations de chaque quation individuelle, soit SCR = SCRi . Le degr de
i=1
libert est donc la somme des N degrs de libert de chaque quation estime,

N
soit ddl = (T (k + 1)) = N T N (k + 1) .
i=1
Le degr de libert du numrateur est donc gal la diffrence des degrs de

libert de SCRc1 et SCR :
ddln = [(N T )(k + 1)][(N T )N (k + 1)] = (N 1)(k + 1)
La statistique F1 est comparer la valeur lue dans la table de Fisher aux

degrs de libert du numrateur et du dnominateur. Si F1 > Fddln;ddld

, nous reje-
tons lhypothse H0 au seuil .
1
2) Test H20 : a = ai i
Ce test dhypothses jointes se ramne au test de Fisher dont la statistique est

donne par :
(SC Rc2 SC R)/((N 1) k)
F2 =
SC R/(N T N (k + 1))
H20 , soit estimer le modle effets fixes individuels. Le degr de libert est gal
350 CONOMTRIE
9782100721511-Bourbo-C13.qxd 22/10/14 10:30 Page 351
( N T = nombre dobservations) (k + N = nombre de coefficients esti-

mer), nous estimons k coefficients et N termes constants.
SC R = somme des carrs des rsidus du modle non contraint. Le degr de
libert du numrateur est donc gal :
ddln = [(N T )(k + N )][(N T )N (k + 1)] = (N 1) k
La statistique F2 est comparer la valeur lue dans la table de Fisher aux

degrs de libert du numrateur et du dnominateur. Si F2 > Fddln;ddld

, nous reje-
tons lhypothse H20 au seuil .
3) Test H30 : a0i = a0 i
Ce test dhypothses jointes se ramne au test de Fisher dont la statistique est

donne par :
(SC Rc1 SC Rc2 )/(N 1)
F3 =
SC RC2 /(N (T 1) k)
SC Rc2 = somme des carrs des rsidus du modle contraint sous lhypothse H20 .
H10 . Le degr de libert du numrateur est donc gal :
ddln = [(N T )(k + 1)][(N T )(k + N )] = N 1
La statistique F3 est comparer la valeur lue dans la table de Fisher aux degrs
de libert du numrateur et du dnominateur. Si F3 > Fddln;ddld

, nous rejetons
lhypothse H0 au seuil .
3
Exercice n 1
fichier C13EX1 = donnes en panel
C13EX1-E = donnes empiles
Procdure squentielle des tests dhomognit
Nous nous intressons lvolution des dpenses dducation sur 25 ans (variable
expliquer note y ) pour neuf pays. Les facteurs explicatifs proposs sont :
x 1it = volution des dpenses militaires en milliers de dollars pour le pays i lan-
ne t ,
x 2it = volution du PIB (Produit intrieur brut) en milliers de dollars pour le pays
i lanne t .
Les variables sont toutes connues sur 25 ans.

9782100721511-Bourbo-C13.qxd 22/10/14 10:30 Page 352
Le modle tudier est donc :

yit = a0i + a1i x1it + a2i x2it + it pour i = 1,. . . ,N et t = 1,. . . ,T
avec N = 9 pays et T = 25 annes, le nombre total dobservations est donc
n = N T = 225 .
yit = volution des dpenses dducation en milliers de dollars pour le pays i
lanne t ,
it = erreur de spcification pour le pays i lanne t , ces erreurs rpondent aux
hypothses classiques (homoscdasticit et indpendance temporelle) et sont indpen-
dantes dun individu lautre (Cov(it , jt ) = 0 pour i =
/ j ).
Un extrait des donnes est prsent au Tableau 1.
Tableau 1 Extrait des donnes de lvolution en dpenses dducation, militaires et

du PIB pour 9 pays sur 25 ans
Pays Anne yit x1it x2it

1 1 512 3,15 25,92
1 2 687 5,32 22,51
1
1 24 2 166 6,29 19,76
1 25 1 214 11,62 19,76
2 1 74 8,47 35,99
2 2 67 11,37 17,8
2
2 24 5 2,66 12,43
2 25 3 4,11 11,13
3 1 419 5,81 13,61
3 2 10238 7,02 3,27
3
3 24 1 939 12,83 14,27
3 25 2 254 16,7 14,14

9 23 5 6,05 8,77
9 24 28 4,84 12,96
9 25 170 3,87 12,83
On demande dappliquer la stratgie des tests dhomognit afin de dterminer la

structure du panel.
352 CONOMTRIE
9782100721511-Bourbo-C13.qxd 22/10/14 10:30 Page 353
Solution
Nous commenons par tester lhypothse H10 : a0i = a0 et a = ai i.

Soit calculer : SC Rc1 = somme des carrs des rsidus du modle contraint sous
lhypothse H10 , nous estimons par les MCO le modle en empilant toutes les observa-
tions (fichier de donnes C13EX1-E).

C 146.2167 138.0735 1.058977 0.2908
X1 29.32698 13.82629 2.121103 0.0350
X2 21.51258 11.47806 1.874234 0.0622
SC Rc1 = 233 782 555,085 ; degr de liberts = 2253 = 222.

Puis calculer SC R = somme des carrs des rsidus du modle non contraint, elle
est gale la somme des 9 sommes des carrs des rsidus des modles estims sur les

N
quations individuelles, soit SC R = SC Ri .
i=1
Les rsultats sont les suivants, le programme Eviews est en tlchargement

(C13EX1.PRG) :
Pays Somme des carrs des rsidus

1 2 757 341
2 211 063,8
3 84 306 563
4 82 876 299
5 150 121,7
6 7 419 022
7 2 771 928
8 2 793 154
9 297 885,1
Total SCR 183 583 378
titre dexemple, lestimation pour le deuxime pays (individu n 2) est la sui-

vante :

9782100721511-Bourbo-C13.qxd 22/10/14 10:30 Page 354
Sample: 26 50

C 58.36178 47.94892 1.217166 0.2364
X1 0.180573 6.411318 0.028165 0.9778
X2 0.506402 2.722052 0.186037 0.8541
Sum squared resid 211 063,8 Degr de libert = 25 3 = 22
SC R = 183 583 378,162 ; degr de liberts = 9 (253) = 198 .

(SC Rc1 SC R)/(N 1)(k + 1) (233 782 555,08 183 583 378,162)/24
F1 = =
SC R/(N T N (k + 1) 183 583 378,162/198
2 091 632,372
= = 2,25 , F1 > F24;198
0,05
= 1,52 , nous rejetons lhypothse H10 .
927 188,778 6
Nous nous dirigeons vers la branche de gauche du graphique 1, soit tester : H20 :
a = ai

i.
Nous calculons SC Rc2 = somme des carrs des rsidus du modle contraint sous
lhypothse H20 , soit estimer le modle effets fixes individuels (la mthode destima-
tion sera tudie la section III, fichier de donnes C13EX1).
Dependent Variable: Y?
Method: Pooled Least Squares
Sample: 1 25
Cross-sections included: 9
Total pool (balanced) observations: 225
C 654.9109 181.7605 3.603153 0.0004
X1? 49.50377 23.64297 2.093805 0.0375
X2? 22.17142 11.02105 2.011733 0.0455
Fixed Effects (Cross)
_1-C 49.20967
_2-C 438.3058
_3-C 1 157.176
_4-C 102.6206
_5-C 409.4617
_6-C 794.9591
_7-C 273.2759
_8-C 501.3735
_9-C 481.5489 SC Rc2 = 195 511 374,365
354 CONOMTRIE
9782100721511-Bourbo-C13.qxd 22/10/14 10:30 Page 355
Le degr de libert de ce modle est de 225 2 9 = 214 , car la constante a0 = C

= 654,91 est la moyenne des 9 coefficients des effets fixes.
(SC Rc2 SC R)/(N 1) k (233 782 555,08 195 511 374,365)/16
F2 = =
SC R/(N T N (k + 1) 183 583 378,162/198
74 599,762 7
= = 0,804, F2 > F7;198
0,05
= 1,90 , nous acceptons lhypothse H20 . Nous
927 188,778 6
nous dirigeons donc vers la branche de droite du graphique 1.
Test H30 : a0i = a0 i
(SC Rc1 SC Rc2 )/(N 1)
Soit calculer la statistique : F3 = dont nous connais-
sons tous les lments. SC RC2 /(N (T 1) k)
(233 782 555,08 195 511 374,365)/8 4 783 897,589
F3 = = = 5,24 ,
195 511 374,365/213 917 893,776 4
F3 > F8;213
0,05
1,90 nous rejetons lhypothse H03 .
Le panel une structure effets individuels.
III. Spcifications et estimations des modles

effets individuels
Les modles effets individuels supposent que les modles estims ne diffrent par
individu que par la valeur de la constante a0i = a0 + ai . Nous allons distinguer deux
cas : les modles effets fixes (leffet individuel est constant au cours du temps) et
les modles effets alatoires (le terme constant est une variable alatoire).
Les modles effets individuels peuvent tre transposs au modle effets
temporels, la constante scrit alors a0t = a0 + at (cf. Sevestre P., 2002).
A. Le modle effets fixes individuels

Le modle en donnes de panel effets fixes individuels peut scrire de la
manire suivante :
yit = a0i + a xit + it
yit = variable endogne observe pour lindividu i la priode t,

xit = vecteur des k variables exognes xit = (x1it ,x2it ,. . . ,xkit ) ; xkit est donc la
valeur observe pour la ki e variable exogne pour lindividu i linstant t,
a = vecteur des k coefficients des k variables exognes, a = (a1 ,a2 ,. . . ,ak ) ,
it = terme derreur.

9782100721511-Bourbo-C13.qxd 22/10/14 10:30 Page 356
La mthode destimation des paramtres va dpendre de la structure des

termes derreurs :
Si les erreurs sont homoscdastiques, non autocorrles dans la dimension
temporelle Cov(it ,it ) = 0 pour t =
/ t et dans la dimension individuelle
Cov(it ,jt ) = 0 pour i = / j : mthode des Moindres Carrs Ordinaires
(MCO) sur les variables indicatrices (en anglais LSDV = Least Square
Dummy Variable) ou sur les estimateurs Within.
Si les erreurs sont htroscdastiques et/ou autocorrles dans la dimen-
sion temporelle mais indpendantes dans la dimension individuelle :
mthode des Moindres Carrs Gnraliss (MCG) sur les variables indica-
trices (LSDV) ou sur les estimateurs Within.
1) Estimateur LSDV
Lestimateur LSDV consiste appliquer la mthode des MCO sur le modle
avec variables indicatrices spcifiques pour chacun des N individus. Nous
construisons donc N variables indicatrices tel que : Di = 1 pour lindividu i et
0 pour les autres.
Le modle scrit : yit + a0 + a01 D1 + a02 D2 + . . . + a0N D N + a xit + it
Pratiquement, nous estimons le modle sans la constante1 a0 :
yit = a1 D1 + a2 D2 + . . . + a N D N + a xit + it par les MCO ou les MCG si les
erreurs sont htroscdastiques ou/et autocorrles.
Nous pouvons ensuite calculer les coefficients a0i = a0 + ai du modle ini-
tial, la valeur de la constante a0 tant gale la moyenne des coefficients ai esti-
ms.
2) Estimateur Within
Lestimateur Within (estimateur intra-individuel) consiste centrer pralable-
ment toutes les variables expliquer et explicatives sur leurs moyennes indivi-
duelles et appliquer la mthode des MCO (ou MCG si les erreurs sont ht-
roscdastiques ou autocorrles) sur le modle ainsi transform :
(yit y i ) = a (xit x i ) + it pour i = 1,. . . ,N et t = 1,. . . ,T .
Aprs lestimation des coefficients a les coefficients fixes individuels a0i sob-
tiennent par les relations : a 01 = y 1 a x 1 ; a 02 = y 2 a x 2 ; ; a 0N = y N a x N
Nous calculons ensuite les coefficients a0i = a0 + ai du modle initial
comme prcdemment.
Cette mthode destimation conduit exactement aux mmes rsultats que la
mthode LSDV.
1. Sinon, il y aurait alors colinarit entre le vecteur du terme constant (a0 ) et la somme des N
variables indicatrices, la matrice (X X) serait alors singulire (non inversible).
356 CONOMTRIE
9782100721511-Bourbo-C13.qxd 22/10/14 10:30 Page 357
B. Le modle effets alatoires

1) Prsentation du modle effets alatoires
Le modle effets alatoires suppose que la relation entre la variable expliquer
et les variables explicatives ne soit plus fixe mais alatoire, leffet individuel
nest plus un paramtre fixe a0i mais une variable alatoire.
Le terme derreur se dcompose de la manire suivante : it = a0i + t + vit
do le nom donn aussi ce type de modle : modle erreur compose (error
components model).
Les a0i reprsentent les effets individuels alatoires, la variable alatoire t
reprsente les effets temporels identiques pour tous les individus et enfin vit est
un terme derreur qui est orthogonal aux effets individuels et temporels.
En outre, nous faisons les hypothses suivantes concernant les variables ala-
toires a0i , t et vit : esprances nulles, homoscdasticits, indpendance tempo-
relle et orthogonalit entre les trois composantes.
Dans le cas simple o leffet temporel nexiste pas (t = 0), le modle effets
alatoires individuels scrit alors : yit = a0 + a xit + it avec it = a0i + vit .
Ou encore yit = a0 + a0i + a xit + vit . Le coefficient a0 est un coefficient fixe
identique pour tous les individus.
2) Estimation du modle effets alatoires

La mthode destimation adquate est celle des MCG car la composante ala-
toire a0i est prsente dans it et it , do Cov(it , it ) =
/ 0 . Nous avons donc une
autocorrlation des erreurs (cf. Sevestre 2002).
On dmontre que lestimateur des MCG se ramne une moyenne pondre
des estimateurs Within (prsent prcdemment) et Between. Lestimateur
Between (estimateur inter-individuel not a Bet ) est lestimateur des MCO appli-
qu sur le modle dont les donnes sont les N moyennes individuelles des
variables expliquer et explicatives :
y i = a0 + a0i + a x i + v i pour i = 1,. . . ,N .
Lestimateur des MCG1 est donn par : a MC G = a Bet + (1 )
a L S DV
La valeur des poids , une matrice de dimension (k,k), est inversement pro-
portionnelle la matrice des covariances de a Bet .
Lintroduction deffets individuels alatoires permet donc de combiner une
spcification intermdiaire entre le modle sans effet individuel et le modle
avec effets fixes. La structure du panel nest ni totalement homogne, ni totale-
ment htrogne.
1. On dmontre aussi que lestimateur des MCO sur les donnes empiles se ramne aussi une
moyenne pondre des estimateurs Within et Between.

9782100721511-Bourbo-C13.qxd 22/10/14 10:30 Page 358
C. Effets fixes ou effets alatoires ? Le test dHausman

Le test dHausman (cf. chapitre 5) est un test de spcification qui permet de
dterminer si les coefficients des deux estimations (fixes et alatoires) sont sta-
tistiquement diffrents.
Sous lhypothse nulle H0 dorthogonalit entre les variables explicatives et
le terme derreur du modle effets alatoires, les deux estimateurs Within et
MCG sont des estimateurs non biaiss et dans ce cas il ne doit pas y avoir de
diffrence significative entre les estimations Within et MCG des diffrents coef-
ficients. La mthode des MCG est alors retenue : le modle est effets ala-
toires.
Soit le test dhypothses :
H0 : a L S DV
a MC G = 0 le modle est effets alatoires

H1 : a L S DV a MC G = / 0 le modle est effets fixes
Nous calculons la statistique :
H = (
a L S DV
a MC G ) [Var(
a L S DV ) Var(
a MC G )]1 (
a L S DV
a MC G )
La statistique H est distribue selon un chi-deux k degr de libert. Si
H > 2 (k) pour un seuil a % fix, nous rejetons lhypothse H0, lestimateur
LSDV (Within) est non biais, nous rejetons alors la spcification effets ala-
toires et nous choisissons un modle effets fixes individuels.
Exercice n 2
fichiers C13EX1, C13EX1-E
Estimation du modle effets fixes individuels et effets alatoires

individuels, estimateur Between, test dHausman
En reprenant le modle et les donnes de lexercice n 1, on demande :

1) Destimer le modle effets fixes individuels.
2) Destimer le modle effets alatoires individuels.
3) De calculer lestimateur Between.
4) De procder au test dHausman.
Solution
1) Nous crons les neuf variables indicatrices relatives chacun des pays et nous proc-
dons lestimation par les MCO du modle (hors terme constant) sur les donnes empi-
les (fichier C13EX1-E) :
358 CONOMTRIE
9782100721511-Bourbo-C13.qxd 22/10/14 10:30 Page 359
yt = a1 x1t + a2 x2t + b1 D1t + b2 D2t + . . . + b9 D9t + t

Soit le rsultat suivant :
Sample: 1 225
X1 49.50377 23.64297 2.093805 0.0375
X2 22.17142 11.02105 2.011733 0.0455
DUM1 704.1205 240.8149 2.923907 0.0038
DUM2 216.6050 250.8295 0.863555 0.3888
DUM3 1 812.087 340.8004 5.317151 0.0000
DUM4 757.5315 227.2174 3.333951 0.0010
DUM5 245.4491 232.6545 1.054994 0.2926
DUM6 1 449.870 429.0331 3.379390 0.0009
DUM7 381.6349 224.4928 1.699987 0.0906
DUM8 153.5374 215.6064 0.712119 0.4772
DUM9 173.3620 234.4385 0.739477 0.4604
Nous calculons maintenant les coefficients ai = a0i a0 :
Pays a0i ai
1 704,12 49,21
2 216,61 438,31
3 1 812,09 1 157,18
4 757,53 102,62
5 245,45 409,46
6 1 449,87 794,96
7 381,63 273,28
8 153,54 501,37
9 173,36 481,55
Moyenne = a0 654,91
Nous retrouvons bien exactement les mmes rsultats que lors du calcul de la
SC Rc2 = somme des carrs des rsidus du modle contraint sous lhypothse H20 de lexer-
cice n 1 (fichier de donnes C13EX1, instruction Eviews : panel.ls(cx =f) y? x1? x2?).
2) Lestimation du modle effets alatoires individuels est effectue par linstruction
Eviews : panel.ls(cx =R) y? x1? x2?

9782100721511-Bourbo-C13.qxd 22/10/14 10:30 Page 360
Dependent Variable: Y?
Method: Pooled EGLS (Cross-section random effects)
Sample: 1 25
Cross-sections included: 9
Total pool (balanced) observations: 225
Cross-section SUR (PCSE) standard errors & covariance (d.f. corrected)
C 400.3119 208.0501 1.924112 0.0556
X1? 9.907703 22.74786 0.435544 0.6636
X2? 21.70457 11.17599 1.942071 0.0534
Random Effect (Cross)
_1-C 76.20577
_2-C 326.3516
_3-C 729.8104
_4-C 171.7304
_5-C 279.7010
_6-C 327.8098
_7-C 109.6655
_8-C 269.7585
_9C 320.0798
Nous observons que le modle effets alatoires conduit des estimations des coe-
ficients trs diffrents du modle effets fixes, cela peut provenir dune corrlation entre
les effets individuels et les variables explicatives qui introduit un biais destimation lors
de lapplication de la mthode des MCG.
3) Lestimateur Between consiste estimer par les MCO le modle suivant :
y i = a0 + a0i + a x i + v i
Les moyennes calcules sur les 25 annes pour les 9 individus sont prsentes au
tableau 2.
Tableau 2 Moyennes sur les 25 ans par pays
Pays yi x 1i x 2i
1 602,00 5,26 7,13
2 60,64 6,15 6,69
3 1 330,56 11,76 4,54
4 769,68 3,49 8,33
5 70,20 5,31 3,96
6 842,72 15,85 7,99
7 403,88 3,22 8,20
8 175,00 2,70 7,00
9 81,44 4,85 6,68
360 CONOMTRIE
9782100721511-Bourbo-C13.qxd 22/10/14 10:30 Page 361
Les rsultats de lestimation Between (application des MCO sur les donnes du
tableau 2) sont les suivants avec pour variable expliquer y i :
Coefficients cart-type t-Statistique Probabilit

Constante 125,65 694,52 0,183 0,86
x 1i 62,93 32,29 1,94 0,09
x 2i 29,41 92,22 0,318 0,76
4) Nous calculons la statistique dHausman :

H = ( a L S DV a MC G ) [Var( a L S DV ) Var( a MC G )]1 ( a L S DV a MC G )
Avec :

49,503 9,907 558,99 2,30
a L S DV = ; a MC G = ; Var( a L S DV ) = ;
22,171 21,704 2,30 121,46

361,49 0,566
Var( a MC G ) =
0,566 119,71

39,59 197,50 2,869
( a L S DV a MC G ) = ; [Var( a L S DV )Var( a MC G )] =
0,466 2,869 1,751

0,00518 0,8499 39,59
H = [ 39,59 0,466 ] = 7,94 > 2 (2) pour un
0,8499 0,585 0,466
seuil de 5 % = 5,99.
Nous rejetons lhypothse H0, le modle est donc effets individuels fixes.
Le programme Eviews en tlchargement (C13EX2) permet de calculer directement
la statistique dHausman.

9782100721511-Bourbo-C13.qxd 22/10/14 10:30 Page 362
9782100721511-Bourbo-C14.qxd 04/11/14 7:42 Page 363
Liste des exercices

Chapitre 1
Exercice 1 Calcul dun coefficient de corrlation 10
Chapitre 2
Exercice 1 Gnration dune consommation alatoire 15
Exercice 2 Estimations des coefficients de rgression 20
Exercice 3 Test de coefficient et intervalle de confiance 29
Exercice 4 quivalence des tests et analyse de la variance 36
Exercice 5 Prvision dans un modle de rgression simple 41
Exercice 6 Comparaison de coefficients de rgression 43
Exercice 7 Apprendre manipuler les formules 44
Exercice 8 Apprendre utiliser les formules 45
Chapitre 3
Exercice 1 Mise sous forme matricielle dun modle

et calcul des coefficients de rgression 55
Exercice 2 Tests statistiques sur les coefficients et la variance de lerreur :
calcul des leviers et des rsidus studentiss 64
Exercice 3 Tests partir de lanalyse de la variance 69
Exercice 4 Dtection et correction de valeurs anormales
par variable indicatrice 76
Exercice 5 Intgration dune variable qualitative 78
Exercice 6 tude de saisonnalit par variables indicatrices 79
Exercice 7 Prvision partir du modle linaire 83
Exercice 8 Tests de stabilit structurelle, test de spcification de Ramsey 87
Exercice 9 Estimation dun modle et tests de validit partir de
la connaissance de quelques lments statistiques 90
Exercice 10 Test dune combinaison linaire de coefficients de rgression
(test de contrainte linaire) 93
Exercice 11 Reconstitution dinformations manquantes 95

9782100721511-Bourbo-C14.qxd 22/10/14 10:31 Page 364
Exercice 12 Modle deux rgimes : estimation par variable muette

ou par analyse de la variance 96
Exercice 13 Estimation dune fonction de production : impact de la
privatisation 97
Exercice 14 Fonction conomtrique dinvestissement 101
Chapitre 4
Exercice 1 Calcul des coefficients de corrlation partielle du premier ordre

et du deuxime ordre 109
Exercice 2 Relation entre coefficients de corrlation simple, partielle
et multiple 113
Exercice 3 Consquences de la multicolinarit 114
Exercice 4 Tests de multicolinarit 117
Exercice 5 Mthodes de slection de variables explicatives 121
Chapitre 5
Exercice 1 Tests dindpendance des erreurs 131

Exercice 2 Procdures destimation en cas dautocorrlation
des erreurs dordre 1 139
Exercice 3 Correction de lhtroscdasticit
lorsque les donnes reprsentent des moyennes 144
Exercice 4 Tests de dtection dune htroscdasticit et correction 147
Exercice 5 Test dexognit dHausman, modle erreurs sur
les variables : la technique des variables instrumentales 158
Exercice 6 Prvision de part de march 160
Exercice 7 Un peu de rflexion conomtrique... 162
Chapitre 6
Exercice 1 Estimation dune fonction de production de type Cobb-Douglas 165

Exercice 2 Estimation des paramtres dun modle de diffusion
Logistique et de Gompertz 172
Exercice 3 Estimation des paramtres dune fonction de production
de type CES 174
364 CONOMTRIE
9782100721511-Bourbo-C14.qxd 04/11/14 7:43 Page 365
Chapitre 7
Exercice 1 Estimation des paramtres dun modle autorgressif

erreurs lies 181
Exercice 2 Dtermination du nombre de retards dans un modle
retards chelonns 186
Exercice 3 Estimation des coefficients laide dun polynme
(mthode dAlmon) 191
Exercice 4 Estimation des coefficients dun modle selon une spcifica-
tion des retards de Koyck et une distribution de Pascal 195
Exercice 5 Estimation dun modle dajustement partiel
et danticipations adaptatives 200
Exercice 6 Modlisation du prix dune matire premire 201
Exercice 7 Un modle dvaluation de la politique marketing 203
Exercice 8 Une comparaison des courbes de Phillips franaise et amricaine 208
Chapitre 8
Exercice 1 Comparaison des rsultats par moindres carrs ordinaires,
moindres carrs indirects et doubles moindres carrs 225
Exercice 2 Le problme de lidentification lorsque la structure
dun modle change 229
Exercice 3 Le modle de Klein 230
Chapitre 9
Exercice 1 Exemple dapplication des tests de racine unitaire au CAC40 252
Exercice 2 Gnration de processus ARMA
et analyse des corrlogrammes 260
Exercice 3 Analyse par la mthode de Box et Jenkins et prvision de
trois processus alatoires 264
Chapitre 10
Exercice 1 Recherche des conditions de stationnarit dun modle VAR 278
Exercice 2 Spcification, estimation et prvision dun modle VAR 281
Exercice 3 Analyse dune fonction de rponse impulsionnelle
et dcomposition de la variance 290
Exercice 4 Tests de causalit de Granger et de Sims 293

9782100721511-Bourbo-C14.qxd 22/10/14 10:31 Page 366
Chapitre 11
Exercice 1 Test de cointgration et estimation dun modle
correction derreur 304
Exercice 2 Tests de cointgration et estimation dun modle vectoriel
correction derreur 314
Chapitre 12
Exercice 1 Estimation des modles Probit et Logit binaires explicatifs
des facteurs de la russite en Licence 326
Exercice 2 Estimation dun modle choix multiples de prvision
des ventes 332
Exercice 3 Prvision de la demande dlectricit pour un fournisseur
capacit limite 340
Chapitre 13
Exercice 1 Procdure squentielle des tests dhomognit 351
Exercice 2 Estimation du modle effets fixes individuels et effets
alatoires individuels, estimateur Between, test dHausman 358
366 CONOMTRIE
9782100721511-Bourbo-C15.qxd 22/10/14 10:32 Page 367
Tables statistiques
1. Table de la loi de Laplace-Gauss
2. Table de la loi de Student
3. Table de la loi du Chi-Deux
4. Table de la loi de Fisher-Snedecor
5. Table de la loi de Fisher-Snedecor (suite)
6. Table de Durbin-Watson
7. Tables de Dickey-Fuller

9782100721511-Bourbo-C15.qxd 22/10/14 10:32 Page 368
1. TABLE DE LA LOI DE LAPLACE-GAUSS

(Probabilit de trouver une valeur infrieure x )
t
1 2 /2
(t) = et dt .
2
t
. 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5l20 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,l 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7290 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9779 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
TABLE POUR LES GRANDES VALEURS DE X

. x 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,8 4,0 4,5
F(x) 0,998 65 0,999 04 0,999 31 0,999 52 0,999 66 0,999 76 0,999 841 0,999 928 0,999 968 0,999 997
Nota. La table donne les valeurs de F(x) pour x positif. Lorsque x est ngatif, il faut prendre le compl-
ment l'unit de la valeur lue dans la table.
Exemples : pour x = 1,37 F(x) = 0,9147
pour x = 1,37 F(x) = 0,0853
368 CONOMTRIE
9782100721511-Bourbo-C15.qxd 22/10/14 10:32 Page 369
2. TABLE DE LA LOI DE STUDENT
Valeurs de T ayant la probabilit P dtre dpasses en valeur absolue
P = 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,05 0,02 0,01
1 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,82l 63,657
2 0,142 0,289 0,445 0,617 0,816 1,06l 1,386 1,886 2,920 4,303 6,965 9,925
3 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,841
4 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604
5 0,132 0,267 0,408 0,559 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032
6 0,131 0,265 0,404 0,553 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707
7 0,130 0,263 0,402 0,549 0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,499
8 0,130 0,262 0,399 0,546 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355
9 0,129 0,261 0,398 0,543 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250
10 0,129 0,260 0,397 0,542 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169
11 0,129 0,260 0,396 0,540 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106
12 0,128 0,259 0,395 0,539 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055
13 0,128 0,259 0,394 0,538 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012
14 0,128 0,258 0,393 0,537 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977
15 0,128 0,258 0,393 0,536 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947
16 0,128 0,258 0,392 0,535 0,690 0,865 1,071 1,337 1,746 2,120 2,583 2,921
17 0,128 0,257 0,392 0,534 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898
18 0,127 0,257 0,392 0,534 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878
19 0,127 0,257 0,391 0,533 0,688 0,861 1,066 1,328 1,729 2,093 2,539 2,861
20 0,127 0,257 0,391 0,533 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845
21 0,127 0,257 0,391 0,532 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831
22 0,127 0,256 0,390 0,532 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819
23 0,127 0,256 0,390 0,532 0,685 0,858 1,060 1,319 1,714 2,069 2,500 2,807
24 0,127 0,256 0,390 0,531 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797
25 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787
26 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779
27 0,127 0,256 0,389 0,531 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771
28 0,127 0,256 0,389 0,530 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763
29 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756
30 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750
0,12566 0,25335 0,38532 0,52440 0,67449 0,84162 1,03643 1,28155 1,64485 1,95996 2,32634 2,57582
Nota. est le nombre de degrs de libert.

9782100721511-Bourbo-C15.qxd 22/10/14 10:32 Page 370
3. TABLE DE LA LOI DU CHI-DEUX

Valeurs de 2 ayant la probabilit P dtre dpasses
P = 0,90
. 0,80 0,70 0,50 0,30 0,20 0,10 0,05 0,02 0,01
1 0,0158 0,0642 0,148 0,455 1,074 1,642 2,706 3,841 5,412 6,635
2 0,211 0,446 0,713 1,386 2,408 3,219 4,605 5,991 7,824 9,210
3 0,584 1,005 1,424 2,366 3,665 4,642 6,251 7,815 9,837 11,345
4 1,064 1,649 2,195 3,357 4,878 5,989 7,779 9,488 11,668 13,277
5 1,610 2,343 3,000 4,351 6,064 7,289 9,236 11,070 13,388 15,086
6 2,204 3,070 3,828 5,348 7,231 8,558 10,645 12,592 15,033 16,812
7 2,833 3,822 4,671 6,346 8,383 9,803 12,017 14,067 16,662 18,475
8 3,490 4,594 5,527 7,344 9,524 11,030 13,362 15,507 18,168 20,090
9 4,168 5,380 6,393 8,343 10,656 12,242 14,684 16,919 19,679 21,666
10 4,865 6,179 7,267 9,342 11,781 13,442 15,987 18,307 21,161 23,209
11 5,578 6,989 8,148 10,341 12,899 14,631 17,275 19,675 22,618 24,725
12 6,304 7,807 9,034 11,340 14,011 15,812 18,549 21,026 24,054 26,217
13 7,042 8,634 9,926 12,340 15,119 16,985 19,812 22,362 25,472 27,688
14 7,790 9,467 10,821 13,339 16,222 18,151 21,064 23,685 26,873 29,141
15 8,547 10,307 11,721 14,339 17,322 19,311 22,307 24,996 28,259 30,578
16 9,312 11,152 12,624 15,338 18,418 20,465 23,542 26,296 29,633 32,000
17 10,085 12,002 13,531 16,338 19,511 21,615 24,769 27,587 30,995 33,409
18 10,865 12,857 14,440 17,338 20,601 22,760 25,989 28,869 32,346 34,805
19 11,651 13,716 15,352 18,338 21,689 23,900 27,204 30,144 33,687 36,191
20 12,443 14,578 16,266 19,337 22,775 25,038 28,412 31,410 35,020 37,566
21 13,240 15,445 17,182 20,337 23,858 26,171 29,615 32,671 36,343 38,932
22 14,041 16,314 18,101 21,337 24,939 27,301 30,813 33,924 37,659 40,289
23 14,848 17,187 19,021 22,337 26,018 28,429 32,007 35,172 38,968 41,638
24 15,659 18,062 19,943 23,337 27,096 29,553 33,196 36,415 40,270 42,980
25 16,473 18,940 20,867 24,337 28,172 30,675 34,382 37,652 41,566 44,314
26 17,292 19,820 21,792 25,336 29,246 31,795 35,563 38,885 42,856 45,642
27 18,114 20,703 22,719 26,336 30,319 32,912 36,741 40,113 44,140 46,963
28 18,939 21,588 23,647 27,336 31,391 34,027 37,916 41,337 45,419 48,278
29 19,768 22,475 24,577 28,336 32,461 35,139 39,087 42,557 46,693 49,588
30 20,599 23,364 25,508 29,336 33,530 36,250 40,256 43,773 47,962 50,892
2
Lorsque > 30, on peut admettre que la quantit 2 2 1 suit la loi normale
rduite.
Exemple :
Calculez la valeur de 2 correspondant une probabilit P = 0,10 de dpassement
lorsque = 41 . laide de la table 1, on calcule, pour P = 0,10 , x = 1,2816 .

[x + 2 1]2 1 1
Do : =2
= [1,2816 + 82 1]2 = (10,2816)2 = 52,85.
2 2 2
370 CONOMTRIE
9782100721511-Bourbo-C15.qxd 22/10/14 10:32 Page 371
4. TABLE DE LA LOI DE FISHER-SNEDECOR
Valeurs de F ayant la probabilit P dtre dpasses (F = s12 /22 )
1 = 1 1 = 2 1 = 3 1 = 4 1 = 5
2
.
P = 0,05 P = 0,01 P = 0,05 P = 0,01 P = 0,05 P = 0,01 P = 0,05 P = 0,01 P = 0,05 P = 0,01
l 161,4 4 052 199,5 4 999 215,7 5 403 224,6 5 625 230,2 5764
2 18,51 98,49 19,00 99,00 19,16 99,17 19,25 99,25 19,30 99,30
3 10,13 34,12 9,55 30,81 9,28 29,46 9,12 28,71 9,01 28,24
4 7,71 21,20 6,94 18,00 6,59 16,69 6,39 15,98 6,26 15,52
5 6,61 16,26 5,79 13,27 5,41 12,06 5,19 11,39 5,05 10,97
6 5,99 13,74 5,14 10,91 4,76 9,78 4,53 9,15 4,39 8,75
7 5,59 12,25 4,74 9,55 4,35 8,45 4,12 7,85 3,97 7,45
8 5,32 11,26 4,46 8,65 4,07 7,59 3,84 7,01 3,69 6,63
9 5,12 10,56 4,26 8,02 3,86 6,99 3,63 6,42 3,48 6,06
10 4,96 10,04 4,10 7,56 3,71 6,55 3,48 5,99 3,33 5,64
11 4,84 9,65 3,98 7,20 3,59 6,22 3,36 5,67 3,20 5,32
12 4,75 9,33 3,88 6,93 3,49 5,95 3,26 5,41 3,11 5,06
13 4,67 9,07 3,80 6,70 3,41 5,74 3,18 5,20 3,02 4,86
14 4,60 8,86 3,74 6,51 3,34 5,56 3,11 5,03 2,96 4,69
15 4,54 8,68 3,68 6,36 3,29 5,42 3,06 4,89 2,90 4,56
16 4,49 8,53 3,63 6,23 3,24 5,29 3,01 4,77 2,85 4,44
17 4,45 8,40 3,59 6,11 3,20 5,18 2,96 4,67 2,81 4,34
18 4,41 8,28 3,55 6,01 3,16 5,09 2,93 4,58 2,77 4,25
19 4,38 8,18 3,52 5,93 3,13 5,01 2,90 4,50 2,74 4,17
20 4,35 8,10 3,49 5,85 3,10 4,94 2,87 4,43 2,71 4,10
21 4,32 8,02 3,47 5,78 3,07 4,87 2,84 4,37 2,68 4,04
22 4,30 7,94 3,44 5,72 3,05 4,82 2,82 4,31 2,66 3,99
23 4,28 7,88 3,42 5,66 3,03 4,76 2,80 4,26 2,64 3,94
24 4,26 7,82 3,40 5,61 3,01 4,72 2,78 4,22 2,62 3,90
25 4,24 7,77 3,38 5,57 2,99 4,68 2,76 4,18 2,60 3,86
26 4,22 7,72 3,37 5,53 2,98 4,64 2,74 4,14 2,59 3,82
27 4,21 7,68 3,35 5,49 2,96 4,60 2,73 4,11 2,57 3,78
28 4,20 7,64 3,34 5,45 2,95 4,57 2,71 4,07 2,56 3,75
29 4,18 7,60 3,33 5,42 2,93 4,54 2,70 4,04 2,54 3,73
30 4,17 7,56 3,32 5,39 2,92 4,51 2,69 4,02 2,53 3,70
40 4,08 7,31 3,23 5,18 2,84 4,31 2,61 3,83 2,45 3,51
60 4,00 7,08 3,15 4,98 2,76 4,13 2,52 3,65 2,37 3,34
120 3,92 6,85 3,07 4,79 2,68 3,95 2,45 3,48 2,29 3,17
3,84 6,64 2,99 4,60 2,60 3,78 2,37 3,32 2,21 3,02
Nota. s12 est la plus grande des deux variances estimes, avec 1 degrs de libert.

9782100721511-Bourbo-C15.qxd 22/10/14 10:32 Page 372
5. TABLE DE LA LOI DE FISHER-SNEDECOR (suite)
Valeurs de F ayant la probabilit P dtre dpasses (F = s12 /22 )
1 = 6 1 = 8 1 = 12 1 = 24 1 =
2
.
P = 0,05 P = 0,01 P = 0,05 P = 0,01 P = 0,05 P = 0,01 P = 0,05 P = 0,01 P = 0,05 P = 0,01
1 234,0 5 859 238,9 5 981 243,9 6 106 249,0 6 234 254,3 6366
2 19,33 99,33 19,37 99,36 19,41 99,42 19,45 99,46 19,50 99,50
3 8,94 27,91 8,84 27,49 8,74 27,05 8,64 26,60 8,53 26,12
4 6,16 15,21 6,04 14,80 5,91 14,37 5,77 13,93 5,63 13,46
5 4,95 10,67 4,82 10,27 4,68 9,89 4,53 9,47 4,36 9,02
6 4,28 8,47 4,15 8,10 4,00 7,72 3,84 7,31 3,67 6,88
7 3,87 7,19 3,73 6,84 3,57 6,47 3,41 6,07 3,23 5,65
8 3,58 6,37 3,44 6,03 3,28 5,67 3,12 5,28 2,93 4,86
9 3,37 5,80 3,23 5,47 3,07 5,11 2,90 4,73 2,71 4,31
10 3,22 5,39 3,07 5,06 2,91 4,71 2,74 4,33 2,54 3,91
11 3,09 5,07 2,95 4,74 2,79 4,40 2,61 4,02 2,40 3,60
12 3,00 4,82 2,85 4,50 2,69 4,16 2,50 3,78 2,30 3,36
13 2,92 4,62 2,77 4,30 2,60 3,96 2,42 3,59 2,21 3,16
14 2,85 4,46 2,70 4,14 2,53 3,80 2,35 3,43 2,13 3,00
15 2,79 4,32 2,64 4,00 2,48 3,67 2,29 3,29 2,07 2,87
16 2,74 4,20 2,59 3,89 2,42 3,55 2,24 3,18 2,01 2,75
17 2,70 4,10 2,55 3,79 2,38 3,45 2,19 3,08 1,96 2,65
18 2,66 4,01 2,51 3,71 2,34 3,37 2,15 3,00 1,92 2,57
19 2,63 3,94 2,48 3,63 2,31 3,30 2,11 2,92 1,88 2,49
20 2,60 3,87 2,45 3,56 2,28 3,23 2,08 2,86 1,84 2,42
21 2,57 3,81 2,42 3,51 2,25 3,17 2,05 2,80 1,81 2,36
22 2,55 3,76 2,40 3,45 2,23 3,12 2,03 2,75 1,78 2,31
23 2,53 3,71 2,38 3,41 2,20 3,07 2,00 2,70 1,76 2,26
24 2,51 3,67 2,36 3,36 2,18 3,03 1,98 2,66 1,73 2,21
25 2,49 3,63 2,34 3,32 2,16 2,99 1,96 2,62 1,71 2,17
26 2,47 3,59 2,32 3,29 2,15 2,96 1,95 2,58 1,69 2,13
27 2,46 3,56 2,30 3,26 2,13 2,93 1,93 2,55 1,67 2,10
28 2,44 3,53 2,29 3,23 2,12 2,90 1,91 2,52 1,65 2,06
29 2,43 3,50 2,28 3,20 2,10 2,87 1,90 2,49 1,64 2,03
30 2,42 3,47 2,27 3,17 2,09 2,84 1,89 2,47 1,62 2,01
40 2,34 3,29 2,18 2,99 2,00 2,66 1,79 2,29 1,51 1,80
60 2,25 3,12 2,10 2,82 1,92 2,50 1,70 2,12 1,39 1,60
120 2,17 2,96 2,01 2,66 1,83 2,34 1,61 1,95 1,25 1,38
2,09 2,80 1,94 2,51 1,75 2,18 1,52 1,79 1,00 1,00
Nota. s12 est la plus grande des deux variances estimes, avec 1 degrs de libert.
372 CONOMTRIE
9782100721511-Bourbo-C15.qxd 22/10/14 10:32 Page 373
6. TABLE DE DURBIN-WATSON
Risque = 5 %
k=1 k=2 k=3 k=4 k=5

n
d1 d2 d1 d2 d1 d2 d1 d2 d1 d2
15 1,08 1,36 0,95 1,54 0,82 1,75 0,69 1,97 0,56 2,21
16 1,10 1,37 0,98 1,54 0,86 1,73 0,74 1,93 0,62 2,15
17 1,13 1,38 1,02 1,54 0,90 1,71 0,78 1,90 0,67 2,10
18 1,16 1,39 1,05 1,53 0,93 1,69 0,82 1,87 0,71 2,06
19 1,18 1,40 1,08 1,53 0,97 1,68 0,86 1,85 0,75 2,02
20 1,20 1,41 1,10 1,54 1,00 1,68 0,90 1,83 0,79 1,99
21 1,22 1,42 1,13 1,54 1,03 1,67 0,93 1,81 0,83 1,96
22 1,24 1,43 1,15 1,54 1,05 1,66 0,96 1,80 0,86 1,94
23 1,26 1,44 1,17 1,54 1,08 1,66 0,99 1,79 0,90 1,92
24 1,27 1,45 1,19 1,55 1,10 1,66 1,01 1,78 0,93 1,90
25 1,29 1,45 1,21 1,55 1,12 1,66 1,04 1,77 0,95 1,89
26 1,30 1,46 1,22 1,55 1,14 1,65 1,06 1,76 0,98 1,88
27 1,32 1,47 1,24 1,56 1,16 1,65 1,08 1,76 1,01 1,86
28 1,33 1,48 1,26 1,56 1,18 1,65 1,10 1,75 1,03 1,85
29 1,34 1,48 1,27 1,56 1,20 1,65 1,12 1,74 1,05 1,84
30 1,35 1,49 1,28 1,57 1,21 1,65 1,14 1,74 1,07 1,83
31 1,36 1,50 1,30 1,57 1,23 1,65 1,16 1,74 1,09 1,83
32 1,37 1,50 1,31 1,57 1,24 1,65 1,18 1,73 1,11 1,82
33 1,38 1,51 1,32 1,58 1,26 1,65 1,19 1,73 1,13 1,81
34 1,39 1,51 1,33 1,58 1,27 1,65 1,21 1,73 1,15 1,81
35 1,40 1,52 1,34 1,58 1,28 1,65 1,22 1,73 1,16 1,80
36 1,41 1,52 1,35 1,59 1,29 1,65 1,24 1,73 1,18 1,80
37 1,42 1,53 1,36 1,59 1,31 1,66 1,25 1,72 1,19 1,80
38 1,43 1,54 1,37 1,59 1,32 1,66 1,26 1,72 1,21 1,79
39 1,43 1,54 1,38 1,60 1,33 1,66 1,27 1,72 1,22 1,79
40 1,44 1,54 1,39 1,60 1,34 1,66 1,29 1,72 1,23 1,79
45 1,48 1,57 1,43 1,62 1,38 1,67 1,34 1,72 1,29 1,78
50 1,50 1,59 1,46 1,63 1,42 1,67 1,38 1,72 1,34 1,77
55 1,53 1,60 1,49 1,64 1,45 1,68 1,41 1,72 1,38 1,77
60 1,55 1,62 1,51 1,65 1,48 1,69 1,44 1,73 1,41 1,77
65 1,57 1,63 1,54 1,66 1,50 1,70 1,47 1,73 1,44 1,77
70 1,58 1,64 1,55 1,67 1,52 1,70 1,49 1,74 1,46 1,77
75 1,60 1,65 1,57 1,68 1,54 1,71 1,51 1,74 1,74 1,77
80 1,61 1,66 1,59 1,69 1,56 1,72 1,53 1,74 1,51 1,77
85 1,62 1,67 1,60 1,70 1,57 1,72 1,55 1,75 1,52 1,77
90 1,63 1,68 1,61 1,70 1,59 1,73 1,57 1,75 1,54 1,78
95 1,64 1,69 1,62 1,71 1,60 1,73 1,58 1,75 1,56 1,78
100 1,65 1,69 1,63 1,72 1,61 1,74 1,59 1,76 1,57 1,78
k est le nombre de variables exognes (constante exclue).

n est la taille de lchantillon.

9782100721511-Bourbo-C15.qxd 04/11/14 7:45 Page 374
7. TABLES DE DICKEY-FULLER1
Modle [1] sans tendance et sans terme constant
Modle [2] sans tendance et avec terme constant
Modle [3] avec tendance et avec terme constant
Tables de la distribution du t1
Nombre
observations Probabilits
n 0,01 0,025 0,05 0,l0 0,90 0,95 0,975 0,99
25 2,66 2,26 1,95 1,60 0,92 1,33 1,70 2,16
50 2,62 2,25 1,95 1,61 0,91 1,31 1,66 2,08
100 2,60 2,4 1,95 1,61 0,91 1,29 1,64 2,03 Modle [1]
250 2,58 2,23 1,95 1,62 0,89 1,29 1,63 2,01
500 2,58 2,23 1,95 1,62 0,89 1,28 1,62 2,00
2,58 2,23 1,95 1,62 0,89 1,28 1,62 2,00
25 3,75 3,33 3,00 2,63 0,37 0,00 0,34 0,72
50 3,58 3,22 2,93 2,60 0,40 0,03 0,29 0,66
100 3,51 3,17 2,89 2,58 0,42 0,05 0,26 0,63 Modle [2]
250 3,46 3,14 2,88 2,57 0,42 0,06 0,24 0,62
500 3,44 3,13 2,87 2,57 0,43 0,07 0,24 0,61
3,43 3,12 2,86 2,57 0,44 0,07 0,23 0,60
25 4,38 3,95 3,60 3,24 1,14 0,80 0,50 0,15
50 4,15 3,80 3,50 3,18 1,19 0,87 0,58 0,24
100 4,04 3,73 3,45 3,15 1,22 0,90 0,62 0,28 Modle [3]
250 3,99 3,69 3,43 3,13 1,23 0,92 0,64 0,31
500 3,98 3,68 3,42 3,13 1,24 0,93 0,65 0,32
3,96 3,66 3,41 3,12 1,25 0,94 0,66 0,33
Tables de la distribution des tc et tb (test bilatral)
Modle [2] Modle [3]

Constante c Constante c Tendance b
n 2% 5 % 10 % 2% 5% 10 % 2% 5% 10 %
25 3,41 2,97 2,61 4,05 3,59 3,20 3,74 3,25 2,85
50 3,28 2,89 2,56 3,87 3,47 3,14 3,60 3,18 2,81
100 3,22 2,86 2,54 3,78 3,42 3,11 3,53 3,14 2,79
250 3,19 2,84 2,53 3,74 3,39 3,09 3,49 3,12 2,79
500 3,18 2,83 2,52 3,72 3,38 3,08 3,48 3,11 2,78
3,18 2,83 2,52 3,71 3,38 3,08 3,46 3,11 2,78
1. Source : Fuller W.A., Introduction to Statistical Times Series, John Wiley, 1976.
374 CONOMTRIE
9782100721511-Bourbo-C16.qxd 22/10/14 10:33 Page 375
Bibliographie
AKAIKE H., Information theory and an extension of the maximum likelihood prin-
ciple , in B.N. Petrov and F. Cski, eds, 2nd International Symposium on
Information Theory, Akadmia Kiad, Budapest, 1973.
AKAIKE H., A new look at the statistical model identification , IEEE Transactions
on automatic Control, Vol. 19, 1974.
AKAIKE H., A bayesian extension of the minimum AIC procedure , Biometrika,
Vol. 66, 1979.
ALMON S., The distributed lag between capital appropriation and expenditures ,
Econometrica, Vol. 33, nl, janvier 1965.
AMEMIYA T., Qualitative response models: a survey , Journal of Economic
Literature, n19, 1981.
ARROW K.J., CHENERY H.B., MINHAS B.S., SOLOW R.M., Capital-labor substitution
and economic efficiency , Review of Economics and Statistics, Vol. 43, 1961.
BEVERIDGE S., NELSON C. R., A new approach to decomposition of economic time
series into permanent and transitory components with particular attention to mea-
surement of the business cycle , Journal of the Monetary Economics, 7, 2, 1981.
BOURBONNAIS R., TERRAZA M., Analyse des sries temporelles, Dunod, Paris, 3e d.,
2010.
BOURBONNAIS R., USUNIER J.-C., Prvision des ventes, 5e d., Economica, Paris,
2013.
BOX G.E.P., JENKINS G.M., Time series analysis : forecasting and control,
Holdenday, 1976.
BOX G.E.P., PIERCE D.A., Distribution of residual autocorrelations in autoregressive-
integrated moving average time series models , Journal of the American
Statistical Association, Vol. 65, 1970.
BREUSCH T., Testing for autocorrelation in dynamic linear models , Australian
Economic Papers, Vol. 17, 1978.
DICKEY D., FULLER W., Distribution of the estimators for autoregressive time series
with unit root , Journal of the American Statistical Association, Vol. 74, n366,
1979.
DICKEY D., FULLER W., Likelihood ratio statistics for autoregressive time series
with unit root , Econometrica, Vol. 49, n4, 1981.
DURBIN J., Testing for serial correlation in least-squares regression when some of
the regressors are lagged dependant variables , Biometrika, Vol. 38, 1970.
ENGLE R.E., GRANGER C.W.J., Cointegration and Error-correction : representation,
estimation and testing , Econometrica, Vol. 55, mars 1987.
ENGLE R.F., Autoregressive conditional heteroscedasticity with estimate of the
variance of U.K. inflation , Econometrica, Vol. 50, 1982.
Bibliographie 375
9782100721511-Bourbo-C16.qxd 22/10/14 10:33 Page 376
FARRAR D.E., GLAUBER R.R., Multicolinearity in regression analysis , Review of

Economics and Statistics, Vol. 49, 1967.
FULLER W.A., Introduction to statistical time series, John Wiley, 1976.
GLEISJER H., A new test for heteroscedasticity , Journal of American Statistical
Association, Vol. 64, 1969.
GODFREY L.G., Testing for higher order serial correlation in regression equation
when the regressors contain lagged dependant variables , Econometrica, Vol. 46,
1978.
GOLDFELD S.M., QUANDT R.E., Some tests of homoscedasticity , Journal of the
American Statistical Association, Vol. 60, 1965.
GRANGER C.W.J., Co-integrated variables and Error-correcting models ,
Document de travail, universit de San Diego, 1983.
GRANGER C.W.J., Investigating causal relations by econometrics models and cross
spectral methods , Econometrica, Vol. 37, 1969.
GREENE W.H., Econometric Analysis, Prentice Hall, 4e d., 2000.
GRIFFITHS W.E., CARTER HILL R., JUDGE G.G., Learning and practicing econome-
trics, John Willey, New York, 1993.
HAMILTON J.D., Time series analysis, Princeton University Press, 1994.
HARVEY A.C., Forecasting Structural Time Series Models and the Kalman Filter,
Cambridge University Press, 1988.
HAUSMAN J.A., Specification Tests in Econometrics , Econometrica, Vol. 46, 1978.
HSIAO C., Analysis of Panel Data , Econometric Society Monographs, N11,
Cambridge University Press, 1986.
JARQUE C.M., BERA A.K., Efficient test for normality homoscedasticity and serial
independance of regression residuals , Applied Statistics, Vol. 31, n2, 1980.
JARQUE C.M., BERA A.K., Testing the normality assumption in limited dependant
variable models , International Economic Review, Vol. 25, n3, 1984.
JOHANSEN S., Statistical analysis of cointegration vectors , Journal of economic
dynamics and control, Vol. 12, 1988.
JOHANSEN S., JUSELIUS, Maximum likelihood estimation and to the demand for
money inference on cointegration with application , Oxford Bulletin of Economics
and Statistics, Vol. 52, 1990.
JOHANSEN S., Estimation and Hypothesis Testing of Cointegration Vectors in
Gaussian Vector Autoregressive Models , Econometrica, Vol. 59, 1991.
JOHNSTON J. et DINARDO J., Mthodes conomtriques, (traduit par B. Guerrien)
Economica, 4e d., Paris, 1999.
JUDGE G.G., CARTER HILL R., GRIFFITHS W.E., LTKEPOHL H., LEE T.-C., Introduction
to the theory and practice of econometrics, John Willey, New York, 1988.
KENDALL M.G., STUART A., The advanced theory of statistics, Vol. 2, Grifin, Londres,
1961.
KLEIN L.R., An introduction to econometrics, Prentice Hall, 1962.
KLEIN L.R., Economic fluctuations in the United States 1921-1941, John Wiley, New
York, 1950.
KOYCK L.M., Distributed lags and investment analysis, North-Holland, Amsterdam,
1954.
376 CONOMTRIE
9782100721511-Bourbo-C16.qxd 22/10/14 10:33 Page 377
KWIATKOWSKI D., PHILLIPS P., SCHMIDT P., et SHIN Y., Testing the null hypothesis of
stationarity against the alternative of a unit root. How sure are we that economic
time series have a unit root ? Journal of econometric, Vol. 54, 1992.
LJUNG G.M., BOX G.E.P., On a mesure of lack of fit in time series models ,
Biometrika, Vol. 65, 1978.
MACKINNON, J.G., Critical Values for Cointegration Tests, Chapitre 13 in Long-run
Economic Relationships : Readings in Cointegration, R.F. Engle et C.W.J.
Granger diteurs, Oxford University Press, 1991.
MADDALA G.S., RAO A.S., Maximum likelihood estimation of Solows and
Jorgensons distributed lag models , The Review of Economics and Statistics,
fvrier 1971.
NELSON C.R., PLOSSER C., Trends and Random Walks in Macroeconomics Time
Series : some Evidence and Applications , Journal of Monatery Economics,
10, 1982.
PHILLIPS P., PERRON P., Testing for unit root in time series regression , Biometrika,
Vol. 75, 1988.
QUENOUILLE M.H., The joint distribution of serial correlation coefficients ,
Annuals of mathematical statistics, Vol. 20, 1949.
SCHWARZ G., Estimating the dimension of a model , The annals of Statistics, Vol. 6,
1978.
SEVESTRE P., conomtrie des donnes de Panel, Dunod, 2002.
SIMS C.A., Macroeconomics and reality , Econometrica, Vol. 48, 1980.
SOLOW R.M., On a family of lag distributions , Econometrica, avril 1960.
THOMAS A., conomtrie des variables qualitatives, Dunod, 2000.
TOBIN J., Estimation of relationships for limited dependent variables ,
Econometrica, n26, 1958.
WHITE H., A heteroskedasticity-consistent covariance estimator and a direct test for
heteroskedasticity , Econometrica, Vol. 48, 1980.
WOLD H., A study in the analysis of stationary time series, Almquist-Wiksell, 1954.
WONNACOTT T.H., WONNACOTT R.J., Statistique, Economica, 4e d., Paris, 1998.
ZELLNER A., An efficient Method of Estimating Seemingly Unrelated Regression
Equations and Tests for Aggregation Bias , Journal of the American Statistical
Association, 57, pp. 348-368, 1962.
Bibliographie 377
9782100721511-Bourbo-C16.qxd 22/10/14 10:33 Page 378
9782100721511-Bourbo-idx.qxd 22/10/14 10:33 Page 379
Index
A Estimateur
Algorithme de Gauss-Newton 171 Between 357, 358, 360
Analyse de la variance 33, 34, 38, 54, de Aitken 127
67, 68, 69, 70, 73 LSDV 356, 358
Autocorrlation des erreurs 127, 179 Within 356
B, C F
Backward Elimination 120 Fonction
Bruit Blanc 242 dautocorrlation 240
Causalit 292, 293 dautocorrlation partielle 241
Coefficient de rponse impulsionnelle 285, 290
de corrlation 8, 10, 11, 37, 108 de vraisemblance 74
de corrlation multiple 54, 92 Forward Regression 120
de corrlation partielle 109, 113
H
de dtermination 41, 54, 92, 112
Conditions didentification 222, 225 Htroscdasticit 18, 142, 144
Corrlogramme 243, 256, 258 Homoscdasticit 18
Critre 119
I
dinformation de Hannan-Quinn 327
de Akaike 119, 185, 279 Intervalle
de Schwarz 119, 185 de confiance 29, 39, 62, 66
de prdiction 40
D de prvision 82
Dcomposition
de Cholesky 288 L
de la variance 290 Leptokurtique 244
Degr Loi
de libert 27, 34, 54, 70 de Fisher 35, 60, 61
Donnes centres 54 de Student 9, 27, 30, 36, 59, 60
DoublesMoindresCarrs 223
M
E Matrice HAT 62
Effet de levier 62, 63 Maximum de vraisemblance 224
quations Mthode
de Yule-Walker 261 de Box et Jenkins 260
rduites 219 de Cochrane-Orcutt 138, 140
structurelles 219 des Moments Gnraliss 156, 157
INDEX 379
des triples moindres carrs 234 Processus

des variables instrumentales 155, 160 DS 246, 248
du balayage 138, 141 TS 245, 248
du maximum de vraisemblance 235 Pseudo-R2 325
SUR 347 Racine unitaire 245
Modle Rgression
choix multiples 330 augmente 157
correction derreur 301, 303, 307 fallacieuse 299
correction derreur vectoriel 308 pondre 144
effets alatoires 355, 357 rcursive 84
effets alatoires individuels 358 Rsidus
effets fixes 355 standardiss 63
effets fixes individuels 355, 358 studentiss 63
erreur compose 357 Retards dAlmon 188
erreurs sur les variables 154 Risque de premire espce 30
retards chelonns 183
AR 256 S
ARIMA 256, 259 Saisonnalit 79, 261
ARMA 257 Schwarz 279
autorgressif 178, 180 Stagewise Regression 121
dajustement partiel 198 Stationnarit 239, 277
danticipations adaptatives 199 Stepwise Regression 120
de choix binaire 322
de Gompertz 169 T
de Klein 230 Test 244
de Koyck 193 ARCH 153
de marche au hasard 246 bilatral 32, 60, 64
de Solow 194 Box-Pierce 131, 243
linaire sur variable latente 322 bruit blanc 241
logistique 169 dautocorrlation 178
Logit 323, 326, 341 dgalit des variances 148
Logit multinomial 336 dexognit dHausman 156, 158
MA 257 dexognit faible 313
Probit 323, 329 dHausman 158, 159, 358
SARIMA 259 de Breusch-Godfrey 130, 132
Tobit 337, 338, 341 de CHOW 68, 69, 71, 85, 97, 100, 144
VAR 276 de cointgration 303
Moindres Carrs Gnraliss 126 de Dickey-Fuller 249, 299
Moindres carrs indirects 223 de Dickey et Fuller Augments 249
Multicolinarit 114, 118 de diffrence 156
de Durbin et Watson 129, 130, 133,
O, P, R 178
de Farrar et Glauber 116, 118
Orthogonalisation 287 de Fisher 36, 44, 67, 74, 93, 184, 350
Point de h de Durbin 178, 182
dinfluence 63 de Gleisjer 148, 150
de levier 63 de Goldfeld-Quandt 148, 149
380 CONOMTRIE
de Granger 294 KPSS 251

de Jarque et Bera 244 de stationnarit 241
de Johansen 315 unilatral 32
de Klein 115, 117 Thorme
de la trace 311 de Frisch, Waugh et Lovell 53
de la valeur propre maximale 313 de Gauss-Markov 53
de Ljung-Box 131, 243, 314 Triples moindres carrs 224
de normalit 244
de Phillips et Perron 250 V
de racines unitaires 249 Valeur anormale 62
de Ramsey 86, 89 Variable
de relation de cointgration 310 auxiliaire 75
de RESET 86 centre 20
de Sims 294 endogne 4, 14, 47, 177, 219, 320
de Wald 94, 350 exogne 4, 14, 47, 177, 219, 320
de White 148, 151 indicatrice 75, 76, 80
du CUSUM 85 latente 322, 338
du Kurtosis 244 muette 75, 96
du multiplicateur de Lagrange 74, 153 qualitative 77
du Skewness 244
INDEX 381
Dans la mme collection

B. Bernier et Y. Simon, Initiation la macroconomie, 9e d., 2009.
B. Bernier et H.-L. Vdie, Initiation la microconomie, 3e d., 2009.
R. Bourbonnais et M. Terraza, Analyse des sries temporelles, 3e d., 2010.
R. Bourbonnais, conomtrie, 9e d., 2015.
M. Delaplace, Monnaie et financement de lconomie, 4e dition 2013.
G. Deleplace, Histoire de la pense conomique, 2e d., 2009.
B. Goldfarb et C. Pardoux, Introduction la mthode statistique, 7e d., 2013.
B. Guillochon, A. Kawecki et B. Venet, conomie internationale, 7e d., 2012.
N. Hayek et J.-P. Leca, Mathmatiques pour lconomie, 4e d., 2011.
F. Huart, conomie des finances publiques, 2012.
J.-P. Lecoutre, Statistique et probabilits, 5e dition, 2012.
P. de Lima, conomie bancaire et croissance conomique, 2012.
T. de Montbrial et E. Fauchart-Foray, Introduction lconomie, 4e d., 2009.
P. Petauton et M. Fromenteau, Thorie et pratique de lassurance vie, 4e d.,
2012.
F. Poulon, conomie gnrale, 7e d., 2011.
M. Raffinot, conomie du dveloppement, 2015.
M. Yildizoglu, Introduction la thorie des jeux, 2e d., 2011.
TD co Sup
S. Brana et M.-C. Bergouignan, TD Comptabilit nationale, 3e d., 2011.
S. Brana, M. Cazals et P. Kauffmann, TD conomie montaire et financire,
4e d., 2012.
S. Brana et M.-C. Bergouignan, TD Macroconomie, 5e d., 2015.
J. Hricourt et J. Reynaud, TD conomtrie, 2007.
K. Jouaber Snoussi et M.-J. Rigobert, TD Finance dentreprise, 2e d., 2010.
J.-P. Lecoutre et Ph. Pilibossian, TD Algbre, 4e d., 2014.
J.-P. Lecoutre et Ph. Pilibossian, TD Analyse, 5e d., 2013.
J.-P. Lecoutre, TD Statistique et probabilits, 6e d., 2015.
P. Mdan, TD Microconomie, 5e d., 2015.
J.-L. Monino, J.-M. Kosianski et F. Le Cornu, TD Statistique descriptive,
4e d., 2010.
G. Neuberg, TD Mathmatiques financires et actuarielles, 2012.
F. Poulon, TD conomie gnrale, 2011.
72151 - (I) - (2) - OSB 80 - LAS - JME

Imprimerie CHIRAT - 42540 Saint-Just-la-Pendue
Dpt lgal : Janvier 2015
Imprim en France

Bourbonnais 2015

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Bourbonnais 2015

Transféré par

Droits d'auteur :

Formats disponibles

9782100721511-Bourbo-lim.

qxd 22/10/14 10:34 Page I

Cours et exercices corrigs

Table des matires

1. Quest-ce que lconomtrie ? 1

2. Le modle de rgression simple 13

Table des matires III

3. Le modle de rgression multiple 47

4. Multicolinarit et slection du modle optimal 107

III. Multicolinarit : consquences et dtection 114

5. Problmes particuliers : la violation des hypothses 125

6. Les modles non linaires 165

7. Les modles dcalages temporels 177

Table des matires V

C. Distribution finie des retards 188

8. Introduction aux modles quations simultanes 217

9. lments danalyse des sries temporelles 239

10. La modlisation VAR 275

B. La reprsentation gnrale 277

11. La cointgration et le modle correction derreur 297

12. Introduction lconomtrie des variables qualitatives 319

Table des matires VII

B. Le modle de choix multiples non ordonn :

13. Introduction lconomtrie des donnes de panel 345

Liste des exercices 363

Tables statistiques 367

Dans le terme conomtrie figure la racine du mot conomie car son

Quest-ce que lconomtrie ? 1

Pourquoi des modles ?

Nombreux sont ceux sociologues, conomistes ou physiciens qui

B. La construction des modles en conomtrie

1) Rfrence une thorie

Une thorie sexprime au travers dhypothses auxquelles le modle fait rf-

2) Formalisation des relations et choix de la forme des fonctions

partir des propositions prcdentes, nous pouvons construire des relations :

C = a0 + a1 Y avec a0 > 0 et 0 < a1 < 1

Les deux premires quations refltent des relations de comportements alors

3) Slection et mesure des variables

1. Corriges des Variations Saisonnires.

Quest-ce que lconomtrie ? 3

II. Le rle de lconomtrie

B. Lconomtrie comme outil dinvestigation

Quest-ce que lconomtrie ? 5

la simulation qui mesure limpact de la modification de la valeur dune

III. La thorie de la corrlation

Tableau 1 Linarit et corrlation

Corrlation Corrlation Absence de

Quest-ce que lconomtrie ? 7

B. Mesure et limite du coefficient de corrlation

On peut dmontrer que, par construction ce coefficient reste compris entre

1. La notion de degrs de libert est explicite au chapitre 2.

Quest-ce que lconomtrie ? 9

Tableau 2 Rendement de mas et quantit dengrais

1) Tracer le nuage de points et le commenter.

Graphique 6 Nuage du couple de valeurs :

2) Afin dappliquer la formule [2], nous dressons le tableau de calcul 3.

Tableau 3 Calcul dun coefficient de corrlation

16 20 256 400 320

Somme 261 304 7 127 9 734 8 286

(10)(8 286) (261)(304) 3 516

soit x,y = 0,89 et x,y

le coefficient de corrlation entre x et y est significativement diffrent de 0.

2) Limites de la notion de corrlation

a) La relation teste est linaire