Vous êtes sur la page 1sur 25

9782100721511-Bourbo-lim.

qxd

22/10/14

10:34

Page I

conomtrie
Cours et exercices corrigs
Rgis Bourbonnais

9e dition

9782100721511-Bourbo-lim.qxd

14/11/14

9:11

Page II

Dunod, 2015
5 rue Laromiguire, 75005 Paris
www.dunod.com
ISBN 978-2-10-072151-1

9782100721511-Bourbo-tdm.qxd

22/10/14

10:35

Page III

Table des matires


Avant-propos

IX

1. Quest-ce que lconomtrie ?

I. La notion de modle
A. Dfinition
B. La construction des modles en conomtrie
II. Le rle de lconomtrie
A. Lconomtrie comme validation de la thorie
B. Lconomtrie comme outil dinvestigation
III. La thorie de la corrlation
A. Prsentation gnrale
B. Mesure et limite du coefficient de corrlation

1
1
2
5
5
5
6
6
8

2. Le modle de rgression simple

13

I. Prsentation du modle
A. Exemple introductif
B. Rle du terme alatoire
C. Consquences du terme alatoire
II. Estimation des paramtres
A. Modle et hypothses
B. Formulation des estimateurs
C. Les diffrentes critures du modle : erreur et rsidu
D. Proprits des estimateurs
III. Consquences des hypothses : construction des tests
A. Hypothse de normalit des erreurs
B. Consquences de lhypothse de normalit des erreurs
C. Test bilatral, test unilatral et probabilit critique dun test
IV. quation et tableau danalyse de la variance
A. quation danalyse de la variance
B. Tableau danalyse de la variance
V. La prvision dans le modle de rgression simple

13
13
14
16
17
17
18
21
22
24
24
25
27
33
33
34
39

Table des matires  III

9782100721511-Bourbo-tdm.qxd

22/10/14

10:35

Page IV

3. Le modle de rgression multiple

47

I. Le modle linaire gnral


A. Prsentation
B. Forme matricielle
II. Estimation et proprits des estimateurs
A. Estimation des coefficients de rgression
B. Hypothses et proprits des estimateurs
C. quation danalyse de la variance et qualit dun ajustement
III. Les tests statistiques
A. Le rle des hypothses
B. Construction des tests
C. Tests sur les rsidus : valeur anormale, effet de levier
et point dinfluence
IV. Lanalyse de la variance
A. Construction du tableau danalyse de la variance
et test de signification globale dune rgression
B. Autres tests partir du tableau danalyse de la variance
C. Gnralisation des tests par analyse de la variance

47
47
48
49
49
51
54
59
59
60

V. Lutilisation de variables indicatrices


A. Constitution et finalits des variables indicatrices
B. Exemples dutilisation

75
75
76

VI. La prvision laide du modle linaire gnral


et la rgression rcursive
A. Prdiction conditionnelle
B. Fiabilit de la prvision et intervalle de prvision
C. Les tests de stabilit par la rgression rcursive
D. Le test de spcification de Ramsey
VII. Exercices rcapitulatifs
Annexe
A) Interprtation gomtrique de la mthode des moindres carrs
B) Rsolution de lexercice 1 par des logiciels informatiques
de rgression multiple
C) Estimation de la variance de lerreur

4. Multicolinarit et slection du modle optimal


I. Corrlation partielle
A. Exemple introductif
B. Gnralisation de la notion de corrlation partielle
II. Relation entre coefficients de corrlation simple,
partielle et multiple

IV  CONOMTRIE

62
67
67
68
73

81
81
82
84
86
90
102
102
103
105

107
107
107
108
112

9782100721511-Bourbo-tdm.qxd

22/10/14

10:35

Page V

III. Multicolinarit : consquences et dtection


A. Consquences de la multicolinarit
B. Tests de dtection dune multicolinarit
C. Comment remdier la multicolinarit ?

114
114
115
118

IV. Slection du modle optimal

119

5. Problmes particuliers : la violation des hypothses

125

I. Lautocorrlation des erreurs


A. Prsentation du problme
B. Lestimateur des Moindres Carrs Gnraliss (MCG)
C. Les causes et la dtection de lautocorrlation des erreurs
D. Les procdures destimation en cas dautocorrlation des erreurs

125
125
126
127
134

II. Lhtroscdasticit
A. Prsentation du problme
B. Correction de lhtroscdasticit
C. Tests de dtection de lhtroscdasticit
D. Autre test dhtroscdasticit : le test ARCH

142
142
144
147
153

III. Modles erreurs sur les variables


A. Consquences lorsque les variables sont entaches derreurs
B. La mthode des variables instrumentales
C. Le test dexognit dHausman
D. La mthode des moments gnralise

154
154
155
156
157

6. Les modles non linaires

165

I. Les diffrents types de modles non linaires


A. Les fonctions de type exponentiel
B. Les modles de diffusion

165
165
168

II. Mthodes destimation des modles non linaires


A. Initiation aux mthodes destimation non linaires
B. Exemples dapplication

170
170
172

7. Les modles dcalages temporels

177

I. Les modles linaires autorgressifs


A. Formulation gnrale
B. Test dautocorrlation et mthodes destimation

177
177
178

II. Les modles retards chelonns


A. Formulation gnrale
B. Dtermination du nombre de retards

183
183
184

Table des matires  V

9782100721511-Bourbo-tdm.qxd

22/10/14

10:35

Page VI

C. Distribution finie des retards


D. Distribution infinie des retards
III. Deux exemples de modles dynamiques
A. Le modle dajustement partiel
B. Le modle danticipations adaptatives

8. Introduction aux modles quations simultanes


I. quations structurelles et quations rduites
A. Exemple introductif
B. Le modle gnral
C. Cas particulier : les modles rcursifs
II. Le problme de lidentification
A. Restrictions sur les coefficients
B. Conditions didentification
III. Les mthodes destimation
A. Les moindres carrs indirects
B. Les doubles moindres carrs
C. Autres mthodes destimation
Annexe
Identification : les conditions de rang

9. lments danalyse des sries temporelles


I. Stationnarit
A. Dfinition et proprits
B. Fonctions dautocorrlation simple et partielle
C. Tests de bruit blanc et de stationnarit
II. La non-stationnarit et les tests de racine unitaire
A. La non-stationnarit : les processus TS et DS
B. Les tests de racine unitaire et la stratgie squentielle de test
III. Les modles ARIMA
A. Typologie des modles AR, MA et ARMA
B. Lextension aux processus ARIMA et SARIMA
IV. La mthode de Box et Jenkins
A. Recherche de la reprsentation adquate : lidentification
B. Estimation des paramtres
C. Tests dadquation du modle et prvision

10. La modlisation VAR


I. Reprsentation dun modle VAR
A. Exemple introductif

VI  CONOMTRIE

188
192
198
198
199

217
218
218
220
221
221
221
222
223
223
223
224
236
236

239
239
239
240
241
245
245
248
256
256
259
260
260
261
262

275
276
276

9782100721511-Bourbo-tdm.qxd

22/10/14

10:35

Page VII

B. La reprsentation gnrale
C. La reprsentation ARMAX
II. Estimation des paramtres
A. Mthode destimation
B. Dtermination du nombre de retards
C. Prvision
III. Dynamique dun modle VAR
A. Reprsentation VMA dun processus VAR
B. Analyse et orthogonalisation des chocs
C. Dcomposition de la variance
D. Choix de lordre de dcomposition
IV. La causalit
A. Causalit au sens de Granger
B. Causalit au sens de Sims

277
278
279
279
279
280
284
284
285
288
288
292
292
293

11. La cointgration et le modle correction derreur


I. Exemples introductifs
II. Le concept de cointgration
A. Proprits de lordre dintgration dune srie
B. Conditions de cointgration
C. Le modle correction derreur (ECM)
III. Cointgration entre deux variables
A. Test de cointgration entre deux variables
B. Estimation du modle correction derreur
IV. Gnralisation k variables
A. La cointgration entre k variables
B. Estimation du modle correction derreur
C. Le modle correction derreur vectoriel
D. Tests de relation de cointgration
E. Test dexognit faible
F. Synthse de la procdure destimation

297
297
299
299
301
301
302
303
303
306
306
307
308
310
313
314

12. Introduction lconomtrie des variables qualitatives


I. Les problmes et les consquences de la spcification binaire
II. Les modles de choix binaires
A. Le modle linaire sur variable latente
B. Les modles Probit et Logit
C. Interprtation des rsultats et tests statistiques
III. Les modles choix multiples
A. Les modles Probit et Logit ordonns

319
320
322
322
323
325
330
331

Table des matires  VII

9782100721511-Bourbo-tdm.qxd

22/10/14

10:35

Page VIII

B. Le modle de choix multiples non ordonn :


le Logit multinomial
IV. Les modles variable dpendante limite : le modle Tobit
A. Le modle Tobit simple : modle de rgression tronqu
ou censur
B. Estimation et interprtation des rsultats

13. Introduction lconomtrie des donnes de panel


I. Prsentation des modles donnes de panel
A. Spcificits des donnes de panel
B. La mthode SUR
C. Le modle linaire simple
II. Les tests dhomognit
A. Procdure squentielle de tests
B. Construction des tests
III. Spcifications et estimations des modles effets individuels
A. Le modle effets fixes individuels
B. Le modle effets alatoires
C. Effets fixes ou effets alatoires ? Le test dHausman

335
337
338
340

345
346
346
347
348
349
349
350
355
355
357
358

Liste des exercices

363

Tables statistiques

367

Bibliographie

375

Index

379

VIII  CONOMTRIE

9782100721511-Bourbo-avtpro.qxd

20/10/14

15:06

Page IX

Avant-propos
Cette neuvime dition est enrichie de nouveaux exercices et des dveloppements les plus rcents de lconomtrie. Ce livre couvre tous les champs de
lconomtrie : rgression simple et multiple, violation des hypothses (htroscdasticit, autocorrlation des erreurs, variables explicatives alatoires),
modle dcalage, analyse des sries temporelles, tests de racine unitaire, quations multiples, VAR, cointgration, VECM, conomtrie des variables qualitatives et des donnes de panel
Sur lensemble de ces thmes, ce livre vous propose un cours, des exercices corrigs, et une prsentation des logiciels dconomtrie les plus rpandus.
Souhaitons quil corresponde votre attente.
En effet, nous avons voulu, par une alternance systmatique de cours et
dexercices, rpondre un besoin pdagogique qui est de mettre rapidement en
pratique les connaissances thoriques et ainsi, dutiliser de manire oprationnelle les acquis du cours ; les exercices sont reprs grce un bandeau gris.
De surcrot, le recours des logiciels1, lors de la rsolution des exercices, permet une dcouverte de ces outils et donne une dimension pratique que recherchent ltudiant et le praticien.
Afin que le lecteur puisse lui-mme refaire les exercices, les donnes utilises (sous format Excel, ASCII, RATS et Eviews) ainsi que les programmes de
traitement Batch de Eviews ou de RATS sont disponibles gratuitement par
tlchargement sur le serveur web :
http://regisbourbonnais.dauphine.fr
Pour chaque exercice faisant appel un fichier de donnes, le nom du fichier
est cit en tte de lexercice et repr par licne suivante :
Nous avons voulu faire de ce manuel un livre dapprentissage facilement
accessible ; cest pourquoi les dmonstrations les plus complexes font lobjet de
renvois une bibliographie plus spcialise. Cependant, il convient de prciser
que lconomtrie fait appel des notions dalgbre linaire et dinduction statistique quil est souhaitable de connatre.
1. Trois logiciels sont utiliss : EXCEL ( Microsoft), RATS ( Var Econometrics version 3 et
Estima version 4), Eviews ( Quantitative Micro Software). Nous recommandons aussi particulirement le logiciel GRETL (http://gretl.sourceforge.net) qui est un logiciel dconomtrie
gratuit, complet et trs facile dapprentissage.

Avant-propos  IX

9782100721511-Bourbo-avtpro.qxd

20/10/14

15:06

Page X

Dans le terme conomtrie figure la racine du mot conomie car son


utilisation est surtout destine des fins de traitement de donnes conomiques ;
cependant, dautres domaines tels que la finance, la recherche agronomique, la
mdecine, etc., font maintenant le plus souvent appel ces techniques.
Ce livre sadresse en premier lieu aux tudiants (sciences conomiques, gestion, coles de commerce et dingnieurs, etc.) dont la formation requiert une
connaissance de lconomtrie. Gageons quil sera un support de cours indispensable et un alli prcieux pour prparer les sances de travaux dirigs.
Noublions pas cependant le praticien de lconomtrie (conomiste dentreprise, chercheur, etc.) qui, confront des problmes destimation statistique,
trouvera dans ce livre les rponses pratiques aux diffrentes questions quil peut
se poser.
Enfin, jexprime toute ma gratitude toutes les personnes collgues et tudiants qui ont eu la gentillesse de me faire des commentaires et dont les
conseils et suggestions contribuent la qualit pdagogique de ce livre. Je reste,
bien entendu, le seul responsable des erreurs qui subsisteraient1.

1. Les lecteurs souhaitant faire des commentaires ou des remarques peuvent me contacter : Rgis
Bourbonnais, universit de Paris-Dauphine, place du Marchal de Lattre de Tassigny, 75775
Paris Cedex 16, E-mail : regis.bourbonnais@dauphine.fr

X  CONOMTRIE

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 1

1. Quest-ce que

lconomtrie ?

e premier chapitre est consacr la prsentation de lconomtrie


et sa liaison avec la thorie conomique. Nous abordons tout
dabord la notion de modle ainsi que les diffrentes tapes de la
modlisation. Lapport de lconomtrie en tant quoutil de validation
est tudi en II. Enfin, la thorie de la corrlation fondement de lconomtrie fait lobjet de la section III.

I. La notion de modle
A. Dfinition
Il est dlicat de fournir une dfinition unique de la notion de modle1. Dans le
cadre de lconomtrie, nous pouvons considrer quun modle consiste en une
prsentation formalise dun phnomne sous forme dquations dont les
variables sont des grandeurs conomiques. Lobjectif du modle est de reprsenter les traits les plus marquants dune ralit quil cherche styliser. Le
modle est donc loutil que le modlisateur utilise lorsquil cherche comprendre et expliquer des phnomnes. Pour ce faire, il met des hypothses et
explicite des relations.

1. La notion de modle est relative au point de vue auquel nous nous plaons : la physique,
lpistmologie...

Quest-ce que lconomtrie ?  1

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 2

Pourquoi des modles ?

Nombreux sont ceux sociologues, conomistes ou physiciens qui


fondent leurs analyses ou leurs jugements sur des raisonnements
construits et labors. Ces constructions refrent implicitement des
modles ; alors pourquoi ne pas expliciter clairement les hypothses et
les relations au sein dun modle ?

Le modle est donc une prsentation schmatique et partielle dune ralit


naturellement plus complexe. Toute la difficult de la modlisation consiste ne
retenir que la ou les reprsentations intressantes pour le problme que le modlisateur cherche expliciter. Ce choix dpend de la nature du problme, du type
de dcision ou de ltude effectuer. La mme ralit peut ainsi tre formalise
de diverses manires en fonction des objectifs.

B. La construction des modles en conomtrie


Dans les sciences sociales, et particulirement en conomie, les phnomnes
tudis concernent le plus souvent des comportements afin de mieux comprendre la nature et le fonctionnement des systmes conomiques. Lobjectif du
modlisateur est, dans le cadre de lconomtrie et au travers dune mesure statistique, de permettre aux agents conomiques (mnages, entreprises, tat...)
dintervenir de manire plus efficace. La construction dun modle comporte un
certain nombre dtapes qui sont toutes importantes. En effet, en cas de faiblesse dun des maillons , le modle peut se trouver invalid pour cause dhypothses manquantes, de donnes non reprsentatives ou observes avec des
erreurs, etc. Examinons les diffrentes tapes suivre lors de la construction
dun modle, ceci partir de lexemple du modle keynsien simplifi.

1) Rfrence une thorie


Une thorie sexprime au travers dhypothses auxquelles le modle fait rfrence. Dans la thorie keynsienne, quatre propositions sont fondamentales :
1. la consommation et le revenu sont lis ;
2. le niveau dinvestissement priv et le taux dintrt sont galement lis ;
3. il existe un investissement autonome public ;
4. enfin, le produit national est gal la consommation plus linvestissement
priv et public.

2  CONOMTRIE

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 3

2) Formalisation des relations et choix de la forme des fonctions


partir des propositions prcdentes, nous pouvons construire des relations :
1. la consommation est fonction du revenu : C = f (Y ) avec f  > 0 ;
2. linvestissement priv dpend du taux dintrt : I = g(r) avec g  < 0 ;
3. il existe un investissement autonome public : I ;
4. enfin, le produit national (ou le revenu national) est gal la consommation plus linvestissement : Y C + I + I .
ce stade, nous navons postul aucune forme particulire en ce qui concerne les fonctions f et g . Ainsi, bien que des considrations dordre thorique nous
renseignent sur le signe des drives, il existe une multitude de fonctions de
formes trs diffrentes et ayant des signes de drives identiques, par exemple
C = a0 + a1 Y et C = a0 Y a1 . Cependant ces deux relations ne refltent pas le
mme comportement ; une augmentation du revenu provoque un accroissement
proportionnel pour la premire relation, alors que, dans la seconde, leffet sestompe avec laugmentation du revenu (si 0 < a1 < 1 ). Nous appelons forme
fonctionnelle ce choix (arbitraire ou fond) de spcification prcise du modle. Dans notre exemple, le modle explicit scrit :
C = a0 + a1 Y

I = b0 + b1 r

avec a0 > 0 et 0 < a1 < 1


a1 = propension marginale consommer
et a0 = consommation incompressible ;
avec b0 > 0 et b1 < 0 ;

Y C+I+I

Les deux premires quations refltent des relations de comportements alors


que la troisime est une identit (aucun paramtre nest estimer).

3) Slection et mesure des variables


Le modle tant spcifi, il convient de collecter les variables reprsentatives
des phnomnes conomiques. Ce choix nest pas neutre et peut conduire des
rsultats diffrents, les questions quil convient de se poser sont par exemple :
Faut-il raisonner en euros constants ou en euros courants ?
Les donnes sont-elles brutes ou CVS 1 ?
Quel taux dintrt faut-il retenir (taux au jour le jour, taux directeur de la
Banque Centrale Europenne,...) ? etc.

1. Corriges des Variations Saisonnires.

Quest-ce que lconomtrie ?  3

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 4

Nous distinguons plusieurs types de donnes selon que le modle est spcifi en :
srie temporelle : cest le cas le plus frquent en conomtrie, il sagit de
variables observes intervalles de temps rguliers (la consommation
annuelle, totale France, exprime en euros courants sur 20 ans) ;
coupe instantane : les donnes sont observes au mme instant et concernent les valeurs prises par la variable pour un groupe dindividus1 spcifiques (consommation observe des agriculteurs pour une anne donne) ;
panel : la variable reprsente les valeurs prises par un chantillon dindividus intervalles rguliers (la consommation dun chantillon de mnages
de la rgion parisienne sur 20 ans) ;
cohorte : trs proches des donnes de panel, les donnes de cohorte se distinguent de la prcdente par la constance de lchantillon, les individus
sonds sont les mmes dune priode sur lautre.

4) Dcalages temporels
Dans le cadre de modle spcifi en sries temporelles, les relations entre les
variables ne sont pas toujours synchrones mais peuvent tre dcales dans le
temps. Nous pouvons concevoir que la consommation de lanne t est explique
par le revenu de lanne t 1 et non celui de lanne t . Pour lever cette ambigut, il est dusage dcrire le modle en le spcifiant laide dun indice
de temps : Ct = a0 + a1 Yt1 . La variable Yt1 est appele variable endogne
retarde .


On appelle variable exogne une variable dont les valeurs sont prdtermines, et variable endogne une variable dont les valeurs
dpendent des variables exognes.

5) Validation du modle
La dernire tape est celle de la validation2 du modle :
Les relations spcifies sont-elles valides ?
Peut-on estimer avec suffisamment de prcision les coefficients ?
Le modle est-il vrifi sur la totalit de la priode ?
Les coefficients sont-ils stables ? Etc.
toutes ces questions, les techniques conomtriques sefforcent dapporter
des rponses.
1. Le terme dindividu est employ au sens statistique, cest--dire comme un lment dune population : une personne, une parcelle de terre...
2. Validation, cest--dire en conformit avec les donnes disponibles.

4  CONOMTRIE

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 5

II. Le rle de lconomtrie


A. Lconomtrie comme validation de la thorie
Lconomtrie est un outil la disposition de lconomiste qui lui permet dinfirmer ou de confirmer les thories quil construit. Le thoricien postule des
relations ; lapplication de mthodes conomtriques fournit des estimations sur
la valeur des coefficients ainsi que la prcision attendue.
Une question se pose alors : pourquoi estimer ces relations, et les tester
statistiquement ? Plusieurs raisons incitent cette dmarche : tout dabord cela
force lindividu tablir clairement et estimer les interrelations sous-jacentes.
Ensuite, la confiance aveugle dans lintuition peut mener lignorance de
liaisons importantes ou leur mauvaise utilisation. De plus, des relations marginales mais nanmoins explicatives, qui ne sont quun lment dun modle
global, doivent tre testes et valides afin de les mettre leur vritable place.
Enfin, il est ncessaire de fournir, en mme temps que lestimation des relations,
une mesure de la confiance que lconomiste peut avoir en celles-ci, cest--dire
la prcision que lon peut en attendre. L encore, lutilisation de mthodes purement qualitatives exclut toute mesure quantitative de la fiabilit dune relation.

B. Lconomtrie comme outil dinvestigation


Lconomtrie nest pas seulement un systme de validation, mais galement un
outil danalyse. Nous pouvons citer quelques domaines o lconomtrie apporte une aide la modlisation, la rflexion thorique ou laction conomique
par :
la mise en vidence de relations entre des variables conomiques qui
ntaient pas a priori videntes ou pressenties ;
linduction statistique ou linfrence statistique consiste infrer, partir
des caractristiques dun chantillon, les caractristiques dune population.
Elle permet de dterminer des intervalles de confiance pour des paramtres
du modle ou de tester si un paramtre est significativement1 infrieur,
suprieur ou simplement diffrent dune valeur fixe ;

1. Au sens statistique, cest--dire avec un seuil (risque derreur ne pas dpasser, souvent 5 %).

Quest-ce que lconomtrie ?  5

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 6

la simulation qui mesure limpact de la modification de la valeur dune


variable sur une autre (Ct = a1 Yt ) ;
la prvision1, par lutilisation de modles conomtriques, qui est utilise
par les pouvoirs publics ou lentreprise afin danticiper et ventuellement
de ragir lenvironnement conomique.
Dans cet ouvrage, nous nous efforcerons de montrer, laide dexemples, les
diffrentes facettes de lutilisation des techniques conomtriques dans des
contextes et pour des objectifs diffrents.

III. La thorie de la corrlation


A. Prsentation gnrale
Lorsque deux phnomnes ont une volution commune, nous disons quils sont
corrls . La corrlation simple mesure le degr de liaison existant entre ces
deux phnomnes reprsents par des variables. Si nous cherchons une relation
entre trois variables ou plus, nous ferons appel alors la notion de corrlation
multiple.
Nous pouvons distinguer la corrlation linaire, lorsque tous les points du
couple de valeurs (x,y) des deux variables semblent aligns sur une droite, de
la corrlation non linaire lorsque le couple de valeurs se trouve sur une mme
courbe dallure quelconque.
Deux variables peuvent tre :
en corrlation positive ; on constate alors une augmentation (ou diminution, ou constance) simultane des valeurs des deux variables ;
en corrlation ngative, lorsque les valeurs de lune augmentent, les valeurs
de lautre diminuent ;
non corrles, il ny a aucune relation entre les variations des valeurs de
lune des variables et les valeurs de lautre.
Le tableau 1, en croisant les critres de linarit et de corrlation, renvoie
une reprsentation graphique.

1. Pour dcouvrir lutilisation de lconomtrie des fins de prvision de ventes, voir Bourbonnais
R. et Usunier J. C. (2013).

6  CONOMTRIE

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 7

Tableau 1 Linarit et corrlation

Corrlation
positive

Corrlation
ngative

Absence de
corrlation

Relation linaire

Graphe 1

Graphe 2

Graphe 5

Relation non linaire

Graphe 3

Graphe 4

Graphe 5

x
Graphe 2

Graphe 1
y

Graphe 3

Graphe 4
y

x
Graphe 5

Quest-ce que lconomtrie ?  7

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 8

B. Mesure et limite du coefficient de corrlation


1) Le coefficient de corrlation linaire
La reprsentation graphique ne donne quune impression de la corrlation
entre deux variables sans donner une ide prcise de lintensit de la liaison,
cest pourquoi nous calculons une statistique appele coefficient de corrlation
linaire simple, not r x,y . Il est gal :
n

(xi x)(yi y)

r x,y =

Cov (x,y)
i=1
=

n
n
x y


2
(xi x )
(yi y )2
i=1

[1]

i=1

avec :
Cov (x,y) = covariance entre x et y ;
x et y = cart type de x et cart type de y ;
n
= nombre dobservations.

En dveloppant la formule [1], il vient :

n
r x,y = 
n

n


xi yi

i=1

n

i=1

n


xi

n


i=1

yi

i=1


n
n
n

2

2

x
xi
n
yi2
yi

[2]

2
i

i=1

i=1

i=1

On peut dmontrer que, par construction ce coefficient reste compris entre

1 et 1 :

proche de 1, les variables sont corrles positivement ;


proche de 1 , les variables sont corrles ngativement ;
proche de 0, les variables ne sont pas corrles.
Dans la pratique, ce coefficient est rarement trs proche de lune de ces trois
bornes et il est donc difficile de proposer une interprtation fiable la simple
lecture de ce coefficient. Ceci est surtout vrai en conomie o les variables sont
toutes plus au moins lies entre elles. De plus, il nest calcul qu partir dun
chantillon dobservations et non pas sur lensemble des valeurs. On appelle x,y

8  CONOMTRIE

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 9

ce coefficient empirique qui est une estimation du coefficient vrai r x,y . La thorie des tests statistiques nous permet de lever cette indtermination.
Soit tester lhypothse H0 : r x,y = 0 , contre lhypothse H1 : r x,y = 0 .
x,y
Sous lhypothse H0, nous pouvons dmontrer que  
 suit une loi
2
1 x,y

n2

de Student n 2 degrs de libert1. Nous calculons alors une statistique, appel le t de Student empirique :
|x,y |
t =  

2
1 x,y

[3]

n2
/2
valeur lue dans une table de Student2 au seuil = 0,05 (5 %)
Si t > tn2
n 2 degrs de libert3, nous rejetons lhypothse H0, le coefficient de corrlation est donc significativement diffrent de 0 ; dans le cas contraire, lhypothse dun coefficient de corrlation nul est accepte. La loi de Student tant symtrique, nous calculons la valeur absolue du t empirique et nous procdons au test
par comparaison avec la valeur lue directement dans la table.

1. La notion de degrs de libert est explicite au chapitre 2.


2. Les lois de probabilit sont en fin douvrage.
3. Si le nombre dobservations n est suprieur 30, on peut approximer la loi de Student par une
loi normale, soit t /2 1,96 .

Quest-ce que lconomtrie ?  9

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 10

Exercice n 1

fichier C1EX1

Calcul dun coefficient de corrlation


Un agronome sintresse la liaison pouvant exister entre le rendement de mas x
(en quintal) dune parcelle de terre et la quantit dengrais y (en kilo). Il relve 10 couples de donnes consigns dans le tableau 2
Tableau 2 Rendement de mas et quantit dengrais
Rendement x

16

18

23

24

28

29

26

31

32 34

Engrais y

20

24

28

22

32

28

32

36

41 41

1) Tracer le nuage de points et le commenter.


2) Calculer le coefficient de corrlation simple et tester sa signification par rapport 0
pour un seuil = 0,05 .
Solution

Quantit dengrais

1) Le nuage de points (graphique 6) indique que les couples de valeurs sont approximativement aligns : les deux variables semblent corrles positivement.

Rendement

Graphique 6 Nuage du couple de valeurs :


rendement-quantit dengrais

10  CONOMTRIE

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 11

2) Afin dappliquer la formule [2], nous dressons le tableau de calcul 3.


Tableau 3 Calcul dun coefficient de corrlation

Somme

x2

y2

xy

20
24
28
22
32
28
32
36
41
41

256
324
529
576
784
841
676
961
1 024
1 156

400
576
784
484
1 024
784
1 024
1 296
1 681
1 681

320
432
644
528
896
812
832
1 116
1 312
1 394

304

7 127

9 734

8 286

16
18
23
24
28
29
26
31
32
34
261

(10)(8 286) (261)(304)


3 516

x,y = 
=
2
2
(56,11)(70,17)
(10)(7 127) 261 (10)(9 734) 304
2
soit x,y = 0,89 et x,y
= 0,79

Le t de Student empirique (daprs [3]) est gal :


t = 

|x,y |
(1

2
x,y
)

0,89
= 5,49 > t80,025 = 2,306
0,1 620

n2
le coefficient de corrlation entre x et y est significativement diffrent de 0.

2) Limites de la notion de corrlation


a) La relation teste est linaire
Lapplication de la formule [1] ou [2] ne permet de dterminer que des corrlations linaires entre variables. Un coefficient de corrlation nul indique que la
covariance entre la variable x et la variable y est gale 0. Cest ainsi que deux
variables en totale dpendance peuvent avoir un coefficient de corrlation nul,
comme lillustre lexemple suivant : lquation dun cercle nous est donne
par (x x1 )2 + (y y1 )2 = R 2 , les variables x et y sont bien lies entre elles
fonctionnellement (graphique 7) et pourtant leur covariance est nulle et donc
leur coefficient de corrlation gal 0.
Pour pallier cette limite, il convient ventuellement de transformer les
variables, pralablement au calcul du coefficient de corrlation, afin de linariser

Quest-ce que lconomtrie ?  11

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 12

leur relation, par exemple au moyen dune transformation de type logarithmique.

Graphique 7 Relation fonctionnelle nest pas corrlation linaire

b) Corrlation nest pas causalit


Le fait davoir un coefficient de corrlation lev entre deux variables ne signifie pas quil existe un autre lien que statistique. En dautres termes, une covariance significativement diffrente de 0 nimplique pas une liaison dordre conomique, physique ou autre. Nous appelons corrlation fortuite ce type de corrlation que rien ne peut expliquer.
Lexemple le plus fameux concerne la forte corrlation existante entre le
nombre de taches solaires observes et le taux de criminalit aux tats-Unis.
Cela ne signifie pas quil existe une relation entre les deux variables, mais
quune troisime variable, lvolution de long terme (la tendance) ici, explique
conjointement les deux phnomnes. La thorie de la cointgration traite de ce
problme (cf. chapitre 11).

12  CONOMTRIE

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 13

2. Le modle

de rgression simple

ous commenons notre tude par le modle le plus simple : une


variable endogne est explique par une variable exogne.
Aprs avoir tudi les consquences probabilistes de lerreur
dobservation, nous prsentons en I. les formules de base permettant
destimer les paramtres du modle. Les hypothses stochastiques et
leurs consquences sont tudies au paragraphe II.
En III. et IV., la qualit de lestimation dun modle est examine laide
des premiers tests statistiques (Student, Fisher).
Enfin, en V., le modle de rgression simple est tudi en tant quoutil de
prvision avec le degr de confiance que nous pouvons en attendre.

I. Prsentation du modle
A. Exemple introductif
Soit la fonction de consommation keynsienne :
C = a0 + a1 Y

o :
C
Y
a1
a0

=
=
=
=

consommation,
revenu,
propension marginale consommer,
consommation autonome ou incompressible.

Le modle de rgression simple  13

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 14

1) Vocabulaire
La variable consommation est appele variable expliquer ou variable
endogne .
La variable revenu est appele variable explicative ou variable exogne
(cest le revenu qui explique la consommation).
a1 et a0 sont les paramtres du modle ou encore les coefficients de rgression.

2) Spcification
Nous pouvons distinguer deux types de spcifications :
Les modles en srie temporelle, les variables reprsentent des phnomnes
observs intervalles de temps rguliers, par exemple la consommation et le
revenu annuel sur 20 ans pour un pays donn. Le modle scrit alors :
Ct = a0 + a1 Yt

t = 1,. . . , 20

o :
Ct = consommation au temps t ,
Yt = revenu au temps t .

Les modles en coupe instantane, les variables reprsentent des phnomnes


observs au mme instant mais concernant plusieurs individus, par exemple la
consommation et le revenu observs sur un chantillon de 20 pays. Le modle
scrit alors :
Ci = a0 + a1 Yi

i = 1,. . . , 20

o :
Ci = consommation du pays i pour une anne donne,
Yi = revenu du pays i pour une anne donne.

B. Rle du terme alatoire


Le modle tel quil vient dtre spcifi nest quune caricature de la ralit.
En effet ne retenir que le revenu pour expliquer la consommation est lvidence mme insuffisant ; il existe une multitude dautres facteurs susceptibles
dexpliquer la consommation. Cest pourquoi nous ajoutons un terme (t )
qui synthtise lensemble de ces informations non explicites dans le modle : Ct = a0 + a1 Yt + t si le modle est spcifi en srie temporelle
(Ci = a0 + a1 Yi + i si le modle est spcifi en coupe instantane), o t reprsente lerreur de spcification du modle, cest--dire lensemble des phnomnes explicatifs de la consommation non lis au revenu. Le terme t mesure la

14  CONOMTRIE

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 15

diffrence entre les valeurs rellement observes de Ct et les valeurs qui auraient
t observes si la relation spcifie avait t rigoureusement exacte. Le terme
t regroupe donc trois erreurs :
une erreur de spcification, cest--dire le fait que la seule variable explicative nest pas suffisante pour rendre compte de la totalit du phnomne expliqu ;
une erreur de mesure, les donnes ne reprsentent pas exactement le phnomne ;
une erreur de fluctuation dchantillonnage, dun chantillon lautre les
observations, et donc les estimations, sont lgrement diffrentes.

Exercice n 1

fichier C2EX1

Gnration dune consommation alatoire


Le tableau 1 prsente le revenu moyen par habitant sur 10 ans exprim en dollars
pour un pays.
Tableau 1 volution du revenu moyen par habitant en dollars
Anne

Revenu

1
2
3
4
5
6
7
8
9
10

8 000
9 000
9 500
9 500
9 800
11 000
12 000
13 000
15 000
16 000

Sachant que la propension marginale consommer est de 0,8 et que la consommation incompressible est 1 000, on demande :
1) de calculer la consommation thorique sur les 10 ans ;
2) considrant que notre erreur dobservation suit une loi normale de moyenne 0 et de
variance 20 000, de gnrer cette variable alatoire et de calculer une consommation
observe tenant compte de cette erreur.
Solution
Les calculs des questions 1) et 2) sont prsents dans le tableau 2.
La consommation thorique (colonne 3) est calcule par application directe de la
formule : Ct = 1 000 + 0,8 Yt .

Le modle de rgression simple  15