Vous êtes sur la page 1sur 31

UPB-UFR SJPEG

Cours d’Econométrie I

Année Universitaire 2014-2015


Plan du cours
Introduction générale
Chapitre I : Le modèle de régression linéaire simple
Chapitre II : Les propriétés des estimateurs des moindres carrés ordinaires
Chapitre III : Inférences dans les modèles de régression linéaire simple
Chapitre IV : Analyse de variance et choix de la forme fonctionnelle dans un modèle de
régression linéaire simple
Chapitre V : Modélisation économétrique de la fonction de consommation keynésienne

Références bibliographiques
1.Bourbonnais R., (2009), « Econométrie : Manuel et exercices corrigés »,
Édition Dunod.
2. Greene W., (2005), « Econométrie», Pearson Education, 5ème edition.
3. Carter R. Hill, William E. Griffiths et George G. Judge (2001). « Undergraduate
Econometrics », Second Edition.
4. Johnston J., (1985). « Méthodes Econométriques ». Tome 1. Editions Economica.

2
Introduction générale

L’analyse économique est basée sur des représentations théoriques (modèles) qui
décrivent les comportements des agents et les mécanismes qui sont à l’origine des
phénomènes observés. Les théories économiques sont des énoncés logiques qui reposent
sur des hypothèses plus ou moins réalistes et mènent à des conclusions économiques.
L’économétrie permet de construire des modèles pour confronter ces théories
économiques aux faits observés. Le terme « économétrie » a été forgé en 1930 par que R.
Frisch et I. Fisher.
L'économétrie peut être définie comme l'application des méthodes statistiques à l'étude
des phénomènes économiques. Elle utilise les méthodes des statistiques mathématiques et
les outils de l’inférence statistique pour mesurer empiriquement les relations postulées
par la théorie économique. Elle a deux objectifs essentiels :
 Evaluer les paramètres en jeu dans les relations économiques et tester les théories
économiques ;
 Utiliser les résultats des estimations des modèles économétriques à des fins de
prévisions et/ou de conduite de politiques économiques.
Dans la modélisation économétrique, la théorie économique guide la spécification des
modèles et des formes fonctionnelles qui traduisent mathématiquement les relations
économiques postulées. Les données quant à elles servent à valider ou invalider les
hypothèses émises sur les relations économiques. La démarche économétrique comporte
donc trois étapes :
i) La construction d’un modèle testable qui soit justifié par la théorie économique et qui
puisse être vérifié statistiquement ;
ii) L’estimation des paramètres du modèle à partir de données statistiques, les tests de
spécification et de validité des résultats obtenus par rapport à la théorie économique ;
iii) L’utilisation du modèle économétrique à des fins de prévisions et / ou d’analyse de
politiques économiques.

3
Graphique : Démarche économétrique

Théorie économique

Modélisation économétrique

Estimations économétriques

(Utilisation de données)

Tests de spécification

Modèle non adéquat Modèle est adéquat

Tests d’hypothèses

Utilisation du modèle à des fins de

prédictions et/ou de politiques économiques

Ce cours d’économétrie I est une introduction aux méthodes et modèles de base de


l’économétrie. Son objectif est de familiariser les étudiants avec les méthodes statistiques
de bases qui permettent de tester la validité des théories économiques. Il vise à rendre les
utilisateurs de ces méthodes aptes à choisir les techniques les plus adéquates pour
résoudre un problème économique donné, à interpréter les résultats obtenus lors des
applications et à évaluer la validité des hypothèses sur lesquelles reposent leurs propriétés
optimales. Un intérêt tout particulier sera porté aux exemples concrets d’application
choisis dans le domaine des sciences économiques.

4
Chapitre I : Le modèle de régression linéaire simple

Introduction
Le modèle de régression linéaire simple est le modèle le plus élémentaire destiné à
modéliser et à étudier la dépendance entre deux phénomènes économiques. La régression
simple est à la fois utilisée pour expliquer les phénomènes économiques et pour des
prévisions. Le modèle utilise des variables quantitatives et est estimé à partir de données
observées sur les périodes passées.
I.1 Spécification du modèle linéaire simple
Le modèle de régression linéaire simple est une technique qui a pour objet l’explication
d’une variable quantitative économique Y , dite variable à expliquer (ou endogène ou
dépendante), à l’aide d’une autre variable économique également quantitative X , dite
variable explicative (ou exogène ou indépendante), par une relation fonctionnelle du type
Y  f  X  . Cette relation est exprimée sous la forme d’une équation qui prédit la
variable dépendante à partir d’une fonction de la variable indépendante et de paramètres.
La fonction étant linéaire, la relation cherchée a la forme suivante :

Y  0  1 X

Où  0 et 1 sont les paramètres du modèle ;  0 est la constante et 1 le coefficient.

La relation ci-dessus représente le modèle économique et signifie que la variable


dépendante Y est entièrement expliquée par la variable indépendante X . Cependant,
d’autres variables marginales peuvent expliquer la variable dépendante Y . Le modèle
économétrique prend en compte toutes les autres variables omises, les erreurs de
spécification et de mesure des variables à l’aide d’un terme d’erreur aléatoire  . Le
modèle économétrique a alors la forme suivante :

Y  0  1 X  

Si l’on dispose d’une population mère de N observations sur les variables Y et X , le


modèle économétrique peut être s’écrire de la façon suivante :

Yi  0  1 X i   i i=1,….., N

L’objectif de la régression linéaire simple est d’estimer les paramètres  0 et 1 à partir


d’un échantillon de n observations issues de la population mère.
Soient 𝑏𝑜 et 𝑏1 les estimateurs respectifs de 𝛽𝑜 et 𝛽1 , issus de l’échantillon de n
observations. Le modèle estimé peut alors s’écrire comme suit :
𝑌𝑖 = 𝑏𝑜 + 𝑏1 𝑋𝑖 i  1,..., n

5
Pour estimer les paramètres de la population mère, il est nécessaire de supposer certaines
hypothèses sur le modèle de régression linéaire simple.
I.2 Hypothèses du modèle de régression linéaire simple
Le modèle de régression linéaire simple est fondé sur un ensemble d’hypothèses sur les
termes d’erreurs et sur la relation linéaire retenue. Ces hypothèses sont les suivantes :
H1 : Le modèle de régression est linéaire

La relation entre Y et X est linéaire : Yi  0  1 X i   i i=1,……,N

H2 : La moyenne des erreurs est nulle

E   i   0 i

H3 : La variance des erreurs est constante et finie ou homoscédasticité

V  i    2 i

H4 :Il y a indépendance entre les termes d’erreurs aléatoires

Cov  i ,  j   0 i  j

H5 : Il y a indépendance entre les termes d’erreurs aléatoires et les variables explicatives

Cov  i , X j   0 i et j

H6 : Les termes d’erreurs aléatoires sont distribués selon la loi normale

 i  N  0,  2  i

Ces hypothèses permettent de tirer quelques implications :

 H2  E Yi   0  1 X i i=1,……,N

Preuve
𝑌𝑖 = 𝛽𝑜 + 𝛽1 𝑋𝑖 + 𝜀𝑖  𝐸(𝑌𝑖 ) = 𝐸 𝛽𝑜 + 𝛽1 𝑋𝑖 + 𝜀𝑖 = 𝐸(𝛽𝑜 + 𝛽1 𝑋𝑖 ) + 𝐸(𝜀𝑖 )
 𝐸(𝑌𝑖 ) = 𝛽𝑜 + 𝛽1 𝑋𝑖
 H3 et H5  V Yi    2 i=1,……,N

Preuve
𝑌𝑖 = 𝛽𝑜 + 𝛽1 𝑋𝑖 + 𝜀𝑖  𝑉(𝑌𝑖 ) = 𝑉 𝛽𝑜 + 𝛽1 𝑋𝑖 + 𝜀𝑖
𝑉(𝑌𝑖 ) = 𝑉 𝛽𝑜 + 𝛽1 𝑋𝑖 ) + 𝑉(𝜀𝑖 − 2𝐶𝑜𝑣 𝛽𝑜 + 𝛽1 𝑋𝑖 , 𝜀𝑖
𝑉(𝑌𝑖 ) = 0 + 𝜎 2 − 2𝛽1 𝐶𝑜𝑣 𝑋𝑖 , 𝜀𝑖  𝑉(𝑌𝑖 ) = 0 + 𝜎 2 − 0
𝑉(𝑌𝑖 ) = 𝜎 2

6
 H6  𝑌𝑖 → 𝑁 𝛽𝑜 + 𝛽1 𝑋𝑖 , 𝜎 2 i=1,……,N
Preuve
𝑌𝑖 est une combinaison linéaire de variables contenant une variable aléatoire normale,
donc 𝑌𝑖 est également une variable qui suit une loi normale de moyenne et de variance
𝑌𝑖 → 𝑁 𝛽𝑜 + 𝛽1 𝑋𝑖 , 𝜎 2

 H5  𝐸 𝜀𝑖 𝑋𝑗 = 0
Preuve

Cov  i , X j   E  i X j   E  i  E  X j   E  i X j   0
i et j
Sous les hypothèses ci-dessus, les paramètres du modèle de régression linéaire simple
peuvent être estimés par la méthode des moindres carrés ordinaires.
I.3 Méthodes d’estimation des paramètres du modèle : la méthode des moindres
carrés ordinaires
Il existe plusieurs méthodes d’estimation des paramètres du modèle de régression linéaire
simple. Cependant, la méthode des moindres carrés ordinaires (MCO) est la méthode la
plus couramment utilisée pour estimer les paramètres.
Pour toute observation i de la population, l’erreur d’estimation est :

 i  Yi   0  1 X i  i=1,……,N
On estime l’erreur d’estimation de la population par le résidu issu de l’échantillon,

ei  Yi   b0  b1 X i   Yi  Yˆi i  1,..., n

La méthode des moindres carrés ordinaires consiste à minimiser la somme des carrés des
résidus (SCR).
n
MinSCR  Min ei2
i 1

n 2

 MinSCR  Min Yi   b0  b1 X i  


i 1


𝑑𝑆𝐶𝑅 𝑛
𝑑𝑏𝑜
= −2 𝑖=1 𝑌𝑖 − 𝑏0 + 𝑏1 𝑋𝑖 =0 (1)

𝑑𝑆𝐶𝑅 𝑛
= −2 𝑖=1 𝑋𝑖 𝑌𝑖 − 𝑏0 + 𝑏1 𝑋𝑖 =0 (2)
𝑑𝑏1

7
𝑛
(1)  −2 𝑖=1 𝑌𝑖 − 𝑏0 + 𝑏1 𝑋𝑖 =0
𝑛 𝑛
 𝑖=1 𝑌𝑖 − 𝑛𝑏0 − 𝑏1 𝑖=1 𝑋𝑖 =0
 𝑛𝑌 − 𝑛𝑏0 − 𝑛𝑏1 𝑋 = 0
 𝑌 − 𝑏0 − 𝑏1 𝑋 = 0
 𝑏0 = 𝑌 − 𝑏1 𝑋
𝑛
(2)  −2 𝑖=1 𝑋𝑖 𝑌𝑖 − 𝑏0 + 𝑏1 𝑋𝑖 =0
𝑛 𝑛 𝑛

𝑋𝑖 𝑌𝑖 − 𝑏0 𝑋𝑖 − 𝑏1 𝑋𝑖2 = 0
𝑖=1 𝑖=1 𝑖=1
𝑛 𝑛 𝑛

𝑋𝑖 𝑌𝑖 − (𝑌 − 𝑏1 𝑋) 𝑋𝑖 − 𝑏1 𝑋𝑖2 = 0
𝑖=1 𝑖=1 𝑖=1
𝑛 𝑛 𝑛 𝑛

𝑋𝑖 𝑌𝑖 − 𝑌 𝑋𝑖 + 𝑏1 𝑋 𝑋𝑖 − 𝑏1 𝑋𝑖2 = 0
𝑖=1 𝑖=1 𝑖=1 𝑖=1
𝑛 𝑛 𝑛 𝑛

𝑋𝑖 𝑌𝑖 − 𝑌 𝑋𝑖 + 𝑏1 (𝑋 𝑋𝑖 − 𝑋𝑖2 ) = 0
𝑖=1 𝑖=1 𝑖=1 𝑖=1
𝑛 𝑛

𝑋𝑖 𝑌𝑖 − 𝑛𝑋𝑌 + 𝑏1 (𝑛𝑋 2 − 𝑋𝑖2 ) = 0


𝑖=1 𝑖=1
𝑛 𝑛
𝑖=1 𝑋𝑖 𝑌𝑖 − 𝑛𝑋𝑌 𝑖=1(𝑋𝑖 − 𝑋 )(𝑌𝑖 − 𝑌) 𝐶𝑜𝑣(𝑋, 𝑌)
𝑏1 = 𝑛 2 2
= 𝑛 =
𝑖=1 𝑋𝑖 − 𝑛𝑋 𝑖=1(𝑋𝑖 − 𝑋)
2 𝑉(𝑋)

On peut représenter le nuage de points de l’échantillon d’observation  X i , Yi  i  1,..., n


dans un graphique.

8
Les points paraissent alignés, on peut alors proposer un modèle linéaire, c'est-à-dire
chercher la droite dont l'équation est Yˆi  b0  b1 X i qui passe le plus près de l’ensemble
des points du graphique.
Selon la méthode des moindres carrés ordinaires, la droite la plus proche de l’ensemble
des observations est celle qui minimise la somme des carrés desrésidus.
n 2

MinSCR  Min Yi   b0  b1 X i  


i 1


où Yi   b0  b1 X i  
2
représente le carré de la distance verticale du point expérimental
 X i , Yi  à la droite considérée comme la meilleure. Cela revient donc à déterminer les
valeurs des paramètres b1 et b0 qui minimisent la somme des carrés des résidus. Les
paramètres b1 et b0 représente respectivement le coefficient directeur de la droite et son
ordonnée à l'origine.

Interprétation de la relation Yi  0  1 X i   i

On peut interpréter la relation Yi  0  1 X i   i comme une décomposition de Yi en «


partie expliquée par X i » et en « partie non expliquée par X i », la première étant
0  1 X i et la seconde  i . Intuitivement, la capacité de la variable explicative à
expliquer la variable dépendante est d’autant meilleure que le terme d’erreur  i est petit.

La constante  0 s’interprète comme la valeur attendue de Yi lorsque X i  0 . Le


coefficient 1 a est interprété comme l’effet marginal de la variation d’une unité de X i
sur la variable Yi . Cette dernière interprétation fait clairement apparaître 1 comme le
paramètre d’intérêt dans le modèle linéaire simple. Le paramètre 1 capture à lui seul
toute la dépendance de Yi par rapport à X i . La formule de l’effet marginal est :

dYi
1 
dX i

9
Chapitre II : Les propriétés des estimateurs des moindres carrés
ordinaires

Introduction
L’objectif de ce chapitre est d’examiner en détail les propriétés statistiques des
estimateurs des moindres carrés ordinaires (EMCO). Il s’agit de voir si les estimateurs de
MCO b0 et b1 sont les meilleures estimateurs linéaires de  0 et 1 . Un bon estimateur
doit être sans biais, efficace (précis) et convergent.
II.1 Espérance mathématique des estimateurs
Dans un modèle de régression linéaire simple, pour montrer que les estimateurs sont sans
biais, il faut étudier leurs espérances mathématiques sur plusieurs échantillons de même
taille. Pour ce faire, montrons d’abord que les estimateurs des moindres carrés ordinaires
sont des variables aléatoires distribuées selon la loi normale.
n

 Y  Y  X
i i X
b1  i 1
n

 X X
2
i
i 1

Posons
n
S xy    X i  X Yi  Y   
i 1
n
=  Yi X i  nYX
i 1
n n
=  Yi X i  X  Yi
i=1 i=1
n
  Yi  X i  X 
i 1

n
S xx    X i  X 
2

i 1
n
  X i2  nX 2
i=1
n n
=  X i2  X  X i
i=1 i 1
n
= X i  X i  X 
i 1

10
n
S yy   Yi  Y 
2

i 1
n
=  Yi 2  nY 2
i 1
n n
=  Yi 2  Y  Yi
i 1 i 1
n
=  Yi Yi  Y 
i 1

S xy
D’ou b1 
S xx
n
 
Y  X i i X n  Xi  X  
b1  i 1
 b1   Yi  n 
 2 
n

 X X    Xi  X  
2 i 1
i
i 1 i 1 

X  X  n
En posant ci  , on peut écrire b1  Y c
i
n i i

 X  X 
2 i 1
i
i 1

L’estimateur b1 est une variable aléatoire distribuée selon la loi normale car il est une
combinaison de variables aléatoires distribuées selon la loi normale.

b0  Y  b1 X
1 n n
= 
n i 1
Yi  X  Yi ci
i 1
n
1 
=  Yi   Xci 
i 1 n 
n
=  Yi ai
i 1

1
Avec ai   Xci
n
L’estimateur b0 est une variable aléatoire distribuée selon la loi normale car il est une
combinaison de variables aléatoires distribuées selon la loi normale.
Les estimateurs des MCO sont des variables aléatoires obtenues à partir d’un échantillon
de n observations d’une population. Les estimateurs des MCO seront donc différents d’un
échantillon à un autre.

11
L’estimateur d’un paramètre est dit sans biais lorsque l’espérance mathématique de tous
estimateurs des MCO issue d’échantillons de taille n possibles est égale à ce paramètre.

Calcul de E  b1 

 n 
E  b1   E   Yi ci 
 i 1 
n
  E Yi  ci
i 1
n
  E   0  1 X i  ci
i 1
n n
  0  ci  1  X i ci
i 1 i 1

n n
Xi  X
 ci   n

 X X
2
i 1 i 1
i
i 1
n

 X X0
1
 n i

 X X
2
i 1
i
i 1

 
n  X X  n

 X i ci   X i  n i 

 Xi  X  
2

 
i 1 i 1

i 1 
n
X X
  Xi i
i 1 S xx
n

 X X X
1
 i i
S xx i 1

1
 S xx
S xx
1

d’où E  b1   1 , l’estimateur b1 est donc un estimateur sans biais du paramètre 1

12
Calcul de E  b0 

E  b0   E Y  b1 X 
 E   0  1 X  b1 X 
 E   0   E  X 1   E  b1 X 
  0  X 1  E  b1  X
  0  X 1  X 1

d’où E  b0   0 , l’estimateur b0 est donc un estimateur sans biais du paramètre  0

Les estimateurs des moindres carrés ordinaires sont donc des estimateurs sans biais.
II.2 Variance des estimateurs
Les variances des estimateurs des MCO sont dits efficaces s’ils ont les plus petites
variances parmi les estimateurs linéaires sans biais de  0 et 1 . Selon le théorème de
Gauss-Markov, «dans le modèle de régression linéaire simple, si les paramètres  0 et 1
sont identifiés, les estimateurs des moindres carrés ordinaires sont les estimateurs qui ont
les plus petites variances parmi tous les estimateurs linéaires sans biais de  0 et 1 ». Ce
théorème affirme que les estimateurs des moindres carrés ordinaires sont « BLUE » (best
linearunbiased) c'est-à-dire qu’ils sont linéaires, sans biais et de variance minimale. Ce
sont donc les estimateurs les plus précis et les plus efficaces. Pour étudier l’efficacité des
estimateurs des MCO, il est nécessaire de déterminer au préalable leurs variances et
covariances.
II.2.1 Variance, covariance et distribution des estimateurs des moindres carrés
ordinaires

Calcul de V  b1 

 n 
V  b1   V   Yi ci 
 i 1 
n
  V Yi ci 
i 1
n
  ci2V Yi 
i 1
n
  ci2 2
i 1
n
  2  ci2
i 1

13
2
 
n  
X  X
V  b1    2   n i 
i 1 
   X i  X  
2

i 1 
2
X X  n
  i 2

i 1  S xx 
2 n 2


S xx2
 Xi  X 
i 1

 2
 S xx
S xx2
2

S xx
2
V  b1   2

 Xi  X 
n

i 1

Calcul de V  b0 

n
b0 =  Yi ai
i 1

 n 
V  b0  =V   Yi ai 
 i 1 
n
  ai2V Yi 
i 1
n
  ai2 2
i 1
2
1 
n
     Xci 
2

i 1  n 
n
 1 2 Xci 
  2 2   X 2 ci2 
i 1  n n 
 1 2X n n

   2
c  X c i
2 2
i 
n n i 1 i 1 
1 n

  2   0  X 2  ci2 
n i 1 

14
   
2

 n   
2 1 Xi  X
V  b0    X  n2
  
n i 1 
2  
   Xi  X   
  i 1  
 n
 Xi  X  
2
2 1
    X  2
 
 n i 1  S xx  

1 X 2

  2   2 S xx 
 n S xx 
1 X2 
2   
 n S xx 

 
1 X 2 
V  b0    2   n 
n 2 
   Xi  X  
 i 1 

Calcul de Cov  b0 , b1 

 n n

Cov  b0 , b1   Cov   Yi ai ,  Yi ci 
 i 1 i 1 
n
  ai ci Cov Yi , Yi 
i 1
n
  ai ciV Yi 
i 1
n
  ai ci 2
i 1
n
1 
  2    Xci ci
i 1  n 
n
c 
  2   i  Xci2 
i 1  n 
 c n n

  2   i  X  ci2 
 i 1 n i 1 
1 n n

    ci  X  ci2 
2

 n i 1 i 1 
n
  2 X  ci2
i 1

15
2
 
n 
X X 
  2 X   n i 
i 1 
 Xi  X  
2

 
i 1 
 2 X n 2


S xx2
 X
i 1
i X

 2 X
 S xx
S xx2
 2 X

S xx

 2 X
Cov  b0 , b1   n

 X X
2
i
i 1

Distribution des EMCO


Les estimateurs des moindres carrés ordinaires sont distribués selon une loi normale.

  
 1 X 2 

b0  N  0 ,  2
  n 
 n 2 
    Xi  X  
  i 1 

 
 
 2
b1  N  1 , 
 n 2

  Xi  X  
 i 1 
NB Dans un modèle de régression linéaire simple, on montre que le meilleur estimateur
1 n 2
de  2 est la variable aléatoire S 2  
n  2 i 1
ei . C’est un estimateur sans biais de  2

 
car on a E S 2   2 .

II.2.2 Efficacité des estimateurs


Selon le théorème de Gauss-Markov, les estimateurs des moindres carrés ordinaires sont
les estimateurs linéaires les plus efficaces. Considérons un autre estimateur linéaire 1' de
1' tel que,

16
n
b1'   Yi di
i 1

 n 
E  b1'   E   Yi d i 
 i 1 
n
  di E Yi 
i 1

On sait que

Yi  0  1 X i   i

Y  0  1 X

Yi  Y  1  X i  X    i
yi  1 xi   i

  d E  x   
n
d’où E b1'  i 1 i i
i 1

E  b1'    di E  1 xi   i 
n

i 1

E  b1'   1  di xi
n

i 1

n
Si b1' est un estimateur sans biais de 1 , d x
i 1
i i 1

n
Supposons que d x
i 1
i i  1 c’est-à-dire que b1' est un estimateur sans biais de 1

 n 
V  b1'   V   yi d i 
 i 1 
n
  di2V  yi 
i 1
n
  di2 2
i 1
n
  2  di2
i 1

17
 
n
Pour que V b1' soit minimale, il faut que  2 d
i 1
i
2
soit minimale sous la contrainte

d x
i 1
i i 1

 n
 n
Min   2  di2  s/c d x i i 1
 i 1  i 1

La fonction de lagrange est,


n
 n

L  di ,     di2   1   di xi 
i 1  i 1 
CPO

L n n
 2 di    xi  0 (1)
di i 1 i 1

L n
 1   di xi  0 (2)
 i 1

n n
2 di    xi (1)
i 1 i 1

d x
i 1
i i 1 (2)

(1) et (2)
n n
2 di xi    xi2
i 1 i 1

n
2    xi2
i 1

2
 n

x
i 1
2
i

 
n  2  n
2 d i   n   xi
 x 2  i 1
 i 
i 1

 i 1 

18
n

n x i

d i  i 1
n
i 1
x
i 1
2
i

n n
xi
 di   n
i 1 i 1
x
i 1
2
i

n n
Xi  X
d   i n

 X X
2
i 1 i 1
i
i 1

n n
  di   ci  di  ci
i 1 i 1

D’où b1'  b1

Par conséquent, tout estimateur sans biais et efficace de 1 est forcément un estimateur
des moindres carrés ordinaires. Une démarche similaire permet de montrer que b0 est le
seul estimateur linéaire sans biais et efficace de  0

II.3 Convergence des estimateurs

Les estimateurs des moindres carrés ordinaires bi convergent vers les paramètres  i .
Pour tout 𝜇 aussi petit que possible, on aura :

lim p  bi  i     0
n 

Ou lim V  bi   0
n 

19
Chapitre III : Inférences dans les modèles de régression linéaire
simple

Avant d’utiliser les résultats d’un modèle économétrique à des fins de prévisions et/ou de
politiques économiques, il est nécessaire de faire des inférences statistiques sur les
paramètres d’intérêts. Cette opération permet de savoir si les résultats obtenus sont
conformes à la théorie économique et ont un niveau de confiance satisfaisant.
III.1 Tests d’hypothèses sur les paramètres
Les tests d’hypothèse permettent de confirmer ou d’infirmer les relations postulées par la
théorie économique. Dans le modèle de régression linéaire simple, le paramètre 1 est le
paramètre d’intérêt sur lequel porte les tests d’hypothèse.

III.1.1 Test de signification individuelle d’un paramètre 1

Le MRLS postule que la variable Y dépend de la variable X selon la relation


Y  0  1 X   . Une question essentielle est celle de l’existence réelle d’une telle
relation de dépendance. Pour étudier la question, on peut poser et résoudre le test
d’hypothèse suivant :

H 0 : 1  0 , X n’a pas d’influence sur Y

H1 : 1  0 , X a une influence sur Y

Où H 0 est l’hypothèse nulle et H1 l’hypothèse alternative

Pour tester cette hypothèse, on utilise la distribution théorique de Student :


b1  1
T  t  n  2
Sb1

b1
Sous l’hypothèse H 0 , on calcul la statistique Tc 
Sb1

Pour prendre la décision, on compare la statistique Tc avec la loi théorique t de student


au seuil  lu sur la table bilatérale. Les règles de décision sont les suivantes :

Si Tc  t 2  n  2  , on rejette H 0

Si Tc  t 2  n  2  , on ne rejette pas H 0

Les valeurs théoriques de la distribution du Student sont données par la table de Student

20
III.1.2 Test d’une valeur quelconque du paramètre 1

On peut être intéressé par des problèmes dans lesquels la valeur testée est une valeur
quelconque b de 1 . Pour étudier la question, il faut poser et résoudre le test d’hypothèse
suivant :

H 0 : 1  c

H1 : 1  c

Où H 0 est l’hypothèse nulle et H1 l’hypothèse alternative

Pour tester cette hypothèse, on utilise la distribution théorique de Student :

b1  1
T  t  n  2
Sb1

b1  c
Sous l’hypothèse H 0 , on calcul la statistique Tc 
Sb1

Pour prendre la décision, on compare la statistique Tc avec la loi théorique t de Student


au seuil  lu sur la table bilatérale. Les règles de décision sont les suivantes :

Si Tc  t  n  2  , on rejette H 0

Si Tc  t  n  2  , on ne rejette H 0

21
III.1.3 Test d’une inégalité sur le paramètre 1

De manière plus générale, on peut être amené à tester

H 0 : 1  c

H1 : 1 >c

Où H 0 est l’hypothèse nulle et H1 l’hypothèse alternative et c est une valeur donnée et


connue. Dans le cas d’un test de signe, c  0
Pour tester cette hypothèse, on utilise la distribution théorique de Student :

b1  1
T  t  n  2
Sb1

b1  c
Sous l’hypothèse H 0 , on calcul la statistique Tc 
Sb1

Pour prendre la décision, on compare la statistique Tc avec la loi théorique t de Student


au seuil  lu sur la table unilatérale à droite. Les règles de décision sont les suivantes :

Si Tc  t  n  2  , on rejette H 0

Si Tc  t  n  2  , on ne rejette H 0

22
On peut aussi tester,

H 0 : 1  c

H1 : 1  c
Pour tester cette hypothèse, on utilise la distribution théorique de Student :
b1  1
T  t  n  2
Sb1

b1  c
Sous l’hypothèse H 0 , on calcul la statistique Tc 
Sb1

Pour prendre la décision, on compare la statistique Tc avec la loi théorique t de Student


au seuil  lu sur la table unilatérale à gauche. Les règles de décision sont les suivantes :

Si Tc  t  n  2  , on rejette H 0

Si Tc  t  n  2  , on ne rejette H 0

III.2 Intervalle de confiance


L’intervalle de confiance permet de déterminer la région de l’espace dans laquelle, il y a
de forte chance de trouver la valeur inconnue des paramètres. Pour construire l’intervalle
de confiance autour du paramètre 1 au seuil de confiance 1   , on détermine une borne
inférieure (BI) et une borne supérieure (BS) de sorte que 1    p  BI  1  BS  .

Autrement dit, IC1  1    BI , BS  . La statistique de Student permet de déterminer ces


bornes.

23
p  t  T  t   1  

 b  
p  t  1 1  t   1  
 Sb1 
 

 
p b1  t Sb1  1  b1  t Sb1  1  

IC1  1   b1  t Sb1 , b1  t Sb1 

III.3 Prédiction
La prédiction permet de prédire la valeur de Y à partir d’une valeur donnée de X .
Considérons le modèle économétrique suivant,

Yi  0  1 X i   i

Le modèle estimé est

Yˆi  b0  b1 X i

Pour un niveau donné de X 0 , la vraie valeur de Y0 est Ŷ0  b0  b1 X 0

Où Yˆ0 représente la prédiction de Y0

La prévision est entachée d’erreur, il est plus intéressant de produire un intervalle de


prévision sur laquelle nous contrôlons la probabilité d’erreur. L’erreur de prédiction est
définie par :

e0  Yˆ0  Y0
  b0  b1 X 0     0  1 X   0 
  b0   0   X 0  b1  1    0

Espérance mathématique de e0

E  e0   E  b0   0   X 0  b1  1    0 
 E  b0   E   0   X 0 E  b1   X 0 E  1   E   0 
  0   0  X 0 1  X 0 1  0

E  e0   0

24
Variance de e0

V  e0   V  b0   0   X 0  b1  1    0 
 V  b0   0   V  X 0  b1  1    V   0   2Cov  b0   0  , X 0  b1  1  
2Cov  b0   0  ,  0   2Cov  X 0  b1  1  ,  0 
2X 0 X 2
V  e0   V  b0   X V  b1    
2
0
2
n

 X X
2
i
i 1

 
 1 (X  X0) 2 
V  e0    2 1   n 
 n
 Xi  X  
2

 i 1 
Intervalle de confiance autour de Y0

IC(1 ) Y0   Y0  t Se0 , Y0  t Se0 

25
Chapitre IV : Analyse de variance et choix d’une forme
fonctionnelle dans un modèle de régression linéaire simple

Introduction
L’équation d’analyse de la variance permet de calculer le coefficient de détermination et
évaluer la qualité globale de l’estimation du modèle économétrique. En utilisant
différentes transformations, de nombreuses formes fonctionnelles peuvent être utilisées
dans un modèle de régression linéaire simple.
IV.1 Equation d’analyse de la variance
L’équation d’analyse de la variance de Y permet de juger de la qualité de l’ajustement
d’un modèle économétrique. Considérons la déviation de Yi par rapport à la moyenne Y ,
Yi  Y , i  1,..., n


Yi  Y  Yi  Yˆi  Yˆi  Y   
Y  Y     
2
  Yi  Yˆi  Yˆi  Y 
2
i
 

 Y  Y    Y  Yˆ   Yˆ  Y 


n n 2
2
i i i i
i 1 i 1

   Yˆ  Y    
n
Yi  Y     Yi  Yˆi
n

  2 Yi  Yˆi Yˆi  Y 
2 2 2

i 1 i 1
i


 Y  Y    Y  Yˆ    Yˆ  Y    
n n n n
 2 Yi  Yˆi Yˆi  Y
2 2 2
i i i i
i 1 i 1 i 1 i 1

    
n n
Yi  Yˆi Yˆi  Y   ei Yˆi  Y
i 1 i 1
n n
= ei Yˆi  Y  ei
i 1 i 1
n n
= ei  bo  b1 X i   Y  ei
i 1 i 1
n n n
=bo  ei  b1  ei X i  Y  ei
i 1 i 1 i 1

=0

 Y  Yˆ Yˆ  Y   0
n

i i i
i 1

D’où l’équation fondamentale d’analyse de la variance devient,

26
    Yˆ  Y 
n n n

 Y  Y  
2 2
Yi  Yˆi
2
i i
i 1 i 1 i 1

Autrement dit, SCT  SCR  SCE


Cette égalité correspond à la décomposition de la variance totale (SCT) en variance
résiduelle (SCR) et en variance expliquée (SCE).
n
SCT   Yi  Y  est la somme des carrés totaux
2

i 1

 
n
SCR   Yi  Yˆi
2
est la somme des carrés des résidus
i 1

 
n
SCE   Yˆi  Y
2
est la somme des carrés expliqués
i 1

L’ajustement global du modèle est d’autant meilleur que la variance expliquée est proche
de la variance totale. À partir de l’équation d’analyse de la variance, on peut calculer le
coefficient de détermination.
IV.2 Le coefficient de détermination
Le coefficient de détermination mesure la capacité de la variable explicative à déterminer
le niveau de la variable dépendante. C’est l’indicateur usuel d’adéquation du modèle
économétrique. Sa formule est la suivante :
SCE SCR
R2   1 ,
SCT SCT
R 2 s’interprète comme le pourcentage de variation de la variable dépendante qui est
expliqué par la variable indépendante. Plus il est proche de l'unité, plus les valeurs
observées et les valeurs calculées par le modèle sont proches. Il faut noter que R 2 a
tendance à croître avec le nombre de variables explicatives du modèle. Il est alors
préférable de le corriger en utilisant le R2 ajusté.
SCR /(n  2)
R2  1 
SCT /(n  1)
IV.3 Le choix de la forme fonctionnelle
Un modèle de régression simple est linéaire lorsque sa forme fonctionnelle est linéaire
par rapport à la variable ou linéaire après une transformation approprié. La linéarité se
réfère à la manière dont les paramètres et le terme d’erreur sont incorporés dans
l’équation, pas nécessairement à la relation entre les variables. Par exemple le modèle
Y  0 X 1 e est linéaire après transformation logarithmique, alors que ce n’est pas le
cas du modèle Y  0 X 1   . Le modèle Y  0 X 1 e est donc intrinsèquement
linéaire.

27
Il existe de nombreuses formes fonctionnelles qui peuvent être utilisées dans le cadre
d’un modèle de régression linéaire simple. Les formes fonctionnelles les plus
couramment utilisées sont les suivantes :
i) La forme fonctionnelle linéaire

Y  0  1 X  

dY
L’effet marginal est :  1
dX
dY X X
L’élasticité est :    1
dX Y Y

ii) La forme fonctionnelle log-linéaire


forme intrinsèquement linéaire et très utilisée par les économistes

Y  0 X 1 e
La transformation logarithmique permet de rendre cette forme fonctionnelle linéaire,

ln Y  ln 0  1 ln X  

Y '  0'  1 X '  


L’effet marginal est :
d ln Y dY Y
  1
d ln X dX X
dY X
 1
Y dX
dY Y
 1
dX X
L’élasticité est :

dY X Y X
  1
dX Y X Y
  1
iii) La forme fonctionnelle exponentielle (ou géométrique)

Cette forme fonctionnelle est utilisée lorsque l’évolution de Y est constante dans le
temps ; elle représente un type d’évolution qui ne dure pas longtemps et est surtout utilisé
lorsque X représente le temps. Sa formule est :

Y  e0  1 X 
Sa transformation logarithmique permet d’obtenir une forme linéaire,

28
lnY  0  1 X  

Y '  0  1 X  

L’effet marginal est :

d ln Y dY Y dY 1
   1
dX dX dX Y
dY
 1Y
dX

L’élasticité est :

  1Y 
dY X X

dX Y Y
  1 X

iv) La forme fonctionnelle logarithmique


Cette forme fonctionnelle représente les cas d’évolution de Y qui s’épuise dans le temps.
Sa formule est la suivante :

Y  0  1 ln X  

Y  0  1 X '  
L’effet margina est,
dY dY dY
 X  1
d ln X dX X dX

dY 1

dX X
L’élasticité est,

dY X 1 X
 
dX Y X Y
1

Y

29
Chapitre V : Modélisation de la fonction de consommation
keynésienne

L’analyse économétrique se fonde en général sur un énoncé de la théorie économique.


L’objectif de ce chapitre est de modéliser économétriquement la théorie keynésienne de
la consommation.
V.1 Théorie keynésienne de la consommation
Dans son ouvrage, « La théorie générale de l’emploi, de l’intérêt et de la monnaie »,
Keynes (1936) écrit :
« On définira donc ce que l’on appellera la propension à consommer comme étant la
relation fonctionnelle f entre X, un niveau de revenu, et C, la dépense de consommation
correspondante à ce montant de telle sorte que C=f(X).
Le montant que la communauté dépense pour sa consommation dépend : 1° en partie du
montant de son revenu ; 2° en partie des autres circonstances objectives qui
accompagnent ce revenu ; et 3° en partie des besoins subjectifs, des penchants
psychologiques et des habitudes des individus qui la composent. La loi psychologique
fondamentale, à laquelle on peut faire toute confiance, à la foi a priori en raison de notre
connaissance de la nature humaine et a posteriori en raison des enseignements de
l’expérience, c’est qu’en moyenne et la plupart du temps les Hommes tendent à accroître
leur consommation à mesure que leur revenu croît, mais non d’une quantité aussi grande
que l’accroissement du revenu. C’est dire que …….dC/dX est positif et inférieur à
l’unité.
Mais, en dehors des variations de courtes périodes du revenu, il est encore évident qu’un
haut niveau absolu du revenu contribue, en règle générale à augmenter l’écart entre le
revenu et la consommation ….. Ces raisons font qu’en général une proportion de plus en
plus importante du revenu est épargnée à mesure que le revenu réel croît ».
V.2 Modélisation économique de la consommation keynésienne
La théorie keynésienne soutient une relation entre la consommation et le revenu, C=f(X),
et affirme que la propension marginale à consommer (pmc= dC/dX) est comprise entre 0
et 1. La formulation la plus commune de la fonction de consommation keynésienne est
une relation linéaire, C  0  1 X , qui vérifie la loi de Keynes si 1 est compris entre
0 et 1 et  0 est plus grand que zéro. Ces propositions théoriques constituent la base
d’une étude économétrique.
V.3 Modélisation économétrique de la consommation keynésienne
Considérons une enquête réalisée sur un échantillon de n ménages pour collecter des
informations sur la consommation et le revenu d’une population donnée. Le modèle
économétrique de la consommation keynésienne à étudier est le suivant :

Ci  0  1 X i   i i  1,..., n

30
Le travail à faire est le suivant :
1. Estimer économétriquement la fonction de consommation keynésienne des ménages.
2. Apprécier la spécification linéaire pour voir si c’est une description satisfaisante la
relation entre la consommation et le revenu
3. Dire si la théorie keynésienne de la consommation est confirmée par les faits observés.
4. Faire des prédictions ou des recommandations de politiques économiques

31

Vous aimerez peut-être aussi