Académique Documents
Professionnel Documents
Culture Documents
Support de cours
Econométrie du Modèle Linéaire
SOMMAIRE
SOMMAIRE ---------------------------------------------------------------------------- 1
1
Cours d’Econométrie du Modèle Linéaire – AS2
Objectifs du cours :
Présenter les méthodes statistiques explicatives multivariées sous l’angle de la statistique
inférentielle (fondée sur une modélisation probabiliste). Les modèles présentés ici sont ceux qui
prétendent expliquer une variable quantitative observée. Après l’approche probabiliste, de
nombreux exemples pratiques seront traités.
Contenu du cours :
Bibliographie :
Berry W.D. and Feldman S. (1985), Multiple Regression in Pratice , SAGE university papers.
Bourdonnais R. (2004), Econométrie, Dunod.
William Greene, Théophile A. Phu N. (2011), Econométrie, Pearson Education ; 7e edition
Fox J. (1991), Regression Diagnostics, SAGE university papers.
Hardy M. (1993), Regression with Dummy Variables, SAGE university papers.
Iversen G.R and H. Norpoth (1976), Analysis of Variance, SAGE university papers.
Johnson (1985), Econométrie, tomes 1 et 2, Economica.
Netter J., W. Wasserman, M. Kurtner, (1985), Regression Analysis of Variance and Experimental
design, Eds Irwin Homewood.
Saporta G. (1990), Probabilités, analyse des données et statistique, Technip.
Wildt A.R and Hatola O.T. (1978), Analysis of Covariance, SAGE university papers.
2
Cours d’Econométrie du Modèle Linéaire – AS2
Par exemple, si on se propose d’étudier la consommation d’un certain bien par les
ménages, la théorique économique postule que C = f (R ) .
3
Cours d’Econométrie du Modèle Linéaire – AS2
Donc, dans le cadre de l’économétrie, un modèle peut être considéré comme « une
présentation formalisée d’un phénomène sous forme d’équations dont les variables sont des
grandeurs économiques. »1
On parle de modèle linéaire lorsque la forme fonctionnelle 𝑓 est linéaire.
Deux variables sont dites corrélées lorsqu’elles ont tendance à avoir une évolution
commune.
Lorsque cette tendance d’évolution va dans le même sens (elles croissent ensemble, ou
elles décroissent ensemble, ou encore elles stagnent ensemble), on dit qu’elles sont
corrélées positivement. Si par contre, une variable a tendance à croître lorsque les valeurs
de l’autre variable décroissent, on dit qu’elles sont corrélées négativement.
Figure 3 : corrélation non linéaire positive Figure 4 : corrélation non linéaire négative
4
Cours d’Econométrie du Modèle Linéaire – AS2
S’il n’y a aucune relation entre les variations des valeurs de l’une des variables et les
valeurs de l’autre, on dit que ces variables sont non corrélées.
Dans le cas des modèles linéaires, la corrélation souhaitée est linéaire. Elle est mesurée
par le coefficient de corrélation (linéaire) ou coefficient de corrélation de Pearson.
Si l’on dispose plutôt d'un échantillon de n observations (𝑥𝑖 , 𝑦𝑖 )𝑖=1,2,…,𝑛 des variables X et
Y, 𝜌(𝑋, 𝑌) est estimé par
• 𝜌(𝑋, 𝑌) = 1 ∶ tous les points du nuage sont alignés le long d’une droite de pente
positive
• 𝜌(𝑋, 𝑌) = −1 ∶ tous les points du nuage sont alignés le long d’une droite de pente
négative.
5
Cours d’Econométrie du Modèle Linéaire – AS2
Remarques
Il est toujours possible et plus facile de réaliser un test statistique en utilisant la P-
valeur ou probabilité critique (P-value ou significance en anglais).
𝑆𝑖 𝑃 < 𝛼 → 𝑅𝑒𝑗𝑒𝑡 𝑑𝑒 𝐻0
𝑆𝑖 𝑃 ≥ 𝛼 → 𝑁𝑜𝑛 𝑟𝑒𝑗𝑒𝑡 (𝑎𝑐𝑐𝑒𝑝𝑡𝑎𝑡𝑖𝑜𝑛) 𝑑𝑒 𝐻0
Dans le cas où l'on rejette H0, on peut construire un modèle de régression linéaire
simple sur la relation entre X et Y.
Exercice d’application
6
Cours d’Econométrie du Modèle Linéaire – AS2
Pour recourir à cet outil statistique, il convient de se rassurer au préalable qu'il existe une
liaison linéaire significative entre les deux variables. Ce qui peut se faire à travers un
graphique (nuage de points) et un test de significativité de la corrélation (voir chapitre
précédent).
Considérons deux variables quantitatives X (la superficie cultivée de maïs par exemple)
et Y (la production de maïs par exemple) pour lesquelles on dispose d'un échantillon de n
observations (𝑥𝑖 , 𝑦𝑖 )𝑖=1,2,…,𝑛 .
2
Le modèle peut être spécifié en série temporelle (variables observées à intervalles de temps réguliers) ou en
coupe instantanée (variables observées au même instant sur un échantillon de plusieurs individus). C’est cette
dernière option que nous retenons.
3 On trouve d'autres appellations dans la littérature :
• Variable expliquée ~ variable endogène ~ variable dépendante, variable réponse, etc.
• Variable explicative ~ variable exogène ~ variable indépendante, variable de contrôle, régresseur,
etc.
Le terme “simple” fait référence au fait qu’il n’y a qu’une seule variable explicative X pour expliquer Y.
7
Cours d’Econométrie du Modèle Linéaire – AS2
Estimer un modèle revient à trouver des valeurs à ses paramètres inconnus sur la base
des données d'échantillon. Dans le cas du MRLS, ses paramètres (𝛽0 , 𝛽1 , 𝜎 2 ) peuvent être
estimés soit par la méthode des moindres carrés, soit par la méthode du maximum de
vraisemblance.
2.2.1. Estimation de 𝜷𝟎 et 𝜷𝟏
Par la MMC, on recherche les valeurs de 𝛽0 𝑒𝑡 𝛽1 qui minimisent la somme des carrés des
erreurs du modèle 𝑆(𝛽0 , 𝛽1 ) = ∑𝑛𝑖=1 𝜀𝑖2 = ∑𝑛𝑖=1(𝑦𝑖 − 𝛽0 − 𝛽1 𝑥𝑖 )2.
4Cette dernière hypothèse n'est pas indispensable. Son utilité est dans la méthode d'estimation par le
maximum de vraisemblance et pour l'inférence.
Le modèle linéaire qui comporte cette hypothèse est appelé modèle linéaire gaussien.
8
Cours d’Econométrie du Modèle Linéaire – AS2
̂𝟎 et 𝜷
2.2.2. Propriétés de 𝜷 ̂𝟏
• ̂0 et 𝛽
Les estimateurs 𝛽 ̂1 de 𝛽0 et 𝛽1 sont sans biais.
̂0 ) = 𝛽0 et
𝐸(𝛽
̂1 ) = 𝛽1
𝐸(𝛽
• ̂0 et 𝛽
Les estimateurs 𝛽 ̂1 de 𝛽0 et 𝛽1 sont aussi de variance minimale parmi tous les
estimateurs linéaires (par rapport à 𝑦𝑖 , … , 𝑦𝑛 ) sans biais (théorème de Gauss-
Markov).
1 𝑥̅ 2
̂0 ) = 𝜎̂
𝑉𝑎𝑟(𝛽 2
= 𝜎2 [ + 𝑛 ] [2.4]
𝛽0 𝑛 ∑𝑖=1(𝑥𝑖 −𝑥̅ )2
𝜎 2
̂1 ) = 𝜎̂
𝑉𝑎𝑟(𝛽 2
= [2.5]
𝛽1 ∑𝑛
𝑖=1 𝑖 −𝑥̅ )
(𝑥 2
−𝑥̅
̂0 , 𝛽
𝐶𝑜𝑣(𝛽 ̂1 ) = 𝜎 2 [ 𝑛 [2.6]
2]
∑ 𝑖=1 𝑖 −𝑥̅ )
(𝑥
2.2.3. Estimation de 𝝈𝟐
La variance des erreurs 𝜎 2 est estimée sans biais par la MMC par 5 :
𝑛 2
̂2 = ∑𝑖=1 𝜀̂𝑖
𝜎 [2.7]
𝑛−2
̂𝟎 , 𝜷
2.2.4. Autres propriétés de 𝜷 ̂𝟐
̂𝟏 et 𝝈
̂0 ~𝑁 (𝛽0 , 𝜎̂
𝛽 2
)
𝛽0
̂1 ~𝑁 (𝛽1 , 𝜎̂
𝛽 2
)
𝛽1
̂2
(𝑛−2)𝜎
~2 (𝑛 − 2)
𝜎2
̂2 sont indépendantes.
̂0 et 𝜎
𝛽
̂2 sont indépendantes.
̂1 et 𝜎
𝛽
2
∑𝑛
𝑖=1 𝜀̂𝑖
5 ̂2
L’estimateur (biaisé) de 𝜎 2 par la MMV est 𝜎 = 𝑛
9
Cours d’Econométrie du Modèle Linéaire – AS2
Pour valider un modèle, on vérifie le caractère plausible des hypothèses grâce aux
résultats de l'estimation ; en particulier, les conditions concernant les erreurs
(𝜀𝑖 ) utilisent les résidus (𝜀̂).
𝑖 On peut également effectuer des tests de significativité des
paramètres du modèle . 6
Pour cela, on peut soit faire des graphiques, soit réaliser des tests statistiques.
les points soient répartis aléatoirement dans le plan (sans une forme
particulière).
6
La validation d’un modèle linéaire passe par l’examen de la qualité d’ajustement, les graphes des résidus
(simples, standardisés ou studentisés), les Q-Q ou P-P plots et les tests d’ajustement (Shapiro-Wilks,
Kolmogorov-Smirnov, etc.) – Source : Ana Karina Fermin, Univ. Paris Nanterre (http://fermin.perso.math.cnrs.fr/)
10
Cours d’Econométrie du Modèle Linéaire – AS2
On observe une tendance parabolique évidente dans les résidus du graphique ci-dessus (qui
ne sauraient donc être aléatoires).
Il faudrait donc prendre en compte cette structure, par exemple en ajoutant un terme
quadratique 𝑥 2 dans la partie explicative du modèle.
Ici, la variance des résidus augmente en fonction des valeurs prédites. Il n’y a donc pas
homoscédasticité.
11
Cours d’Econométrie du Modèle Linéaire – AS2
𝜀̂𝑖
𝜀̂𝑖∗ = ̂ √1−ℎ𝑖𝑖
𝜎
1 (𝑥𝑖 −𝑥̅ )2
avec7 ℎ𝑖𝑖 = 𝑛 + 2
∑𝑛
𝑗=1(𝑥𝑗 −𝑥̅ )
On s'attend à ce qu'au moins 95% des points du nuage soient compris entre
les valeurs -2 et +2 de l'axe des résidus.
Les éléments diagonaux ℎ𝑖𝑖 de cette matrice mesurent ainsi l’impact ou l’importance du rôle que joue 𝑦𝑖
dans l’estimation de 𝑦̂.𝑖
Par ailleurs, même si l’hypothèse d’homoscédasticité est vérifiée, les résidus n’ont pas la même variance
𝑖 = 𝜎²(1 − ℎ𝑖𝑖 )
𝑉𝑎𝑟(𝜀̂)
Il est donc d’usage d’en calculer des versions standardisées afin de les rendre comparables.
8 Ce test ainsi que les deux qui suivent sont bilatéraux ; on peut aussi effectuer des tests unilatéraux.
• Dans le cas du test unilatéral gauche (𝐻1 : 𝛽1 < 0), on va rejeter 𝐻0 au seuil 𝛼 si 𝑡 < 𝑡𝛼 (𝑛 − 2),
𝑡𝛼 (𝑛 − 2) étant le quantile /fractile d'ordre 𝛼 de la loi de Student à 𝑛 − 2 degrés de liberté.
• Pour le cas du test unilatéral droit (𝐻1 : 𝛽𝑗 > 0), on va rejeter 𝐻0 au seuil 𝛼 si 𝑡 > 𝑡1−𝛼 (𝑛 − 2),
𝑡1−𝛼 (𝑛 − 2) étant le quantile /fractile d'ordre 1 − 𝛼 de la loi de Student à 𝑛 − 2 degrés de liberté.
12
Cours d’Econométrie du Modèle Linéaire – AS2
𝑆𝐶𝐸
Régression : X (expliquée) SCE 𝐷𝐷𝐿𝐸 = 1 𝐶𝑀𝐸 =
𝐷𝐷𝐿𝐸
𝐶𝑀𝐸
𝐹=
𝑆𝐶𝑅 𝐶𝑀𝑅
Erreur (résiduelle) SCR 𝐷𝐷𝐿𝑅 = 𝑛 − 2 𝐶𝑀𝑅 =
𝐷𝐷𝐿𝑅
13
Cours d’Econométrie du Modèle Linéaire – AS2
Remarque
Tous ces tests peuvent facilement effectués avec la connaissance de la P-value. En effet,
𝑆𝑖 𝑃 < 𝛼 → 𝑅𝑒𝑗𝑒𝑡 𝑑𝑒 𝐻0
𝑆𝑖 𝑃 ≥ 𝛼 → 𝑁𝑜𝑛 𝑟𝑒𝑗𝑒𝑡 (𝑎𝑐𝑐𝑒𝑝𝑡𝑎𝑡𝑖𝑜𝑛) 𝑑𝑒 𝐻0
A partir de la relation :
Ou encore
𝑆𝐶 𝑡𝑜𝑡𝑎𝑙𝑒 (𝑑𝑒 𝑌) = 𝑠𝑜𝑚𝑚𝑒 𝑑𝑒𝑠 𝑐𝑎𝑟𝑟é𝑠 𝑒𝑥𝑝𝑙𝑖𝑞𝑢é𝑒 (𝑝𝑎𝑟 𝑋) + 𝑠𝑜𝑚𝑚𝑒 𝑑𝑒𝑠 𝑐𝑎𝑟𝑟é𝑠 𝑟é𝑠𝑖𝑑𝑢𝑒𝑙𝑙𝑒
𝑣𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑡é 𝑒𝑥𝑝𝑙𝑖𝑞𝑢é𝑒
On définit le coefficient de détermination par le ratio 𝑣𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑡é 𝑡𝑜𝑡𝑎𝑙𝑒
𝑆𝐶𝐸 𝑆𝐶𝑅
𝑅 2 = 𝑆𝐶𝑇 = 1 − 𝑆𝐶𝑇 [2.8]
Comme interprétation, plus 𝑅 2 est proche de 1, meilleure est l’adéquation du modèle aux
données.
14
Cours d’Econométrie du Modèle Linéaire – AS2
Ce qui n'est pas le cas dans le graphique suivant où une structure non linéaire (exponentielle
notamment) apparaît.
Dans un tel cas, il faudrait changer de modèle, en transformant l'une des 2 variables X ou Y,
mais plus généralement X (par 𝑙𝑛𝑋, 𝑒 𝑋 , 𝑋 2 , √𝑋, etc.), puisque Y est la variable d'intérêt.
15
Cours d’Econométrie du Modèle Linéaire – AS2
A noter que les valeurs (. ) peuvent dans certains cas être les 𝑡 de Student.
16