Chapitre 3 Econométrie I

Cours d’Econométrie I L3 Economie Quantitative 2019-2020 HIDRA.
Chapitre 3 : Modèle de régression linéaire multiple

3.1. Formulation
La régression linéaire multiple est la généralisation multivariée de la régression linéaire

simple. Nous cherchons à expliquer les valeurs prises par la variable endogène Y à l’aide de k
variables exogènes 𝑋𝑗 (j=1,.., k).
L’équation de régression s’écrit :
𝑦𝑖 = 𝑎0 + 𝑎1 𝑥1𝑖 + 𝑎2 𝑥2𝑖 + ⋯ + 𝑎𝑘 𝑥𝑘𝑖 + 𝜀𝑖 (𝑖 = 1, … , 𝑛)…………………… (3.1)
Nous devons estimer les valeurs de (k+1) paramètres (𝑎0 , 𝑎1 , … , 𝑎𝑘 ) à partir d’un échantillon
de n observations.
Nous remarquons dans le modèle (3.1) :
- 𝑖 = 1, … , 𝑛 correspond au numéro des observations ;

- 𝑦𝑖 est la i-ème observation de la variable endogène Y ;
- 𝑥𝑗𝑖 est la i-ème observation de la j-ème variable exogène ;
- 𝑎0 , 𝑎1 , … , 𝑎𝑘 les coefficients de la régression du modèle ;
- 𝜀𝑖 est l’erreur du modèle, il mesure les informations manquantes qui permettaient
d’expliquer linéairement les valeurs de Y à l’aide des k variables 𝑋𝑗 .
Les étapes de processus de modélisation sont les suivantes :
1. Estimer les valeurs des coefficients (𝑎0 , 𝑎1 , … , 𝑎𝑘 ) à partir d’un échantillon de donnés
(estimation des MCO).
2. Evaluer la précision de ces estimateurs (biais, variance des estimateurs).
3. Mesurer le pouvoir explicatif du modèle dans sa globalité (tableau d’analyse de la
variance, coefficient de détermination).
4. Tester l’existence d’une relation entre l’endogène Y et les exogènes 𝑋𝑗 (test de
significativité globale de la régression).
5. Tester l’apport marginal de chaque variable explicative dans l’explication de Y (test de
significativité de chaque coefficient).
6. Tester l’apport d’un groupe de variables explicatives dans l’explication de Y (test de
significativité simultanée d’un groupe de coefficient).
7. Pour un nouvel individu 𝑖 ∗ pour lequel on fournit la description (𝑥1𝑖 ∗ , …,𝑥𝑘𝑖 ∗ ),
calculer la valeur prédite 𝑦𝑖 ∗ et l’intervalle de prédiction.
8. Interpréter les résultats en mettant en avant notamment l’impact des exogènes sur
l’endogène (interprétation des coefficients).
Remarque 1:
𝑑𝑦
Chaque coefficient se lie comme une propension marginale = 𝑎𝑖 , mais à la différence de
𝑑𝑥 𝑖
la régression linéaire simple, on prend en compte le rôle des autres variables lors de son
1
Cours d’Econométrie I L3 Economie Quantitative 2019-2020 HIDRA. Y
estimation. On dit alors que c’est un coefficient partiel : il indique l’impact de la variable en
contrôlant l’effet des autres variables.
3.2. Ecriture matricielle du modèle
En considérant les valeurs prises par les variables, on peut écrire :
𝑦𝑖 = 𝑎0 + 𝑎1 𝑥1𝑖 + 𝑎2 𝑥2𝑖 + ⋯ + 𝑎𝑘 𝑥𝑘𝑖 + 𝜀𝑖 (𝑖 = 1, … , 𝑛)
En faisant varier 𝑖 de 1 à n , on aura :
𝑦1 = 𝑎0 + 𝑎1 𝑥11 + 𝑎2 𝑥21 + ⋯ + 𝑎𝑘 𝑥𝑘1 + 𝜀1
𝑦2 = 𝑎0 + 𝑎1 𝑥12 + 𝑎2 𝑥22 + ⋯ + 𝑎𝑘 𝑥𝑘2 + 𝜀2
⋮ ⋮
𝑦𝑛 = 𝑎0 + 𝑎1 𝑥1𝑛 + 𝑎2 𝑥2𝑛 + ⋯ + 𝑎𝑘 𝑥𝑘𝑛 + 𝜀𝑛

𝑦1 1 𝑥11 𝑥21 ⋯ 𝑥𝑘1 𝑎1 𝜀1
𝑦2 1 𝑥12 𝑥22 ⋯ 𝑥𝑘2 𝑎2 𝜀2
⋮ = ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ + ⋮
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
𝑦𝑛 1 𝑥1𝑛 𝑥2𝑛 ⋯ 𝑥𝑘𝑛 𝑎𝑛 𝜀𝑛
𝑌 = 𝑋 × 𝑎 + 𝜀
Remarque 2 :
La matrice X de dimension (n, k+1) contient l’ensemble des observations sur les exogènes,
avec une première colonne formée par la valeur 1 indiquant que l’on intègre la constante 𝑎0
dans l’équation.
3.3. Estimation et propriétés des estimateurs
3.3.1. Estimation des paramètres par la méthode des MCO

𝑛
La méthode des MCO consiste à minimiser la somme des carrés des erreurs min 𝑖=1 𝜀𝑖 .
Soit 𝜀 le vecteur des erreurs avec 𝜀 ′ = 𝜀1 , 𝜀2 , … , 𝜀𝑛 la transposée de 𝜀.

𝑛
La somme des carrés des erreurs devient : S = 𝑖=1 𝜀𝑖 = 𝜀′ 𝜀 .
D’après l’écriture matricielle : 𝜀 = 𝑌 − 𝑋𝑎 d’où 𝜀 ′ 𝜀 = 𝑌 − 𝑋𝑎 ′ (𝑌 − 𝑋𝑎)
Rappel : on fait un rappel de quelques éléments sur le calcul matriciel pour comprendre le
développement qui suivra : On note 𝑋 ′ la matrice transposée de la matrice 𝑋.
- 𝑋𝑎 ′ = 𝑎′ 𝑋 ′
- 𝑌′𝑋𝑎 ′ = 𝑎′ 𝑋 ′ 𝑌
- La transposé d’un scalaire est lui-même.
2
𝑛
S= 𝑖=1 𝜀𝑖 = 𝜀 ′ 𝜀= 𝑌 − 𝑋𝑎 ′
𝑌 − 𝑋𝑎 = 𝑌 ′ 𝑌 − 𝑌 ′ 𝑋𝑎 − 𝑎′ 𝑋 ′ 𝑌 + 𝑎′𝑋′𝑋𝑎
En dérivant par rapport à 𝑎 on trouve :
𝑑𝑆 𝑑𝜀 ′ 𝜀 𝑑(𝑌 ′ 𝑌 − 𝑌 ′ 𝑋𝑎 − 𝑎′ 𝑋 ′ 𝑌 + 𝑎′ 𝑋 ′ 𝑋𝑎) 𝑑(𝑌 ′ 𝑌 − 2𝑎′ 𝑋 ′ 𝑌 + 𝑎′ 𝑋 ′ 𝑋𝑎)

= = =
𝑑𝑎 𝑑𝑎 𝑑𝑎 𝑑𝑎
(car 𝑌 ′ 𝑋𝑎 est un scalaire (𝑌 ′ 𝑋𝑎)′ = 𝑎′ 𝑋 ′ 𝑌 )
𝑑𝑆 𝑑𝜀 ′ 𝜀
= = −2𝑋 ′ 𝑌 + 2𝑋′𝑋𝑎
𝑑𝑎 𝑑𝑎
En égalisant à zéro, il vient : −2𝑋 ′ 𝑌 + 2𝑋 ′ 𝑋𝑎 = 0 𝑋 ′ 𝑋𝑎 = 𝑋 ′ 𝑌
En notant 𝑎 la solution de cette équation (lorsqu’elle existe), on arrive à : 𝑋 ′ 𝑋𝑎 = 𝑋 ′ 𝑌
Cette solution existe si (𝑋 ′ 𝑋) est inversible. Dans ce cas on a :
(𝑋 ′ 𝑋)−1 (𝑋 ′ 𝑋)𝑎 = (𝑋 ′ 𝑋)−1 𝑋 ′ 𝑌 𝑎 = (𝑋 ′ 𝑋)−1 𝑋 ′ 𝑌

𝑑2𝑆
= 2𝑋′𝑋 > 0 (car (𝑋 ′ 𝑋) dans la pratique est une matrice toujours définie positive).
𝑑𝑎 2
L’estimateur des MCO des coefficients du modèle s’écrit :
𝑎 = (𝑋 ′ 𝑋)−1 𝑋 ′ 𝑌
Remarque 3 :
En cas de multicolinéarité parfaite entre au moins deux variables explicatives, la matrice

(𝑋 ′ 𝑋) ne sera pas inversible et la méthode des MCO ne sera pas valide.
3.3.2. Hypothèses de l’estimateur
Comme pour la régression simple, les hypothèses permettant de déterminer les propriétés des
estimateurs (sans biais, convergent) et les lois de distribution (loi de student pour chaque
coefficient pris individuellement, loi de fisher dès que l’on traite un groupe de coefficients).
H1) les 𝑋𝑗 sont non aléatoires, c'est-à-dire les 𝑥𝑗𝑖 sont observés sans erreur.
- Le vecteur Y est aléatoire car il dépend de 𝜀.

- La matrice X n’est pas une matrice stochastique (aléatoire).
H2) 𝐸 𝜀𝑖 = 0 ∀𝑖, l’espérance de l’erreur est nulle. Le modèle en moyenne est bien spécifié.
H3) ∀𝑖, 𝑉𝑎𝑟 𝜀𝑖 = 𝜎𝜀2 ; la variance de l’erreur est constante (c’est l’hypothèse
d’homoscédasticité).
On peut aussi écrire H3) comme : ∀𝑖, 𝐸 𝜀𝑖2 = 𝜎𝜀2
Car 𝑉𝑎𝑟 𝜀𝑖 = 𝐸 𝜀𝑖2 − (𝐸 𝜀𝑖 )2 = 𝐸 𝜀𝑖2 − 0 = 𝐸 𝜀𝑖2 .
3
H4) 𝐶𝑜𝑣 𝜀𝑖 , 𝜀𝑗 = 0 𝑝𝑜𝑢𝑟 𝑖 ≠ 𝑗. Absence de corrélation entre les erreurs ; ou bien les erreurs
sont indépendantes, c’est l’hypothèse de non autocorrélation des erreurs.
H5) 𝐶𝑜𝑣 𝑥𝑝𝑖 , 𝜀𝑖 = 0 ∀ 𝑝 = 1, … , 𝑘. L’erreur n’est pas corrélée avec les variables
explicatives ; ou bien l’erreur est indépendante des variables exogènes.
H6) 𝜀𝑖 𝑁 0, 𝜎𝜀2 , les erreurs sont distribuées selon une loi Normale.
H7) La matrice 𝑋′𝑋 est régulière, c'est-à-dire det(𝑋 ′ 𝑋) ≠ 0 et (𝑋 ′ 𝑋)−1 existe. Elle indique
l’absence de colinéarité entres les variables exogènes.
1
H8) n (𝑋 ′ 𝑋) tend vers une matrice finie, inversible lorsque 𝑛 +∞ .
H9) La taille de l’échantillon 𝑛 > 𝑘 + 1 (le nombre d’observation est supérieur au nombre de
paramètres à estimer).
Exercice 1:
Soit la variable à expliquer 𝑦𝑡 et deux variables explicatives 𝑥1𝑡 et 𝑥2𝑡 connues sur 10
périodes. Nous cherchons à estimer la relation 𝑦𝑡 = 𝑎0 + 𝑎1 𝑥1𝑡 + 𝑎2 𝑥2𝑡 + 𝜀𝑡 .
Les valeurs sont données sur le tableau suivant :
Tableau 1 : Données de l’exercice 1

t 𝑦𝑡 𝑥1𝑡 𝑥2𝑡
1 12 7 48
2 21 9 40
3 24 11 18
4 24 12 28
5 13 7 40
6 17 9 32
7 21 12 31
8 26 14 24
9 31 19 22
10 30 21 25
1. Exprimer la forme matricielle du modèle
2. Calculer la matrice 𝑋’𝑋 et 𝑋 ′ 𝑌 puis la matrice inverse (𝑋’𝑋)−1
3. Calculer 𝑎 = (𝑋 ′ 𝑋)−1 𝑋 ′ 𝑌
Corrigé :
1. Forme matricielle du modèle
12 1 7 48 𝜀1
21 1 9 40 𝑎0 𝜀2
24 = 1 11 18 𝑎1 + ⋮
⋮ ⋮ ⋮ ⋮ 𝑎2 ⋮
30 1 21 25 𝜀10
4
𝑌= 𝑋 × 𝑎 + 𝜀
2. Calcul de la matrice 𝑿’𝑿 et 𝑿′ 𝒀
1 7 48
1 1 1 ⋯ 1 1 9 40 10 121 308
𝑋’𝑋 = 7 9 11 ⋯ 21 1 11 18 = 121 1667 3449
48 40 18 ⋯ 25 ⋮ ⋮ ⋮ 308 3449 10282
1 21 25
12
1 1 1 ⋯ 1 21 219
𝑋’𝑌 = 7 9 11 ⋯ 21 24 = 2904
48 40 18 ⋯ 25 ⋮ 6291
30
- Calcul de la matrice inverse (𝑿’𝑿)−𝟏
6,225 −0,216 −0,114

𝐶𝑜𝑛𝑗𝑜𝑖𝑛𝑡𝑒 (𝑋’𝑋) (𝐶𝑜𝑓 𝑋’𝑋 )′
(𝑋’𝑋)−1 = = = −0,216 0,00944 0,0033
det (𝑋’𝑋) det (𝑋’𝑋)
−0,114 0,0033 0,00241
3. Calcul de 𝒂
6,225 −0,216 −0,114 219 𝑎0 18,87

𝑎 = (𝑋 ′ 𝑋)−1 𝑋 ′ 𝑌= −0,216 0,00944 0,0033 2904 = 𝑎1 = 0,902
−0,114 0,0033 0,00241 6291 𝑎2 −0,256
3.3.3. Propriétés de l’estimateur
La spécification théorique du modèle est 𝑌 = 𝑋𝑎 + 𝜀 où 𝜀 est un vecteur aléatoire inconnu.
Le modèle estimé est 𝑌 = 𝑋𝑎.
On défini le résidu (e) par : 𝑒 = 𝑌 − 𝑌.
Le vecteur (e) des résidus est connu, on peut aussi écrire le modèle comme suit :
𝑌 = 𝑋𝑎 + 𝑒
a) Estimateur sans biais de 𝒂
𝑎 = (𝑋 ′ 𝑋)−1 𝑋′𝑌 est un estimateur sans biais de 𝑎.
𝑎 = 𝑋′ 𝑋 −1
𝑋 ′ 𝑌 . On remplace Y par (𝑋𝑎 + 𝜀) dans la formule de 𝑎, on obtient :
𝑎 = 𝑋′ 𝑋 −1
𝑋 ′ 𝑋𝑎 + 𝜀
𝑎 = 𝑋′ 𝑋 −1
𝑋 ′ 𝑋𝑎 + 𝑋 ′ 𝑋 −1
𝑋′ 𝜀
5
𝑎 = 𝑎 + 𝑋′ 𝑋 −1
𝑋 ′ 𝜀 …………………. (3.2)
𝐸 𝑎 = 𝑎 + 𝑋′ 𝑋 −1
𝑋 ′ 𝐸 𝜀 = 𝑎 car 𝐸 𝜀 = 0.
L’estimateur est donc sans biais : 𝐸 𝑎 = 𝑎
b) 𝒂 est un estimateur convergent
En notant par Ω𝑎 la matrice des variances-covariances de 𝑎, on a :

′
Ω𝑎 = 𝐸[ 𝑎 − 𝐸 𝑎 𝑎−𝐸 𝑎 ]= 𝐸[ 𝑎 − 𝑎 𝑎 − 𝑎 ′ ]…………(3.3)
D’après (3.2), 𝑎 − 𝑎 = 𝑋 ′ 𝑋 −1
𝑋′ 𝜀
On remplace (3.2) dans (3.3), on obtient :
Ω𝑎 = 𝐸[ 𝑋 ′ 𝑋 −1
𝑋′ 𝜀 𝑋′ 𝑋 −1
𝑋′ 𝜀 ′ ]
Ω𝑎 = 𝐸[ 𝑋 ′ 𝑋 −1
𝑋 ′ 𝜀𝜀 ′ 𝑋 𝑋 ′ 𝑋 −1
]
Ω𝑎 = 𝑋 ′ 𝑋 −1 𝑋 ′ 𝐸(𝜀𝜀 ′ )𝑋 𝑋 ′ 𝑋 −1 avec 𝐸 𝜀𝜀 ′ = Ω𝜀 = 𝜎𝜀2 𝐼𝑛 la matrice des variances-

covariances de l’erreur 𝜀 (D’après les hypothèses H3 et H4)
𝐸(𝜀1 𝜀1 ) 𝐸(𝜀1 𝜀2 ) ⋯ 𝐸(𝜀1 𝜀𝑛 ) 𝜎𝜀2 0 ⋯ 0

Ω𝜀 = 𝐸 𝜀𝜀 ′ =
𝐸(𝜀2 𝜀1 ) 𝐸(𝜀2 𝜀2 ) ⋯ 𝐸(𝜀2 𝜀𝑛 )
= 0 𝜎𝜀2 ⋯ 0
⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
𝐸(𝜀𝑛 𝜀1 ) 𝐸(𝜀𝑛 𝜀2 ) ⋯ 𝐸(𝜀𝑛 𝜀𝑛 ) 0 0 ⋯ 𝜎𝜀2
Ω𝑎 = 𝑋 ′ 𝑋 −1
𝑋 ′ 𝜎𝜀2 𝐼𝑛 𝑋 𝑋 ′ 𝑋 −1
=𝜎𝜀2 𝑋 ′ 𝑋 −1
𝑋′ 𝑋 𝑋 ′ 𝑋 −1
= 𝜎𝜀2 𝑋 ′ 𝑋 −1
Donc : Ω𝑎 = 𝜎𝜀2 𝑋 ′ 𝑋 −1
Par définition :
𝑣𝑎𝑟(𝑎0 ) 𝑐𝑜𝑣(𝑎0 , 𝑎1 ) ⋯ 𝑐𝑜𝑣(𝑎0 , 𝑎𝑘 )

𝑐𝑜𝑣(𝑎1 , 𝑎0 ) 𝑣𝑎𝑟(𝑎1 ) ⋯ 𝑐𝑜𝑣(𝑎1 , 𝑎𝑘 )
Ω𝑎 = ⋮ ⋮ ⋯ ⋮
⋮ ⋮ ⋱ ⋮
𝐸(𝜀𝑛 𝜀1 ) 𝑐𝑜𝑣(𝑎𝑘 , 𝑎1 ) ⋯ 𝑣𝑎𝑟(𝑎𝑘 )
 Calcul de la 𝐥𝐢𝐦 Ω𝒂
𝒏 +∞
1
D’après H8), nous avons 𝑛 𝑋′𝑋 𝑀 (M une matrice finie et inversible)
𝑛 +∞
1 1
Pour n assez grand, on a : 𝑛 𝑋′𝑋 𝑀 𝑋′𝑋 𝑛𝑀 𝑋′𝑋 𝑛𝑀 (𝑋 ′ 𝑋)−1 𝑀−1
𝑛
1
Donc la lim Ω𝑎 =lim 𝜎𝜀2 𝑋 ′ 𝑋 −1
=lim 𝜎𝜀2 𝑛 𝑀−1 = matrice nulle.
𝑛 +∞ 𝑛 +∞ 𝑛 +∞
6
Par conséquent : 𝑎 est un estimateur à variance minimale, donc il est convergent.
Remarque 4 :
Dans la pratique souvent 𝜎𝜀2 est inconnue, alors Ω𝑎 est aussi inconnue. Il faut donc estimer
𝜎𝜀2 .
𝑛 2
𝑒′𝑒 𝑖=1 𝑒𝑖
Proposition : l’estimateur sans biais de 𝜎𝜀2 est donné par : 𝜎𝜀2 = 𝑛−𝑘−1 = 𝑛−𝑘−1
Donc l’estimateur de la matrice des variances-covariances de Ω𝑎 est donné par :

𝑛 2
𝑒′𝑒 𝑖=1 𝑒𝑖
Ω𝑎 = 𝜎𝜀2 𝑋 ′ 𝑋 −1
où 𝜎𝜀2 = 𝑛−𝑘−1 = avec 𝑒𝑖 = 𝑦𝑖 − 𝑦𝑖 .
𝑛 −𝑘−1
c) Equation d’analyse de la variance
L’équation de l’analyse de la variance est donnée par :

𝑛 𝑛 𝑛
(𝑦𝑖 − 𝑦)2 = (𝑦𝑖 − 𝑦)2 + 𝑒𝑖 2
𝑖=1 𝑖=1 𝑖=1
𝑛
𝑖=1(𝑦𝑖 − 𝑦)2 : variabilité totale (somme des carrés totale SCT)
𝑛
𝑖=1(𝑦𝑖 − 𝑦)2 : variabilité expliquée (somme des carrés expliquée SCE)
𝑛 2
𝑖=1 𝑒𝑖 : variabilité résiduelle (somme des carrés résiduelle SCR)
Cette équation d’analyse de la variance va nous permettre de juger de la qualité de

l’ajustement du modèle. En effet, plus SCE est proche de SCT meilleur est l’ajustement
globale du modèle.
𝑛 𝑛
2 𝑖=1(𝑦𝑖 − 𝑦 )2 𝑖=1 𝑒𝑖
2
𝑅 = 𝑛 = 1− 𝑛
𝑖=1(𝑦𝑖 − 𝑦 )2 𝑖=1(𝑦𝑖 − 𝑦 )2
𝑅 2 est appelé coefficient de détermination. Plus il est proche de 1, meilleur est l’ajustement,
car 𝑅 2 prend ses valeurs entre 0 et 1, 0 ≤ 𝑅 2 ≤ 1.
Le coefficient 𝑅 2 mesure la proportion de la variance de la variable endogène Y expliquée par

la régression de Y sur l’ensemble des variables exogènes.
Remarque 5 :
La valeur de 𝑅 2 a tendance à augmenter avec le nombre de variables explicatives plutôt que

𝑅 2 , on introduit le coefficient de détermination corrigé 𝑅 2 :
𝑛−1
𝑅2 = 1 − (1 − 𝑅 2 )
𝑛−𝑘−1
7
Exercice 2 :
En reprenant les données de l’exercice 1 :
1. Calculer les résidus et l’estimation de la variance de l’erreur 𝜎𝜀2 .

2. Calculer la matrice des variances-covariances de 𝑎.
3. Calculer 𝑅 2 et 𝑅 2 corrigé.
Corrigé :
1. Calcul des résidus
Rappelons que dans l’exercice 1, nous avons estimé les paramètres du modèle
𝑦𝑡 = 18,87 + 0,902𝑥1𝑡 − 0,256𝑥2𝑡 + 𝑒𝑡 ;

𝑦𝑡 = 18,87 + 0,902𝑥1𝑡 − 0,256𝑥2𝑡 et 𝑒𝑡 = 𝑦𝑡 − 𝑦𝑡 = 𝑦𝑡 − (18,87 + 0,902𝑥1𝑡 − 0,256𝑥2𝑡 )
𝑝𝑜𝑢𝑟 𝑡 = 1, 𝑒1 = 12 − 18,87 + 0,902 × 7 − 0,256 × 48 = −0,896

𝑃𝑜𝑢𝑟 𝑡 = 2, 𝑒2 = 21 − 18,87 + 0,902 × 9 − 0,256 × 40 = 4,252
⋮
𝑃𝑜𝑢𝑟 𝑡 = 10, 𝑒10 = 30 − 18,87 + 0,902 × 21 − 0,256 × 25 = −1,412
- Calcul de l’estimation de la variance de l’erreur
10 2
𝑒′𝑒 𝑡=1 𝑒𝑡 31,469
𝜎𝜀2 = = = = 4,495
𝑛 − 𝑘 − 1 𝑛 − 𝑘 − 1 10 − 2 − 1
2. Calcul de la matrice des variances-covariances de 𝒂
Ω𝑎 = 𝜎𝜀2 𝑋 ′ 𝑋 −1
6,225 −0,216 −0,114 27,9827 −0,9702 −0,5128

Ω𝑎 = 4,495 −0,216 0,00944 0,0033 = −0,9702 0,04245 0,01482
−0,114 0,0033 0,00241 −0,5128 0,01482 0,01083
𝜎𝑎20 = 27,9827 , 𝜎𝑎21 = 0,04245, 𝜎𝑎22 = 0,01083
3. Calcul de 𝑹𝟐 et 𝑹𝟐
10 10
𝑡=1(𝑦𝑡 − 𝑦 )2 𝑡=1 𝑒𝑡
2
31,469
𝑅2 = 10 =1− 10 =1− = 0,916
𝑡=1(𝑦𝑡 − 𝑦 )2 𝑡=1(𝑦𝑡 − 𝑦 )2 376,9
𝑛−1 10 − 1
𝑅2 = 1 − 1 − 𝑅2 = 1 − 1 − 0,916 = 0,892
𝑛−𝑘−1 10 − 2 − 1
3.4. Tests statistiques
3.4.1. Hypothèse de normalité des erreurs
8
Soit 𝜀𝑖 𝑁 0, 𝜎𝜀2 (Hypothèse H6)
La distribution Normale est incomparablement simple et très connue pour ses propriétés
théoriques, et beaucoup de phénomènes semblent suivre cette distribution.
L’hypothèse de normalité des erreurs va nous permettre de définir la loi de probabilité des
estimateurs et par conséquent, de construire des tests statistiques concernant la validité du
modèle estimé. Les estimateurs des MCO sont des facteurs linéaires de 𝜀𝑖 , donc si les 𝜀𝑖 sont
distribués normalement, les estimateurs le sont aussi. Même dans le cas des échantillons de
petite taille (taille finie), l’hypothèse de normalité est une aide pour la dérivation des
distributions des estimateurs des MCO, mais aussi, elle permet d’utiliser les tests statistiques
de student, fisher et khi-2 dans les modèles de régression.
De plus, l’hypothèse de normalité des erreurs va permettre de réduire l’influence des variables
omises (représentées par 𝜀𝑖 ) et elle sera la plus faible possible, ou, au moins aléatoire. Avec le
théorème central limite (TCL), on peut montrer que la distribution de leur somme tend vers
une distribution normale à mesure de la croissance infinie du nombre de telles variables.
3.4.2. Test global de Fisher
𝑅 2 est une variable aléatoire car elle dépend d’un échantillon lui-même est aléatoire. Il ne doit
donc s’interpréter qu’après avoir déterminer sa loi de probabilité. Malheureusement, celle-ci
dépend de manière ci complexe des observations qu’il est difficile de la déterminer.
Ainsi, pour juger de la qualité du modèle, on dispose d’un autre indicateur qui s’exprime
comme un rapport de la variance expliquée sur la variance inexpliquée.
𝑆𝐶𝐸
𝐹∗ = 𝑘
𝑆𝐶𝑅
𝑛−𝑘−1
où k désigne le nombre de degré de liberté de SCE
et (𝑛 − 𝑘 − 1) désigne le nombre de degré de liberté de SCR.
𝑅2
𝐹∗ = 𝑘
(1 − 𝑅 2 )
𝑛−𝑘−1
Le test global de fisher est formulé comme suit :
𝐻0 "𝑎1 = 𝑎2 = ⋯ = 𝑎𝑘 = 0" contre 𝐻1 "∃ 𝑗 𝑡𝑒𝑙𝑙𝑒 𝑞𝑢𝑒 𝑎𝑗 ≠ 0" (au moins un paramètre est
différent de zéro).
L’hypothèse de normalité des erreurs implique que sous 𝐻0 , 𝐹 ∗ (calculé) suit la loi de fisher à
k et (n-k-1) degré de liberté.
9
On compare alors ce 𝐹 ∗ au 𝐹𝛼 théorique (lu dans la table de fisher) à k et (n-k-1) degré de

liberté.
Au niveau de signification 𝛼 généralement choisi 𝛼 = 5% , la fonction densité de fisher a une

forme asymétrique et prends ses valeurs entre 0 et +∞.
Figure 3.1. La fonction de répartition de la loi de fisher

fF(x)
(1 − 𝛼) 𝛼
Région d’acceptation de H0 𝐹𝛼 Région de rejet de H0 F
Règle de décision :
- Si 𝐹 ∗ > 𝐹𝛼 alors on rejette H0, le modèle est globalement bon.

- Si 𝐹 ∗ ≤ 𝐹𝛼 alors on accepte H0, le modèle est rejeté globalement.
3.4.2. Test individuel de student

𝜀1
𝜀2
Nous avons 𝜀𝑖 𝑁(0, 𝜎𝜀2 ) ou 𝜀 = ⋮ 𝑁(0, 𝜎𝜀2 𝐼𝑛 ) ; 𝐸 𝑎 = 𝑎 et Ω𝑎 = 𝜎𝜀2 𝑋 ′ 𝑋 −1
,
𝜀𝑛
ainsi, 𝑎 𝑁(𝑎, 𝜎𝜀2 𝑋 ′ 𝑋 −1

) ou bien 𝑎𝑖 𝑁(𝑎𝑖 , 𝜎𝑎2𝑖 ) où 𝜎𝑎2𝑖 : désigne le i ème terme de la
diagonale principale de la matrice Ω𝑎 = 𝜎𝜀2 𝑋 ′ 𝑋 −1
.
On a centré et réduit 𝑎𝑖 , on a obtenu :
𝑎𝑖 − 𝑎𝑖
𝑁 0,1 .
𝜎𝑎 𝑖
Cependant, le plus souvent, la variance 𝜎𝑎2𝑖 est inconnue, alors, on l’estime par 𝜎𝑎2𝑖 qui désigne
𝑒′𝑒
le ième terme de la diagonale principale de la matrice Ω𝑎 = 𝜎𝜀2 𝑋 ′ 𝑋 −1
avec 𝜎𝜀2 = 𝑛−𝑘−1
𝑎 𝑖 −𝑎 𝑖
Dans ce cas, on est amené à donner la loi de : suit une loi de student à (n-k-1) degré de
𝜎𝑎
𝑖
liberté. C'est-à-dire : 𝑡(𝑛 − 𝑘 − 1).
𝜎𝑎
𝑖
Le test de student est formulé comme suit :
10
𝐻0 "𝑎𝑖 = 0" contre 𝐻1 " 𝑎𝑖 ≠ 0".
𝑎𝑖
Sous 𝐻0 , l’hypothèse de normalité des erreurs implique que : 𝑡(𝑛 − 𝑘 − 1).
𝜎𝑎
𝑖
Figure 3.2. La fonction de répartition de la loi de student

f(t)
1 1
𝛼 𝛼
2 (1 − 𝛼 ) 2
𝛼 𝛼
2 2
−∞ 𝐻1 − 𝑡𝑛−𝑘−1 𝐻0 0 𝐻0 + 𝑡𝑛−𝑘−1 𝐻1 +∞
 Région critique au seuil 𝜶 :

𝑎 𝑎
- si (𝜎 𝑖 > 𝑡𝛼 2
ou 𝜎 𝑖 < −𝑡𝛼 2 ) alors on rejette 𝐻0 .
𝑎𝑖 𝑎𝑖
Les points critiques 𝑡𝛼 2

et −𝑡𝛼 2
étant symétrique, il suffit alors de chercher 𝑡𝛼 2
telle que :
𝑎𝑖 𝛼 𝑎𝑖
P( > 𝑡𝛼 2 ) = où 𝑡𝑎∗𝑖 = 𝑡𝛼 2 (𝑛 − 𝑘 − 1)
𝜎𝑎 2 𝜎𝑎
𝑖 𝑖
Cette indicateur 𝑡𝑎∗𝑖 est appelé le ratio de student. Ainsi, nous comparons ce 𝑡𝑎∗𝑖 (calculé) au
𝑡𝛼 2 (𝑛 − 𝑘 − 1) théorique (lu dans la table de student au seuil de signification 𝛼).
 Règle de décision :
- si 𝑡𝑎∗𝑖 > 𝑡𝛼 2 (𝑛 − 𝑘 − 1), alors on rejette 𝐻0 , la variable 𝑥𝑖 est significativement
contributive à l’explication de l’endogène.
- si 𝑡𝑎∗𝑖 ≤ 𝑡𝛼 2 (𝑛 − 𝑘 − 1), alors on accepte 𝐻0 , la variable 𝑥𝑖 n’est pas contributive à
l’explication de l’endogène.
Remarque 6 :
Puisque la loi de student converge vers la loi normale centrée et réduite, lorsque le nombre de
degré de liberté augmente, on utilise la loi de student comme loi de seulement si la taille
𝜎𝑎
𝑖
de l’échantillon est relativement petite 𝑛 < 30 .
Lorsque n est suffisamment grand (n≥ 30), on utilise la loi normale comme la loi de cette
statistique .
𝜎𝑎
𝑖
3.4.3. Intervalle de confiance
Pour obtenir un intervalle de confiance pour 𝑎𝑖 au niveau de confiance (1 − 𝛼), on écrit :
11
P(−𝑡𝛼 2
≤ ≤ 𝑡𝛼 2 ) = 1 − 𝛼
𝜎𝑎
𝑖
𝑃(−𝜎𝑎 𝑖 𝑡𝛼 2
≤ 𝑎𝑖 − 𝑎𝑖 ≤ 𝜎𝑎 𝑖 𝑡𝛼 2 ) = 1 − 𝛼
𝑃(−𝜎𝑎 𝑖 𝑡𝛼 2
− 𝑎𝑖 ≤ −𝑎𝑖 ≤ 𝜎𝑎 𝑖 𝑡𝛼 2
− 𝑎𝑖 ) = 1 − 𝛼
𝑃(𝑎𝑖 − 𝜎𝑎 𝑖 𝑡𝛼 2
≤ 𝑎𝑖 ≤ 𝑎𝑖 +𝜎𝑎 𝑖 𝑡𝛼 2 ) = 1 − 𝛼
Donc, l’intervalle de confiance pour 𝑎𝑖 au niveau de confiance (1 − 𝛼) (au niveau de

signification (𝛼) est donné par :
𝐼𝐶𝑎 𝑖 = [𝑎𝑖 − 𝜎𝑎 𝑖 . 𝑡𝛼 2
, 𝑎𝑖 + 𝜎𝑎 𝑖 . 𝑡𝛼 2 ]
Exercice 3 :
Reprenant les données de l’exercice 1 :
1. Effectuer le test global de Fisher au seuil 𝛼 = 5%.

2. Effectuer le test individuel de Student.
3. Calculer l’intervalle de confiance des paramètres estimés.
Corrigé :
1. Tester la signification globale du modèle : test de Fisher
Il s’agit de tester :
𝐻0 "𝑎1 = 𝑎2 = 0" contre 𝐻1 "∃ 𝑗 𝑡𝑒𝑙𝑙𝑒 𝑞𝑢𝑒 𝑎𝑗 ≠ 0" (au moins l’un des paramètre est différent
de zéro).
𝑅2 0,916
𝐹∗ = 𝑘 = 2 0,05
= 38,16 > 𝐹(2,7) = 4,74
(1 − 𝑅 2 ) (1 − 0,916)
𝑛−𝑘−1 10 − 2 − 1
Donc, on rejette l’hypothèse 𝐻0 , le modèle est globalement bon, c'est-à-dire qu’au moins
l’une des variables 𝑥1𝑡 et 𝑥2𝑡 est explicative du modèle.
2. Tester individuellement la contribution des variables explicatives : test de Student
𝑎1 0,902
𝑡𝑎∗1 = = = 4,38 > 𝑡0,05 10 − 2 − 1 = 2,36 𝑎1 ≠ 0,
𝜎𝑎 1 0,206
𝑥1𝑡 est significativement contributive à l’explication de l’endogène.
𝑎2 0,256
𝑡𝑎∗2 = = = 2,46 > 𝑡0,05 10 − 2 − 1 = 2,36 𝑎2 ≠ 0,
𝜎𝑎 2 0,104
12
𝑥2𝑡 est significativement contributive à l’explication de l’endogène.
3. Calculer l’intervalle de confiance des paramètres estimés.
𝐼𝐶𝑎 1 = [𝑎1 − 𝜎𝑎 1 . 𝑡𝛼 2
, 𝑎1 + 𝜎𝑎 1 . 𝑡𝛼 2 ] = [0,415; 1,388]
𝐼𝐶𝑎 2 = [𝑎2 − 𝜎𝑎 2 . 𝑡𝛼 2
, 𝑎2 + 𝜎𝑎 2 . 𝑡𝛼 2 ] = [0,010; 0,501]
3.5. Utilisation des variables indicatrices
L’appellation de la variable indicatrice est différente dans la littérature, cette variable est aussi
appelée variable binaire ou dichotomique ou auxiliaire ou muette, le terme dummy est le plus
utilisé dans le vocabulaire anglo-saxon.
3.5.1. Définition
Une variable indicatrice est une variable explicative particulière qui prend les valeurs binaires
0 ou 1. Elle est utilisée dans un modèle pour intégrer un facteur explicatif représentant un
phénomène qui a lieu ou n’a pas lieu.
Soit le modèle à deux variables explicatives 𝑥1𝑖 et 𝑥2𝑖 :
𝑦𝑖 = 𝑎0 + 𝑎1 𝑥1𝑖 + 𝑎2 𝑥2𝑖 + 𝑏0 𝐷𝑖 + 𝑏1 𝐷𝑖 𝑥1𝑖 + 𝑏1 𝐷𝑖 𝑥2𝑖 + 𝜀𝑖
Si le phénomène existe 𝐷𝑖 = 0 , s’il n’existe pas alors, 𝐷𝑖 = 1.
- Si 𝑫𝒊 = 𝟎, le modèle s’écrit : 𝑦𝑖 = 𝑎0 + 𝑎1 𝑥1𝑖 + 𝑎2 𝑥2𝑖 + 𝜀𝑖 ,

- Si 𝑫𝒊 = 𝟏, le modèle s’écrit : 𝑦𝑖 = 𝑎0 + 𝑏0 + (𝑎1 + 𝑏1 )𝑥1𝑖 + (𝑎2 +𝑏2 )𝑥2𝑖 + 𝜀𝑖 ,
3.5.2. Domaine d’utilisation
Elle est utilisée pour la correction des valeurs anormales (grève, guerre,…etc.), la
modification structurelle (avant et après un changement structurelle), l’intégration de la
saisonnalité, la caractérisation d’un individu (genre, situation matrimoniale,…etc.),
l’intégration d’un facteur qualitatif (appartenance d’un pays à l’OMC,…etc.).
Exemple 1:
Un modèle de production du service de tourisme est donnée par :
𝑃𝑆𝑡 = 𝑎0 + 𝑎1 𝑉𝐴𝑡 + 𝑎2 𝑃𝑡 + 𝜀𝑡
𝑃𝑆𝑡 : Production du secteur du tourisme pour l’année t.
𝑉𝐴𝑡 : Valeur ajoutée du secteur du tourisme pour l’année t.
𝑃𝑡 : Population pour l’année t.
13
Pour estimation du modèle sur 18 ans, on s’interroge sur la perturbation entrainée par l’effet
d’une guerre pour l’année 16. On intègre au modèle, une variable indicatrice 𝐷𝑡 telle que :
𝐷𝑡 = 0 pour 𝑡 = 1 à 15 et 𝑡 = 17 𝑒𝑡 18 ,
𝐷𝑡 = 1 pour 𝑡 = 16.
L’estimation du modèle donne :
𝑃𝑆𝑡 = 2340,4 + 23,5𝑉𝐴𝑡 + 0,3𝑃𝑡 − 120,56𝐷𝑡 + 𝑒𝑡

𝛼 2
La variable indicatrice 𝐷𝑡 a un ratio de student 𝑡 ∗ = 5,8 > 𝑡14 = 2,14
Donc le coefficient de régression de cette variable est significativement différent de zéro. La

production de service pour l’année 16 est anormalement basse (−120,56) et cette baisse est
du à l’effet de guerre.
Exemple 2 :
Pour estimer un modèle exprimant la relation entre le PIB et les prix du pétrole d’un pays
exportateur du pétrole sur 10 ans, on s’intéresse à l’effet de la hausse des prix du pétrole, pour
une année donnée t=5, sur le PIB. On intègre dans le modèle, une variable indicatrice 𝐷𝑡 telle
que :
𝐷𝑡 = 0 pour 𝑡 = 1 à 4 et 𝑡 = 6 à 10
𝐷𝑡 = 1 si t=5
Le modèle s’écrit :
𝑃𝐼𝐵𝑡 = 𝑎0 + 𝑎1 𝑃𝑟𝑖𝑥𝑡 + 𝑎2 𝐷𝑡 + 𝜀𝑡
Remarque 7 :
Dans le cas des variables qualitatives ayant plusieurs modalités, par exemple la situation
familiale (célibataire, marié, divorcé, veuf), il convient alors de coder autant de variables
indicatrices que de modalités moins une.
3.6. Prévision
3.6.1. Calcul de prévision
Le calcul de la prévision consiste à déterminer quelle valeur doit être attribuée à la variable à
la variable endogène lorsque nous connaissons les valeurs des variables exogènes.
Le modèle général est :
𝑦𝑖 = 𝑎0 + 𝑎1 𝑥1𝑖 + 𝑎2 𝑥2𝑖 + ⋯ + 𝑎𝑘 𝑥𝑘𝑖 + 𝑒𝑖 (𝑖 = 1, … , 𝑛)
La prévision pour la donnée (𝑖 + ℎ) est donnée par :
14
𝑦𝑖+ℎ = 𝑎0 + 𝑎1 𝑥1(𝑖+ℎ) + 𝑎2 𝑥2(𝑖+ℎ) + ⋯ + 𝑎𝑘 𝑥𝑘(𝑖+ℎ)
3.6.2. Intervalle de confiance de la prévision
La variance de l’erreur de la prévision est égale à :

′
𝜎𝑒2𝑖+ℎ = 𝜎𝜀2 (𝑉𝑖+ℎ 𝑋′ 𝑋 −1
𝑉𝑖+ℎ + 1)
avec :
1
𝑥1(𝑖+ℎ)
𝑉= 𝑥2(𝑖+ℎ) est le vecteur des valeurs prévues des variables explicatives,
⋮
𝑥𝑘(𝑖+ℎ)
𝑉′ est la transposé de V.
Nous avons :
𝑒 𝑖+ℎ
𝑒𝑖+ℎ = 𝑦𝑖+ℎ − 𝑦𝑖+ℎ 𝑁(0, 𝜎𝑒2𝑖+ℎ ) ou 𝑁(0,1)
𝜎𝑒 𝑖+ℎ
𝑒 𝑦 𝑖+ℎ −𝑦 𝑖+ℎ
ou encore 𝜎 𝑖+ℎ 𝑡(𝑛 − 𝑘 − 1) c'est-à-dire : 𝑡(𝑛 − 𝑘 − 1) .
𝑒 𝑖+ℎ ′
𝜎𝜀2 (𝑉𝑖+ℎ 𝑋 ′ 𝑋 −1 𝑉𝑖+ℎ +1)
Ainsi, l’intervalle de confiance de la prévision au seuil de signification 𝛼 est donné par :
′
𝐼𝐶𝑦 𝑖+ℎ = [𝑦𝑖+ℎ − 𝑡𝛼 2
𝑛 − 𝑘 − 1 . 𝜎𝜀2 (𝑉𝑖+ℎ 𝑋′ 𝑋 −1 𝑉
𝑖+ℎ + 1) ; 𝑦𝑖+ℎ + 𝑡𝛼 2
𝑛−𝑘−
′
1 . 𝜎𝜀2 (𝑉𝑖+ℎ 𝑋′ 𝑋 −1 𝑉
𝑖+ℎ + 1)].
Exercice 4 :
Pour les données de l’exercice 1, calculer la prévision et son intervalle de confiance à 95%
pour la période t=11, sachant que les valeurs prévues des variables explicatives sont
𝑥1,11 = 24 et 𝑥2,11 = 21.
Corrigé :
- Calcul de la prévision pour l’horizon h=1
𝑦10+1 = 18,87 + 0,902 𝑥1(11) − 0,256𝑥2(11) = 18,87 + 0,902 × 24 − 0,256 × 21 = 35,14
- Calcul de l’intervalle de confiance de la prévision
La variance de l’erreur de prévision est donnée par :
15
1 1
′
𝜎𝑒211 = 𝜎𝜀2 (𝑉11 ′
𝑋𝑋 −1
𝑉11 + 1) avec 𝑉 = 𝑥1(11) = 24
𝑥2(11) 21
6,225 −0,216 −0,114 1

𝜎𝑒211 = 4,495 1 24 21 −0,216 0,00944 0,0033 24 + 1 = 8,54
−0,114 0,0033 0,00241 21
𝐼𝐶𝑦11 = [𝑦11 − 𝑡𝛼 2
𝑛 − 𝑘 − 1 . 𝜎𝑒11 ; 𝑦11 + 𝑡𝛼 2
𝑛 − 𝑘 − 1 . 𝜎𝑒11 ].
𝐼𝐶𝑦11 = 35,14 − 2,36 × 8,54 ; 35,14 + 2,36 × 8,54 = [28,24 ; 42,04]
16

Chapitre 3 Econométrie I

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Chapitre 3 Econométrie I

Transféré par

Droits d'auteur :

Formats disponibles

Cours d’Econométrie I L3 Economie Quantitative 2019-2020 HIDRA.

Chapitre 3 : Modèle de régression linéaire multiple

La régression linéaire multiple est la généralisation multivariée de la régression linéaire

L’équation de régression s’écrit :

𝑦𝑖 = 𝑎0 + 𝑎1 𝑥1𝑖 + 𝑎2 𝑥2𝑖 + ⋯ + 𝑎𝑘 𝑥𝑘𝑖 + 𝜀𝑖 (𝑖 = 1, … , 𝑛)…………………… (3.1)

Nous remarquons dans le modèle (3.1) :

- 𝑖 = 1, … , 𝑛 correspond au numéro des observations ;

Les étapes de processus de modélisation sont les suivantes :

3.2. Ecriture matricielle du modèle

En considérant les valeurs prises par les variables, on peut écrire :

𝑦𝑖 = 𝑎0 + 𝑎1 𝑥1𝑖 + 𝑎2 𝑥2𝑖 + ⋯ + 𝑎𝑘 𝑥𝑘𝑖 + 𝜀𝑖 (𝑖 = 1, … , 𝑛)

En faisant varier 𝑖 de 1 à n , on aura :

𝑦1 = 𝑎0 + 𝑎1 𝑥11 + 𝑎2 𝑥21 + ⋯ + 𝑎𝑘 𝑥𝑘1 + 𝜀1

𝑦2 = 𝑎0 + 𝑎1 𝑥12 + 𝑎2 𝑥22 + ⋯ + 𝑎𝑘 𝑥𝑘2 + 𝜀2

𝑦𝑛 = 𝑎0 + 𝑎1 𝑥1𝑛 + 𝑎2 𝑥2𝑛 + ⋯ + 𝑎𝑘 𝑥𝑘𝑛 + 𝜀𝑛

3.3. Estimation et propriétés des estimateurs

3.3.1. Estimation des paramètres par la méthode des MCO

Soit 𝜀 le vecteur des erreurs avec 𝜀 ′ = 𝜀1 , 𝜀2 , … , 𝜀𝑛 la transposée de 𝜀.

D’après l’écriture matricielle : 𝜀 = 𝑌 − 𝑋𝑎 d’où 𝜀 ′ 𝜀 = 𝑌 − 𝑋𝑎 ′ (𝑌 − 𝑋𝑎)

En dérivant par rapport à 𝑎 on trouve :

𝑑𝑆 𝑑𝜀 ′ 𝜀 𝑑(𝑌 ′ 𝑌 − 𝑌 ′ 𝑋𝑎 − 𝑎′ 𝑋 ′ 𝑌 + 𝑎′ 𝑋 ′ 𝑋𝑎) 𝑑(𝑌 ′ 𝑌 − 2𝑎′ 𝑋 ′ 𝑌 + 𝑎′ 𝑋 ′ 𝑋𝑎)

En égalisant à zéro, il vient : −2𝑋 ′ 𝑌 + 2𝑋 ′ 𝑋𝑎 = 0 𝑋 ′ 𝑋𝑎 = 𝑋 ′ 𝑌

En notant 𝑎 la solution de cette équation (lorsqu’elle existe), on arrive à : 𝑋 ′ 𝑋𝑎 = 𝑋 ′ 𝑌

Cette solution existe si (𝑋 ′ 𝑋) est inversible. Dans ce cas on a :

(𝑋 ′ 𝑋)−1 (𝑋 ′ 𝑋)𝑎 = (𝑋 ′ 𝑋)−1 𝑋 ′ 𝑌 𝑎 = (𝑋 ′ 𝑋)−1 𝑋 ′ 𝑌

L’estimateur des MCO des coefficients du modèle s’écrit :

En cas de multicolinéarité parfaite entre au moins deux variables explicatives, la matrice

3.3.2. Hypothèses de l’estimateur

- Le vecteur Y est aléatoire car il dépend de 𝜀.

On peut aussi écrire H3) comme : ∀𝑖, 𝐸 𝜀𝑖2 = 𝜎𝜀2

Car 𝑉𝑎𝑟 𝜀𝑖 = 𝐸 𝜀𝑖2 − (𝐸 𝜀𝑖 )2 = 𝐸 𝜀𝑖2 − 0 = 𝐸 𝜀𝑖2 .

Tableau 1 : Données de l’exercice 1

2. Calcul de la matrice 𝑿’𝑿 et 𝑿′ 𝒀

- Calcul de la matrice inverse (𝑿’𝑿)−𝟏

6,225 −0,216 −0,114

6,225 −0,216 −0,114 219 𝑎0 18,87

3.3.3. Propriétés de l’estimateur

La spécification théorique du modèle est 𝑌 = 𝑋𝑎 + 𝜀 où 𝜀 est un vecteur aléatoire inconnu.

Le modèle estimé est 𝑌 = 𝑋𝑎.

On défini le résidu (e) par : 𝑒 = 𝑌 − 𝑌.

a) Estimateur sans biais de 𝒂

𝑎 = (𝑋 ′ 𝑋)−1 𝑋′𝑌 est un estimateur sans biais de 𝑎.

L’estimateur est donc sans biais : 𝐸 𝑎 = 𝑎

b) 𝒂 est un estimateur convergent

En notant par Ω𝑎 la matrice des variances-covariances de 𝑎, on a :

On remplace (3.2) dans (3.3), on obtient :

Ω𝑎 = 𝑋 ′ 𝑋 −1 𝑋 ′ 𝐸(𝜀𝜀 ′ )𝑋 𝑋 ′ 𝑋 −1 avec 𝐸 𝜀𝜀 ′ = Ω𝜀 = 𝜎𝜀2 𝐼𝑛 la matrice des variances-

𝐸(𝜀1 𝜀1 ) 𝐸(𝜀1 𝜀2 ) ⋯ 𝐸(𝜀1 𝜀𝑛 ) 𝜎𝜀2 0 ⋯ 0

𝑣𝑎𝑟(𝑎0 ) 𝑐𝑜𝑣(𝑎0 , 𝑎1 ) ⋯ 𝑐𝑜𝑣(𝑎0 , 𝑎𝑘 )

Par conséquent : 𝑎 est un estimateur à variance minimale, donc il est convergent.

Donc l’estimateur de la matrice des variances-covariances de Ω𝑎 est donné par :

c) Equation d’analyse de la variance

L’équation de l’analyse de la variance est donnée par :

Cette équation d’analyse de la variance va nous permettre de juger de la qualité de

Le coefficient 𝑅 2 mesure la proportion de la variance de la variable endogène Y expliquée par

La valeur de 𝑅 2 a tendance à augmenter avec le nombre de variables explicatives plutôt que

En reprenant les données de l’exercice 1 :

1. Calculer les résidus et l’estimation de la variance de l’erreur 𝜎𝜀2 .

1. Calcul des résidus

𝑦𝑡 = 18,87 + 0,902𝑥1𝑡 − 0,256𝑥2𝑡 + 𝑒𝑡 ;

𝑝𝑜𝑢𝑟 𝑡 = 1, 𝑒1 = 12 − 18,87 + 0,902 × 7 − 0,256 × 48 = −0,896

- Calcul de l’estimation de la variance de l’erreur

6,225 −0,216 −0,114 27,9827 −0,9702 −0,5128