Académique Documents
Professionnel Documents
Culture Documents
LSI3 Econometrie Cours
LSI3 Econometrie Cours
■ 1: MCO: Rappel
■ 2: Types de données
■ 3: Exercises
et
E[x (y − β0 − β1 x)] = 0. (6)
■ Supposons que nous ayons un échantillon des données. Ainsi βˆ0 et βˆ1
doivent résoudre les équations 5 et 6 sous leurs formes échantillonnales.
C’est-à-dire,
1 X
n
yi − βˆ0 − βˆ1 xi = 0 (7)
n i=1
et
n
X h i
xi yi − (ȳ − βˆ1 x̄) − βˆ1 xi = 0, (10)
i=1
qui conduit à
n
X n
X
xi (yi − ȳ) = βˆ1 xi (xi − x̄) . (11)
i=1 i=1
■ Remarque: βˆ0 et βˆ1 sont les estimateurs qui minimisent SSR. Les équations
(7) et (8) sont alors appelées les conditions de premier ordre des estimés
des MCO.
■ Nous définissons aussi la sommes des carrés expliqués (SSE) ou “explained
sum of squares” et la somme totale des carrés (SST) ou “total sum of
squares” respectivement par
n
X 2
SSE = (yˆi − ȳ) (16)
i=1
Xn
et SST =
2
(yi − ȳ) . (17)
i=1
3. E(u|x) = 0;
4. et V (u|x) = σ 2 (homoscédasticité);
■ les estimateurs βˆ0 et βˆ1 sont les meilleurs estimateurs linéaires sans biais
(best linear unbiased estimators - BLUE) de β0 et β1 respectivement. Ceci
est connu sous le théorème de Gauss-Markov.
■ Rappelons que βˆ0 et βˆ1 sont les estimateurs non biaisés si
E βˆ0 = β0 and E βˆ1 = β1 . (22)
Utilisez la méthode des MCO pour trouver l’estimateur de β1 . Pour cela, vous
avez seulement besoin de minimiser
n
X 2
(yi − β1 xi ) (24)
i=1
par rapport à β1 .
■ 1: Hypothèses et estimations
■ 2: Théorème de Frisch-Waugh-Lovell
■ 3: Interprétation des coefficients de régression
■ 4: R-carré et R-carré ajusté
■ 5: Tests de significativité (individuelle, globale), test de Chow
■ 6: Différentes méthodes d’estimation (MCO, méthode des moments,
maximum de vraisemblance)
■ 7: Régression multiple (RM) avec des variables binaires
■ 8: Exercices
où
x′i = (1, xi1 , xi2 , . . . , xik ) i = 1, 2, . . . , n (32)
et
β0
β1
β=
.. (33)
.
βk
où
y1 1 x11 ... x1k β0 u1
y2 1 x21 ... x2k β1 u2
y=
.. X=
.. .. .. ..
β=
.. u=
.. (36)
. . . . . . .
yn 1 xn1 . . . xnk βk un
X ′ û = 0
X ′ y − X β̂ = 0 (38)
X ′ y − X ′ X β̂ = 0
■ Démonstration: en exercice.
D’où
h i
−1 −1
E β̂|X = E β|X + (X ′ X) X ′ u|X = β + (X ′ X) X ′ E(u|X) = β. (44)
| {z }
=0
■ Ce qui veut dire que E β̂|X = β. Par la Loi des Espérances Itérées, on a:
E β̂ = E [E (β|X)] = E (β) = β. (45)
■ Cas de la variance:
h i h i
−1 −1
V β̂|X = V β|X + (X ′ X) X ′ u|X = V (X ′ X) X ′ u|X . (47)
où
′
X = [X1 X2 ] et β = (β1′ , β2′ ) . (50)
■ On s’intéresse seulement à β2 .
■ Alors:
β̂2 = α̂2 et û = ê. (53)
■ Alors, l’estimateur des MCO de β̂1 peut être obtenu, soit en faisant
directement la régression multiple en (54), soit en considérant la procédure
de FWL. Trouvez l’estimateur des MCO de β̂1 par cette procédure.
où educ est “le nombre d’années d’éducation”, exper est “le nombre d’années
d’expérience”, et tenure est “le nombre d’années de travail avec l’employeur
actuel”.
■ Comment interpréter les coefficients dans (58). Par exemple, le coefficient
0.092 signifie qu’une année supplémentaire d’études entraine une
augmentation de log(wage) de 0.092, ou bien de 9.2% du salaire, lorsque
exper et tenure sont fixés.
2 SSE SSR
R = =1− (59)
SST SST
et
SSR/(n − k − 1) n−1
Ra2 =1− =1− 1−R 2
. (60)
SST /(n − 1) n−k−1
■ D’après son expresssion, Ra2 pourrait ne pas augmenter suite à l’ajout d’une
variable explicative. Ceci se vérifie de façon simple.
βbj
tβbj = , j = 0, 1, 2, . . . , k. (62)
bβbj
σ
■ Les t-statistiques données par les logiciels sont utilisées pour tester la
significativité des paramètres.
■ Remarque: En réalité, la vraie formule des t-statistiques est la suivante:
βbj − βj
tβbj = , j = 0, 1, 2, . . . , k. (63)
bβbj
σ
H0 : β1 = β2 vs
(68)
H1 : β1 6= β2 .
■ Ces hypothèses peuvent être réécrites de la manière suivante:
H0 : β1 − β2 = 0 vs
(69)
H1 : β1 − β2 6= 0.
■ Dans ce cas, on définit la statistique t par:
βb1 − βb2
t= . (70)
bβb1 −βb2
σ
■ Pour trouver t, il faut calculer σ(βb1 −βb2 ) . En exercice, calculez cette quantité.
Une fois t calculée, on compare sa valeur absolue à un un niveau critique.
On rejette H0 si |t| > tcrit .
2
SSRnr = SST 1 − Rnr . (76)
et H1
yi = x′i β1 + ui pour i = 1, . . . , n1
(84)
yi = x′i β2 + ui pour i = n + 1, . . . , n
où n = n1 + n2 .
où (
f emale = 0 si l’individu est un homme
(88)
f emale = 1 si l’individu est une femme.
■ Alors,
β1 = E (wage|f emale = 1, educ) − E (wage|f emale = 0, educ) . (90)
■ D’où β1 est la différence entre le salaire moyen d’une femme et celui d’un
homme pour le même niveau d’éducation.
■ Selon la spécification (89), le rendement de l’éducation est supposé être le
même pour les hommes que pour les femmes.
■ Mais, il est possible de différencier le rendement de l’éducation des hommes
de celui des femmes. Pour cela, on introduit une nouvelle variable qui est en
fait la variable educ multipliée par la variable f emale:
wage = β0 + β1 f emale + β2 educ + β3 f emale × educ + u. (91)
E(Salaire/Educ1 = 1) = β0 + β1
E(Salaire/Educ2 = 1) = β0 + β2
(97)
E(Salaire/Educ3 = 1) = β0 + β3
E(Salaire/Educ4 = 1) = β0 .
■ On remarque qu’en prenant la différence entre les espérances
conditionnelles par rapport à la catégorie exclue, on obtient:
E(Salaire/Educ1 = 1) − E(Salaire/Educ4 = 1) = β1
E(Salaire/Educ2 = 1) − E(Salaire/Educ4 = 1) = β2 (98)
E(Salaire/Educ3 = 1) − E(Salaire/Educ4 = 1) = β3 .
■ Ainsi, β1 mesure la différence dans les salaires moyens entre les individus
n’ayant aucun niveau d’éducation et ceux ayant un niveau universitaire. β2
mesure la différence dans les salaires moyens entre ceux du primaire et
ceux de l’université. De même, β3 mesure la différence dans les salaires
moyens entre secondaires et universitaires.
A. Zabsonré Econométrie LSI3-2023 - p. 63/135
Les méthodes d’estimation
■ En économétrie, il existe différentes méthodes d’estimation des paramètres:
les MCO, la méthode des moments et le maximum de vraisemblance.
■ Nous avons déjà utilisé dans ce chapitre les deux premières méthodes. La
dernière méthode requiert souvent de spécifier la loi des erreurs. Elle est
beaucoup plus utilisée dans l’économétrie des variables qualitatives.
■ Pour plus de détails sur la méthode du maximum de vraisemblance, revoir le
cours d’économétrie des variables qualitatives.
■ Notez que toutes ces trois méthodes aboutissent au même résultat pour
l’estimation des paramètres du modèle de régression linéaire.
■ Notre régression donnera les paramètres estimés suivants: β̂0∗ , β̂1∗ , β̂2∗ .
■ Avec ce modèle, on suppose que x3 n’a aucun effet sur y après que x1 et x2
ont été contrôlées. Cela signifie que β3 = 0. En termes d’espérance
conditionnelle, on a:
E (y|x1 , x2 , x3 ) = E (y|x1 , x2 ) = β0 + β1 x1 + β2 x2 . (103)
■ Malgré que x3 n’a aucun effet sur y, nous estimons quand-même le modèle:
■ De ce fait,
P
n P
n
(x1i − x̄1 ) yi = (x1i − x̄1 ) (β0 + β1 x1i + β2 x2i + ui )
i=1 i=1 (110)
P
n
2 P
n P
n
= β1 (x1i − x̄1 ) + β2 (x1i − x̄1 ) x2i + (x1i − x̄1 ) ui .
i=1 i=1 i=1
■ Ainsi,
P
n P
n
(x1i − x̄1 ) x2i (x1i − x̄1 ) ui
β˜1 = β1 + β2 i=1
P
n + i=1
Pn (111)
(x1i − x̄1 )2 (x1i − x̄1 )2
i=1 i=1
■ En prenant l’espérance conditionnelle de cet estimateur, nous obtenons que
■ Vos estimateurs des MCO dans la régression simple seront en moyenne trop
grands.
■ Montrez aussi que les erreurs dans la variable dépendante n’affectent pas en
général les estimateurs des MCO.
yi = β0 + β1 xi + ui
(126)
E (ui |xi ) = 0, V (ui |xi ) = σi2 ≡ σ 2 (xi ) .
■ Dans ce modèle ci-dessus, quel est cet estimateur non biaisé plus efficace
que l’estimateur des MCO? C’est l’estimateur des moindres carrés pondérés.
Comment l’obtient-on?
■ Si on divisait ui par (σi /σ) où σ est une constante, alors on aura un nouveau
terme d’erreur u∗i = σui /σi .
■ Ce terme d’erreur u∗i aura pour variance σ 2 . Montrez-le en exercice.
■ On montre donc que u∗i satisfait les hypothèses classiques du modèle de
régression linéaire. En particulier, il satisfait l’homoscédasticité. Le modèle
(126) devient alors:
σyi /σi = β0 σ/σi + β1 σxi /σi + u∗i . (127)
yi = β0 + β1 xi + ui
(128)
E (ui |xi ) = 0, V (ui |xi ) = σi2 ≡ σ 2 (xi ) .
■ Comment tester l’hétéroscédasticité dans les modèles linéaires?
■ Premièrement, on considère la régression:
y = β0 + β1 x1 + β2 x2 + . . . + βk xk + u, E (u|x1 , x2 , . . . , xk ) = 0. (129)
■ Comme u n’est pas connu, on remplace u par û. Donc, on estime l’équation:
û2 = δ0 + δ1 x1 + δ2 x2 + . . . + δk xk + e. (135)
et on obtient l’équation
\ = −0.185 + 0.109educ
ln(salaire)
(0.185) (0.014) (150)
n = 428, R2 = 0.118.
■ Dans le modèle (149), educ est une variable endogène. Supposons qu’on
utilise le niveau d’éducation du père pereduc comme instrument pour educ.
On estime d’abord le modèle sous la forme réduite:
d = 10.24 + 0.269pereduc
educ
(0.28) (0.029) (151)
n = 428, R2 = 0.173.
\ = 0.441 + 0.059educ
ln(salaire)
(0.446) (0.035) (152)
n = 428, R2 = 0.093.
■ Une année d’éducation supplémentaire augmente le salaire de la femme de
6% au lieu de 11% comme dans le cas du MCO. Cela suggère que l’estimé
MCO est trop élevé et correspond au biais de la variable omise (la capacité
ou la compétence, ou l’aptitude).
■ 1: Introduction
■ 2: Panel à deux périodes
■ 3: Modèles à effets fixes
■ 4: Modèles à effets aléatoires
■ 5: Données de panel: Cas général
■ 6: Exercices
■ Ainsi, une différence dans le niveau de production entre ces deux pays si elle
existe est alors liée à des spécificités inobservables, stables dans le temps,
dont l’effet est mesuré par ai .
■ Par exemple, ce coefficient ai peut rendre compte des influences sur la
croissance des différences socio-culturelles ou religieuses. Ces différences
sont difficiles à quantifier mais leurs effets nous intéressent.