Académique Documents
Professionnel Documents
Culture Documents
Econométrie de Panel
Chapitre 1 – Introduction
Chapitre 2 – Modèles à effets individuels
Les chapitres théoriques du cours seront complémentés avec des exercices, qui seront approfondis lors des séances de TDs.
Présentation des effets individuels
Les modèles en données de panel regroupent à la fois la dimension individuelle (comme dans les coupes
transversales) et la dimension temporelle (comme dans les séries temporelles). Par conséquent, les deux indices i et
t sont présents dans l’équation de régression:
où i=1,…,N et t=1,…,T.
i peut désigner ménages, individus, firmes, banques, pays, etc. et t désigne le temps.
𝛼 est une constante et 𝛽 est le vecteur 𝐾 × 1 des coefficients à estimer.
𝑋𝑖𝑡 est est le vecteur 𝐾 × 1 qui désigne la i-ème observation des K variables explicatives.
Les effets individuels spécifiques sont nonobservables (c’est-à-dire, ne sont pas explicitement inclus dans l’équation de régression) et invariants dans le
temps (c’est-à-dire, ne sont pas censés de changer dans le temps).
Présentation des effets individuels: exemples
Dans une équation sur le revenu des ménages,
𝑦𝑖𝑡 = 𝛼 + 𝑋𝑖𝑡′ 𝛽 + 𝑢𝑖𝑡 , 𝑢𝑖𝑡 = 𝜇𝑖 + 𝜈𝑖𝑡
𝑦𝑖𝑡 mesure le revenu des ménages, 𝑋𝑖𝑡 contient un set de variables comme l’expérience, l’éducation, l’appartenance
à un syndicat, genre, ethnie, etc. de l’individu i à l’instant t.
𝜇𝑖 est invariant au temps et tient compte des effets spécifiques individuels qui ne sont pas inclus dans la régression.
On peut les attribuer aux capacités individuelles des individus qui n’ont pas vocation de changer dans le temps et ne
sont pas pris en compte dans la régression.
𝜇𝑖 représente les effets individuels et décrit les caractéristiques invariant aux temps et non-inclus (exclus) dans l’équation de régression.
Présentation des effets individuels: exemples
Dans une équation sur production des firmes,
𝑦𝑖𝑡 = 𝛼 + 𝑋𝑖𝑡′ 𝛽 + 𝑢𝑖𝑡 , 𝑢𝑖𝑡 = 𝜇𝑖 + 𝜈𝑖𝑡
𝑦𝑖𝑡 mesure la production des firmes, 𝑋𝑖𝑡 contient un set de variables les facteurs de production, etc. de la firme i à
l’instant t.
𝜇𝑖 est invariant au temps et tient compte des effets spécifiques individuels qui ne sont pas inclus dans la régression.
On peut les attribuer aux capacités des gestionnaires et des membres de l’exécutif qui n’ont pas vocation de changer
dans le temps et ne sont pas pris en compte dans la régression.
𝜇𝑖 représente les effets individuels et décrit les caractéristiques invariant aux temps et non-inclus (exclus) dans l’équation de régression.
Présentation des effets individuels: forme matricielle
La forme classique de l’équation:
𝑦𝑖𝑡 = 𝛼 + 𝑋𝑖𝑡′ 𝛽 + 𝑢𝑖𝑡 , 𝑢𝑖𝑡 = 𝜇𝑖 + 𝜈𝑖𝑡
𝑦 = 𝛼𝜄𝑁𝑇 + 𝑋𝛽 + 𝑢 = 𝑍𝛿 + 𝑢
𝑦1𝑡
𝑋1,1𝑡 … 𝑋𝐾,1𝑡
𝛽1 1
où 𝑦 = ⋮ 𝑋= ⋮ ⋱ ⋮ 𝛽= ⋮ 𝑍 = 𝜄𝑁𝑇 , 𝑋 𝜄𝑁𝑇 = ⋮ 𝛿 ′ = 𝛼 ′ , 𝛽′
𝑦𝑁𝑇
𝑋1,𝑁𝑡 … 𝑋𝐾,1𝑡 ถ
𝛽𝐾 ด
1
𝑁𝑇×1 𝑁𝑇×1
𝐾×1
𝑁𝑇×𝐾
La forme matricielle est intéressante car elle allège l’écriture des équations.
Présentation des effets individuels: forme matricielle
La forme vectorielle peut être écrite de la façon suivante:
𝑦 = 𝛼𝜄𝑁𝑇 + 𝑋𝛽 + 𝑢 = 𝑍𝛿 + 𝑢
𝑦11
⋮
𝑦1𝑇
𝑋1,1𝑡 … 𝑋𝐾,1𝑡
𝛽1 1
où 𝑦 = ⋮ 𝑋= ⋮ ⋱ ⋮ 𝛽= ⋮ 𝑍 = 𝜄𝑁𝑇 , 𝑋 𝜄𝑁𝑇 = ⋮ 𝛿 ′ = 𝛼 ′ , 𝛽′
𝑦𝑁1
𝑋1,𝑁𝑡 … 𝑋𝐾,1𝑡 ถ
𝛽𝐾 ด
1
⋮
𝑦𝑁𝑇 𝐾×1 𝑁𝑇×1
𝑁𝑇×𝐾
𝑁𝑇×1
𝑦 = 𝛼𝜄𝑁𝑇 + 𝑋𝛽 + 𝑢 = 𝑍𝛿 + 𝑢, avec 𝑢 = 𝑍𝜇 𝜇 + 𝜈
Cela veut dire que, 𝑃𝑦 a comme élément 𝑦𝑖. = σ𝑇𝑡=1 𝑦𝑖𝑡 Τ𝑇 et 𝑄𝑦 a comme élément 𝑦𝑖𝑡 − 𝑦𝑖. .
P et Q sont des matrices symétriques et idempotentes:
i) 𝑃′ = 𝑃 et 𝑄′ = 𝑄, 𝑃2 = 𝑃 et 𝑄 2 = 𝑄 𝑟𝑎𝑛𝑘 𝑃 = 𝑡𝑟 𝑃 = 𝑁 et 𝑟𝑎𝑛𝑘 𝑄 = 𝑡𝑟 𝑄 = 𝑁 𝑇 − 1
ii) P et Q sont orthogonales, 𝑃𝑄 = 0
iii) 𝑃 + 𝑄 = 𝐼𝑁𝑇
𝑦 = 𝛼𝜄𝑁𝑇 + 𝑋𝛽 + 𝑢 = 𝑍𝛿 + 𝑍𝜇 𝜇 + 𝜈
L’estimateur LSDV (Least Squares Dummy Variables) est celui qu’on applique pour les modèles en panel avec des effets individuels fixes.
Effets individuels fixes
𝜇𝑖 sont considérés comme des paramètres fixes (des constantes individuelles) à estimer.
𝜈𝑖𝑡 sont des résidus qui suivent une loi 𝐼𝐼𝐷 0, 𝜎𝜈2 .
𝑋𝑖𝑡 sont supposées indépendantes de 𝜈𝑖𝑡 , 𝑐𝑜𝑣 𝑋𝑖𝑡 , 𝜈𝑖𝑡 = 0, pour ∀𝑖 et ∀𝑡
𝑄𝑦 = 𝑄𝑋𝛽 + 𝑄𝜈
La matrice Q exclut les effets fixes, 𝑄𝑍𝜇 = 𝑄𝜄𝑁𝑇 = 0, car 𝑃𝑍𝜇 = 𝑍𝜇 . En d’autres termes, c’est une régression de 𝑦 =
𝑄𝑦 avec des éléments 𝑦𝑖𝑡 − 𝑦ത𝑖. sur 𝑋෨ = 𝑄𝑋 avec des éléments 𝑋𝑖𝑡,𝑘 − 𝑋ത𝑖.,𝑘 pour la k-ème variable, k=1,…,K. Cela
implique l’inversion d’une matrice de taille 𝐾 × 𝐾 au lieu de 𝑁 + 𝐾 × 𝑁 + 𝐾 .
L’estimateur MCO obtenu est
𝛽෨ = 𝑋 ′ 𝑄𝑋 −1 𝑋 ′ 𝑄𝑦
−1
avec 𝑣𝑎𝑟 𝛽෨ = 𝜎𝜈2 𝑋 ′ 𝑄𝑋 −1 = 𝜎𝜈2 𝑋෨ ′ 𝑋෨
L’estimateur LSDV (Least Squares Dummy Variables) est celui qu’on applique pour les modèles en panel avec des effets individuels fixes.
La matrice Q exclut les effets fixes.
Effets individuels fixes
𝜇𝑖 sont considérés comme des paramètres fixes (des constantes individuelles) à estimer.
𝜈𝑖𝑡 sont des résidus qui suivent une loi 𝐼𝐼𝐷 0, 𝜎𝜈2 .
𝑋𝑖𝑡 sont supposées indépendantes de 𝜈𝑖𝑡 , 𝑐𝑜𝑣 𝑋𝑖𝑡 , 𝜈𝑖𝑡 = 0, pour ∀𝑖 et ∀𝑡
L’estimateur de 𝛽෨ peut autrement être obtenu avec l’approche classique des MCO.
Effets individuels fixes
𝜇𝑖 sont considérés comme des paramètres fixes (des constantes individuelles) à estimer.
𝜈𝑖𝑡 sont des résidus qui suivent une loi 𝐼𝐼𝐷 0, 𝜎𝜈2 .
𝑋𝑖𝑡 sont supposées indépendantes de 𝜈𝑖𝑡 , 𝑐𝑜𝑣 𝑋𝑖𝑡 , 𝜈𝑖𝑡 = 0, pour ∀𝑖 et ∀𝑡
où σ𝑁 𝑖=1 𝜇𝑖 = 0 est une restriction appliquée afin d’éviter la trappe à la variable muette et ainsi la colinéarité
parfaite.
L’estimateur 𝛽෨ est obtenu de la régression
𝑦𝑖𝑡 − 𝑦ത𝑖. = 𝛽 𝑥𝑖𝑡 − 𝑥ҧ𝑖. + 𝜈𝑖𝑡 − 𝜈ҧ𝑖.
et l’estimateur 𝛼,
de l’équation
𝛼 = 𝑦ത.. − 𝛽෨ 𝑥ҧ..
et l’estimateur 𝜇𝑖 , de l’équation
𝜇𝑖 = 𝑦ത𝑖. − 𝛼 − 𝛽෨𝑥ҧ𝑖.
L’estimateur de 𝛽෨ peut autrement être obtenu avec l’approche classique des MCO.
Effets individuels fixes
𝜇𝑖 sont considérés comme des paramètres fixes (des constantes individuelles) à estimer.
𝜈𝑖𝑡 sont des résidus qui suivent une loi 𝐼𝐼𝐷 0, 𝜎𝜈2 .
𝑋𝑖𝑡 sont supposées indépendantes de 𝜈𝑖𝑡 , 𝑐𝑜𝑣 𝑋𝑖𝑡 , 𝜈𝑖𝑡 = 0, pour ∀𝑖 et ∀𝑡
pourrait ne pas être faisable, car elle inclut N-1 variables muettes. Les Moindres Carrés à effets fixes, appelé LSDV,
souffre d’une perte énorme de degrés de liberté. Trop de variables muettes peut aggraver le problème de
multicolinéarité entre les variables explicatives.
Si cette régression est le vrai modèle, LSDV est l’estimateur BLUE à condition que 𝜈𝑖𝑡 soit un BB centré, à savoir
𝜈𝑖𝑡 ~𝐿𝑜𝑖 0, 𝜎𝜈2 𝐼𝑁𝑇 .
Si 𝑇 → ∞, FE est un estimateur cohérent
Si N → ∞ et T est fixé, seulement l’estimateur FE de 𝛽 est cohérent et ceux des effets individuels 𝛼 + 𝜇𝑖 ne le sont
pas car le nombre de paramètres augmente avec N.
𝑅𝑅𝑆𝑆−𝑈𝑅𝑆𝑆 Τ 𝑁−1
La statistique de Fisher 𝐹0 = ~𝐹𝑁−1,𝑁 𝑇−1 −𝐾
𝑈𝑅𝑆𝑆Τ 𝑁𝑇−𝑁−𝐾
Ensuite, il faut déclarer à Stata qu’il s’agit de données en panel, avec i=state_index indiquant l’indice individuel et
t=yr indiquant l’indice temporel
xtset state_index yr
𝑌 est le Produit National Brut. 𝐾1 est le capital public qui comprend autoroutes et rues, installations d'eau et d'égouts et autres bâtiments et
structures publics. 𝐾2 est le stock de capital privé. 𝐿 est le facteur travail mesuré en tant qu'emploi dans les masses salariales non agricoles.
𝑈𝑛𝑒𝑚𝑝 est le taux de chômage. Les données sont téléchargeables du fichier « Productivity data.xlxs ».
Effets individuels fixes: Application
Considérions la fonction de production Cobb-Douglas qui étudie la productivité du capital public dans la production:
𝑙𝑛𝑌𝑖𝑡 = 𝛼 + 𝛽1 𝑙𝑛𝐾1,𝑖𝑡 + 𝛽2 𝑙𝑛𝐾2,𝑖𝑡 + 𝛽3 𝑙𝑛𝐿𝑖𝑡 + 𝛽4 𝑈𝑛𝑒𝑚𝑝𝑖𝑡 + 𝑢𝑖𝑡
Ensuite, il faut déclarer à Stata qu’il s’agit de données en panel, avec i=state_index indiquant l’indice individuel et
t=yr indiquant l’indice temporel
xtset state_index yr
Toutes les commandes et les commentaires peuvent être réunis dans un fichier de type « .do ».
Window Do-file Editor New Do-file Editor
Avant un commentaire il faut mettre le symbole « /* » et après lui le symbole « */».
Effets individuels fixes: Application
Considérions la fonction de production Cobb-Douglas qui étudie la productivité du capital public dans la production:
𝑙𝑛𝑌𝑖𝑡 = 𝛼 + 𝛽1 𝑙𝑛𝐾1,𝑖𝑡 + 𝛽2 𝑙𝑛𝐾2,𝑖𝑡 + 𝛽3 𝑙𝑛𝐿𝑖𝑡 + 𝛽4 𝑈𝑛𝑒𝑚𝑝𝑖𝑡 + 𝑢𝑖𝑡
Ensuite, il faut déclarer à Stata qu’il s’agit de données en panel, avec i=state_index indiquant l’indice individuel et
t=yr indiquant l’indice temporel
xtset state_index yr
Ensuite, depuis la base de données avec l’extension « .dta », on ouvre le fichier « .do »
File Do …
Effets individuels fixes: Application
. xtreg lnY lnK1 lnK2 lnL unemp, fe
F(4,764) = 3064.81
corr(u_i, Xb) = 0.0608 Prob > F = 0.0000
------------------------------------------------------------------------------
lnY | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
lnK1 | -.0261493 .0290016 -0.90 0.368 -.0830815 .0307829
lnK2 | .2920067 .0251197 11.62 0.000 .242695 .3413185
lnL | .7681595 .0300917 25.53 0.000 .7090872 .8272318
unemp | -.0052977 .0009887 -5.36 0.000 -.0072387 -.0033568
_cons | 2.352898 .1748131 13.46 0.000 2.009727 2.696069
-------------+----------------------------------------------------------------
sigma_u | .09057292
sigma_e | .03813705
rho | .8494045 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(47, 764) = 75.82 Prob > F = 0.0000
F(4,764) = 3064.81
corr(u_i, Xb) = 0.0608 Prob > F = 0.0000
------------------------------------------------------------------------------
lnY | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
lnK1 | -.0261493 .0290016 -0.90 0.368 -.0830815 .0307829
lnK2 | .2920067 .0251197 11.62 0.000 .242695 .3413185
lnL | .7681595 .0300917 25.53 0.000 .7090872 .8272318
unemp | -.0052977 .0009887 -5.36 0.000 -.0072387 -.0033568
_cons | 2.352898 .1748131 13.46 0.000 2.009727 2.696069
-------------+----------------------------------------------------------------
sigma_u | .09057292
sigma_e | .03813705
rho | .8494045 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(47, 764) = 75.82 Prob > F = 0.0000
Puisque la p-value>0.10, la variable K1 n’a pas d’effet statistique sur la variable Y. Par conséquent, le capital public n’a pas d’effet sur le Produit National
Brut.
Effets individuels fixes: Application
. xtreg lnY lnK1 lnK2 lnL unemp, fe
F(4,764) = 3064.81
corr(u_i, Xb) = 0.0608 Prob > F = 0.0000
------------------------------------------------------------------------------
lnY | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
lnK1 | -.0261493 .0290016 -0.90 0.368 -.0830815 .0307829
lnK2 | .2920067 .0251197 11.62 0.000 .242695 .3413185
lnL | .7681595 .0300917 25.53 0.000 .7090872 .8272318
unemp | -.0052977 .0009887 -5.36 0.000 -.0072387 -.0033568
_cons | 2.352898 .1748131 13.46 0.000 2.009727 2.696069
-------------+----------------------------------------------------------------
sigma_u | .09057292
sigma_e | .03813705
rho | .8494045 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(47, 764) = 75.82 Prob > F = 0.0000
Puisque la p-value<0.05, la variable K2 a d’effet statistique sur la variable Y. Par conséquent, le capital privé a d’effet sur le Produit National Brut. Plus
précisément, une hausse de 1% du capital privé implique une hausse de 0.29% du Produit National Brut, toutes choses égales par ailleurs.
Effets individuels fixes: Application
. xtreg lnY lnK1 lnK2 lnL unemp, fe
F(4,764) = 3064.81
corr(u_i, Xb) = 0.0608 Prob > F = 0.0000
------------------------------------------------------------------------------
lnY | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
lnK1 | -.0261493 .0290016 -0.90 0.368 -.0830815 .0307829
lnK2 | .2920067 .0251197 11.62 0.000 .242695 .3413185
lnL | .7681595 .0300917 25.53 0.000 .7090872 .8272318
unemp | -.0052977 .0009887 -5.36 0.000 -.0072387 -.0033568
_cons | 2.352898 .1748131 13.46 0.000 2.009727 2.696069
-------------+----------------------------------------------------------------
sigma_u | .09057292
sigma_e | .03813705
rho | .8494045 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(47, 764) = 75.82 Prob > F = 0.0000
Puisque la p-value<0.05, la variable L a d’effet statistique sur la variable Y. Par conséquent, le facteur travail a d’effet sur le Produit National Brut. Plus
précisément, une hausse de 1% de la masse salariale non-agricole implique une hausse de 0.78% du Produit National Brut, toutes choses égales par
ailleurs.
Effets individuels fixes: Application
. xtreg lnY lnK1 lnK2 lnL unemp, fe
F(4,764) = 3064.81
corr(u_i, Xb) = 0.0608 Prob > F = 0.0000
------------------------------------------------------------------------------
lnY | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
lnK1 | -.0261493 .0290016 -0.90 0.368 -.0830815 .0307829
lnK2 | .2920067 .0251197 11.62 0.000 .242695 .3413185
lnL | .7681595 .0300917 25.53 0.000 .7090872 .8272318
unemp | -.0052977 .0009887 -5.36 0.000 -.0072387 -.0033568
_cons | 2.352898 .1748131 13.46 0.000 2.009727 2.696069
-------------+----------------------------------------------------------------
sigma_u | .09057292
sigma_e | .03813705
rho | .8494045 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(47, 764) = 75.82 Prob > F = 0.0000
Puisque la p-value<0.05, la variable unemp a d’effet statistique sur la variable Y. Par conséquent, le taux de chômage a d’effet sur le Produit National Brut.
Plus précisément, une hausse de 1% du taux de chômage implique une baisse de 0.005% du Produit National Brut, toutes choses égales par ailleurs.
Effets individuels fixes: Application
. xtreg lnY lnK1 lnK2 lnL unemp, fe Le tableau affiche également le résultats du test de Chow sur la
Fixed-effects (within) regression Number of obs = 816 pertinence du modèle à effets fixes
Group variable: state_index Number of groups = 48
------------------------------------------------------------------------------
lnY | Coef. Std. Err. t P>|t| [95% Conf. Interval] où K est le nombre de variables explicatives,
-------------+----------------------------------------------------------------
lnK1 | -.0261493 .0290016 -0.90 0.368 -.0830815 .0307829
RRSS Restricted Residual Sum of Squares, c’est-à-dire la somme
lnK2 | .2920067 .0251197 11.62 0.000 .242695 .3413185 des carrés des résidus pour le modèle contraint, à savoir le
lnL | .7681595 .0300917 25.53 0.000 .7090872 .8272318
unemp | -.0052977 .0009887 -5.36 0.000 -.0072387 -.0033568
modèle groupé où MCO est appliqué
_cons | 2.352898 .1748131 13.46 0.000 2.009727 2.696069 URSS Unrestricted Residual Sum of Squares, c’est-à-dire la
-------------+----------------------------------------------------------------
sigma_u | .09057292
somme des carrés des résidus pour le modèle noncontraint, à
sigma_e | .03813705 savoir le modèle à effets fixes où LSDV est appliqué.
rho | .8494045 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(47, 764) = 75.82 Prob > F = 0.0000
La statistique de Fisher est très élevée, F(47,764)=75.82 et statistiquement très significative (p-value<0,05). Cela signifie que les effets individuels sont
conjointement statistiquement significatifs; c’est-à-dire, il existe au moins un état pour qui cet effet soit significatif. Cela signifie également qu’une
régression simple des MCO, qui ne considère pas les effets individuels, souffrirait d’un biais de variables omises (les effets individuels) et rendrait ainsi les
résultats biaisés.
Effets individuels fixes: Application
. xtreg lnY lnK1 lnK2 lnL unemp, fe Le tableau affiche également le résultats du test de Chow sur la
Fixed-effects (within) regression Number of obs = 816 pertinence du modèle à effets fixes
Group variable: state_index Number of groups = 48
------------------------------------------------------------------------------
lnY | Coef. Std. Err. t P>|t| [95% Conf. Interval] où K est le nombre de variables explicatives,
-------------+----------------------------------------------------------------
lnK1 | -.0261493 .0290016 -0.90 0.368 -.0830815 .0307829
RRSS Restricted Residual Sum of Squares, c’est-à-dire la somme
lnK2 | .2920067 .0251197 11.62 0.000 .242695 .3413185 des carrés des résidus pour le modèle contraint, à savoir le
lnL | .7681595 .0300917 25.53 0.000 .7090872 .8272318
unemp | -.0052977 .0009887 -5.36 0.000 -.0072387 -.0033568
modèle groupé où MCO est appliqué
_cons | 2.352898 .1748131 13.46 0.000 2.009727 2.696069 URSS Unrestricted Residual Sum of Squares, c’est-à-dire la
-------------+----------------------------------------------------------------
sigma_u | .09057292
somme des carrés des résidus pour le modèle noncontraint, à
sigma_e | .03813705 savoir le modèle à effets fixes où LSDV est appliqué.
rho | .8494045 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(47, 764) = 75.82 Prob > F = 0.0000
Puisque l’estimateur LSDV est un estimateur MCO avec la prise en compte des effets individuels, on peut appliquer ce dernier estimateur en mettant dans
l’équation de régression les effets individuels explicitement
reg lnY lnK1 lnK2 lnL unemp i.state_index
Effets individuels fixes: Application
------------------------------------------------------------------------------ ------------------------------------------------------------------------------
lnY | Coef. Std. Err. z P>|z| [95% Conf. Interval] lnY | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+---------------------------------------------------------------- -------------+----------------------------------------------------------------
| |
state_index | state_index |
2 | .1664708 .0136339 12.21 0.000 .1397489 .1931928 25 | .1096629 .0163961 6.69 0.000 .0775271 .1417987
3 | .0613988 .01672 3.67 0.000 .0286282 .0941695 26 | .1402695 .0246146 5.70 0.000 .0920259 .1885132
4 | .2988061 .0368152 8.12 0.000 .2266496 .3709625 27 | .1225309 .0273569 4.48 0.000 .0689123 .1761494
5 | .1942932 .0137456 14.13 0.000 .1673523 .2212341 28 | .2412521 .0201436 11.98 0.000 .2017714 .2807328
6 | .2695868 .0188069 14.33 0.000 .2327259 .3064477 29 | .2527582 .0222681 11.35 0.000 .2091136 .2964029
7 | .2118447 .0224317 9.44 0.000 .1678793 .2558101 30 | .2743703 .0388085 7.07 0.000 .198307 .3504336
8 | .1315363 .020489 6.42 0.000 .0913785 .171694 31 | .0360083 .0169712 2.12 0.034 .0027454 .0692713
9 | .0565913 .0160726 3.52 0.000 .0250895 .088093 32 | .1422781 .0296689 4.80 0.000 .0841281 .200428
10 | .1367972 .0251638 5.44 0.000 .0874771 .1861174 33 | .1210272 .022762 5.32 0.000 .0764146 .1656399
11 | .1857043 .0240672 7.72 0.000 .1385333 .2328752 34 | .2143161 .0164367 13.04 0.000 .1821008 .2465314
12 | .0577659 .0140859 4.10 0.000 .030158 .0853739 35 | .1492874 .0139964 10.67 0.000 .1218549 .1767199
13 | .1255467 .0140015 8.97 0.000 .0981042 .1529892 36 | .0877256 .024799 3.54 0.000 .0391204 .1363308
14 | .1371023 .0156361 8.77 0.000 .106456 .1677485 37 | .1867344 .030334 6.16 0.000 .1272807 .246188
15 | .1976713 .0140004 14.12 0.000 .170231 .2251115 38 | -.082223 .016847 -4.88 0.000 -.1152424 -.0492036
16 | .3130538 .02213 14.15 0.000 .2696798 .3564278 39 | .0880636 .0239972 3.67 0.000 .0410298 .1350973
17 | .0667997 .0252354 2.65 0.008 .0173391 .1162602 40 | .0274807 .0155322 1.77 0.077 -.0029618 .0579233
18 | .1986623 .0202527 9.81 0.000 .1589676 .2383569 41 | .1920419 .0251718 7.63 0.000 .142706 .2413778
19 | .1606044 .02308 6.96 0.000 .1153685 .2058403 42 | .1270401 .0170767 7.44 0.000 .0935704 .1605098
20 | .2153771 .02168 9.93 0.000 .1728851 .2578691 43 | .1345834 .0287631 4.68 0.000 .0782087 .190958
21 | .1139324 .0165492 6.88 0.000 .0814965 .1463683 44 | .1788493 .0182458 9.80 0.000 .1430882 .2146104
22 | .0484076 .0142564 3.40 0.001 .0204655 .0763496 45 | .2451644 .0205819 11.91 0.000 .2048246 .2855042
23 | .1120074 .0152631 7.34 0.000 .0820922 .1419226 46 | .0915333 .0182785 5.01 0.000 .0557081 .1273586
24 | .1465373 .0266613 5.50 0.000 .094282 .1987925 47 | .1273426 .0170358 7.47 0.000 .093953 .1607323
25 | .1096629 .0163961 6.69 0.000 .0775271 .1417987 48 | .4469402 .0398907 11.20 0.000 .3687559 .5251245
Comme on peut constater, les effets individuels de tous les états sont statistiquement significatifs au seuil de 10% et qu’ils ne sont pas significatifs à 5%
uniquement pour l’état 40.
Effets individuels aléatoires: éléments de base
Il y a trop de paramètres dans le modèle à effets fixes et la perte de degrés de liberté peut être évitée si 𝜇𝑖 est
considéré aléatoire: 𝜇𝑖 ~𝐼𝐼𝐷 0, 𝜎𝜇2 , 𝜈𝑖𝑡 ~𝐼𝐼𝐷 0, 𝜎𝜈2 et 𝜇𝑖 est indépendant de 𝜈𝑖𝑡 .
En plus, 𝑋𝑖𝑡 sont indépendantes de 𝜇𝑖 et 𝜈𝑖𝑡 , pour ∀𝑖 et ∀𝑡.
Si N est trop grand, le modèle à effets fixes mène vers la perte de degrés de liberté. Ainsi, l’effet individuel est
considéré comme aléatoire. D’après l’expression des résidus
𝑢 = 𝑍𝜇 𝜇 + 𝜈
ce qui implique une variance homoscédastique 𝑣𝑎𝑟 𝑢𝑖𝑡 = 𝜎𝜇2 + 𝜎𝜈2 pour ∀𝑖 et ∀𝑡 et la même corrélation 𝜎𝜇2 dans
le temps pour le même individu. Par conséquent,
𝜎𝜇2 + 𝜎𝜈2 𝑝𝑜𝑢𝑟 𝑖 = 𝑗, 𝑡 = 𝑠 1 𝑝𝑜𝑢𝑟 𝑖 = 𝑗, 𝑡 = 𝑠
𝑐𝑜𝑣 𝑢𝑖𝑡 , 𝑢𝑗𝑠 = ൞ 𝜎𝜇2 𝑝𝑜𝑢𝑟 𝑖 = 𝑗, 𝑡 ≠ 𝑠 et ρ = 𝑐𝑜𝑟 𝑢𝑖𝑡 , 𝑢𝑗𝑠 = ൞𝜎𝜇2 ൗ 𝜎𝜇2 + 𝜎𝜈2 𝑝𝑜𝑢𝑟 𝑖 = 𝑗, 𝑡 ≠ 𝑠
0 𝑠𝑖𝑛𝑜𝑛 0 𝑠𝑖𝑛𝑜𝑛
Le modèles à effets aléatoires implique une variance homoscédastique et une corrélation des résidus dans le temps pour le même individu.
Effets individuels aléatoires: la matrice de variance-covariance
Afin d’obtenir l’estimateur GLS (General Least Squares), on a besoin de la matrice de variance-covariance inversée
Ω = 𝜎𝜇2 𝐼𝑁 ⊗ 𝐽𝑇 + 𝜎𝜈2 𝐼𝑁 ⊗ 𝐼𝑇 = 𝑇𝜎𝜇2 𝐼𝑁 ⊗ 𝐽𝑇ҧ + 𝜎𝜈2 𝐼𝑁 ⊗ 𝐸𝑇 + 𝜎𝜈2 𝐼𝑁 ⊗ 𝐽𝑇ҧ
où 𝐽𝑇ҧ = 𝐽𝑇 Τ𝑇 et 𝐸𝑇 = 𝐼𝑇 − 𝐽𝑇ҧ .
Et on obtient
Ω = 𝜎12 𝑃 + 𝜎𝜈2 𝑄
La distribution réelle des résidus n’est pas connue et ces variances ne peuvent pas être estimées.
1) Wallace et Hussain (1969) suggèrent d’appliquer les résidus OLS, 𝑢ො 𝑂𝐿𝑆 , à la place des vraies valeurs, qui sont
inconnues, de u. De toute façon, avec un modèle à effets aléatoires, l’estimateur OLS est encore non-biaisé et
cohérent, mais plus efficient.
2) Amemiya (1971) suggère d’appliquer les résidus LSDV à la place des résidus OLS. Dans ce cas, 𝑢 = 𝑦 − 𝛼𝜄 𝑁𝑇 − 𝑋𝛽෨
෨ En substituant, 𝑢 à la place de u dans les équations des variances ci-dessus, on obtient les
ത .. 𝛽.
où 𝛼 = 𝑦ത.. − 𝑋′
estimateurs d’Amemiya, qui ont la distribution suivante
3) Swamy et Arora (1972) suggèrent de réaliser 2 régressions pour obtenir les estimateurs des variances.
La 1ère régression est la régression Within (effets fixes)
𝑦𝑖𝑡 − 𝑦ത𝑖. = 𝛽 𝑥𝑖𝑡 − 𝑥ҧ𝑖. + 𝜈𝑖𝑡 − 𝜈ҧ𝑖.
La 2nde régression est la régression Between sur les moyennes dans le temps
ത 𝑖. + 𝑢ത 𝑖.
𝑦ത𝑖. = 𝛼 + 𝑋′
ҧ 𝑋 et 𝜙 2 = 𝜎𝜈2 Τ𝜎12 .
et 𝑊𝑋𝑋 = 𝑋 ′ 𝑄𝑋, 𝐵𝑋𝑋 = 𝑋′ 𝑃 − 𝐽𝑁𝑇
où 𝑊1 = 𝑊𝑋𝑋 + 𝜙 2 𝐵𝑋𝑋 −1
𝑊𝑋𝑋 et 𝑊2 = 𝑊𝑋𝑋 + 𝜙 2 𝐵𝑋𝑋 −1
𝜙 2 𝐵𝑋𝑋 = 𝐼 − 𝑊1
Remarques:
1) Si 𝜎𝜇2 = 0 ⟹ 𝜙 2 = 1 et 𝛽መ𝐺𝐿𝑆 = 𝛽መ𝑂𝐿𝑆
2) Si 𝑇 → ∞ ⟹ 𝜙 2 → 0 et 𝛽መ𝐺𝐿𝑆 → 𝛽෨𝑊𝑖𝑡ℎ𝑖𝑛
3) Si 𝐵𝑋𝑋 ≫ 𝑊𝑋𝑋 ⟹ 𝛽መ𝐺𝐿𝑆 → 𝛽መ𝐵𝑒𝑡𝑤𝑒𝑒𝑛 et vice versa si 𝑊𝑋𝑋 ≫ 𝐵𝑋𝑋 ⟹ 𝛽መ𝐺𝐿𝑆 → 𝛽෨𝑊𝑖𝑡ℎ𝑖𝑛
2 ҧ
𝜎ො𝜈,𝑚𝑙𝑒 = 𝑑′ 𝑄 + 𝜙 2 𝑃 − 𝐽𝑁𝑇 𝑑 Τ𝑁𝑇
F(4,43) = 1754.11
sd(u_i + avg(e_i.))= .0832062 Prob > F = 0.0000
------------------------------------------------------------------------------
lnY | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
lnK1 | .1793651 .0719719 2.49 0.017 .0342199 .3245104
lnK2 | .3019542 .0418215 7.22 0.000 .2176132 .3862953
lnL | .5761274 .0563746 10.22 0.000 .4624372 .6898176
unemp | -.0038903 .0099084 -0.39 0.697 -.0238724 .0160918
_cons | 1.589444 .2329796 6.82 0.000 1.119596 2.059292
------------------------------------------------------------------------------
Reprenons l’exemple de l’effets du capital public et du capital privé sur le Produit National Brut aux Etats-Unis (fichier « Productivity data.xlsx »)
On peut également effectuer une régression between sur les moyennes dans le temps 𝑦ത𝑖. = 𝛼 + 𝑋′ ത 𝑖. + 𝑢ത 𝑖.
Les résultats sont différents des effets fixes car la régression est faite uniquement en coupes transversales entre les états avec les moyennes dans le temps.
Ainsi, le fait de ne pas considérer l’aspect temporel des données rend l’effet de K1 significatif et celui de unemp, au contraire, non-significatif.
Effets individuels aléatoires: Application
. xtreg lnY lnK1 lnK2 lnL unemp, re
------------------------------------------------------------------------------
lnY | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
lnK1 | .0044388 .0234173 0.19 0.850 -.0414583 .0503359
lnK2 | .3105483 .0198047 15.68 0.000 .2717317 .3493649
lnL | .7296705 .0249202 29.28 0.000 .6808278 .7785132
unemp | -.0061725 .0009073 -6.80 0.000 -.0079507 -.0043942
_cons | 2.135411 .1334615 16.00 0.000 1.873831 2.39699
-------------+----------------------------------------------------------------
sigma_u | .0826905
sigma_e | .03813705
rho | .82460109 (fraction of variance due to u_i)
------------------------------------------------------------------------------
La régression avec des effets aléatoires sur Stata se fait par défaut avec la méthode de Swamy et Arora. Commenter les résultats.
Effets individuels aléatoires: Application
. xtreg lnY lnK1 lnK2 lnL unemp, re
------------------------------------------------------------------------------
lnY | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
lnK1 | .0044388 .0234173 0.19 0.850 -.0414583 .0503359
lnK2 | .3105483 .0198047 15.68 0.000 .2717317 .3493649
lnL | .7296705 .0249202 29.28 0.000 .6808278 .7785132
unemp | -.0061725 .0009073 -6.80 0.000 -.0079507 -.0043942
_cons | 2.135411 .1334615 16.00 0.000 1.873831 2.39699
-------------+----------------------------------------------------------------
sigma_u | .0826905
sigma_e | .03813705
rho | .82460109 (fraction of variance due to u_i)
------------------------------------------------------------------------------
La condition des effets aléatoires, à savoir corr(u_i, X) = 0, est imposée aux calculs.
Effets individuels aléatoires: Application
. xtreg lnY lnK1 lnK2 lnL unemp, re
------------------------------------------------------------------------------
lnY | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
lnK1 | .0044388 .0234173 0.19 0.850 -.0414583 .0503359
lnK2 | .3105483 .0198047 15.68 0.000 .2717317 .3493649
lnL | .7296705 .0249202 29.28 0.000 .6808278 .7785132
unemp | -.0061725 .0009073 -6.80 0.000 -.0079507 -.0043942
_cons | 2.135411 .1334615 16.00 0.000 1.873831 2.39699
-------------+----------------------------------------------------------------
sigma_u | .0826905
sigma_e | .03813705
rho | .82460109 (fraction of variance due to u_i)
------------------------------------------------------------------------------
Comme dans le cas des effets fixes, puisque la p-value>0.10, la variable K1 n’a pas d’effet statistique sur la variable Y. Par conséquent, le capital public n’a
pas d’effet sur le Produit National Brut.
Effets individuels aléatoires: Application
. xtreg lnY lnK1 lnK2 lnL unemp, re
------------------------------------------------------------------------------
lnY | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
lnK1 | .0044388 .0234173 0.19 0.850 -.0414583 .0503359
lnK2 | .3105483 .0198047 15.68 0.000 .2717317 .3493649
lnL | .7296705 .0249202 29.28 0.000 .6808278 .7785132
unemp | -.0061725 .0009073 -6.80 0.000 -.0079507 -.0043942
_cons | 2.135411 .1334615 16.00 0.000 1.873831 2.39699
-------------+----------------------------------------------------------------
sigma_u | .0826905
sigma_e | .03813705
rho | .82460109 (fraction of variance due to u_i)
------------------------------------------------------------------------------
Comme dans le cas des effets fixes, puisque la p-value<0.05, la variable K2 a d’effet statistique sur la variable Y. Par conséquent, le capital privé a d’effet sur
le Produit National Brut. Plus précisément, une hausse de 1% du capital privé implique une hausse de 0.31% du Produit National Brut, toutes choses égales
par ailleurs. C’est un résultats légèrement supérieur à celui des EF.
Effets individuels aléatoires: Application
. xtreg lnY lnK1 lnK2 lnL unemp, re
------------------------------------------------------------------------------
lnY | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
lnK1 | .0044388 .0234173 0.19 0.850 -.0414583 .0503359
lnK2 | .3105483 .0198047 15.68 0.000 .2717317 .3493649
lnL | .7296705 .0249202 29.28 0.000 .6808278 .7785132
unemp | -.0061725 .0009073 -6.80 0.000 -.0079507 -.0043942
_cons | 2.135411 .1334615 16.00 0.000 1.873831 2.39699
-------------+----------------------------------------------------------------
sigma_u | .0826905
sigma_e | .03813705
rho | .82460109 (fraction of variance due to u_i)
------------------------------------------------------------------------------
Comme dans le cas des effets fixes, puisque la p-value<0.05, la variable L a d’effet statistique sur la variable Y. Par conséquent, le facteur travail a d’effet sur
le Produit National Brut. Plus précisément, une hausse de 1% de la masse salariale non-agricole implique une hausse de 0.73% du Produit National Brut,
toutes choses égales par ailleurs. C’est un résultats légèrement inférieur à celui des EF.
Effets individuels aléatoires: Application
. xtreg lnY lnK1 lnK2 lnL unemp, mle . mixed lnY lnK1 lnK2 lnL unemp || _all:R.state_index
Random-effects ML regression Number of obs = 816 Mixed-effects ML regression Number of obs = 816
Group variable: state_index Number of groups = 48 Group variable: _all Number of groups = 1
Random effects u_i ~ Gaussian Obs per group: min = 17 Obs per group: min = 816
avg = 17.0 avg = 816.0
max = 17 max = 816
LR chi2(4) = 2412.91
Log likelihood = 1401.9041 Prob > chi2 = 0.0000 Wald chi2(4) = 18904.40
Log likelihood = 1401.9041 Prob > chi2 = 0.0000
------------------------------------------------------------------------------
lnY | Coef. Std. Err. z P>|z| [95% Conf. Interval] ------------------------------------------------------------------------------
-------------+---------------------------------------------------------------- lnY | Coef. Std. Err. z P>|z| [95% Conf. Interval]
lnK1 | .0031446 .0239185 0.13 0.895 -.0437348 .050024 -------------+----------------------------------------------------------------
lnK2 | .309811 .020081 15.43 0.000 .270453 .3491691 lnK1 | .0031446 .0234856 0.13 0.893 -.0428864 .0491755
lnL | .7313372 .0256936 28.46 0.000 .6809787 .7816957 lnK2 | .309811 .0199118 15.56 0.000 .2707847 .3488374
unemp | -.0061382 .0009143 -6.71 0.000 -.0079302 -.0043462 lnL | .7313372 .0250205 29.23 0.000 .6822979 .7803765
_cons | 2.143865 .1376582 15.57 0.000 1.87406 2.413671 unemp | -.0061382 .0009063 -6.77 0.000 -.0079145 -.0043619
-------------+---------------------------------------------------------------- _cons | 2.143865 .1344052 15.95 0.000 1.880436 2.407295
/sigma_u | .085162 .0090452 .0691573 .1048706 ------------------------------------------------------------------------------
/sigma_e | .0380836 .0009735 .0362226 .0400402
rho | .8333481 .0304597 .7668537 .8861754
------------------------------------------------------------------------------
Likelihood-ratio test of sigma_u=0: chibar2(01)= 1149.84 Prob>=chibar2 = 0.000
Les résultats avec la méthode de Maximum de Vraisemblance sont très proches à ceux obtenus avec la méthode de Swamy et Arora.
Ils s’obtiennent avec deux commandes: l’une traditionnelle de xtreg (modèle de gauche) et l’autre mixed.