Chapitre 2 - Modèles À Effets Individuels

Ion Lapteacru, MCF HDR (15h)
Econométrie de Panel
Chapitre 1 – Introduction
Chapitre 2 – Modèles à effets individuels
Les chapitres théoriques du cours seront complémentés avec des exercices, qui seront approfondis lors des séances de TDs.
Présentation des effets individuels
Les modèles en données de panel regroupent à la fois la dimension individuelle (comme dans les coupes
transversales) et la dimension temporelle (comme dans les séries temporelles). Par conséquent, les deux indices i et
t sont présents dans l’équation de régression:
𝑦𝑖𝑡 = 𝛼 + 𝑋𝑖𝑡′ 𝛽 + 𝑢𝑖𝑡
où i=1,…,N et t=1,…,T.
i peut désigner ménages, individus, firmes, banques, pays, etc. et t désigne le temps.
𝛼 est une constante et 𝛽 est le vecteur 𝐾 × 1 des coefficients à estimer.
𝑋𝑖𝑡 est est le vecteur 𝐾 × 1 qui désigne la i-ème observation des K variables explicatives.
Si le modèle contient uniquement des effets individuels, alors

𝑢𝑖𝑡 = 𝜇𝑖 + 𝜈𝑖𝑡
où 𝜇𝑖 représente les effets individuels nonobservés et 𝜈𝑖𝑡 les résidus.
Les effets individuels spécifiques sont nonobservables (c’est-à-dire, ne sont pas explicitement inclus dans l’équation de régression) et invariants dans le
temps (c’est-à-dire, ne sont pas censés de changer dans le temps).
Présentation des effets individuels: exemples
Dans une équation sur le revenu des ménages,
𝑦𝑖𝑡 = 𝛼 + 𝑋𝑖𝑡′ 𝛽 + 𝑢𝑖𝑡 , 𝑢𝑖𝑡 = 𝜇𝑖 + 𝜈𝑖𝑡
𝑦𝑖𝑡 mesure le revenu des ménages, 𝑋𝑖𝑡 contient un set de variables comme l’expérience, l’éducation, l’appartenance
à un syndicat, genre, ethnie, etc. de l’individu i à l’instant t.
𝜇𝑖 est invariant au temps et tient compte des effets spécifiques individuels qui ne sont pas inclus dans la régression.
On peut les attribuer aux capacités individuelles des individus qui n’ont pas vocation de changer dans le temps et ne
sont pas pris en compte dans la régression.
𝜇𝑖 représente les effets individuels et décrit les caractéristiques invariant aux temps et non-inclus (exclus) dans l’équation de régression.
Présentation des effets individuels: exemples
Dans une équation sur production des firmes,
𝑦𝑖𝑡 mesure la production des firmes, 𝑋𝑖𝑡 contient un set de variables les facteurs de production, etc. de la firme i à
l’instant t.
𝜇𝑖 est invariant au temps et tient compte des effets spécifiques individuels qui ne sont pas inclus dans la régression.
On peut les attribuer aux capacités des gestionnaires et des membres de l’exécutif qui n’ont pas vocation de changer
dans le temps et ne sont pas pris en compte dans la régression.
𝜇𝑖 représente les effets individuels et décrit les caractéristiques invariant aux temps et non-inclus (exclus) dans l’équation de régression.
Présentation des effets individuels: forme matricielle
La forme classique de l’équation:
La forme vectorielle peut être écrite de la façon suivante:
𝑦 = 𝛼𝜄𝑁𝑇 + 𝑋𝛽 + 𝑢 = 𝑍𝛿 + 𝑢
𝑦1𝑡
𝑋1,1𝑡 … 𝑋𝐾,1𝑡
𝛽1 1
où 𝑦 = ⋮ 𝑋= ⋮ ⋱ ⋮ 𝛽= ⋮ 𝑍 = 𝜄𝑁𝑇 , 𝑋 𝜄𝑁𝑇 = ⋮ 𝛿 ′ = 𝛼 ′ , 𝛽′
𝑦𝑁𝑇
𝑋1,𝑁𝑡 … 𝑋𝐾,1𝑡 ถ
𝛽𝐾 ด
1
𝑁𝑇×1 𝑁𝑇×1
𝐾×1
𝑁𝑇×𝐾
La forme matricielle est intéressante car elle allège l’écriture des équations.
𝑦 = 𝛼𝜄𝑁𝑇 + 𝑋𝛽 + 𝑢 = 𝑍𝛿 + 𝑢
𝑦11
⋮
𝑦1𝑇
𝑋1,1𝑡 … 𝑋𝐾,1𝑡
𝛽1 1
où 𝑦 = ⋮ 𝑋= ⋮ ⋱ ⋮ 𝛽= ⋮ 𝑍 = 𝜄𝑁𝑇 , 𝑋 𝜄𝑁𝑇 = ⋮ 𝛿 ′ = 𝛼 ′ , 𝛽′
𝑦𝑁1
𝑋1,𝑁𝑡 … 𝑋𝐾,1𝑡 ถ
𝛽𝐾 ด
1
⋮
𝑦𝑁𝑇 𝐾×1 𝑁𝑇×1
𝑁𝑇×𝐾
𝑁𝑇×1
Avec les résidus sous la forme matricielle

𝑢 = 𝑍𝜇 𝜇 + 𝜈
où 𝑢′ = 𝑢11 , … , 𝑢1𝑇 , … , 𝑢𝑁1 , … , 𝑢𝑁𝑇 , 𝑍𝜇 = 𝐼𝑁 ⨂𝜄 𝑇 , 𝜇′ = 𝜇1 , … , 𝜇𝑁 et 𝜈 ′ = 𝜈11 , … , 𝜈1𝑇 , … , 𝜈𝑁1 , … , 𝜈𝑁𝑇
𝐼𝑁 est la matrice identité de dimension N et 𝜄 𝑇 est le vecteur d’unités (valeur 1) de dimension T.

⨂ est le produit de Kronecker, à savoir, chaque élément de la matrice 𝐼𝑁 est multiplié par le vecteur 𝜄𝑇 .
𝑦 = 𝛼𝜄𝑁𝑇 + 𝑋𝛽 + 𝑢 = 𝑍𝛿 + 𝑢, avec 𝑢 = 𝑍𝜇 𝜇 + 𝜈
où 𝑢′ = 𝑢11 , … , 𝑢1𝑇 , … , 𝑢𝑁1 , … , 𝑢𝑁𝑇 , 𝑍𝜇 = 𝐼𝑁 ⨂𝜄 𝑇 , 𝜇′ = 𝜇1 , … , 𝜇𝑁 et 𝜈 ′ = 𝜈11 , … , 𝜈1𝑇 , … , 𝜈𝑁1 , … , 𝜈𝑁𝑇 .
A noter que 𝑍𝜇 𝑍′𝜇 = 𝐼𝑁 ⨂𝐽𝑇 et

−1
𝑃 = 𝑍𝜇 𝑍′𝜇 𝑍𝜇 𝑍′𝜇 est la matrice qui fait la moyenne des valeurs dans le temps pour chaque individu, et
𝑄 = 𝐼𝑁𝑇 − 𝑃 est la matrice qui obtient les déviations par rapport aux moyennes individuelles.
Cela veut dire que, 𝑃𝑦 a comme élément 𝑦𝑖. = σ𝑇𝑡=1 𝑦𝑖𝑡 Τ𝑇 et 𝑄𝑦 a comme élément 𝑦𝑖𝑡 − 𝑦𝑖. .
P et Q sont des matrices symétriques et idempotentes:
i) 𝑃′ = 𝑃 et 𝑄′ = 𝑄, 𝑃2 = 𝑃 et 𝑄 2 = 𝑄  𝑟𝑎𝑛𝑘 𝑃 = 𝑡𝑟 𝑃 = 𝑁 et 𝑟𝑎𝑛𝑘 𝑄 = 𝑡𝑟 𝑄 = 𝑁 𝑇 − 1
ii) P et Q sont orthogonales, 𝑃𝑄 = 0
iii) 𝑃 + 𝑄 = 𝐼𝑁𝑇
𝐼𝑁 est la matrice identité de dimension N et 𝜄 𝑇 est le vecteur d’unités (valeur 1) de dimension T.

⨂ est le produit de Kronecker, à savoir, chaque élément de la matrice 𝐼𝑁 est multiplié par le vecteur 𝜄𝑇 .
𝐽𝑇 est la matrice carrée de dimension T composée des unités (valeur 1).
Effets individuels fixes
𝜇𝑖 sont considérés comme des paramètres fixes (des constantes individuelles) à estimer.
𝜈𝑖𝑡 sont des résidus qui suivent une loi 𝐼𝐼𝐷 0, 𝜎𝜈2 .
𝑋𝑖𝑡 sont supposées indépendantes de 𝜈𝑖𝑡 , 𝑐𝑜𝑣 𝑋𝑖𝑡 , 𝜈𝑖𝑡 = 0, pour ∀𝑖 et ∀𝑡
La forme matricielle de l’équation à effets individuels est donc
𝑦 = 𝛼𝜄𝑁𝑇 + 𝑋𝛽 + 𝑢 = 𝑍𝛿 + 𝑍𝜇 𝜇 + 𝜈
Sur laquelle on applique les MCO afin d’obtenir 𝛼, 𝛽 et 𝜇.

A noter que Z est une matrice 𝑁𝑇 × 𝐾 + 1 et 𝑍𝜇 , la matrice de dummies individuelles, est de taille 𝑁𝑇 × 𝑁.
Si N est grand, l’équation va contenir trop de dummies individuelles et la matrice à inverser par les MCO est de
grande taille, de dimension 𝑁 + 𝐾 .
Puisque ce ne sont que les paramètres 𝛼 et 𝛽 qui nous intéressent, on peut obtenir l’estimateur LSDV en multipliant
l’équation par Q et en appliquant les MCO (LS)
𝑄𝑦 = 𝑄𝑋𝛽 + 𝑄𝜈
L’estimateur LSDV (Least Squares Dummy Variables) est celui qu’on applique pour les modèles en panel avec des effets individuels fixes.
𝑄𝑦 = 𝑄𝑋𝛽 + 𝑄𝜈
La matrice Q exclut les effets fixes, 𝑄𝑍𝜇 = 𝑄𝜄𝑁𝑇 = 0, car 𝑃𝑍𝜇 = 𝑍𝜇 . En d’autres termes, c’est une régression de 𝑦෤ =
𝑄𝑦 avec des éléments 𝑦𝑖𝑡 − 𝑦ത𝑖. sur 𝑋෨ = 𝑄𝑋 avec des éléments 𝑋𝑖𝑡,𝑘 − 𝑋ത𝑖.,𝑘 pour la k-ème variable, k=1,…,K. Cela
implique l’inversion d’une matrice de taille 𝐾 × 𝐾 au lieu de 𝑁 + 𝐾 × 𝑁 + 𝐾 .
L’estimateur MCO obtenu est
𝛽෨ = 𝑋 ′ 𝑄𝑋 −1 𝑋 ′ 𝑄𝑦
−1
avec 𝑣𝑎𝑟 𝛽෨ = 𝜎𝜈2 𝑋 ′ 𝑄𝑋 −1 = 𝜎𝜈2 𝑋෨ ′ 𝑋෨
L’estimateur LSDV (Least Squares Dummy Variables) est celui qu’on applique pour les modèles en panel avec des effets individuels fixes.
La matrice Q exclut les effets fixes.
Pour une régression simple (1 seule variable explicative)

𝑦𝑖𝑡 = 𝛼 + 𝜇𝑖 + 𝛽𝑥𝑖𝑡 + 𝜈𝑖𝑡
Prenant la moyenne dans le temps,

𝑦ത𝑖. = 𝛼 + 𝜇𝑖 + 𝛽𝑥ҧ𝑖. + 𝜈ҧ𝑖.
Faisant la différence, on obtient

𝑦𝑖𝑡 − 𝑦ത𝑖. = 𝛽 𝑥𝑖𝑡 − 𝑥ҧ𝑖. + 𝜈𝑖𝑡 − 𝜈ҧ𝑖.
De même, prenant également la moyenne entre les individus,

𝑦ത.. = 𝛼 + 𝛽𝑥ҧ.. + 𝜈..ҧ
L’estimateur de 𝛽෨ peut autrement être obtenu avec l’approche classique des MCO.
Pour une régression simple (1 seule variable explicative)

𝑦ത.. = 𝛼 + 𝛽𝑥ҧ.. + 𝜈..ҧ
où σ𝑁 𝑖=1 𝜇𝑖 = 0 est une restriction appliquée afin d’éviter la trappe à la variable muette et ainsi la colinéarité
parfaite.
L’estimateur 𝛽෨ est obtenu de la régression
et l’estimateur 𝛼,
෤ de l’équation
𝛼෤ = 𝑦ത.. − 𝛽෨ 𝑥ҧ..
et l’estimateur 𝜇෤𝑖 , de l’équation
𝜇෤𝑖 = 𝑦ത𝑖. − 𝛼෤ − 𝛽෨𝑥ҧ𝑖.
L’estimateur de 𝛽෨ peut autrement être obtenu avec l’approche classique des MCO.
Quand le nombre d’individus N est trop grand, la régression

𝑦 = 𝛼𝜄𝑁𝑇 + 𝑋𝛽 + 𝑢 = 𝑍𝛿 + 𝑍𝜇 𝜇 + 𝜈
pourrait ne pas être faisable, car elle inclut N-1 variables muettes. Les Moindres Carrés à effets fixes, appelé LSDV,
souffre d’une perte énorme de degrés de liberté. Trop de variables muettes peut aggraver le problème de
multicolinéarité entre les variables explicatives.
Si cette régression est le vrai modèle, LSDV est l’estimateur BLUE à condition que 𝜈𝑖𝑡 soit un BB centré, à savoir
𝜈𝑖𝑡 ~𝐿𝑜𝑖 0, 𝜎𝜈2 𝐼𝑁𝑇 .
Si 𝑇 → ∞, FE est un estimateur cohérent
Si N → ∞ et T est fixé, seulement l’estimateur FE de 𝛽 est cohérent et ceux des effets individuels 𝛼 + 𝜇𝑖 ne le sont
pas car le nombre de paramètres augmente avec N.
LSDV est un estimateur BLUE pour un modèle à effets fixes.

Note: si le modèle est un panel à effets fixes, l’estimateurs des MCO donne des résultats biaisés et non-cohérents. C’est un biais de variables omises car
MCO supprime les effets individuels quand, en réalité, ils sont pertinents.
Effets individuels fixes: test des effets fixes
Il s’agit d’un test de Chow qui teste

𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑁−1 = 0
𝐻𝑎 : ∃𝜇𝑖 ≠ 0
𝑅𝑅𝑆𝑆−𝑈𝑅𝑆𝑆 Τ 𝑁−1
La statistique de Fisher 𝐹0 = ~𝐹𝑁−1,𝑁 𝑇−1 −𝐾
𝑈𝑅𝑆𝑆Τ 𝑁𝑇−𝑁−𝐾
où K est le nombre de variables explicatives,

RRSS Restricted Residual Sum of Squares, c’est-à-dire la somme des carrés des résidus pour le modèle contraint, à
savoir le modèle groupé où MCO est appliqué
URSS Unrestricted Residual Sum of Squares, c’est-à-dire la somme des carrés des résidus pour le modèle
noncontraint, à savoir le modèle à effets fixes où LSDV est appliqué.
LSDV est un estimateur BLUE pour un modèle à effets fixes.

Note: si le modèle est un panel à effets fixes, l’estimateurs des MCO donne des résultats biaisés et non-cohérents. C’est un biais de variables omises car
MCO supprime les effets individuels quand, en réalité, ils sont pertinents.
Effets individuels fixes: Application
Considérions la fonction de production Cobb-Douglas qui étudie la productivité du capital public dans la production:
𝑙𝑛𝑌𝑖𝑡 = 𝛼 + 𝛽1 𝑙𝑛𝐾1,𝑖𝑡 + 𝛽2 𝑙𝑛𝐾2,𝑖𝑡 + 𝛽3 𝑙𝑛𝐿𝑖𝑡 + 𝛽4 𝑈𝑛𝑒𝑚𝑝𝑖𝑡 + 𝑢𝑖𝑡
Ce panel de données est construit pour 48 états et sur la période 1970-1986.

Avant toute régression, il faut transformer les valeurs brutes en valeurs logarithmiques:
gen lnY= log(gsp)

gen lnK1=log(p_cap)
gen lnK2=log(pc)
gen lnL=log(emp)
Ensuite, il faut déclarer à Stata qu’il s’agit de données en panel, avec i=state_index indiquant l’indice individuel et
t=yr indiquant l’indice temporel
xtset state_index yr
𝑌 est le Produit National Brut. 𝐾1 est le capital public qui comprend autoroutes et rues, installations d'eau et d'égouts et autres bâtiments et
structures publics. 𝐾2 est le stock de capital privé. 𝐿 est le facteur travail mesuré en tant qu'emploi dans les masses salariales non agricoles.
𝑈𝑛𝑒𝑚𝑝 est le taux de chômage. Les données sont téléchargeables du fichier « Productivity data.xlxs ».

gen lnY= log(gsp)

gen lnK1=log(p_cap)
gen lnK2=log(pc)
gen lnL=log(emp)
Toutes les commandes et les commentaires peuvent être réunis dans un fichier de type « .do ».
Window  Do-file Editor  New Do-file Editor
Avant un commentaire il faut mettre le symbole « /* » et après lui le symbole « */».

gen lnY= log(gsp)

gen lnK1=log(p_cap)
gen lnK2=log(pc)
gen lnL=log(emp)
Ensuite, depuis la base de données avec l’extension « .dta », on ouvre le fichier « .do »
File  Do …
. xtreg lnY lnK1 lnK2 lnL unemp, fe
Fixed-effects (within) regression Number of obs = 816

Group variable: state_index Number of groups = 48
R-sq: within = 0.9413 Obs per group: min = 17

between = 0.9921 avg = 17.0
overall = 0.9910 max = 17
F(4,764) = 3064.81
corr(u_i, Xb) = 0.0608 Prob > F = 0.0000
------------------------------------------------------------------------------
lnY | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
lnK1 | -.0261493 .0290016 -0.90 0.368 -.0830815 .0307829
lnK2 | .2920067 .0251197 11.62 0.000 .242695 .3413185
lnL | .7681595 .0300917 25.53 0.000 .7090872 .8272318
unemp | -.0052977 .0009887 -5.36 0.000 -.0072387 -.0033568
_cons | 2.352898 .1748131 13.46 0.000 2.009727 2.696069
-------------+----------------------------------------------------------------
sigma_u | .09057292
sigma_e | .03813705
rho | .8494045 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(47, 764) = 75.82 Prob > F = 0.0000
Le résultat de la régression avec Effets Fixes (EF). Commenter les résultats.



between = 0.9921 avg = 17.0
F(4,764) = 3064.81
corr(u_i, Xb) = 0.0608 Prob > F = 0.0000
------------------------------------------------------------------------------
-------------+----------------------------------------------------------------
lnK1 | -.0261493 .0290016 -0.90 0.368 -.0830815 .0307829
lnK2 | .2920067 .0251197 11.62 0.000 .242695 .3413185
lnL | .7681595 .0300917 25.53 0.000 .7090872 .8272318
unemp | -.0052977 .0009887 -5.36 0.000 -.0072387 -.0033568
_cons | 2.352898 .1748131 13.46 0.000 2.009727 2.696069
-------------+----------------------------------------------------------------
sigma_u | .09057292
sigma_e | .03813705
------------------------------------------------------------------------------
Puisque la p-value>0.10, la variable K1 n’a pas d’effet statistique sur la variable Y. Par conséquent, le capital public n’a pas d’effet sur le Produit National
Brut.


between = 0.9921 avg = 17.0
F(4,764) = 3064.81
corr(u_i, Xb) = 0.0608 Prob > F = 0.0000
------------------------------------------------------------------------------
-------------+----------------------------------------------------------------
lnK1 | -.0261493 .0290016 -0.90 0.368 -.0830815 .0307829
lnK2 | .2920067 .0251197 11.62 0.000 .242695 .3413185
lnL | .7681595 .0300917 25.53 0.000 .7090872 .8272318
unemp | -.0052977 .0009887 -5.36 0.000 -.0072387 -.0033568
_cons | 2.352898 .1748131 13.46 0.000 2.009727 2.696069
-------------+----------------------------------------------------------------
sigma_u | .09057292
sigma_e | .03813705
------------------------------------------------------------------------------
Puisque la p-value<0.05, la variable K2 a d’effet statistique sur la variable Y. Par conséquent, le capital privé a d’effet sur le Produit National Brut. Plus
précisément, une hausse de 1% du capital privé implique une hausse de 0.29% du Produit National Brut, toutes choses égales par ailleurs.


between = 0.9921 avg = 17.0
F(4,764) = 3064.81
corr(u_i, Xb) = 0.0608 Prob > F = 0.0000
------------------------------------------------------------------------------
-------------+----------------------------------------------------------------
lnK1 | -.0261493 .0290016 -0.90 0.368 -.0830815 .0307829
lnK2 | .2920067 .0251197 11.62 0.000 .242695 .3413185
lnL | .7681595 .0300917 25.53 0.000 .7090872 .8272318
unemp | -.0052977 .0009887 -5.36 0.000 -.0072387 -.0033568
_cons | 2.352898 .1748131 13.46 0.000 2.009727 2.696069
-------------+----------------------------------------------------------------
sigma_u | .09057292
sigma_e | .03813705
------------------------------------------------------------------------------
Puisque la p-value<0.05, la variable L a d’effet statistique sur la variable Y. Par conséquent, le facteur travail a d’effet sur le Produit National Brut. Plus
précisément, une hausse de 1% de la masse salariale non-agricole implique une hausse de 0.78% du Produit National Brut, toutes choses égales par
ailleurs.


between = 0.9921 avg = 17.0
F(4,764) = 3064.81
corr(u_i, Xb) = 0.0608 Prob > F = 0.0000
------------------------------------------------------------------------------
-------------+----------------------------------------------------------------
lnK1 | -.0261493 .0290016 -0.90 0.368 -.0830815 .0307829
lnK2 | .2920067 .0251197 11.62 0.000 .242695 .3413185
lnL | .7681595 .0300917 25.53 0.000 .7090872 .8272318
unemp | -.0052977 .0009887 -5.36 0.000 -.0072387 -.0033568
_cons | 2.352898 .1748131 13.46 0.000 2.009727 2.696069
-------------+----------------------------------------------------------------
sigma_u | .09057292
sigma_e | .03813705
------------------------------------------------------------------------------
Puisque la p-value<0.05, la variable unemp a d’effet statistique sur la variable Y. Par conséquent, le taux de chômage a d’effet sur le Produit National Brut.
Plus précisément, une hausse de 1% du taux de chômage implique une baisse de 0.005% du Produit National Brut, toutes choses égales par ailleurs.
. xtreg lnY lnK1 lnK2 lnL unemp, fe Le tableau affiche également le résultats du test de Chow sur la
Fixed-effects (within) regression Number of obs = 816 pertinence du modèle à effets fixes
R-sq: within = 0.9413 Obs per group: min = 17 𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑁−1 = 0

between = 0.9921 avg = 17.0 𝐻𝑎 : ∃𝜇𝑖 ≠ 0
F(4,764) = 3064.81 𝑅𝑅𝑆𝑆−𝑈𝑅𝑆𝑆 Τ 𝑁−1

La stat. de Fisher 𝐹0 = ~𝐹𝑁−1,𝑁 𝑇−1 −𝐾
corr(u_i, Xb) = 0.0608 Prob > F = 0.0000 𝑈𝑅𝑆𝑆Τ 𝑁𝑇−𝑁−𝐾
------------------------------------------------------------------------------
lnY | Coef. Std. Err. t P>|t| [95% Conf. Interval] où K est le nombre de variables explicatives,
-------------+----------------------------------------------------------------
lnK1 | -.0261493 .0290016 -0.90 0.368 -.0830815 .0307829
RRSS Restricted Residual Sum of Squares, c’est-à-dire la somme
lnK2 | .2920067 .0251197 11.62 0.000 .242695 .3413185 des carrés des résidus pour le modèle contraint, à savoir le
lnL | .7681595 .0300917 25.53 0.000 .7090872 .8272318
unemp | -.0052977 .0009887 -5.36 0.000 -.0072387 -.0033568
modèle groupé où MCO est appliqué
_cons | 2.352898 .1748131 13.46 0.000 2.009727 2.696069 URSS Unrestricted Residual Sum of Squares, c’est-à-dire la
-------------+----------------------------------------------------------------
sigma_u | .09057292
somme des carrés des résidus pour le modèle noncontraint, à
sigma_e | .03813705 savoir le modèle à effets fixes où LSDV est appliqué.
------------------------------------------------------------------------------
La statistique de Fisher est très élevée, F(47,764)=75.82 et statistiquement très significative (p-value<0,05). Cela signifie que les effets individuels sont
conjointement statistiquement significatifs; c’est-à-dire, il existe au moins un état pour qui cet effet soit significatif. Cela signifie également qu’une
régression simple des MCO, qui ne considère pas les effets individuels, souffrirait d’un biais de variables omises (les effets individuels) et rendrait ainsi les
résultats biaisés.
. xtreg lnY lnK1 lnK2 lnL unemp, fe Le tableau affiche également le résultats du test de Chow sur la
Fixed-effects (within) regression Number of obs = 816 pertinence du modèle à effets fixes
R-sq: within = 0.9413 Obs per group: min = 17 𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑁−1 = 0

between = 0.9921 avg = 17.0 𝐻𝑎 : ∃𝜇𝑖 ≠ 0
F(4,764) = 3064.81 𝑅𝑅𝑆𝑆−𝑈𝑅𝑆𝑆 Τ 𝑁−1

corr(u_i, Xb) = 0.0608 Prob > F = 0.0000 𝑈𝑅𝑆𝑆Τ 𝑁𝑇−𝑁−𝐾
------------------------------------------------------------------------------
lnY | Coef. Std. Err. t P>|t| [95% Conf. Interval] où K est le nombre de variables explicatives,
-------------+----------------------------------------------------------------
lnK1 | -.0261493 .0290016 -0.90 0.368 -.0830815 .0307829
lnK2 | .2920067 .0251197 11.62 0.000 .242695 .3413185 des carrés des résidus pour le modèle contraint, à savoir le
lnL | .7681595 .0300917 25.53 0.000 .7090872 .8272318
unemp | -.0052977 .0009887 -5.36 0.000 -.0072387 -.0033568
_cons | 2.352898 .1748131 13.46 0.000 2.009727 2.696069 URSS Unrestricted Residual Sum of Squares, c’est-à-dire la
-------------+----------------------------------------------------------------
sigma_u | .09057292
sigma_e | .03813705 savoir le modèle à effets fixes où LSDV est appliqué.
------------------------------------------------------------------------------
On peut obtenir cette statistique par le calcul de la stat. de Fisher.

Suite à la régression avec FE et effets individuels fixes, avec la commande display e(rss) on obtient URSS=1.1112.
. reg lnY lnK1 lnK2 lnL unemp Le tableau affiche également le résultats du test de Chow sur la
Source | SS df MS Number of obs = 816 pertinence du modèle à effets fixes
-------------+------------------------------ F( 4, 811) =27171.66
Model | 843.514727 4 210.878682 Prob > F = 0.0000
Residual | 6.29415351 811 .007760978 R-squared = 0.9926 𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑁−1 = 0
-------------+------------------------------ Adj R-squared = 0.9926 𝐻𝑎 : ∃𝜇𝑖 ≠ 0
Total | 849.80888 815 1.04271028 Root MSE = .0881
------------------------------------------------------------------------------ 6.2942−1.1112 Τ 48−1

lnY | Coef. Std. Err. t P>|t| [95% Conf. Interval] 1.1112Τ 48×17−48−4
-------------+----------------------------------------------------------------
lnK1 | .155007 .0171538 9.04 0.000 .121336 .188678
lnK2 | .3091902 .010272 30.10 0.000 .2890274 .329353 où K est le nombre de variables explicatives,
lnL | .5939349 .0137475 43.20 0.000 .5669501 .6209197
unemp | -.006733 .0014164 -4.75 0.000 -.0095132 -.0039528
_cons | 1.643302 .0575873 28.54 0.000 1.530265 1.75634 des carrés des résidus pour le modèle contraint, à savoir le
------------------------------------------------------------------------------
URSS Unrestricted Residual Sum of Squares, c’est-à-dire la
savoir le modèle à effets fixes où LSDV est appliqué.
On fait ensuite la régression avec les MCO et on obtient RRSS=6.2942

6.2942−1.1112 Τ 48−1
Sachant que N=48, T=17 et K=4 (car 4 coefficients à estimer, sans constante), 𝐹0 = = 75.82
1.1112Τ 48×17−48−4
------------------------------------------------------------------------------ ------------------------------------------------------------------------------
lnY | Coef. Std. Err. z P>|z| [95% Conf. Interval] lnY | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+---------------------------------------------------------------- -------------+----------------------------------------------------------------
| |
state_index | state_index |
2 | .1664708 .0136339 12.21 0.000 .1397489 .1931928 25 | .1096629 .0163961 6.69 0.000 .0775271 .1417987
3 | .0613988 .01672 3.67 0.000 .0286282 .0941695 26 | .1402695 .0246146 5.70 0.000 .0920259 .1885132
4 | .2988061 .0368152 8.12 0.000 .2266496 .3709625 27 | .1225309 .0273569 4.48 0.000 .0689123 .1761494
5 | .1942932 .0137456 14.13 0.000 .1673523 .2212341 28 | .2412521 .0201436 11.98 0.000 .2017714 .2807328
6 | .2695868 .0188069 14.33 0.000 .2327259 .3064477 29 | .2527582 .0222681 11.35 0.000 .2091136 .2964029
7 | .2118447 .0224317 9.44 0.000 .1678793 .2558101 30 | .2743703 .0388085 7.07 0.000 .198307 .3504336
8 | .1315363 .020489 6.42 0.000 .0913785 .171694 31 | .0360083 .0169712 2.12 0.034 .0027454 .0692713
9 | .0565913 .0160726 3.52 0.000 .0250895 .088093 32 | .1422781 .0296689 4.80 0.000 .0841281 .200428
10 | .1367972 .0251638 5.44 0.000 .0874771 .1861174 33 | .1210272 .022762 5.32 0.000 .0764146 .1656399
11 | .1857043 .0240672 7.72 0.000 .1385333 .2328752 34 | .2143161 .0164367 13.04 0.000 .1821008 .2465314
12 | .0577659 .0140859 4.10 0.000 .030158 .0853739 35 | .1492874 .0139964 10.67 0.000 .1218549 .1767199
13 | .1255467 .0140015 8.97 0.000 .0981042 .1529892 36 | .0877256 .024799 3.54 0.000 .0391204 .1363308
14 | .1371023 .0156361 8.77 0.000 .106456 .1677485 37 | .1867344 .030334 6.16 0.000 .1272807 .246188
15 | .1976713 .0140004 14.12 0.000 .170231 .2251115 38 | -.082223 .016847 -4.88 0.000 -.1152424 -.0492036
16 | .3130538 .02213 14.15 0.000 .2696798 .3564278 39 | .0880636 .0239972 3.67 0.000 .0410298 .1350973
17 | .0667997 .0252354 2.65 0.008 .0173391 .1162602 40 | .0274807 .0155322 1.77 0.077 -.0029618 .0579233
18 | .1986623 .0202527 9.81 0.000 .1589676 .2383569 41 | .1920419 .0251718 7.63 0.000 .142706 .2413778
19 | .1606044 .02308 6.96 0.000 .1153685 .2058403 42 | .1270401 .0170767 7.44 0.000 .0935704 .1605098
20 | .2153771 .02168 9.93 0.000 .1728851 .2578691 43 | .1345834 .0287631 4.68 0.000 .0782087 .190958
21 | .1139324 .0165492 6.88 0.000 .0814965 .1463683 44 | .1788493 .0182458 9.80 0.000 .1430882 .2146104
22 | .0484076 .0142564 3.40 0.001 .0204655 .0763496 45 | .2451644 .0205819 11.91 0.000 .2048246 .2855042
23 | .1120074 .0152631 7.34 0.000 .0820922 .1419226 46 | .0915333 .0182785 5.01 0.000 .0557081 .1273586
24 | .1465373 .0266613 5.50 0.000 .094282 .1987925 47 | .1273426 .0170358 7.47 0.000 .093953 .1607323
25 | .1096629 .0163961 6.69 0.000 .0775271 .1417987 48 | .4469402 .0398907 11.20 0.000 .3687559 .5251245
Puisque l’estimateur LSDV est un estimateur MCO avec la prise en compte des effets individuels, on peut appliquer ce dernier estimateur en mettant dans
l’équation de régression les effets individuels explicitement
reg lnY lnK1 lnK2 lnL unemp i.state_index
------------------------------------------------------------------------------ ------------------------------------------------------------------------------
lnY | Coef. Std. Err. z P>|z| [95% Conf. Interval] lnY | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+---------------------------------------------------------------- -------------+----------------------------------------------------------------
| |
state_index | state_index |
2 | .1664708 .0136339 12.21 0.000 .1397489 .1931928 25 | .1096629 .0163961 6.69 0.000 .0775271 .1417987
3 | .0613988 .01672 3.67 0.000 .0286282 .0941695 26 | .1402695 .0246146 5.70 0.000 .0920259 .1885132
4 | .2988061 .0368152 8.12 0.000 .2266496 .3709625 27 | .1225309 .0273569 4.48 0.000 .0689123 .1761494
5 | .1942932 .0137456 14.13 0.000 .1673523 .2212341 28 | .2412521 .0201436 11.98 0.000 .2017714 .2807328
6 | .2695868 .0188069 14.33 0.000 .2327259 .3064477 29 | .2527582 .0222681 11.35 0.000 .2091136 .2964029
7 | .2118447 .0224317 9.44 0.000 .1678793 .2558101 30 | .2743703 .0388085 7.07 0.000 .198307 .3504336
8 | .1315363 .020489 6.42 0.000 .0913785 .171694 31 | .0360083 .0169712 2.12 0.034 .0027454 .0692713
9 | .0565913 .0160726 3.52 0.000 .0250895 .088093 32 | .1422781 .0296689 4.80 0.000 .0841281 .200428
10 | .1367972 .0251638 5.44 0.000 .0874771 .1861174 33 | .1210272 .022762 5.32 0.000 .0764146 .1656399
11 | .1857043 .0240672 7.72 0.000 .1385333 .2328752 34 | .2143161 .0164367 13.04 0.000 .1821008 .2465314
12 | .0577659 .0140859 4.10 0.000 .030158 .0853739 35 | .1492874 .0139964 10.67 0.000 .1218549 .1767199
13 | .1255467 .0140015 8.97 0.000 .0981042 .1529892 36 | .0877256 .024799 3.54 0.000 .0391204 .1363308
14 | .1371023 .0156361 8.77 0.000 .106456 .1677485 37 | .1867344 .030334 6.16 0.000 .1272807 .246188
15 | .1976713 .0140004 14.12 0.000 .170231 .2251115 38 | -.082223 .016847 -4.88 0.000 -.1152424 -.0492036
16 | .3130538 .02213 14.15 0.000 .2696798 .3564278 39 | .0880636 .0239972 3.67 0.000 .0410298 .1350973
17 | .0667997 .0252354 2.65 0.008 .0173391 .1162602 40 | .0274807 .0155322 1.77 0.077 -.0029618 .0579233
18 | .1986623 .0202527 9.81 0.000 .1589676 .2383569 41 | .1920419 .0251718 7.63 0.000 .142706 .2413778
19 | .1606044 .02308 6.96 0.000 .1153685 .2058403 42 | .1270401 .0170767 7.44 0.000 .0935704 .1605098
20 | .2153771 .02168 9.93 0.000 .1728851 .2578691 43 | .1345834 .0287631 4.68 0.000 .0782087 .190958
21 | .1139324 .0165492 6.88 0.000 .0814965 .1463683 44 | .1788493 .0182458 9.80 0.000 .1430882 .2146104
22 | .0484076 .0142564 3.40 0.001 .0204655 .0763496 45 | .2451644 .0205819 11.91 0.000 .2048246 .2855042
23 | .1120074 .0152631 7.34 0.000 .0820922 .1419226 46 | .0915333 .0182785 5.01 0.000 .0557081 .1273586
24 | .1465373 .0266613 5.50 0.000 .094282 .1987925 47 | .1273426 .0170358 7.47 0.000 .093953 .1607323
25 | .1096629 .0163961 6.69 0.000 .0775271 .1417987 48 | .4469402 .0398907 11.20 0.000 .3687559 .5251245
Comme on peut constater, les effets individuels de tous les états sont statistiquement significatifs au seuil de 10% et qu’ils ne sont pas significatifs à 5%
uniquement pour l’état 40.
Effets individuels aléatoires: éléments de base
Il y a trop de paramètres dans le modèle à effets fixes et la perte de degrés de liberté peut être évitée si 𝜇𝑖 est
considéré aléatoire: 𝜇𝑖 ~𝐼𝐼𝐷 0, 𝜎𝜇2 , 𝜈𝑖𝑡 ~𝐼𝐼𝐷 0, 𝜎𝜈2 et 𝜇𝑖 est indépendant de 𝜈𝑖𝑡 .
En plus, 𝑋𝑖𝑡 sont indépendantes de 𝜇𝑖 et 𝜈𝑖𝑡 , pour ∀𝑖 et ∀𝑡.
Si N est trop grand, le modèle à effets fixes mène vers la perte de degrés de liberté. Ainsi, l’effet individuel est
considéré comme aléatoire. D’après l’expression des résidus
𝑢 = 𝑍𝜇 𝜇 + 𝜈
La matrice de variance-covariance s’en obtient:

Ω = 𝐸 𝑢𝑢′ = 𝑍𝜇 𝐸 𝜇𝜇′ 𝑍′𝜇 + 𝐸 𝜈𝜈′ = 𝜎𝜇2 𝐼𝑁 ⊗ 𝐽𝑇 + 𝜎𝜈2 𝐼𝑁 ⊗ 𝐼𝑇
ce qui implique une variance homoscédastique 𝑣𝑎𝑟 𝑢𝑖𝑡 = 𝜎𝜇2 + 𝜎𝜈2 pour ∀𝑖 et ∀𝑡 et la même corrélation 𝜎𝜇2 dans
le temps pour le même individu. Par conséquent,
𝜎𝜇2 + 𝜎𝜈2 𝑝𝑜𝑢𝑟 𝑖 = 𝑗, 𝑡 = 𝑠 1 𝑝𝑜𝑢𝑟 𝑖 = 𝑗, 𝑡 = 𝑠
𝑐𝑜𝑣 𝑢𝑖𝑡 , 𝑢𝑗𝑠 = ൞ 𝜎𝜇2 𝑝𝑜𝑢𝑟 𝑖 = 𝑗, 𝑡 ≠ 𝑠 et ρ = 𝑐𝑜𝑟 𝑢𝑖𝑡 , 𝑢𝑗𝑠 = ൞𝜎𝜇2 ൗ 𝜎𝜇2 + 𝜎𝜈2 𝑝𝑜𝑢𝑟 𝑖 = 𝑗, 𝑡 ≠ 𝑠
0 𝑠𝑖𝑛𝑜𝑛 0 𝑠𝑖𝑛𝑜𝑛
Le modèles à effets aléatoires implique une variance homoscédastique et une corrélation des résidus dans le temps pour le même individu.
Effets individuels aléatoires: la matrice de variance-covariance
Afin d’obtenir l’estimateur GLS (General Least Squares), on a besoin de la matrice de variance-covariance inversée
Ω = 𝜎𝜇2 𝐼𝑁 ⊗ 𝐽𝑇 + 𝜎𝜈2 𝐼𝑁 ⊗ 𝐼𝑇 = 𝑇𝜎𝜇2 𝐼𝑁 ⊗ 𝐽𝑇ҧ + 𝜎𝜈2 𝐼𝑁 ⊗ 𝐸𝑇 + 𝜎𝜈2 𝐼𝑁 ⊗ 𝐽𝑇ҧ
où 𝐽𝑇ҧ = 𝐽𝑇 Τ𝑇 et 𝐸𝑇 = 𝐼𝑇 − 𝐽𝑇ҧ .
Et on obtient
Ω = 𝜎12 𝑃 + 𝜎𝜈2 𝑄
avec 𝜎12 = 𝑇𝜎𝜇2 + 𝜎𝜈2 , 𝑃 = 𝐼𝑁 ⊗ 𝐽𝑇ҧ et 𝑄 = 𝐼𝑁 ⊗ 𝐸𝑇 . Avec les propriétés de P et Q, on vérifie

1 1
Ω−1 = 2 𝑃 + 2 𝑄
𝜎1 𝜎𝜐
− 1 Τ2 1 1
Ω = 𝑃+ 𝑄
𝜎1 𝜎𝜐
ou, en général, Ω𝑟 = 𝜎12 𝑟 𝑃 + 𝜎𝜐2 𝑟 𝑄 pour tout scalaire r.
L’estimateur GLS ou MCG (Moindres Carrés Généralisés)

Effets individuels aléatoires: estimateur de la variance
Le meilleur estimateur quadratique non-biaisé (BQU, Best Quadratic Unibiased) de la variance s’obtient de la
décomposition spectrale de la matrice de variance-covariance Ω. En fait, 𝑃𝑢~ 0, 𝜎12 𝑃 et Q𝑢~ 0, 𝜎𝜈2 𝑄
Donc,
𝑢′ 𝑃𝑢 𝑢′ 𝑄𝑢 σ𝑁 𝑇 𝑢𝑖. 2
𝑖=1 σ𝑡=1 𝑢𝑖𝑡 −ഥ
𝜎ො12 = = 𝑇 σ𝑁 2Τ
𝑖=1 𝑖. 𝑁
𝑢
ത et 𝜎ො𝜈2 = =
𝑡𝑟 𝑃 𝑡𝑟 𝑄 𝑁 𝑇−1
La distribution réelle des résidus n’est pas connue et ces variances ne peuvent pas être estimées.
1) Wallace et Hussain (1969) suggèrent d’appliquer les résidus OLS, 𝑢ො 𝑂𝐿𝑆 , à la place des vraies valeurs, qui sont
inconnues, de u. De toute façon, avec un modèle à effets aléatoires, l’estimateur OLS est encore non-biaisé et
cohérent, mais plus efficient.
2) Amemiya (1971) suggère d’appliquer les résidus LSDV à la place des résidus OLS. Dans ce cas, 𝑢෤ = 𝑦 − 𝛼𝜄 ෤ 𝑁𝑇 − 𝑋𝛽෨
෨ En substituant, 𝑢෤ à la place de u dans les équations des variances ci-dessus, on obtient les
ത .. 𝛽.
où 𝛼෤ = 𝑦ത.. − 𝑋′
estimateurs d’Amemiya, qui ont la distribution suivante

2) Amemiya (1971) suggère d’appliquer les résidus LSDV à la place des résidus OLS. Dans ce cas, 𝑢෤ = 𝑦 − 𝛼𝜄 ෤ 𝑁𝑇 − 𝑋𝛽෨
෨ En substituant, 𝑢෤ à la place de u dans les équations des variances ci-dessus, on obtient les
ത .. 𝛽.
où 𝛼෤ = 𝑦ത.. − 𝑋′
estimateurs d’Amemiya, qui ont la distribution suivante
𝑁𝑇 𝜎ො𝜈2 − 𝜎𝜈2 2𝜎𝜈4 0
~𝑁 0,
2
𝑁 𝜎𝜇Ƹ − 𝜎𝜇2 0 2𝜎𝜇4
où 𝜎ො𝜇2 = 𝜎ො12 − 𝜎ො𝜈2 Τ𝑇.
3) Swamy et Arora (1972) suggèrent de réaliser 2 régressions pour obtenir les estimateurs des variances.
La 1ère régression est la régression Within (effets fixes)
qui donne l’estimateur suivant de la variance

′ ′ ′ −1 ′
𝑦 𝑄𝑦 − 𝑦 𝑄𝑋 𝑋 𝑄𝑋 𝑋 𝑄𝑦
𝜎෠ො𝜈2 =
𝑁 𝑇−1 −𝐾

3) Swamy et Arora (1972) suggèrent de réaliser 2 régressions pour obtenir les estimateurs des variances.
La 1ère régression est la régression Within (effets fixes)

𝑦 ′ 𝑄𝑦 − 𝑦 ′ 𝑄𝑋 𝑋 ′ 𝑄𝑋 −1 𝑋 ′ 𝑄𝑦
𝜎෠ො𝜈2 =
𝑁 𝑇−1 −𝐾
La 2nde régression est la régression Between sur les moyennes dans le temps
ത 𝑖. + 𝑢ത 𝑖.
𝑦ത𝑖. = 𝛼 + 𝑋′

𝑦 ′ 𝑃𝑦 − 𝑦 ′ 𝑃𝑍 𝑍 ′ 𝑃𝑍 −1 𝑍 ′ 𝑃𝑦
𝜎෠ො12 =
𝑁−𝐾−1

En fait, l’estimateur GLS (General Least Squares est
𝛽መ𝐺𝐿𝑆 = 𝑊𝑋𝑋 + 𝜙 2 𝐵𝑋𝑋 −1 𝑊𝑋𝑦 + 𝜙 2 𝐵𝑋𝑦 avec 𝑣𝑎𝑟 𝛽መ𝐺𝐿𝑆 = 𝜎𝜈2 𝑊𝑋𝑋 + 𝜙 2 𝐵𝑋𝑋 −1
ҧ 𝑋 et 𝜙 2 = 𝜎𝜈2 Τ𝜎12 .
et 𝑊𝑋𝑋 = 𝑋 ′ 𝑄𝑋, 𝐵𝑋𝑋 = 𝑋′ 𝑃 − 𝐽𝑁𝑇
Ainsi, l’estimateur Within de 𝛽 est 𝛽෨𝑊𝑖𝑡ℎ𝑖𝑛 = 𝑊𝑋𝑋−1

𝑊𝑋𝑦 et l’estimateur Between est est 𝛽መ𝐵𝑒𝑡𝑤𝑒𝑒𝑛 = 𝐵𝑋𝑋
−1
𝐵𝑋𝑦 .
Cela veut dire que 𝛽መ𝐺𝐿𝑆 est une matrice pondérée de 𝛽෨𝑊𝑖𝑡ℎ𝑖𝑛 et de 𝛽መ𝐵𝑒𝑡𝑤𝑒𝑒𝑛 :
𝛽መ𝐺𝐿𝑆 = 𝑊1 𝛽෨𝑊𝑖𝑡ℎ𝑖𝑛 + 𝑊2 𝛽መ𝐵𝑒𝑡𝑤𝑒𝑒𝑛
où 𝑊1 = 𝑊𝑋𝑋 + 𝜙 2 𝐵𝑋𝑋 −1
𝑊𝑋𝑋 et 𝑊2 = 𝑊𝑋𝑋 + 𝜙 2 𝐵𝑋𝑋 −1
𝜙 2 𝐵𝑋𝑋 = 𝐼 − 𝑊1
Remarques:
1) Si 𝜎𝜇2 = 0 ⟹ 𝜙 2 = 1 et 𝛽መ𝐺𝐿𝑆 = 𝛽መ𝑂𝐿𝑆
2) Si 𝑇 → ∞ ⟹ 𝜙 2 → 0 et 𝛽መ𝐺𝐿𝑆 → 𝛽෨𝑊𝑖𝑡ℎ𝑖𝑛
3) Si 𝐵𝑋𝑋 ≫ 𝑊𝑋𝑋 ⟹ 𝛽መ𝐺𝐿𝑆 → 𝛽መ𝐵𝑒𝑡𝑤𝑒𝑒𝑛 et vice versa si 𝑊𝑋𝑋 ≫ 𝐵𝑋𝑋 ⟹ 𝛽መ𝐺𝐿𝑆 → 𝛽෨𝑊𝑖𝑡ℎ𝑖𝑛

2
4) Nerlove (1971) suggère d’estimer 𝜎𝜇2 comme 𝜎𝜇2 = σ𝑁 𝑖=1 𝜇
ො 𝑖 − 𝜇
ොҧ ൗ 𝑁 − 1 où 𝜇ො𝑖 sont les coefficients dummies
obtenus par la régression LSDV. Et 𝜎𝜈2 est obtenu de la somme des carrés des résidus Within divisée par NT.
5) Estimateur de Maximum de Vraisemblance.

Sous l’hypothèse de normalité des résidus, la fonction de vraisemblance est
2 2
𝑁𝑇 𝑁 1
𝐿 𝛼, 𝛽, 𝜙 , 𝜎𝜈 = 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡 − 𝑙𝑜𝑔𝜎𝜈 + 𝑙𝑜𝑔𝜙 − 2 𝑢′Σ−1 𝑢
2 2
2 2 2𝜎𝜈
où Ω = 𝜎𝜈2 Σ, 𝜙 2 = 𝜎𝜈2 Τ𝜎12 et Σ = 𝑄 + 𝜙 −2 𝑃. La maximisation de cette fonction de vraisemblance implique une

condition de 1er ordre non-linéaire.
Breusch (1987) concentre la fonction de vraisemblance par rapport à 𝛼 et 𝜎𝜈2 . Dans ce cas,
2
𝛼ො𝑚𝑙𝑒 = 𝑦ത.. − 𝑋′.. 𝛽𝑚𝑙𝑒 et 𝜎ො𝜈,𝑚𝑙𝑒 = 1Τ𝑁𝑇 𝑢′ො Σ෠ −1 𝑢ො
où 𝑢ො et Σ෠ sont basés sur les estimations de maximum de vraisemblance de 𝛽, 𝜙 2 et 𝛼

Soit 𝑑 = 𝑦 − 𝑋𝛽መ𝑚𝑙𝑒 ⟹ 𝛼ො𝑚𝑙𝑒 = 1Τ𝑁𝑇 𝜄′ 𝑁𝑇 𝑑 𝑒𝑡 𝑢ො = 𝑑 − 𝜄𝑁𝑇 𝛼ො𝑚𝑙𝑒 = 𝑑 − 𝐽𝑁𝑇
ҧ 𝑑. Cela implique
2 ҧ
𝜎ො𝜈,𝑚𝑙𝑒 = 𝑑′ 𝑄 + 𝜙 2 𝑃 − 𝐽𝑁𝑇 𝑑 Τ𝑁𝑇
Et la fonction de vraisemblance concentrée

2
𝑁𝑇 2 ҧ 𝑁
𝐿𝐶 𝛽, 𝜙 = 𝑐𝑜𝑛𝑡𝑎𝑛𝑡 − 𝑙𝑜𝑔 𝑑 ′ 𝑄+𝜙 𝑃−𝐽𝑁𝑇
𝑑 + 𝑙𝑜𝑔𝜙 2
2 2
En la maximisant par rapport à 𝜙 2

2
𝑑′𝑄𝑑 σ𝑁 𝑇 ҧ
𝑖=1 σ𝑡=1 𝑑𝑖𝑡 − 𝑑𝑖.
𝜙෠ 2 = =
ҧ
𝑇 − 1 𝑑′ 𝑃 − 𝐽𝑁𝑇 𝑑 𝑇 𝑇 − 1 σ𝑁 𝑑ҧ − 𝑑ҧ 2
𝑖=1 𝑖. ..
Par rapport à 𝛽
−1
𝛽መ𝑚𝑙𝑒 = 𝑋′ 𝑄 + 𝜙 2 𝑃 − 𝐽𝑁𝑇
ҧ 𝑋 ҧ
𝑋′ 𝑄 + 𝜙 2 𝑃 − 𝐽𝑁𝑇 𝑦
On répète les calculs jusqu’à la convergence.

Effets individuels aléatoires: Application
. xtreg lnY lnK1 lnK2 lnL unemp, be
Between regression (regression on group means) Number of obs = 816


between = 0.9939 avg = 17.0
F(4,43) = 1754.11
sd(u_i + avg(e_i.))= .0832062 Prob > F = 0.0000
------------------------------------------------------------------------------
-------------+----------------------------------------------------------------
lnK1 | .1793651 .0719719 2.49 0.017 .0342199 .3245104
lnK2 | .3019542 .0418215 7.22 0.000 .2176132 .3862953
lnL | .5761274 .0563746 10.22 0.000 .4624372 .6898176
unemp | -.0038903 .0099084 -0.39 0.697 -.0238724 .0160918
_cons | 1.589444 .2329796 6.82 0.000 1.119596 2.059292
------------------------------------------------------------------------------
Reprenons l’exemple de l’effets du capital public et du capital privé sur le Produit National Brut aux Etats-Unis (fichier « Productivity data.xlsx »)
On peut également effectuer une régression between sur les moyennes dans le temps 𝑦ത𝑖. = 𝛼 + 𝑋′ ത 𝑖. + 𝑢ത 𝑖.
Les résultats sont différents des effets fixes car la régression est faite uniquement en coupes transversales entre les états avec les moyennes dans le temps.
Ainsi, le fait de ne pas considérer l’aspect temporel des données rend l’effet de K1 significatif et celui de unemp, au contraire, non-significatif.
. xtreg lnY lnK1 lnK2 lnL unemp, re
Random-effects GLS regression Number of obs = 816


between = 0.9928 avg = 17.0
Wald chi2(4) = 19131.09

corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000
------------------------------------------------------------------------------
lnY | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
lnK1 | .0044388 .0234173 0.19 0.850 -.0414583 .0503359
lnK2 | .3105483 .0198047 15.68 0.000 .2717317 .3493649
lnL | .7296705 .0249202 29.28 0.000 .6808278 .7785132
unemp | -.0061725 .0009073 -6.80 0.000 -.0079507 -.0043942
_cons | 2.135411 .1334615 16.00 0.000 1.873831 2.39699
-------------+----------------------------------------------------------------
sigma_u | .0826905
sigma_e | .03813705
------------------------------------------------------------------------------
La régression avec des effets aléatoires sur Stata se fait par défaut avec la méthode de Swamy et Arora. Commenter les résultats.


between = 0.9928 avg = 17.0
Wald chi2(4) = 19131.09

------------------------------------------------------------------------------
-------------+----------------------------------------------------------------
lnK1 | .0044388 .0234173 0.19 0.850 -.0414583 .0503359
lnK2 | .3105483 .0198047 15.68 0.000 .2717317 .3493649
lnL | .7296705 .0249202 29.28 0.000 .6808278 .7785132
unemp | -.0061725 .0009073 -6.80 0.000 -.0079507 -.0043942
_cons | 2.135411 .1334615 16.00 0.000 1.873831 2.39699
-------------+----------------------------------------------------------------
sigma_u | .0826905
sigma_e | .03813705
------------------------------------------------------------------------------
La condition des effets aléatoires, à savoir corr(u_i, X) = 0, est imposée aux calculs.


between = 0.9928 avg = 17.0
Wald chi2(4) = 19131.09

------------------------------------------------------------------------------
-------------+----------------------------------------------------------------
lnK1 | .0044388 .0234173 0.19 0.850 -.0414583 .0503359
lnK2 | .3105483 .0198047 15.68 0.000 .2717317 .3493649
lnL | .7296705 .0249202 29.28 0.000 .6808278 .7785132
unemp | -.0061725 .0009073 -6.80 0.000 -.0079507 -.0043942
_cons | 2.135411 .1334615 16.00 0.000 1.873831 2.39699
-------------+----------------------------------------------------------------
sigma_u | .0826905
sigma_e | .03813705
------------------------------------------------------------------------------
Comme dans le cas des effets fixes, puisque la p-value>0.10, la variable K1 n’a pas d’effet statistique sur la variable Y. Par conséquent, le capital public n’a
pas d’effet sur le Produit National Brut.


between = 0.9928 avg = 17.0
Wald chi2(4) = 19131.09

------------------------------------------------------------------------------
-------------+----------------------------------------------------------------
lnK1 | .0044388 .0234173 0.19 0.850 -.0414583 .0503359
lnK2 | .3105483 .0198047 15.68 0.000 .2717317 .3493649
lnL | .7296705 .0249202 29.28 0.000 .6808278 .7785132
unemp | -.0061725 .0009073 -6.80 0.000 -.0079507 -.0043942
_cons | 2.135411 .1334615 16.00 0.000 1.873831 2.39699
-------------+----------------------------------------------------------------
sigma_u | .0826905
sigma_e | .03813705
------------------------------------------------------------------------------
Comme dans le cas des effets fixes, puisque la p-value<0.05, la variable K2 a d’effet statistique sur la variable Y. Par conséquent, le capital privé a d’effet sur
le Produit National Brut. Plus précisément, une hausse de 1% du capital privé implique une hausse de 0.31% du Produit National Brut, toutes choses égales
par ailleurs. C’est un résultats légèrement supérieur à celui des EF.


between = 0.9928 avg = 17.0
Wald chi2(4) = 19131.09

------------------------------------------------------------------------------
-------------+----------------------------------------------------------------
lnK1 | .0044388 .0234173 0.19 0.850 -.0414583 .0503359
lnK2 | .3105483 .0198047 15.68 0.000 .2717317 .3493649
lnL | .7296705 .0249202 29.28 0.000 .6808278 .7785132
unemp | -.0061725 .0009073 -6.80 0.000 -.0079507 -.0043942
_cons | 2.135411 .1334615 16.00 0.000 1.873831 2.39699
-------------+----------------------------------------------------------------
sigma_u | .0826905
sigma_e | .03813705
------------------------------------------------------------------------------
Comme dans le cas des effets fixes, puisque la p-value<0.05, la variable L a d’effet statistique sur la variable Y. Par conséquent, le facteur travail a d’effet sur
le Produit National Brut. Plus précisément, une hausse de 1% de la masse salariale non-agricole implique une hausse de 0.73% du Produit National Brut,
toutes choses égales par ailleurs. C’est un résultats légèrement inférieur à celui des EF.
. xtreg lnY lnK1 lnK2 lnL unemp, mle . mixed lnY lnK1 lnK2 lnL unemp || _all:R.state_index
Random-effects ML regression Number of obs = 816 Mixed-effects ML regression Number of obs = 816
Group variable: state_index Number of groups = 48 Group variable: _all Number of groups = 1
Random effects u_i ~ Gaussian Obs per group: min = 17 Obs per group: min = 816
avg = 17.0 avg = 816.0
max = 17 max = 816
LR chi2(4) = 2412.91
Log likelihood = 1401.9041 Prob > chi2 = 0.0000 Wald chi2(4) = 18904.40
Log likelihood = 1401.9041 Prob > chi2 = 0.0000
------------------------------------------------------------------------------
lnY | Coef. Std. Err. z P>|z| [95% Conf. Interval] ------------------------------------------------------------------------------
-------------+---------------------------------------------------------------- lnY | Coef. Std. Err. z P>|z| [95% Conf. Interval]
lnK1 | .0031446 .0239185 0.13 0.895 -.0437348 .050024 -------------+----------------------------------------------------------------
lnK2 | .309811 .020081 15.43 0.000 .270453 .3491691 lnK1 | .0031446 .0234856 0.13 0.893 -.0428864 .0491755
lnL | .7313372 .0256936 28.46 0.000 .6809787 .7816957 lnK2 | .309811 .0199118 15.56 0.000 .2707847 .3488374
unemp | -.0061382 .0009143 -6.71 0.000 -.0079302 -.0043462 lnL | .7313372 .0250205 29.23 0.000 .6822979 .7803765
_cons | 2.143865 .1376582 15.57 0.000 1.87406 2.413671 unemp | -.0061382 .0009063 -6.77 0.000 -.0079145 -.0043619
-------------+---------------------------------------------------------------- _cons | 2.143865 .1344052 15.95 0.000 1.880436 2.407295
/sigma_u | .085162 .0090452 .0691573 .1048706 ------------------------------------------------------------------------------
/sigma_e | .0380836 .0009735 .0362226 .0400402
rho | .8333481 .0304597 .7668537 .8861754
------------------------------------------------------------------------------
Likelihood-ratio test of sigma_u=0: chibar2(01)= 1149.84 Prob>=chibar2 = 0.000
Les résultats avec la méthode de Maximum de Vraisemblance sont très proches à ceux obtenus avec la méthode de Swamy et Arora.
Ils s’obtiennent avec deux commandes: l’une traditionnelle de xtreg (modèle de gauche) et l’autre mixed.

Chapitre 2 - Modèles À Effets Individuels

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Chapitre 2 - Modèles À Effets Individuels

Transféré par

Droits d'auteur :

Formats disponibles

Ion Lapteacru, MCF HDR (15h)

𝑦𝑖𝑡 = 𝛼 + 𝑋𝑖𝑡′ 𝛽 + 𝑢𝑖𝑡

Si le modèle contient uniquement des effets individuels, alors

où 𝜇𝑖 représente les effets individuels nonobservés et 𝜈𝑖𝑡 les résidus.

La forme vectorielle peut être écrite de la façon suivante:

Avec les résidus sous la forme matricielle

où 𝑢′ = 𝑢11 , … , 𝑢1𝑇 , … , 𝑢𝑁1 , … , 𝑢𝑁𝑇 , 𝑍𝜇 = 𝐼𝑁 ⨂𝜄 𝑇 , 𝜇′ = 𝜇1 , … , 𝜇𝑁 et 𝜈 ′ = 𝜈11 , … , 𝜈1𝑇 , … , 𝜈𝑁1 , … , 𝜈𝑁𝑇

𝐼𝑁 est la matrice identité de dimension N et 𝜄 𝑇 est le vecteur d’unités (valeur 1) de dimension T.

où 𝑢′ = 𝑢11 , … , 𝑢1𝑇 , … , 𝑢𝑁1 , … , 𝑢𝑁𝑇 , 𝑍𝜇 = 𝐼𝑁 ⨂𝜄 𝑇 , 𝜇′ = 𝜇1 , … , 𝜇𝑁 et 𝜈 ′ = 𝜈11 , … , 𝜈1𝑇 , … , 𝜈𝑁1 , … , 𝜈𝑁𝑇 .

A noter que 𝑍𝜇 𝑍′𝜇 = 𝐼𝑁 ⨂𝐽𝑇 et

𝐼𝑁 est la matrice identité de dimension N et 𝜄 𝑇 est le vecteur d’unités (valeur 1) de dimension T.

La forme matricielle de l’équation à effets individuels est donc

Sur laquelle on applique les MCO afin d’obtenir 𝛼, 𝛽 et 𝜇.

Pour une régression simple (1 seule variable explicative)

Prenant la moyenne dans le temps,

Faisant la différence, on obtient

De même, prenant également la moyenne entre les individus,

Pour une régression simple (1 seule variable explicative)

Quand le nombre d’individus N est trop grand, la régression

LSDV est un estimateur BLUE pour un modèle à effets fixes.

Il s’agit d’un test de Chow qui teste

où K est le nombre de variables explicatives,

LSDV est un estimateur BLUE pour un modèle à effets fixes.

Ce panel de données est construit pour 48 états et sur la période 1970-1986.

gen lnY= log(gsp)

Ce panel de données est construit pour 48 états et sur la période 1970-1986.

gen lnY= log(gsp)

Ce panel de données est construit pour 48 états et sur la période 1970-1986.

gen lnY= log(gsp)

Fixed-effects (within) regression Number of obs = 816

R-sq: within = 0.9413 Obs per group: min = 17

Le résultat de la régression avec Effets Fixes (EF). Commenter les résultats.

Fixed-effects (within) regression Number of obs = 816

R-sq: within = 0.9413 Obs per group: min = 17

Fixed-effects (within) regression Number of obs = 816

R-sq: within = 0.9413 Obs per group: min = 17

Fixed-effects (within) regression Number of obs = 816

R-sq: within = 0.9413 Obs per group: min = 17

Fixed-effects (within) regression Number of obs = 816

R-sq: within = 0.9413 Obs per group: min = 17

R-sq: within = 0.9413 Obs per group: min = 17 𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑁−1 = 0

F(4,764) = 3064.81 𝑅𝑅𝑆𝑆−𝑈𝑅𝑆𝑆 Τ 𝑁−1

R-sq: within = 0.9413 Obs per group: min = 17 𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑁−1 = 0

F(4,764) = 3064.81 𝑅𝑅𝑆𝑆−𝑈𝑅𝑆𝑆 Τ 𝑁−1

On peut obtenir cette statistique par le calcul de la stat. de Fisher.

------------------------------------------------------------------------------ 6.2942−1.1112 Τ 48−1

On fait ensuite la régression avec les MCO et on obtient RRSS=6.2942

La matrice de variance-covariance s’en obtient:

avec 𝜎12 = 𝑇𝜎𝜇2 + 𝜎𝜈2 , 𝑃 = 𝐼𝑁 ⊗ 𝐽𝑇ҧ et 𝑄 = 𝐼𝑁 ⊗ 𝐸𝑇 . Avec les propriétés de P et Q, on vérifie

ou, en général, Ω𝑟 = 𝜎12 𝑟 𝑃 + 𝜎𝜐2 𝑟 𝑄 pour tout scalaire r.

L’estimateur GLS ou MCG (Moindres Carrés Généralisés)

L’estimateur GLS ou MCG (Moindres Carrés Généralisés)

qui donne l’estimateur suivant de la variance

L’estimateur GLS ou MCG (Moindres Carrés Généralisés)

qui donne l’estimateur suivant de la variance

qui donne l’estimateur suivant de la variance

L’estimateur GLS ou MCG (Moindres Carrés Généralisés)

Ainsi, l’estimateur Within de 𝛽 est 𝛽෨𝑊𝑖𝑡ℎ𝑖𝑛 = 𝑊𝑋𝑋−1

L’estimateur GLS ou MCG (Moindres Carrés Généralisés)

5) Estimateur de Maximum de Vraisemblance.

où Ω = 𝜎𝜈2 Σ, 𝜙 2 = 𝜎𝜈2 Τ𝜎12 et Σ = 𝑄 + 𝜙 −2 𝑃. La maximisation de cette fonction de vraisemblance implique une

où 𝑢ො et Σ෠ sont basés sur les estimations de maximum de vraisemblance de 𝛽, 𝜙 2 et 𝛼

L’estimateur GLS ou MCG (Moindres Carrés Généralisés)