Académique Documents
Professionnel Documents
Culture Documents
Séance 6
Modèle à double erreurs
composées
Introduction
On a vu dans la séance précédente le cas de présence d’un
effet individuel dans le modèle. Plusieurs méthodes
peuvent être appliquées (modèle à effets fixes, à effets
aléatoires) pour trouver le meilleur estimateur selon les
conditions à chaque fois (MCO, Within, MCG,…).
En fait, il n’existe pas de meilleur estimateur mais les règles
de l’art imposent d’approfondir encore l’analyse et réaliser
des tests afin de voir quel est l’estimateur qui colle le plus à
la réalité des données étudiées (prochaine séance)
Dans la pratique, il est également possible qu’il existe un
effet temporel dans le modèle, c’est-à-dire une variable
aléatoire qui affecte la totalité des individus à une même
date.
Le modèle à effets temporels (1)
Pour chaque individu i et chaque période t :
'
yit t x i ,t
it
yi IT X i i
En regroupant tous les individus :
Y DT X avec DT S N IT
Le modèle à effets temporels (2)
On définit les opérateurs inter- et intratemporels :
BT DT ( DT' DT ) 1 DT' 1 N DT DT'
WT I NT BT
L’estimateur LSDV de b est :
ˆ ( X 'WT X ) 1 X 'WT Y
Cet estimateur s’obtient comme l’estimateur des
MCO sur le modèle transformé :
WT Y WT X WT
' '
(
ity y.t ) ( xit x.t ) erreur
Estimation des modèles à effets
fixes temporels
Pour les modèles uniquement à effets fixes
temporels, ils s’estiment:
en ajoutant T-1 variables binaires
en centrant les données autour de la moyenne des
individus par période
Modèle à effets individuels et
temporels
Wallace et Hussain ont considéré le modèle suivant :
yit X it it
avec
it ui t wit
On suppose que l’erreur se compose d’une partie ui
fixe dans le temps qui est l’effet individuel non
observé, de t qui est l’effet temporel non observé et
de wit qui est le terme d’erreur aléatoire usuel.
t est invariant entre les individus et tient compte de
tout effet temporel spécifique qui n’est pas inclus dans
le modèle (effet d’une réforme, effet des années de
grève, effet de l’embargo,…)
Modèle à effets fixes
Si les ui et les t sont considérés comme des
paramètres fixes à estimer et les wit des
erreurs stochastiques iid(0,w2).
Et si les Xit sont supposées indépendantes des
wit pour tout i et t.
Alors, l’inférence est conditionnelle aux N
individus et aux T périodes. Le modèle à
effets fixes est approprié dans ce cas à la
condition que N ou T ne soient pas trop
grands (perte de degrés de liberté).
L’estimateur « Double Within »
Pour obtenir l’estimateur à effets fixes, Wallace et
Hussain ont proposé la transformation Within suivante :
~
yit ( y it yi . y. t y.. )
Cette transformation élimine à la fois les effets
individuels et temporels.
La régression est faite sur le modèle :
QW y QW X QW w
Et en appliquant les MCO, on obtient l’estimateur Within
~
( X QW X ) 1 X QW y
Modèle à effets aléatoires (1)
Pour chaque individu i et chaque période t :
yit xit' i ,t
it ui vt wit
Hypothèses :
ui iid (0, u2 )
2
vt iid (0, v )
2
w
it iid (0, w)
u , v , w mutuellement indépendants
i t it
Modèle à effets aléatoires (2)
Les propriétés suivantes sur les erreurs sont donc
vérifiées :
E ( it ) 0 i, t
u2 v2 w2 si i j et t s
2
u si i j et t s
E ( it js )
2
v si i j et t s
0 sinon
Interprétation :
Autocorrélation temporelle «individu par individu»,
constante quel que soit le nombre de périodes séparant
deux perturbations
Covariance contemporaine entre les individus
Modèle à effets aléatoires (3)
Si on empile les observations pour l’individu i :
u2 v2 w2 u2 u2
2 2 2 2 2
u
* E ( i i' ) u u v w A
2
u2 u2 2 2
u v w
soit : A ( v2 w2 ) IT u2 ST ST'
v2 0 0
2
0 0
* E ( i 'j ) v
B v2 IT
2
0 0 v
La matrice de variance covariance
Si on empile les N individus :
A B B
B A B
V ( ) E ( ')
B B B
A B 0 0 B B B
0 A B 0 B B B
soit : V ( )
0 0 A B B B B
I N ( A B) ( ST ST' ) B
Les estimateurs (1) : le between
individuel
Tous les estimateurs s’obtiennent en appliquant les
moindres carrés ordinaires aux données transformées.
L’estimateur du between individuel est le même
estimateur between qu’on a vu avant à la différence
que l’on n’estime plus ici le terme constant en raison
du centrage des données.
avec :
Estimateur sans biais de variance :
Les estimateurs (2) : le between
temporel
On applique les MCO sur les données centrées par
rapport aux moyennes des variables sur tous les
individus.
L’estimateur du between temporel est
avec :
Estimateur sans biais de variance :
Les estimateurs (3) : l’estimateur
des MCG
L’estimateur des moindres carrés généralisés est défini
par :
de matrice de covariance :
Ce qui donne :
de variance :
Estimation des composantes de la
variance
Pour pouvoir estimer les matrices de covariance des
estimateurs précédents ainsi que pour pouvoir réaliser
l’estimation optimale par les moindres carrés quasi-
2 2 2
généralisés, il faut disposer d’estimateurs de u , v et w
Pour cela, on se base sur les sommes des carrés des
résidus des trois estimateurs : le double within, le
between individuel et le between temporel.
2 2 2
ˆ
On utilise ensuite les estimateurs u v , ˆ et ˆ w pour
effectuer les moindres carrés quasi généralisés, ce qui
donne les estimateurs convergents ˆ1, ˆ2 et ˆ3 et
permet donc de donner l’estimation optimale des MCG.
Exemple : Effet de la réforme de 2000 sur
le taux de redoublement au collège
Variables du modèle
Yit : taux de redoublement au collège (trCOL)
Xit : - taille moyenne de la classe (eleve_clas)
- proportion d’élèves à l’âge normal (pCOL_xt)
- nombre moyen d’années d’ancienneté
des enseignants (anc_moy)
- indicatrices des années 2000 à 2010 (t00 à t09)
La méthode des MCO suppose que
les erreurs sont indépendantes et homoscédastiques
et ne tient pas compte de l’hétérogénéité
individuelle non observée.
18
Estimateur MCO sur des données
de panel (pooled)
. regress trCOL eleve_clas pCOL_xt anc_moy t00 t01 t02 t03
t04 t05 t06 t07 t08 t09
Source SS df MS Number of obs = 15863
F( 13, 15849) = 159.24
Model 7.1766752 13 .552051938 Prob > F = 0.0000
Residual 54.9441365 15849 .003466726 R-squared = 0.1155
Adj R-squared = 0.1148
Total 62.1208117 15862 .003916329 Root MSE = .05888
Robust
trCOL Coef. Std. Err. t P>|t| [95% Conf. Interval]
F(13,1902) = 35.71
sd(u_i + avg(e_i.))= .0467003 Prob > F = 0.0000
21
Estimateur à effets aléatoires (RE)
. xtreg trCOL eleve_clas pCOL_xt anc_moy t00 t01 t02 t03 t04
t05 t06 t07 t08 t09, re vce(robust) theta
Random-effects GLS regression Number of obs = 15863
Group variable: id Number of groups = 1916
theta
min 5% median 95% max
0.2451 0.2451 0.6721 0.6721 0.6721
Robust
trCOL Coef. Std. Err. z P>|z| [95% Conf. Interval]
sigma_u .04135501
sigma_e
rho
.0476047
.43009198 (fraction of variance due to u_i) 22
Estimateur à effets fixes (FE)
. xtreg trCOL eleve_clas pCOL_xt anc_moy t00 t01 t02 t03 t04
t05 t06 t07 t08 t09, fe vce(robust)
Fixed-effects (within) regression Number of obs = 15863
Group variable: id Number of groups = 1916
F(13,1915) = 43.55
corr(u_i, Xb) = 0.0926 Prob > F = 0.0000
Robust
trCOL Coef. Std. Err. t P>|t| [95% Conf. Interval]
sigma_u .0506961
sigma_e .0476047
rho .5314173 (fraction of variance due to u_i) 23
Estimateur en différences
premières (FD)
. reg D.(trCOL eleve_clas pCOL_xt anc_moy t00 t01 t02 t03
t04 t05 t06 t07 t08 t09), noconstant vce(cluster id)
Linear regression Number of obs = 13930
F( 13, 1776) = 31.02
Prob > F = 0.0000
R-squared = 0.0165
Root MSE = .06179
Robust
D.trCOL Coef. Std. Err. t P>|t| [95% Conf. Interval]
eleve_clas
D1. -.000593 .0002007 -2.95 0.003 -.0009866 -.0001993
pCOL_xt
D1. .0266515 .0057948 4.60 0.000 .0152861 .0380169
anc_moy
D1. .0001294 .000173 0.75 0.455 -.00021 .0004688
t00
D1. .0026476 .0016004 1.65 0.098 -.0004913 .0057865
t01
D1. .0093361 .0018627 5.01 0.000 .0056827 .0129895
t02
D1. .006807 .0020602 3.30 0.001 .0027662 .0108477
t03
D1. .0005984 .0022323 0.27 0.789 -.0037798 .0049766
t04
D1. -.0075412 .0024314 -3.10 0.002 -.0123099 -.0027724
t05
D1. -.0151721 .0025477 -5.96 0.000 -.0201689 -.0101754
t06
D1. -.0196973 .0026587 -7.41 0.000 -.0249119 -.0144827
t07
D1. -.0213714 .0027941 -7.65 0.000 -.0268515 -.0158913
t08
D1. -.0331748 .0029741 -11.15 0.000 -.0390079 -.0273417
t09
D1. -.0228282 .0028729 -7.95 0.000 -.0284627 -.0171936 24
Comparaison des estimateurs
• global xvar eleve_clas pCOL_xt anc_moy t00 t01 t02 t03 t04
t05 t06 t07 t08 t09
• quietly regress trCOL $xvar, vce(cluster id)
• estimates store MCO
• quietly xtreg trCOL $xvar, be
• estimates store BE
• quietly xtreg trCOL $xvar, re vce(robust)
• estimates store RE
• quietly xtreg trCOL $xvar, fe vce(robust)
• estimates store FE
• estimates table MCO BE RE FE, b(%9.4f) se stats(N)
25
Comparaison des estimateurs
Variable MCO BE RE FE