Vous êtes sur la page 1sur 26

Université Mohamed V Agdal

Faculté des Sciences Juridiques, Economiques


et Sociales

Econométrie des données de panel

Séance 6
Modèle à double erreurs
composées
Introduction
 On a vu dans la séance précédente le cas de présence d’un
effet individuel dans le modèle. Plusieurs méthodes
peuvent être appliquées (modèle à effets fixes, à effets
aléatoires) pour trouver le meilleur estimateur selon les
conditions à chaque fois (MCO, Within, MCG,…).
 En fait, il n’existe pas de meilleur estimateur mais les règles
de l’art imposent d’approfondir encore l’analyse et réaliser
des tests afin de voir quel est l’estimateur qui colle le plus à
la réalité des données étudiées (prochaine séance)
 Dans la pratique, il est également possible qu’il existe un
effet temporel dans le modèle, c’est-à-dire une variable
aléatoire qui affecte la totalité des individus à une même
date.
Le modèle à effets temporels (1)
 Pour chaque individu i et chaque période t :
'
yit  t  x    i ,t
it

 Pour chaque individu i :

yi  IT   X i    i
 En regroupant tous les individus :

Y  DT   X    avec DT  S N  IT
Le modèle à effets temporels (2)
 On définit les opérateurs inter- et intratemporels :
BT  DT ( DT' DT ) 1 DT'  1 N  DT DT'
WT  I NT  BT
 L’estimateur LSDV de b est :
ˆ  ( X 'WT X ) 1 X 'WT Y
 Cet estimateur s’obtient comme l’estimateur des
MCO sur le modèle transformé :
WT Y  WT X   WT 
 ' '
(
 ity  y.t )  ( xit  x.t )   erreur
Estimation des modèles à effets
fixes temporels
 Pour les modèles uniquement à effets fixes
temporels, ils s’estiment:
 en ajoutant T-1 variables binaires
 en centrant les données autour de la moyenne des
individus par période
Modèle à effets individuels et
temporels
 Wallace et Hussain ont considéré le modèle suivant :
yit    X it    it
avec
 it  ui  t  wit
 On suppose que l’erreur se compose d’une partie ui
fixe dans le temps qui est l’effet individuel non
observé, de t qui est l’effet temporel non observé et
de wit qui est le terme d’erreur aléatoire usuel.
 t est invariant entre les individus et tient compte de
tout effet temporel spécifique qui n’est pas inclus dans
le modèle (effet d’une réforme, effet des années de
grève, effet de l’embargo,…)
Modèle à effets fixes
 Si les ui et les t sont considérés comme des
paramètres fixes à estimer et les wit des
erreurs stochastiques iid(0,w2).
 Et si les Xit sont supposées indépendantes des
wit pour tout i et t.
 Alors, l’inférence est conditionnelle aux N
individus et aux T périodes. Le modèle à
effets fixes est approprié dans ce cas à la
condition que N ou T ne soient pas trop
grands (perte de degrés de liberté).
L’estimateur « Double Within »
 Pour obtenir l’estimateur à effets fixes, Wallace et
Hussain ont proposé la transformation Within suivante :
~
yit  ( y it  yi .  y. t  y.. )
 Cette transformation élimine à la fois les effets
individuels et temporels.
 La régression est faite sur le modèle :
QW y  QW X   QW w
 Et en appliquant les MCO, on obtient l’estimateur Within
~
  ( X QW X ) 1 X QW y
Modèle à effets aléatoires (1)
 Pour chaque individu i et chaque période t :
 yit    xit'    i ,t

 it  ui  vt  wit

 Hypothèses :
ui iid (0,  u2 )
 2
vt iid (0,  v )
 2
w
 it  iid (0,  w)
u , v , w mutuellement indépendants
 i t it
Modèle à effets aléatoires (2)
 Les propriétés suivantes sur les erreurs sont donc
vérifiées :
E ( it )  0 i, t
 u2   v2   w2 si i  j et t  s
 2
 u si i  j et t  s
E ( it  js )  
2
 v si i  j et t  s
0 sinon

 Interprétation :
 Autocorrélation temporelle «individu par individu»,
constante quel que soit le nombre de périodes séparant
deux perturbations
 Covariance contemporaine entre les individus
Modèle à effets aléatoires (3)

Si on empile les observations pour l’individu i :

 u2   v2   w2  u2   u2 
 2 2 2 2 2 
       u
* E ( i i' )   u u v w A
     
 2
  u2  u2 2 2
  u   v   w 
soit : A  ( v2   w2 ) IT   u2 ST ST'
 v2 0  0
 2 
0   0
* E ( i 'j )   v
 B   v2 IT
    
 2
 0 0   v 
La matrice de variance covariance
 Si on empile les N individus :
 A B  B
B A  B
V ( )  E ( ')   
    
 
 B B  B 
A B 0  0  B B  B
 0 A  B  0  B B  B
soit : V ( )    
          
   
 0 0  A  B   B B  B 
 I N  ( A  B)  ( ST ST' )  B
Les estimateurs (1) : le between
individuel
 Tous les estimateurs s’obtiennent en appliquant les
moindres carrés ordinaires aux données transformées.
 L’estimateur du between individuel est le même
estimateur between qu’on a vu avant à la différence
que l’on n’estime plus ici le terme constant en raison
du centrage des données.

avec :
 Estimateur sans biais de variance :
Les estimateurs (2) : le between
temporel
 On applique les MCO sur les données centrées par
rapport aux moyennes des variables sur tous les
individus.
 L’estimateur du between temporel est

avec :
 Estimateur sans biais de variance :
Les estimateurs (3) : l’estimateur
des MCG
 L’estimateur des moindres carrés généralisés est défini
par :

de matrice de covariance :

 Il est obtenu en réalisant les MCO sur les données pré-


multipliées par -1/2
 Ceci est équivalent à travailler sur la transformation :
Les estimateurs (3) : l’estimateur
des MCG
 Plus généralement, l’estimateur des MCG s’obtient en
appliquant les moindres carrés ordinaires aux
transformations suivantes :

 Ce qui donne :
de variance :
Estimation des composantes de la
variance
 Pour pouvoir estimer les matrices de covariance des
estimateurs précédents ainsi que pour pouvoir réaliser
l’estimation optimale par les moindres carrés quasi-
2 2 2
généralisés, il faut disposer d’estimateurs de  u ,  v et  w
 Pour cela, on se base sur les sommes des carrés des
résidus des trois estimateurs : le double within, le
between individuel et le between temporel.
2 2 2
 ˆ

On utilise ensuite les estimateurs u v , ˆ et ˆ w pour
effectuer les moindres carrés quasi généralisés, ce qui
donne les estimateurs convergents ˆ1, ˆ2 et ˆ3 et
permet donc de donner l’estimation optimale des MCG.
Exemple : Effet de la réforme de 2000 sur
le taux de redoublement au collège
Variables du modèle
 Yit : taux de redoublement au collège (trCOL)
 Xit : - taille moyenne de la classe (eleve_clas)
- proportion d’élèves à l’âge normal (pCOL_xt)
- nombre moyen d’années d’ancienneté
des enseignants (anc_moy)
- indicatrices des années 2000 à 2010 (t00 à t09)
 La méthode des MCO suppose que
 les erreurs sont indépendantes et homoscédastiques
 et ne tient pas compte de l’hétérogénéité
individuelle non observée.
18
Estimateur MCO sur des données
de panel (pooled)
. regress trCOL eleve_clas pCOL_xt anc_moy t00 t01 t02 t03
t04 t05 t06 t07 t08 t09
Source SS df MS Number of obs = 15863
F( 13, 15849) = 159.24
Model 7.1766752 13 .552051938 Prob > F = 0.0000
Residual 54.9441365 15849 .003466726 R-squared = 0.1155
Adj R-squared = 0.1148
Total 62.1208117 15862 .003916329 Root MSE = .05888

trCOL Coef. Std. Err. t P>|t| [95% Conf. Interval]

eleve_clas .0013504 .0000788 17.13 0.000 .0011958 .0015049


pCOL_xt -.0751603 .0034994 -21.48 0.000 -.0820196 -.068301
anc_moy .0018575 .0000748 24.83 0.000 .0017108 .0020041
t00 .0006824 .0024761 0.28 0.783 -.0041711 .0055359
t01 .0045072 .0024436 1.84 0.065 -.0002825 .0092969
t02 -.00257 .0024054 -1.07 0.285 -.0072849 .0021449
t03 -.0082947 .0023783 -3.49 0.000 -.0129564 -.0036329
t04 -.0198441 .0023689 -8.38 0.000 -.0244875 -.0152008
t05 -.0245458 .0023527 -10.43 0.000 -.0291573 -.0199342
t06 -.0286816 .0023467 -12.22 0.000 -.0332814 -.0240818
t07 -.0318979 .0023391 -13.64 0.000 -.0364828 -.0273129
t08 -.0406548 .0023252 -17.48 0.000 -.0452125 -.0360971
t09 -.0318277 .0022896 -13.90 0.000 -.0363155 -.0273399
_cons .1524257 .0033804 45.09 0.000 .1457997 .1590517
19
Estimateur MCO avec des écarts-
types robustes
. regress trCOL eleve_clas pCOL_xt anc_moy t00 t01 t02 t03
t04 t05 t06 t07 t08 t09, vce(cluster id)
Linear regression Number of obs = 15863
F( 13, 1915) = 76.16
Prob > F = 0.0000
R-squared = 0.1155
Root MSE = .05888

(Std. Err. adjusted for 1916 clusters in id)

Robust
trCOL Coef. Std. Err. t P>|t| [95% Conf. Interval]

eleve_clas .0013504 .0001548 8.72 0.000 .0010468 .001654


pCOL_xt -.0751603 .0092392 -8.13 0.000 -.0932803 -.0570403
anc_moy .0018575 .0001369 13.57 0.000 .0015889 .002126
t00 .0006824 .0017414 0.39 0.695 -.0027329 .0040977
t01 .0045072 .002016 2.24 0.025 .0005533 .0084611
t02 -.00257 .002001 -1.28 0.199 -.0064943 .0013544
t03 -.0082947 .0020711 -4.01 0.000 -.0123564 -.0042329
t04 -.0198441 .0019835 -10.00 0.000 -.0237343 -.015954
t05 -.0245458 .0021105 -11.63 0.000 -.0286849 -.0204066
t06 -.0286816 .0022082 -12.99 0.000 -.0330124 -.0243508
t07 -.0318979 .0022995 -13.87 0.000 -.0364076 -.0273882
t08 -.0406548 .002326 -17.48 0.000 -.0452165 -.0360931
t09 -.0318277 .0022105 -14.40 0.000 -.0361629 -.0274925
_cons .1524257 .0066578 22.89 0.000 .1393683 .165483
20
Estimateur between (BE)
. xtreg trCOL eleve_clas pCOL_xt anc_moy t00 t01 t02 t03 t04
t05 t06 t07 t08 t09, be
Between regression (regression on group means) Number of obs = 15863
Group variable: id Number of groups = 1916

R-sq: within = 0.0010 Obs per group: min = 1


between = 0.1962 avg = 8.3
overall = 0.0097 max = 11

F(13,1902) = 35.71
sd(u_i + avg(e_i.))= .0467003 Prob > F = 0.0000

trCOL Coef. Std. Err. t P>|t| [95% Conf. Interval]

eleve_clas .0018417 .0002037 9.04 0.000 .0014422 .0022411


pCOL_xt -.0839307 .0097849 -8.58 0.000 -.1031211 -.0647403
anc_moy .002452 .000192 12.77 0.000 .0020755 .0028285
t00 .1269393 .0358529 3.54 0.000 .0566241 .1972545
t01 -.0098389 .0250204 -0.39 0.694 -.0589092 .0392314
t02 -.0302448 .0270856 -1.12 0.264 -.0833655 .0228758
t03 .247742 .0352775 7.02 0.000 .1785553 .3169286
t04 .0577634 .030024 1.92 0.055 -.0011199 .1166468
t05 -.0193436 .0256454 -0.75 0.451 -.0696396 .0309524
t06 .0538775 .0261423 2.06 0.039 .002607 .105148
t07 .0478783 .023445 2.04 0.041 .0018977 .0938588
t08 .0030674 .0212807 0.14 0.885 -.0386685 .0448033
t09 .042155 .0195468 2.16 0.031 .0038196 .0804903
_cons .0619752 .0206747 3.00 0.003 .0214277 .1025227

21
Estimateur à effets aléatoires (RE)
. xtreg trCOL eleve_clas pCOL_xt anc_moy t00 t01 t02 t03 t04
t05 t06 t07 t08 t09, re vce(robust) theta
Random-effects GLS regression Number of obs = 15863
Group variable: id Number of groups = 1916

R-sq: within = 0.0574 Obs per group: min = 1


between = 0.1207 avg = 8.3
overall = 0.0998 max = 11

Wald chi2(13) = 721.77


corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000

theta
min 5% median 95% max
0.2451 0.2451 0.6721 0.6721 0.6721

(Std. Err. adjusted for 1916 clusters in id)

Robust
trCOL Coef. Std. Err. z P>|z| [95% Conf. Interval]

eleve_clas .0005121 .0001319 3.88 0.000 .0002536 .0007705


pCOL_xt -.0249118 .0053082 -4.69 0.000 -.0353157 -.0145078
anc_moy .0010085 .0001138 8.86 0.000 .0007854 .0012315
t00 .0014406 .0016393 0.88 0.380 -.0017723 .0046535
t01 .0070158 .0018876 3.72 0.000 .0033162 .0107154
t02 .0022494 .0018984 1.18 0.236 -.0014715 .0059702
t03 -.0035937 .0019574 -1.84 0.066 -.0074301 .0002428
t04 -.0132394 .0018823 -7.03 0.000 -.0169287 -.00955
t05 -.0189963 .0019758 -9.61 0.000 -.0228688 -.0151238
t06 -.0230257 .0020404 -11.28 0.000 -.0270248 -.0190266
t07 -.0251904 .0021177 -11.90 0.000 -.0293409 -.0210399
t08 -.0348515 .0021721 -16.05 0.000 -.0391086 -.0305943
t09 -.0246836 .0020455 -12.07 0.000 -.0286928 -.0206745
_cons .1552498 .0051054 30.41 0.000 .1452434 .1652563

sigma_u .04135501
sigma_e
rho
.0476047
.43009198 (fraction of variance due to u_i) 22
Estimateur à effets fixes (FE)
. xtreg trCOL eleve_clas pCOL_xt anc_moy t00 t01 t02 t03 t04
t05 t06 t07 t08 t09, fe vce(robust)
Fixed-effects (within) regression Number of obs = 15863
Group variable: id Number of groups = 1916

R-sq: within = 0.0605 Obs per group: min = 1


between = 0.0601 avg = 8.3
overall = 0.0656 max = 11

F(13,1915) = 43.55
corr(u_i, Xb) = 0.0926 Prob > F = 0.0000

(Std. Err. adjusted for 1916 clusters in id)

Robust
trCOL Coef. Std. Err. t P>|t| [95% Conf. Interval]

eleve_clas .0000309 .0001565 0.20 0.843 -.0002761 .0003379


pCOL_xt -.0158546 .0054434 -2.91 0.004 -.0265303 -.005179
anc_moy .0002145 .0001561 1.37 0.170 -.0000917 .0005206
t00 .0017555 .0016213 1.08 0.279 -.0014243 .0049353
t01 .0084844 .0018784 4.52 0.000 .0048005 .0121684
t02 .0046731 .0019276 2.42 0.015 .0008927 .0084536
t03 -.0010599 .0019884 -0.53 0.594 -.0049595 .0028396
t04 -.0088046 .0019998 -4.40 0.000 -.0127266 -.0048826
t05 -.0151321 .0020545 -7.37 0.000 -.0191615 -.0111028
t06 -.0188649 .0021392 -8.82 0.000 -.0230604 -.0146695
t07 -.0201419 .0022524 -8.94 0.000 -.0245594 -.0157245
t08 -.0294763 .0023541 -12.52 0.000 -.0340932 -.0248593
t09 -.0188154 .0022131 -8.50 0.000 -.0231557 -.0144751
_cons .1783407 .0059316 30.07 0.000 .1667076 .1899739

sigma_u .0506961
sigma_e .0476047
rho .5314173 (fraction of variance due to u_i) 23
Estimateur en différences
premières (FD)
. reg D.(trCOL eleve_clas pCOL_xt anc_moy t00 t01 t02 t03
t04 t05 t06 t07 t08 t09), noconstant vce(cluster id)
Linear regression Number of obs = 13930
F( 13, 1776) = 31.02
Prob > F = 0.0000
R-squared = 0.0165
Root MSE = .06179

(Std. Err. adjusted for 1777 clusters in id)

Robust
D.trCOL Coef. Std. Err. t P>|t| [95% Conf. Interval]

eleve_clas
D1. -.000593 .0002007 -2.95 0.003 -.0009866 -.0001993

pCOL_xt
D1. .0266515 .0057948 4.60 0.000 .0152861 .0380169

anc_moy
D1. .0001294 .000173 0.75 0.455 -.00021 .0004688

t00
D1. .0026476 .0016004 1.65 0.098 -.0004913 .0057865

t01
D1. .0093361 .0018627 5.01 0.000 .0056827 .0129895

t02
D1. .006807 .0020602 3.30 0.001 .0027662 .0108477

t03
D1. .0005984 .0022323 0.27 0.789 -.0037798 .0049766

t04
D1. -.0075412 .0024314 -3.10 0.002 -.0123099 -.0027724

t05
D1. -.0151721 .0025477 -5.96 0.000 -.0201689 -.0101754

t06
D1. -.0196973 .0026587 -7.41 0.000 -.0249119 -.0144827

t07
D1. -.0213714 .0027941 -7.65 0.000 -.0268515 -.0158913

t08
D1. -.0331748 .0029741 -11.15 0.000 -.0390079 -.0273417

t09
D1. -.0228282 .0028729 -7.95 0.000 -.0284627 -.0171936 24
Comparaison des estimateurs
• global xvar eleve_clas pCOL_xt anc_moy t00 t01 t02 t03 t04
t05 t06 t07 t08 t09
• quietly regress trCOL $xvar, vce(cluster id)
• estimates store MCO
• quietly xtreg trCOL $xvar, be
• estimates store BE
• quietly xtreg trCOL $xvar, re vce(robust)
• estimates store RE
• quietly xtreg trCOL $xvar, fe vce(robust)
• estimates store FE
• estimates table MCO BE RE FE, b(%9.4f) se stats(N)
25
Comparaison des estimateurs
Variable MCO BE RE FE

eleve_clas 0.0014 0.0018 0.0005 0.0000


0.0002 0.0002 0.0001 0.0002
pCOL_xt -0.0752 -0.0839 -0.0249 -0.0159
0.0092 0.0098 0.0053 0.0054
anc_moy 0.0019 0.0025 0.0010 0.0002
0.0001 0.0002 0.0001 0.0002
t00 0.0007 0.1269 0.0014 0.0018
0.0017 0.0359 0.0016 0.0016
t01 0.0045 -0.0098 0.0070 0.0085
0.0020 0.0250 0.0019 0.0019
t02 -0.0026 -0.0302 0.0022 0.0047
0.0020 0.0271 0.0019 0.0019
t03 -0.0083 0.2477 -0.0036 -0.0011
0.0021 0.0353 0.0020 0.0020
t04 -0.0198 0.0578 -0.0132 -0.0088
0.0020 0.0300 0.0019 0.0020
t05 -0.0245 -0.0193 -0.0190 -0.0151
0.0021 0.0256 0.0020 0.0021
t06 -0.0287 0.0539 -0.0230 -0.0189
0.0022 0.0261 0.0020 0.0021
t07 -0.0319 0.0479 -0.0252 -0.0201
0.0023 0.0234 0.0021 0.0023
t08 -0.0407 0.0031 -0.0349 -0.0295
0.0023 0.0213 0.0022 0.0024
t09 -0.0318 0.0422 -0.0247 -0.0188
0.0022 0.0195 0.0020 0.0022
_cons 0.1524 0.0620 0.1552 0.1783
0.0067 0.0207 0.0051 0.0059

N 15863 15863 15863 15863


26
legend: b/se

Vous aimerez peut-être aussi