Académique Documents
Professionnel Documents
Culture Documents
Sminaire Mthodologique
Christophe HURLIN
LEconomtrie des Donnes de Panel 2
Figure 0.1:
Prsentation
Le but de ce sminaire est de proposer une initiation, tant sur le plan thorique
que sur le plan appliqu, lconomtrie des donnes de panel. Sur le plan thorique,
le sminaire dbutera par une prsentation des problmes de spcications de base en
conomtrie de panel et par les mthodes destimation traditionnelles. Cette premire
partie insistera en particulier sur les stratgies de tests de spcication du modle. La
seconde partie du sminaire sera consacre ltude des panels dynamiques et pro-
posera une introduction aux concepts de non stationnarit stochastique en panel et
notamment la spcication des tests de non stationnarit et de cointgration. Ces
concepts thoriques seront appliqus direntes problmatiques conomiques, comme
par exemple la problmatique de la convergence des PIB par tte, que ce soit au travers
de commentaires de travaux empiriques ou par la programmation dexemples illustratifs
sous un logiciel dconomtrie (TSP ou SAS prciser)
LEconomtrie des Donnes de Panel 3
Introduction 2
Annexes 62
A.1. Equivalence entre les estimateurs Within et pooled : = 1 62
A.2. Programme TSP : Modle MFR 63
Bibliographie 67
LEconomtrie des Donnes de Panel 5
Chapitre I
Introduction
Dans ce premier chapitre, nous nous restreindrons ltude des modles linaires sim-
ples sur donnes de panel, ces derniers tant dnis par opposition aux modles dy-
namiques faisant intervenir des variables endognes retardes. Dans toute la suite de ce
chapitre, on considre des processus strictement stationnaires au sens de la stationnarit
du second ordre1 .
Lobjectif des cinq premires sections de ce chapitre est de faire en sorte que le
lecteur puisse interprter, de faon exhaustive et relativement approfondie, les rsultats
de base que donnent les principaux logiciels dconomtrie lorsque lon envisage des
modles de panel. Nous prendrons ici comme rfrence le logiciel TSP 4.3, mais il
est bien entendu vident que ces rsultats de base sont sensiblement identiques si lon
considre dautres logiciels comme Eviews, SAS ou Rats.
Quelles sont les connaissances minimales ncessaires lconomtre appliqu pour
pouvoir interprter un tableau de rsultats destimation de panel ? Prenons comme
exemple la commande panel de TSP. A lissue de cette procdure, lutilisateur dispose
des ralisations des estimateurs Pooled, Between, des estimateurs du modle eets
individuels xes (Within), du modle eets individuels alatoires (Error Component
Model ), des rsultats de trois tests de Fischer, dun estimateur de la variance des
eets individuels, dun estimateur de la variance totale, de lestimateur dun paramtre
de pondration et de la statistique du test dHausman. Voil ainsi rsums tous les
lements que nous nous proposons dtudier tout au long des cinq premires sections.
Ainsi, la premire section est consacre aux tests de spcication qui correspondent
en fait aux trois tests de Fischer du chier de rsultat des estimations TSP. Il sagit ici de
dterminer la manire dont doit tre spci un modle de panel, si tant que lhypothse
de panel puisse tre accepte. Nous verrons alors que toute lanalyse repose alors
sur la notion dhomognit des paramtres du modle envisag. Les tests prsents
visent ainsi porter un diagnostic sur lventuelle ncessit dintgrer une dimension
htrogne et sur la manire dont cette htrognit doit tre spcie. Une des
manires simples pour ne pas supposer lexistence dun modle totalement identique
consiste ainsi introduire des eets individuels sous la forme de constantes spciques,
propres chaque individu du panel. Nous proposerons ainsi une procdure gnrale de
tests de spcication des modles linaires simples.
1
La dnition de la stationnarit fera lobjet du chapitre suivant.
LEconomtrie des Donnes de Panel 7
Enn, la cinquime section sera consacre aux tests de spcication des eets indi-
viduels. La question est alors de savoir quel modle, parmi les modles eets alatoires
et eets xes, doit tre retenu. Ceci nous conduira prsenter le test dHausman (1978)
qui constitue le test standard de spcication des eets individuels.
Lorsque lon considre un chantillon de donnes de panel, la toute premire chose quil
convient de vrier est la spcication homogne ou htrogne du processus gnrateur
de donnes. Sur le plan conomtrique, cela revient tester lgalit des coecients
du modle tudi dans la dimension individuelle. Sur le plan conomique, les tests
de spcication reviennent dterminer si lon est en droit de supposer que le modle
thorique tudi est parfaitement identique pour tous les pays, ou au contraire sil existe
des spcicits propres chaque pays.
Nous commencerons par prsenter un petit exemple illustratif construit partir
dune fonction de production agrge. Dans une seconde section, nous gnraliserons
la procdure de tests de spcication en introduisant les notions de variances intra-
classes (Within) et inter-classes (Between). Enn, nous proposerons une application
de ces tests de spcication lestimation dune relation entre le nombre de grves et
un ensemble de variables explicatives.
Prenons lexemple dune fonction de production. Supposons que lon dispose dun
chantillon de donnes de P IB et de facteurs (travail et capital) sur une dure de T
priodes pour un ensemble de N pays. Si lon note yi;t le logarithme du P IB, ki;t le
logarithme du stock de capital priv et ni;t le logarithme de lemploi et que lon suppose
une fonction de production de type Cobb Douglass, le modle gnral scrit sous la
forme 8 i 2 [1; N] ; 8 t 2 [1; T ] :
Les innovations "i;t sont supposes tre i:i:d: de moyenne nulle et de variance gale
2" ; 8 i 2 [1; N] :
Toutefois, lorsque lon travaille sur des sries agrgs, il est relativement peu prob-
able que la fonction de production macroconomique soit strictement identique pour
tous les pays tudis. Si lhypothse dhomognit totale est rejete, il convient alors
de tester si les lasticits des dirents facteurs sont identiques. Si ce nest pas le cas, il
nexiste a priori aucune structure de production commune entre les pays. Dans ce cas,
lutilisation des donnes de panel ne se justie pas et peut mme conduire des biais
destimation. On doit donc estimer les fonctions de production pays par pays.
Si en revanche, il savre quil existe bien une relation identique entre la production
et les facteurs pour tous les pays, la source dhtrognit du modle peut alors provenir
des constantes i : Dans notre exemple, ces constantes reprsentent la moyenne de la
productivit totale des facteurs de production (rsidu de Solow). Or, rien ne garan-
tit que les pays tudis possdent le mme niveau de productivit structurelle. Au
contraire, il se peut parfaitement que des facteurs a-temporels ou structurels, comme la
position gographique, le climat, lloignement par rapport au grands axes commerciaux
etc... aient pu conduire des dirences structurelles de niveau de productivit entre
les pays. Il convient donc de tester lhypothse dune constante commune tous les
pays. Si cette hypothse est rejete, on obtient alors un modle avec eets individuels
qui scrit sous la forme :
Dans ce cas, le niveau moyen de la productivit totale des facteurs, dtermin par
E (i + "i;t ) = i ; varie selon les pays, mme si la structure de production (les lasticits
des deux facteurs travail et capital) est identique.
Cet exemple, que nous allons prsent gnraliser, montre bien que la phase de
test de spcication revient dterminer si le processus gnrateur de donnes peut
tre considr comme homogne, cest dire unique pour tous les individus, ou si au
contraire il apparat totalement htrogne, auquel cas lutilisation des techniques de
panel ne peut se justier. Entre ces deux cas extrmes, il convient de prcisment
identier la source dhtrognit pour bien spcier le modle.
LEconomtrie des Donnes de Panel 10
Les innovations "i;t sont supposes tre i:i:d: de moyenne nulle et de variance gale
2" ;
8 i 2 [1; N] : Ainsi on suppose que les paramtres i et i du modle (1.1) peuvent
direr dans la dimension individuelle2 , mais lon suppose quils sont constants dans le
temps.
TestH01 : i = i = i [1, N]
2 2
H0 rejete H0 vraie
Dans une premire tape, on teste lhypothse dune structure parfaitement ho-
mogne (constantes et coecients identiques) :
H01 : i = i = 8 i 2 [1; N]
Si en revanche, on rejette lhypothse nulle, on passe une seconde tape qui consiste
dterminer si lhtrognit provient des coecients i .
3
Dans notre modle, chaque vecteur i comprend K paramtres. Pour les N individus du panel, on
obtient KN paramtres. Lgalit des N vecteurs i revient donc imposer KN K restrictions. De
la mme faon, lgalit des N constantes revient imposer N 1 restrictions. Au total, lhypothse
H01 revient imposer (K + 1) (N 1) restrictions linaires.
LEconomtrie des Donnes de Panel 12
La seconde tape consiste tester lgalit pour tous les individus des K com-
posantes des vecteurs i .
H02 : i = 8 i 2 [1; N]
Sous lhypothse nulle, on nimpose ici aucune restriction sur les constantes indi-
viduelles i : De la mme faon, on construit une statistique de Fischer pour tester
ces (N 1) K restrictions linaires. Toujours sous lhypothse dindpendance et de
normalit des rsidus, cette statistique suit une loi de Fischer avec (N 1) K et NT
N (K + 1) degrs de libert. Si lon rejette lhypothse nulle H20 dhomognit des coef-
cients i , on rejette alors la structure de panel, puisque au mieux seules les constantes
i peuvent tre identiques entre les individus :
On estime alors les paramtres vectoriels i en utilisant les modles dirents pays
par pays. Si en revanche, on accepte lhypothse nulle H20 dhomognit des coecients
i ; on retient la structure de panel et lon cherche alors dterminer dans une troisime
tape si les constantes i ont une dimension individuelle.
H03 : i = 8 i 2 [1; N]
Dans le cas o lon accepte lhypothse nulle H30 , on retrouve alors une structure de
panel totalement homogne (modle pooled). Le test H30 ne sert alors qu conrmer
ou inrmer les conclusions du tests H10 ; tant donn que le fait de rduire le nombre de
restrictions linaires permet daccrotre la puissance du test du Fischer.
LEconomtrie des Donnes de Panel 13
Nous allons prsent, prsenter les mthodes de construction des dirents tests de
Fischer utiliss dans cette procdure. On considre le modle (1.1) et lon suppose que
les rsidus "i;t sont indpendamment distribus dans les dimensions i et t; suivant une
loi normale desprance nulle et de variance nie 2" . On suppose que la variance 2" est
connue.
H01 : i = i = 8 i 2 [1; N]
H01 : i = i = 8 i 2 [1; N]
(K;1)
Les estimateurs bi et
b i des paramtres individuels sont obtenus quation par qua-
tion pour chaque individu. Soit SCR1;i la somme des carrs des rsidus obtenue pour
LEconomtrie des Donnes de Panel 14
chaque quation. La somme des carrs des rsidus du modle (1.1) non contraint est
alors tout simplement dnie comme la somme des N somme des carrs des rsidus
obtenues pour les N quations individuelles.
N
X N h
X i
0 1
SCR1 = SCR1;i = Syy;i Sxy;i Sxx;i Sxy;i (1.7)
i=1 i=1
T
X
Sxx;i = (xi;t xi ) (xi;t xi )0 (1.9)
t=1
T
X
Sxy;i = (xi;t xi ) (yi;t y i )0 (1.10)
t=1
Les moyennes xi et yi sont dnies, pour chaque individu, dans la dimension tem-
porelle de faon traditionnelle par 8 i 2 [1; N] :
T
1X
xi = xi;t
T t=1
T
1X
yi = yi;t
T t=1
Lexpression de SCR1 fait ainsi apparatre la somme des variances individuelles
des rsidus obtenues partir des N rgressions individuelles. Lexpression Syy;i
0 1
Sxy;i Sxx;i Sxy;i correspond ainsi ( une transforme linaire prs) la variance intra-
groupe (Within variance) des rsidus.
N X
X T
Sxx;i = (xi;t xi ) (xi;t xi )0 (1.14)
i=1 t=1
N X
X T
Sxy;i = (xi;t xi ) (yi;t y i )0 (1.15)
i=1 t=1
Les moyennes x et y sont alors dnies sur lensemble des T N observations :
N T
1 XX
x= xi;t
NT t=1
i=1
N T
1 XX
y= yi;t
NT t=1 i=1
Lexpression SCR1;c correspond une transforme de la variance totale des rsidus
(total variance) obtenus partir de lestimation dun modle unique sur les NT donnes
empiles.
La somme des carrs des rsidus du modle non contraint, SCR1 ; est donne par
lquation (1.7). Sous lhypothse H02 ; la somme des carrs des rsidus dans le modle
eets individuels est donne par :
N
N !0 N !1 N !
X X X X
SCR1;c0 = Syy;i Sxy;i Sxx;i Sxy;i (1.17)
i=1 i=1 i=1 i=1
o les sommes Sk;i ont t dnies par les quations (1.8), (1.9) et (1.10). Cette criture
signie que dans le modle eets individuels, les estimateurs (Within) des paramtres
i et i sont obtenus en centrant les variables sur leurs moyennes individuelles respec-
tives. Nous reviendrons par la suite sur cette proprit.
H03 : i = 8 i 2 [1; N]
Les sommes des carrs des rsidus SCR1;c0 et SCR1;c ont t respectivement dnies
par les quations (1.17) et (1.12).
Il est en outre possible de tester la constance dans le temps des dirents paramtres
du panel suivant une procdure sensiblement identique (voir Hsiao 1986). Mais cette
problmatique relve plus de la notion traditionnelle de stabilit des coecients dans le
temps que de la pure application des techniques conomtriques de donnes de panel.
LEconomtrie des Donnes de Panel 17
1.3. Application
load(file=strikes.wks);
panel (id=i,time=t,byid) srt u p;
La premire ligne du programme sert tout simplement lire les donnes du chier
strike.wks. La seconde ligne du programme permet dobtenir lensemble des estima-
teurs de base (pooled, between, eets xes et eets alatoires) ainsi que les rsultats
des principaux tests de spcication (tests dhomognit et test dHausman). Loption
id = i indique le nom de lindicatrice pays et loption time = t indique le nom de lindi-
catrice temporelle. Loption byid est ncessaire pour acher lensemble des rsultats
des tests de spcication6 . Les variables sont respectivement nommes srt , u et p.
Sur la gure (1.2) sont reports les rsultats destimation de cette procdure TSP.
Nous allons nous concentrer plus particulirement sur lanalyse des rsultats des tests
dhomognit. TSP propose, avec loption byid, les trois tests de Fischer prsents
prcdemment.
On observe tout dabord le panel est cylindr (balanced), cest dire quil comporte
le mme nombre de points dans la dimension temporelle pour tous les individus. On
a ici N = 17 et T = 35; soit 595 observations. Commenons tout dabord par le test
4
Les donnes ont t collectes par Bruce Western et proviennent du site
http://lib.stat.cmu.edu/datasets/
5
Le panel comporte initialement 18 pays, mais pour le pays 3, les donnes ne sont disponibles que
jusquen 1980. Cest pourquoi an de travailler sur un panel cylindr nous avons choisi de retirer ce
pays de notre chantillon.
6
Pour plus de dtails sur linstruction panel sous TSP, se reporter au manuel de programmation du
logiciel.
LEconomtrie des Donnes de Panel 18
de lhypothse dhomognit totale (test H01 dans nos notations). Ce dernier est not
sous la forme F test of A; B = Ai ; Bi dans le chier rsultat de TSP. La lettre A
dsigne ici les constantes, tandis que la lettre B dsigne le vecteur des coecients des
variables explicatives. Dans le cadre de notre chantillon, la ralisation de la statistique
de Fischer associe au test H01 , note F1 ; est de 3:8320. Le logiciel indique en outre le
nombre de degr de libert de cette statistique. Nous avons vu prcdemment que F1
suivait un Fischer avec (N 1) (K + 1) et NT N (K + 1) degrs de libert. Compte
tenu des dimensions de notre panel et du nombre de variables explicatives (K = 2),
on doit donc comparer la valeur de cette ralisation au seuil dun Fischer F (48; 544) :
Le logiciel nous donne directement la pvalue associe ce test. En loccurrence ici,
cette pvalue est trs largement infrieure au seuil de 5%, donc pour ce seuil, on rejette
lhypothse nulle H0 dgalit des constantes i et des coecients i et i :
Reste enn tester lhypothse H03 de constantes individuelles i : Ce test est not
sous la forme F test of Ai ; B = Ai ; B dans le chier rsultat de TSP. Dans le cadre
de notre chantillon, la ralisation de la statistique de Fischer associe au test H03 ,
note F3 ; est de 9:0342. Cette valeur est comparer au seuil dun Fischer avec N 1
et N (T 1) K degrs de libert , cest dire ici un F (16; 576) : La pvalue est trs
largement infrieure au seuil de 5%. Pour ce seuil, on rejette lhypothse nulle H0
dgalit des constantes i : Il est ncessaire dintroduire ici des eets individuels. La
spcication nale de notre modle est donc :
Reste prsent tudier les direntes mthodes destimation des modles incluant
des constantes individuelles.
LEconomtrie des Donnes de Panel 20
Nous allons prsent nous des modles de panel htrognes, o la seule source
dhtrognit provient des constantes individuelles. On suppose ainsi que les coe-
cients des direntes variables stochastiques explicatives sont identiques pour tous les
individus du panel ( i = ). On suppose en outre que ces coecients sont des con-
stantes dterministes. Les constantes individuelles i ; quant elles, dirent selon les
individus.
1. Empilement par individus : pour une variable donne, les T ralisations his-
toriques de chaque individu sont stockes dans un vecteur colonne, et les N
vecteurs colonnes ainsi obtenus sont ensuite empils la suite des uns des autres
dans lordre des individus.
LEconomtrie des Donnes de Panel 21
2. Empilement par dates : pour une variable donne, les N ralisations individuelles
pour une date donne sont stockes dans un vecteur colonne, et les T vecteurs
colonnes ainsi obtenus pour toutes les dates sont ensuite empils la suite des
uns des autres.
Il est trs important de noter que les principaux logiciels dconomtrie (notamment
TSP) optent gnralement pour une mthode dempilement par pays. Si le logiciel
nempile pas lui mme les donnes, les sries utilises dans le cadre des applications
doivent, de faon imprative, tre ordonnes sous la forme prconise par les concepteurs
du logiciel.
Denition 2.1. Dans le cas de lempilement par pays, pour chaque individu 8i 2
[1; N] ; le modle (2.1) peut scrire sous la forme :
Cest principalement cette expression du modle (2.1) que lon utilisera par la suite
pour tudier les estimateurs du modle linaire simple. On peut toutefois crire le
modle de faon totalement vectorielle en empilant les vecteurs yi et les matrices Xi :
Pour cela on pose :
0 1 0 1 0 1
y1 X1 "1
B y2 C B X2 C B "2 C
Y =B @
C
A X =B @
C
A " =B C
(T N;1) ::: (T N;K) ::: (T N;1) @ ::: A
yN XN "N
LEconomtrie des Donnes de Panel 22
Y = ee
e + X + " (2.3)
2.1.1. Exemple
Considrons un panel de 2 pays (N = 2), dont les donnes annuelles sont disponibles
sur 3 ans (T = 3). On cherche estimer une fonction de production log-linaire (Cobb-
Douglass), suppose commune ces deux pays. Soit yi;t le logarithme du P IB, ki;t le
logarithme du stock de capital priv et ni;t le logarithme de lemploi. On suppose que
cette fonction de production scrit sous la forme :
() yi = ei + Xi + "i 8 i = 1; ::; N
() Y = ee
e + X + "
LEconomtrie des Donnes de Panel 23
Denition 2.2. Dans le cas de lempilement par dates, pour chaque date t 2 [1; T ] ;
le modle (2.1) peut scrire sous la forme :
e + Xt + "t
yt = 8 t = 1; ::; T (2.4)
De la mme faon, il est possible dexprimer le modle (2.1) sous une forme vecto-
rielle complte. On pose :
0 1 0 1 0 1
y1 X1 "1
B y2 C B X2 C B "2 C
Y =B @ ::: A
C X =B @ :::
C
A " =B C
(T N;1) (T N;K) (T N;1) @ ::: A
yT XT "T
Il vient alors :
Y =e
ee
e + X + " (2.5)
2.2.1. Exemple
Reprenons lexemple prsent prcdemment. Lorsque les donnes sont empiles par
dates, ce modle scrit sous forme vectorielle de la faon suivante :
y1;t 1 k1;t n1;t k "1;t
= + +
y2;t 2 k2;t n2;t n "2;t
() yt =
e + Xt + "t 8 t = 1; ::; T
LEconomtrie des Donnes de Panel 24
() Y = e
ee
e + X + "
Maintenant que nous avons prsent lcriture vectorielle des modles de panel
eets individuels, nous allons prsent tudier les proprits des estimateurs des
paramtres de ces modles suivant la spcication des eets individuels. Nous dis-
tinguerons pour cela deux cas : le cas des eets xes et le cas des eets alatoires.
LEconomtrie des Donnes de Panel 25
On fait maintenant lhypothse que les eets individuels i sont reprsents par des
constantes (do lappellation modle eets xes). Nous allons dterminer la forme
gnrale des estimateurs des paramtres i et dans ce modle eets xes. On
considre donc le modle (1.1) sous lhypothse (H1) :
Pour tudier les proprits des estimateurs du modle eets xes, nous allons
faire une hypothse supplmentaire sur la nature du processus des rsidus "i;t : Cette
hypothse constitue tout simplement la gnralisation dans la dimension de panel de
la dnition dun bruit blanc.
Hypothse (H2) On suppose que les rsidus "i;t sont i:i:d: et satisfont les conditions
suivantes, 8 i 2 [1; N] ; 8 t 2 [1; T ]
E ("i;t ) = 0
2" t=s
E ("i;t "i;s ) = ; ce qui implique que E ("i "0i ) = 2" IT o It dsigne
0 8t 6= s
la matrice identit (T; T ) :
E ("i;t "j;s ) = 0; 8j 6= i; 8 (t; s)
La premire condition impose tout simplement que lesprance des rsidus du mod-
le (3.1) soit nulle. La seconde condition, standard en conomtrie des sries tem-
porelles, impose que le processus "i;t soit un processus sans mmoire (dans la di-
mension temporelle). Pour chaque individu, il nexiste ainsi aucune corrlation entre
le niveau prsent du processus "i;t et les ralisations passes. Seule la variance du
processus "i;t est non nulle. Lintroduction dune dimension individuelle, nous oblige
ici dnir une seconde contrainte qui est que tous les processus individuels "i;t ont
la mme variance 2" quel que soit lindividu considr. Autrement dit, la matrice de
variance covariance du processus "i est proportionnelle, un scalaire prs, la matrice
identit. Enn, la troisime condition stipule quil nexiste aucune corrlation entre
les processus dinnovation pour deux individus distincts et cela quelle que soit la date
considre.
LEconomtrie des Donnes de Panel 26
On peut dmontrer que sous lhypothse (H2), lestimateur des Moindres Carrs
Ordinaires (MCO) des paramtres i et du modle (3.2) est le meilleur estimateur
linaire sans biais (BLUE 7 ). Si lon suppose que " est connu, cet estimateur est
obtenu en minimisant la variance des rsidus empiriques, note S; par rapport aux
seuls paramtres i et :
N
X N
X
min S= "0i "i = (yi ei Xi )0 (yi ei Xi )
fi ;gN
i=1 i=1 i=1
7
Best Linear Unbiased Estimator
LEconomtrie des Donnes de Panel 27
Les ralisations des estimateurs des constantes i sont alors dduits de la relation :
0
b i = y i b xi
En eet, on voit daprs lquation (3.5), que lestimateur W ithin des coecients
de peut tre obtenu en centrant les direntes (variables endogne et exognes) sur
les moyennes individuelles respectives. Ainsi, on peut obtenir le mme estimateur en
utilisant le modle transform suivant 8 i 2 [1; N] ; 8 t 2 [1; T ] :
yei;t = 0 x
ei;t + "i;t
Le fait quil soit quivalent destimer les paramtres du modle (3.2) directement
partir de cette spcication incluant des dummies individuelles ou partir dun modle
transform o les variables sont centres sur leurs moyennes individuelles respectives
est particulirement important. Cela illustre la notion de variance intra-classes qui
est fondamentale dans la construction de lestimateur Within. Nous allons prsent,
proposer une illustration de cette proprit de lestimateur W ithin:
LEconomtrie des Donnes de Panel 28
3.2. Application
o si;t dsigne le nombre de jours chms pour cause de grve, pour 1000 salaris
du secteur industriel, ui;t dsigne le taux de chmage de lconomie et pi;t le taux
dination. On suppose que lon peut spcier les eets individuels i sous la forme
deets xes. Dans le programme ci-dessous, on cherche comparer lestimateur Within
et lestimateur des MCO du modle transform :
Linstruction panel de TSP avec les options notot, nobet et novar permet dobtenir
directement et uniquement les rsultats de lestimation W ithin: Pour construire les es-
timateurs du modle transform, on doit au pralable centrer les variables sur leur
moyennes individuelles respectives. Pour raliser cette opration on construit une
boucle sur les N = 17 individus, avec un compteur j et chaque tape on slectionne
un pays dont le code pays (variable i) est gal la valeur du compteur j (instruc-
tion select i = j). Pour le sous chantillon slectionn, linstruction msd [Nom de
la Variable] permet alors de calculer dirents moments de la variable considre sans
les acher (si lon ajoute loption noprint). En particulier, la moyenne empirique est
stocke dans la variable rserve @mean. Ds lors, pour chaque individu, on construit
de nouvelles variables en centrant sur les moyennes individuelles correspondantes. En-
n, il ne reste plus qu eectuer la rgression par les MCO sur le modle transform
(instruction ls ou ols)
load(file=strikes.wks);
?---- Estimation Within ----
panel (id=i,time=t,notot,nobet,novar) srt u p;
?---- Centrer les Donnes ---
do j=1 to 17;
select (i=j);
msd(noprint) srt;
srtc=srt-@mean;
msd(noprint) u;
uc=u-@mean;
msd(noprint) p;
LEconomtrie des Donnes de Panel 29
pc=p-@mean;
enddo;
?---- Estimation Modle Transform----
ls srtc uc pc;
?---- Affichage des Effets Fixes (Instruction Panel) ----
print @fixed;
Les rsultats de ce programme sont reproduits sur la gure (3.1). On vrie que
lestimateur W ithin est totalement quivalent lestimateur des MCO appliqu sur
un modle transform o les variables endognes et exognes ont t centres sur leurs
moyennes individuelles respectives. Dans les deux cas, les ralisations des estimateurs
des coecients des deux variables explicatives (respectivement ui;t et pi;t ) sont stricte-
ment identiques (respectivement 21:5968 et 16:2729).
Dans le cas o lon utilise la commande panel de TSP, on peut acher les esti-
mations des eets xes en utilisant la commande print @fixed. Dans le cas o lon
utilise le modle transform, il convient alors de reconstruire les estimateurs des ef-
fets xes selon la formule (3.3) en utilisant les moyennes individuelles des variables
(cf. programme ci-dessus) et les ralisations des estimateurs des coecients et .
Essayons prsent de commenter les estimations ainsi obtenues. Il savre ainsi que
le pays 9 a, de faon structurelle, le plus de journes chmes pour cause de grve.
Pour ce pays, dirents facteurs historiques (lgislation sur le droit de grve) ou soci-
ologique (reprsentation des syndicats par exemple) expliquent que toutes choses gales
par ailleurs (chmage et ination), la frquence des grve soit particulirement lve.
A linverse, les pays 15 et 2 ont des eets xes ngatifs. Pour un mme niveau de ch-
mage et dination, ces deux pays auront le nombre de jours chms le plus faible de
tout notre chantillon. Il faut bien comprendre que les estimations des eets individu-
els ne peuvent sanalyser quen niveau relatif (cest dire en comparant les direntes
ralisations individuelles) et non en niveau absolu.
LEconomtrie des Donnes de Panel 30
Figure 3.1: Comparaison des Estimateurs Whithin et OLS sur Modle Transform
LEconomtrie des Donnes de Panel 31
Nous allons prsent introduire un oprateur matriciel qui permet de centrer les
variables sur leurs moyennes individuelles respectives.
Denition 3.2. Le modle (3.9) eet individuels xes peut scrire sous la forme
vectorielle suivante 8 i = 1; ::; N :
En eet, on peut montrer que les processus transforms Qyi et QXi correspondent
aux variables centres sur leurs moyennes respectives. En eet, on montre que :
0 1 0 1
yi;1 ! 1
XT
1 1 0 B yi;2 C B 1 C
Qyi = IT ee0 yi = yi e e yi = B C 1 yi;t B C
T T @ ::: A T t=1 @ ::: A
yi;T 1
En appliquant les MCO cette expression on obtient donc une criture quivalente
b
de LSDV :
"N #1 " N #
X X
b LSDV = 0
X QXi 0
X Qyi (3.12)
i i
i=1 i=1
LEconomtrie des Donnes de Panel 33
Ds lors le rsidu, not "i;t ; dun modle de panel peut tre dcompos en trois
principales composantes de la faon suivante (Hsiao 1986) 8 i 2 [1; N] ; 8 t 2 [1; T ] :
Les variables i dsignent ici les eets individuels qui reprsentent lensemble des
spcicits structurelles ou a-temporelles de la variable endogne, qui dirent selon
les individus. On suppose ici que ces eets sont alatoires. Les variables alatoires
t reprsentent quant elle les eets temporels strictement identiques pour tous les
individus. Enn, le processus stochastique vi;t dsigne la composante du rsidu total "i;t
orthogonale aux eets individuels et aux eets temporels. Gnralement, on est conduit
faire un certain nombre dhypothses techniques sur cette structure de rsidus.
Hypothses (H3) On suppose que les rsidus "i;t = i +t +vi;t sont i:i:d: et satisfont
les conditions suivantes, 8 i 2 [1; N] ; 8 t 2 [1; T ]
E (i ) = E (t ) = E (vi;t ) = 0
E (i t ) = E (t2vi;t ) = E (i vi;t ) = 0
i=j
E (i j ) =
0 8i 6= j
2
t=s
E (t s ) =
0 8t 6= s
2
v t = s; i = j
E (vi;t vj;s ) =
0 8t
6= s; 8i 6= j
E i x0i;t = E t x0i;t = E vi;t x0i;t = 0
LEconomtrie des Donnes de Panel 34
Dans une premire tape, nous allons prsenter le modle simple eets individuels
alatoires. Nous supposerons ainsi, pour simplier lanalyse, quil nexiste pas deet
temporel. Nous proposerons alors une criture vectorielle du modle eets alatoires.
Dans une seconde tape nous tudierons les estimateurs des dirents coecients de ce
modle.
V Ve = 2 ee0 Ve + 2v Ve = IT () 2v Ve = IT 2 ee0 Ve
8
Pour une dmonstration plus lgante voir Graybill (1969), Nerlove (1971), Wallace et Hussain
(1969)
LEconomtrie des Donnes de Panel 35
ee0 Ve V = ee0 V
= ee0 2 ee0 + 2v IT
= 2 e e0 e e0 + 2v ee0
On obtient ainsi :
0e 1
ee V = ee0
T + 2v
2
Ainsi, linverse de la matrice de variance covariance des "i scrit sous la forme :
1 1 2
V = 2 IT ee0
v 2v + T 2
Nous allons prsent nous intresser aux proprits des estimateurs du modle ala-
toire. Pour bien comprendre ces proprits, il est ncessaire de bien apprhender les
consquences de la structure des rsidus.
LEconomtrie des Donnes de Panel 36
Remark 1. Dans le modle de la proposition (4.1), le fait que les eets individuels
i constituent lune des composantes des rsidus "i du modle (4.4), induit une cor-
rlation entre le niveau de ces rsidus lorsque lon considre un individu donn. En
revanche, sous (H3 ), il nexiste pas de corrlation de ces rsidus dans la dimension
inter individuelle.
Quelles sont alors les consquences de cette structure des rsidus ? Si lon raisonne
en termes de biais destimation, il ny en a aucune ds lors que lon centre les variables du
modle sur leur moyenne respective. En eet, dans ce cas la composante individuelle des
rsidus disparat et les corrlations inter-individuels des rsidus du modle transform
disparaissent par la mme occasion. Pour le vecteur ; on retrouve alors la forme
gnrale de lestimateur du modle eets xes. Pour preuve, appliquons loprateur
Q au modle eet alatoire :
Dans ce modle, sous (H3 ), lestimateur bLSDV du vecteur est non biais et
convergent 9 . Lestimateur de la constante est alors construit sous la forme :
0
b = y b LSDV x
(4.8)
avec :
N T N T
1 XX 1 XX
yi = yi;t x = xi;t (4.9)
(1;1) NT t=1
(K;1) NT t=1
i=1 i=1
Ainsi, il nexiste pas de problme de biais lorsque lon envisage les techniques des-
timation utilises dans les modles eets xes, cest dire lorsque lon centre les
variables sur leurs moyennes individuelles respectives. Toutefois, lestimateur bLSDV
ainsi obtenu nest pas un estimateur variance minimale : cest pas lestimateur BLUE:
o lindice p dsigne la convergence en probabilit (voir section prcdente pour une dmonstration).
LEconomtrie des Donnes de Panel 37
Nous ne donnerons pas ici de dmonstration de cette proprit. Si lon rsume, quelle
que soit la nature des eets individuels (xes ou alatoires), lestimateur Within est un
estimateur sans biais et convergent. Toutefois, cette estimateur nest pas un estimateur
variance minimale lorsque les eets individuels sont alatoires. Un estimateur BLUE
possible du vecteur est alors donn par lestimateur de Moindres Carrs Gnraliss
(MCG). Cette proprit sera particulirement intressante lorsquil sera ncessaire de
discriminer les deux modles et de construire les tests de spcication appropris (test
dHausman 1978, en particulier).
Nous avons vu que dans un modle eets alatoires, un estimateur BLUE peut tre
construit partir de lestimateur des Moindres Carrs Gnraliss (MCG). Considrons
le modle vectoriel de la proposition (4.1) :
e i + "i
yi = X 8 i = 1; ::; N (4.10)
ei = (e; Xi ) et 0 = ; 0 : Soit V la matrice de variance covariance
avec "i = i e+vi ; X
du vecteur des rsidus "i : V = E ("i "0i ) : On suppose, dans un premier temps, que V
est connue. Le problme est que, du fait de la structure du modle, la matrice V nest
pas diagonale en raison de la prsence de corrlations intra-individuelles des rsidus.
Tout comme en sries temporelles, cest pourquoi on applique alors les MCG.
Denition 4.3. Si la matrice V est connue, lestimateur des MCG du vecteur ; not
bMCG ; est alors dni par la relation :
"N #1 " N #
X X
bMCG =
ei0 V 1 X
X ei ei0 V 1 yi
X (4.11)
i=1 i=1
Il existe une autre faon dobtenir lestimateur des MCG. En eet, dans la pratique,
la procdure en deux tapes, utilise dans les principaux logiciels dconomtrie, nest
LEconomtrie des Donnes de Panel 38
pas exactement similaire celle que nous venons de dcrire10 . Lestimateur des MCG
est construit partir dune relation existant entre cet estimateur et les estimateurs
Between et Within (Maddala 1971).
Sous les hypothses (H3 ), nous avons vu (proposition 4.1) que linverse de la matrice
de variance covariance V pouvait scrire sous la forme :
1 2
V 1 = 2 IT ee0
v 2v + T 2
Denition 4.4. On pose que la matrice V 1 peut tre exprime sous la forme alter-
native suivante :
1 1
V 1 = 2 Q + ee0 (4.12)
v T
avec Q = (IT ee0 =T ) et o le paramtre est dni par la relation :
2v
= (4.13)
2v + T 2
Reprenons alors lexpression de lestimateur des MCG (4.11) et substituons cette
nouvelle expression de V 1 : On obtient alors :
"N #1 "X #
X 1
N
1
bMCG =
ei0 Q + ee0 X
X ei ei0 Q + ee0 yi
X
T T
i=1 i=1
"N N
#1 " N N
#
X 1 X X 1 X
() bMCG = Xei0 QX
ei + ei0 ee0 X
X ei ei0 Qyi +
X ei0 ee0 yi
X
T T
i=1 i=1 i=1 i=1
Sachant que X ei = (e Xi ) et = ; on peut montrer que ces dirents termes
0 0
Denition 4.5. Lestimateur inter-classe Between, est lestimateur des Moindres Car-
rs Ordinaires obtenu dans la spcication 8 i 2 [1; N] :
y i = c + 0 xi + "i (4.15)
Proposition 4.6. Sous les hypothses (H3 ), lestimateur des MCG des coecients
du modle eets alatoires, not bMCG ; est une moyenne pondre des estimateurs
Between b BE et Within bLSDV :
On peut montrer que si le paramtre est gal 1, lestimateur des MCG corre-
spond exactement lestimateur des MCO du modle pooled ( voir annexe A.1). Dans
le cas, o = 0, lestimateur des MCG correspond lestimateur du modle eets
xes : "N #1 " N #
X X
b MCG = bLSDV = Xi0 QXi Xi0 Qyi
i=1 i=1
bMCG ! bLSDV
T !1
On constate ainsi, que lorsque 2 ]0; 1[, la structure avec eets individuels ala-
toires constitue une solution intermdiaire entre le modle sans eet individuel (totale-
ment homogne) et le modle avec eets xes (totalement htrogne).
Ce rsultat conrme le fait que sous les hypothses ( H3 ); dans un modle eets
alatoires, lestimateur MCG est toujours prfrable lestimateur W ithin. Sachant
que le paramtre tend vers 0 lorsque T ! 1; on en dduit immdiatement que la
dirence disparat pour des panels de dimension temporelle innie :
bMCG ! bLSDV
T !1
Dans le cas o la matrice de variance covariance V nest pas connue, il est ncessaire
comme nous lavons dit prcdemment de procder en deux tapes. Dans une premire
tape on estime les variances des direntes composantes des rsidus. Pour cela on
estime le modle eets xes bLSDV , et lon construit les estimateurs des variances
intra et inter individuelles :
Denition 4.7. Les estimateurs des variances des composantes intra classe et inter
classe des rsidus du modle eets alatoires sont respectivement donns par :
PN PT h 0
i2
(yi;t y i ) b LSDV (xi;t xi )
b2v = i=1 t=1
(4.23)
N (T 1) K
N
P 0
2
y i bLSDV xi
1 2
b2 = i=1
b (4.24)
N K 1 T v
On en dduit alors lestimateur b du paramtre selon :
b b2v
= (4.25)
b2v + T
b2
A laide des ralisations de lestimateur Between on construit la matrice de poids
: Dans une seconde tape, on applique directement la formule (4.11) des MCG ou
lon utilise la somme pondre (4.17).
Proposition 4.8. Lestimateur des MCG construit en deux tapes converge asymp-
totiquement (NT ! 1) vers lestimateur des MCG obtenu dans le cas o la matrice
de variance covariance V est connue. Mme dans le cas de petits chantillons (T 3
et N (K + 1) 9), la procdure en deux tapes reste plus ecace que lestimateur
W ithin; dans le sens o la dirence entre la matrices de variances covariances des
MCG et celle de lestimateur reste une matrice dnie positive.
Nous ne proposerons pas ici de dmonstration de cette proposition (cf. Fuller and
Battese 1974, Taylor 1980). Mais cela conrme lide que quelle que soit la taille du
panel, lestimateur des MCG est plus ecace que lestimateur Within. Proposons
prsent une application de ces dirents rsultats.
LEconomtrie des Donnes de Panel 42
o si;t dsigne le nombre de jours chms pour cause de grve, pour 1000 salaris
du secteur industriel, ui;t dsigne le taux de chmage de lconomie et pi;t le taux
dination. On suppose ici que lon peut spcier les eets individuels i sous la forme
deets alatoires et que les rsidus "i;t = vi;t + i satisfont les hypothses (H3 ). Si lon
ne dsire que les ralisations de lestimateur des MCG du modle alatoire, lexclusion
de tout autre estimateur, le programme TSP est alors le suivant :
load(file=strikes.wks);
?---- Estimation Modle Effets Alatoires ----
panel (id=i,time=t,nowhit,nobet,nowithin) srt u p;
Les rsultats de ce programme, reproduits sur la gure (4.1) sont bien entendu
totalement identiques ceux de la gure (1.2).
E (i ) = c (4.28)
b2v .
1. une ralisation de lestimateur de la variance intra classe
b2 ou variance des
2. une ralisation de lestimateur de la variance inter classe
eets individuels.
b du paramtre .
3. une ralisation de lestimateur
P T h
N P 0
i
(yi;t y i ) bLSDV (xi;t xi )
i=1 t=1
b2v =
= 0:2551E + 06
N (T 1) K
P
N 0
y i bLSDV xi
i=1 1 2
b2 =
b = 55 401
N K1 T v
On en dduit alors une estimation du paramtre :
b b2v
0:2551E + 06
= = ' 0:11628
b2v + T
b2 0:2551E + 06 + 37 55 401
Rappelons que si le paramtre tend vers 0, lestimateur des MCG converge vers
lestimateur W ithin et que si au contraire tend vers 1, lestimateur des MCG converge
vers lestimateur du modle pooled. Dans le cas de notre chantillon, on observe que
lestimateur des MCG est plus prs de lestimateur W ithin que de celui du modle
totalement homogne. Ceci signie que dans notre panel, la variance temporelle pour
chaque pays (intra classe) domine la variance internationale (inter classe).
LEconomtrie des Donnes de Panel 44
Une des principaux problmes qui peut se poser dans le cadre du modle eets
alatoires provient de lventuelle corrlation entre les variables explicatives xi;t et les
eets individuels i: Sur le plan conomique, cette corrlation traduit linuence des
spcicits individuelles structurelles (ou a-temporelles) sur la dtermination du niveau
des variables explicatives. Reprenons lexemple de la fonction de production. Supposons
que lon dispose dun chantillon de donnes de P IB et de facteurs (travail et capital)
sur une dure de T priodes pour un ensemble de N pays. Si lon note yi;t le logarithme
du P IB, ki;t le logarithme du stock de capital priv et ni;t le logarithme de lemploi et
que lon suppose une fonction de production de type Cobb Douglass, le modle gnral
scrit sous la forme 8 i 2 [1; N] ; 8 t 2 [1; T ] :
Les innovations vi;t sont supposes tre i:i:d: de moyenne nulle et de variance gale
2v ; 8 i 2 [1; N] : On suppose que les eets individuels sont alatoires et quil existe une
corrlation entre ces eets et le niveau des variables explicatives :
Rappelons enn que dans ce modle, le rsidu total "i;t = i + vi;t sapparente la
productivit totale des facteurs ou au rsidu de Solow. Ds lors, ces deux corrlations
traduisent tout simplement le fait que plus un pays est structurellement productif (plus
son eet individuel est lev), plus le niveau de facteur utilis sera lui mme important.
Il y a tout lieu de penser quune telle corrlation puisse tre observe sur donnes
historiques.
LEconomtrie des Donnes de Panel 45
Sur le plan plus technique, la prsence dun corrlation entre les eets individuels
et les variables explicatives viole la sixime condition des hypothses (H3 ) puisque :
En prsence dune telle corrlation, nous allons montrer que lestimateur des MCG
est un estimateur biais des paramtres du vecteur ; alors lestimateur Within ne
lest pas. Ce biais sassimile tout simplement un biais dendognit, puisque les
rsidus totaux "i;t = i + vi;t sont corrls avec les variables explicatives. Toute la
stratgie de test de spcication des eets individuels repose alors sur la comparaison
des deux estimateurs, dont la divergence traduit la prsence dune corrlation et donc
la ncessaire adoption du modle eets xes et de lestimateur Within. Dans le
cas contraire o les deux estimateurs donnent des rsultats sensiblement identiques, les
hypothses (H3 ) sont satisfaites et lon peut spcier le modle avec des eets individuels
alatoires. Lestimateur des MCG est alors lestimateur BLUE.
"i;t = i + vi;t
o 0 = ( 1 2 :::: K ) est un vecteur de constantes: On suppose ici que les eets indi-
viduels alatoires i sont corrls aux variables explicatives :
E ( i j Xi ) 6= 0
Cette corrlation peut tre exprime sous direntes formes. Nous retiendrons la
formulation de Mundlak (1978a) qui postule une approximation linaire de cette es-
prance.
Denition 5.1. Dans la formulation de Mundlak (1978a), on suppose ainsi que les
eets individuels peuvent scrire sous la forme de la somme dune combinaison linaire
des moyennes individuelles des variables explicatives et dune composante orthogonale
i:i:d: i .
i = x0i a + i (5.4)
LEconomtrie des Donnes de Panel 46
On obtient ainsi une structure de rsidus "i;t + x0i a faisant apparatre trois termes
: la composante orthogonale des eets individuels i ; la projection linaire11 des eets
individuels sur lespace des variables explicatives x0i a; et un terme derreur i:i:d: dans
les dimensions temporelle et individuelle, vi;t : On suppose que les rsidus globaux "i;t
satisfont les hypothse (H4 ) :
Hypothses (H4 ) On suppose que les rsidus "i;t = i + vi;t satisfont les conditions
suivantes, 8 i 2 [1; N] ; 8 t 2 [1; T ]
E (i ) = E (vi;t ) = 0
E (i vi;t ) = 0
2 i=j
E i j =
0 8i 6= j
2
v t = s; i = j
E (vi;t vj;s ) =
0 8t6= s; 8i 6= j
E vi;t x0i;t = E i x0i;t = 0
Le modle eets individuels alatoires, sous les hypothses (H4 ), scrit vecto-
riellement sous la forme :
ei = (e; Xi ) et 0 = ; 0 : Sous les hypothses (H4 ), la matrice
avec "i = i e + vi ; X
de variance covariance de "i ; note V; est alors dnie par :
h 2 0
0
0 i ee + 2v IT = V i = j
E "i "j = E (i e + vi ) j e + vj = (5.8)
0 i 6= j
11
La projection linaire tant adapte au schma de corrlation propos.
LEconomtrie des Donnes de Panel 47
Si lon applique les Moindres Carrs Gnraliss au modle (5.7), en tenant compte
de la matrice de variance covariance V qui possde les bonnes proprits, on obtiendra
alors des estimateurs convergents des dirents paramtres :
bMCG = y x0 b BE
(5.10)
aMCG = b BE bLSDV
b (5.11)
b = bBE + (IK ) b LSDV (5.12)
MCG
bMCG ! bLSDV
T !1
b MCG !
NT !1
Mais un problme se pose lorsque lon applique, tort, lestimateur des MCG, au
modle initial, cest dire au modle dans lequel on na pas pris le soin de dcomposer
les eets individuels en deux composantes, dont une est strictement orthogonale aux
variables explicatives. Ainsi, supposons prsent que le modle (5.7) soit le bon, et que
lon applique tort les Moindres Carrs Gnraliss la spcication suivante :
Soit bMCG lestimateur des MCG appliqu ce modle, sous lhypothse que les
donnes sont gnres par le modle de (5.7). On part de la relation suivante :
Dans ce contexte, on peut montrer que lestimateur Between bBE converge vers
+ a; puisque le vecteur a relie les moyennes individuelles xi aux eets individuels i:
Ds lors, il peut apparatre un biais dans lestimateur bMCG taille T nie.
Proposition 5.2. Lorsque les eets individuels et les variables explicatives sont cor-
rles, lorsque les rsidus satisfont les hypothses (H4 ) et le modle (5.7), lapplication
tort des MCG au modle (5.13)
"i;t = i + vi;t
LEconomtrie des Donnes de Panel 48
La dmonstration de ce rsultat est trs simple. Admettons que les deux rsultats
suivants :
bBE ! p
+a
NT !1
bLSDV p
!
NT !1
Ds lors, taille T dchantillon nie, on montre que facilement lexistence dun
biais a dans lestimateur des MCG de :
On sait cependant que lorsque la taille dchantillon T tend vers linnie, la matrice
de poids tend vers 0, et lestimateur des MCG converge vers lestimateur W ithin:
Le biais disparat :
plim bMCG = plim bLSDV =
T !1 T !1
Remark 4. Ce rsultat signie quen prsence dune corrlation entre les eets indi-
viduels et les variables explicatives, lestimateur des MCG est biais taille dchantil-
lon T nie, et ce mme si le nombre dindividus N tend vers linni. Par opposition
lestimateur W ithin, dont la construction permet la suppression des eets individuels,
est asymptotiquement non biais.
Tout le problme repose sur le fait, que si les eets individuels et les variables
explicatives ne sont pas corrles, lestimateur des MCG est dans ce cas lestimateur
BLUE, cest dire lestimateur convergent, non biais variance minimale. Ainsi, le
problme de la spcication des eets individuels est un problme particulirement im-
portant de lconomtrie de panel applique. Pour sen convaincre, il sut de considrer
les rsultats de lestimation de notre modle sur les grves (gure 1.2), dans lesquels les
estimateurs des MCG et les estimateurs W ithin donnent des rsultats trs dirents
sur le plan quantitatifs, notamment en ce qui concerne la variable du chmage.
LEconomtrie des Donnes de Panel 49
Le test de spcication dHausman (1978) est un test gnral qui peut tre appliqu
des nombreux problmes de spcication en conomtrie. Mais son application la plus
rpandue est celle des tests de spcication des eets individuels en panel. Il sert ainsi
discriminer les eets xes et alatoires.
Lide gnrale du test dHausman est la fois simple et gniale. Supposons que
lon cherche tester la prsence ventuelle dune corrlation ou dun dfaut de spci-
cation. Admettons que lon dispose de deux types destimateurs pour les paramtres
du modle tudi. Le premier estimateur est suppos tre lestimateur non biais
variance minimale sous lhypothse nulle de spcication correcte du modle (absence
de corrlation). En revanche, sous lhypothse alternative de mauvaise spcication,
cet estimateur est suppos tre biais. On suppose que le second estimateur est non
biais dans les deux cas. Ds lors, il sut de comparer une distance, pondre par une
matrice de variance covariance, entre les deux estimateurs pour pouvoir dterminer si
la spcication est correcte ou non. Si la distance est statistiquement nulle, la spci-
cation est correcte, on choisit le premier estimateur. Si la distance est importante, le
modle est mal spci.
Lapplication technique de ce principe suppose tout de mme que lon construise la
matrice de variance covariance de lcart entre les deux estimateurs. De faon gnrale,
il devrait alors apparatre des termes de covariance entre les deux estimateurs. An de
les liminer, on considre le lemme suivant :
Denition 5.4. Lhypothse teste concerne la corrlation des eets individuels et des
variables explicatives :
H0 : E ( i j Xi ) = 0 (5.19)
H1 : E ( i j Xi ) 6= 0 (5.20)
Ce test peut tre interprter comme un test de spcication. Sous H0 ; le modle peut
tre spci avec des eets individuels alatoires et lon doit alors retenir lestimateur
des MCG (estimateur BLUE): Sous lhypothse alternative H1 , le modle doit tre
spci avec des eets individuels xes et lon doit alors retenir lestimateur Within
(estimateur non biais).
On peut ici appliquer le lemme (5.3) en considrant lestimateur des MCG (estima-
teur b1 ) et lestimateur Within (estimateur b 2 ). En eet, nous avons vu que sous H0 ;
dans un modle eets alatoires, lestimateur des MCG b MCG est lestimateur BLUE:
Sous lhypothse de normalit des rsidus, les deux estimateurs b MCG et b LSDV sont
convergents et asymptotiquement distribus selon une loi normale. On en dduit que :
var bMCG bLSDV = var b MCG var b LSDV (5.21)
Ds lors, sous lhypothse nulle H0 ; la distance entre les deux estimateur est nulle
puisque tous deux convergent vers la vraie valeur : En revanche, sous lhypothse
alternative, la prsence de la corrlation entre les eets individuels et les variables
explicatives conduit un biais de lestimateur des MCG et cette distance devient alors
importante.
Il faut noter que la statistique du test de Hausman est dgnre lorsque lon consid-
re que la dimension T tend vers linni. En eet, dans ce cas, lestimateur des MCG
converge vers lestimateur Within 12 , ce qui implique que le numrateur et le dnomina-
teur de la statistique dHausman tendent vers 0. Toutefois, on sait que lorsque T tend
vers linni, les modles eets alatoires et eets xes ne peuvent tre distingus
et sont parfaitement similaires. Ds lors, la question de la spcication de ces eets
importe peu.
5.3. Application
load(file=strikes.wks);
?---- Test Hausman, Within et VarComp----
panel (id=i,time=t,nowhit,nobet) srt u p;
Les rsultats de ce programme, reproduits sur la gure (5.1), sont bien entendu
totalement identiques ceux de la gure (1.2).
Pour lchantillon considr, la ralisation de la statistique du test dHausman est de
13; 924. Etant donn que le modle comporte deux variables explicatives (K = 2); cette
statistique suit un chi deux deux degrs de libert. A 95%, le seuil est de 5:99; donc
ici on rejette lhypothse nulle dabsence de corrlation entre les eets individuels et les
variables explicatives. Le chmage et lination sont corrls au spcicits structurelles
et a-temporelles du volume des jours chms pour cause de grve. Plus un pays, toutes
choses gales par ailleurs, connat de jours de grves, plus son niveau de chmage et
dination sont levs (ou faibles suivant le signe de la corrlation). Ainsi, on doit ici
privilgier ladoption dun modle eets xes et retenir lestimateur Within.
plim b M CG = b LSDV
N !1
observe que pour lchantillon tudi , les coecients estims notamment pour le ch-
mage sont sensiblement dirents dans les deux cas (21pour lestimateur W ithin et
12 pour lestimateur des MCG). Rappelons, que sous lhypothse nulle dabsence de
corrlation ces deux estimateurs devraient converger vers la mme valeur. Cette obser-
vation conrme donc notre diagnostic quant la prsence dune corrlation entre les
eets individuels et les deux variables explicatives du modle. On doit ainsi privilgier
les rsultats de lestimateur W ithin.
LEconomtrie des Donnes de Panel 53
Commenons par prsenter la structure gnrale des modle eets individuels xes
et coecients alatoires.
yi = ei + Xi i + vi 8 i 2 [1; N] (6.3)
o e dsigne un vecteur unitaire de dimension (T; 1) et o lon suppose que les rsidus vi;t
satisfont les hypothses (H1 ); avec en particulier E (vi vi0 ) = 2vi IT . Lhypothse selon
laquelle le paramtre i est un coecient alatoire implique une nouvelle structure des
rsidus qui peut sexprimer sous la forme suivante :
yi = ei + Xi + "i (6.4)
LEconomtrie des Donnes de Panel 54
avec 8 i 2 [1; N]
"i = Xi ei + vi (6.5)
o les coecients alatoires e i = i ; sont tels que E ei = 0; E Xi e i = 0
0
et E ei ei = : A partir de lquation (6.4), on obtient ainsi un modle o les
coecients i et sont xes, mais o la structure des rsidus ne satisfait pas les
hypothses standards. Pour le montrer, tablissons la forme de la matrice de variance
covariance des rsidus individuels, not i ; est alors dnie par13 :
0
0
i = E "i "0i = E Xi ei + vi Xi ei + vi = Xi E ei ei Xi0 + E vi vi0
Pi yi = Pi ei + Pi Xi + Pi "i
ou encore
yi = i ei + Xi + "i (6.9)
Dans ce modle transform, les rsidus "i satisfont les hypothses H1 puisque :
1 0
E "i ("i )0 = Pi E "i "0i Pi0 = Pi Pi0 Pi Pi = IT (6.10)
Qi ei = Qi Pi e = 0
13
Si Xi est non stochastique.
LEconomtrie des Donnes de Panel 55
1 0
Qi = IT Pi e e0 1
i e ePi (6.11)
La preuve est la suivante :
h 1 0 i
Q Pi e = IT Pi e e0 1
i e ePi Pi e
1 0
= Pi e Pi e e0 1
i e ePi Pi e
0 0 1 0
= Pi e Pi e e Pi Pi e ePi Pi e
= Pi e Pi e
= 0
o les estimateurs bi ; 8 i 2 [1; N] ; sont les estimateurs des MCO obtenus quation par
quation pour chaque individu.
b i ; 8 i 2 [1; N]
o e dsigne le vecteur unitaire de dimension (T; 1) et la matrice
est dnie par :
b i = Xi X
b i0 +
b2vi IT (6.20)
14
Formule (3.3) page 578.
LEconomtrie des Donnes de Panel 57
avec 8 t 2 [1; T ]
N
1 X
yt = yi;t (6.22)
N i=1
Ce modle de convergence est construit partir de lcart du PIB par tte yi;t
la moyenne internationale yt des PIB par tte. On cherche dterminer si le taux de
croissance de cet cart est li ngativement au niveau de lcart observ la priode
prcdente. Si pour tous les pays, les constantes i sont nulles et les coecients i
sont ngatifs cela signie que lon observe un phnomne de convergence des PIB par
tte. Dans ce cas, un cart positif du PIB par tte la moyenne international induit
un diminution de la croissance de cet cart la date suivante. Autrement dit les carts
des PIB par tte de tous les pays la moyenne internationale tendent se resserrer et
par l mme disparatre. On dit alors quil y a convergence absolue des niveaux de
PIB par tte.
(yi;t y t ) = i yi;t1 y t1 + "i;t
Mais de tels phnomnes sont rarement observs sur des chantillons internationaux,
cest pourquoi gnralement on introduit des eets individuels i dans la spcications
des modles. Ces eets individuels permettent denvisager la notion de convergence
conditionnelle. Supposons en eet que les constantes i soient non nulles, dans ce cas
on montre que :
lim yi;t+p y t+p = i 8 i 2 [1; N] (6.24)
p!1
Les PIB par tte des dirents pays convergent ainsi vers des sentiers rguliers
parallles mais non confondues : les taux de croissance sont identiques mais les niveaux
demeurent dirents.
LEconomtrie des Donnes de Panel 58
Dans cette tude, nous montrons laide de tests de non stationnarit en panel
(Evans et Karras 1996), quil existe un processus de convergence conditionnel sur un
chantillon de 27 pays de lOCDE (1960-1990). Pour cet chantillon, nous proposons
alors une estimation par la mthode MF R de la moyenne de la vitesse de convergence
des PIB par tte. On considre donc le modle suivant :
(yi;t y t ) = i + i yi;t1 yt1 + i yi;t1 y t1 + "i;t (6.25)
Tout comme en sries temporelles, on introduit ici un terme de type ADF yi;t1 yt1
de faon blanchir la structure des rsidus. On suppose que les eets individuels i
sont xes et que les paramtres i et i sont des coecients alatoires. On a donc
une structure de type MF R identique celle prsente prcdemment avec N = 27;
T = 31et K = 2: On sintresse ici plus particulirement aux vitesses de convergence
i dont la distribution, suppose commune, une esprance et une variance 2 . On
pose ainsi :
i
i = 8 i 2 [1; N] (6.26)
(2;1) i
2
0
E ( i ) = = E ( i ) ( i ) = = (6.27)
2
Faisons abstraction ici des problmes lis la structure dynamique du modle (cf.
Hsiao 1989 pour une application avec endogne retarde). Le problme consiste
estimer les paramtres ; , 2 ; 2 et : Le programme TSP qui reprend les 3 tapes
de la procdure destimation des paramtres du modle MF R est fourni en annexe
(A.2).
Tout dabord, commenons par prsenter les rsultats des estimations des 27 qua-
tions individuelles (tape 1 ). Les rsultats gurent dans le tableau (6.1).
Ces rsultats ont t stocks dans un chier Excel grce aux commandes suivantes
:
smpl 1 N;
unmake ls_alpha alpha_i;
unmake ls_rho rho_i gam_i;
unmake sigls sig_i;
write(file=dea.xls) alpha_i rho_i gam_i sig_i;
Le chier Excel a ensuite t import dans un Workle sous Eviews, ce qui nous per-
met dutiliser linterface graphique, relativement pratique, de ce logiciel pour prsenter
les rsultats. On peut en particulier tudier la distribution des vitesses de convergence
LEconomtrie des Donnes de Panel 59
8
Series: RHO_I
Sample 1 27
Observations 27
6
Mean -0.141609
Median -0.130857
Maximum 0.018295
4
Minimum -0.447934
Std. Dev. 0.117664
Skewness -0.733074
2 Kurtosis 2.881545
Jarque-Bera 2.434072
Probability 0.296106
0
-0.4 -0.3 -0.2 -0.1 0.0
nuls, ce qui traduirait une hypothse de non convergence. Il serait possible de calculer
cette probabilit.
Pour autant jusqu prsent nous nous sommes contents dtudier la distribution
i sans tenir compte de la prcision des estimations individuelles, cest dire des
des b
variances des rsidus 2v : Cest pourquoi, nous avons construit lestimateur MFR con-
struit partir dune correction faisant intervenir la matrice de variance des direntes
composantes des rsidus. Ainsi, dans le programme, nous avons construit lestima-
teur de Swamy (1970) de cette matrice de variance covariance (tape 2 de la procdure
gnrale). Les rsultats obtenus sont les suivants :
2
b b
b 0:013845 0:0024814
= = (6.28)
b
b2 0:0024814 0:042026
Bien entendu, on retrouve lcart type des paramtres i que nous avions calcul
p
prcdemment puisque bp = 0:013845 = : 11766: Mais nous tenons compte ici des
ventuelles covariances pouvant exister entre les coecients i et i :
Enn, dans une dernire tape, nous avons construit lestimateur MFR associ aux
moyennes des paramtres i et i (tape 3 de la procdure gnrale). Les rsultats
obtenus sont les suivants :
b = b 0:11395
= (6.29)
b
0:15865
h = 0.0595
2
h = 0.1190
h = 0.1785
0
-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1
RHO_I
A. Annexes
Rappelons que :
T
X
xi;t = T xi
t=1
On obtient ainsi :
N
" T
# N X T
X 1X 2 X
D= 2
xi;t 2xi x + x = (xi;t x)2
i=1
T t=1 i=1 t=1
?******************************
?**** ESTIMATEUR MFR *******
?**** HSIAO (1989) *******
?******************************
?--- Options ----------------
OPTIONS(LIMWARN=0,LIMERR=10);
SUPRES SMPL;
?----------------------------
?******************************
?**** Paramtres du Modle ****
?******************************
set N=27 ; ? Nombre dIndividus N
set l=31 ; ? Nombre de Priodes T
set K=2 ; ? Nombre de Variables Explicatives K
set nobs=N*l ; ? Nombre Total dObservations NT
set t0=60; ? Date de Dbut dEchantillon
set t1=90 ; ? Date de Fin dEchantillon
set retard=2; ? Nombre de Retards (Modle Dynamique)
smpl 1 nobs;
?*****************************
?***** Variables *************
?*****************************
?- Base de donnes
load(le=ocde.wks);
? Donnes Centres sur la Moyenne Internationale
y=log(y);
do j=t0 to t1;
select (t=j);
msd(noprint) Y;
YB=Y-@MEAN;
LEconomtrie des Donnes de Panel 64
enddo;
? Construction des Sries
smpl 1 nobs;
y=yb;
select i=i(-1);
dy=y-y(-1);
?*****************************
?------------------------------------------------
?---- ETAPE 1 : Estimations pays par pays ----
?------------------------------------------------
mform(nrow=N,ncol=1) ls_alpha=0;
mform(nrow=N,ncol=K) ls_rho=0;
mform(nrow=N,ncol=1) sigls=0;
do j=1 to N;
?--- Rgressions Individuelles ---
smpl 1 nobs;
select (i=j)&(i=i(-2));
ls(silent) dy c y(-1) dy(-1);
?--- Construction des Vecteurs des Coefficients ---
set ls_alpha(j,1)=@coef(1);
do p=1 to K;
set pf=p+1;
set ls_rho(j,p)=@coef(pf);
enddo;
set sigls(j,1)=@s2;
enddo;
print ls_alpha ls_rho sigls;
?-----------------------------------------------------
?---- ETAPE 2 : Swamy (1970) ----
?---- Estimateur de la variance du parametre rho ----
?-----------------------------------------------------
?--- Calcul de la Moyenne des Coefficients Alatoires ---
mform(nrow=N,ncol=1) en=1;
mat sum_rho=((en)*ls_rho)/N;
?--- Construction du Vecteur des Moyennes ---
if K=1; then; do;
LEconomtrie des Donnes de Panel 65
mat vsum_rho=sum_rho*en;
enddo;
if K>1; then; do;
mat vsum_rho=sum_rho(1,1)*en;
do j=2 to K;
mat sum_rhoi=sum_rho(1,j)*en;
mmake vsum_rho vsum_rho sum_rhoi;
enddo;
enddo;
?--- Construction du lestimateur de Delta ---
mat Delta=(1/(N-1))*((ls_rho-vsum_rho))*(ls_rho-vsum_rho);
?-------------------------------------
?-- ETAPE 3 : Construction de Beta ---
?-- Construction des Phi_i ---
?-------------------------------------
smpl 1 nobs;
set l1=l-retard;
mform(nrow=l1,ncol=l1,type=diag) unite=1;
mform(nrow=l1,ncol=1) z=1;
mform(nrow=K,ncol=K) T1=0;
mat T2=T1;
mform(nrow=K,ncol=1) T3=0;
mat T4=T3;
do j=1 to N;
smpl 1 nobs;
?*********************************
?**** Construction des sries ****
?*********************************
select (i=j)&(i=i(-2));
y1=y(-1);
dy1=dy(-1);
mmake x y1 dy1;
mmake yy dy;
?-- Construction de la matrice (Phi)-1
mform(nrow=l1,ncol=l1) Phi=0;
mat Phi=x*Delta*x+sigls(j,1)*unite;
LEconomtrie des Donnes de Panel 66
mat Phi=(Phi);
?-- Premier Terme : T1 ---
mat t1_i=(x)*Phi*x;
mat T1=T1+t1_i;
?-- Deuxime Terme : T2 ---
mat t2_i=(x)*Phi*z*(((z)*Phi*z))*(z)*Phi*x;
mat T2=T2+t2_i;
?-- Troisime Terme : T3 ---
mat t3_i=(x)*Phi*yy;
mat T3=T3+t3_i;
?----------------------------------------
?-- Estimateur de rho_bar ------
?----------------------------------------
mat rhols_m=(sum_rho);
mat rho_mfr=((T1-T2))*(T3-T4);
print rhols_m rho_mfr;
print delta;
?--------------------------
?--- Calcul des T-stats ---
?--------------------------
if K=1; then; do;
set T_stat=rho_mfr/sqrt(Delta);
enddo;
if K>1; then; do;
mform(nrow=K,ncol=1) T_stat=0;
do j=1 to K;
set T_stat(j,1)=rho_mfr(j,1)/sqrt(Delta(j,j));
enddo;
enddo;
print t_stat;
LEconomtrie des Donnes de Panel 67
Bibliographie
Ahn, S.C., et Schmidt, P., (1995), Ecient Estimation of Models for Dynamic
Panel Data, Journal of Econometrics, 68, 5-27.
Bernard, A., et Jones, C., (1996), Productivity Across Industries and Countries :
Times Series Theory and Evidence, The Review of Economics and Statistics,135-146.
Harris, R.D.F. et Tzavalis, E., (1996), Inference for Unit Root in Dynamic Panels,
Working Paper, University of Exeter, UK.
Im, K.S., Pesaran, M.H., et Shin, Y., (1995), Testing for Unit Roots in Heteroge-
nous Panels, DAE, Working Paper 9526, University of Cambridge.
Islam, N., (1995), Gowth Empirics : A Panel Data Approach, Quarterly Journal
of Economics.
Levin, A., et Lin, C-F., (1992), Unit Root Test in Panel Data: Asymptotic and
Finite-Sample Properties, Discussion Paper 92-23, Department of Economics, Uni-
versity of California, San Diego.
Quah, D., (1994), Exploiting Cross-Section Variations for Unit Root Inference in
Dynamic Data, Economics Letters, 44, 9-19.
LEconomtrie des Donnes de Panel 68
Mundlak Y. (1978), On the Pooling of Time Series and Cross Section Data,
Econometrica, 46, 69-85
Taylor W.E. (1980), Small Sample Consideration in Estimation from Panel Data,
Journal of Econometrics, 13, 203-223