Vous êtes sur la page 1sur 68

Ecole Doctorale Edocif

Sminaire Mthodologique

LEconomtrie des Donnes de Panel


Modles Linaires Simples

Christophe HURLIN
LEconomtrie des Donnes de Panel 2

Figure 0.1:

Prsentation

Le but de ce sminaire est de proposer une initiation, tant sur le plan thorique
que sur le plan appliqu, lconomtrie des donnes de panel. Sur le plan thorique,
le sminaire dbutera par une prsentation des problmes de spcications de base en
conomtrie de panel et par les mthodes destimation traditionnelles. Cette premire
partie insistera en particulier sur les stratgies de tests de spcication du modle. La
seconde partie du sminaire sera consacre ltude des panels dynamiques et pro-
posera une introduction aux concepts de non stationnarit stochastique en panel et
notamment la spcication des tests de non stationnarit et de cointgration. Ces
concepts thoriques seront appliqus direntes problmatiques conomiques, comme
par exemple la problmatique de la convergence des PIB par tte, que ce soit au travers
de commentaires de travaux empiriques ou par la programmation dexemples illustratifs
sous un logiciel dconomtrie (TSP ou SAS prciser)
LEconomtrie des Donnes de Panel 3

Table des Matires

Introduction 2

Chapitre 1 : Modles Linaires Simples 5


Introduction 6

1. Tests de spcication ou tests dhomognit 8


1.1. Lexemple dune fonction de production 8
1.2. Procdure de tests de spcication 10
1.2.1. Procdure gnrale 10
1.2.2. Construction des statistiques de test 13
1.3. Application 17
2. Modles eets individuels 20
2.1. Empilement par pays 21
2.1.1. Exemple 22
2.2. Empilement par dates 23
2.2.1. Exemple 23
3. Modles eets xes 25
3.1. Estimateur Within ou LSDV 26
3.2. Application 28
3.3. Ecriture vectorielle 31
4. Modles eets alatoires 33
4.1. Modle variance compose 34
4.2. Estimateurs du modle eets alatoires 35
4.3. Estimateur des Moindres Carrs Gnraliss 37
4.4. Application 42
5. Tests de spcication des eets individuels 44
5.1. Corrlation des eets individuels et des variables explicatives 45
5.2. Test de spcication dHausman 49
6.3. Application 51
6. Modles coecients xes et alatoires 53
6.1. Modle MFR de Hsiao (1989) 53
6.2. Mthode destimation des paramtres 56
6.3. Application 57
LEconomtrie des Donnes de Panel 4

Annexes 62
A.1. Equivalence entre les estimateurs Within et pooled : = 1 62
A.2. Programme TSP : Modle MFR 63
Bibliographie 67
LEconomtrie des Donnes de Panel 5

Chapitre I

Modles Linaires Simples


LEconomtrie des Donnes de Panel 6

Introduction

Dans ce premier chapitre, nous nous restreindrons ltude des modles linaires sim-
ples sur donnes de panel, ces derniers tant dnis par opposition aux modles dy-
namiques faisant intervenir des variables endognes retardes. Dans toute la suite de ce
chapitre, on considre des processus strictement stationnaires au sens de la stationnarit
du second ordre1 .

Lobjectif des cinq premires sections de ce chapitre est de faire en sorte que le
lecteur puisse interprter, de faon exhaustive et relativement approfondie, les rsultats
de base que donnent les principaux logiciels dconomtrie lorsque lon envisage des
modles de panel. Nous prendrons ici comme rfrence le logiciel TSP 4.3, mais il
est bien entendu vident que ces rsultats de base sont sensiblement identiques si lon
considre dautres logiciels comme Eviews, SAS ou Rats.
Quelles sont les connaissances minimales ncessaires lconomtre appliqu pour
pouvoir interprter un tableau de rsultats destimation de panel ? Prenons comme
exemple la commande panel de TSP. A lissue de cette procdure, lutilisateur dispose
des ralisations des estimateurs Pooled, Between, des estimateurs du modle eets
individuels xes (Within), du modle eets individuels alatoires (Error Component
Model ), des rsultats de trois tests de Fischer, dun estimateur de la variance des
eets individuels, dun estimateur de la variance totale, de lestimateur dun paramtre
de pondration et de la statistique du test dHausman. Voil ainsi rsums tous les
lements que nous nous proposons dtudier tout au long des cinq premires sections.

Ainsi, la premire section est consacre aux tests de spcication qui correspondent
en fait aux trois tests de Fischer du chier de rsultat des estimations TSP. Il sagit ici de
dterminer la manire dont doit tre spci un modle de panel, si tant que lhypothse
de panel puisse tre accepte. Nous verrons alors que toute lanalyse repose alors
sur la notion dhomognit des paramtres du modle envisag. Les tests prsents
visent ainsi porter un diagnostic sur lventuelle ncessit dintgrer une dimension
htrogne et sur la manire dont cette htrognit doit tre spcie. Une des
manires simples pour ne pas supposer lexistence dun modle totalement identique
consiste ainsi introduire des eets individuels sous la forme de constantes spciques,
propres chaque individu du panel. Nous proposerons ainsi une procdure gnrale de
tests de spcication des modles linaires simples.
1
La dnition de la stationnarit fera lobjet du chapitre suivant.
LEconomtrie des Donnes de Panel 7

Dans une seconde section, nous prsenterons le modle eets individuels. Ce


modle suppose lexistence de coecients identiques pour tous les individus et de con-
stantes spciques. Ainsi, la relation conomique mise en vidence travers ce type de
modlisation nest cense direr pour tous les individus quau niveau des constantes
introduites dans le modle. Nous insisterons alors sur la construction du modle et en
particulier sur sa reprsentation sous forme vectorielle. Il sagit ici de prsenter les deux
principales mthodes de construction des chantillons de donnes, savoir la mthode
dempilement par date et la mthode dempilement par individus.

La troisime section est consacr au modle eets individuels xes. On suppose


dans cette section que les eets individuels sont des paramtres dterministes. Nous
serons alors amener prsenter la construction et les proprits de lestimateur Within
des coecients du modle. Une application sur les relations entre le nombre de grves
dans le secteur industriel et les dterminants macroconomiques sera propose. Nous
nous appuierons sur les rsultats et les dirents tests proposs sous TSP.

Une quatrime section sera consacre au modle eets individuels alatoires. On


suppose dans cette section que les eets individuels ne sont plus des paramtres, mais
des variables alatoires possdant une distribution commune pour tous les individus.
Nous commencerons par tudier la structure des rsidus de ce modle variance com-
pose. Nous tudierons ensuite les dirents estimateurs des coecients du modle
eets alatoires et plus particulirement lestimateur des Moindres Carrs Gnraliss.

Enn, la cinquime section sera consacre aux tests de spcication des eets indi-
viduels. La question est alors de savoir quel modle, parmi les modles eets alatoires
et eets xes, doit tre retenu. Ceci nous conduira prsenter le test dHausman (1978)
qui constitue le test standard de spcication des eets individuels.

Nous conclurons enn en introduisant un sixime section consacre la prsentation


dun type de modle de plus en plus utilis en conomtrie appliqu : le modle avec
coecients xes et coecients alatoires. Ce modle, introduit notamment par Hsiao
(1989), permet de raliser dirents exercices de modlisation conomique particulire-
ment intressants.
LEconomtrie des Donnes de Panel 8

1. Tests de spcication ou tests dhomognit

Lorsque lon considre un chantillon de donnes de panel, la toute premire chose quil
convient de vrier est la spcication homogne ou htrogne du processus gnrateur
de donnes. Sur le plan conomtrique, cela revient tester lgalit des coecients
du modle tudi dans la dimension individuelle. Sur le plan conomique, les tests
de spcication reviennent dterminer si lon est en droit de supposer que le modle
thorique tudi est parfaitement identique pour tous les pays, ou au contraire sil existe
des spcicits propres chaque pays.
Nous commencerons par prsenter un petit exemple illustratif construit partir
dune fonction de production agrge. Dans une seconde section, nous gnraliserons
la procdure de tests de spcication en introduisant les notions de variances intra-
classes (Within) et inter-classes (Between). Enn, nous proposerons une application
de ces tests de spcication lestimation dune relation entre le nombre de grves et
un ensemble de variables explicatives.

1.1. Lexemple dune fonction de production

Prenons lexemple dune fonction de production. Supposons que lon dispose dun
chantillon de donnes de P IB et de facteurs (travail et capital) sur une dure de T
priodes pour un ensemble de N pays. Si lon note yi;t le logarithme du P IB, ki;t le
logarithme du stock de capital priv et ni;t le logarithme de lemploi et que lon suppose
une fonction de production de type Cobb Douglass, le modle gnral scrit sous la
forme 8 i 2 [1; N] ; 8 t 2 [1; T ] :

yi;t = i + i ki;t + i ni;t + "i;t

Les innovations "i;t sont supposes tre i:i:d: de moyenne nulle et de variance gale
2" ; 8 i 2 [1; N] :

Dans un premier temps, la phase de test de spcication, revient sur le plan


conomique, dterminer sil est en droit de supposer une fonction de production
totalement identique pour tous les pays (modle pooled). Dans ce cas, les lasticits de
lemploi et du capital sont identiques pour tous les pays ( i = ; i = ; 8 i 2 [1; N] ) et
le niveau moyen de la productivit totale des facteurs, reprsent ici par les constantes
i ; est lui aussi identique pour tous les pays. Le modle scrit alors sous la forme :

yi;t = + ki;t + ni;t + "i;t


LEconomtrie des Donnes de Panel 9

Toutefois, lorsque lon travaille sur des sries agrgs, il est relativement peu prob-
able que la fonction de production macroconomique soit strictement identique pour
tous les pays tudis. Si lhypothse dhomognit totale est rejete, il convient alors
de tester si les lasticits des dirents facteurs sont identiques. Si ce nest pas le cas, il
nexiste a priori aucune structure de production commune entre les pays. Dans ce cas,
lutilisation des donnes de panel ne se justie pas et peut mme conduire des biais
destimation. On doit donc estimer les fonctions de production pays par pays.

Si en revanche, il savre quil existe bien une relation identique entre la production
et les facteurs pour tous les pays, la source dhtrognit du modle peut alors provenir
des constantes i : Dans notre exemple, ces constantes reprsentent la moyenne de la
productivit totale des facteurs de production (rsidu de Solow). Or, rien ne garan-
tit que les pays tudis possdent le mme niveau de productivit structurelle. Au
contraire, il se peut parfaitement que des facteurs a-temporels ou structurels, comme la
position gographique, le climat, lloignement par rapport au grands axes commerciaux
etc... aient pu conduire des dirences structurelles de niveau de productivit entre
les pays. Il convient donc de tester lhypothse dune constante commune tous les
pays. Si cette hypothse est rejete, on obtient alors un modle avec eets individuels
qui scrit sous la forme :

yi;t = i + ki;t + ni;t + "i;t

Dans ce cas, le niveau moyen de la productivit totale des facteurs, dtermin par
E (i + "i;t ) = i ; varie selon les pays, mme si la structure de production (les lasticits
des deux facteurs travail et capital) est identique.

Cet exemple, que nous allons prsent gnraliser, montre bien que la phase de
test de spcication revient dterminer si le processus gnrateur de donnes peut
tre considr comme homogne, cest dire unique pour tous les individus, ou si au
contraire il apparat totalement htrogne, auquel cas lutilisation des techniques de
panel ne peut se justier. Entre ces deux cas extrmes, il convient de prcisment
identier la source dhtrognit pour bien spcier le modle.
LEconomtrie des Donnes de Panel 10

1.2. Procdure de tests de spcication

On considre un chantillon de T observations de N processus individuels fyi;t ; t 2 Z; i 2 Ng


et fxi;t ; t 2 Z; i 2 Ng : Par la suite, on notera fyi;t g et fxi;t g ces deux processus. On
suppose que le processus fyi;t g est dni de faon gnrale par le relation linaire suiv-
ante, 8 i 2 N, 8 t 2 Z :
yi;t = i + 0i xi;t + "i;t (1.1)
0
o i 2 R, i = 1;i 2;i :::: K;i est un vecteur de dimension (K; 1). On considre
ainsi un vecteur de K variables explicatives :

xi;t = (x1;i;t ; x2;i;t ; :::; xK;i;t )0 (1.2)

Les innovations "i;t sont supposes tre i:i:d: de moyenne nulle et de variance gale
2" ;
8 i 2 [1; N] : Ainsi on suppose que les paramtres i et i du modle (1.1) peuvent
direr dans la dimension individuelle2 , mais lon suppose quils sont constants dans le
temps.

1.2.1. Procdure gnrale

Si lon considre le modle (1.1), plusieurs congurations sont alors possibles :

1. Les N constantes i et les N vecteurs de paramtres i sont identiques : i = ;


i = 8 i 2 [1; N]. On qualie alors le panel de panel homogne.

2. Les N constantes i et les N vecteurs de paramtres i sont dirents selon les


individus. On a donc N modles dirents, on rejette la structure de panel.

3. Les N constantes i sont identiques, i = 8 i 2 [1; N] ; tandis que les vecteurs


de paramtres i dirent selon les individus. Dans ce cas, tous les coecients
du modle, lexception des constantes, sont dirents selon les individus. On a
donc N modles dirents.

4. Les N vecteurs de paramtres i sont identiques, i = 8 i 2 [1; N] ; tandis


que les constantes i dirent selon les individus. On obtient un modle eets
individuels.

Pour discriminer ces direntes congurations et pour sassurer du bien fond de la


structure de panel, il convient dadopter une procdure de tests dhomognit embots.
La procdure gnrale de test prsente dans Hsiao (1986) est dcrite sur la gure (1.1).
2
A lexception de la variance des innovations que lon supposera identique pour tous les individus.
LEconomtrie des Donnes de Panel 11

Figure 1.1: Procdure Gnrale de Tests dHomognit

TestH01 : i = i = i [1, N]

H01 rejete H01 vraie

TestH0 : i = i [1, N] yi,t = + ' xi,t + i,t


2

2 2
H0 rejete H0 vraie

yi,t = i + i ' xi,t + i,t TestH03 : i = i [1, N]

H03 vraie H03 rejete

yi,t = + ' xi,t + i,t yi,t = i + ' xi,t + i,t

Dans une premire tape, on teste lhypothse dune structure parfaitement ho-
mogne (constantes et coecients identiques) :

H01 : i = i = 8 i 2 [1; N]

Ha1 : 9 (i; j) 2 [1; N] = i 6= j ou i 6= j

On utilise alors une statistique de Fischer pour tester ces (K + 1) (N 1) restric-


tions linaires3 . Si lon suppose que les rsidus "i;t sont indpendamment distribus
dans les dimensions i et t; suivant une loi normale desprance nulle et de variance
nie 2" ; cette statistique suit une distribution de Fischer avec (K + 1) (N 1) et
NT N (K + 1) degrs de libert. Les conclusions de ce test sont les suivantes. Si
lon accepte lhypothse nulle H10 dhomognit, on obtient alors un modle de pooled
totalement homogne.
yi;t = + 0 xi;t + "i;t (1.3)

Si en revanche, on rejette lhypothse nulle, on passe une seconde tape qui consiste
dterminer si lhtrognit provient des coecients i .

3
Dans notre modle, chaque vecteur i comprend K paramtres. Pour les N individus du panel, on
obtient KN paramtres. Lgalit des N vecteurs i revient donc imposer KN K restrictions. De
la mme faon, lgalit des N constantes revient imposer N 1 restrictions. Au total, lhypothse
H01 revient imposer (K + 1) (N 1) restrictions linaires.
LEconomtrie des Donnes de Panel 12

La seconde tape consiste tester lgalit pour tous les individus des K com-
posantes des vecteurs i .
H02 : i = 8 i 2 [1; N]

Ha2 : 9 (i; j) 2 [1; N] = i 6= j

Sous lhypothse nulle, on nimpose ici aucune restriction sur les constantes indi-
viduelles i : De la mme faon, on construit une statistique de Fischer pour tester
ces (N 1) K restrictions linaires. Toujours sous lhypothse dindpendance et de
normalit des rsidus, cette statistique suit une loi de Fischer avec (N 1) K et NT
N (K + 1) degrs de libert. Si lon rejette lhypothse nulle H20 dhomognit des coef-
cients i , on rejette alors la structure de panel, puisque au mieux seules les constantes
i peuvent tre identiques entre les individus :

yi;t = + 0i xi;t + "i;t (1.4)

On estime alors les paramtres vectoriels i en utilisant les modles dirents pays
par pays. Si en revanche, on accepte lhypothse nulle H20 dhomognit des coecients
i ; on retient la structure de panel et lon cherche alors dterminer dans une troisime
tape si les constantes i ont une dimension individuelle.

La troisime tape de la procdure consiste tester lgalit des N constantes indi-


viduelles i ; sous lhypothse de coecients i communs tous les individus :

H03 : i = 8 i 2 [1; N]

Ha3 : 9 (i; j) 2 [1; N] = i 6= j

Sous lhypothse nulle, on impose i = : Sous lhypothse dindpendance et de


normalit des rsidus, on construit une statistique de Fischer pour tester ces N
1 restrictions linaires. Cette statistique suit une loi de Fischer avec (N 1) K et
N (T 1) K degrs de libert. Si lon rejette lhypothse nulle H30 dhomognit des
constantes i , on obtient alors un modle de panel avec eets individuels :

yi;t = i + 0 xi;t + "i;t (1.5)

Dans le cas o lon accepte lhypothse nulle H30 , on retrouve alors une structure de
panel totalement homogne (modle pooled). Le test H30 ne sert alors qu conrmer
ou inrmer les conclusions du tests H10 ; tant donn que le fait de rduire le nombre de
restrictions linaires permet daccrotre la puissance du test du Fischer.
LEconomtrie des Donnes de Panel 13

1.2.2. Construction des statistiques de test

Nous allons prsent, prsenter les mthodes de construction des dirents tests de
Fischer utiliss dans cette procdure. On considre le modle (1.1) et lon suppose que
les rsidus "i;t sont indpendamment distribus dans les dimensions i et t; suivant une
loi normale desprance nulle et de variance nie 2" . On suppose que la variance 2" est
connue.

Test dhomognit globale On considre tout dabord, le test de lhypothse


dhomognit totale H01 :

H01 : i = i = 8 i 2 [1; N]

Soit F1 la statistique de Fischer associe ce test. Ce test revient imposer


(K + 1) (N 1) restrictions linaires sur les coecients du modle (1.1). De plus,
sous lhypothse alternative Ha2 ; il existe au plus NK coecients dirents pour les
composantes des N vecteurs i (de dimension K) et N constantes individuelles. On
dispose donc de NT N (K + 1) degrs de libert.

Denition 1.1. La statistique de Fischer F1 associe au test dhomognit totale H01


dans le modle (1.1) :

H01 : i = i = 8 i 2 [1; N]
(K;1)

scrit sous la forme suivante et suit un Fischer avec (N 1) (K + 1) et NT N (K + 1)


degrs de libert :
(SCR1;c SCR1 ) = [(N 1) (K + 1)]
F1 = (1.6)
SCR1 = [NT N (K + 1)]
o SCR1 dsigne la somme des carrs des rsidus du modle (1.1) et SCR1;c la somme
des carrs des rsidus du modle contraint :

yi;t = + 0 xi;t + "i;t

Ainsi, si la ralisation de la statistique de Fischer pour lchantillon considr est


suprieure au seuil thorique %; on rejette lhypothse nulle dhomognit. Reste
prsent dterminer la formule gnrale des sommes de carrs des rsidus des modles
contraint et non contraint. Considrons tout dabord le modle non contraint :

yi;t = i + 0i xi;t + "i;t

Les estimateurs bi et
b i des paramtres individuels sont obtenus quation par qua-
tion pour chaque individu. Soit SCR1;i la somme des carrs des rsidus obtenue pour
LEconomtrie des Donnes de Panel 14

chaque quation. La somme des carrs des rsidus du modle (1.1) non contraint est
alors tout simplement dnie comme la somme des N somme des carrs des rsidus
obtenues pour les N quations individuelles.
N
X N h
X i
0 1
SCR1 = SCR1;i = Syy;i Sxy;i Sxx;i Sxy;i (1.7)
i=1 i=1

o les sommes Sk;i sont dnies de la faon suivante 8 i 2 [1; N] :


T
X
Syy;i = (yi;t yi )2 (1.8)
t=1

T
X
Sxx;i = (xi;t xi ) (xi;t xi )0 (1.9)
t=1
T
X
Sxy;i = (xi;t xi ) (yi;t y i )0 (1.10)
t=1
Les moyennes xi et yi sont dnies, pour chaque individu, dans la dimension tem-
porelle de faon traditionnelle par 8 i 2 [1; N] :
T
1X
xi = xi;t
T t=1

T
1X
yi = yi;t
T t=1
Lexpression de SCR1 fait ainsi apparatre la somme des variances individuelles
des rsidus obtenues partir des N rgressions individuelles. Lexpression Syy;i
0 1
Sxy;i Sxx;i Sxy;i correspond ainsi ( une transforme linaire prs) la variance intra-
groupe (Within variance) des rsidus.

Le modle (1.1) contraint sous lhypothse H01 scrit :

yi;t = + 0 xi;t + "i;t (1.11)

On dispose ainsi dun chantilon de T N observations pour identier les paramtres


communs et de cette relation. On applique alors les Moindres Carrs Ordinaires
sur les donnes empiles (modle pooled). La somme des carrs scrit sous la forme :
0 1
SCR1;c = Syy Sxy Sxx Sxy (1.12)

o les sommes Sk sont dnies de la faon suivante :


N X
X T
Syy = (yi;t y i )2 (1.13)
i=1 t=1
LEconomtrie des Donnes de Panel 15

N X
X T
Sxx;i = (xi;t xi ) (xi;t xi )0 (1.14)
i=1 t=1
N X
X T
Sxy;i = (xi;t xi ) (yi;t y i )0 (1.15)
i=1 t=1
Les moyennes x et y sont alors dnies sur lensemble des T N observations :
N T
1 XX
x= xi;t
NT t=1
i=1

N T
1 XX
y= yi;t
NT t=1 i=1
Lexpression SCR1;c correspond une transforme de la variance totale des rsidus
(total variance) obtenus partir de lestimation dun modle unique sur les NT donnes
empiles.

Test dhomognit des coecients i


Considrons prsent le test de lhypothse dhomognit des coecients i , note
2
H0 :
H02 : i = 8 i 2 [1; N]

Soit F2 la statistique de Fischer associe ce test. Sous lhypothse nulle, on nim-


pose aucune restriction sur les constantes individuelles i : Toujours sous lhypothse
dindpendance et de normalit des rsidus, on construit une statistique de Fischer
pour tester ces (N 1) K restrictions linaires. Sous lhypothse alternative Ha2 ; on
retrouve le modle (1.1) et NT N (K + 1) degrs de libert.

Denition 1.2. La statistique de Fischer F2 associe au test dhomognit totale H02


dans le modle (1.1) :
H02 : i = 8 i 2 [1; N]
(K;1)

scrit sous la forme suivante et suit un Fischer avec (N 1) K et NT N (K + 1)


degrs de libert :
SCR1;c0 SCR1 = [(N 1) K]
F2 = (1.16)
SCR1 = [NT N (K + 1)]
o SCR1 dsigne la somme des carrs des rsidus du modle (1.1) et SCR1;c0 la somme
des carrs des rsidus du modle contraint (modle eets individuels) :

yi;t = i + 0 xi;t + "i;t


LEconomtrie des Donnes de Panel 16

La somme des carrs des rsidus du modle non contraint, SCR1 ; est donne par
lquation (1.7). Sous lhypothse H02 ; la somme des carrs des rsidus dans le modle
eets individuels est donne par :
N
N !0 N !1 N !
X X X X
SCR1;c0 = Syy;i Sxy;i Sxx;i Sxy;i (1.17)
i=1 i=1 i=1 i=1

o les sommes Sk;i ont t dnies par les quations (1.8), (1.9) et (1.10). Cette criture
signie que dans le modle eets individuels, les estimateurs (Within) des paramtres
i et i sont obtenus en centrant les variables sur leurs moyennes individuelles respec-
tives. Nous reviendrons par la suite sur cette proprit.

Test dhomognit des constantes i


Considrons enn le dernier test dhomognit des constantes i , note H03 :

H03 : i = 8 i 2 [1; N]

Soit F3 la statistique de Fischer associe ce test. Sous lhypothse nulle, on


impose lgalit des paramtres i : Sous lhypothse dindpendance et de normalit
des rsidus, on construit une statistique de Fischer pour tester ces N 1 restrictions
linaires. Sous lhypothse alternative Ha3 ; les coecients i sont tous gaux, mais les
constantes dirent selon les individus. On a donc NT N K degrs de libert.

Denition 1.3. La statistique de Fischer F3 associe au test dhomognit totale H03


dans le modle (1.1) :
H03 : i = 8 i 2 [1; N]
scrit sous la forme suivante et suit un Fischer avec N 1 et N (T 1) K degrs de
libert :
SCR1;c SCR1;c0 = (N 1)
F3 = (1.18)
SCR1;c0 = [N (T 1) K]
o SCR1;c0 dsigne la somme des carrs des rsidus du modle (1.1) sous lhypothse
i = (modle eets individuels) et SCR1;c la somme des carrs des rsidus du
modle contraint (modle de pooled) :

yi;t = + 0 xi;t + "i;t

Les sommes des carrs des rsidus SCR1;c0 et SCR1;c ont t respectivement dnies
par les quations (1.17) et (1.12).

Il est en outre possible de tester la constance dans le temps des dirents paramtres
du panel suivant une procdure sensiblement identique (voir Hsiao 1986). Mais cette
problmatique relve plus de la notion traditionnelle de stabilit des coecients dans le
temps que de la pure application des techniques conomtriques de donnes de panel.
LEconomtrie des Donnes de Panel 17

1.3. Application

Considrons prsent une application simple de ces tests dhomognit partir de


donnes de panel relatives au nombre de grves dans le secteur industriel4 . Les donnes
annuelles couvrent 17 pays5 de lOCDE et sont disponibles de 1951 1985. Soit si;t le
nombre de jours chms pour cause de grve, pour 1000 salaris du secteur industriel,
du pays i observ la date t. Nous cherchons relier cette variable dune part au taux
de chmage de lconomie, not ui;t ; et dautre au niveau de lination, note pi;t ; selon
la relation linaire suivante :

si;t = i + i ui;t + i pi;t + "i;t 8 i = 1; ::; 17 (1.19)

Appliquons la stratgie de test dhomognit ce modle. Pour ce faire, nous


utiliserons directement les rsultats des tests programms sous TSP (version 4.3A ou
versions ultrieures). Les commandes TSP sont donc les suivantes :

load(file=strikes.wks);
panel (id=i,time=t,byid) srt u p;

La premire ligne du programme sert tout simplement lire les donnes du chier
strike.wks. La seconde ligne du programme permet dobtenir lensemble des estima-
teurs de base (pooled, between, eets xes et eets alatoires) ainsi que les rsultats
des principaux tests de spcication (tests dhomognit et test dHausman). Loption
id = i indique le nom de lindicatrice pays et loption time = t indique le nom de lindi-
catrice temporelle. Loption byid est ncessaire pour acher lensemble des rsultats
des tests de spcication6 . Les variables sont respectivement nommes srt , u et p.

Sur la gure (1.2) sont reports les rsultats destimation de cette procdure TSP.
Nous allons nous concentrer plus particulirement sur lanalyse des rsultats des tests
dhomognit. TSP propose, avec loption byid, les trois tests de Fischer prsents
prcdemment.
On observe tout dabord le panel est cylindr (balanced), cest dire quil comporte
le mme nombre de points dans la dimension temporelle pour tous les individus. On
a ici N = 17 et T = 35; soit 595 observations. Commenons tout dabord par le test
4
Les donnes ont t collectes par Bruce Western et proviennent du site
http://lib.stat.cmu.edu/datasets/
5
Le panel comporte initialement 18 pays, mais pour le pays 3, les donnes ne sont disponibles que
jusquen 1980. Cest pourquoi an de travailler sur un panel cylindr nous avons choisi de retirer ce
pays de notre chantillon.
6
Pour plus de dtails sur linstruction panel sous TSP, se reporter au manuel de programmation du
logiciel.
LEconomtrie des Donnes de Panel 18

Figure 1.2: Rsultats des Tests de Spcication sous TSP 4.3A


LEconomtrie des Donnes de Panel 19

de lhypothse dhomognit totale (test H01 dans nos notations). Ce dernier est not
sous la forme F test of A; B = Ai ; Bi dans le chier rsultat de TSP. La lettre A
dsigne ici les constantes, tandis que la lettre B dsigne le vecteur des coecients des
variables explicatives. Dans le cadre de notre chantillon, la ralisation de la statistique
de Fischer associe au test H01 , note F1 ; est de 3:8320. Le logiciel indique en outre le
nombre de degr de libert de cette statistique. Nous avons vu prcdemment que F1
suivait un Fischer avec (N 1) (K + 1) et NT N (K + 1) degrs de libert. Compte
tenu des dimensions de notre panel et du nombre de variables explicatives (K = 2),
on doit donc comparer la valeur de cette ralisation au seuil dun Fischer F (48; 544) :
Le logiciel nous donne directement la pvalue associe ce test. En loccurrence ici,
cette pvalue est trs largement infrieure au seuil de 5%, donc pour ce seuil, on rejette
lhypothse nulle H0 dgalit des constantes i et des coecients i et i :

Il convient alors de tester lhypothse H02 ; dgalit des coecients i et i (co-


ecients associs aux variables explicatives) entre les pays. Ce test est not sous la
forme F test of Ai ; B = Ai ; Bi dans le chier rsultat de TSP. Dans le cadre de
notre chantillon, la ralisation de la statistique de Fischer associe au test H02 , note
F2 ; est de 1:1845. Cette valeur est comparer au seuil dun Fischer avec (N 1) K et
NT N (K + 1) degrs de libert , cest dire ici un F (32; 544) : La pvalue indique
ici que jusquau seuil de 25%, lhypothse nulle ne peut pas tre rejete. A 5%, on con-
rme donc ici la structure de panel, puisque lon est en droit de supposer quil existe
des coecients communs pour tous les pays entre le volume des grves et les variables
explicatives que sont le chmage et lination.

Reste enn tester lhypothse H03 de constantes individuelles i : Ce test est not
sous la forme F test of Ai ; B = Ai ; B dans le chier rsultat de TSP. Dans le cadre
de notre chantillon, la ralisation de la statistique de Fischer associe au test H03 ,
note F3 ; est de 9:0342. Cette valeur est comparer au seuil dun Fischer avec N 1
et N (T 1) K degrs de libert , cest dire ici un F (16; 576) : La pvalue est trs
largement infrieure au seuil de 5%. Pour ce seuil, on rejette lhypothse nulle H0
dgalit des constantes i : Il est ncessaire dintroduire ici des eets individuels. La
spcication nale de notre modle est donc :

si;t = i + ui;t + pi;t + "i;t 8 i = 1; ::; 17 (1.20)

Reste prsent tudier les direntes mthodes destimation des modles incluant
des constantes individuelles.
LEconomtrie des Donnes de Panel 20

2. Modles eets individuels

Nous allons prsent nous des modles de panel htrognes, o la seule source
dhtrognit provient des constantes individuelles. On suppose ainsi que les coe-
cients des direntes variables stochastiques explicatives sont identiques pour tous les
individus du panel ( i = ). On suppose en outre que ces coecients sont des con-
stantes dterministes. Les constantes individuelles i ; quant elles, dirent selon les
individus.

Hypothse (H1) On suppose que les N vecteurs de paramtres i sont identiques,


i = 2 R; 8 i 2 [1; N] ; tandis que les constantes i peuvent direr selon les
individus. En particulier, il existe au moins un couple (j; i) 2 [1; N]2 tel que
j 6= i

Sous lhypothse (H1), le modle (1.1), scrit sous la forme suivante :

yi;t = i + 0 xi;t + "i;t (2.1)

o i 2 R et 0 = ( 1 2 :::: K ) 2 RK est un vecteur de constantes. Les innovations "i;t


sont supposes tre i:i:d: de moyenne nulle, de variance gale 2" ; 8 i 2 [1; N] et sont
supposes non corrles que ce soit dans la dimension individuelle ou dans la dimension
temporelle.
Ds lors, dans ce contexte, on doit distinguer deux cas : le cas o les paramtres i
sont des constantes dterministes (modle eets xes) et le cas o les paramtres i
sont des ralisations dun variable alatoire desprance et de variance nie (modle
eets alatoires). Nous allons donc successivement envisager ces deux types de modle
(sections 3 et 4). Toutefois, avant de prsenter ces deux modles, nous commencerons
tout dabord par introduire les direntes mthodes dempilement de donnes de panel
qui autorisent une criture vectorielle du modle eet individuel.

En eet, il existe deux possibilit dcriture vectorielle du modle (2.1). Autrement


dit, il existe deux faons dempiler les donnes :

1. Empilement par individus : pour une variable donne, les T ralisations his-
toriques de chaque individu sont stockes dans un vecteur colonne, et les N
vecteurs colonnes ainsi obtenus sont ensuite empils la suite des uns des autres
dans lordre des individus.
LEconomtrie des Donnes de Panel 21

2. Empilement par dates : pour une variable donne, les N ralisations individuelles
pour une date donne sont stockes dans un vecteur colonne, et les T vecteurs
colonnes ainsi obtenus pour toutes les dates sont ensuite empils la suite des
uns des autres.

Il est trs important de noter que les principaux logiciels dconomtrie (notamment
TSP) optent gnralement pour une mthode dempilement par pays. Si le logiciel
nempile pas lui mme les donnes, les sries utilises dans le cadre des applications
doivent, de faon imprative, tre ordonnes sous la forme prconise par les concepteurs
du logiciel.

2.1. Empilement par pays

Considrons tout dabord la mthode dempilement par pays. On considre un chan-


tillon de N individus sur T priodes, et un modle avec K variables explicatives. On
pose :
0 1 0 1 0 1
yi;1 x1;i;1 x2;i;1 ::: xK;i;1 "i;1
B yi;2 C B x1;i;2 x2;i;2 ::: xK;i;2 C B "i;2 C
yi = B C Xi =
@ ::: A (T;K) @ :::
B C " i = B
A (T;1) @ ::: A
C
(T;1) ::: ::: :::
yi;T x1;i;T x2;i;T ::: xK;i;T "i;T

On dnit en outre un vecteur unitaire, not e; tel que :


0 1
1
B 1 C
e =B C
(T;1) @ ::: A
1

Denition 2.1. Dans le cas de lempilement par pays, pour chaque individu 8i 2
[1; N] ; le modle (2.1) peut scrire sous la forme :

yi = ei + Xi + "i 8 i = 1; ::; N (2.2)

Cest principalement cette expression du modle (2.1) que lon utilisera par la suite
pour tudier les estimateurs du modle linaire simple. On peut toutefois crire le
modle de faon totalement vectorielle en empilant les vecteurs yi et les matrices Xi :
Pour cela on pose :
0 1 0 1 0 1
y1 X1 "1
B y2 C B X2 C B "2 C
Y =B @
C
A X =B @
C
A " =B C
(T N;1) ::: (T N;K) ::: (T N;1) @ ::: A
yN XN "N
LEconomtrie des Donnes de Panel 22

On dnit 0T le vecteur nul de dimension (T; 1) :


0 1 0 1
e 0T ::: 0T 1
B 0T e ::: 0T C B 2 C
ee = B C e =B C
(T N;N) @ ::: ::: ::: 0T A (N;1) @ ::: A
0T 0T ::: e N

On obtient alors la reprsentation vectorielle suivante :

Y = ee
e + X + " (2.3)

2.1.1. Exemple

Considrons un panel de 2 pays (N = 2), dont les donnes annuelles sont disponibles
sur 3 ans (T = 3). On cherche estimer une fonction de production log-linaire (Cobb-
Douglass), suppose commune ces deux pays. Soit yi;t le logarithme du P IB, ki;t le
logarithme du stock de capital priv et ni;t le logarithme de lemploi. On suppose que
cette fonction de production scrit sous la forme :

yi;t = i + k ki;t + n ni;t + "i;t 8 i 2 [1; 2] ; 8 t 2 [1; T ]

o k et n dsignent respectivement les lasticits (supposes communes aux deux


pays) de la production par rapport au capital et lemploi. Leet individuel i mesure
ici les spcicits a-temporelles de la productivit totale des facteurs qui correspond
dans cette rgression, aux rsidus "i;t : Ce modle scrit sous forme vectorielle de la
faon suivante :
0 1 0 1 0 1 0 1
yi;1 1 ki;1 ni;1 "i;1
@ yi;2 A = @ 1 A i + @ ki;2 ni;2 A k + @ "i;2 A
n
yi;3 1 ki;3 ni;3 "i;3

() yi = ei + Xi + "i 8 i = 1; ::; N

Lcriture vectorielle complte du modle est la suivante :


0 1 0 1 0 1 0 1
y1;1 1 0 k1;1 n1;1 "1;1
B y1;2 C B 1 0 C B k1;2 n1;2 C B "1;2 C
B C B C B C B C
B y C B B k1;3 n C B C
B 1;3 C B 1 0 C C 1 B 1;3 C k B "1;3 C
B C=B C + B C + B C
B y2;1 C B 0 1 C 2 B k2;1 n2;1 C n B "2;1 C
B C @ B C B C
@ y2;2 A 0 1 A @ k2;2 n2;2 A @ "2;2 A
y2;3 0 1 k2;3 n2;3 "2;3

() Y = ee
e + X + "
LEconomtrie des Donnes de Panel 23

2.2. Empilement par dates

De faon parallle, il est possible de reprsenter de faon symtrique le modle (2.1)


en utilisant la mthode dempilement par dates. Pour ce faire, il sut de poser les
dnitions suivantes :
0 1 0 1 0 1
y1;t x1;1;t x2;1;t ::: xK;1;t "1;t
B y2;t C B x1;2;t x2;2;t ::: xK;2;t C B "2;t C
yt = B C
@ ::: A (N;K) Xt = B@ :::
C
A "t = B
@ ::: A
C
(N;1) ::: ::: ::: (T;1)
yN;t x1;N;t x2;N;t ::: xK;N;t "N;t

Denition 2.2. Dans le cas de lempilement par dates, pour chaque date t 2 [1; T ] ;
le modle (2.1) peut scrire sous la forme :

e + Xt + "t
yt = 8 t = 1; ::; T (2.4)

De la mme faon, il est possible dexprimer le modle (2.1) sous une forme vecto-
rielle complte. On pose :
0 1 0 1 0 1
y1 X1 "1
B y2 C B X2 C B "2 C
Y =B @ ::: A
C X =B @ :::
C
A " =B C
(T N;1) (T N;K) (T N;1) @ ::: A
yT XT "T

Soit IN la matrice identit de dimension (N; N) : On dnit la matrice suivante :


0 1
IN
B IN C
e
ee = B C
(T N;N) @ ::: A
IN

Il vient alors :
Y =e
ee
e + X + " (2.5)

2.2.1. Exemple

Reprenons lexemple prsent prcdemment. Lorsque les donnes sont empiles par
dates, ce modle scrit sous forme vectorielle de la faon suivante :

y1;t 1 k1;t n1;t k "1;t
= + +
y2;t 2 k2;t n2;t n "2;t

() yt =
e + Xt + "t 8 t = 1; ::; T
LEconomtrie des Donnes de Panel 24

Lcriture vectorielle complte du modle est la suivante :


0 1 0 0 1 0 1
y1;1 1 k1;1 n1;1 "1;1
1 0 B k2;1
B y2;1 C B 0 1 C B n2;1 CC B "2;1 C
B C B C B C B C
B C B B C
B y1;2 C B 1 0 C C 1 B k1;2
B n1;2 CC k B "1;2 C
B C = + + B C
B y2;2 C B 0 1 C 2 B k2;2 n C B "2;2 C
B C B @
C
A
B
B
2;2 C
C
n
B C
@ y1;3 A 1 0 @ k1;3 @ A
n1;3 A "1;3
y2;3 0 1 "2;3
k2;3 n2;3

() Y = e
ee
e + X + "

Maintenant que nous avons prsent lcriture vectorielle des modles de panel
eets individuels, nous allons prsent tudier les proprits des estimateurs des
paramtres de ces modles suivant la spcication des eets individuels. Nous dis-
tinguerons pour cela deux cas : le cas des eets xes et le cas des eets alatoires.
LEconomtrie des Donnes de Panel 25

3. Modle eets xes

On fait maintenant lhypothse que les eets individuels i sont reprsents par des
constantes (do lappellation modle eets xes). Nous allons dterminer la forme
gnrale des estimateurs des paramtres i et dans ce modle eets xes. On
considre donc le modle (1.1) sous lhypothse (H1) :

yi;t = i + 0 xi;t + "i;t 8 i 2 [1; N] ; 8 t 2 [1; T ] (3.1)

o i 2 R, 0 = ( 1 2 :::: K ) 2 RK . Tous les paramtres du modle sont des constantes


et lon suppose pour simplier quil nexiste pas deet temporel. On dnit le vecteur
"i tel que :
0
"i = "i;1 "i;2 ::: "i;T
(T;1)

Pour tudier les proprits des estimateurs du modle eets xes, nous allons
faire une hypothse supplmentaire sur la nature du processus des rsidus "i;t : Cette
hypothse constitue tout simplement la gnralisation dans la dimension de panel de
la dnition dun bruit blanc.

Hypothse (H2) On suppose que les rsidus "i;t sont i:i:d: et satisfont les conditions
suivantes, 8 i 2 [1; N] ; 8 t 2 [1; T ]
E ("i;t ) = 0
2" t=s
E ("i;t "i;s ) = ; ce qui implique que E ("i "0i ) = 2" IT o It dsigne
0 8t 6= s
la matrice identit (T; T ) :
E ("i;t "j;s ) = 0; 8j 6= i; 8 (t; s)

La premire condition impose tout simplement que lesprance des rsidus du mod-
le (3.1) soit nulle. La seconde condition, standard en conomtrie des sries tem-
porelles, impose que le processus "i;t soit un processus sans mmoire (dans la di-
mension temporelle). Pour chaque individu, il nexiste ainsi aucune corrlation entre
le niveau prsent du processus "i;t et les ralisations passes. Seule la variance du
processus "i;t est non nulle. Lintroduction dune dimension individuelle, nous oblige
ici dnir une seconde contrainte qui est que tous les processus individuels "i;t ont
la mme variance 2" quel que soit lindividu considr. Autrement dit, la matrice de
variance covariance du processus "i est proportionnelle, un scalaire prs, la matrice
identit. Enn, la troisime condition stipule quil nexiste aucune corrlation entre
les processus dinnovation pour deux individus distincts et cela quelle que soit la date
considre.
LEconomtrie des Donnes de Panel 26

3.1. Estimateur Within ou LSDV

Considrons lcriture vectorielle du modle obtenue par un empilement des donnes


par pays.
yi = e i + Xi + "i 8 i = 1; ::; N (3.2)
(T;1) (T;1) (T;K)(K;1) (T;1)

Lestimateur des Moindres Carrs Ordinaires (MCO) des paramtres i et dans


le modle eets xes est appel estimateur W ithin; ou estimateur eets xes ou
estimateur LSDV (Least Square Dummy Variable). Comme nous lavons vu, le terme
W ithin sexplique par le fait cet estimateur tient compte de la variance intra groupe de
la variable endogne. La troisime appellation LSDV tient au fait que cet estimateur
conduit introduire des variables dummies, qui dans la spcication (3.2) correspondent
aux vecteurs colonnes de e:

On peut dmontrer que sous lhypothse (H2), lestimateur des Moindres Carrs
Ordinaires (MCO) des paramtres i et du modle (3.2) est le meilleur estimateur
linaire sans biais (BLUE 7 ). Si lon suppose que " est connu, cet estimateur est
obtenu en minimisant la variance des rsidus empiriques, note S; par rapport aux
seuls paramtres i et :
N
X N
X
min S= "0i "i = (yi ei Xi )0 (yi ei Xi )
fi ;gN
i=1 i=1 i=1

La premire condition ncessaire de ce programme; nous donne immdiatement


lexpression de lestimateur de la constante i , 8 i 2 [1; N] :
0
b i = y i b LSDV xi
(3.3)

o les termes y i et xi dsignent les moyennes individuelles des variables endognes et


exognes.
T T
1X 1X
yi = yi;t xi = xi;t 8 i 2 [1; N] (3.4)
(1;1) T t=1 (K;1) T t=1
Ces moyennes sont donc calcules de faon traditionnelle dans la dimension tem-
porelle, et cela pour chaque individu de lchantillon. Cest pourquoi elles sont indices
en i:
A partir de la seconde condition ncessaire du programme de minimisation, on
montre que lestimateur du paramtre vectoriel est donn par la relation suivante :
"N T #1 " N T #
XX XX
bLSDV = (xi;t xi ) (xi;t xi )0
(xi;t xi ) (yi;t yi ) (3.5)
i=1 t=1 i=1 t=1

7
Best Linear Unbiased Estimator
LEconomtrie des Donnes de Panel 27

Proposition 3.1. Lestimateur W ithin ou LSDV de ; obtenu dans le modle eets


individuels xes (3.2) est identique lestimateur des MCO obtenu partir dun modle
transform o les variables expliques et explicatives sont centres sur leur moyennes
individuelles respectives :
0
(yi;t y i ) = b (xi;t xi ) + "i;t 8 i 2 [1; N] ; 8 t 2 [1; T ] (3.6)

Les ralisations des estimateurs des constantes i sont alors dduits de la relation :
0
b i = y i b xi

En eet, on voit daprs lquation (3.5), que lestimateur W ithin des coecients
de peut tre obtenu en centrant les direntes (variables endogne et exognes) sur
les moyennes individuelles respectives. Ainsi, on peut obtenir le mme estimateur en
utilisant le modle transform suivant 8 i 2 [1; N] ; 8 t 2 [1; T ] :

yei;t = 0 x
ei;t + "i;t

avec yei;t = (yi;t y i ) et x


ei;t = (xi;t xi ). En eet, dans ce cas on obtient :
"N T #1 " N T #
XX XX
b = x e0i;t
ei;t x ei;t yei;t
x
i=1 t=1 i=1 t=1
"N T #1 " N T #
XX 0
XX
= (xi;t xi ) (xi;t xi ) (xi;t xi ) (yi;t y i )
i=1 t=1 i=1 t=1

On reconnat ici lexpression gnrale de lestimateur W ithin bLSDV : Reste alors


obtenir les ralisations des estimateurs des constantes individuelles selon la formule :
0
b 1 = y 1 b x1

0
b 2 = y 2 b x2

::::
0
bN
= y N b xN

Le fait quil soit quivalent destimer les paramtres du modle (3.2) directement
partir de cette spcication incluant des dummies individuelles ou partir dun modle
transform o les variables sont centres sur leurs moyennes individuelles respectives
est particulirement important. Cela illustre la notion de variance intra-classes qui
est fondamentale dans la construction de lestimateur Within. Nous allons prsent,
proposer une illustration de cette proprit de lestimateur W ithin:
LEconomtrie des Donnes de Panel 28

3.2. Application

Considrons nouveau lexemple du modle de grves dans le secteur industriel. Nous


avons tabli prcdemment que le modle de panel comportait des eets individuels et
pouvait scrire sous la forme:

si;t = i + ui;t + pi;t + "i;t 8 i = 1; ::; 17 (3.7)

o si;t dsigne le nombre de jours chms pour cause de grve, pour 1000 salaris
du secteur industriel, ui;t dsigne le taux de chmage de lconomie et pi;t le taux
dination. On suppose que lon peut spcier les eets individuels i sous la forme
deets xes. Dans le programme ci-dessous, on cherche comparer lestimateur Within
et lestimateur des MCO du modle transform :

(si;t si ) = (ui;t ui ) + (pi;t pi ) + "i;t (3.8)

Linstruction panel de TSP avec les options notot, nobet et novar permet dobtenir
directement et uniquement les rsultats de lestimation W ithin: Pour construire les es-
timateurs du modle transform, on doit au pralable centrer les variables sur leur
moyennes individuelles respectives. Pour raliser cette opration on construit une
boucle sur les N = 17 individus, avec un compteur j et chaque tape on slectionne
un pays dont le code pays (variable i) est gal la valeur du compteur j (instruc-
tion select i = j). Pour le sous chantillon slectionn, linstruction msd [Nom de
la Variable] permet alors de calculer dirents moments de la variable considre sans
les acher (si lon ajoute loption noprint). En particulier, la moyenne empirique est
stocke dans la variable rserve @mean. Ds lors, pour chaque individu, on construit
de nouvelles variables en centrant sur les moyennes individuelles correspondantes. En-
n, il ne reste plus qu eectuer la rgression par les MCO sur le modle transform
(instruction ls ou ols)

load(file=strikes.wks);
?---- Estimation Within ----
panel (id=i,time=t,notot,nobet,novar) srt u p;
?---- Centrer les Donnes ---
do j=1 to 17;
select (i=j);
msd(noprint) srt;
srtc=srt-@mean;
msd(noprint) u;
uc=u-@mean;
msd(noprint) p;
LEconomtrie des Donnes de Panel 29

pc=p-@mean;
enddo;
?---- Estimation Modle Transform----
ls srtc uc pc;
?---- Affichage des Effets Fixes (Instruction Panel) ----
print @fixed;

Les rsultats de ce programme sont reproduits sur la gure (3.1). On vrie que
lestimateur W ithin est totalement quivalent lestimateur des MCO appliqu sur
un modle transform o les variables endognes et exognes ont t centres sur leurs
moyennes individuelles respectives. Dans les deux cas, les ralisations des estimateurs
des coecients des deux variables explicatives (respectivement ui;t et pi;t ) sont stricte-
ment identiques (respectivement 21:5968 et 16:2729).
Dans le cas o lon utilise la commande panel de TSP, on peut acher les esti-
mations des eets xes en utilisant la commande print @fixed. Dans le cas o lon
utilise le modle transform, il convient alors de reconstruire les estimateurs des ef-
fets xes selon la formule (3.3) en utilisant les moyennes individuelles des variables
(cf. programme ci-dessus) et les ralisations des estimateurs des coecients et .
Essayons prsent de commenter les estimations ainsi obtenues. Il savre ainsi que
le pays 9 a, de faon structurelle, le plus de journes chmes pour cause de grve.
Pour ce pays, dirents facteurs historiques (lgislation sur le droit de grve) ou soci-
ologique (reprsentation des syndicats par exemple) expliquent que toutes choses gales
par ailleurs (chmage et ination), la frquence des grve soit particulirement lve.
A linverse, les pays 15 et 2 ont des eets xes ngatifs. Pour un mme niveau de ch-
mage et dination, ces deux pays auront le nombre de jours chms le plus faible de
tout notre chantillon. Il faut bien comprendre que les estimations des eets individu-
els ne peuvent sanalyser quen niveau relatif (cest dire en comparant les direntes
ralisations individuelles) et non en niveau absolu.
LEconomtrie des Donnes de Panel 30

Figure 3.1: Comparaison des Estimateurs Whithin et OLS sur Modle Transform
LEconomtrie des Donnes de Panel 31

3.3. Ecriture vectorielle

Une faon quivalente dobtenir lestimateur W ithin et de montrer lquivalence avec le


modle transform o les variables sont centres, consiste travailler directement avec
lcriture vectorielle (3.2). Par la suite, nous adopterons souvent cette notation vecto-
rielle qui permet dallger particulirement les notations du modle et des estimateurs
correspondants. On considre donc le modle vectoriel suivant :

yi = ei + Xi + "i 8 i = 1; ::; N (3.9)

Nous allons prsent introduire un oprateur matriciel qui permet de centrer les
variables sur leurs moyennes individuelles respectives.

Denition 3.2. Le modle (3.9) eet individuels xes peut scrire sous la forme
vectorielle suivante 8 i = 1; ::; N :

Qyi = QXi + Q"i

o la matrice Q de dimension (T; T ) est telle que :


1 0
Q = IT ee (3.10)
T
Lestimateur W ithin du vecteur est alors dni de la faon suivante :
"N #1 " N #
X X
b LSDV = Xi0 QXi Xi0 Qyi (3.11)
i=1 i=1

En eet, on peut montrer que les processus transforms Qyi et QXi correspondent
aux variables centres sur leurs moyennes respectives. En eet, on montre que :
0 1 0 1
yi;1 ! 1
XT
1 1 0 B yi;2 C B 1 C
Qyi = IT ee0 yi = yi e e yi = B C 1 yi;t B C
T T @ ::: A T t=1 @ ::: A
yi;T 1

De la mme faon, on peut montrer que :


1 0
QXi = Xi ee Xi
T
0 1 0 1
x1;i;1 x2;i;1 ::: xK;i;1 1
B x1;i;2 xK;i;2 C B 1 C
QXi = B
x2;i;2 ::: C 1 B C PT x1;i;t PT x2;i;t ::: PT xK;i;t
@ ::: ::: ::: ::: A T @ ::: A t=1 t=1 t=1

x1;i;T x2;i;T ::: xK;i;T 1


LEconomtrie des Donnes de Panel 32

Ds lors, an dliminer les eets individuels de lquation (3.9), il sut de prmul-


tiplier les membres de cette quation par Q. Ainsi 8 i = 1; ::; N

Qyi = Qei + QXi + Q"i

() Qyi = QXi + Q"i

En appliquant les MCO cette expression on obtient donc une criture quivalente
b
de LSDV :
"N #1 " N #
X X
b LSDV = 0
X QXi 0
X Qyi (3.12)
i i
i=1 i=1
LEconomtrie des Donnes de Panel 33

4. Modle eets alatoires

Dans la pratique standard de lanalyse conomtrique, on suppose quil existe un grand


nombre de facteurs qui peuvent aecter la valeur de la variable explique et qui pour-
tant ne sont pas introduits explicitement sous la forme de variables explicatives. Ces
facteurs sont alors approxims par la structure des rsidus. Le problme se pose de
la faon similaire en conomtrie de panel. La seule dirence tient au fait que trois
types de facteurs omis peuvent tre envisags. Il y a tout dabord les facteurs qui af-
fectent la variable endogne diremment suivant la priode et lindividu considr. Il
peut en outre exister des facteurs qui aectent de faon identique lensemble des indi-
vidus, mais dont linuence dpend de la priode considre (eets temporel). Enn,
dautres facteurs peuvent au contraire reter des dirences entre les individus de type
structurelles, cest dire indpendantes du temps (eets individuel).

Ds lors le rsidu, not "i;t ; dun modle de panel peut tre dcompos en trois
principales composantes de la faon suivante (Hsiao 1986) 8 i 2 [1; N] ; 8 t 2 [1; T ] :

"i;t = i + t + vi;t (4.1)

Les variables i dsignent ici les eets individuels qui reprsentent lensemble des
spcicits structurelles ou a-temporelles de la variable endogne, qui dirent selon
les individus. On suppose ici que ces eets sont alatoires. Les variables alatoires
t reprsentent quant elle les eets temporels strictement identiques pour tous les
individus. Enn, le processus stochastique vi;t dsigne la composante du rsidu total "i;t
orthogonale aux eets individuels et aux eets temporels. Gnralement, on est conduit
faire un certain nombre dhypothses techniques sur cette structure de rsidus.

Hypothses (H3) On suppose que les rsidus "i;t = i +t +vi;t sont i:i:d: et satisfont
les conditions suivantes, 8 i 2 [1; N] ; 8 t 2 [1; T ]
E (i ) = E (t ) = E (vi;t ) = 0
E (i t ) = E (t2vi;t ) = E (i vi;t ) = 0
i=j
E (i j ) =
0 8i 6= j
2
t=s
E (t s ) =
0 8t 6= s
2
v t = s; i = j
E (vi;t vj;s ) =
0 8t
6= s; 8i 6= j
E i x0i;t = E t x0i;t = E vi;t x0i;t = 0
LEconomtrie des Donnes de Panel 34

Sous ces hypothses, la variance de la variable endogne yi;t conditionnellement aux


variables explicatives xi;t est alors gale 2y = 2 + 2 + 2v . Les variances 2 , 2 et
2v correspondent aux direntes composantes de la variance totale. Cest pourquoi, le
modle eets alatoires est aussi appel modle erreurs composs (error component
model).

Dans une premire tape, nous allons prsenter le modle simple eets individuels
alatoires. Nous supposerons ainsi, pour simplier lanalyse, quil nexiste pas deet
temporel. Nous proposerons alors une criture vectorielle du modle eets alatoires.
Dans une seconde tape nous tudierons les estimateurs des dirents coecients de ce
modle.

4.1. Modle variance compose

On se limite au cas o il nexiste pas deet temporel (t = 0; 8t). On considre donc


le modle suivant 8 i 2 [1; N] ; 8 t 2 [1; T ] :

yi;t = + 0 xi;t + "i;t (4.2)

"i;t = i + vi;t (4.3)


o 0 = ( 1 2 :::: K ) est un vecteur de constantes et le processus f"i;t g satisfait les
hypothses (H3 ). La constante dsigne ici lesprance inconditionnelle du processus
y;i;t puisque on suppose que E (i ) = 0; 8 i 2 [1; N] :

Proposition 4.1. Le modle eets individuels alatoires scrit vectoriellement sous


la forme :
yi = X ei + "i 8 i = 1; ::; N (4.4)
(T;1) (T;K+1)(K+1;1) (T;1)

ei = (e; Xi ) et 0 = ; 0 : Sous les hypothses (H3 ), la matrice
avec "i = i e + vi ; X
de variance covariance de "i ; note V; est alors dnie par :

V = E "i "0i = E (i e + vi ) (i e + vi )0 = 2 ee0 + 2v IT (4.5)

Linverse de cette matrice de variance covariance est dnie comme :



1 1 2
V = 2 IT ee0 (4.6)
v 2v + T 2

Donnons ici une dmonstration possible de ce rsultat8 . On pose Ve = V 1 : Par


dnition on a Ve V = V Ve = IT : On en dduit que :

V Ve = 2 ee0 Ve + 2v Ve = IT () 2v Ve = IT 2 ee0 Ve
8
Pour une dmonstration plus lgante voir Graybill (1969), Nerlove (1971), Wallace et Hussain
(1969)
LEconomtrie des Donnes de Panel 35

Reste alors dterminer lexpression de ee0 Ve : Raisonnons par une mthode de


coecient indtermin. On suppose que ee0 Ve peut scrire sous la forme ee0 o 2 R+ .
Considrons lexpression de ee0 Ve V en substituant ee0 Ve par son expression, il vient :

ee0 Ve V = ee0 V

= ee0 2 ee0 + 2v IT

= 2 e e0 e e0 + 2v ee0

Par dnition de Ve ; on a ee0 Ve V = ee0 : Sachant que e (e0 e) e0 = T ee0 ; on obtient


alors la relation suivante :
ee0 Ve V = ee0

() ee0 2 T + 2v = ee0

On en dduit immdiatement la valeur du paramtre :


1
= 2 R+
2 T + 2v

On obtient ainsi :
0e 1
ee V = ee0
T + 2v
2

Ds lors, en reprenant lexpression de Ve , il vient :



2e 2
v V = IT ee0
2 T + 2v

Ainsi, linverse de la matrice de variance covariance des "i scrit sous la forme :

1 1 2
V = 2 IT ee0
v 2v + T 2

Lcriture vectorielle du modle eets alatoires de la proposition (4.1) nous sera


particulirement dans la section suivante pour construire les estimateurs des dirents
paramtres de ce modle.

4.2. Estimateurs du modle eets alatoires

Nous allons prsent nous intresser aux proprits des estimateurs du modle ala-
toire. Pour bien comprendre ces proprits, il est ncessaire de bien apprhender les
consquences de la structure des rsidus.
LEconomtrie des Donnes de Panel 36

Remark 1. Dans le modle de la proposition (4.1), le fait que les eets individuels
i constituent lune des composantes des rsidus "i du modle (4.4), induit une cor-
rlation entre le niveau de ces rsidus lorsque lon considre un individu donn. En
revanche, sous (H3 ), il nexiste pas de corrlation de ces rsidus dans la dimension
inter individuelle.

Quelles sont alors les consquences de cette structure des rsidus ? Si lon raisonne
en termes de biais destimation, il ny en a aucune ds lors que lon centre les variables du
modle sur leur moyenne respective. En eet, dans ce cas la composante individuelle des
rsidus disparat et les corrlations inter-individuels des rsidus du modle transform
disparaissent par la mme occasion. Pour le vecteur ; on retrouve alors la forme
gnrale de lestimateur du modle eets xes. Pour preuve, appliquons loprateur
Q au modle eet alatoire :

Qyi = Qe + QXi + Qei + Qvi



Or, on sait par dnition de lapplication que Qe = IT T 1 ee0 e = 0: Ds lors,
on obtient le modle 8 i 2 [1; N] :

Qyi = Qe + QXi + Qvi (4.7)

Dans ce modle, sous (H3 ), lestimateur bLSDV du vecteur est non biais et
convergent 9 . Lestimateur de la constante est alors construit sous la forme :
0
b = y b LSDV x
(4.8)

avec :
N T N T
1 XX 1 XX
yi = yi;t x = xi;t (4.9)
(1;1) NT t=1
(K;1) NT t=1
i=1 i=1
Ainsi, il nexiste pas de problme de biais lorsque lon envisage les techniques des-
timation utilises dans les modles eets xes, cest dire lorsque lon centre les
variables sur leurs moyennes individuelles respectives. Toutefois, lestimateur bLSDV
ainsi obtenu nest pas un estimateur variance minimale : cest pas lestimateur BLUE:

Proposition 4.2. Dans un modle eets alatoires, lestimateur Within bLSDV ;


obtenu sous lhypothse deets xes, est un estimateur sans biais et convergent du
vecteur de paramtres : Toutefois, ce nest pas lestimateur BLUE. Un estimateur
BLUE est alors donn par lestimateur de Moindres Carrs Gnraliss (MCG).
9
On a en eet :
p
b !
LSDV
NT !1

o lindice p dsigne la convergence en probabilit (voir section prcdente pour une dmonstration).
LEconomtrie des Donnes de Panel 37

Nous ne donnerons pas ici de dmonstration de cette proprit. Si lon rsume, quelle
que soit la nature des eets individuels (xes ou alatoires), lestimateur Within est un
estimateur sans biais et convergent. Toutefois, cette estimateur nest pas un estimateur
variance minimale lorsque les eets individuels sont alatoires. Un estimateur BLUE
possible du vecteur est alors donn par lestimateur de Moindres Carrs Gnraliss
(MCG). Cette proprit sera particulirement intressante lorsquil sera ncessaire de
discriminer les deux modles et de construire les tests de spcication appropris (test
dHausman 1978, en particulier).

4.3. Estimateur des Moindres Carrs Gnraliss

Nous avons vu que dans un modle eets alatoires, un estimateur BLUE peut tre
construit partir de lestimateur des Moindres Carrs Gnraliss (MCG). Considrons
le modle vectoriel de la proposition (4.1) :

e i + "i
yi = X 8 i = 1; ::; N (4.10)

ei = (e; Xi ) et 0 = ; 0 : Soit V la matrice de variance covariance
avec "i = i e+vi ; X
du vecteur des rsidus "i : V = E ("i "0i ) : On suppose, dans un premier temps, que V
est connue. Le problme est que, du fait de la structure du modle, la matrice V nest
pas diagonale en raison de la prsence de corrlations intra-individuelles des rsidus.
Tout comme en sries temporelles, cest pourquoi on applique alors les MCG.

Denition 4.3. Si la matrice V est connue, lestimateur des MCG du vecteur ; not
bMCG ; est alors dni par la relation :

"N #1 " N #
X X
bMCG =
ei0 V 1 X
X ei ei0 V 1 yi
X (4.11)
i=1 i=1

Cette dnition de lestimateur b MCG correspond la dnition gnrale (iden-


tique celle utilise en srie temporelle, cf. Bourbonnais 2000) des Moindres Carrs
Gnraliss. Bien entendu, lorsque la matrice V nest pas connue, lestimateur bMCG
est obtenu en deux tapes. La premire tape consiste appliquer lestimateur W ithin
pour obtenir une premire estimation sans biais et convergente des paramtres et
: A partir de ces estimations, on construit les sries de rsidus individuels "i et lon
construit un estimateur Vb de la matrice de variance covariance V: La seconde tape
consiste alors appliquer lestimateur des MCG selon la formule (4.11) en utilisant
lestimateur Vb de V:

Il existe une autre faon dobtenir lestimateur des MCG. En eet, dans la pratique,
la procdure en deux tapes, utilise dans les principaux logiciels dconomtrie, nest
LEconomtrie des Donnes de Panel 38

pas exactement similaire celle que nous venons de dcrire10 . Lestimateur des MCG
est construit partir dune relation existant entre cet estimateur et les estimateurs
Between et Within (Maddala 1971).

Sous les hypothses (H3 ), nous avons vu (proposition 4.1) que linverse de la matrice
de variance covariance V pouvait scrire sous la forme :

1 2
V 1 = 2 IT ee0
v 2v + T 2
Denition 4.4. On pose que la matrice V 1 peut tre exprime sous la forme alter-
native suivante :
1 1
V 1 = 2 Q + ee0 (4.12)
v T
avec Q = (IT ee0 =T ) et o le paramtre est dni par la relation :


2v
= (4.13)
2v + T 2
Reprenons alors lexpression de lestimateur des MCG (4.11) et substituons cette
nouvelle expression de V 1 : On obtient alors :
"N #1 "X #
X 1
N
1
bMCG =
ei0 Q + ee0 X
X ei ei0 Q + ee0 yi
X
T T
i=1 i=1
"N N
#1 " N N
#
X 1 X X 1 X
() bMCG = Xei0 QX
ei + ei0 ee0 X
X ei ei0 Qyi +
X ei0 ee0 yi
X
T T
i=1 i=1 i=1 i=1

Sachant que X ei = (e Xi ) et = ; on peut montrer que ces dirents termes
0 0

peuvent se rcrire sous la forme suivante :


2 31
PN 0 2 3
NT y
bMCG
6 NT T xi 7
6 i=1 7 4 P N PN 5
bMCG = 4 PN P
N PN 0
5 X 0 Qy + T
i x i y i
T xi Xi0 QXi + T xi xi i=1
i
i=1
i=1 i=1 i=1

A partir de la formule de linverse dune matrice partitionne, on montre que :


" N N
#1 " N N
#
1 X X 1 X X
b MCG = Xi0 QXi + (xi x) (xi x)0 Xi0 Qyi + (xi x) (y i y)0
T T
i=1 i=1 i=1 i=1
(4.14)
Introduisons prsent lestimateur Between, qui est construit partir des N moyennes
individuelles des variables endognes et exognes, centres sur la moyenne totale (du
fait de la prsence dune constante).
10
Mais sur le fond, les deux procdures sont strictement identiques. Seules leurs mises en oeuvre
pratique et lexpression utilise pour lestimateur des MCG dirent.
LEconomtrie des Donnes de Panel 39

Denition 4.5. Lestimateur inter-classe Between, est lestimateur des Moindres Car-
rs Ordinaires obtenu dans la spcication 8 i 2 [1; N] :

y i = c + 0 xi + "i (4.15)

Soit b BE lestimateur Between du vecteur :


"N #1 " N #
X X
bBE = (xi x) (xi x)0 (xi x) (y i y)0 (4.16)
i=1 i=1

A partir de lquation (4.14), on montre immdiatement que lestimateur des MCG


du modle eets alatoires est une moyenne pondre de lestimateur Between bBE
(quation 4.16) et de lestimateur Within b LSDV (quation 3.11).

Proposition 4.6. Sous les hypothses (H3 ), lestimateur des MCG des coecients
du modle eets alatoires, not bMCG ; est une moyenne pondre des estimateurs
Between b BE et Within bLSDV :

bMCG = bBE + (IK ) b LSDV (4.17)

o les poids dtermins par la matrice sont dnis par la relation :


"N N
#1 " N #
X X 0
X 0
0
= T Xi QXi + T (xi x) (xi x) (xi x) (xi x) (4.18)
i=1 i=1 i=1

Essayons prsent dinterprter ces pondrations et en particulier linuence du


paramtre : Revenons lquation (4.14) de lestimateur des MCG :
" N N
#1 " N N
#
1 X X 1 X X
b MCG = Xi0 QXi + (xi x) (xi x)0 Xi0 Qyi + (xi x) (y i y)0
T T
i=1 i=1 i=1 i=1

On peut montrer que si le paramtre est gal 1, lestimateur des MCG corre-
spond exactement lestimateur des MCO du modle pooled ( voir annexe A.1). Dans
le cas, o = 0, lestimateur des MCG correspond lestimateur du modle eets
xes : "N #1 " N #
X X
b MCG = bLSDV = Xi0 QXi Xi0 Qyi
i=1 i=1

Remark 2. Ainsi, le paramtre qui intervient dans la construction de la matrice de


poids mesure le poids qui doit tre attribu la variance inter classe (Between). Dans
le cas, o = 0 on retrouve lestimateur W ithin fond uniquement sur la variance intra
individuelle.
bMCG ! bLSDV (4.19)
!0
LEconomtrie des Donnes de Panel 40

Dans le cas complmentaire, = 1; on retrouve lestimateur du modle pooled qui tient


compte de la variance totale cest dire la fois de la variance intra individuelle et
inter individuelle.
b MCG ! b pooled (4.20)
!1

Si lon reprend la dnition du paramtre ; on montre que :



2v
= lim = 0 (4.21)
2v + T 2 T !1

Ds lors, N x, lorsque la dimension temporelle du panel tend vers linni les


estimateurs MCG et Within sont confondus :

bMCG ! bLSDV
T !1

Cette proprit sera particulirement utile pour comprendre la construction du test


de spcication dHausman.

On constate ainsi, que lorsque 2 ]0; 1[, la structure avec eets individuels ala-
toires constitue une solution intermdiaire entre le modle sans eet individuel (totale-
ment homogne) et le modle avec eets xes (totalement htrogne).

Remark 3. Lintroduction deets individuels alatoires permet dobtenir une spci-


cation intermdiaire entre le modle sans eet individuel et le modle avec eets xes.
Lhypothse dune distribution commune des eets individuels permet une dadopter une
structure ni totalement homogne ni totalement htrogne, dans les eets individuels
ont en commun une distribution identique.

On peut enn dmontrer que la dirence entre la matrice de variance de lesti-


mateur MCG et matrice de variance de lestimateur W ithin est gale une matrice
dnie positive (Rao 1972, Thiel 1971). En eet :
"N #1
X N
X
var b MCG = 2v Xi0 QXi + T (xi x) (xi x)0 (4.22)
i=1 i=1
P PN
On suppose que les quantits (1=NT ) N 0
i=1 Xi QXi et (1=NT )
0
i=1 Xi Xi conver-
gent vers des matrices dnies positives. Puisque le paramtre > 0; on vrie que
lestimateur des MCG (estimateur BLUE) a toujours une variance infrieure celle de
lestimateur W ithin.
var b MCG var bLSDV
LEconomtrie des Donnes de Panel 41

Ce rsultat conrme le fait que sous les hypothses ( H3 ); dans un modle eets
alatoires, lestimateur MCG est toujours prfrable lestimateur W ithin. Sachant
que le paramtre tend vers 0 lorsque T ! 1; on en dduit immdiatement que la
dirence disparat pour des panels de dimension temporelle innie :
bMCG ! bLSDV
T !1

Dans le cas o la matrice de variance covariance V nest pas connue, il est ncessaire
comme nous lavons dit prcdemment de procder en deux tapes. Dans une premire
tape on estime les variances des direntes composantes des rsidus. Pour cela on
estime le modle eets xes bLSDV , et lon construit les estimateurs des variances
intra et inter individuelles :

Denition 4.7. Les estimateurs des variances des composantes intra classe et inter
classe des rsidus du modle eets alatoires sont respectivement donns par :
PN PT h 0
i2
(yi;t y i ) b LSDV (xi;t xi )
b2v = i=1 t=1
(4.23)
N (T 1) K
N
P 0
2
y i bLSDV xi
1 2
b2 = i=1
b (4.24)
N K 1 T v
On en dduit alors lestimateur b du paramtre selon :

b b2v

= (4.25)
b2v + T
b2
A laide des ralisations de lestimateur Between on construit la matrice de poids
: Dans une seconde tape, on applique directement la formule (4.11) des MCG ou
lon utilise la somme pondre (4.17).

Proposition 4.8. Lestimateur des MCG construit en deux tapes converge asymp-
totiquement (NT ! 1) vers lestimateur des MCG obtenu dans le cas o la matrice
de variance covariance V est connue. Mme dans le cas de petits chantillons (T 3
et N (K + 1) 9), la procdure en deux tapes reste plus ecace que lestimateur
W ithin; dans le sens o la dirence entre la matrices de variances covariances des
MCG et celle de lestimateur reste une matrice dnie positive.

Nous ne proposerons pas ici de dmonstration de cette proposition (cf. Fuller and
Battese 1974, Taylor 1980). Mais cela conrme lide que quelle que soit la taille du
panel, lestimateur des MCG est plus ecace que lestimateur Within. Proposons
prsent une application de ces dirents rsultats.
LEconomtrie des Donnes de Panel 42

4.4. Une application

Reprenons lapplication propose la section prcdente. On considre le modle suiv-


ant :
si;t = c + ui;t + pi;t + vi;t 8 i = 1; ::; 17 (4.26)

"i;t = i + vi;t (4.27)

o si;t dsigne le nombre de jours chms pour cause de grve, pour 1000 salaris
du secteur industriel, ui;t dsigne le taux de chmage de lconomie et pi;t le taux
dination. On suppose ici que lon peut spcier les eets individuels i sous la forme
deets alatoires et que les rsidus "i;t = vi;t + i satisfont les hypothses (H3 ). Si lon
ne dsire que les ralisations de lestimateur des MCG du modle alatoire, lexclusion
de tout autre estimateur, le programme TSP est alors le suivant :

load(file=strikes.wks);
?---- Estimation Modle Effets Alatoires ----
panel (id=i,time=t,nowhit,nobet,nowithin) srt u p;

Les rsultats de ce programme, reproduits sur la gure (4.1) sont bien entendu
totalement identiques ceux de la gure (1.2).

Figure 4.1: Estimation Modle Eets Alatoires


LEconomtrie des Donnes de Panel 43

Contrairement au cas de lestimateur W ithin o il ny avait que deux coecients


(en dehors des eets xes), les rsultats de lestimation du modle eets alatoires font
apparatre 3 ralisations destimateurs des coecients du chmage (u), de lination (p)
et dune constante (c): Le coecient associ cette constante correspond lestimateur
de la moyenne des eets individuels.

E (i ) = c (4.28)

On peut vrier dailleurs que cette ralisation est approximativement gale la


moyenne des ralisations des estimateurs de eets individuels dans le cas du modle
eets xes (gure 3.1).

On dispose en outre de trois informations supplmentaires :

b2v .
1. une ralisation de lestimateur de la variance intra classe

b2 ou variance des
2. une ralisation de lestimateur de la variance inter classe
eets individuels.

b du paramtre .
3. une ralisation de lestimateur

On peut vrier numriquement que ces estimations satisfont les conditions de la


dnition (4.7) puisque :

P T h
N P 0
i
(yi;t y i ) bLSDV (xi;t xi )
i=1 t=1
b2v =
= 0:2551E + 06
N (T 1) K

P
N 0
y i bLSDV xi
i=1 1 2
b2 =
b = 55 401

N K1 T v
On en dduit alors une estimation du paramtre :

b b2v
0:2551E + 06
= = ' 0:11628
b2v + T
b2 0:2551E + 06 + 37 55 401

Rappelons que si le paramtre tend vers 0, lestimateur des MCG converge vers
lestimateur W ithin et que si au contraire tend vers 1, lestimateur des MCG converge
vers lestimateur du modle pooled. Dans le cas de notre chantillon, on observe que
lestimateur des MCG est plus prs de lestimateur W ithin que de celui du modle
totalement homogne. Ceci signie que dans notre panel, la variance temporelle pour
chaque pays (intra classe) domine la variance internationale (inter classe).
LEconomtrie des Donnes de Panel 44

5. Tests de spcication des eets individuels

En prsence dun modle eets individuels, la question qui se pose immdiatement


est de savoir comment ces eets individuels doivent tre spcis : doit on adopter
lhypothse deets xes ou au contraire lhypothse deets alatoires ? Nous avons
vu dans la section prcdente que lestimateur des MCG, utilis dans le cas du modle
eets alatoires, est asympotiquement (sous lhypothse T ! 1) identique lestima-
teur Within. Toutefois, pour des panels de dimension temporelle rduite (typiquement
le cas des panels macroconomiques), il peut exister de fortes dirences entre les ral-
isations des deux estimateurs (Hausman 1978). Ds lors, au del de linterprtation
conomique, le choix de la spcication, et par l mme de la mthode destimation,
est particulirement important pour ce type de panels.

Une des principaux problmes qui peut se poser dans le cadre du modle eets
alatoires provient de lventuelle corrlation entre les variables explicatives xi;t et les
eets individuels i: Sur le plan conomique, cette corrlation traduit linuence des
spcicits individuelles structurelles (ou a-temporelles) sur la dtermination du niveau
des variables explicatives. Reprenons lexemple de la fonction de production. Supposons
que lon dispose dun chantillon de donnes de P IB et de facteurs (travail et capital)
sur une dure de T priodes pour un ensemble de N pays. Si lon note yi;t le logarithme
du P IB, ki;t le logarithme du stock de capital priv et ni;t le logarithme de lemploi et
que lon suppose une fonction de production de type Cobb Douglass, le modle gnral
scrit sous la forme 8 i 2 [1; N] ; 8 t 2 [1; T ] :

yi;t = i ki;t + i ni;t + i + vi;t

Les innovations vi;t sont supposes tre i:i:d: de moyenne nulle et de variance gale
2v ; 8 i 2 [1; N] : On suppose que les eets individuels sont alatoires et quil existe une
corrlation entre ces eets et le niveau des variables explicatives :

E (i ki;t ) > 0 E (i ni;t ) > 0

Rappelons enn que dans ce modle, le rsidu total "i;t = i + vi;t sapparente la
productivit totale des facteurs ou au rsidu de Solow. Ds lors, ces deux corrlations
traduisent tout simplement le fait que plus un pays est structurellement productif (plus
son eet individuel est lev), plus le niveau de facteur utilis sera lui mme important.
Il y a tout lieu de penser quune telle corrlation puisse tre observe sur donnes
historiques.
LEconomtrie des Donnes de Panel 45

Sur le plan plus technique, la prsence dun corrlation entre les eets individuels
et les variables explicatives viole la sixime condition des hypothses (H3 ) puisque :

yi;t = + 0 xi;t + "i;t (5.1)

"i;t = i + vi;t (5.2)



E i x0i;t 6= 0 (5.3)

En prsence dune telle corrlation, nous allons montrer que lestimateur des MCG
est un estimateur biais des paramtres du vecteur ; alors lestimateur Within ne
lest pas. Ce biais sassimile tout simplement un biais dendognit, puisque les
rsidus totaux "i;t = i + vi;t sont corrls avec les variables explicatives. Toute la
stratgie de test de spcication des eets individuels repose alors sur la comparaison
des deux estimateurs, dont la divergence traduit la prsence dune corrlation et donc
la ncessaire adoption du modle eets xes et de lestimateur Within. Dans le
cas contraire o les deux estimateurs donnent des rsultats sensiblement identiques, les
hypothses (H3 ) sont satisfaites et lon peut spcier le modle avec des eets individuels
alatoires. Lestimateur des MCG est alors lestimateur BLUE.

5.1. Corrlation des eets individuels et des variables explicatives

Considrons le modle eets alatoires suivant 8 i 2 [1; N] ; 8 t 2 [1; T ] :

yi;t = + 0 xi;t + "i;t

"i;t = i + vi;t

o 0 = ( 1 2 :::: K ) est un vecteur de constantes: On suppose ici que les eets indi-
viduels alatoires i sont corrls aux variables explicatives :

E ( i j Xi ) 6= 0

Cette corrlation peut tre exprime sous direntes formes. Nous retiendrons la
formulation de Mundlak (1978a) qui postule une approximation linaire de cette es-
prance.

Denition 5.1. Dans la formulation de Mundlak (1978a), on suppose ainsi que les
eets individuels peuvent scrire sous la forme de la somme dune combinaison linaire
des moyennes individuelles des variables explicatives et dune composante orthogonale
i:i:d: i .
i = x0i a + i (5.4)
LEconomtrie des Donnes de Panel 46

avec a 2 RK : Sous cette hypothse, le modle devient :

yi;t = + 0 xi;t + x0i a + "i;t (5.5)

"i;t = i + vi;t (5.6)

On obtient ainsi une structure de rsidus "i;t + x0i a faisant apparatre trois termes
: la composante orthogonale des eets individuels i ; la projection linaire11 des eets
individuels sur lespace des variables explicatives x0i a; et un terme derreur i:i:d: dans
les dimensions temporelle et individuelle, vi;t : On suppose que les rsidus globaux "i;t
satisfont les hypothse (H4 ) :

Hypothses (H4 ) On suppose que les rsidus "i;t = i + vi;t satisfont les conditions
suivantes, 8 i 2 [1; N] ; 8 t 2 [1; T ]
E (i ) = E (vi;t ) = 0
E (i vi;t ) = 0
2 i=j
E i j =
0 8i 6= j
2
v t = s; i = j
E (vi;t vj;s ) =
0 8t6= s; 8i 6= j
E vi;t x0i;t = E i x0i;t = 0

De la mme faon que pour le modle eets alatoires standard, on construit la


matrice de variance covariance des rsidus globaux "i;t , son inverse et lon construit le
modle vectoriel.

Le modle eets individuels alatoires, sous les hypothses (H4 ), scrit vecto-
riellement sous la forme :

yi = Xi e + ex0i a + "i 8 i = 1; ::; N (5.7)


(T;1) (T;K+1)(K+1;1) (T;K)(K;1) (T;1)


ei = (e; Xi ) et 0 = ; 0 : Sous les hypothses (H4 ), la matrice
avec "i = i e + vi ; X
de variance covariance de "i ; note V; est alors dnie par :
h 2 0
0
0 i ee + 2v IT = V i = j
E "i "j = E (i e + vi ) j e + vj = (5.8)
0 i 6= j

Linverse de cette matrice de variance covariance est dnie comme :



1 1 2
V = 2 IT ee0 (5.9)
v 2v + T 2

11
La projection linaire tant adapte au schma de corrlation propos.
LEconomtrie des Donnes de Panel 47

Si lon applique les Moindres Carrs Gnraliss au modle (5.7), en tenant compte
de la matrice de variance covariance V qui possde les bonnes proprits, on obtiendra
alors des estimateurs convergents des dirents paramtres :

bMCG = y x0 b BE
(5.10)

aMCG = b BE bLSDV
b (5.11)
b = bBE + (IK ) b LSDV (5.12)
MCG

Nous ne prsenterons pas ici la forme gnrale de la matrice de poids . Toute-


fois, en reprenant la formule gnrale de lestimateur des MCG, on peut montrer que

lestimateur bMCG est un estimateur non biais du paramtre :

bMCG ! bLSDV
T !1

b MCG !
NT !1

Mais un problme se pose lorsque lon applique, tort, lestimateur des MCG, au
modle initial, cest dire au modle dans lequel on na pas pris le soin de dcomposer
les eets individuels en deux composantes, dont une est strictement orthogonale aux
variables explicatives. Ainsi, supposons prsent que le modle (5.7) soit le bon, et que
lon applique tort les Moindres Carrs Gnraliss la spcication suivante :

yi;t = + 0 xi;t + "i;t (5.13)

"i;t = i + vi;t (5.14)

Soit bMCG lestimateur des MCG appliqu ce modle, sous lhypothse que les
donnes sont gnres par le modle de (5.7). On part de la relation suivante :

bMCG = bBE + (IK ) b LSDV

Dans ce contexte, on peut montrer que lestimateur Between bBE converge vers
+ a; puisque le vecteur a relie les moyennes individuelles xi aux eets individuels i:
Ds lors, il peut apparatre un biais dans lestimateur bMCG taille T nie.

Proposition 5.2. Lorsque les eets individuels et les variables explicatives sont cor-
rles, lorsque les rsidus satisfont les hypothses (H4 ) et le modle (5.7), lapplication
tort des MCG au modle (5.13)

yi;t = + 0 xi;t + "i;t

"i;t = i + vi;t
LEconomtrie des Donnes de Panel 48

conduit un biais semi asymptotique dans lestimateur du vecteur taille T nie :


p
b MCG ! + a (5.15)
N!1

Ce biais disparat asymptotiquement :


p
bMCG ! (5.16)
T !1

La dmonstration de ce rsultat est trs simple. Admettons que les deux rsultats
suivants :
bBE ! p
+a
NT !1

bLSDV p
!
NT !1
Ds lors, taille T dchantillon nie, on montre que facilement lexistence dun
biais a dans lestimateur des MCG de :

plim b MCG = plim bBE + (IK ) plim bLSDV


N!1 N!1 N!1
= ( + a) + (IK )
= + a

On sait cependant que lorsque la taille dchantillon T tend vers linnie, la matrice
de poids tend vers 0, et lestimateur des MCG converge vers lestimateur W ithin:
Le biais disparat :
plim bMCG = plim bLSDV =
T !1 T !1

Remark 4. Ce rsultat signie quen prsence dune corrlation entre les eets indi-
viduels et les variables explicatives, lestimateur des MCG est biais taille dchantil-
lon T nie, et ce mme si le nombre dindividus N tend vers linni. Par opposition
lestimateur W ithin, dont la construction permet la suppression des eets individuels,
est asymptotiquement non biais.

Tout le problme repose sur le fait, que si les eets individuels et les variables
explicatives ne sont pas corrles, lestimateur des MCG est dans ce cas lestimateur
BLUE, cest dire lestimateur convergent, non biais variance minimale. Ainsi, le
problme de la spcication des eets individuels est un problme particulirement im-
portant de lconomtrie de panel applique. Pour sen convaincre, il sut de considrer
les rsultats de lestimation de notre modle sur les grves (gure 1.2), dans lesquels les
estimateurs des MCG et les estimateurs W ithin donnent des rsultats trs dirents
sur le plan quantitatifs, notamment en ce qui concerne la variable du chmage.
LEconomtrie des Donnes de Panel 49

5.2. Test de spcication dHausman

Le test de spcication dHausman (1978) est un test gnral qui peut tre appliqu
des nombreux problmes de spcication en conomtrie. Mais son application la plus
rpandue est celle des tests de spcication des eets individuels en panel. Il sert ainsi
discriminer les eets xes et alatoires.

Lide gnrale du test dHausman est la fois simple et gniale. Supposons que
lon cherche tester la prsence ventuelle dune corrlation ou dun dfaut de spci-
cation. Admettons que lon dispose de deux types destimateurs pour les paramtres
du modle tudi. Le premier estimateur est suppos tre lestimateur non biais
variance minimale sous lhypothse nulle de spcication correcte du modle (absence
de corrlation). En revanche, sous lhypothse alternative de mauvaise spcication,
cet estimateur est suppos tre biais. On suppose que le second estimateur est non
biais dans les deux cas. Ds lors, il sut de comparer une distance, pondre par une
matrice de variance covariance, entre les deux estimateurs pour pouvoir dterminer si
la spcication est correcte ou non. Si la distance est statistiquement nulle, la spci-
cation est correcte, on choisit le premier estimateur. Si la distance est importante, le
modle est mal spci.
Lapplication technique de ce principe suppose tout de mme que lon construise la
matrice de variance covariance de lcart entre les deux estimateurs. De faon gnrale,
il devrait alors apparatre des termes de covariance entre les deux estimateurs. An de
les liminer, on considre le lemme suivant :

Lemma 5.3. On considre deux estimateurs b1 et b 2 ; dun vecteur de paramtres


2 RK , que lon suppose convergent et asymptotiquement normalement distribus.
On suppose que b1 atteint la borne asymptotique de Cramer
Rao. Pour un chantillon
p p
b b
de taille N; les quantits N 1 et N 2 sont asymptotiquement dis-
tribues selon des lois normales de matrice de variance covariance respectives V0 et V1 :
p
Sous ces hypothses, les distributions asymptotiques de N b1 et la dirence
p
N b 1 b2 ne sont pas corrles, ce qui implique :

var b 1 b2 = var b 1 var b2 (5.17)

Ds lors, en appliquant ce lemme, Hausman prconise de fonder le test de spci-


cation sur la statistique suivante :
0 h i1
H = b1 b 2 var b 1 b2 b1 b 2 (5.18)

Sous lhypothse nulle de spcication correcte, cette statistique est asymptotique-


ment distribue selon un chi deux K degrs de libert.
LEconomtrie des Donnes de Panel 50

Appliquons prsent le test dHausman au problme de la spcication des eets


individuels dans un panel.

Denition 5.4. Lhypothse teste concerne la corrlation des eets individuels et des
variables explicatives :
H0 : E ( i j Xi ) = 0 (5.19)

H1 : E ( i j Xi ) 6= 0 (5.20)

Ce test peut tre interprter comme un test de spcication. Sous H0 ; le modle peut
tre spci avec des eets individuels alatoires et lon doit alors retenir lestimateur
des MCG (estimateur BLUE): Sous lhypothse alternative H1 , le modle doit tre
spci avec des eets individuels xes et lon doit alors retenir lestimateur Within
(estimateur non biais).

On peut ici appliquer le lemme (5.3) en considrant lestimateur des MCG (estima-
teur b1 ) et lestimateur Within (estimateur b 2 ). En eet, nous avons vu que sous H0 ;
dans un modle eets alatoires, lestimateur des MCG b MCG est lestimateur BLUE:
Sous lhypothse de normalit des rsidus, les deux estimateurs b MCG et b LSDV sont
convergents et asymptotiquement distribus selon une loi normale. On en dduit que :

var bMCG bLSDV = var b MCG var b LSDV (5.21)

Ds lors, sous lhypothse nulle H0 ; la distance entre les deux estimateur est nulle
puisque tous deux convergent vers la vraie valeur : En revanche, sous lhypothse
alternative, la prsence de la corrlation entre les eets individuels et les variables
explicatives conduit un biais de lestimateur des MCG et cette distance devient alors
importante.

Denition 5.5. La statistique du test dHausman appliqu au test de la spcication


des eets individuels est la suivante :
0 h i1
H = b MCG bLSDV var b MCG bLSDV b MCG bLSDV (5.22)

Sous lhypothse nulle H0 ; la statistique H suit asympotiquement (N tend vers linni)


un chi deux K degrs de libert.

Ainsi, si la ralisation de la statistique H est suprieure au seuil %; on rejette


lhypothse nulle et lon privilgie ladoption deets individuels xes et lutilisation de
lestimateur Within non biais.
LEconomtrie des Donnes de Panel 51

Il faut noter que la statistique du test de Hausman est dgnre lorsque lon consid-
re que la dimension T tend vers linni. En eet, dans ce cas, lestimateur des MCG
converge vers lestimateur Within 12 , ce qui implique que le numrateur et le dnomina-
teur de la statistique dHausman tendent vers 0. Toutefois, on sait que lorsque T tend
vers linni, les modles eets alatoires et eets xes ne peuvent tre distingus
et sont parfaitement similaires. Ds lors, la question de la spcication de ces eets
importe peu.

5.3. Application

Reprenons lapplication sur les journes de grves propose la section prcdente.


Si lon dsire obtenir les ralisations des estimateurs MCG et W ithin, ainsi que la
statistique du test dHausman, lexclusion des estimateurs Between et P ooled, le
programme TSP est alors le suivant :

load(file=strikes.wks);
?---- Test Hausman, Within et VarComp----
panel (id=i,time=t,nowhit,nobet) srt u p;

Les rsultats de ce programme, reproduits sur la gure (5.1), sont bien entendu
totalement identiques ceux de la gure (1.2).
Pour lchantillon considr, la ralisation de la statistique du test dHausman est de
13; 924. Etant donn que le modle comporte deux variables explicatives (K = 2); cette
statistique suit un chi deux deux degrs de libert. A 95%, le seuil est de 5:99; donc
ici on rejette lhypothse nulle dabsence de corrlation entre les eets individuels et les
variables explicatives. Le chmage et lination sont corrls au spcicits structurelles
et a-temporelles du volume des jours chms pour cause de grve. Plus un pays, toutes
choses gales par ailleurs, connat de jours de grves, plus son niveau de chmage et
dination sont levs (ou faibles suivant le signe de la corrlation). Ainsi, on doit ici
privilgier ladoption dun modle eets xes et retenir lestimateur Within.

On peut vrier la validit de cette conclusion, en comparant de faon heuristique


les ralisations des estimateurs des modles eets xes et eets alatoires. On
12
Contrairement au cas o N tend vers linni o lon a :

plim b MCG = plim b LSDV =


N !1 N !1

dans le cas o la dimension T tend vers linni, on a :

plim b M CG = b LSDV
N !1

Ds lors, les deux estimateurs tendent tre identiques.


LEconomtrie des Donnes de Panel 52

Figure 5.1: Rsultats Test dHausman (1978)

observe que pour lchantillon tudi , les coecients estims notamment pour le ch-
mage sont sensiblement dirents dans les deux cas (21pour lestimateur W ithin et
12 pour lestimateur des MCG). Rappelons, que sous lhypothse nulle dabsence de
corrlation ces deux estimateurs devraient converger vers la mme valeur. Cette obser-
vation conrme donc notre diagnostic quant la prsence dune corrlation entre les
eets individuels et les deux variables explicatives du modle. On doit ainsi privilgier
les rsultats de lestimateur W ithin.
LEconomtrie des Donnes de Panel 53

6. Modle coecients xes et alatoires

On peut envisager plusieurs variantes du modle linaire standard. La plupart de ces


variantes sont construites en levant progressivement les direntes hypothses (H3 ) sur
la structure des rsidus. On peut dabord introduire une autocorrlation des rsidus
(dans la dimension temporelle). On utilise alors des mthodes destimation proches de
celles de Cochrane Orcut (1949), utilise en sries temporelles. Une seconde variante
possible, et par ailleurs souvent utilise, consiste suppose supposer une structure de
variance covariance arbitraire pour les rsidus (mthode de Chamberlain 1982 et 1984).
Il est dans ce cas possible de traiter des problmes dautocorrlation et dhtrosc-
dasticit. Mais nous allons ici nous concentrer sur un autre type de modle linaire
: les modles avec un mlange de coecients xes et alatoires. En particulier, nous
allons tudier le modle MFR (Mixed Fixed and Random Coecient) propos par Hsiao
(1989).

6.1. Modle MFR de Hsiao (1989)

Commenons par prsenter la structure gnrale des modle eets individuels xes
et coecients alatoires.

Denition 6.1. On considre le modle MF R suivant :

yi;t = i + 0i xi;t + vi;t 8 i 2 [1; N] ; 8 t 2 [1; T ] (6.1)



o i 2 R, 0i = i;1 i;2 :::: i;K 2 RK : On suppose ici que les eets individuels i
sont xes et que les coecients i des exognes sont distribus selon une distribution
commune de moyenne E ( i ) = et de matrice de variance covariance :
0 2 1
1 1 ; 2 ::: 1 ; K
B ::: 2 ; K C
B 2 ; 1 2 2 C
E ( i ) ( i )0 = = B C (6.2)
(K;K) @ ::: ::: ::: ::: A
K ; 1 K ; 2 ::: 2 K

Le modle (6.1) peut scrire sous la forme vectorielle suivante :

yi = ei + Xi i + vi 8 i 2 [1; N] (6.3)

o e dsigne un vecteur unitaire de dimension (T; 1) et o lon suppose que les rsidus vi;t
satisfont les hypothses (H1 ); avec en particulier E (vi vi0 ) = 2vi IT . Lhypothse selon
laquelle le paramtre i est un coecient alatoire implique une nouvelle structure des
rsidus qui peut sexprimer sous la forme suivante :

yi = ei + Xi + "i (6.4)
LEconomtrie des Donnes de Panel 54

avec 8 i 2 [1; N]
"i = Xi ei + vi (6.5)

o les coecients alatoires e i = i ; sont tels que E ei = 0; E Xi e i = 0
0

et E ei ei = : A partir de lquation (6.4), on obtient ainsi un modle o les
coecients i et sont xes, mais o la structure des rsidus ne satisfait pas les
hypothses standards. Pour le montrer, tablissons la forme de la matrice de variance
covariance des rsidus individuels, not i ; est alors dnie par13 :
0
0
i = E "i "0i = E Xi ei + vi Xi ei + vi = Xi E ei ei Xi0 + E vi vi0

On montre ainsi que :


i = Xi Xi0 + 2vi IT (6.6)
La matrice de variance covariance est ainsi conditionnelle aux individus et de plus
nest pas diagonale. On doit donc appliquer une mthode de Moindres Carrs Gnral-
iss sur un modle transform excluant les eets individuels.

Supposons que lon connaisse la matrice de variance covariance i et que celle-ci


soit une matrice dnie positive, on cherche alors construire un modle transform
o les rsidus satisfont les hypothses (H1 ) : Pour cela, on introduit une transforme Pi
telle que :
1 0
i = Pi Pi 8 i 2 [1; N] (6.7)
On dnit alors les variables transformes suivantes :

Xi = Pi Xi yi = Pi yi ei = Pi e "i = Pi "i (6.8)

Ds lors, le modle (6.4), scrit sous la forme :

Pi yi = Pi ei + Pi Xi + Pi "i

ou encore
yi = i ei + Xi + "i (6.9)

Dans ce modle transform, les rsidus "i satisfont les hypothses H1 puisque :
1 0
E "i ("i )0 = Pi E "i "0i Pi0 = Pi Pi0 Pi Pi = IT (6.10)

Reste enn appliquer un oprateur permettant dliminer les eets individuels


transforms. Pour cela on construit une application Qi telle 8 i 2 [1; N] :

Qi ei = Qi Pi e = 0
13
Si Xi est non stochastique.
LEconomtrie des Donnes de Panel 55

On montre alors que Qi est telle :

1 0
Qi = IT Pi e e0 1
i e ePi (6.11)
La preuve est la suivante :
h 1 0 i
Q Pi e = IT Pi e e0 1
i e ePi Pi e
1 0
= Pi e Pi e e0 1
i e ePi Pi e
0 0 1 0
= Pi e Pi e e Pi Pi e ePi Pi e
= Pi e Pi e
= 0

Appliquons prsent cette seconde transformation au modle transform (6.9), il


vient :
Qi yi = Qi ei i + Qi Xi + Qi "i
() Q yi = Qi Xi + Qi "i (6.12)
A partir de cette expression, on peut nalement proposer un estimateur de la
moyenne des coecients i ; cest un estimateur du paramtre . Soit bMF R cet esti-
mateur : "N #1 " N #
X X
b MF R = 0
(Xi ) Qi Xi 0
(Xi ) Qi yi (6.13)
i=1 i=1
En dveloppant cette expression on obtient :
(N )1
X h 0 1 1 0 i
bMF R = 0 0
Xi Pi IT Pi e e e ePi Pi Xi
i
i=1
(N )
X h 1 0 i
Xi0 Pi0 IT Pi e e0 1
i e ePi Pi yi
i=1

Proposition 6.2. Lestimateur BLUE de la moyenne des coecients alatoires i ;


i = 1; ::N du modle (6.1) coecients xes et alatoires (MFR) :
"N N
#1
X X 0 1 1 1
bMF R = 0 1
Xi Xi 0 1
Xi e e e e Xi
i i i i
i=1 i=1
"N N
#
X X 0 1 1 1
Xi0 1
i yi x0i 1
i e e i e ei yi (6.14)
i=1 i=1

Un estimateur convergent de la matrice de variance covariance de ces paramtres est


alors dni par (Swamy 1970) :
2 ! !0 3
XN XN N
X
b = 1
4 b i 1 b i bi 1 bi 5 (6.15)
(K;K) N 1 N N
i=1 i=1 i=1
LEconomtrie des Donnes de Panel 56

o les estimateurs bi ; 8 i 2 [1; N] ; sont les estimateurs des MCO obtenus quation par
quation pour chaque individu.

On retrouve ici la formule gnrale de lestimateur de la moyenne des coecients


alatoires i dans un modle MF R. Cette formule dire lgrement de celle propose
dans larticle de Hsiao (1989)14 , dans le sens o nous nous sommes limits ici un
modle avec uniquement des eets individuels xes. Dans larticle de Hsiao, lauteur
introduit non pas des eets individuels, mais des variables dichotomiques individuelles
direntes selon les mois de lanne et selon les individus.

6.2. Procdure destimation des paramtres du modle MFR

La procdure gnrale permettant dobtenir les estimateurs de lesprance et de la


variance des coecients alatoires du modle de Hsiao est la suivante :

1. Etape 1 : on estime le modle (6.1) pour chaque individu, en sries temporelles.


Soient bi et 2vi les estimateurs des MCO des paramtres i et de la variance des
rsidus 8 i 2 [1; N] :
0
b i + bi xi;t + vbi;t
yi;t = (6.16)
T
1 X
b2vi =
vbi;t (6.17)
T K t=1

2. Etape 2 : on construit lestimateur de Swamy (1970) de la matrice de variance


b , selon la formule :
covariance des paramtres i ; not
2 ! !0 3
XN XN N
X
b = 1
4 bi 1 bi b i 1 b i 5 (6.18)
(K;K) N 1 N N
i=1 i=1 i=1

3. Etape 3 : on construit lestimateur de la moyenne des paramtres alatoires


i de la faon suivante :
"N #1
X N
X 1
bMF R = b 1 Xi
Xi0 b 1 e
Xi0 b 1 e
e0 b 1 Xi
e
i i i i
i=1 i=1
"N #
X N
X 1
b 1 yi
Xi0 b 1 e e0
x0i b 1 e b 1 yi (6.19)
e
i i i i
i=1 i=1

b i ; 8 i 2 [1; N]
o e dsigne le vecteur unitaire de dimension (T; 1) et la matrice
est dnie par :
b i = Xi X
b i0 +
b2vi IT (6.20)
14
Formule (3.3) page 578.
LEconomtrie des Donnes de Panel 57

A la n de ces trois tapes on dispose dun estimateur bMF R du vecteur des


moyennes des paramtres i et dun estimateur b de la matrice de variance covari-
ance associe. On peut alors construire les statistiques de Student.

6.3. Une application

Considrons une application de la technique destimation dun modle MF R la prob-


lmatique de la convergence propose dans Gaulier, Hurlin et Jean-Pierre (2000). On
cherche estimer une quation de convergence conditionnelle du type :

(yi;t y t ) = i + i yi;t1 y t1 + "i;t (6.21)

avec 8 t 2 [1; T ]
N
1 X
yt = yi;t (6.22)
N i=1
Ce modle de convergence est construit partir de lcart du PIB par tte yi;t
la moyenne internationale yt des PIB par tte. On cherche dterminer si le taux de
croissance de cet cart est li ngativement au niveau de lcart observ la priode
prcdente. Si pour tous les pays, les constantes i sont nulles et les coecients i
sont ngatifs cela signie que lon observe un phnomne de convergence des PIB par
tte. Dans ce cas, un cart positif du PIB par tte la moyenne international induit
un diminution de la croissance de cet cart la date suivante. Autrement dit les carts
des PIB par tte de tous les pays la moyenne internationale tendent se resserrer et
par l mme disparatre. On dit alors quil y a convergence absolue des niveaux de
PIB par tte.

(yi;t y t ) = i yi;t1 y t1 + "i;t

ce qui implique que :



lim yi;t+p y t+p = 0 8 i 2 [1; N] (6.23)
p!1

Mais de tels phnomnes sont rarement observs sur des chantillons internationaux,
cest pourquoi gnralement on introduit des eets individuels i dans la spcications
des modles. Ces eets individuels permettent denvisager la notion de convergence
conditionnelle. Supposons en eet que les constantes i soient non nulles, dans ce cas
on montre que :

lim yi;t+p y t+p = i 8 i 2 [1; N] (6.24)
p!1

Les PIB par tte des dirents pays convergent ainsi vers des sentiers rguliers
parallles mais non confondues : les taux de croissance sont identiques mais les niveaux
demeurent dirents.
LEconomtrie des Donnes de Panel 58

Dans cette tude, nous montrons laide de tests de non stationnarit en panel
(Evans et Karras 1996), quil existe un processus de convergence conditionnel sur un
chantillon de 27 pays de lOCDE (1960-1990). Pour cet chantillon, nous proposons
alors une estimation par la mthode MF R de la moyenne de la vitesse de convergence
des PIB par tte. On considre donc le modle suivant :

(yi;t y t ) = i + i yi;t1 yt1 + i yi;t1 y t1 + "i;t (6.25)

Tout comme en sries temporelles, on introduit ici un terme de type ADF yi;t1 yt1
de faon blanchir la structure des rsidus. On suppose que les eets individuels i
sont xes et que les paramtres i et i sont des coecients alatoires. On a donc
une structure de type MF R identique celle prsente prcdemment avec N = 27;
T = 31et K = 2: On sintresse ici plus particulirement aux vitesses de convergence
i dont la distribution, suppose commune, une esprance et une variance 2 . On
pose ainsi :
i
i = 8 i 2 [1; N] (6.26)
(2;1) i
2
0
E ( i ) = = E ( i ) ( i ) = = (6.27)
2
Faisons abstraction ici des problmes lis la structure dynamique du modle (cf.
Hsiao 1989 pour une application avec endogne retarde). Le problme consiste
estimer les paramtres ; , 2 ; 2 et : Le programme TSP qui reprend les 3 tapes
de la procdure destimation des paramtres du modle MF R est fourni en annexe
(A.2).

Tout dabord, commenons par prsenter les rsultats des estimations des 27 qua-
tions individuelles (tape 1 ). Les rsultats gurent dans le tableau (6.1).
Ces rsultats ont t stocks dans un chier Excel grce aux commandes suivantes
:

smpl 1 N;
unmake ls_alpha alpha_i;
unmake ls_rho rho_i gam_i;
unmake sigls sig_i;
write(file=dea.xls) alpha_i rho_i gam_i sig_i;

Le chier Excel a ensuite t import dans un Workle sous Eviews, ce qui nous per-
met dutiliser linterface graphique, relativement pratique, de ce logiciel pour prsenter
les rsultats. On peut en particulier tudier la distribution des vitesses de convergence
LEconomtrie des Donnes de Panel 59

Figure 6.1: Rsultat des Estimations Individuelles

Obs Alpha_I Rho_I Gam_I Sig_I


1 0,13376594 -0,3052974 0,02715862 0,00032369
2 -0,0893829 -0,1493948 0,47335094 0,00137522
3 0,02164255 -0,0482918 0,15210068 0,00047172
4 0,02181379 -0,0713512 0,08023112 0,00058703
5 0,05501872 0,01829461 0,13963646 0,00152846
6 0,03200307 -0,2798161 -0,1547206 0,00014765
7 0,03007381 -0,1644535 -0,2663595 0,00021004
8 -0,0968696 -0,1697266 0,22403599 0,00123583
9 0,01394913 -0,0702855 0,01103817 0,00068135
10 0,0468125 -0,2748415 0,30987847 0,00069222
11 0,00018522 -0,0081573 0,08217304 0,00013755
12 0,03381594 -0,1308573 0,17844738 0,00024927
13 -0,06906 -0,1506083 -0,1468081 0,00074661
14 0,04178007 -0,2517085 0,35072318 0,00173777
15 -0,0555896 -0,176831 0,27316603 0,0007863
16 0,0280554 -0,3224786 0,18986426 0,0003754
17 0,08583123 -0,2657224 0,20064856 0,00104416
18 -0,0022626 -0,0062728 0,19309539 0,00019094
19 0,02389198 -0,0916293 0,51222789 0,00038848
20 -0,0432805 -0,0772415 0,14977539 0,00113732
21 -0,020066 -0,1200527 0,52000779 0,00032102
22 0,00564093 -0,0314211 0,32853037 0,00029894
23 0,01507706 -0,0447503 0,23266649 0,00039859
24 -0,5000802 -0,4479339 0,33779788 0,00123425
25 0,01952289 -0,1447489 0,15997526 0,0006339
26 -0,0074825 -0,0072746 -0,250526 0,00059937
27 -0,0061079 -0,0305862 0,18348967 0,00073227

individuelles i : A partir de lhistogramme (6.2), on constate que la moyenne simple des


ralisations des estimateurs des MCO b i est de 0:1416; et que la dispersion est rela-
tivement importante puisque lcart type des b i est de 0:117. De plus, les statistiques de
la Kurtosis, de la Skewness et de Jarque-Bera semble indiquer que la distribution nest
pas normale. En particulier, il semble que la distribution des b i soit non symtrique
(Kurtosis) et dcale vers la droite par rapport la moyenne.
Cette premire analyse est conrme par lexamen de lestimateur noyau de la
densit des bi et ce quel que soit le bandwitch parameter choisi, comme le montre la
gure (6.3). On observe que lestimateur de la distribution des b i nest pas symtrique
autour de la moyenne et tend tre dcal vers la droite. Economiquement, cela signie
que la probabilit que les ralisations individuelles des vitesses de convergence soient
suprieures la moyenne 0:1416 est elle mme suprieure la probabilit que ces
vitesses de convergence soient infrieures la moyenne. On observe en outre quil
existe une probabilit non nulles, mais faible, que les paramtres i soient positifs ou
LEconomtrie des Donnes de Panel 60

Figure 6.2: Histogramme des b


i

8
Series: RHO_I
Sample 1 27
Observations 27
6
Mean -0.141609
Median -0.130857
Maximum 0.018295
4
Minimum -0.447934
Std. Dev. 0.117664
Skewness -0.733074
2 Kurtosis 2.881545

Jarque-Bera 2.434072
Probability 0.296106
0
-0.4 -0.3 -0.2 -0.1 0.0

nuls, ce qui traduirait une hypothse de non convergence. Il serait possible de calculer
cette probabilit.

Pour autant jusqu prsent nous nous sommes contents dtudier la distribution
i sans tenir compte de la prcision des estimations individuelles, cest dire des
des b
variances des rsidus 2v : Cest pourquoi, nous avons construit lestimateur MFR con-
struit partir dune correction faisant intervenir la matrice de variance des direntes
composantes des rsidus. Ainsi, dans le programme, nous avons construit lestima-
teur de Swamy (1970) de cette matrice de variance covariance (tape 2 de la procdure
gnrale). Les rsultats obtenus sont les suivants :
2
b b
b 0:013845 0:0024814
= = (6.28)
b
b2 0:0024814 0:042026

Bien entendu, on retrouve lcart type des paramtres i que nous avions calcul
p
prcdemment puisque bp = 0:013845 = : 11766: Mais nous tenons compte ici des
ventuelles covariances pouvant exister entre les coecients i et i :

Enn, dans une dernire tape, nous avons construit lestimateur MFR associ aux
moyennes des paramtres i et i (tape 3 de la procdure gnrale). Les rsultats
obtenus sont les suivants :

b = b 0:11395
= (6.29)
b
0:15865

On constate ainsi que la ralisation de lestimateur MFR de la moyenne b est in-


frieure la simple moyenne des bi individuels. Cela signie que lestimateur MFR
peut tre envisag comme une moyenne pondre des estimations individuelles b i ; dont
LEconomtrie des Donnes de Panel 61

Figure 6.3: Estimateur Kernel de la Densit des b


i

Kernel Density (Epanechnikov)


4

h = 0.0595
2
h = 0.1190
h = 0.1785

0
-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1

RHO_I

les pondrations sont fonctions de la prcisions des estimations individuelles (de la


variance des rsidus).
LEconomtrie des Donnes de Panel 62

A. Annexes

A.1. Equivalence entre les estimateurs Within et pooled dans le cas = 1

Revenons lquation (4.14) de lestimateur des MCG :


" N N
#1 " N N
#
1 X X 1 X X
b MCG = 0
Xi QXi + (xi x) (xi x)0 0
Xi Qyi + (xi x) (y i y) 0
T T
i=1 i=1 i=1 i=1
(A.1)
On suppose pour simplier quil nexiste quune variable explicative (K = 1) et lon
suppose que = 1. Lestimateur des MCG scrit alors sous la forme :
" N N
#1 " N N
#
1 X X 1 X X
b MCG = Xi0 QXi + (xi x)2 Xi0 Qyi + (xi x) (y i y)
T T
i=1 i=1 i=1 i=1
(A.2)
Considrons tout dabord le dnominateur de cette expression :
N N N T N
1X 0 X 1 XX X
D= Xi QXi + (xi x)2 = (xi;t xi )2 + (xi x)2
T T t=1
i=1 i=1 i=1 i=1

Dveloppons cette expression, il vient :


N
" T
# N
" T T
#
X 1X X 1 X 1 X
D= (xi;t xi )2 + (xi x)2 = x2 2xi xi;t + 2x2i 2xi x + x2
T t=1 T t=1 i;t T t=1
i=1 i=1

Rappelons que :
T
X
xi;t = T xi
t=1
On obtient ainsi :
N
" T
# N X T
X 1X 2 X
D= 2
xi;t 2xi x + x = (xi;t x)2
i=1
T t=1 i=1 t=1

De la mme faon, on montre que le numrateur peut scrire sous la forme :


N X
X T
N= (xi;t x) (yi;t y)
i=1 t=1

Ainsi, on retrouve lexpression du lestimateur du modle pooled :


"N T #1 " N T #
XX XX
bMCG = bpooled = (xi;t x)2
(xi;t x) (yi;t y)
i=1 t=1 i=1 t=1

Le mme rsultat peut tre dmontr dans le cas gnral (K 1).


LEconomtrie des Donnes de Panel 63

A.2. Programme TSP : Modle MFR

Le programme TSP ci-dessous reprend les 3 tapes de la procdure destimation des


paramtres du modle MF R appliqu la problmatique de convergence de Hurlin,
Gaulier et Jean Pierre (2000). Toutes les lignes de commandes en italique doivent tre
modies dans le cas dune autre application.

?******************************
?**** ESTIMATEUR MFR *******
?**** HSIAO (1989) *******
?******************************
?--- Options ----------------
OPTIONS(LIMWARN=0,LIMERR=10);
SUPRES SMPL;
?----------------------------

?******************************
?**** Paramtres du Modle ****
?******************************
set N=27 ; ? Nombre dIndividus N
set l=31 ; ? Nombre de Priodes T
set K=2 ; ? Nombre de Variables Explicatives K
set nobs=N*l ; ? Nombre Total dObservations NT
set t0=60; ? Date de Dbut dEchantillon
set t1=90 ; ? Date de Fin dEchantillon
set retard=2; ? Nombre de Retards (Modle Dynamique)
smpl 1 nobs;

?*****************************
?***** Variables *************
?*****************************
?- Base de donnes
load(le=ocde.wks);
? Donnes Centres sur la Moyenne Internationale
y=log(y);
do j=t0 to t1;
select (t=j);
msd(noprint) Y;
YB=Y-@MEAN;
LEconomtrie des Donnes de Panel 64

enddo;
? Construction des Sries
smpl 1 nobs;
y=yb;
select i=i(-1);
dy=y-y(-1);
?*****************************

?------------------------------------------------
?---- ETAPE 1 : Estimations pays par pays ----
?------------------------------------------------
mform(nrow=N,ncol=1) ls_alpha=0;
mform(nrow=N,ncol=K) ls_rho=0;
mform(nrow=N,ncol=1) sigls=0;
do j=1 to N;
?--- Rgressions Individuelles ---
smpl 1 nobs;
select (i=j)&(i=i(-2));
ls(silent) dy c y(-1) dy(-1);
?--- Construction des Vecteurs des Coefficients ---
set ls_alpha(j,1)=@coef(1);
do p=1 to K;
set pf=p+1;
set ls_rho(j,p)=@coef(pf);
enddo;
set sigls(j,1)=@s2;
enddo;
print ls_alpha ls_rho sigls;

?-----------------------------------------------------
?---- ETAPE 2 : Swamy (1970) ----
?---- Estimateur de la variance du parametre rho ----
?-----------------------------------------------------
?--- Calcul de la Moyenne des Coefficients Alatoires ---
mform(nrow=N,ncol=1) en=1;
mat sum_rho=((en)*ls_rho)/N;
?--- Construction du Vecteur des Moyennes ---
if K=1; then; do;
LEconomtrie des Donnes de Panel 65

mat vsum_rho=sum_rho*en;
enddo;
if K>1; then; do;
mat vsum_rho=sum_rho(1,1)*en;
do j=2 to K;
mat sum_rhoi=sum_rho(1,j)*en;
mmake vsum_rho vsum_rho sum_rhoi;
enddo;
enddo;
?--- Construction du lestimateur de Delta ---
mat Delta=(1/(N-1))*((ls_rho-vsum_rho))*(ls_rho-vsum_rho);

?-------------------------------------
?-- ETAPE 3 : Construction de Beta ---
?-- Construction des Phi_i ---
?-------------------------------------
smpl 1 nobs;
set l1=l-retard;
mform(nrow=l1,ncol=l1,type=diag) unite=1;
mform(nrow=l1,ncol=1) z=1;
mform(nrow=K,ncol=K) T1=0;
mat T2=T1;
mform(nrow=K,ncol=1) T3=0;
mat T4=T3;

do j=1 to N;
smpl 1 nobs;
?*********************************
?**** Construction des sries ****
?*********************************
select (i=j)&(i=i(-2));
y1=y(-1);
dy1=dy(-1);
mmake x y1 dy1;
mmake yy dy;
?-- Construction de la matrice (Phi)-1
mform(nrow=l1,ncol=l1) Phi=0;
mat Phi=x*Delta*x+sigls(j,1)*unite;
LEconomtrie des Donnes de Panel 66

mat Phi=(Phi);
?-- Premier Terme : T1 ---
mat t1_i=(x)*Phi*x;
mat T1=T1+t1_i;
?-- Deuxime Terme : T2 ---
mat t2_i=(x)*Phi*z*(((z)*Phi*z))*(z)*Phi*x;
mat T2=T2+t2_i;
?-- Troisime Terme : T3 ---
mat t3_i=(x)*Phi*yy;
mat T3=T3+t3_i;

?-- Quatrime Terme : T4 ---


mat t4_i=(x)*Phi*z*(((z)*Phi*z))*(z)*Phi*yy ;
mat T4=T4+t4_i;
smpl 1 nobs;
enddo;

?----------------------------------------
?-- Estimateur de rho_bar ------
?----------------------------------------
mat rhols_m=(sum_rho);
mat rho_mfr=((T1-T2))*(T3-T4);
print rhols_m rho_mfr;
print delta;

?--------------------------
?--- Calcul des T-stats ---
?--------------------------
if K=1; then; do;
set T_stat=rho_mfr/sqrt(Delta);
enddo;
if K>1; then; do;
mform(nrow=K,ncol=1) T_stat=0;
do j=1 to K;
set T_stat(j,1)=rho_mfr(j,1)/sqrt(Delta(j,j));
enddo;
enddo;
print t_stat;
LEconomtrie des Donnes de Panel 67

Bibliographie

Ahn, S.C., et Schmidt, P., (1995), Ecient Estimation of Models for Dynamic
Panel Data, Journal of Econometrics, 68, 5-27.

Bernard, A., et Jones, C., (1996), Productivity Across Industries and Countries :
Times Series Theory and Evidence, The Review of Economics and Statistics,135-146.

Bernard A.B., et Durlauf S.N., (1995), Convergence of International Output,


Journal of Applied Econometrics, 10, 97-108.

Blundell, R., et Schmidt, R., (1991), Conditions Initiales et Estimation Ecace


dans les Modles Dynamiques sur Donnes de Panel : Une Application au Comporte-
ment dInvestissement des Entreprises, Annales dEconomie et de Statistique, 20/21,
109-123.

Gaulier G, Hurlin C et JeanPierre P. (1999), Testing Convergence : A Panel Data


Approach, Annales dEconomie et de Statistiques, 55-56, 411-427.

Harris, R.D.F. et Tzavalis, E., (1996), Inference for Unit Root in Dynamic Panels,
Working Paper, University of Exeter, UK.

Hausman J.A., (1978) Specication Tests in Econometrics, Econometrica, 46,


1251-1271
Hsiao, C., (1986), Analysis of Panel Data, Econometric society Monographs N0
11. Cambridge Universirty Press.

Hsiao C. (1989), Modelling Ontrario Regional Electricity System Demand Using


a Mixed Fixed and Random Coecient Approaoch, Regional Science and Urban Eco-
nomics, 19, 565-587

Im, K.S., Pesaran, M.H., et Shin, Y., (1995), Testing for Unit Roots in Heteroge-
nous Panels, DAE, Working Paper 9526, University of Cambridge.

Islam, N., (1995), Gowth Empirics : A Panel Data Approach, Quarterly Journal
of Economics.

Levin, A., et Lin, C-F., (1992), Unit Root Test in Panel Data: Asymptotic and
Finite-Sample Properties, Discussion Paper 92-23, Department of Economics, Uni-
versity of California, San Diego.

Quah, D., (1994), Exploiting Cross-Section Variations for Unit Root Inference in
Dynamic Data, Economics Letters, 44, 9-19.
LEconomtrie des Donnes de Panel 68

Mundlak Y. (1978), On the Pooling of Time Series and Cross Section Data,
Econometrica, 46, 69-85

Nickell S. (1981), Biases in Dynamic Models with Fixed Eects, Econometrica,


49, 1399-1416
Sevestre, P., et Trognon, A., (1992), Linear Dynamic Models, in Matyas and P.
Sevestre (eds), Ch. 6., 94-116.

Swamy P.A. (1970), Ecient Inference in a Random Coecient Regression Model,


Econometrica, 38, 311-323

Taylor W.E. (1980), Small Sample Consideration in Estimation from Panel Data,
Journal of Econometrics, 13, 203-223

Vous aimerez peut-être aussi