Pan ch1-2

Économétrie des Données de Panel Ch 1.
Modèles Linéaires Non Dynamiques
Économétrie des Données de Panel

Ch 1. Modèles Linéaires Non Dynamiques
Pr. Philippe Polomé, Université Lumière Lyon 2
M1 APE Analyse des Politiques Économiques

M1 RISE Gouvernance des Risques Environnementaux
2020 – 2021
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Plan du Ch 1
Les données de panel Matrice des erreurs en panel

Modèles à données de panel Inférence robuste : White
Effets Fixes & Effets Aléatoires Application White
Estimateurs pour données de panel Inférence robuste : Bootstrap
Efficience et Erreurs Application Bootstrap
Estimateurs appropriés MRL Effets Fixes vs. Effets Aléatoires
Estimateurs appropriés pour EF Éléments du choix hors tests
Estimateur approprié pour EA Test de Hausman
Interprétation : EF vs. EA Autres tests
Application Données de panel non-cylindré
Inférence avec données de panel Annexes
Les données de panel
Sommaire
Modèles à données de panel
Estimateurs pour données de panel
Inférence avec données de panel
Effets Fixes vs. Effets Aléatoires
Autres tests
Données de panel non-cylindré
Annexes
Notation
I i = 1, ..., N : agent (individu, firme, pays...)

I t = 1, ..., T : temps
I En général Ti : nombre de périodes diffère d’agent à agent
I Panel “non-cylindré” (unbalanced)
I Attrition, on y reviendra en fin de chapitre
I Pour simplifier la notation, la théorie utilise T
I Les logiciels gèrent Ti
I yit une observation de la variable dépendante y
I xit une observation du vecteur K × 1 des variables
indépendantes
I “régresseurs”
I Possiblement endogènes dans Ch. 2, mais pas dans le Ch. 1
Organisation des données

obs agent i temps t y x1 ... xK
1 1 1 y11 x111 xK 11
.. ..
. .
t 1 t y1t x11t xK 1t
.. ..
. .
T 1 T y1T x11T xK 1T
T+1 2 1 y21 x121 xK 21
.. ..
. .
it i t yit x1it xKit
.. ..
. .
NT N T yNT x1NT xKNT
Sommaire
Autres tests
Annexes
Modèles & Estimateurs
I Plus grand choix de modèles et d’estimateurs qu’avec les

coupes transversales
I 3 modèles standards dans la présente Section
I 5 estimateurs dans la prochaine Section
I Chaque estimateur “peut” être appliqué à chaque modèle
I Avec des résultats divers
I On ne sait jamais quel modèle s’applique
I Table 5x3 des propriétés des estimateurs dans chaque modèle
en fin de chapitre
Modèle 1. MRL - Modèle de régression linéaire classique

I Le modèle le + restrictif
I impose des coefficients constants entre i
0
yit = α + xit β + uit (1)
uit un élément scalaire du vecteur du terme d’erreur u
α intercept
β pente
I Si ce modèle est le bon
I (correctement spécifié)
I et si les régresseurs ne sont pas corrélés à l’erreur
I Alors il pourra être estimé, de façon consistante, comme une
coupe transversale
I En réalité, il n’est là qu’à titre didactique, il ne s’applique
probablement jamais
Dichotomiques Individuelles et Temporelles
I Une variante simple du MRL (1)

I Intercepts qui changent entre individus et entre période
I Mais pas les deux à la fois
I Pentes constantes
0
yit = αi + γt + xit β + it (2)
N T
0
X X
ou yit = αj dj,it + γs ds,it + xit β + it
j=1 s=2
où les N dichotomiques individuelles dj,it = 1 si i = j & = 0 sinon
les T − 1 dichotomiques temporelles ds,it = 1 si t = s & = 0 sinon

Données de panel avec dichotomiques
obs i i =1 ... i =N t t=1 ... t =T −1 y x1 ... xK

1 1 1 0 1 1 0 y11 x111 xK 11
.. ..
. .
t 1 1 0 t 0 0 y1t x11t xK 1t
.. ..
. .
T 1 1 0 T 0 0 y1T x11T xK 1T
T+1 2 0 0 1 1 0 y21 x121 xK 21
.. ..
. .
it i 0 0 t 0 0 yit x1it xKit
.. ..
. .
NT N 0 1 T 0 0 yNT x1NT xKNT
Dichotomiques Individuelles et Temporelles

I xit n’inclut pas d’intercept
I Si on en met un
I alors une des N dichotomiques individuelles doit être retirée
I Beaucoup de logiciels font ça
I Focus sur les panels courts où N → ∞ mais pas T
I Alors γ (coef. des dich. temp.) peuvent être estimés de façon
consistante
I Au moins au sens où il y a un nombre fini de ces dich. temp.
I T − 1 dich. temp. sont simplement incorporées aux
régresseurs xit
I Par contre, si on insérait l’ensemble des N dich. individuelles
dj,it dans les régresseurs xit
I Ça poserait un problème lorsque N → ∞
I On ne peut estimer de façon consistante un nombre ∞ de
paramètres
I L’information ne croît pas sur αi lorsque N croît
I Challenge : estimer les paramètres β
I en contrôlant pour les N dich. indiv. αi
Effets Fixes & Effets Aléatoires
Sommaire

Modèle à Effets Individuels

I Chaque agent i a son intercept, mais toutes les pentes sont
les mêmes entre agents
0
yit = αi + xit β + it (3)
où it est iid sur i et t
I = une façon plus parcimonieuse d’exprimer le précédent

modèle (2) : ce sera notre principal modèle dans ce chapitre
I Les dich. temp. sont incluses dans les régresseurs xit
I Modèle linéaire, non-dynamique, à données de panel
“standard”
I αi = variables aléatoires
I En fait : un modèle à paramètres aléatoires
I Capture hétérogénéité inobservée invariante dans le temps
I = caractéristiques individuelles inobservées
Rappel : l’hétérogénéité inobservée (en coupe transversale
I Modèle correct : Y = β0 + β1 x1 + β2 x2 +
I Modèle estimé : Y = β0 + β1 x1 + ν
I L’effet du régresseur manquant x2 sur Y est implicite dans le
terme d’erreur du modèle estimé : ν = β2 x2 +
I = hétérogénéité inobservée :
I Des facteurs (individuels) inobservés influent sur Y
I Si x2 n’est pas corrélé avec x1
I MC consistant pour βˆ1 (βˆ0 est biasé et inconsistant)
I Si x2 est corrélé avec x1 ,
I l’erreur ν est corrélée avec x1
I MC inconsistant pour tous les coef.
Rappel : l’hétérogénéité inobservée
Mêmes pentes
Exogénéité
I Dans ce Ch. 1 : on assume l’exogénéité forte/stricte
E [εit |αi , xi1 , ..., xiT ] = 0, t = 1, ..., T (4)
I C’est-à-dire : hypothèse que pour it
I Espérance de zéro conditionnellement aux valeurs passées,
présentes et futures des régresseurs
I Équivalent à zéro covariance E [εit xit ] = 0
I Rien n’est supposé entre la variable aléatoire αi et les
régresseurs xi : E [εit αi ] =?
I Exclut des modèles avec une variable dépendante retardée
I Pas de yi(t−s) dans xit sinon ce serait un modèle dynamique
0
I Comme yit−1 = αi + xit−1 β + it−1 : il est difficile d’affirmer
que E (it it−1 ) = 0
I Et aussi avec des régresseurs endogènes (Ch. 2)
Modèle à Effets Fixes
0
I 2 variantes du modèle (3) yit = αi + xit β + it selon hyp. sur αi
I Toutes deux ont “2” erreurs αi et it
I Modèles à erreurs composées
I Toutes deux traitent αi comme une v.a. inobservée
I Variante 1 : modèle à effets fixes (EF)
I αi est corrélé avec (la partie invariante au temps) des
régresseurs observés xit
I C’est une forme d’hétérogénéité inobservée car on ne sait pas
ce qui se cache dans αi
I “fixe” parce que, anciennement, αi était traité comme un
paramètre (non-aléatoire) à estimer
Modèle à Effets Aléatoires

I Variante 2 : modèle à effets aléatoires (EA)
I αi distribué indépendamment de x
I Habituellement, assume de plus que les effets aléatoires αi et
les termes d’erreurs it dans (3) sont iid :
αi ∼ α, σα2

(5)
it ∼ 0, σ2
I Pas d’hyp. sur la distribution de ces v.a. dans (5)
I Dans le modèle classique, it présentera de l’autocorrélation :
cov (it , is ) 6= 0
I On supposera aussi souvent cov (it , jt ) = 0 et
cov (αi , αj ) = 0
I Sauf dans les modèles spatiaux
I Dans le modèle EA, α est vu comme l’intercept
I Dans la pratique, it présentera de l’hétéroscédasticité
it ∼ 0, σ2it

Hyp. d’équicorrélation du modèle EA

0
I Le modèle EA yit = αi + xit β + it
I peut être vu comme la régression de yit sur xit
I avec erreur composée uit = αi + εit
I Les hyp. EA usuelles (5) (αi et it iid) impliquent que
σv2α , t 6= s

Cov [(αi + εit ), (αi + εis )] = (6)
σv2α + σv2ε , t = s
I Le modèle EA impose donc que l’erreur composée uit soit
équicorrelée
I Car Cor [uit , uis ] = σα2 /[σα2 + σε2 ] pour t 6= s
I ne change donc pas avec la durée t − s
I Le modèle EA est aussi appelé équicorrélé ou à erreurs
interchangeables
Autres noms des modèles EF/EA (3)
I Modèle à effets individuels une voie (One-way)

I Deux voies (Two-way) = inclusion de dich. de temps ou
d’effets aléatoires de temps
I Modèles à composants aléatoires
I Modèle à intercept aléatoire
I Pour distinguer de modèles plus généraux, p.e. à pentes
aléatoires
Synthèse des 3 modèles à données de panel
uit ∼ 0, σu2
0
MRL yit = α + xit β + uit (1)

EF 0 Cov (αi , xit )6= 0

yit = αi + xit β + it (3)
αi ∼ α, σα2
EA (5)
it ∼ 0, σ2
I Ces 3 modèles supposent l’hétérogénéité stricte (4)

I D’autres modèles panel existent, en particulier dynamiques
Sommaire
Autres tests
Annexes
Introduction
I Il y a 5 estimateurs disponibles couramment pour β en
données de panel
I Dans ce contexte non-dynamique, sans endogénéité, ce sont
tous des variantes de MC
I Seuls 3 sont utilisés en pratique
I Diffèrent selon leurs utilisations des variations transversales
(entre i) et temporelles
I Leurs propriétés dépendent de quel est le modèle approprié
(MRL - EF - EA)
I Un régresseur xit peut être
I invariant dans le temps, xit = xi pour t = 1, ..., T ,
I ou variable dans le temps
I Certains estimateurs ne peuvent identifier que les coefficients
des régresseurs variables dans le temps
I Ne peuvent produire une estimation des autres coefficients
I On va voir les estimateurs du plus simple au plus complexe
I On regarde la consistance et l’efficience
Efficience et Erreurs
Sommaire

Efficience des Estimateurs

I L’efficience n’est pertinente que pour les estimateurs
consistants
I L’efficience est la précision de l’estimateur
I Essentiellement l’inverse de sa matrice de var-cov Σβ̂
I Qui donc dépend de la matrice de var-cov des erreurs Σu
Hypothèses sur les erreurs

I Les modèles à données de panel ont différents types d’erreur
I uit pour MRL
I αi + εit pour EF et EA
I Dans beaucoup d’applications de microéconomie
I raisonnable de supposer indépendance entre i
I Sauf avec des données spatiales, par exemple des pays
I Toutes ces erreurs sont potentiellement
1. Autocorrélées (corrélées sur t pour un certain i )
I Corrélation sérielle, temporelle
2. Hétéroscédastiques entre les i
I L’inférence (tests) stat. valide requiert de prendre en compte
ces caractéristiques
I Section suivante
I Dans cette section-ci
I structure de la mat. de var-cov des erreurs
I Efficience
Matrice Σu de variance-covariance des erreurs en panel
I Sans distinguer entre les trois modèles

I On écrit l’erreur du modèle uit
I Peut être αi + it ou pas
I Entre i on a Cor [uit , ujs ] = 0
I pour i 6= j et t = ou 6= s
I Pour un certain i
I Cor [uit , uis ] = σits : corrélation quelconque dans le temps
I t = s, σits = σit2 : hétérocédasticité quelconque
I Ça donne la matrice var-cov des erreurs Σu suivante
Matrice Σu bloc-diagonale de var-cov des erreurs panel
σv211
 
σv112 ··· σv11T
.. ..
.
 
 σv212 . 
 0 ··· 0 
 .. .. .. 

 . . . σv1(T − 1)T


SYM ··· σv21T
 
 
.. .. ..
 
0 . . .
 
 
.. .. ..
 
 

 . . . 0 


 σv2N1 σvN12 ··· σvN 1T 

 .. .. 
σv2N2 . .
 
0 ··· 0
 
.. .. ..
 
. . .
 
 σvN(T − 1)T 
SYM ··· σv2NT
Modèle EA
I Le modèle EA met plus de structure dans la matrice Σu

0
I Modèle EA yit = αi + xit β + it avec
I αi iid (non-corrélés à xit )
I it iid avec corrélations comme dans l’hyp. EA (5)
“équicorrélation”
αi ∼ α, σα2

it ∼ 0, σ2
I La matrice Σu prend la forme suivante
Matrice Σu Bloc-Diagonale de Var-Cov des Erreurs Panel EA
σv2α + σv2ε σv2α ··· σv2α

 
.. ..
.
 
 σv2α σv2α + σv2ε . 
 0 ··· 0 
. .. ..
..
 
. . σv2α
 
 
σv2α σv2α σv2α + σv2ε
 
 ··· 
.. .. ..
 
 

 0 . . .


.. .. ..
 
. .
 

 . 0 


 σv2α + σv2ε σv2α ··· σv2α 

 .. .. 
σv2α σv2α + σv2ε . .
 
0 0
 
···
.. .. ..
 
 
 . . . σv2α 
σv2α ··· σv2α σv2α + σv2ε
En mots
I La matrice s’organise en blocs carrés autour de la diagonale
principale
I Chaque carré tient en 2 chiffres
I Hors de sa diagonale principale, une corrélation entre périodes
σα2
I la même pour tous les i
I Sur sa diagonale principale, une variance σα2 + σ2
homoscédastique
I Entre différents i, toutes les corrélations sont nulles
I Hors des blocs diagonaux
I On voit donc que même dans la structure la plus restrictive,
les estimateurs panel se trouvent dans un contexte avec de
l’autocorrélation
Estimateurs appropriés MRL
Sommaire

Estimateur nº1 MCO

I MCO estime α et β dans yit = α + xit0 β + uit
I MCO est consistant (pour N → ∞, t constant) si
I Cov [uit , xit ] = 0 et
I MRL (1) est approprié, ou si
I EA est approprié
I La mat Σu n’est pas diagonale
I MCO inefficient
I L’estimateur MCO σˆ2 (X 0 X )−1 de la matrice Σβ̂ est biaisé
I MCO est inconsistant si EF est approprié
0
I Ré-écrire EF yit = αi + xit β + it comme
yit = α + xit´ β + (αi −α + εit )
I Donc l’erreur MCO, uit = αi − α + it , est corrélé à xit par αi

Estimateur nº2 Between
I Étapes
1. Prendre les moyennes sur le temps par individu
T
I ȳi = 1
X
yit , idem pour x̄i
T t=1
2. Estimer par MCO ȳi = α + x̄i0 β + ε̄i
I Régresser ȳi sur un intercept et le vecteur x̄i
I Pour estimer β, MCO utilise toutes les données
I Donc les variations à la fois sur le temps et en transversal
I Between n’utilise que les variations transversales
I Entre (between) différents individus
I Analogue à une régression en coupe transversale
I Les variations internes (within) à chaque individu sont écartées
Propriétés de l’estimateur Between
I Le modèle implicite derrière l’estimateur between est

0
ȳi = α + x̄i β + ui i = 1, ..., N (7)
I Between est consistant si les régresseurs x̄i sont indépendants
de l’erreur ui
I C’est le cas pour le MRL (1)
I Si par contre le modèle est à erreurs composées (3)
0
yit = αi + xit β + it
I Alors, ui = (αi − α + ¯i )
I Dans EA, αi est indépendant de x
I Donc Between est consistant pour EA
I Dans EF, αi est corrélé à xit et donc à x̄i
I Between est donc inconsistant
Propriétés de l’estimateur Between
I Between gaspille beaucoup d’informations

I C’est un estimateur didactique
I Ne pas l’utiliser dans vos applications
I Sauf si les données ne sont pas stationnaires
I Je ne détaille pas pour l’instant
I Sans regarder formellement
I between est très inefficient à cause du gaspillage d’information
Estimateurs appropriés pour EF
Sommaire

Estimateur nº3 Within
I Principe : Les déviations individuelles de la variable

dépendante de ses moyennes temporelles
I sont expliquées par
I les déviations individuelles des régresseurs de leurs moyennes
temporelles
0
I Soit le modèle à effets individuels (3) yit = αi + xit β + it
I Prendre le moyenne sur t : ȳi = αi + x̄i0 β + ε̄i
I Soustraire : les termes αi s’annulent = la transformation
within
0
yit − ȳi = (xit − x̄i ) β + (it − ¯i )
(8)
1, ..., N, t = 1, ..., T
Estimateur Within
I Estimateur Within = MCO sur les données transformées

0
yit − ȳi = (xit − x̄i ) β + (it − ¯i )
I Comme αi a disparu par différence, Within est consistant dans

EF, EA et MRL
I En tout cas quand l’hyp d’exogénéité forte tient (+ loin)
I Within est aussi appelé estimateur Effets Fixes
I Chaque i doit être observé au moins deux fois dans
l’échantillon
I sinon xit − x̄i = 0
Consistance de l’estimateur Within / Effets Fixes

I Within traite αi comme des paramètres dits nuisance
I que l’on peut ignorer si notre intérêt porte sur les pentes β
I qui n’ont pas besoin d’être estimés de façon consistante pour
obtenir une estimation consistante des β
I Ce résultat ne se propage généralement pas aux modèles
non-linéaires
I La consistance requiert plus précisément
E (it − ¯i |xit − x̄i ) = 0

dans le modèle transformé
0
yit − ȳi = (xit − x̄i ) β + (it − ¯i )
I À cause des moyennes, cela exige plus que E (it |xit ) = 0
I Il faut l’exogénéité stricte (4)
E [εit |αi , xi1 , ..., xiT ] = 0, t = 1, ..., T

Estimations des effets fixes

I Si les effets fixes αi sont d’intérêt, ils peuvent être estimés
0
par α̂i = ȳi − x̄i β̂
I Cet estimateur de αi est non-biaisé
I Dans des panels courts (petit T ), il est inconsistant
I Parce que l’information ne s’accumule pas (T ne croît pas)
I Par contre, la distribution des α̂i , par rapport à une variable
clef, peut être informative
I Si N n’est pas trop grand, une alternative pour estimer Within
est l’estimateur MC à dichotomiques
I On définit N dich. di , une par individu, di = 1 pour i
0
X
I Ensuite, estimer yit = αi di + xit β + it par MCO
i
I Régression de yit sur xit et N dich. individuelles
I Cela produit l’estimation Within pour β, ainsi que les
estimations des N effets fixes
I Dans les limites des capacités de l’ordinateur
Within et les régresseurs invariants dans le temps
I Une limitation majeure de Within

I les coefficients des régresseurs invariants dans le temps ne sont
pas identifiés
I Puisque si xit = xi alors x̄i = xi et (xit − x̄i ) = 0
I Beaucoup d’études ont précisément pour objet des régresseurs
invariants dans le temps
I P.e. les effets du genre ou de l’origine ethnique sur le salaire
I Pour cette raison, des praticiens évitent d’utiliser within
I MCO et l’estimateur Effets Aléatoires (ci-dessous) permettent
d’estimer ces coefficients
I mais sont inconsitants si EF est le modèle approprié
I On verra un estimateur qui permet parfois de les identifier
Pourquoi est-ce si intéressant
Éq. de salaire p.e.
log (salit ) = β1 +β2 expit +β3 expit2 +β4 educit +β5 genrei +β6 cognii +αi +it
I Les capacités cognitives ne sont pas observées

I elles passent donc dans αi
I elles sont corrélées avec educ
I L’estimateur EF permet d’estimer les autres coef de façon
consistante
Estimateur nº4 différences premières
I Principe : Les changements individuels d’une période à

l’autre de la variable dépendante
I sont expliqués par
I les changements individuels d’une période à l’autre des
régresseurs
0
I Soit le modèle à effets individuels (3) yit = αi + xit β + it
I retarder d’une période yi,t−1 = αi + xi,t−1
0
β + εi,t−1
I Soustraire = la transformation différences premières
0
yit − yi,t−1 = (xit − xi,t−1 ) β + (it − i,t−1 )
(9)
i = 1, ..., N, t = 2, ..., T
Estimateur différences premières

I L’estimateur différences premières (D1) est MCO appliqué à la
transformation différences premières (9)
I Cet estimateur est consistant pour β dans tous les modèles
I Pour les mêmes raisons que Within
I Pareillement, les coefficients des régresseurs invariants dans le
temps ne sont pas identifiés
I D1 est moins efficient que within
I si εit est iid (pour T > 2)
I car une période d’obsevation est écartée
I Cependant, D1 peut préserver contre des variables I(1)
I Qui amèneraient sinon à des résultats spurieux
I I(1) : intégré à l’ordre 1 - essentiellement très corrélé avec son
passé
Efficience des estimateurs pour EF
I Ces 2 estimateurs font peu d’hypothèses sur la structure du

terme d’erreur
I Leur efficience n’est généralement pas discutée
I Car la priorité est l’estimation consistante
I On reviendra plus loin sur la question des tests d’hypothèse
dans ce contexte
Estimateur approprié pour EA
Sommaire

Rappel du modèle EA
0
I Modèle à effets individuels (3) yit = αi + xit β + it avec
I αi iid (donc non-corrélés à xit )
I it iid mais corrélations comme dans l’hyp. EA (5)
αi ∼ α, σα2

it ∼ 0, σ2
I Dans ce cas, MCO consistant (car αi non-corrélés à xit )

I Mais Moindres Carrés Généralisés MCG sera plus efficient
Rappel : MCG en coupe transversale

I Quand toutes les hyp. du modèle linéaire sont satisfaites
I sauf que la matrice var-cov Σ des erreurs n’est pas l’identité,
alors
I MCO consistant
I mais pas efficient (Gauss-Markov ne s’applique plus)
I Si on connait Σ, on peut retrouver l’efficience
0
I Soit le MRL en coupe transversale y = x β +
0
I avec E = Σ 6= σ 2 I
0
I On peut montrer qu’il existe toujours P telle que P P = Σ−1
I Décomposition de Cholesky, non-unique pour les matrices
réelles sdp
I Prémultiplier le modèle linéaire par P : Py = Pxβ + P
I y ∗ = x ∗ β + ∗
0
0
0 0
I Alors Var (∗ ) = E P P = PE P
0
0 −1 0 0 −1 0
I = PΣP = P P P P = PP −1 P P =I
Rappel : MCG en coupe transversale
I Donc, le modèle transformé a des erreurs dites sphériques

I Donc, MCO sur les données transformées est efficient
I C’est MCG
I En pratique, Σ est inconnue, il nous en faut un estimateur
consistant
I Tout estimateur consistant de Σ, Σ̂, définit l’estimateur MCG
faisables (consistant)
I En panel, le modèle EA implique une matrice Σ comme dans
la diapo suivante
I Comme détaillé précédemment
Matrice Σ bloc-diagonale de var-cov des erreurs panel EA
σv2α + σv2ε σv2α σv2α

 
···
.. ..
.
 
 σv2α σv2α + σv2ε . 
 0 ··· 0 
 .. .. .. 

 . . . σv2α


σv2α ··· σv2α σvα + σv2ε
2
 
 
.. .. ..
 
0 . . .
 
 
.. .. ..
 
 

 . . . 0 


 σv2α + σv2ε σv2α ··· σv2α 

 .. .. 
σv2α σv2α + σv2ε . .
 
0 ··· 0
 
.. .. ..
 
. . .
 
 σv2α 
σv2α ··· σv2α σv2α + σv2ε
Estimateur nº5 EA
I On appelle estimateur EA l’estimateur MCG
I dans lequel la matrice Σ des erreurs est celle de la diapo
précédente
I La version faisable de cet estimateur est MCO
I appliqué aux données transformées de la façon suivante :
0
yit − λ̂ȳi = 1 − λ̂ µ + xit − λ̂x̄i β + νit (10)
où νit = (1 − λ̂)αi + (εit − λ̂ε̄i ) est asymptotiquement iid, et
I λ̂ est un estimateur consistant pour

σ
λ=1− p (11)
σ + T σα2
2
Estimateur EA
I On ajoute l’intercept (non-aléatoire) scalaire µ afin de
normaliser les effets aléatoires αi à une espérance nulle
I et ainsi faire coincider l’estimateur avec l’hypothèse EA (5)
I C’est-à-dire µ correspond à α dans (5)
I La dérivation de cet estimateur (10) et des manières d’estimer
σα2 et σε2 , et donc λ,
I sont détaillés dans Cameron & Trivedi
I Remarque
I λ̂ = 0 correspond à l’estimateur MCO
I λ̂ = 1 correspond à l’estimateur within
I λ̂ → 1 lorsque T → ∞ (regardez la formule)
I Il s’agit d’un estimateur en deux étapes de β
1. estimer λ (il y a plusieurs manières)
2. estimer β par MCO sur les données transformées
Propriétés de l’estimateur EA
I Consistant et efficient si le modèle EA est le bon

I Le gain d’efficience par rapport à l’estimateur MCO n’est pas
nécessairement élevé
I Probablement inefficient si l’hypothèse d’équicorrélation
n’est pas vraie
I p.e. dans un processus AR (1)
I ou si le MRL est le bon
I Inconsistant si le modèle EF est le bon car alors αi est corrélé
avec xit
Interprétation : EF vs. EA
Sommaire

Discussion sur EA et EF
I La plupart des disciplines de stat appliquées
I traitent l’hétérogénéité inobservée (individuelle) αi comme
distribuée indépendamment des régresseurs
I Sauf la micro/macroéconométrie
I Cette hyp d’indépendance
I a l’avantage de permettre une estimation consistante de tous
les paramètres
I y-compris ceux invariants dans le temps
I si l’hyp est vraie
I est souvent considérée par les économistes comme non
supportée par les données
I Les deux modèles ont des intérêts distincts
I EA : Précise la structure temporelle → Efficience
I EF : Endogénéité de l’hétérogénéité inobservée → Consistance
Prédictions et effets individuels
0
I Le modèle est yit = αi + xit β + it aussi bien pour EA que
pour EF
I L’effet individuel αi est une v.a. dans les deux modèles
I On prend l’espérance conditionnelle aux régresseurs
I E [yit |xit ] = E [αi |xit ] + xit0 β
I Que peut-on en dire ? (prochaine dia)
Prédictions et effets individuels

I Dans le modèle EA, il est supposé que E [αi |xit ] = α
I Donc E [yit |xit ] = α + xit0 β
I Si EA est le bon modèle, α peut être estimé de façon
consistante
I Donc on peut prédire yit par E [yit |xit ]
I Dans EF, E [αi |xit ] varie avec xit et on ne sait pas comment
I C’est raisonnable car αi comprend des charactéristiques
inobservées
I Donc E [yit |xit ] ne peut être identifié : pas de prédiction
I Malgré cela, on peut estimer les β de façon consistante
I Et donc les effets marginaux sont identifiés
β = ∂E [yit |αi , xit ]/∂xit
I Par exemple, l’effet d’un changement de prix sur les ventes
I Mais seulement pour les régresseurs variant dans le temps
Résumé estimateurs et modèles linéaires courants pour panel
Modèle
Estimateur de β MRL (1) EA (3) & (5) EF (3)
MCO (1) Consistant Consistant Inconsistant
Between (7) Consistant Consistant Inconsistant
Within (EF) (8) Consistant Consistant Consistant
D1 (9) Consistant Consistant Consistant
EA (10) Consistant Consistant Inconsistant
Cette table ne présente que la consistance des estimateurs de β
I L’estimation des αi est toujours inconsistante, sauf si αi = α∀i
I La consistance ne tient que si les propriétés des modèles
tiennent
Le seul estimateur efficient est EA si le bon modèle est EA
Application
Sommaire

Application
Package plm
I Créez un nouveau projet p.e. panel

I Installer plm (Croissant & Milo)
I fichier de commande 2017Panel.R sur le site du cours
I Structure des données dans plm
I Peut être un dataframe
I mais il faut un index qui indique i
I Soit on passe un argument index dans les fonctions
d’estimation et de test de plm
I Sinon, plm suppose que la première col. contient l’index i et la
2º le temps t
I On peut aussi utiliser pdata.frame(x, index = NULL,...)
I sur x un dataframe normal
I pour créer un dataframe compris par plm
Application
Exemple : déforestation amazonienne
I Le fichier de données est en ligne sur le site du cours

I À charger dans R-Studio via l’interface
I Bouton fenêtre HD
I Données de 1988 à 2015
I États de l’Amazone légale
I 9 états du bassin brézilien de l’Amazone
I Le Brésil est un pays fédéral
I Chaque état a une latitude importante sur ses politiques
Amazonie légale du Brésil
Déforestation 2001
Déforestation 2002
Déforestation 2003
Déforestation 2004
Déforestation 2005
Déforestation 2006
Déforestation 2007
Déforestation 2008
Déforestation 2009
Déforestation 2010
Déforestation 2011
Déforestation 2012
Déforestation 2013
Déforestation 2014
Déforestation 2015
Application
Hypothèse : Courbe de Kuznetz Environmentale CKE
I S. Kuznets (1955) suggère une relation “U-inversé” ∩

I entre la croissance économique et les inégalités de revenu
I Le développement induit d’abord des inégalités
I À mesure que le revenu moyen augmente, ces inégalités
deviennent intolérables et disparaissent
I p.e. transferts, meilleures opportunités, meilleure éducation,
système de santé, biens publics...
I CKE suggérée par Grossman & Kruger (1991, 1995)
I Les dommages environnmentaux augmentent d’abord avec le
développement
I Puis se récupèrent lorsque le revenu moyen augmente
I Émissions, déforestation,...
Application
CKE formel
I Les niveaux plus élevés de revenu par habitant PIBh
I sont graduellement associés avec des niveaux plus faibles
d’émissions y
I Jusqu’à une baisse nette à un “turning point”
yit = β0 + β1 PIBhit + β2 PIBh2it + γxit + it
I x : autres régresseurs/contrôles potentiels

Application
Évidence de CKE
I Bien que décrite comme une relation temporelle
I CKE a + souvent été étudiée en coupe-transversale ou en panel
I Lorsqu’on la trouve, est-ce causal ou spurieux ?
I Stern 2004
I CKE pour les émissions de CO2 & CO2 eq sont spurieuses
I L’apparence de CKE est due à un mélange d’effets
1. La pollution % de façon monotone, voire linéaire, avec le
revenu
2. Mais le “temps” fait baisser les émissions, on émet moins
3. Dans les pays à croissance rapide, l’effet revenu (% émissions)
est plus fort que l’effet temps
4. Dans les pays riches, la croissance est faible, donc les efforts
de réduction des émissions peuvent dépasser l’effet revenu
I C’est ce qui cause un CKE apparent en coupe transversale ou
en panel
Application
CKE déforestation
I Objectif : Estimer l’équation KCE par panel

I Dans le cas de la déforestation
I Le modèle opérationnel d’intérêt
dit = βi + β1 PIBhit + β2 PIBh2it + γxit + it (12)
I d = déforestation annuelle
I On pourrait postuler un modèle dynamique en incluant di,t−1
dans x
I mais on reste en statique dans ce chapitre
I On pourrait regarder en log
Application
CKE déforestation
I Il y a un problème d’échelle
I Déforestation en niveau, par habitant ou par km² ?
I On fait abstraction de cela ici, mais c’est certainement
important
I PIB local ou national ?
I Interprétation, p.e. Kauppi et.al. (2006)
I avec la hausse du PIB, la déforestation devient moins
intéressante que d’autres alternatives
I On est donc plutôt sur le PIB national, mais on va faire le
cours avec le PIB par état par simplicité
Application
CKE déforestation : les x

I PPCDAm
I Plano Plurianual (de Ação) para a Prevenção e Controle de
Desmatamento, Queimadas e Exploração Madeireira Ilegal na
Amazônia Legal
I Politique de lutte contre la déforestation, instaurée en 2004
I Prix agricoles, principalement boeuf, soja dans une moindre
mesure
I Prix locaux ou internationaux ?
I Ces deux prix sont assez corrélés (65%)
I Pression de population
I Peu probable car les migrations se font surtout vers les villes
I Extraction de bois
I Existe mais peu évoquée comme pression
Examiner les variables
I Etat → noms des états
I Year → année
I pop → population en h
I surface en km²
I PIBh2010R → PIB en Real de 2010
I IPEA-IBGE (statistiques officielles brésiliennes)
I Defor_km2 deforestation annuelle en km²
I Prodes http ://www.obt.inpe.br/prodes/taxas_prodes.htm
I 1988 : moyenne 1978-1988 (peut-être préférable de l’éliminer) ;
1993-94 : moyenne 2 années
I PPCDAmCurR → budget du plan d’action contre la
déforestation en Real nominaux
I Par État : plano pluriannual (plan pluriannuel) et Lei
Orçamentária Anual (loi du budget annuel) sur les portal do
transparencia de chaque État
I La donnée n’est pas présente pour tous les états ni tous les ans
I 0 de 1988 à 2003 inclus pour tous les États
I 3 phases : 2004-2008, 2009-2011, 2012-2015
I CPI → consumer price index (World Bank)
I PPCDAm2010R → budget du plan d’action en Real de 2010
Graphique : scatterplot
Graphique : ggplot2+facet (installer ggplot2)
Graphique : log(Defor)~PIB
Graphique : Defor~Etat
Graphique : Defor~Year
Application
Transformer les données
I Conversion en “pdata.frame” pour plm

I Prend en compte la variable temps (Year) correctement
I C’est-à-dire avec une durée entre observations
I 2 arguments logiques
I drop.index laisse tomber les index du data.frame
I row.names crée des noms de ligne de type “Acre-1988”
I Il y avait AmaLegal dans les données
I La somme des autres : il faut laisser tomber cette série
I On a laissé tomber, mais il restait le nom
I En convertissant en pdata.frame, ce nom disparait
Application
Qualité des données

I “Cylindrage” du panel - quelle justification ?
I Le PIB (par état) n’est dispo que jusque 2013 ∀ États
I Il faudrait que je mette à jour
I Tocantins n’a pas de PIB en 1988
I La déforestation n’est dispo qu’à partir de 1988
I Donc : pas de conséquence
I Importantes différences sur le budget du PPCDAm
I Restreint beaucoup l’échantillon
I Les états qui tiennent bien les comptes pourraient être ceux
qui font plus d’effort sur la déforestation ?
I En tout cas, les plus gros “déforesteurs” (Mato Grosso, Pará,
Rondônia)
I présentent peu de données
I Biais de sélection ?
I Les résultats sont-ils sensibles à la qualité des données ?
Application
Régression dans R
I On va commencer par la CKE seule (pas de x)

I Ça n’est pas correct statistiquement
I mais on veut surtout illustrer les régressions panel
I Du général au particulier
I Modèle + général : effets fixes
I Estimateur Within
I Estimateur Diff 1ere
I Second modèle : effets aléatoires
I Modèle plus restrictif : MRL
I Estimateur MCO
I Estimateur Between
I plm se charge de transformer les données
Application
Estimateur EF Within
I plm(Defor_km2~PIBh2010R+I(PIBh2010R^2), data=pama,
model = "within")
I Unbalanced Panel : n=9, T=25-26, N=233
I Tocantins n’a pas de donnée de revenu en 1988
I La sortie ne présente pas d’intercept
I Suit la théorie, mais + difficile à comparer avec EA
I On ne regarde pas les t-stat et les tests pour le moment
I Les autres modèles linéaires fonctionnent de la même manière
I en changeant juste l’option model
I Les α̂i sont extraits par la commande fixef avec des options de
calcul
I Même non-consistants, on peut corréler ces α̂i avec des
variables d’intérêt
I Juste pour within
Application
Estimateur EF D1 - fd
I plm présentait un intercept : qu’est-ce que ça veut dire ?

I implicitement, le modèle en niveaux devrait alors inclure un
trend
dit = α + τ t + β1 PIBit + β2 PIB2it + it
⇐⇒
∆dit = τ + β1 ∆PIBit + β2 ∆PIB2it + ∆it
I On exclut l’intercept en ajoutant "-1" à la formule
I Ça ne change pas grand chose (dans ce cas-ci)
I Dans des versions antérieures de plm, l’intercept était enlevé
Application
Estimateur EA - random
I Plusieurs versions
I random.method = c("swar", "walhus", "amemiya", "nerlove",
"kinla")
I Se différencient essentiellement selon le mode de calcul de
MCG
I Je ne détaille pas - on laisse tomber
I Défaut : swar : Swamy and Arora
I summary informe sur la variance de chaque composante de
l’error
I idiosyncratic : σ2 ; individual : σα2
I Theta est le θ de MCG
I L’estimateur EA avec effets temporels (“two way”) n’est pas
implémenté
Application
Estimateurs MCO, Between
I Between
I Nombre d’observations réellement utilisées = “Observations
used in estimation” = 9
I Pooling – même chose que MCO
Application
Comparaison des résultats
EF - Within EF - D1 EA - MCG Pooling Between

β0 – -99.5 -1045 1057 6942
β1 DIP 630 437 624 121 -1290
β2 DIP2 -31.4 -11.5 -31.1 -4.96 68.294
# obs. 233 224 233 233 9
Sans dich. de temps
I Au vu des graphiques, pooling & between ne sont pas
appropriés
I Within et EA ont des résultats semblables
I Forte différence (EF D1) vs. (EA MCO Between)
I Révèle endogénéité - donc ici, peu probable
I D1 est qualitativement semblable
I On en rediscute lors de l’inférence
Application
Dichotomiques de temps – twoways
I Permettent de “filtrer” un choc idiosyncratique

I qui affecte tous les états de façon semblable
I Mais beaucoup de régresseurs (1988 → 2014 = 27)
I introduit potentiellement du bruit
I plm option effect = "twoways"
I On les extrait avec fixef(modèle estimé,effect="time")
I Si on donne l’option effect = "time" à plm : supprime les αi
I pas défini pour D1 : pq ?
I ni pour be bien sûr
I pour EA, ne fonctionne que pour les panels “balanced”
I Lorsque toutes les dich de temps sont introduites
I Peu de différence
Sommaire
Autres tests
Annexes
Matrice des erreurs en panel
Sommaire

Inférence
I L’inférence consiste en
I la prédiction
I les tests d’hypothèses
I L’inférence classique fait des tests d’hyp.
I dont la significativité des coefficients
I à partir de la matrice Σβ de variance-covariance des β̂
I Donc : essentiel de disposer d’une estimation
I au minimum consistante
I de cette matrice Σβ
I Celle-ci s’appuie sur la matrice Σu
I Var-Cov des erreurs uit = αi + it
I Prochaine dia
Rappel sur la matrice var-cov des erreurs panel en général
σv211
 
σv112 ··· σv11T
.. ..
.
 
 σv212 . 
 0 ··· 0 
 .. .. .. 

 . . . σv1(T − 1)T


SYM ··· σv21T
 
 
.. .. ..
 
0 . . .
 
 
.. .. ..
 
 

 . . . 0 


 σv2N1 σvN12 ··· σvN 1T 

 .. .. 
σv2N2 . .
 
0 ··· 0
 
.. .. ..
 
. . .
 
 σvN(T − 1)T 
SYM ··· σv2NT
Rappel 2 : Matrice Σu dans le modèle EA avec
hétéroscédasticité
σv2α + σv2ε1 σv2α ··· σv2α


 .. ..

σv2α σv2α + σv2ε1 . .
0 ··· 0

.. .. ..

. .


 . σv2α

 σv2α ··· σv2α σv2α + σv2ε1

.. .. ..
0 . . .


.. .. ..



 . . . 0
σv2α + σv2εN σv2α ··· σv2α


.. ..


 σv2α σv2α + σv2εN . .
 0 ··· 0
.. .. ..

. . .

 σv2α
σv2α ··· σv2α σv2α + σv2εN
Estimateur MC
I Tous les estimateurs panel sont MC sur données transformées
I MC traite chacune des T années comme de l’information
indépendante, mais
I Le contenu informationnel est moindre
I puisque les erreurs (et donc les obs.) sont corrélées
I Ceci tend à surestimer la précision
I Le modèle qui fait le plus d’hypothèses sur Σu est EA
I Si ce modèle est exact, on peut procéder à l’inférence
habituelle
I à partir des données transformées MCG
I Dans les autres cas,
I On utilise des corrections panel des écarts-types (et) quand on
applique MCO
I Beaucoup de corrections sont possibles, selon les hyp. sur la
corrélation et l’hétéroscédasticité
I Et aussi selon la longueur du panel – mais on ne verra pas
Inférence statistique Panel-robuste
I Des écarts-types Panel-robustes peuvent être estimés

I sans supposer de forme fonctionnelle spécifique pour la
corrélation ou l’hétéroscédasticité des erreurs individuelles
I au moyen de 2 techniques
I l’estimateur robuste de White
I le bootstrap
I Dans beaucoup de packages économétriques, les et calculés
par défaut
I assument des erreurs iid
I Donc une matrice Σu diagonale
I incohérente avec panel
I Cette inférence est erronée
I En général, elle sous-estime les et, donc sur-estime les t-stat
Efficience en panel
I En panel, donc, on utilise des estimateurs inefficients

I mais on estime leur matrice de var-cov Σβ̂ de façon
consistante
I Lorsque l’estimateur de β est consistant
I Seul l’estimateur EA est efficient dans le modèle EA
I Tous les autres estimateurs consistants sont inefficients dans
tous les modèles
I Estimateurs plus efficients
I Moindres Carrés Généralisés (faisables) : pggls
I Méthode Généralisée des Moments GMM : Ch. 2
I Les estimateurs EF, EA et D1 tendent à réduire la corrélation
sérielle
I mais pas à l’éliminer
Inférence robuste : White
Sommaire

Rappel : l’estimateur de Σβ̂ hétéroscédastique-consistant de

White
I MRL classique en coupe transversale
0
0
I y = x β + avec E = Σ 6= σ 2 I
I MCO est non-biaisé et consistant
0 −1 0 0 −1
I Var β̂OLS = Σβ̂ = X X X Σ X X X 6=
MCO
0 −1
σ2 X X
I En cas d’hétéroscédasticité pure, White (1980) montre que
N
1X 2 0
S= ˆi Xi Xi
N
i=1
I est un estimateur consistant de N1 X Σ X sous des conditions

0
générales
0
I ˆi est le résidu MCO ˆ = y − x β̂MCO
L’estimateur de Σβ̂ hétéroscédastique-consistant de White

en panel
I L’estimateur de White peut être étendu pour l’autocorrélation

I mais souvent on ne le fait pas
I car on cherche à étudier les propriétés temporelles dans plus
de détails
I Sauf en panel court
I où la série est trop courte pour la tester en détail
I On va voir brièvement comment White est appliqué au Panel
L’estimateur de Σβ̂ hétéroscédastique-consistant de White

en panel
I Réécrire tout estimateur panel comme un estimateur MC de θ
dans
0
ỹit = w̃it θ + ũit (13)
I ỹit est une fonction connue de seulement yi1 , ..., yiT
0 0
I Pareil pour w̃it et wit0 = 1 ; ũit et uit

xit
0
I p.e. MCO : pas de transformation, θ = α β 0

I Within : ỹit = yit − ȳi , w̃it = xit −x̄i uniquement pour les
régresseurs variant dans le temps
I θ : coefficients des régresseurs variant dans le temps
I ...
I / Ces transformations induiront de la corrélation sérielle
I même si les erreurs originelles n’en ont pas
Notation
I Empiler les observations selon les périodes pour un individu i :

I ~
yi = W~ 0θ + ~
ui où
i
I ~
yi : T × 1
I Pour D1, (T − 1) × 1
~i : T × q
I W
" N #−1
~ W
0
~ ~~
X X 0
I MCO θ̂MCO = W i i W yi i
i=1 i
I pour tous les estimateurs panel
Variance estimateur MCO

I Variance de θ̂MCO dans le modèle avec un ~ :
" N #−1 " N #−1
~ iW
~i ~ iE ~ ~i W~i ~ iW
~i
X 0 X 0 h 0 i X 0
Σθ̂MCO = W W ui ~
u i |W W
i=1 i i=1
I Même formule sandwich que dans le rappel

I Sauf qu’on a un vecteur ũi plutôt qu’un scalaire ui
I et des Σi plutôt que directement les matrices
I White :
I On a pas besoin d’un estimateur consistant de la matrice
var-cov des erreurs Σu pourX l’inférence
~ 0E ~ ~i W~i
h 0 i
I Il suffit d’un estimateur de W i u i ~
u i |W
i
I La partie du milieu de Σθ̂
MCO
I Qui est de dimension plus réduite que Σu
Estimateur “Panel-robuste” de la matrice de var-cov Σθ̂MCO

I L’estimateur de White faisable de Σβ̂
I étendu pour le panel
I permet à la fois hétérodasticité et autocorrélation
" N
#−1 " N
#−1
0
~iW
0
~i ~ i^
0
ui ^ ~i ~iW
0
~i
X X X
\=
Σ θ̂MCO W W ~ ~
ui W W (14)
i=1 i i=1
où ^
~
ui = ~ ~ 0 θ̂
yi − W i
I L’information accumule lorsque N → ∞

I car la mat. Σu de var-cov des erreurs est de dimensions finies
X
T × T alors qu’on prend
i
I C’est la base de la consistance
Détail
~ 0E ~ ~i W~i
X h 0 i
I On cherche W i ui ~
u i | W
i
0
~ 0^
ui ^ ~i
X
I On prend W i~ ~
ui W
i
I simplification de notation
···
   
zi11 zik1 ei1
. .. ..  ˆ  . 
 ..
I W̃i = Zi =  . . , ũi = ei =  .. 
zi1T ··· zikT eiT
0 0
X
Zi ei ei Zi =
i
 0   0  
zi11 · · · zik1 ei1 ei1 zi11 · · · zik1
X . ..   ..   ..   .. .. 
. . . ..
 . . .   .  .   . . . 
i zi1T · · · zikT eiT eiT zi1T · · · zikT
(k × T ) × (T × 1) × (1 × T ) × (T × k) = (k × k)
X 0 0
Détail : Zi ei ei Zi
i
  2  
z ··· zi1T ei1 ··· ei1 eiT zi11 ··· zik1
X  i11
. ..   .. ..   .. .. 
 .. .. ..
= . .  . .  . . . 
i 2
zik1 ··· zikT sym ··· eiT zi1T ··· zikT
 P P  
ei1 · · · eiT t zi1t eit
t zi1t eit zi11 · · · zik1
X .. .. ..   .. .. .. 
=  . . .  . . . 
i
P P
ei1 t zikt eit · · · eiT t zikt eit zi1T · · · zikT
 P P P P 
t zi1t eit t zi1t eit · · · t zikt eit t zi1t eit
X .. .. ..
= . . .P

 
i
P
sym ··· t zikt eit t zikt eit
On voit comment on se rapproche d’une matrice de var-cov
Estimateur Panel-robuste de la matrice de var-cov Σθ̂MCO

I Cet estimat. (14) assume l’indépendance entre les i & N → ∞
I mais permet que V [uit ] et Cov [uit , uis ] change avec i, t, et s
I ce qui est le cas pour des panels courts
I Des e.t. panel-robustes basés sur cet estimateur (14)
I peuvent être calculés en utilisant une commande MCO
habituelle
I avec une procédure parfois appelée “cluster-robust” pour le
calcul des e.t.
I cluster sur i
I Erreur fréquente :
I utiliser une procédure “standard robust” des e.t. dans MCO
0
sur ỹit = w̃it θ + ũit
I Ajuste uniquement pour hétéroscédasticité
I En panel, en pratique, plus important de corriger pour la
corrélation sérielle
Application White
Sommaire

Application White
Application : déforestation amazonienne
Rappel
I États de l’Amazone légale (un état n’a pas 1988)
I Modèle CKE
yit = αi + β1 PIBhit + β2 PIBh2it + γxit + it
I On ne regarde pas x pour le moment

Application White
vcovXX : fonctions du package plm

L’autocorrélation sérielle et/ou l’hétéroscédasticité
I ne modifie les coefficients estimés
I mais la matrice de v-cov des β̂ doit être estimée correctement
I plm ne fait pas les tests lui-même
I mais calcule une estimation robuste de cette matrice
I qui est ensuite passée au package lmtest pour les tests
vcovHC correspond à l’estimation de White telle qu’on la vue pour
panel
I plusieurs alternatives existent sur le même principe
I Elles sont généralement + modernes et mieux adaptées à
certains cas
I voir help plm, dans la liste descendre à vcov
I On va juste regarder le classique vcovHC
Application White
vcovHC
vcovHC(x,
I x : objet de class "plm" (résultat d’une estimation EA ou
within), ou class "pgmm" ou class "pcce"
method = c("arellano", "white1", "white2"),
I white1 : hétérocédasticité de tout type, pas d’autocorrélation
I white2 : même variance au sein d’un groupe i
I arellano : structure générale hétérocédasticité comme white 1
et autocorrélation à l’intérieur d’un groupe
I Entre groupes, pas de corrélation
type = c("HC0", "sss", "HC1", "HC2", "HC3", "HC4"),
I diverses corrections pour la taille d’échantillon entre autres
cluster = c("group", "time"), ...)
I normalement le cluster est sur “group”
I Si on prend “time”, on groupe par t au lieu que par i
Application White
vcovHC estimée
I Dans le cas de la déforestation

I On s’attend à Hétéroscédasticité et Autocorrélation
I Donc : arellano
I vcovHC.w <- vcovHC(defor.w, method="ar")
I et similaire pour ea & fd
Application White
Package lmtest – Zeileis & Hothorn
I Possiblement il faut l’installer & le charger

I lmtest peut exécuter plusieurs tests classiques
I associés aux modèles linéaires
I coeftest est le t-stat
I mais aussi z-stat dans les conditions appropriées
I coeftest(x, vcov., ...)
I x est un objet stocké résultat d’une estimation
I vcov. est soit une matrice stockée, soit une méthode pour
calculer cette matrice à partir de x
I coefci(x, vcov., parm, level ...)
I idem, mais donne l’intervalle de confiance
I pour le paramètre dans parm (optionel)
I et le niveau de confiance dans level (.95 par défaut)
Application White
Résultats – en reprenant les estimations oneway
EF - Within EF - D1 EA - MCG Pooling Between

coef. p-val coef. p-val coef. p-val coef. p-val coef. p-val
β0 – -99.5 .14 .03 -1045 .35 .61 1057 .37 .61 6942 .40
β1 DIP 630 2e-05 .09 437 .27 .04 624 2e-05 .09 121 .55 .75 -1290 .41
β2 DIP2 -31.4 3e-08 .02 -11.5 .43 .025 -31.1 3e-08 .025 -4.96 .55 .70 68.294 .33
# obs. 233 defaut White 224 defaut White 233 defaut White 233 defaut White 9 defaut
I Le changement important de significativité en passant à White

I de pls ordres de grandeurs sur les p-valeurs
I Faible significativité de D1 due à la perte d’efficience en
passant aux diff. 1º
I Surprenante récupération en passant à White
I Possiblement, montre l’importance de la cointégration
Application White
Autres tests sur les coefficients
I Test de Wald : comparer des modèles anidés

I waldtest du package lmtest
I Tester des restrictions linéaires
I linearHypothesis( ) du package car
I Voir plm vignette p 40.
Application White
Note. Décomposition de la variance

I Pour l’estimateur EA, la sortie indique “Effects :
I Idiosyncratic – it
I Individual – αi ”
I Si le modèle est twoway (et le panel balanced), il y a aussi un
terme time
I Cela reflète la variance estimée de l’erreur
I La variance totale s 2 d’une série panel xit peut être
décomposée en
N XT N X T
2
1 1
[(xit − x̄i ) + (x̄i − x̄)]2
X X
NT (xit − x̄) = NT
i=1 t=1 i=1 t=1
N X T N X
T
2
1 1
(x̄i − x̄)2
X X
= NT −N (xit − x̄i ) + N−1
i=1 t=1 i=1 t=1
car les produits croisés somment à zéro.

Application White
Décomposition de la variance des résidus

I Variance totale s 2 =
I sw2 variance within “individual”
I [moyenne sur les i des déviations individuelles autour des
moyennes individuelles]
I = variance due aux évolutions temporelles individuelles (en
moyenne sur les i)
I + sb2 variance between “idiosyncratic”
I [déviations des moyennes individuelles autour de la moyenne
générale]
I = variance due aux écarts entre individus
I Ici on a que de la variance totale inexpliquée
I 20% est idiosyncratique
I 80% est due aux différences intra individus
I C’est bien l’intuition des graphiques panel
Inférence robuste : Bootstrap
Sommaire

Rappel : le Bootstrap
I Hyp. Bootstrap :
I Si on pouvait ré-échantillonner la pop. dans les mêmes
conditions, on obtiendrait un échantillon semblable à celui
qu’on a déjà
I “Principe de médiocrité”
I Pas la même chose que représentativité
I Principe (et 2nde hyp.)
I Échantillonner l’échantillon de taille n avec remplacement
I soit n tirages, chaque i a une probabilité 1/n de sortir
I S’appelle “Bootstrap par paire” car y et X sont tirés
I On obtient un échantillon Bootstrap (de taille n)
I Hyp. : semblable à ce qu’on aurait obtenu en
ré-échantillonnant la pop.
I Répliquer ce processus B fois
I B pseudo-échantillons différents
I Pour chaque pseudo-échantillon < Yb , Xb >
I un vecteur θ̂b
Rappel : le Bootstrap
I Pour construire un intervale de confiance pour un élément θk
de θ
I On a B estimations θ̂kb p.e. B = 10 000
I Ordonner ces estimations de la plus petite à la plus grande
I Alors l’intervale de confiance à 95% est délimité par
I l’estimation numéro 250, borne inférieure
I l’estimation numéro 9750, borne supérieure
Pourquoi est-ce intéressant ?
1. Pas d’hypothèse sur la distribution des erreurs
1.1 Mais il ne peut y avoir de corrélation entre observations
1.2 Dès lors, en panels, on ré-échantillonne seulement sur i, en
utilisant toutes les T périodes de chaque i sélectionné
2. On peut calculer des intervales de confiance
2.1 pour toute fonction des paramètres estimés, y-compris
non-linéaire
2.2 pour des paramètres estimés de modèles sans propriétés
d’échantillons finis connues
Estimateur Bootstrap (Panel-robuste) de la matrice de

var-cov Σθ̂MCO en panel
I Pour chaque pseudo-échantillon B

I MCO de ỹit sur w̃it
0
I ỹit = w̃it θ + ũit
I B estimations θ̂b , b = 1, ..., B
I Estimateur Bootstrap “empirique” de la matrice de var-cov Σθ̂ :
B
1 X ¯

¯
0
[
Σ boot = θ̂b − θ̂ θ̂b − θ̂ (15)
θ̂ B −1
b=1
où θ̂¯ = B −1 b θ̂b
P
Estimateur Bootstrap (Panel-robuste) de la matrice de

var-cov Σθ̂MCO en panel
I Bootstrap s’applique à toutes les techniques économétriques

I Peut être lent
I Pour autant que les i soient indépendants :
I Consistant quand N → ∞
I Asymptotiquement équivalent au “Sandwich” Panel-robuste de
White
I Pour autant que les hyp. de chauqe approche soient correctes
I ∀ forme d’hétéroscédasticité ou d’autocorrélation (intra-i)
I Pas accessible comme White dans R
I Il faut une programmation + lourde
Application Bootstrap
Sommaire

Application : déforestation amazonienne
Rappel
I Modèle CKE

Bootstrap
I N’est pas implémenté dans le package plm

I Il existe le package boot
I Mais il n’est pas implémenté pour les données de Panel
I Rappel : en panel, bootstrap sur les i, pas sur toutes les
données
I Actuellement, je ne sais pas faire avec un panel non-cylindré
I Sous-échantillon cylindré :
I PIBh manque en 1988 pour Tocantins
I ama3 <- ama2[-which(ama2$Year=="1988"),]
I On enlève 1988
I 27 observations pour chacun des 9 états
Générer un échantillon bootstrap
I myfunc <- function(n,df) {
I #definit function (n et df sont dans l’appel de la fonction +
bas)
I # n est ama3$Etat lors de l’appel de myfunc, df est le
dataframe, ama3
I unique_Etat <- unique(n)
I # Etat unique
I (help : unique renvoie un vecteur ou data frame comme son
arg x mais en enlevant les lignes doublons, dans ce cas définis
sur Etat
I sample_Etat <- sample(unique_Etat,
size=length(unique_Etat), replace=T )
I # choisit sur Etat unique, au hasard avec remplacement, de la
taille de "size" (help sample)
I new_df <- do.call(rbind, lapply(sample_Etat, function(x)
df[df$Etat==x,] ))
I # va chercher toutes les années de chaque Etat choisi
aléatoirement et rbind c’est-à-dire empile par ligne
I }
Générer un échantillon bootstrap

I Notes do.call & lapply
I # do.call : construit & exécute une function
I # do.call(what, args, quote = FALSE, envir = parent.frame())
I # what : soit une (nouvelle) function soit 1 string avec le nom
de la commande à appeler
I # lapply {base} : Apply une Function sur un Vector ; lapply(X,
FUN, ...) renvoie une liste de même longueur que X, chaque
élément duquel est le résultat d’appliquer FUN à l’élément
correspondant de X
I # Note : création d’une 2eme function à l’intérieur de lapply
I a <- myfunc(ama3$Etat, ama3)
I # exécute la function, on voit que le résultat a la même taille
que ama3
I c’est un bien un "panel bootstrap" de ama3
Boucle for de 1 à R
I À ce stade, on a donc 1 échantillon bootstrap

I On l’utilise pour estimer le panel
I On met ca dans une boucle R fois
I R=99
I c <- coef(plm(Defor_km2~PIBh2010R+I(PIBh2010R^2),
data=ama3, index = c("Etat","Year"), model = "within"))
I # Estimation initiale (peut être une part du bootstrap), coef
est un vector
Boucle for de 1 à R
I for(i in 1 :R) {
I a <- myfunc(ama3$Etat, ama3)
I # A chaque i on relance le bootstrap & les estimations
I a$E <- rep(1 :9, each = 27)
I On ne peut pas utiliser directement “Etat” dans un call plm
car il y a des doublons par construction
I c <-
cbind(c,coef(plm(Defor_km2~PIBh2010R+I(PIBh2010R^2),
data=a, index = c("E","Year"), model = "within")))
I # crée une matrice avec tous les 1º coefs sur la 1º ligne, tous
les 2º sur la seconde et ainsi de suite pour l’ensemble des coef
du modele (ici 2)
I }
Sortir les résultats
I colMeans(t(c))
I # moyenne sur chaque coef
I sqrt(apply(t(c), MARGIN = 2, var))
I # écarts-types par coef
I apply : appliquer la fonction “var” sur la matrice t(c) par
colonne (MARGIN=2)
I apply(t(c), MARGIN = 2, quantile, probs=c(.025, .975))
I # 95% CI over coef value
I Conclusion
I le bootstrap ne conclut pas à autant de significativité que la
procédure robuste White (option )
Résultats – à partir des estimations oneway, R =999
EF - Within EF - D1 EA - MCG Pooling

coef. IC 95% coef. IC 95% coef. IC 95% coef. IC 95%
β0,.025 -222 -189 -4733 -5128 -4544 -3052
– – – -99.5 -1045 1057
β0,.975 -17 -10 5009 3039 12164 5166
β1,.025 DIP -404 -103 -194 16 -450 -106 -1516 -616
630 437 624 121
β1,.975 DIP 1260 1364 1006 858 1217 1353 1233 858
2
β2,.025 DIP -53 -58 -24 -21 -49 -57 -59 -31
-31.4 -11.5 -31.1 -4.96
β2,.975 DIP2 12 -5 7 -1 14 -5 49 21
# obs. 233 boot White 224 boot White 233 boot White 233 boot White
Décimales arrondies ; les résultats varient un peu d’un bootstrap à un autre ;

EA : un message d’erreur dans au moins une itération
En résumé
I Dans la plupart des cas, les estimateurs Panel sont inefficients

I On ne tache pas de récupérer l’efficience
I Mais seulement d’estimer correctement var β̂
I pour l’inférence
I 2 techniques
I White
\
I var β̂ = sandwich
I Bootstrap
\
I var β̂ = variance sur pseudo-échantillons
Sommaire
Autres tests
Annexes
Éléments du choix hors tests
Sommaire

Causalité
I Le modèle EF peut établir la causalité avec moins d’hyp.
que pour
I des données de coupe transversale
I le MRL ou les EA
I Dans quelques cas, la causalité est claire, donc EA est
approprié
I p.e. dans une expérience contrôlée, la causalité est claire, il
s’agit plus de mesurer sa force
I des rendements de culture causés par 6= quantités d’engrais,
en labo
I dans ce cas, le traitement xit est alloué aléatoirement, donc
non-corrélé à αi
I Parfois, on ne veut mesurer que la corrélation, pas la
“causation”
I p.e. pour de la prédiction (data mining)
I EA est alors suffisant
Causalité
I Les économistes sont inhabituels
I ils préfèrent une approche EF car ils veulent mesurer la
causalité
I avec des données observationnelles
I plutôt qu’expérimentales
I Dans ce cas, utiliser EA ou MCO n’aboutit qu’à une corrélation
spurieuse souvent due à une hétérogénéité inobservée
I “facteurs confondants” : variables non-incluses corrélées avec
régresseurs
I EF élimine l’hétérogénéité inobservée
I due aux variables inobservées invariantes dans le temps
I (mais pas due à l’hét. inobs. variable dans le temps)
I L’effet causal de x sur y est mesuré par la corrélation entre des
changements individuels dans y et dans x
Échantillon
I Souvent en économie, l’échantillon porte sur

I des agents complexes : personnes ou pays
I des phénomènes expliqués complexes
I travail (chômage, salaire, participation....)
I revenu, croissance, vote, espérance de vie...
I En conséquence
I il est difficle d’argumenter qu’il ne manque pas un régresseur
I histoire, géographie, droit... pour les pays
I psychologie, culture... pour les personnes
I Donc, EF par défaut
I EA doit être justifié
Faiblesse des EF en pratique

I L’estimation des coef. des régresseurs invariants dans le
temps n’est pas possible avec EF
I Les coef. des régresseurs peu variables dans le temps sera
imprécise
I sb (variation entre unités) forte par rapport à sW (variation
dans le temps)
I La prédiction de la moyenne conditionnelle n’est pas
consistante
I car les effets individuels αi ne sont pas estimés de façon
consistante
I Seuls les changements de cette moyenne conditionnelle, causés
par des changement de régresseurs variants dans le temps,
peuvent être prédits
I EF fait moins d’hyp que EA sur l’hétérogénéité inobservée
I mais il faut que celle-ci soit invariante au temps
I αi , pas αit
Test de Hausman
Sommaire

Test de Hausman
Rappel : le test de Hausman
I Principe
I Soit 2 estimateurs θ̂ et θ̃
0
I dans le même modèle ỹit = w̃it θ + ũit
I S’ils sont tous 2 consistants

I alors leur différence θ̂ − θ̃ ne devrait pas être
statistiquement 6= 0, asymptotiquement

I On teste H0 : plim θ̂ − θ̃ = 0 , Ha : plim θ̂ − θ̃ 6= 0
I Sous H0 , la différence entre ces 2 estimateurs converge à une
normale d’espérance zéro
√
I N θ̂ − θ̃ → N [0, VH ]
I VH est la matrice de var-cov de la distribution limite
Test de Hausman
Rappel : le test de Hausman

I Statistique du test de Hausman
0 1 −1
H = θ̂ − θ̃ V̂H θ̂ − θ̃
N
I Principe

I H est une valeur normalisée du carré de la différence θ̂ − θ̃
I Donc, des valeurs élevées de H amènent à rejeter l’hyp. nulle
I On peut montrer que H asymptotiquement χ2 (q) sous H0
I donc rejeter H0 au niveau α si H > χ2α (q)
I avec q le nombre d’éléments de θ
I et donc : un des 2 estimateurs θ̂, θ̃ au moins est inconsistant
I Difficulté pratique : trouver un estimateur V̂H de VH
I On va voir comment on fait en panel
Test de Hausman
Test de Hausman sur la présence d’effets fixes en données

de panel
I Si les effets individuels αi sont fixes
I L’estimateur within β̂W est consistant
I L’estimateur EA β̃EA est inconsistant
I Avec β le vecteur des coefficients des régresseurs variant dans
le temps
I puique seuls ces coefficients sont estimables avec Within
I Tandis que si les effets sont aléatoires
I Les 2 sont consistants
I H0 : pas de différence systématique entre les 2 estimations
I Si H0 vraie : on préfère EA car plus efficient
I en principe, pas si clair si les erreurs sont I(1)
I Hausman fonctionne sur toutes paires d’estimateurs avec des
propriétés semblables
I p.e. D1 vs. MCO
Test de Hausman
Test de Hausman sur la présence d’effets fixes en données

de panel
I Si le test amène à rejeter l’égalité des 2 vecteurs β̂W et β̃EA
I On infère que puisque β̂W est consistant,
I si β̃EA est différent, il doit être inconsistant
I Et donc que les effets individuels αi sont corrélés avec les
régresseurs xit
I Remarque : On peut encore éviter d’utiliser un estimateur EF
I Si les régresseurs sont corrélés aux αi à cause de variables
omises
I il peut être possible de rajouter des régresseurs
I Il peut être possible d’utiliser un estimateur EA avec variables
instrumentales (Ch. 2)

I À présent on regarde la mat. de var-cov de β̃EA − β̂W
I pour calculer la stat de Hausman en panel
I 2 cas
Test de Hausman
Calcul du test de Hausman quand β̃EA EST pleinement

efficient
I Si le modèle vrai est EA avec Equicorrélation, donc
I αi iid 0, σα2 non-corrélé aux régresseurs

I l’erreur εit iid 0, σε2

I Alors β̃EA pleinement efficient,

I la stat de Hausman se simplifie
0 \
h i \
h i−1
H = β̃EA − β̂W V β̂W − V β̃EA ˜β −ˆβ
EA W
I Avec β le vecteur des coefficients des régresseurs variant dans

le temps comme d’habitude
I Cette stat de test est asymptotiquement χ2 (dim [β]) sous H0
I Très facile à calculer
\
h i \ h i
I puisque les matrices V β̂W , V β̃EA sont fournies lors de
l’estimation
Test de Hausman
Calcul du test de Hausman quand β̃EA N’EST PAS

pleinement efficient
I La forme simplifiée de la stat de Hausman n’est pas valable si
αi ou εit ne sont pas iid
I p.e. lorsqu’il y a hétéroscédasticité
I Car dans ce cas l’estimateur EA β̃EA n’est pas pleinement
efficient sous H0
\
h i \
h i
I L’expression V ˆβW − V ˜βEA dans la formule de H doit être
remplacée par
h\ i
I V ˜βEA − ˆβW qui est + générale

I Estimation de la matrice de var-cov de β̃EA − β̂W
I Ceci N’EST PAS implémenté dans plm (et dans les autres
logiciels que je connais)
I Mais peut être estimé de façon consistante par bootstrap sur
i (pas t)
Test de Hausman
Calcul du test de Hausman quand β̃EA N’EST PAS

pleinement efficient
I Une version panel-robuste de la stat de Hausman est
´ h\ i−1
HRobuste ˜ ˆ
= βEA −βW ˜ ˆ
Vboot βEA − βW ˜β −ˆβ
EA W
B 0
δ̂b − δ̂¯ δ̂b − δ̂¯
h\ i
1
X
I avec Vboot ˜βEA − ˆβW = B−1
b=1
I b est la b ème de B replications bootstrap et δ̂ = ˜βEA − ˆβW
I Cette stat de test peut
I être appliquée à des sous-vecteurs de β
I utiliser d’autres estimateurs tels que β̃MCO à la place de β̃EA et
β̂D1 à la place de β̂W
Test de Hausman
Application du test de Hausman
Rappel. Déforestation amazonienne

I Modèle CKE

Test de Hausman
Illustration du calcul habituel du test de Hausman dans R
I ama3$PIBSQR <- PIBh2010R^2

I Pourquoi ? Comme ca, PIBh^2 est dans ama3
I phtest(defor.w3, defor.re3)
I p-valeur légèrement inf. à 5% : on R H0 (within=re)
I Mais pas solidement
I phtest(modèle 1, modèle 2)
I La version de base, qui utilise la vcov par défaut de chaque
modèle
I Donc, certainement fausse si on R H0 car alors re ne peut pas
être efficient
Test de Hausman
Illustration du calcul habituel du test de Hausman dans R
I plm fournit une version basée sur une méthode plus moderne
de calculer H
I form <- Defor_km2~PIBh2010R+PIBSQR
I phtest(form, data=ama3)
I exactement le même que la version de base
I phtest(form, data=ama3, method = "aux")
I method = "aux" est la méthode + moderne
I p-val passe à presque 19%
I phtest(form, data = ama3, method = "aux", vcov = vcovHC)
I idem que la précédente, mais matrice de vcov des coef est

robuste
I on tombe a p-val 8%
Test de Hausman
Hausman par bootstrap

I Pour autant que je comprenne
I La version précédente ne résoud toujours pas le problème que
la diff. des matrices vcov n’est pas la matrice vcov du vec. des
diff.
I On applique le bootstrap qu’on a développé précédemment
I On stocke les résutlats des 1000 estimations within dans cw
I 1000 estimations re dans cre
I cre2 <- cre[2 :3,] pour enlever l’intercept
I Calcul de la stat de Hausman
I Hdiff <- cw-cre2
I betadiff <- coef(defor.w)-(coef(defor.re)[2 :3])
I H <- crossprod(betadiff,solve(var(t(Hdiff))))%*%betadiff
I Sous H0, est une chisq(q)
I pchisq(H,df=2, lower.tail = F)
I ' 0 : prob qu’une chi2 > H (si lower.tail = TRUE, prob que
<)
Test de Hausman
Hausman : Conclusion
I On rejette facilement re avec un test inadéquat,

I mais avec bootstrap
I la vcov de la diff de coefficients est (bien) plus grande
I et donc on ne rejette plus du tout
I Ça fait sens
I la différence des βˆ1 est de l’ordre de 6.6
I alors que les βˆ1 sont 100 fois + grands
I la différence des βˆ2 est de l’ordre de -0.34
I idem les βˆ2 sont 100 fois + grands
I Comme les estimations sont peu significatives, il serait
étonnant de conclure à une différence significative
Autres tests
Sommaire
Autres tests
Annexes
Autres tests
Test de “poolability”
I Est-ce que les i de l’échantillon ont des coefficients égaux ? –

sauf intercepts
I Peut-on dire que les pentes des différents i sont toutes les
mêmes ?
I On estime d’abord un modèle dit à coefficients variables pvcm
I Version “within” : un modèle est estimé (par MC) par i
I Version “random” : est le modèle de Swamy
I Essentiellement une moyenne des estimations within
précédentes
I pondérées par une fonction de leurs variances
Autres tests
pooltest
I permet de tester si les résultats pvcm sont significativement

différents des résultats plm
I 1º argument est un objet plm
I 2º argument est un objet pvcm avec model=within
I Si le 1º argument est un model pooling
I Le test s’applique à tous les coefficients y-compris les
intercepts,
I Si c’est un modèle within, il ne s’applique qu’aux pentes,
différents intercepts sont assumés
I est essentiellement un test z
I On rejette fortement l’égalité des coefficients
I Pourquoi ? diapo suivante
pooltest : pourquoi des coef. différents ?
I Voir les graphiques ggplot par Etat
I Déforestation en fonction du temps et du PIBh
I Alors que la décroissance est observée partout, le PIBh évolue
différemment dans 3 états
I Mato Grosso, Rondônia, Amazonas
I Acre, Amapá, Tocantins, Roraima, Pará ont une évolution bien
plus limitée du revenu
I la baisse de déforestation observée y est peut-être due à autre
chose qu’un CKE
I Maranhão est le plus pauvre
I Par contre, voir le scatterplot, la déforestation est
principalement le fait de 3 états :
I Mato Grosso, Rondônia, Pará. Ceci explique l’effet CKE au
global
I Mais, il semble qu’il y ait autre chose en jeu
I On peut aussi se demander si le revenu par état est pertinent
dans une fédération sans frontière interne
I C’est le revenu national (“fédéral”) qui importe en terme
d’opportunité
Autres tests
Tests d’effets individuels et temporels

I Est-ce que αi = α ∀i ?
I Le pooling est-il supérieur aux effets alétoires / fixes ?
I Si αi = α ∀i, alors on préfère MCO aux estimateurs panel pour
l’efficience
I plmtest est un test des multiplicateurs de Lagrange
I À partir d’un objet plm pooling
I N’utilise que les résidus du modèle pooling
I Modèle qui est donc inconsistent si le bon modèle est within
I 4 variantes, arg type
I bp : Breusch and Pagan (1980), traditionnel
I honda : Honda (1985), le défaut
I kw : King and Wu (1997)
I ghm : Gourieroux, Holly, and Monfort (1982)
I Prend l’argument effect
I "individual" (défaut), "time" ou les deux ("twoways")
I pFtest compare le modèle pooling et le within
I pour tester si αi = α ∀i.
Autres tests
Tests d’autocorrélation
I Plusieurs tests d’autocorrélation (corrélation sérielle) sont

implémentés dans plm
I Voir la vignette
I Les tests de racines unitaires sont importants
I Mais nous embarqueraient dans des développements
théoriques trop importants
I On ne les verra pas dans ce cadre-ci
I Car on s’appuie essentiellement sur une inférence robuste
I Mais deux tests ont un impact pratique important
I Choisir entre D1 et EF
I Corrélation entre i
D1 vs. EF
I D1 et EF sont consistants dans les 3 modèles panel
0
yit = αi + xit β + it
I Sauf si corrélation entre it et un régresseur
0
I Mais toutes les transfo ỹit = w̃it θ + ũit sauf pooling (identité)
créent de la corrélation sérielle
I Si T = 2, D1 et EF identiques
I Si le terme idiosyncratique it n’a pas de corrélation sérielle
I alors l’erreur du modèle D1 ũit = it − i,t−1 a une corrélation
sérielle de –0.5
I cor (ũit , ũi,t−1 ) = cor ((it − i,t−1 ) , (i,t−1 − i,t−2 )) = −0.5
I puisque les αi sont éliminés
I Dans ce cas, EF est plus efficient que D1
I car EF n’élimine pas de données
I Si l’erreur du modèle D1 ũit = it − i,t−1 a une corrélation
sérielle nulle
I Alors it = i,t−1 + ũit est une marche aléatoire par définition
I Un processus AR(1) avec corrélation parfaite
I Dans ce cas, D1 est plus efficient que EF
I car la transformation D1 ramène la série à un ordre 0
Autres tests
D1 vs. EF : commande pwfdtest

I Appliquer sur un objet “fd”
I Résultat d’une estimation D1
I Teste par défaut si les résidus D1 (h0=“fd”) n’ont pas de
corrélation sérielle
I Si on ne rejette pas, D1 est recommandé
I L’option h0= “fe” teste pour la corrélation sérielle dans les
résidus non transformés
I Si on ne rejette pas, EF est recommandé
I Si on rejette les deux, l’estimateur choisi aura de la corrélation
sérielle
I Conclusion pour la déforestation
I Indication de corrélation sérielle dans les it
I mais pas dans les résidus D1
I Donc D1 recommandé
Autres tests
Tests de dépendance entre coupes transversales

I Abrégée en XSD pour “cross-sectional dependence”
I Peut arriver
I Si les i répondent à des chocs communs
I S’il y a des phénomènes de diffusion spatiale
I Les i sont alors reliés en fonction de la distance qui les
séparent
I S’il y a XSD
I Aucun des estimateurs présentés n’est efficient
I Au pire, si XSD est due à un régresseur manquant, les
estimateurs sont inconsistants
I Actuellement, plm ne comprend que des tests de spécification
I Détecter une corrélation résiduelle entre i
I La seule solution est de trouver le(s) régresseur(s)
manquant(s)
I Pour l’inférence comme pour la consistance
Commande pcdtest
I Essentiellement, on regarde les corrélations résiduelles entre
chaque paire de i
I Les résidus sont par défaut calculés sur des régressions sur
chaque i
I Mais si la série est trop courte, le test utilise les résidus within
I Il faut que cette régression soit consistante pour que le test
aie du sens
I La version Breusch-Pagan test= “lm” s’applique à des panels
longs
I T → ∞ et n fixe
I la version test= “pclm” est semblable, avec une correction
I La version Pesaran test= “cd” s’applique à toutes tailles
d’échantillon suffisamment grand
I Mais est peu puissante lorsque la corrélation est due à des
chocs qui ont un effet négatif sur certains i et positif sur
d’autres
I Est le défaut
I Il est possible de fournir une matrice de proximité au test
Autres tests
Protocole pratique
1. Estimateurs pour EF
1.1 Within
1.2 Différences premières
I S’il y a des différences notables entre ces deux estimateurs, il
y a probablement des racines unitaires
I Section sur dynamique, différences premières est plus
probablement correct
2. Estimateur EA
I Hausman
I En principe, ça s’arrête là et on interprête
I En économie, si on préfère un modèle sans EF, il faut le
justifier en passant un test de Hausman
3. (optionel) Estimateurs pour MRL
I Si Hausman & la théorie rejette EF
I Si on a de bonnes raisons de soupçonner qu’il pourrait ne pas
y avoir d’EA
I Alors, test d’effets individuels / poolability
Autres tests
Protocole pratique
I Souvent les étudiants procèdent à partir du plus simple :

1. Estimer MCO
2. Estimer EA
3. Tester (effets individuels ou autre) EA contre MCO
4. Si ¬R EA, alors estimer EF
5. Test de Hausman EF contre EA
I Problème avec cette approche
I Si le modèle correct est EF, alors les estimateurs MCO et EA
sont inconsistants
I Les tests à l’étape 3 ne peuvent être utilisés
Sommaire
Autres tests
Annexes
Attrition
I Panel cylindré (balanced)

I Les données existent pour chaque i chaque t
I Lorsque les données de certains i n’existent pas pour certains t
I On dit qu’il y a attrition
I p.e. avec des individus qui abandonnent le panel
I Généralement définitivement
I Le panel est alors non-cylindré
I (unbalanced)
I ou incomplet
I Panel rotatif
I un sous-échantillon d’individus est remplacé chaque année
Consistance
0
I yit = αi + xit β + it
I Soit dit = 1 si i observé au temps t, = 0 sinon
I alors T devient Ti
I Within est consistant si l’hyp d’exogénéité forte devient
E [it |αi , xi1 , . . . , xiTi , di1 , . . . , diTi ] = 0
I C’est-à-dire : présence ou absence (dit ) dans l’échantillon ne

peut être corrélée aux erreurs it
Consistance
I Lorsque ça n’est pas le cas, on a

I un exemple classique de sélection de l’échantillon
I Les estimateurs vus sont généralement inconsistants
I On parle de biais d’attrition
I Des caractéristiques inobservées gouvernent l’attrition
I p.e. dans une enquête sur le salaire, il est plus probable que les
personnes à bas salaires quittent l’échantillon
I Dans des applications macro, les pays les plus pauvres ne
disposent pas d’un système stat et auront plus de donnés
manquantes
I EA est consistant si de plus
I l’effet individuel αi est indépendant des régresseurs xit
Cylindrage (Balancing)
I Opération consistant à convertir un panel non-cylindré en
cylindré
I En excluant de l’échantillon tous les individus dont les données
ne sont pas disponibles tous les ans
I Ou en rejetant les années pour lesquelles tous les individus ne
sont pas observés
I En général, cela réduit beaucoup l’efficience
I D’un autre côté, dans la pratique,
I Il arrive que seules certaines variables ne sont pas observées
tous les ans
I p.e. les questions sur le revenu
I Plutôt que de cylindrer le panel à cause de ça, des méthodes
d’imputation de données sont souvent préférables
I Package mice (on verra en M2 CEE)
Conclusions
I Un panel permet de
I traiter l’hétérogénéité inobservée constante dans le temps
I et donc établir la causation plus facilement
I Il existe plusieurs modèles linéaires non-dynamiques en panel
I selon les hyp. sur les αi
I Et plusieurs estimateurs
I Tous basés sur MC
I On souligne EF, EA et D1
Conclusions
I Hétéroscédasticité & autocorrélation sont normalement
présentes ensemble
I Souvent on ne va pas traiter
I Mais utiliser une version robuste du calcul des et
I White ou bootstrap
I Les estimateurs EF et D1 sont toujours consistants dans ce
contexte
I Mais ne peuvent prédire ou estimer les coef. des régresseurs
constants dans le temps
I Ce que peut EA
I qui de + est + efficient
I Mais repose sur une absence de corrélation en αi et xi
I Le choix entre EF et EA peut être justifié par un test de
Hausman
I Dont le calcul a fréquemment recours à bootstrap
Annexes
Sommaire
Autres tests
Annexes
Annexes
Annexe 1. Sur la consistance de MCO dans les modèles à

données de Panel
Annexes
Compacter la notation
I Empiler les observations sur le temps pour un i donné :

I ~
yi = W~ 0θ + ~
ui où
i
I ~
yi : T × 1
I pour le modèle en diff. 1ères, (T − 1) × 1
~i : T × q
I W
" N #−1
~ W
0
~ ~~
X X 0
I Estimateur MCO θ̂MCO = W i i W i yi
i=1 i
Consistance de MCO dans un modèle ~
I Si le modèle est correctement spécifié :
N
" #−1
~ i0 W
~i ~ i0 ~
X X
θ̂MCO =θ+ W W ui
i=1 i
I Comme l’indépendance entre i n’est pas remise en cause,

I la hcondition
i essentielle pour la consistance de MCO est
~
E Wi ~
0
ui = 0
I c’est-à-dire pas de corrélation des erreurs avec les régresseurs
“à l’intérieur (within)” de chanque individu
~ ~
h 0 i
I E W i ui = 0 est + forte que is E [uit |wit ] = 0 (exogénéité
contemporaine)
I parce que la transformation ~ implique plus d’une période p.e.
w̃it = xit −x̄i
I Exogénéité forte (4) E [ũ it |w̃i1 , ..., w̃iT ] = 0 est suffisante
I Ch. 2 : hyp. + faibles – donc matrice de var-cov + compliquée
Annexes
Annex 2. Abréviations courantes

I D1 estimateur différences premières
I ddl degré de liberté (dof)
I dich. Dichotomique
I v.a. Variable aléatoire (random variable)
I EF Effets fixes (fixed effects)
I EA Effets aléatoire (random effects)
I ES état stationnaire
I et Écart-type (se standard errors)
I iid Indépendamment et identiquement distribué
I MC Moindres carrés
I MCO Moindres Carrés Ordinaires
I MCG Moindres Carrés Généralisés
I MRL Modèle de Régression Linéaire
I p.e. par exemple

Pan ch1-2

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Pan ch1-2

Transféré par

Droits d'auteur :

Formats disponibles

Économétrie des Données de Panel Ch 1.

Modèles Linéaires Non Dynamiques

Économétrie des Données de Panel

Pr. Philippe Polomé, Université Lumière Lyon 2

M1 APE Analyse des Politiques Économiques

Les données de panel Matrice des erreurs en panel

Modèles à données de panel

Estimateurs pour données de panel

Inférence avec données de panel

Effets Fixes vs. Effets Aléatoires

Données de panel non-cylindré

I i = 1, ..., N : agent (individu, firme, pays...)

Organisation des données

Modèles à données de panel

Estimateurs pour données de panel

Inférence avec données de panel

Effets Fixes vs. Effets Aléatoires

Données de panel non-cylindré

Modèles & Estimateurs

I Plus grand choix de modèles et d’estimateurs qu’avec les

Modèle 1. MRL - Modèle de régression linéaire classique

Dichotomiques Individuelles et Temporelles

I Une variante simple du MRL (1)

où les N dichotomiques individuelles dj,it = 1 si i = j & = 0 sinon

les T − 1 dichotomiques temporelles ds,it = 1 si t = s & = 0 sinon

Données de panel avec dichotomiques

obs i i =1 ... i =N t t=1 ... t =T −1 y x1 ... xK

Dichotomiques Individuelles et Temporelles

Les données de panel Matrice des erreurs en panel

Modèle à Effets Individuels

où it est iid sur i et t

I = une façon plus parcimonieuse d’exprimer le précédent

Rappel : l’hétérogénéité inobservée (en coupe transversale

Rappel : l’hétérogénéité inobservée

Modèle à Effets Fixes

Modèle à Effets Aléatoires

Hyp. d’équicorrélation du modèle EA

Autres noms des modèles EF/EA (3)

I Modèle à effets individuels une voie (One-way)

Synthèse des 3 modèles à données de panel

EF 0 Cov (αi , xit )6= 0

I Ces 3 modèles supposent l’hétérogénéité stricte (4)

Modèles à données de panel

Estimateurs pour données de panel

Inférence avec données de panel

Effets Fixes vs. Effets Aléatoires

Données de panel non-cylindré

Les données de panel Matrice des erreurs en panel

Efficience des Estimateurs

Hypothèses sur les erreurs

Matrice Σu de variance-covariance des erreurs en panel

I Sans distinguer entre les trois modèles

Matrice Σu bloc-diagonale de var-cov des erreurs panel

I Le modèle EA met plus de structure dans la matrice Σu

σv2α + σv2ε σv2α ··· σv2α

Les données de panel Matrice des erreurs en panel

Estimateur nº1 MCO

yit = α + xit´ β + (αi −α + εit )

I Donc l’erreur MCO, uit = αi − α + it , est corrélé à xit par αi

Estimateur nº2 Between

Propriétés de l’estimateur Between

I Le modèle implicite derrière l’estimateur between est

Propriétés de l’estimateur Between

où it est iid sur i et t

I Donc l’erreur MCO, uit = αi − α + it , est corrélé à xit par αi

E (it − ¯i |xit − x̄i ) = 0

yit = β0 + β1 PIBhit + β2 PIBh2it + γxit + it

I est un estimateur consistant de N1 X Σ X sous des conditions