Vous êtes sur la page 1sur 161

Ch 1.

Modèles Linéaire Non Dynamiques

Économétrie des Données de Panel


Ch 1. Modèles Linéaires Non Dynamiques

Pr. Philippe Polomé, Université Lumière Lyon 2

M1 APE Analyse des Politiques Économiques


M1 RISE Gouvernance des Risques Environnementaux

2016 – 2017
Ch 1. Modèles Linéaire Non Dynamiques

Next year (2016/17) improvements : Present starting from FE,


then get more restricted. Discuss the Breushc Pagan test & the
usefulness of testing Het & autocrrel
Ch 1. Modèles Linéaire Non Dynamiques

Plan du Ch 1

Les données de panel Inférence en données de panel


Modèles à Données de Panel Matrice des erreurs en panel
Effets Fixes & Effets Aléatoires Inférence robuste en panel :
Estimateurs pour données de panel White
Efficience et Erreurs Inférence robuste en panel :
Estimateurs appropriés pour le Bootstrap
MRL Application : Emissions de CO2
Estimateurs appropriés pour EF Effets Fixes vs. Effets Aléatoires
Estimateur approprié pour EA Éléments du choix hors tests
Interprétation : EF vs. EA Test de Hausman
Application : Convergence des Données de panel non-cylindré
émissions de CO2 (Unbalanced)
Ch 1. Modèles Linéaire Non Dynamiques
Les données de panel

Sommaire

Les données de panel

Modèles à Données de Panel

Estimateurs pour données de panel

Inférence en données de panel

Effets Fixes vs. Effets Aléatoires

Données de panel non-cylindré (Unbalanced)


Ch 1. Modèles Linéaire Non Dynamiques
Les données de panel

Les données de panel

I i = 1, ..., N : agent (individu, firme, pays...)


I t = 1, ..., T : temps
I En général Ti : nombre de périodes diffère d’agent à agent
I Panel “non-cylindré” (unbalanced)
I Attrition, on y reviendra en fin de chapitre
I Pour simplifier la notation, la théorie utilise T
I Les logiciels gèrent Ti
I yit une observation de la variable dépendante y
I xit une observation du vecteur K ⇥ 1 des variables
indépendantes
I “régresseurs”
I Possiblement endogènes – Ch. 2
Ch 1. Modèles Linéaire Non Dynamiques
Les données de panel

Organisation des données

obs agent i temps t y x1 ... xK


1 1 1 y11 x111 xK 11
.. ..
. .
t 1 t y1t x11t xK 1t
.. ..
. .
T 1 T y1T x11T xK 1T
T+1 2 1 y21 x121 xK 21
.. ..
. .
it i t yit x1it xKit
.. ..
. .
NT N T yNT x1NT xKNT
Ch 1. Modèles Linéaire Non Dynamiques
Modèles à Données de Panel

Sommaire

Les données de panel

Modèles à Données de Panel

Estimateurs pour données de panel

Inférence en données de panel

Effets Fixes vs. Effets Aléatoires

Données de panel non-cylindré (Unbalanced)


Ch 1. Modèles Linéaire Non Dynamiques
Modèles à Données de Panel

Modèles & Estimateurs

I Plus grand choix de modèles et d’estimateurs qu’avec les


coupes transversales
I 3 modèles standards dans la présente Section
I 5 estimateurs dans la prochaine Section
I On fera cette distinction modèle / estimateur dans chaque
chapitre
I Chaque estimateur “peut” être appliqué à chaque modèle
I Avec des résultats divers
I On ne sait jamais quel modèle s’applique
I Table 5x3 des propriétés des estimateurs dans chaque modèle
Ch 1. Modèles Linéaire Non Dynamiques
Modèles à Données de Panel

Modèle Général

I Le modèle linéaire le plus général pour un panel


I intercept & pente changent sur i & t
0
yit = ↵it + xit it + uit

I uit un élément scalaire du vecteur du terme d’erreur u


I Identification des paramètres
I Est-il possible de les estimer ?
0
I Ce modèle yit = ↵it + xit it + uit est trop général
I Non estimable : + de paramètres à estimer que d’observations
I Restrictions supplémentaires requises sur
I la manière dont ↵it et it varient avec i & t
I le comportement de l’erreur uit
Ch 1. Modèles Linéaire Non Dynamiques
Modèles à Données de Panel

Modèle 1. MRL - Modèle de régression linéaire classique

I Le modèle le + restricif
I impose des coefficients constants entre i
0
yit = ↵ + xit + uit (1)

I Si ce modèle est le bon (correctement spécifié)


I et si les régresseurs ne sont pas corrélés à l’erreur
I Alors il pourra être estimé, de façon consistante, comme une
coupe transversale
Ch 1. Modèles Linéaire Non Dynamiques
Modèles à Données de Panel

Dichotomiques Individuelles et Temporelles

I Une variante simple du MRL (1)


I Intercepts qui changent entre individus et entre période
I Mais pas les deux à la fois
I Pentes constantes
0
yit = ↵i + t + xit + uit (2)

N
X T
X 0
ou yit = ↵j dj,it + s ds,it + xit + uit
j=1 s=2

où les N dichotomiques individuelles dj,it = 1 si i = j & = 0 sinon

les T 1 dichotomiques temporelles ds,it = 1 si t = s & = 0 sinon


Ch 1. Modèles Linéaire Non Dynamiques
Modèles à Données de Panel

Données de panel avec dichotomiques

obs i i =1 ... i =N t t=1 ... t=T 1 y x1 ... xK


1 1 1 0 1 1 0 y11 x111 xK 11
.. ..
. .
t 1 1 0 t 0 0 y1t x11t xK 1t
.. ..
. .
T 1 1 0 T 0 0 y1T x11T xK 1T
T+1 2 0 0 1 1 0 y21 x121 xK 21
.. ..
. .
it i 0 0 t 0 0 yit x1it xKit
.. ..
. .
NT N 0 1 T 0 0 yNT x1NT xKNT
Ch 1. Modèles Linéaire Non Dynamiques
Modèles à Données de Panel

Dichotomiques Individuelles et Temporelles


I xit n’inclut pas d’intercept
I Si on en met un
I alors une des N dichotomiques individuelles doit être retirée
I Beaucoup de logiciels font ça
I Focus sur les panels courts où N ! 1 mais pas T
I Alors (coef. des dich. temp.) peuvent être estimés de façon
consistante
I Au moins au sens où il y a un nombre fini de ces dich. temp.
I T 1 dich. temp. sont simplement incorporées aux
régresseurs xit
I Par contre, si on insérait l’ensemble des N dich. individuelles
dj,it
I Ça poserait un problème lorsque N ! 1
I On ne peut estimer de façon consistante un nombre 1 de
paramètres
I L’information ne croît pas sur ↵i lorsque N croît
I Challenge : estimer les paramètres
I en contrôlant pour les N dich. indiv. ↵i
Ch 1. Modèles Linéaire Non Dynamiques
Modèles à Données de Panel
Effets Fixes & Effets Aléatoires

Sommaire

Les données de panel Inférence en données de panel


Modèles à Données de Panel Matrice des erreurs en panel
Effets Fixes & Effets Aléatoires Inférence robuste en panel :
Estimateurs pour données de panel White
Efficience et Erreurs Inférence robuste en panel :
Estimateurs appropriés pour le Bootstrap
MRL Application : Emissions de CO2
Estimateurs appropriés pour EF Effets Fixes vs. Effets Aléatoires
Estimateur approprié pour EA Éléments du choix hors tests
Interprétation : EF vs. EA Test de Hausman
Application : Convergence des Données de panel non-cylindré
émissions de CO2 (Unbalanced)
Ch 1. Modèles Linéaire Non Dynamiques
Modèles à Données de Panel
Effets Fixes & Effets Aléatoires

Modèle à Effets Individuels


I Chaque agent i a son intercept, mais toutes les pentes sont
les mêmes entre agents
0
yit = ↵i + xit + ✏it (3)

où ✏it est iid sur i et t

I = une façon plus parcimonieuse d’exprimer le précédent


modèle (2)
I Les dic. temp. sont incluses dans les régresseurs xit
I C’est le modèle linéaire, non-dynamique, à données de panel
“standard”
I ↵i variables aléatoires
I Capture hétérogénéité inobservée invariante dans le temps
I = caractéristiques individuelles inobservées
I En fait : un modèle à paramètres aléatoires
Ch 1. Modèles Linéaire Non Dynamiques
Modèles à Données de Panel
Effets Fixes & Effets Aléatoires

Rappel : l’hétérogénéité inobservée

I Modèle correct : Y = 0 + 1 x1 + 2 x2 +✏
I Modèle estimé : Y = 0 + 1 x1 + ⌫
I L’effet du régresseur manquant x2 sur Y est implicite dans le
terme d’erreur du modèle estimé : ⌫ = 2 x2 + ✏
I = hétérogénéité inobservée : Des facteurs (individuels)
inobservés influent sur Y
I Si x2 n’est pas corrélé avec x1
I Pas de souci
I Si x2 est corrélé avec x1 ,
I l’erreur ⌫ est corrélée avec x1
I MC inconsistant
Ch 1. Modèles Linéaire Non Dynamiques
Modèles à Données de Panel
Effets Fixes & Effets Aléatoires

Rappel : l’hétérogénéité inobservée

Mêmes pentes
Ch 1. Modèles Linéaire Non Dynamiques
Modèles à Données de Panel
Effets Fixes & Effets Aléatoires

Exogénéité
I Dans ce Ch. 1 : on assume l’exogénéité forte/stricte
E [eit |ai , xi1 , ..., xiT ] = 0, t = 1, ..., T (4)

I C’est-à-dire : hypothèse que ✏it


I Espérance de zéro conditionnellement aux valeurs passées,
présentes et futures des régresseurs
I Équivalent à zéro covariance
I Rien n’est supposé entre la variable aléatoire ↵i et les
régresseurs xi
I Exclut des modèles avec une variable dépendante retardée
I Pas de yi(t s) dans xit = Modèle dynamique
0
I Comme yit 1 = ↵i + xit 1 + ✏it 1 : il est diffcile d’affirmer
que E (✏it ✏it 1 ) = 0
I Et aussi avec des régresseurs endogènes (Ch. 2)
Ch 1. Modèles Linéaire Non Dynamiques
Modèles à Données de Panel
Effets Fixes & Effets Aléatoires

Modèle à Effets Fixes

0
I 2 variantes du modèle (3) yit = ↵i + xit + ✏it selon hyp. sur ↵i
I Toutes deux ont “2” erreurs ↵i et ✏it
I Modèles à erreurs composées
I Toutes deux traitent ↵i comme une v.a. inobservée
I Variante 1 : modèle à effets fixes (EF)
I ↵i est corrélé avec (la partie invariante au temps) des
régresseurs observés xit
I C’est une forme d’hétérogénéité inobservée
I “fixe” parce que, anciennement, ↵i était traité comme un
paramètre (non-aléatoire) à estimer
Ch 1. Modèles Linéaire Non Dynamiques
Modèles à Données de Panel
Effets Fixes & Effets Aléatoires

Modèle à Effets Aléatoires

I Variante 2 : modèle à effets aléatoires (EA)


I ↵i distribué indépendamment de x
I Habituellement, assume de plus que les effets aléatoires ↵i et
les termes d’erreurs ✏it dans (3) sont iid :
2
↵i ⇠ ↵, ↵
2 (5)
✏it ⇠ 0, ✏

I Pas d’hyp. sur la distribution de ces v.a. dans (5)


I ✏it peut présenter de l’autocorrélation
I Souvent, il est supposé que cov (✏it , ✏is ) 6= 0
I Mais aussi que cov (✏it , ✏jt ) = 0 et cov (↵i , ↵j ) = 0
I Sauf dans les modèles spatiaux
I Dans le modèle EA, ↵ est vu comme l’intercept
Ch 1. Modèles Linéaire Non Dynamiques
Modèles à Données de Panel
Effets Fixes & Effets Aléatoires

Autres noms des modèles EF/EA (3)

I Modèle à effets individuels une voie (One-way)


I Deux voies (Two-way) = inclusion de dich. de temps ou
d’effets aléatoires de temps
I Modèle à intercept aléatoire
I Pour distinguer de modèles plus généraux, p.e. à pentes
aléatoires
I Modèles à composants aléatoires
Ch 1. Modèles Linéaire Non Dynamiques
Modèles à Données de Panel
Effets Fixes & Effets Aléatoires

Modèle EA équicorrélé
0
I Le modèle EA yit = ↵i + xit + ✏it
I peut être vu comme la régression de yit sur xit
I avec erreur composée uit = ↵i + "it
I Les hyp. EA usuelles (5) (↵i et ✏it iid) impliquent que

sv2a , t 6= s
Cov [(ai + eit ), (ai + eis )] = (6)
sv2a + sv2e , t = s

I Le modèle EA impose donc que l’erreur composée uit soit


équicorrelée
I Car Cor [uit , uis ] = ↵2 /[ ↵2 + "2 ] pour t 6= s ne change pas
avec la durée t s
I Le modèle EA est aussi appelé équicorrélé ou à erreurs
interchangeables
Ch 1. Modèles Linéaire Non Dynamiques
Modèles à Données de Panel
Effets Fixes & Effets Aléatoires

Synthèse des modèles à données de panel

0
MRL (1) yit = ↵ + xit + uit uit ⇠ 0, u2
EF 0 Cov (↵i , xit ) 6= 0
yit = ↵i + xit + ✏it (3)
↵i ⇠ ↵, ↵2
EA (5)
✏it ⇠ 0, ✏2

I Ces 3 modèles supposent l’hétérogénéité stricte 4


I D’autres modèles panel existent, en particulier dynamiques
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel

Sommaire

Les données de panel

Modèles à Données de Panel

Estimateurs pour données de panel

Inférence en données de panel

Effets Fixes vs. Effets Aléatoires

Données de panel non-cylindré (Unbalanced)


Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel

Introduction
I Il y a 5 estimateurs utilisés couramment pour en données de
panel
I Dans ce contexte non-dynamique, sans endogénéité : variantes
MC
I Diffèrent selon leurs utilisations des variations transversales
(entre i) et temporelles
I Leurs propriétés dépendent de quel est le modèle approprié
(MRL - EF - EA)
I Un régresseur xit peut être soit
I invariant dans le temps, xit = xi pour t = 1, ..., T ,
I ou variable dans le temps
I Certains estimateurs ne peuvent identifier que les coefficients
des régresseurs variables dans le temps
I On va voir les estimateurs du plus simple au plus complexe
I On regarde la consistance et l’efficience
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Efficience et Erreurs

Sommaire

Les données de panel Inférence en données de panel


Modèles à Données de Panel Matrice des erreurs en panel
Effets Fixes & Effets Aléatoires Inférence robuste en panel :
Estimateurs pour données de panel White
Efficience et Erreurs Inférence robuste en panel :
Estimateurs appropriés pour le Bootstrap
MRL Application : Emissions de CO2
Estimateurs appropriés pour EF Effets Fixes vs. Effets Aléatoires
Estimateur approprié pour EA Éléments du choix hors tests
Interprétation : EF vs. EA Test de Hausman
Application : Convergence des Données de panel non-cylindré
émissions de CO2 (Unbalanced)
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Efficience et Erreurs

Efficience des Estimateurs

I L’efficience n’est pertinente que pour les estimateurs


consistants
I L’efficience est la précision de l’estimateur
I Essentiellement l’inverse de sa matrice de var-cov ⌃ ˆ
I Qui donc dépend de la matrice de var-cov des erreurs ⌃u
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Efficience et Erreurs

Hypothèses sur les erreurs


I Les modèles à données de panel ont différents types d’erreur
I uit pour MRL
I ↵i + "it pour EF et EA
I Dans beaucoup d’applications de microéconomie
I raisonnable de supposer indépendance entre i
I Sauf en spatial
I Pas le cas en macro
I Toutes ces erreurs sont potentiellement
1. Autocorrélées (corrélées sur t pour un certain i )
I Corrélation sérielle, temporelle
2. Hétéroscédastiques entre les i
I L’inférence (tests) stat. valide requiert de prendre en compte
ces caractéristiques
I Section suivante
I Dans cette section-ci
I structure de la mat. de var-cov des erreurs
I Efficience
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Efficience et Erreurs

Matrice ⌃u de variance-covariance des erreurs en panel

I Sans distinguer entre les trois modèles


I On écrit l’erreur du modèle uit
I Peut être ↵i + ✏it ou pas
I Entre i on a Cor [uit , ujs ] = 0
I pour i 6= j et t = ou 6= s
I Pour un certain i
I Cor [uit , uis ] = its: corrélation quelconque dans le temps
2
I t = s, its = it : hétérocédasticité quelconque
I Ça donne la matrice var-cov des erreurs ⌃u suivante
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Efficience et Erreurs

Matrice ⌃u bloc-diagonale de var-cov des erreurs panel

0 1
sv211 sv112 ··· sv11T
B
B .. .. C
C
B sv212 . . C
B 0 ··· 0 C
B .. .. .. C
B . . . sv1(T 1)T C
B C
B SYM ··· sv21T C
B C
B .. .. .. C
B
B 0 . . . C
C
B .. .. .. C
B . . . 0 C
B C
B sv2N1 svN12 ··· svN 1T C
B C
B .. .. C
B C
B sv2N2 . . C
B 0 ··· 0 C
B .. .. .. C
@ . . . svN(T 1)T A
SYM ··· sv2NT
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Efficience et Erreurs

Modèle EA

I Le modèle EA met plus de structure dans la matrice ⌃u


0
I Modèle EA yit = ↵i + xit + ✏it avec
I ↵i iid (donc non-corrélés à xit )
I ✏it iid
I Corrélations comme dans l’hyp. EA (5)
2
↵i ⇠ ↵, ↵
2
✏it ⇠ 0, ✏

I La matrice ⌃u prend la forme suivante


Matrice ⌃u Bloc-Diagonale de Var-Cov des Erreurs Panel EA

0 1
sv2a + sv2e sv2a ··· sv2a
B .. .. C
B sv2a sv2a + sv2e . . C
B 0 ··· 0 C
B .. .. .. C
B C
B
B . . . sv2a C
C
B
B sv2a ··· sv2a sv2a + sv2e C
C
B .. .. .. C
B . . C
B 0 . C
B C
B .. .. .. C
B . . . 0 C
B C
B sv2a + sv2e sv2a ··· sv2a C
B C
B .. .. C
B C
B sv2a sv2a + sv2e . . C
B 0 ··· 0 C
B .. .. .. C
@ . . . sv2a A
sv2a ··· sv2a sv2a + sv2e
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Efficience et Erreurs

En mots

I La matrice s’organise en blocs carrés autour de la diagonale


principale
I Chaque carré tient en 2 chiffres
I Hors de sa diagonale principale, une corrélation entre périodes
2

I la même pour tous les i
2 2
I Sur sa diagonale principale, une variance ↵ + ✏
homoscédastique
I Entre différentes i, toutes les corrélations sont nulles
I Hors des blocs diagonaux
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Estimateurs appropriés pour le MRL

Sommaire

Les données de panel Inférence en données de panel


Modèles à Données de Panel Matrice des erreurs en panel
Effets Fixes & Effets Aléatoires Inférence robuste en panel :
Estimateurs pour données de panel White
Efficience et Erreurs Inférence robuste en panel :
Estimateurs appropriés pour le Bootstrap
MRL Application : Emissions de CO2
Estimateurs appropriés pour EF Effets Fixes vs. Effets Aléatoires
Estimateur approprié pour EA Éléments du choix hors tests
Interprétation : EF vs. EA Test de Hausman
Application : Convergence des Données de panel non-cylindré
émissions de CO2 (Unbalanced)
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Estimateurs appropriés pour le MRL

Estimateur MCO
I MCO estime ↵ et dans yit = ↵ + xit0 + uit
I MCO est consistant (pour N ! 1, t constant) si
I Cov [uit , xit ] = 0 et
I MRL (1) est approprié, ou si
I EA est approprié
I La mat ⌃u n’est pas diagonale
I MCO inefficient
1
I L’estimateur MCO de la matrice ⌃ ˆ ˆ2 (X 0 X ) est biaisé
I MCO est inconsistant si EF est approprié
0
I Ré-écrire EF yit = ↵i + xit + ✏it comme

yit = a + xit� b + (ai −a + eit )

I Donc l’erreur MCO, uit = ↵i ↵ + ✏it , est corrélé à xit par ↵i


Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Estimateurs appropriés pour le MRL

Estimateur Between

I Étapes
1. Prendre les moyennes sur le temps par individu
T
1X
I ȳi = yit , idem pour x̄i
T t=1
2. Estimer par MCO ȳi = ↵ + x̄i0 + "¯i
I Régresser ȳi sur un intercept et le vecteur x̄i
I Pour estimer , MCO utilise toutes les données
I Donc les variations à la fois sur le temps et en transversal
I Between n’utilise que les variations transversales
I Entre (between) différents individus
I Analogue à une régression en coupe transversale
I Les variations internes (within) à chaque individu sont écartées
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Estimateurs appropriés pour le MRL

Propriétés de l’estimateur Between

I Le modèle implicite derrière l’estimateur between est


0
ȳi = ↵ + x̄i + ui i = 1, ..., N (7)

I Between est consistant si les régresseurs x̄i sont indépendants


de l’erreur ui
I C’est le cas pour le MRL (1)
I Si par contre le modèle est à erreurs composées (3)
0
yit = ↵i + xit + ✏it
I Alors, ui = (↵i ↵ + ✏¯i )
I Dans EA, ↵i est indépendant de x
I Donc Between est consistant pour EA
I Dans EF, ↵i est corrélé à xit et donc à x̄i
I Between est donc inconsistant
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Estimateurs appropriés pour le MRL

Propriétés de l’estimateur Between

I Between gaspille beaucoup d’informations


I C’est un estimateur didactique
I Ne pas l’utiliser dans vos applications
I Sans regarder formellement
I between est très inefficient à cause du gaspillage d’information
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Estimateurs appropriés pour EF

Sommaire

Les données de panel Inférence en données de panel


Modèles à Données de Panel Matrice des erreurs en panel
Effets Fixes & Effets Aléatoires Inférence robuste en panel :
Estimateurs pour données de panel White
Efficience et Erreurs Inférence robuste en panel :
Estimateurs appropriés pour le Bootstrap
MRL Application : Emissions de CO2
Estimateurs appropriés pour EF Effets Fixes vs. Effets Aléatoires
Estimateur approprié pour EA Éléments du choix hors tests
Interprétation : EF vs. EA Test de Hausman
Application : Convergence des Données de panel non-cylindré
émissions de CO2 (Unbalanced)
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Estimateurs appropriés pour EF

Estimateur Within

I Principe : Les déviations individuelles de la variable


dépendante de ses moyennes temporelles
I sont expliquées par
I les déviations individuelles des régresseurs de leurs moyennes
temporelles
0
I Soit le modèle à effets individuels 3 yit = ↵i + xit + ✏it
I Prendre le moyenne sur t : ȳi = ↵i + x̄i0 + "¯i
I Soustraire : les termes ↵i s’annulent = la transformation
within
0
yit ȳi = (xit x̄i ) + (✏it ✏¯i )
(8)
1, ..., N, t = 1, ..., T
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Estimateurs appropriés pour EF

Estimateur Within

I Estimateur Within = MCO sur les données transformées


0
yit ȳi = (xit x̄i ) + (✏it ✏¯i )

I Comme ↵i a disparu par différence, Within est consistant dans


EF, EA et MRL
I En tout cas quand l’hyp d’exogénéité forte tient
I Within est aussi appelé estimateur Effets Fixes
I Chaque i doit être observé au moins deux fois dans
l’échantillon
I sinon xit x̄i = 0
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Estimateurs appropriés pour EF

Consistance de l’estimateur Within / Effets Fixes


I Within traite ↵i comme des paramètres dits nuisance
I que l’on peut ignorer si notre intérêt porte sur les pentes
I qui n’ont pas besoin d’être estimés de façon consistante pour
obtenir une estimation consistante des
I Ce résultats ne se propage généralement pas aux modèles
non-linéaires
I La consistance requiert plus précisément
E (✏it ✏¯i |xit x̄i ) = 0
dans le modèle transformé
0
yit ȳi = (xit x̄i ) + (✏it ✏¯i )
I À cause des moyennes, cela exige plus que E (✏it |xit ) = 0
I Il faut l’exogénéité stricte (4)
E [eit |ai , xi1 , ..., xiT ] = 0, t = 1, ..., T
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Estimateurs appropriés pour EF

Estimations des effets fixes


I Si les effets fixes ↵i sont d’intérêt , ils peuvent être estimés
0
par ↵ˆ i = ȳi x̄i ˆ
I Cet estimateur de ↵i non-biaisé
I Dans des panels courts (petit T ), cet estimateur est
inconsistant
I Parce que l’information ne s’accumule pas (T ne croît pas)
I Par contre, la distribution des ↵
ˆ i , par rapport à une variable
clef ou pas, peut être informative
I Si N n’est pas trop grand, une alternative pour estimer Within
est l’estimateur MC à dichotomiques
I On définit N dich. di , X
une par individu, di = 1 pour i
0
I Ensuite, estimer yit = ↵i di + xit + ✏it par MCO
i
I Régression de yit sur xit et N dich. individuelles
I Cela produit l’estimation Within pour , ainsi que les
estimations des N effets fixes
I Dans les limites des capacités de l’ordinateur
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Estimateurs appropriés pour EF

Within et les régresseurs invariants dans le temps

I Une limitation majeure de Within


I les coefficients des régresseurs invariants dans le temps ne sont
pas identifiés
I Puisque si xit = xi alors x̄i = xi et (xit x̄i ) = 0
I Beaucoup d’études ont précisément pour objet des régresseurs
invariants dans le temps
I P.e. les effets du genre ou de l’origine ethnique sur le salaire
I Pour cette raison, des praticiens évitent d’utiliser within
I MCO et l’estimateur Effets Aléatoires (ci-dessous) permettent
d’estimer ces coefficients
I mais sont inconsitants si EF est le modèle approprié
I On verra un estimateur qui permet parfois de les identifier
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Estimateurs appropriés pour EF

Estimateur différences premières

I Principe : Les changements individuels d’une période à


l’autre de la variable dépendante
I sont expliqués par
I les changements individuels d’une période à l’autre des
régresseurs
0
I Soit le modèle à effets individuels (3) yit = ↵i + xit + ✏it
0
I retarder d’une période yi,t 1 = ↵i + xi,t 1 + "i,t 1
I Soustraire = la transformation différences premières
0
yit yi,t 1 = (xit xi,t 1 ) + (✏it ✏i,t 1 )
(9)
i = 1, ..., N, t = 2, ..., T
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Estimateurs appropriés pour EF

Estimateur différences premières

I L’estimateur différences premières (D1) est MCO appliqué à la


transformation différences premières (9)
I Cet estimateur est consistant pour dans tous les modèles
I Pour les mêmes raisons que Within
I Pareillement, les coefficients des régresseurs invariants dans le
temps ne sont pas identifiés
I D1 est moins efficient que within
I si "it est iid (pour T > 2)
I car une période d’obsevation est écartée
I Cependant, D1 peut préserver contre des variables I(1)
I Qui amènerait sinon à des résultats spurieux
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Estimateurs appropriés pour EF

Efficience des estimateurs pour EF

I Ces estimateurs font peu d’hypothèses sur la structure du


terme d’erreur
I Leur efficience n’est généralement pas discutée
I Car la priorité est l’estimation consistante
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Estimateur approprié pour EA

Sommaire

Les données de panel Inférence en données de panel


Modèles à Données de Panel Matrice des erreurs en panel
Effets Fixes & Effets Aléatoires Inférence robuste en panel :
Estimateurs pour données de panel White
Efficience et Erreurs Inférence robuste en panel :
Estimateurs appropriés pour le Bootstrap
MRL Application : Emissions de CO2
Estimateurs appropriés pour EF Effets Fixes vs. Effets Aléatoires
Estimateur approprié pour EA Éléments du choix hors tests
Interprétation : EF vs. EA Test de Hausman
Application : Convergence des Données de panel non-cylindré
émissions de CO2 (Unbalanced)
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Estimateur approprié pour EA

Rappel du modèle EA

0
I Modèle à effets individuels (3) yit = ↵i + xit + ✏it avec
I ↵i iid (donc non-corrélés à xit )
I ✏it iid
I Corrélations comme dans l’hyp. EA (5)
2
↵i ⇠ ↵, ↵
2
✏it ⇠ 0, ✏

I Dans ce cas, MCO consistant (car ↵i non-corrélés à xit )


I Mais Moindres Carrés Généralisés MCG sera plus efficient
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Estimateur approprié pour EA

Rappel : MCG en coupe transversale


I Quand toutes les hyp. du modèle linéaire sont satisfaites
I sauf que la matrice var-cov ⌃ des erreurs n’est pas l’identité,
alors
I MCO consistant
I mais pas efficient (Gauss-Markov ne s’applique plus)
I Si on connait ⌃, on peut retrouver l’efficience
0
I Soit
⇣ le0 ⌘MRL en coupe transversale y = x + ✏ avec
E ✏✏ = ⌃ 6= 2 I
0
1
I On peut montrer qu’il existe toujours P telle que P P = ⌃
I Décomposition de Cholesky, non-unique pour les matrices
réelles sdp
I Prémultiplier le modèle linéaire par P : Py = Px + P✏
I y ⇤ = x ⇤ + ✏⇤
⇣ 0 0
⌘ ⇣ 0⌘ 0
I Alors Var (✏⇤ ) = E P✏✏ P = PE ✏✏ P
0
⇣ 0 ⌘ 1 0 ⇣ 0⌘ 1 0
I = P⌃P = P P P P = PP 1 P P =I
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Estimateur approprié pour EA

Rappel : MCG en coupe transversale

I Donc, le modèle transformé a des erreurs dites sphériques


I Donc, MCO sur les données transformées est efficient
I C’est MCG
I En pratique, ⌃ est inconnue, il nous en faut un estimateur
consistant
I ˆ définit l’estimateur MCG
Tout estimateur consistant de ⌃, ⌃,
faisables (consistant)
I En panel, le modèle EA implique une matrice ⌃ comme dans
la diapo suivante
I Comme détaillé précédemment
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Estimateur approprié pour EA

Matrice ⌃ bloc-diagonale de var-cov des erreurs panel EA

0 1
sv2a + sv2e sv2a ··· sv2a
B
B .. .. C
C
B sv2a sv2a + sv2e . . C
B 0 ··· 0 C
B .. .. .. C
B . . . sv2a C
B C
B sv2a ··· sv2a sv2a + sv2e C
B C
B .. .. .. C
B
B 0 . . . C
C
B .. .. .. C
B . . . 0 C
B C
B sv2a + sv2e sv2a ··· sv2a C
B C
B .. .. C
B C
B sv2a sv2a + sv2e . . C
B 0 ··· 0 C
B .. .. .. C
@ . . . sv2a A
sv2a ··· sv2a sv2a + sv2e
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Estimateur approprié pour EA

Estimateur EA
I On appelle estimateur EA l’estimateur MCG
I dans lequel la matrice ⌃ des erreurs est celle de la diapo
précédente
I La version faisable de cet estimateur est MCO
I appliqué aux données transformées de la façon suivante :
⇣ ⌘ ⇣ ⌘0
yit ˆ ȳi = 1 ˆ µ + xit ˆ x̄i + ⌫it (10)

où ⌫it = (1 ˆ )↵i + ("it ˆ "¯i ) est asymptotiquement iid, et

I ˆ est un estimateur consistant pour



=1 p (11)
2 +T 2
✏ ↵
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Estimateur approprié pour EA

Estimateur EA
I On ajoute l’intercept (non-aléatoire) scalaire µ afin de
normaliser les effets aléatoires ↵i à une espérance nulle
I et ainsi faire coincider l’estimateur avec l’hypothèse EA (5)
I C’est-à-dire µ correspond à ↵ dans (5)
I La dérivation de cet estimateur (10) et des manières d’estimer
2 2
↵ et " , et donc ,
I sont détaillés dans Cameron & Trivedi
I Remarque
I ˆ = 0 correspond à l’estimateur MCO
I ˆ = 1 correspond à l’estimateur within
I ˆ ! 1 lorsque T ! 1 (regardez la formule)
I Il s’agit d’un estimateur en deux étapes de
1. estimer
2. estimer à partir des données transformées
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Estimateur approprié pour EA

Propriétés de l’estimateur EA

I Consistant et efficient si le modèle EA est le bon


I Le gain d’efficience par rapport à l’estimateur MCO n’est pas
nécessairement élevé
I Probablement inefficient si l’hypothèse d’équicorrélation
n’est pas vraie
I Dans un processus AR (1)
I Si le MRL est le bon
I Inconsistant si le modèle EF est le bon car alors ↵i est corrélé
avec xit
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Interprétation : EF vs. EA

Sommaire

Les données de panel Inférence en données de panel


Modèles à Données de Panel Matrice des erreurs en panel
Effets Fixes & Effets Aléatoires Inférence robuste en panel :
Estimateurs pour données de panel White
Efficience et Erreurs Inférence robuste en panel :
Estimateurs appropriés pour le Bootstrap
MRL Application : Emissions de CO2
Estimateurs appropriés pour EF Effets Fixes vs. Effets Aléatoires
Estimateur approprié pour EA Éléments du choix hors tests
Interprétation : EF vs. EA Test de Hausman
Application : Convergence des Données de panel non-cylindré
émissions de CO2 (Unbalanced)
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Interprétation : EF vs. EA

Discussion sur EA et EF
I La plupart des disciplines de stat appliquées
I traitent l’hétérogénéité inobservée (individuelle) ↵i comme
distribuée indépendamment des régresseurs
I Sauf la microéconométrie
I Cette hyp d’indépendance
I a l’avantage de permettre une estimation consistante de tous
les paramètres
I y-compris ceux invariants dans le temps
I si l’hyp est vraie
I est souvent considérée par les économistes comme non
supportée par les données
I Les deux modèles ont des intérêts distincts
I EA : Précise la structure temporelle ! Efficience
I EF : Endogénéité de l’hétérogénéité inobservée ! Consistance
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Interprétation : EF vs. EA

Prédictions et effets individuels

0
I Le modèle est yit = ↵i + xit + ✏it aussi bien pour EA que
pour EF
I L’effet individuel ↵i est une v.a. dans les deux modèles
I On prend l’espérance conditionnelle aux régresseurs
I E [yit |xit ] = E [↵i |xit ] + xit0
I Que peut-on en dire ? (prochaine dia)
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Interprétation : EF vs. EA

Prédictions et effets individuels


I Dans le modèle EA, il est supposé que E [↵i |xit ] = ↵
I Donc E [yit |xit ] = ↵ + xit0
I Si EA est le bon modèle, ↵ peut être estimé de façon
consistante
I Donc on peut prédire yit par E [yit |xit ]
I Dans EF, E [↵i |xit ] varie avec xit et on ne sait pas comment
I C’est raisonnable car ↵i comprend des characteristiques
inobservées
I Donc E [yit |xit ] ne peut être identifié : pas de prédiction
I Malgré cela, on peut estimer les de façon consistante
I Et donc les effets marginaux sont identifiés
= @E [yit |↵i , xit ]/@xit
I Par exemple, l’effet d’un changement de population sur les
émissions
I Mais seulement pour les régresseurs variant dans le temps
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Interprétation : EF vs. EA

Résumé estimateurs et modèles linéaires communs pour


panel

Modèle
Estimateur de MRL (1) EA (3) & (5) EF (3)
MCO (1) Consistant Consistant Inconsistant
Between (7) Consistant Consistant Inconsistant
Within (EF) (8) Consistant Consistant Consistant
D1 (9) Consistant Consistant Consistant
EA (10) Consistant Consistant Inconsistant
Cette table ne considère que la consistance des estimateurs de
I L’estimation des ↵i est toujours inconsistante, sauf lorsque
↵i = ↵8i.
Le seul estimateur efficient est EA lorsque le bon modèle est aussi
EA.
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Sommaire

Les données de panel Inférence en données de panel


Modèles à Données de Panel Matrice des erreurs en panel
Effets Fixes & Effets Aléatoires Inférence robuste en panel :
Estimateurs pour données de panel White
Efficience et Erreurs Inférence robuste en panel :
Estimateurs appropriés pour le Bootstrap
MRL Application : Emissions de CO2
Estimateurs appropriés pour EF Effets Fixes vs. Effets Aléatoires
Estimateur approprié pour EA Éléments du choix hors tests
Interprétation : EF vs. EA Test de Hausman
Application : Convergence des Données de panel non-cylindré
émissions de CO2 (Unbalanced)
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Émissions de CO2
I Convergence dans ce contexte est 2 choses
1. Dans le temps vers un “État stationnaire” (Steady State)
I Non testé ici
2. En supposant la convergence dans le temps,
I Des groupes de pays convergent-ils à la même vitesse
I C’est ce qui est testé ici
I Importance de la convergence lors de négociations
internationales
I Si les émissions tendent à se rapprocher entre pays ou non
I les négociations ne sont pas les mêmes
I Émissions par habitant ou par travailleur effectif, pas au total
I On peut essayer de comprendre les différences entre vitesse de
convergence
I Technologie ? Politique ? Ressources naturelles ? Niveau de
développement ?
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Théorie en état stationnaire


I La croissance du stock de capital est déterminée par
I la croissance de la population n
I le taux d’épargne s
I le progrès technique g (paramètre inconnu)
I un paramètre exogène de dépréciation
I Les auteurs posent g + = .05, constant
I On ne va pas explorer cette question, on oublie
I Il est supposé que les émissions per capita E /L croissent de la
même manière que le stock de capital
I Ceci permet d’obtenir une équation pour les émissions en état
stationnaire
✓ ◆
s
ln (E /L) = ln A + t + ↵ ln (12)
n+g +
I A est le niveau technologique
I permettra de définir une constante pays-spécifique
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Dynamique
I L’économie n’est pas à l’état stationnaire
I Soit
I ✏⇤ les émissions E /L à l’état stationnaire
I ✏ les émissions à l’instant t
I L’équation de convergence dans le temps est
d ln ✏t
= ⇢ [ln ✏⇤ ln ✏t ] (13)
dt
I Équation différentielle
I Dit essentiellement que le mouvement vers l’état stationnaire
est une proportion de la distance actuelle
I Théorie sans fondement empirique, l’existence même d’un état
stationnaire n’étant pas certaine
I Résolution (intégration)
ln ✏t2 = 1 e ⇢⌧
ln ✏⇤ + e ⇢⌧
ln ✏t1 (14)
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Dynamique

I En substituant ✏⇤ selon l’équation 12 dans la solution 14


et en notant
⇣ = e ⌘ , on a
I ⇢⌧

ln ✏t2 = (1 ) ↵ ln n+gs + + (1 ) A + g (t2 t1 ) + ln ✏t1


I Le progrès technologique g (t2 t1 )
I modélisé (ad hoc) comme un jeu de dummies temporelles de
coefficients ⇡t
I Les différences de technologie A entre pays
I donnent naissance à des intercepts par pays ✓i
I Il est supposé que
I les coefficients de ln s et de ln (n + g + ) peuvent être
différents
I comme g + = 0.05 par faute de données, on n’a que s et n
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Modèle estimé

I Le modèle opérationnel est donc


ln ✏t2 = ln ✏t1 + 1 ln s + 2 ln n + ⇡t + ✓i + ⌫it (15)
1
I Le paramètre d’intérêt est ⇢ = ln
5
I Puisque ce paramètre indique la vitesse de convergence vers
l’état stationnaire selon eq. 13
I Modèle dynamique par la présence de ✏t1
I que l’on traite en statique dans ce chapitre
I Les régresseurs ln s et ln n
I aident à limiter (“contrôler”) l’hétérogénéité inobservée
I Il pourrait y en avoir d’autres : prix du pétrole, température en
hiver...
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Penn World Table PWT


I Jeu de données
I maintenu conjointement par des chercheurs de
I U Californie à Davis
I Growth Development Centre de U Groningen
I Données de comptes nationaux
I PIB réel au cours du temps
I dans 189 pays dans la version utilisée (7)
I Non-cylindré 1950-2009
I Semblables à celles de la Banque Mondiale
I Plus long pour certains pays
I Beaucoup moins de variables
I “Extended Penn World Tables” EPWT
I Ajoute quelques variables et change certaines définitions
I Émissions nationales de CO2
I Combustion de combustibles fossiles, fabrication de ciment et
rejet de gaz naturel
I “CO2 pur” vs. “CO2 - équivalent”
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Retard

I Le retard considéré est 5 ans


I Pour un effet long terme selon les auteurs
I ⌧ = t2 t1 = 5 ans
I Différents ⌧ influencent-ils les résultats ?
I Les données post 2005 ne sont pas dans la EPWT pour
plusieurs pays
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Stata

I Charger les données


I .dta : double-click
I capacité d’import très limitée : .csv
I pas de méta-donnée
I Suivre le fichier 20160727CvgceCO2.do
I Ci-dessous
I présentation des données
I Graphique temporel par pays
I menu graphics ! panel data line plots
Qualité des données
I 2009 n’est en fait pas renseigné
I Var. qualn
I NA, 4, 3, 2, 1
I summarize em if (qualn<4)&(year<2009)

year<2009 # Moy Éc.ty. min Max


Tout y compris NA 5 660 2 487 3 315 .4
qualn<5 5 352 2 478 3 280 4.3 32 615
qualn<4 4 397 2 783 3 442 9.1
qualn<3 1 364 5 305 3 366 637
27 359
qualn<2 818 6 385 3 695 1 404

I Restreint beaucoup l’échantillon


I Les états qui tiennent bien les comptes pourraient être ceux
qui font plus d’effort sur les émissions
I Biais de sélection
I Les résultats sont-ils sensibles à la qualité des données ?
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Échantillons

I Cfr papier : Sélection préalable


I "118 countries for which information from 1970 to 2008 was
available"
I “Cylindrage” du panel - quelle justification ?
I Les pays sont regroupés dans différents sous-ensembles
I peu explicites dans le papier
I La question principale est de voir si différents sous-ensembles
ont des convergences différentes
I En supposant qu’il y ait convergence dans le temps
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Échantillons

I NOIL
I tous les pays de l’échantillon sauf les gros producteurs de
pétrole
I INTER - ok (je crois)
I tous les pays de l’échantillon sauf
I ceux de moins d’un million d’habitants
I les données douteuses selon EPWT (qualn)
I OECD - ok
I ASIA - ok
I LAC
I pays d’Amérique Latine / Caraïbe
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Régression dans Stata

I Principe englobant
I Du modèle général vers le plus restrictif
I Modèle + général : effets fixes
I Estimateur Within
I Estimateur Diff 1ere
I Second modèle : effets aléatoires
I Modèle plus restrictif : MRL
I Estimateur MCO
I Estimateur Between
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Estimateur Within

I Stata présente un intercept - pourquoi ?


0
I Stata réécrit le modèle 3 yit = ↵i + xit + ✏it comme
0
yit = ↵ + ↵i + xit + ✏it
I Cela amène la multicollinéarité
I Il faut normaliser
I Dans la théorie,
P on a pris ↵ = 0 pour simplifier la notation
I Stata prend i ↵i = 0 par analogie avec l’hyp. EA :
E (↵i ) ↵ = 0
I Dans aucun cas, cela n’a de conséquence sur les estimations de
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Estimateurs D1, EA

I Diff. 1eres
I Pas disponible directement dans Stata
I Construire les Diff. 1eres puis appliquer MCO
I Retards 1 période dans Stata : by idn : gen lnem1 =
lnem[_n-1]
I n indice les observations, by idn indique de retarder par
individu
I Ensuite by idn : gen lnemD1 = lnem-lnem1
I Par conséquent : intercept nul en théorie
I EA : 2 versions
I GLS = MCG faisable comme présenté plus avant
I ML = maximum de vraisemblance
I Je ne détaille pas - on laisse tomber
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Estimateurs MCO, Between

I Between - directement dans Stata


I Nombre d’observations réellement utilisées = nombre de
groupes
I MCO
I Utiliser la commande/menu regress
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Estimations

I Rappel du modèle 15 :
ln ✏t2 = ln ✏t1 + 1 ln s + 2 ln n + ⇡t + ✓i + ⌫it
1
I Le paramètre d’intérêt est ⇢ = ln
5
I indique la vitesse de cvgce à l’ES
I C’est le modèle “conditionnel”
I Le modèle ln ✏t2 = ln ✏t1 + ⇡t + ✓i + ⌫it est dit “absolu”
I Il n’est pas clair si les auteurs mettent des dich. de temps dans
tous les modèles
I calculs dans do file 20160727CvgceCO2.do
I Ne pas double-cliquer, sinon exécute tout d’un coup
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Résultats Qualn<3 & n>1000 & year<2009

EF - Within EF - Diff 1ere EA - MCG MCO Between


Abs. Cond. Abs. Cond. Abs. Cond. Abs. Cond. Abs. Cond.
✓ 3.13 6.6 .0001 .006 2.3 2.09 1 .45 .63 .03
.63 .63 .057 .07 .73 .71 .88 .85 .93 .89
⇢ .092 .092 .57 .53 .063 .07 .025 .033 .015 .023
1 – -.32 – -.6 – -0.014 – .014 – .017
2 – .17 – .15 – .062 – .07 – .072
# obs 1209 1178 1209 1209 31
# pays 31 non précisé 31 non précisé –
Sans dich. de temps
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Convergence à l’état stationnaire


I À partir de ⇢ (ou de )
I possible de calculer une durée jusqu’à la convergence avec les
émissions de long terme
d ln ✏t
I éq. (13) dt
= ⇢ [ln ✏⇤ ln ✏t ]
I durée proportionnelle à ⇢
I Donc, en général, une convergence vers l’état stationnaire plus
rapide en EF qu’en EA
I Peut s’explique par les effets spécifiques ↵i
I contiennent en particulier le mix énergétique et la politique
carbone du pays
I alors même qu’on a pas de données sur ces variables
I La différence la plus spectaculaire reste entre D1 et le reste
I Prochaine dia
I Between & MCO semblables entre eux
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

D1 vs. EF et les autres


I D1 et EF sont consistants dans les 3 modèles panel
I Si T = 2, D1 et EF identiques
I Si ⌫it (terme d’erreur) n’a pas de corrélation sérielle
I EF est en principe meilleur car EF n’élimine pas de données
I Si ⌫it est une marche aléatoire
I D1 est en principe meilleur car la transformation D1 ramène la
série à un ordre 0
I S’il y a corrélation entre ⌫it et un régresseur (p.e. ✏1t , les
émissions retardées de 5 ans)
I Alors EF et D1 sont inconsistants
I Tester est hors du champ de ce cours
I Compliqué avec des séries courtes
I Cette différence entre D1 et le reste
I Indique sans doute une forte dimension temporelle (intégration
I(1))
I Non prise en cpte par les auteurs
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Analyse conditionnelle

I Rappel : “convergence conditionnelle”


I Lorsque l’on conditionne à d’autres variables
I Coefficients de s et de n
I Forte différence (EF D1) vs. (EA MCO Between)
I Révèle endogénéité : ↵i corrélé à s et/ou n
I Mais coefficient stable à l’inclusion de ces 2 variables
I Rassurant
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Dichotomiques de temps

I Le modèle théorique suggère des dich. temporelles


I Il faut créer ces variables
I Stata permet de le faire en une fois
I quietly tabulate year, generate(D_)
I Lorsque toutes les dich de temps sont introduites
I Les coefficients dans FE et RE sont plus proches
I Par contre, D1 ne semble pas se rapprocher
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Comparer les groupes de pays

I 2 variables ont été créées


I OECD
I ASIA
I On répète l’analyse
I Seulement sur “absolu”
I Entre groupes de pays
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Résultats Qualn<3 et & n>1000 & year<2009

EF - Within EF - Diff 1ere EA - MCG MCO Between


Tous ocde Asie Abs. ocde Asie Abs. ocde Asie Abs. ocde Asie Abs. ocde Asie
✓ 3.13 4.33 2.59 t0 t0 t0 2.3 3.4 1.8 1 2.22 1.4 .63 1.72 .88
.63 .49 .70 .057 .085 .26 .73 .60 .80 .88 .74 .84 .93 .80 .90
# obs 1209 312 257 1178 304 250 1209 312 257 1209 312 257 31 13 11
# pays 31 13 11 non précisé 31 13 11 non précisé – – –
Sans dich. de temps ; &(OECD==1) ; &(ASIA==1)
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Comparer les groupes de pays

I Rappel : cvgce inversément proportionnelle à


I Conclusion robuste à l’ensemble des estimateurs
I OCDE converge + vite que Asie
I Et que l’ensemble de tous les pays
I Sauf selon D1
I Dans la mesure où les pays de l’OCDE
I Ont un plus grand historique d’émissions
I on peut prendre cela pour une confirmation d’une convgce vers
un ES ?
I à débattre
I D1 discordant avec cette interprétation
Ch 1. Modèles Linéaire Non Dynamiques
Estimateurs pour données de panel
Application : Convergence des émissions de CO2

Analyse de sensibilité

I Principe : répéter en changeant certains choix


I Lag de 5 ans pourquoi pas 2 ou 10 ?
I Niveau de qualité de la donnée 1, 2,...
I Laissé comme exercice
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel

Sommaire

Les données de panel

Modèles à Données de Panel

Estimateurs pour données de panel

Inférence en données de panel

Effets Fixes vs. Effets Aléatoires

Données de panel non-cylindré (Unbalanced)


Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Matrice des erreurs en panel

Sommaire

Les données de panel Inférence en données de panel


Modèles à Données de Panel Matrice des erreurs en panel
Effets Fixes & Effets Aléatoires Inférence robuste en panel :
Estimateurs pour données de panel White
Efficience et Erreurs Inférence robuste en panel :
Estimateurs appropriés pour le Bootstrap
MRL Application : Emissions de CO2
Estimateurs appropriés pour EF Effets Fixes vs. Effets Aléatoires
Estimateur approprié pour EA Éléments du choix hors tests
Interprétation : EF vs. EA Test de Hausman
Application : Convergence des Données de panel non-cylindré
émissions de CO2 (Unbalanced)
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Matrice des erreurs en panel

Inférence

I L’inférence consiste en
I la prédiction
I les tests d’hypothèses
I L’inférence classique fait des tests d’hyp.
I dont la significativité des coefficients
I à partir de la matrice ⌃ de variance-covariance des ˆ
I Donc : essentiel de disposer d’une estimation
I au minimum consistante
I de cette matrice ⌃
I Celle-ci s’appuie sur la matrice ⌃u
I Var-Cov des erreurs uit = ↵i + ✏it
I Prochaine dia
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Matrice des erreurs en panel

Rappel sur la matrice var-cov des erreurs panel en général

0 1
sv211 sv112 ··· sv11T
B
B .. .. C
C
B sv212 . . C
B 0 ··· 0 C
B .. .. .. C
B . . . sv1(T 1)T C
B C
B SYM ··· sv21T C
B C
B .. .. .. C
B
B 0 . . . C
C
B .. .. .. C
B . . . 0 C
B C
B sv2N1 svN12 ··· svN 1T C
B C
B .. .. C
B C
B sv2N2 . . C
B 0 ··· 0 C
B .. .. .. C
@ . . . svN(T 1)T A
SYM ··· sv2NT
Rappel 2 : Matrice ⌃u dans le modèle EA avec
hétéroscédasticité

0
sv2a + sv2e1 sv2a ··· sv2a
B
B .. ..
B sv2a sv2a + sv2e1 . .
B 0 ··· 0
B .. .. ..
B . . . sv2a
B
B sv2a ··· sv2a sv2a + sv2e1
B
B ..
B .. ..
B 0 . . .
B
B . .. ..
B .. . . 0
B
B
B sv2a + sv2eN sv2a ··· sv2a
B
B .. ..
B sv2a sv2a + sv2eN . .
B 0 ··· 0
B
B .. .. ..
@ . . . sv2a
sv2a ··· sv2a sv2a + sv2eN
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Matrice des erreurs en panel

Estimateur MC
I Tous les estimateurs panel sont MC sur données transformées
I MC traite chacune des T années comme de l’information
indépendante, mais
I Le contenu informationnel est moindre
I puisque les erreurs (et donc les obs.) sont corrélées
I Ceci tend à surestimer la précision
I Le modèle qui fait le plus d’hypothèses sur ⌃u est EA
I Si ce modèle est exact, on peut procéder à l’inférence
habituelle
I à partir des données transformées MCG
I Dans les autres cas,
I On utilise des corrections panel des écarts-types (et) quand on
applique MCO
I Beaucoup de corrections sont possibles, selon les hyp. sur la
corrélation et l’hétéroscédasticité
I Et aussi selon la longueur du panel – mais on ne verra pas
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Matrice des erreurs en panel

Inférence statistique Panel-robuste


I Des écarts-types Panel-robuste peuvent être estimés
I sans supposer de forme fonctionnelle spécifique pour la
corrélation ou l’hétéroscédasticité des erreurs individuelles
I au moyen de 2 techniques
I l’estimateur robuste de White
I le bootstrap
I En panel, donc, on utilise des estimateurs inefficients
I mais au moins on calcule leur matrice de var-cov ⌃ ˆ
correctement
I Seul estimateur EA est efficient dans le modèle EA
I Tous les autres estimateurs dans tous les modèles sont
inefficients
I Des estimateurs plus efficients s’obtiennent par la Méthodes
Généralisée des Moments GMM : Ch. 2
I Les estimateurs EF, EA et D1 tendent à réduire la corrélation
sérielle
I mais pas à l’éliminer
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Matrice des erreurs en panel

Inférence Panel-robuste et logiciels

I Dans beaucoup de packages économétriques, les et calculés


par défaut assument des erreurs iid
I Donc une matrice ⌃u diagonale
I incohérente avec Panel
I Cette inférence est erronée
I En général, elle sous-estime les et, donc sur-estime les t-stat
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Inférence robuste en panel : White

Sommaire

Les données de panel Inférence en données de panel


Modèles à Données de Panel Matrice des erreurs en panel
Effets Fixes & Effets Aléatoires Inférence robuste en panel :
Estimateurs pour données de panel White
Efficience et Erreurs Inférence robuste en panel :
Estimateurs appropriés pour le Bootstrap
MRL Application : Emissions de CO2
Estimateurs appropriés pour EF Effets Fixes vs. Effets Aléatoires
Estimateur approprié pour EA Éléments du choix hors tests
Interprétation : EF vs. EA Test de Hausman
Application : Convergence des Données de panel non-cylindré
émissions de CO2 (Unbalanced)
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Inférence robuste en panel : White

Rappel : l’estimateur de ⌃ ˆ hétéroscédastique-consistant de


White
I MRL classique en coupe
⇣ transversale

0 0
I y = x + ✏ avec E ✏✏ = ⌃✏ 6= 2 I
I MCO ⇣ est non-biaisé
⌘ et consistant
⇣ 0 ⌘ 1 0 ⇣ 0 ⌘ 1
I ˆ
Var OLS = ⌃ ˆMCO = X X X ⌃✏ X X X 6=
⇣ 0 ⌘ 1
2
X X
I En cas d’hétéroscédasticité pure, White (1980) montre que
N
1X 2 0
S= ✏ˆi Xi Xi
N
i=1
0
I est un estimateur consistant de N1 X ⌃✏ X sous des conditions
générales
0
I ✏ˆi est le résidu MCO ✏ˆ = y x ˆMCO
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Inférence robuste en panel : White

L’estimateur de ⌃ ˆ hétéroscédastique-consistant de White


en panel

I L’estimateur de White peut être étendu pour l’autocorrélation


I mais souvent on ne le fait pas
I car on cherche à étudier les propriétés temporelles dans plus
de détails
I Sauf en panel court
I où la série est trop courte pour la tester en détail
I On va voir brièvement comment White est appliqué au Panel
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Inférence robuste en panel : White

L’estimateur de ⌃ ˆ hétéroscédastique-consistant de White


en panel
I Réécrire tout estimateur panel comme un estimateur MC de ✓
dans
0
ỹit = w̃it ✓ + ũit (16)

I ỹit est une fonction connue de seulement yi1 , ..., yiT


0 ⇥ 0 ⇤
I Pareil pour w̃it et wit0 = 1 xit; ũit et uit
⇥ 0 ⇤
0
I p.e. MCO : pas de transformation, ✓ = ↵
I Within : ỹit = yit ȳi , w̃it = xit −x̄i uniquement pour les
régresseurs variant dans le temps
I ✓ : coefficients des régresseurs variant dans le temps
I ...
I / Ces transformations induiront de la corrélation sérielle
I même si les erreurs originelles n’en ont pas
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Inférence robuste en panel : White

Notation

I Empiler les observations selon les périodes pour un individu i :


I ~
yi = W~ 0✓ + ~
ui où
i
I ~
yi : T ⇥ 1
I Pour D1, (T 1) ⇥ 1
I ~i : T ⇥q
W
" N
# 1
X X
MCO ✓ˆMCO = ~ W
W
0
~i ~ 0~
W i yi
I
i
i=1 i
I pour tous les estimateurs panel
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Inférence robuste en panel : White

Variance MCO
I Variance de ✓ˆMCO dans le modèle avec un ~ :
" N # 1 " N # 1
X 0 X 0 h 0 i X 0
⌃✓ˆMCO = ~ iW
W ~i W~ iE ~
ui ~ ~i W
ui |W ~i ~ iW
W ~i
i=1 i i=1

I Même formule sandwich que dans le rappel


I Sauf qu’on a un vecteur ũi plutôt qu’un scalaire ui
I Pour un seul individu, T obs : un bloc de var-cov
0 2 1
sv11 sv112 · · · sv11T
h 0i B B . .. .. C
sv212 . C
E ũi ũi = BB ..
C
C
@ . . . . . A
. . sv1(T 1)T
SYM · · · sv21T

où il faudrait tout écrire en conditionnel à W̃i


I Hors cette matrice, tous les éléments sont zéro
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Inférence robuste en panel : White

L’estimateur de ⌃ ˆ hétéroscédastique-consistant de White


en panel

IDonc : Variance de ✓ˆMCO dans le modèle avec un ~ :


" N # 1 " N # 1
X 0 X 0 h 0 i X 0
⌃ˆ = ~ iW
W ~i W~ iE ~ui ~ ~i W
ui |W ~i ~ iW
W ~i
✓MCO
i=1 i i=1

I White :
I On a pas besoin d’un estimateur consistant de cette matrice
pour l’inférence X 0 h 0 i
I Il suffit d’un estimateur de W~ E ~ u i ~
u | ~i W
W ~i
i i
i
I La partie du milieu
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Inférence robuste en panel : White

Estimateur Panel-robuste de la matrice de var-cov ⌃✓ˆMCO


I Estimateur consistant “Panel-robuste” de ⌃✓ˆMCO en panel
I C’est essentiellement le même problème qu’en coupe
transversale comme dans le rappel
I Sauf qu’on a un vecteur ui plutôt qu’un scalaire ui
I La formule suivante permet à la fois hétérodasticité et
autocorrélation
" N # 1 " N # 1
X 0 X 0 0 X 0
\
⌃ˆ = ~ ~
Wi Wi ~
Wi ~^ ^
ui ~ ~
ui Wi ~ ~
Wi Wi (17)
✓MCO
i=1 i i=1

où ^
~
ui = ~
yi ~ 0 ✓ˆ
W i

I C’est l’estimateur de ⌃ ˆ de White


I étendu pour le panel
I L’information accumule car la mat. ⌃u de var-cov des erreurs
est de dimensions finies T ⇥ T lorsque N ! 1
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Inférence robuste en panel : White

Détail
X h 0 i
I On cherche ~ 0E ~
W ui ~
u | ~i W
W ~i
i i
i
X 0
~ 0^
W ui ^ ~i
On prend i~ ~
ui W
I

i
I simplification de notation
0 1 0 1
zi11 ··· zik1 ei1
B .. .. .. C ˆ B . C
. A, ũi = ei = @ .. A
I W̃i = Zi = @ . .
zi1T ··· zikT eiT
X 0 0
Zi e i e i Z i =
i
0 10 0 10 10 0 1
zi11 · · · zik1 ei1 ei1 zi11 · · · zik1
XB . .. C B .. C B .. C B .. .. C
. . . ..
@ . . . A @ . A@ . A @ . . . A
i zi1T · · · zikT eiT eiT zi1T · · · zikT
(k ⇥ T ) ⇥ (T ⇥ 1) ⇥ (1 ⇥ T ) ⇥ (T ⇥ k) = (k ⇥ k)
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Inférence robuste en panel : White

Détail
X 0 0
Zi e i e i Z i =
i 0 10 2 10 1
z · · · zi1T ei1 · · · ei1 eiT zi11 · · · zik1
X B i11 . .. C B .. .. C B .. .. C
@ .. .. ..
. . A@ . . A@ . . . A
i zik1 · · · zikT sym · · · eiT 2 zi1T · · · zikT
= 0 P P 10 1
ei1 t zi1t eit · · · eiT t zi1t eit zi11 · · · zik1
XB .. . C B . .. C
. .. .. A @ .. ..
@ . . . A
i
P P
ei1 t zikt eit · · · eiT t zikt eit zi1T · · · zikT
0 P P P P 1
XB t zi1t eit t zi1t eit · · · t zikt eit t zi1t eit
= .. .. .. C
@ . . .P A
i
P
sym ··· t zikt eit t zikt eit
On voit comment on se rapproche d’une matrice de var-cov
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Inférence robuste en panel : White

Estimateur Panel-robuste de la matrice de var-cov ⌃✓ˆMCO


I Cet estimateur (17) assume l’indépendance entre i et N ! 1
I mais permet que V [uit ] et Cov [uit , uis ] change avec i, t, et s
I ce qui est le cas pour des panels courts
I Des et Panel-robustes basés sur cet estimateur (17)
I peuvent être calculés en utilisant une commande MCO
habituelle
I si cette commande a une option “cluster-robust” pour le
calcul des et
I comme dans Stata, cluster sur i
I Erreur fréquente :
I utiliser l’option standard robust des et dans MCO de
0
ỹit = w̃it ✓ + ũit
I Ajuste uniquement pour hétéroscédasticité
I En Panel, en pratique, plus important de corriger pour la
corrélation sérielle
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Inférence robuste en panel : Bootstrap

Sommaire

Les données de panel Inférence en données de panel


Modèles à Données de Panel Matrice des erreurs en panel
Effets Fixes & Effets Aléatoires Inférence robuste en panel :
Estimateurs pour données de panel White
Efficience et Erreurs Inférence robuste en panel :
Estimateurs appropriés pour le Bootstrap
MRL Application : Emissions de CO2
Estimateurs appropriés pour EF Effets Fixes vs. Effets Aléatoires
Estimateur approprié pour EA Éléments du choix hors tests
Interprétation : EF vs. EA Test de Hausman
Application : Convergence des Données de panel non-cylindré
émissions de CO2 (Unbalanced)
Rappel : le Bootstrap
I Hyp. Bootstrap :
I Si on pouvait ré-échantillonner la pop. dans les mêmes
conditions, on obtiendrait un échantillon semblable à celui
qu’on a déjà
I “Principe de médiocrité”
I Pas la même chose que représentativité
I Principe (et 2nde hyp.)
I Échantillonner l’échantillon de taille n avec remplacement
I soit n tirages, chaque i a une probabilité 1/n de sortir
I S’appelle “Bootstrap par paire” car y et X sont tirés
I On obtient un échantillon Bootstrap (de taille n)
I Hyp. : semblable à ce qu’on aurait obtenu en
ré-échantillonnant la pop.
I Repliquer ce processus B fois
I B pseudo-échantillons différents
I Pour chaque pseudo-échantillon < Yb , Xb >
I un vecteur ✓ˆb
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Inférence robuste en panel : Bootstrap

Rappel : le Bootstrap
I Pour construire un intervale de confiance pour un élément ✓k
de ✓
I On a B estimations ✓ˆkb p.e. B = 10 000
I Ordonner ces estimations de la plus petite à la plus grande
I Alors l’intervale de confiance à 95% est délimité par
I l’estimation numéro 250, borne inférieure
I l’estimation numéro 9750, borne supérieure
Pourquoi est-ce intéressant ?
1. Pas d’hypothèse sur la distribution des erreurs
1.1 Mais il ne peut y avoir de corrélation entre observations
1.2 Dès lors, en panels, on ré-échantillonne seulement sur i, en
utilisant toutes les T périodes de chaque i sélectionné
2. On peut calculer des intervales de confiance
2.1 pour toute fonction des paramètres estimés, y-compris
non-linéaire
2.2 pour des paramètres estimés de modèles sans propriétés
d’échantillons finis connues
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Inférence robuste en panel : Bootstrap

Estimateur Bootstrap (Panel-robuste) de la matrice de


var-cov ⌃✓ˆMCO en panel

I Pour chaque pseudo-échantillon B


I MCO de ỹit sur w̃it
I B estimations ✓ˆb , b = 1, ..., B
I Estimateur Bootstrap “empirique” de la matrice de var-cov ⌃✓ˆ :
B ⇣
X ⌘⇣ ⌘0
[ 1
⌃ boot =
ˆ ✓ˆb ✓¯
ˆ ✓ˆb ✓¯ˆ (18)
✓ B 1
b=1

¯ 1
P ˆ
où ✓ˆ = B b ✓b
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Inférence robuste en panel : Bootstrap

Estimateur Bootstrap (Panel-robuste) de la matrice de


var-cov ⌃✓ˆMCO en panel

I Bootstrap s’applique à toutes les techniques économétriques


I Peut être lent
I Pour autant que les i soient indépendants :
I Consistant quand N ! 1
I Asymptotiquement équivalent au “Sandwich” Panel-robuste de
White
I 8 forme d’hétéroscédasticité ou d’autocorrélation
I Accessible comme White dans Stata : option de calcul des et
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Application : Emissions de CO2

Sommaire

Les données de panel Inférence en données de panel


Modèles à Données de Panel Matrice des erreurs en panel
Effets Fixes & Effets Aléatoires Inférence robuste en panel :
Estimateurs pour données de panel White
Efficience et Erreurs Inférence robuste en panel :
Estimateurs appropriés pour le Bootstrap
MRL Application : Emissions de CO2
Estimateurs appropriés pour EF Effets Fixes vs. Effets Aléatoires
Estimateur approprié pour EA Éléments du choix hors tests
Interprétation : EF vs. EA Test de Hausman
Application : Convergence des Données de panel non-cylindré
émissions de CO2 (Unbalanced)
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Application : Emissions de CO2

Rappel
I Jeu de données “Extended Penn World Tables” EPWT
I Données de comptes nationaux
I Non-cylindré 1950-2009
I Émissions nationales de CO2
I Modèle “conditionnel” 15 :
ln ✏t2 = ln ✏t1 + 1 ln s + 2 ln n + ⇡t + ✓i + ⌫it
1
I Le paramètre d’intérêt est ⇢ = ln
5
I indique la vitesse de cvgce à l’ES
I Le modèle “absolu” ln ✏t2 = ln ✏t1 + ⇡t + ✓i + ⌫it
I Effets individuels ✓i simplifient à ✓ (intercept) pour quelques
estimateurs
I ⌫it supposé indépendant sur i, mais (auto)corrélé sur t pour un
i donné
I calculs dans do file 20160727CvgceCO2.do
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Application : Emissions de CO2

Inférence

I On va illustrer des calculs de t-stat


I Selon White & bootstrap
I Mais aussi aborder la décomposition de la variance des
émissions
I Pour comprendre le R 2 dans panel
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Application : Emissions de CO2

Décomposition de la variance des émissions

I La variance totale s 2 d’une série panel xit peut être


décomposée en
N X
X T N X
X T
2
1
NT (xit x̄) = 1
NT [(xit x̄i ) + (x̄i x̄)]2
i=1 t=1 i=1 t=1
XN X T N X
X T
= 1
NT −N (xit x̄i )2 + 1
N 1 (x̄i x̄)2
i=1 t=1 i=1 t=1

car les produits croisés somment à zéro.


Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Application : Emissions de CO2

Décomposition de la variance des émissions

I Donc Variance totale s 2 =


I sw2 variance within
I [moyenne sur les i des déviations individuelles autour des
moyennes individuelles]
I + sb2 variance between
I [déviations des moyennes individuelles autour de la moyenne
générale]
I Les R 2 within et between sont définis de façon similaire
I note. R 2 souvent petit en panel
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Application : Emissions de CO2

Décomposition de la variance des émissions


I Commande directe dans Stata xtsum
s sw sb s sw sb
toutes les obs (qualn<3)&(n>1000)&(year<2009)
ln ✏t2 1.71 .40 1.67 .60 .25 .55
ln ✏t1 1.71 .39 1.72 .62 .24 .57
ln n 1.82 .29 1.77 1.50 .20 1.51
ln i 1.50 .46 1.44 .55 .34 .49

I Interprétation
I Les variations d’émissions par h sont presque complètement
des différences entre pays
I Les retards des émissions et les régresseurs exogènes suivent la
même décomposition
I Plus d’homogénéité entre pays en se restreignant comme dans
les régressions
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Application : Emissions de CO2

Résultats et & t-stat

Pour Qualn<3 & n>1000 & year<2009


EF - Within EF - Diff 1ere EA - MCG MCO Between
✓ 3.13 .0001 2.3 1 .63
.63 .057 .73 .88 .93
Default .016 / 40.7 .03 / 1.92 .013 / 55 .007 / 118 .022 / 42.1
Robust .053 / 11.8 .036 / 1.59 .036 / 20.1 .01 / 92 non dispo
Cluster robust idem robust .041 / 1.40 idem robust .03 / 29 non dispo
Bootstrap (500) .054 / 11.75 .036 / 1.59 .042 / 17.3 .01 / 91 .028 / 33
et / t-stat Sans dich. de temps, sans autre régresseurs
R 2 overall .92 .0031 .92 .92 .92
R 2 within .58 non-dispo .58 non-dispo .58
R 2 between .98 non-dispo .98 non-dispo .98
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Application : Emissions de CO2

ET de

I Default : assume erreurs iid


I Robust
I Dialogue xtreg, choisir l’onglet SE/robust, sélectionner “robust”
I Clustered robust (clustered by idn) comme dans eq. 17
I Dialogue xtreg, choisir “cluster-robust se”
I Cluster sur idn mais Stata n’est pas très clair sur ce qu’il fait
(cfr aide)
I Apparement Stata comprend qu’avec des données de panel il
faut faire Cluster
I En tout cas, pour une commande panel
I L’aide n’est pas explicite
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Application : Emissions de CO2

ET de

I bootstrap comme dans eq. 18 avec 500 replications


I Les et bootstrap changent un peu chaque fois qu’on les calcule
I Stata ne permet pas de spécifier la variable cluster
I donne des résultats proches de cluster robust
I ou de robust dans le cas de MCO/between
I Ça n’est pas le même bootstrap que celui qu’on a vu
I Ces 2 derniers et sont dits panel-robustes
I robuste à la fois à l’hétéroscédasticité et à la corrélation sérielle

I Du moins dans une certaine mesure (cfr. p.e. intégration à


l’ordre 1)
I Ils sont très proches
Ch 1. Modèles Linéaire Non Dynamiques
Inférence en données de panel
Application : Emissions de CO2

Comparaison des et & R 2


I Dans cet exemple, les et “robustes” peuvent être 3 à 4 fois
plus grands que les “default”
I EF est un peu moins précis que EA
I en principe toujours comme ça
I EA moins précis que MCO
I Surprenant, peut-être dû au fait que EA ne rend pas bien
compte de la corrélation des erreurs dans ce cas-ci
I Autrement dit, l’hyp d’équicorrélation ne s’applique pas ici
I Différence très substantielle avec D1
I indicatrice de questions de séries temporelles, sans doute I(1)
I Sur R 2
I Le plus frappant est la 6= entre D1 et les autres
I Typique d’intégration I(1)
I On pourrait calculer R 2 within & between pour D1 et MCO
Ch 1. Modèles Linéaire Non Dynamiques
Effets Fixes vs. Effets Aléatoires

Sommaire

Les données de panel

Modèles à Données de Panel

Estimateurs pour données de panel

Inférence en données de panel

Effets Fixes vs. Effets Aléatoires

Données de panel non-cylindré (Unbalanced)


Ch 1. Modèles Linéaire Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Éléments du choix hors tests

Sommaire

Les données de panel Inférence en données de panel


Modèles à Données de Panel Matrice des erreurs en panel
Effets Fixes & Effets Aléatoires Inférence robuste en panel :
Estimateurs pour données de panel White
Efficience et Erreurs Inférence robuste en panel :
Estimateurs appropriés pour le Bootstrap
MRL Application : Emissions de CO2
Estimateurs appropriés pour EF Effets Fixes vs. Effets Aléatoires
Estimateur approprié pour EA Éléments du choix hors tests
Interprétation : EF vs. EA Test de Hausman
Application : Convergence des Données de panel non-cylindré
émissions de CO2 (Unbalanced)
Ch 1. Modèles Linéaire Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Éléments du choix hors tests

Causalité
I Le modèle EF peut établir la causalité avec moins d’hyp.
que pour
I des données de coupe transversale
I le MRL ou les EA
I Dans quelques cas, la causalité est claire, donc EA est
approprié
I p.e. dans une expérience contrôlée, la causalité est claire, il
s’agit plus de mesurer sa force
I des rendements de culture causés par 6= quantités d’engrais,
en labo
I dans ce cas, le traitement xit est alloué aléatoirement, donc
non-corrélé à ↵i
I Parfois, on ne veut mesurer que la corrélation, pas la
“causation”
I p.e. pour de la prédiction
I EA est alors suffisant
Ch 1. Modèles Linéaire Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Éléments du choix hors tests

Causalité

I Les économistes sont inhabituels


I ils préfèrent une approche EF car ils veulent mesurer la
causalité
I avec des données observationnelles
I plutôt qu’expérimentales
I Dans ce cas, utiliser EA ou MCO n’aboutit qu’à une corrélation
spurieuse souvent due à une hétérogénéité inobservée
I “facteurs confondants” : variables non-incluses corrélées avec
régresseurs
I EF élimine l’hétérogénéité inobservée
I due aux variables inobservées qui sont invariantes dans le
temps
I L’effet causal de x sur y est mesuré par la corrélation entre des
changements individuels dans y et dans x
Ch 1. Modèles Linéaire Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Éléments du choix hors tests

Faiblesse des EF en pratique


I L’estimation des coef. des régresseurs invariant dans le
temps n’est pas possible avec EF
I Les coef. des régresseurs peu variables dans le temps sera
imprécise
I sb (variation entre unités) forte par rapport à sW (variation
dans le temps)
I La prédiction de la moyenne conditionnelle n’est pas
consistante
I car les effets individuels ↵i ne sont pas estimés de façon
consistante
I Seuls les changements de cette moyenne conditionnelle, causés
par des changement de régresseurs variants dans le temps,
peuvent être prédits
I EF fait moins d’hyp que EA sur l’hétérogénéité inobservée
I mais il faut que celle-ci soit invariante au temps
I ↵i , pas ↵it
Ch 1. Modèles Linéaire Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Test de Hausman

Sommaire

Les données de panel Inférence en données de panel


Modèles à Données de Panel Matrice des erreurs en panel
Effets Fixes & Effets Aléatoires Inférence robuste en panel :
Estimateurs pour données de panel White
Efficience et Erreurs Inférence robuste en panel :
Estimateurs appropriés pour le Bootstrap
MRL Application : Emissions de CO2
Estimateurs appropriés pour EF Effets Fixes vs. Effets Aléatoires
Estimateur approprié pour EA Éléments du choix hors tests
Interprétation : EF vs. EA Test de Hausman
Application : Convergence des Données de panel non-cylindré
émissions de CO2 (Unbalanced)
Ch 1. Modèles Linéaire Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Test de Hausman

Rappel : le test de Hausman

I Principe
I Soit 2 estimateurs ✓ˆ et ✓˜ (dans le même modèle)
I S’ils sont tous 2 consistants
⇣ ⌘
I alors leur différence ✓ˆ ✓˜ ne devrait pas être
statistiquement 6= 0, asymptotiquement
⇣ ⌘ ⇣ ⌘
I On teste H0 : plim ✓ˆ ✓˜ = 0 , Ha : plim ✓ˆ ✓˜ 6= 0
I Sous H0 , la différence entre ces 2 estimateurs converge à une
normale d’espérance zéro
p ⇣ ⌘
I N ✓ˆ ✓˜ ! N [0, VH ]
I VH est la matrice de var-cov de la distribution limite
Ch 1. Modèles Linéaire Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Test de Hausman

Rappel : le test de Hausman


I Statistique du test de Hausman
⇣ ⌘0 ⇣ ⌘ 1⇣ ⌘
1
H = ✓ˆ ✓˜ V̂H N ✓ˆ ✓˜
I Principe
I H est au
⇣ ⌘ fond une valeur normalisée du carré de la différence
✓ˆ ✓˜
I Donc, des valeurs élevées de H amènent à rejeter l’hyp. nulle
2
I On peut montrer que H asymptotiquement (q) sous H0
2
I donc rejeter H0 au niveau ↵ si H > ↵ (q)
I avec q le nombre d’éléments de ✓
I ˆ ✓˜ au moins est inconsistant
et donc : un des 2 estimateurs ✓,
I La difficulté en pratique est de trouver un estimateur V̂H de
VH
I On va voir comment on fait en panel
Ch 1. Modèles Linéaire Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Test de Hausman

Test de Hausman sur la présence d’effets fixes en données


de panel
I Si les effets individuels ↵i sont fixes
I L’estimateur within ˆW est consistant
I L’estimateur EA ˜EA est inconsistant
I Avec le vecteur des coefficients des régresseurs variant dans
le temps
I puique seuls ces coefficients sont estimables avec Within
I Tandis que si les effets sont aléatoires
I Les 2 sont consistants
I H0 : pas de différence systématique entre les 2 estimations
I Si H0 vraie : on préfère EA car plus efficient
I en principe, pas si clair si les erreurs sont I(1)
I Hausman fonctionne sur toutes paires d’estimateurs avec des
propriétés semblables
I p.e. D1 vs. MCO
Ch 1. Modèles Linéaire Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Test de Hausman

Test de Hausman sur la présence d’effets fixes en données


de panel
I Si le test amène à rejeter l’égalité des 2 vecteurs ˆW et ˜EA
I On infère que puisque ˆW est consistant,
I si ˜EA est différent, il doit être inconsistant
I Et donc que les effets individuels ↵i sont corrélés avec les
régresseurs xit
I Remarque : On peut encore éviter d’utiliser un estimateur EF
I Si les régresseurs sont corrélés aux ↵i à cause de variables
omises
I il peut être possible de rajouter des régresseurs
I Il peut être possible d’utiliser un estimateur EA avec variables
instrumentales (Ch. 2)
I À
⇣ présent on⌘ regarde le calcul de la mat. de var-cov de
˜EA ˆW
I pour calculer la stat de Hausman en panel
I 2 cas
Ch 1. Modèles Linéaire Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Test de Hausman

Calcul du test de Hausman quand ˜EA EST pleinement


efficient
I Si le modèle

vrai⇤ est EA avec Equicorrélation, donc
I ↵i iid 0, ↵2 non-corrélé
⇥ ⇤ aux régresseurs
2
I l’erreur "it iid 0, "
I Alors ˜EA pleinement efficient,
I la stat de Hausman se simplifie
⇣ ⌘0  \
h i h
\ i 1⇣ ⌘
H= ˜EA ˆW V ˆW V ˜EA b̃EA −b̂W

I Avec le vecteur des coefficients des régresseurs variant dans


le temps comme d’habitude
2
I Cette stat de test est asymptotiquement (dim [ ]) sous H0
I Très facile à calculer
h i \
\ h i
I puisque les matrices V ˆW , V ˜EA sont fournies lors de
l’estimation
Ch 1. Modèles Linéaire Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Test de Hausman

Calcul du test de Hausman quand ˜EA N’EST PAS


pleinement efficient
I La forme simplifiée de la stat de Hausman n’est pas valable si
↵i ou "it ne sont pas iid
I p.e. lorsqu’il y a hétéroscédasticité
I Car dans ce cas l’estimateur EA ˜EA n’est pas pleinement
efficient sous H0
h i
\ h
\ i
I L’expression V b̂W V b̃EA dans la formule de H doit être
remplacée par
h\ i
I V b̃EA b̂W qui est + générale
⇣ ⌘
I Estimation de la matrice de var-cov de ˜EA ˆW
I Ceci N’EST PAS implémenté dans Stata
I Mais peut être estimé de façon consistante par bootstrap sur
i (pas t)
Ch 1. Modèles Linéaire Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Test de Hausman

Calcul du test de Hausman quand ˜EA N’EST PAS


pleinement efficient
I Une version panel-robuste de la stat de Hausman est
⇣ ⌘�  h\ i −1 ⇣ ⌘
HRobuste = b̃EA −b̂W Vboot b̃EA b̂W b̃EA −b̂W

h\ i B ⇣
X ⌘⇣ ⌘0
1 ˆb ¯ ˆ
ˆ ˆ¯
I avec Vboot b̃EA b̂W = B 1 b
b=1
I b est le b ème de B replications bootstrap et ˆ = b̃EA b̂W
I Cette stat de test peut
I être appliquée à des sous-vecteurs de
I utiliser d’autres estimateurs tels que ˜MCO à la place de ˜EA et
ˆD1 à la place de ˆW
Ch 1. Modèles Linéaire Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Test de Hausman

Application du test de Hausman

I Exemple de la convergence des émissions de CO2


Ch 1. Modèles Linéaire Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Test de Hausman

Rappel
I Jeu de données “Extended Penn World Tables” EPWT
I Données de comptes nationaux
I “Unbalanced” 1950-2009
I Émissions nationales de CO2
I Modèle “conditionnel” 15 :
ln ✏t2 = ln ✏t1 + 1 ln s + 2 ln n + ⇡t + ✓i + ⌫it
1
I Le paramètre d’intérêt est ⇢ = ln
5
I indique la vitesse de cvgce à l’ES
I Le modèle “absolu” ln ✏t2 = ln ✏t1 + ⇡t + ✓i + ⌫it
I Effets individuels ✓i simplifient à ✓ (intercept) pour quelques
estimateurs
I ⌫it supposé indépendant sur i, mais (auto)corrélé sur t pour un
i donné
I calculs dans do file 20160727CvgceCO2.do
Ch 1. Modèles Linéaire Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Test de Hausman

Application du test de Hausman


I Dans le modèle “absolu” on n’a qu’un régresseur variable dans
le temps
EF - Within EF - Diff 1ere EA - MCG MCO Between
.63 .057 .73 .88 .93
Default .016 / 40.7 .03 / 1.92 .013 / 55 .007 / 118 .022 / 42.1
Robust .053 / 11.8 .036 / 1.59 .036 / 20.1 .01 / 92 non dispo
Cluster robust idem robust .041 / 1.40 idem robust .03 / 29 non dispo
et / t-stat Sans dich. de temps, sans autre régresseurs

I On pourrait calculer directement H si EA était pleinement


efficient
I On compare les estimations EF et EA sur la base des
écarts-types par défaut
I Car si EA est le bon modèle, la transformation des données par
MCG rend les résidus sphériques
2
H ' (0.73−0.63) / 0.0162 −0.0132 t 115 > 2
.05 (1) = 3.84
I donc le modèle EA est rejeté
Ch 1. Modèles Linéaire Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Test de Hausman

Illustration du calcul habituel du test de Hausman dans


Stata

I exécuter xtreg lnem lnem5, fe


I estimates store EstimEF
I exécuter xtreg lnem lnem5, re
I hausman EstimEF .
I Attention au petit point final qui veut dire “dernier vecteur
estimé”
Ch 1. Modèles Linéaire Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Test de Hausman

Illustration du calcul habituel du test de Hausman dans


Stata

I C’est la procédure du test entre EF (fe dans Stata) et EA (re


dans Stata)
I Stata produit une p-valeur
I Ligne “Prob>chi2 =”
I si cette p-valeur est < 5%, on R H0 , donc les EF ↵i sont
corrélés avec les régresseurs xit
I EF est préférable
I Cette procédure ne marche que avec les et par défaut
I vce(cluster i) renvoie un message d’erreur
I Ce qui est correct puisque la formule utilisée par Stata n’est
pas valable s’il faut utiliser vce(cluster i)
Ch 1. Modèles Linéaire Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Test de Hausman

Application du test de Hausman

I Le calcul utilisé par Stata n’est pas approprié cependant


I La stat H est biaisée parce que les et par défaut sont biaisés
vers le bas
I par rapport aux et cluster
I Il faudrait donc utiliser la formule bootstrap du test de
Hausman
I Cela demande de programmer Stata
I Vous pouvez le faire pour votre dossier
Ch 1. Modèles Linéaire Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Test de Hausman

Protocole pratique
1. Estimateurs pour EF
1.1 Within
1.2 Différences premières
I S’il y a des différences notables entre ces deux estimateurs, il
y a probablement des racines unitaires
I Section sur dynamique, différences premières est plus
probablement correct
2. Estimateur EA
I Hausman
I En principe, ça s’arrête là et on interprête
I En économie, si on préfère un modèle sans EF, il faut le
justifier en passant un test de Hausman
3. (optionel) Estimateurs pour MRL
I SI
I Hausman & la théorie rejette EF
I On a de bonnes raisons de soupçonner qu’il pourrait ne pas y
avoir d’EA
I Test de Breusch-Pagan, mais il en existe d’autres
Ch 1. Modèles Linéaire Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Test de Hausman

Protocole pratique

I Souvent les étudiants procède comme dans le cours :


1. Estimer MCO
2. Estimer EA
3. Tester (Breusch-Pagan ou autre) EA contre MCO
4. Si ¬R EA, alors estimer EF
5. Test de Hausman EF contr EA
I Problème avec cette approche
I Si le modèle correct est EF, alors les estimateurs MCO et EA
sont inconsistants
I Les tests à l’étape 3 ne peuvent être utilisés
Ch 1. Modèles Linéaire Non Dynamiques
Données de panel non-cylindré (Unbalanced)

Sommaire

Les données de panel

Modèles à Données de Panel

Estimateurs pour données de panel

Inférence en données de panel

Effets Fixes vs. Effets Aléatoires

Données de panel non-cylindré (Unbalanced)


Ch 1. Modèles Linéaire Non Dynamiques
Données de panel non-cylindré (Unbalanced)

Attrition

I Panel cylindré (balanced)


I Les données existent pour chaque i chaque t
I Lorsque les données de certains i n’existent pas pour certains t
I On dit qu’il y a attrition
I p.e. avec des individus qui abandonnent le panel
I Généralement définitivement
I Le panel est alors non-cylindré (unbalanced)
I ou incomplet
I Panel rotatif
I un sous-échantillon d’individus est remplacé chaque année
Ch 1. Modèles Linéaire Non Dynamiques
Données de panel non-cylindré (Unbalanced)

Consistance

I Soit dit = 1 si i observé au temps t, = 0 sinon


I alors T devient Ti
I Within est consistant si l’hyp d’exogénéité forte devient

E [✏it |↵i , xi1 , . . . , xiTi , di1 , . . . , diTi ] = 0

I C’est-à-dire : présence ou absence (dit ) dans l’échantillon ne


peut être corrélée aux erreurs ✏it
Ch 1. Modèles Linéaire Non Dynamiques
Données de panel non-cylindré (Unbalanced)

Consistance

I Lorsque ça n’est pas le cas, on a


I un exemple classique de sélection de l’échantillon
I Les estimateurs vus sont généralement inconsistants
I On parle de biais d’attrition
I Des caractéristiques inobservées gouvernent l’attrition
I p.e. dans une enquête sur le salaire, il est plus probable que les
personnes à bas salaires quittent l’échantillon
I Dans l’application, les pays à très basses émissions sont sans
doute les plus pauvres et donc ceux ne disposant pas d’un
système stat
I EA est consistant si de plus
I l’effet individuel ↵i est indépendant des régresseurs xit
Ch 1. Modèles Linéaire Non Dynamiques
Données de panel non-cylindré (Unbalanced)

Cylindrage (Balancing)

I Opération consistant à convertir un panel non-cylindré en


cylindré
I En excluant de l’échantillon tous les individus dont les données
ne sont pas disponibles tous les ans
I Ou en rejetant les années pour lesquelles tous les individus ne
sont pas observés
I En général, cela réduit beaucoup l’efficience
I D’un autre côté, dans la pratique,
I Il arrive que seules certaines variables ne sont pas observées
tous les ans
I p.e. les questions sur le revenu
I Plutôt que de cylindrer le panel à cause de ça, des méthodes
d’imputation de données sont souvent préférables
Ch 1. Modèles Linéaire Non Dynamiques
Données de panel non-cylindré (Unbalanced)

Conclusions

I Un panel permet de
I traiter l’hétérogénéité inobservée constante dans le temps
I et donc établir la causation plus facilement
I Il existe plusieurs modèles linéaires non-dynamiques en panel
I selon les hyp. sur les ↵i
I Et plusieurs estimateurs
I Tous basés sur MC
I On souligne EF, EA et D1
Ch 1. Modèles Linéaire Non Dynamiques
Données de panel non-cylindré (Unbalanced)

Conclusions
I Hétéroscédasticité & autocorrélation sont normalement
présentes ensemble
I Souvent on ne va pas traiter
I Mais utiliser une version robuste du calcul des et
I White ou bootstrap
I Les estimateurs EF et D1 sont toujours consistants
I Mais ne peuvent prédire ou estimer les coef. des régresseurs
constants dans le temps
I Ce que peut EA
I qui de + est + efficient
I Mais repose sur une absence de corrélation en ↵i et xi
I Le choix entre EF et EA peut être justifié par un test de
Hausman
I Dont le calcul a fréquemment recours à bootstrap
Ch 1. Modèles Linéaire Non Dynamiques
Données de panel non-cylindré (Unbalanced)

Annexe 1. Sur la consistance de MCO dans les modèles à


données de Panel
Ch 1. Modèles Linéaire Non Dynamiques
Données de panel non-cylindré (Unbalanced)

Compacter la notation

I Empiler les observations sur le temps pour un i donné :


I ~
yi = W~ 0✓ + ~
ui où
i
I ~
yi : T ⇥ 1
I pour le modèle en diff. 1ères, (T 1) ⇥ 1
I ~i : T ⇥q
W
" N
# 1
X X
Estimateur MCO ✓ˆMCO = ~ W
W
0
~i ~ 0~
W i yi
I
i
i=1 i
Ch 1. Modèles Linéaire Non Dynamiques
Données de panel non-cylindré (Unbalanced)

Consistance de MCO dans un modèle ~


I Si le modèle est correctement spécifié :
" N # 1
X 0 X 0
✓ˆMCO = ✓ + W~ iW
~i ~ i~
W ui
i=1 i
I Comme l’indépendance entre i n’est pas remise en cause,
Ila hcondition
i essentielle pour la consistance de MCO est
~
E Wi ~
0
ui = 0
I c’est-à-dire pas de corrélation des erreurs avec les régresseurs

h “à l’intérieur
i (within)” de chanque individu
E W~ ~ 0
i ui = 0 est + forte que is E [uit |wit ] = 0 (exogénéité
I

contemporaine)
I parce que la transformation ~ implique plus d’une période p.e.
w̃it = xit −x̄i
I Exogénéité forte (4) E [ũ it |w̃i1 , ..., w̃iT ] = 0 est suffisante
I Ch. 2 : hyp. + faibles – donc matrice de var-cov + compliquée
Ch 1. Modèles Linéaire Non Dynamiques
Données de panel non-cylindré (Unbalanced)

Annex 2. Abréviations courantes


I D1 estimateur différences premières
I ddl degré de liberté (dof)
I dich. Dichotomique
I v.a. Variable aléatoire (random variable)
I EF Effets fixes (fixed effects)
I EA Effets aléatoire (random effects)
I ES état stationnaire
I et Écart-type (se standard errors)
I iid Indépendamment et identiquement distribué
I MC Moindres carrés
I MCO Moindres Carrés Ordinaires
I MCG Moindres Carrés Généralisés
I MRL Modèle de Régression Linéaire
I p.e. par exemple