Académique Documents
Professionnel Documents
Culture Documents
2020 – 2021
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Plan du Ch 1
Sommaire
Les données de panel
Autres tests
Annexes
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Les données de panel
Notation
Sommaire
Les données de panel
Autres tests
Annexes
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Modèles à données de panel
Sommaire
I Modèle correct : Y = β0 + β1 x1 + β2 x2 +
I Modèle estimé : Y = β0 + β1 x1 + ν
I L’effet du régresseur manquant x2 sur Y est implicite dans le
terme d’erreur du modèle estimé : ν = β2 x2 +
I = hétérogénéité inobservée :
I Des facteurs (individuels) inobservés influent sur Y
I Si x2 n’est pas corrélé avec x1
I MC consistant pour βˆ1 (βˆ0 est biasé et inconsistant)
I Si x2 est corrélé avec x1 ,
I l’erreur ν est corrélée avec x1
I MC inconsistant pour tous les coef.
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Modèles à données de panel
Effets Fixes & Effets Aléatoires
Mêmes pentes
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Modèles à données de panel
Effets Fixes & Effets Aléatoires
Exogénéité
I Dans ce Ch. 1 : on assume l’exogénéité forte/stricte
E [εit |αi , xi1 , ..., xiT ] = 0, t = 1, ..., T (4)
I C’est-à-dire : hypothèse que pour it
I Espérance de zéro conditionnellement aux valeurs passées,
présentes et futures des régresseurs
I Équivalent à zéro covariance E [εit xit ] = 0
I Rien n’est supposé entre la variable aléatoire αi et les
régresseurs xi : E [εit αi ] =?
I Exclut des modèles avec une variable dépendante retardée
I Pas de yi(t−s) dans xit sinon ce serait un modèle dynamique
0
I Comme yit−1 = αi + xit−1 β + it−1 : il est difficile d’affirmer
que E (it it−1 ) = 0
I Et aussi avec des régresseurs endogènes (Ch. 2)
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Modèles à données de panel
Effets Fixes & Effets Aléatoires
0
I 2 variantes du modèle (3) yit = αi + xit β + it selon hyp. sur αi
I Toutes deux ont “2” erreurs αi et it
I Modèles à erreurs composées
I Toutes deux traitent αi comme une v.a. inobservée
I Variante 1 : modèle à effets fixes (EF)
I αi est corrélé avec (la partie invariante au temps) des
régresseurs observés xit
I C’est une forme d’hétérogénéité inobservée car on ne sait pas
ce qui se cache dans αi
I “fixe” parce que, anciennement, αi était traité comme un
paramètre (non-aléatoire) à estimer
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Modèles à données de panel
Effets Fixes & Effets Aléatoires
uit ∼ 0, σu2
0
MRL yit = α + xit β + uit (1)
Sommaire
Les données de panel
Autres tests
Annexes
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Estimateurs pour données de panel
Introduction
I Il y a 5 estimateurs disponibles couramment pour β en
données de panel
I Dans ce contexte non-dynamique, sans endogénéité, ce sont
tous des variantes de MC
I Seuls 3 sont utilisés en pratique
I Diffèrent selon leurs utilisations des variations transversales
(entre i) et temporelles
I Leurs propriétés dépendent de quel est le modèle approprié
(MRL - EF - EA)
I Un régresseur xit peut être
I invariant dans le temps, xit = xi pour t = 1, ..., T ,
I ou variable dans le temps
I Certains estimateurs ne peuvent identifier que les coefficients
des régresseurs variables dans le temps
I Ne peuvent produire une estimation des autres coefficients
I On va voir les estimateurs du plus simple au plus complexe
I On regarde la consistance et l’efficience
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Estimateurs pour données de panel
Efficience et Erreurs
Sommaire
σv211
σv112 ··· σv11T
.. ..
.
σv212 .
0 ··· 0
.. .. ..
. . . σv1(T − 1)T
SYM ··· σv21T
.. .. ..
0 . . .
.. .. ..
. . . 0
σv2N1 σvN12 ··· σvN 1T
.. ..
σv2N2 . .
0 ··· 0
.. .. ..
. . .
σvN(T − 1)T
SYM ··· σv2NT
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Estimateurs pour données de panel
Efficience et Erreurs
Modèle EA
it ∼ 0, σ2
I La matrice Σu prend la forme suivante
Matrice Σu Bloc-Diagonale de Var-Cov des Erreurs Panel EA
En mots
I La matrice s’organise en blocs carrés autour de la diagonale
principale
I Chaque carré tient en 2 chiffres
I Hors de sa diagonale principale, une corrélation entre périodes
σα2
I la même pour tous les i
I Sur sa diagonale principale, une variance σα2 + σ2
homoscédastique
I Entre différents i, toutes les corrélations sont nulles
I Hors des blocs diagonaux
I On voit donc que même dans la structure la plus restrictive,
les estimateurs panel se trouvent dans un contexte avec de
l’autocorrélation
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Estimateurs pour données de panel
Estimateurs appropriés MRL
Sommaire
I Étapes
1. Prendre les moyennes sur le temps par individu
T
I ȳi = 1
X
yit , idem pour x̄i
T t=1
2. Estimer par MCO ȳi = α + x̄i0 β + ε̄i
I Régresser ȳi sur un intercept et le vecteur x̄i
I Pour estimer β, MCO utilise toutes les données
I Donc les variations à la fois sur le temps et en transversal
I Between n’utilise que les variations transversales
I Entre (between) différents individus
I Analogue à une régression en coupe transversale
I Les variations internes (within) à chaque individu sont écartées
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Estimateurs pour données de panel
Estimateurs appropriés MRL
Sommaire
Estimateur Within
log (salit ) = β1 +β2 expit +β3 expit2 +β4 educit +β5 genrei +β6 cognii +αi +it
Sommaire
Rappel du modèle EA
0
I Modèle à effets individuels (3) yit = αi + xit β + it avec
I αi iid (donc non-corrélés à xit )
I it iid mais corrélations comme dans l’hyp. EA (5)
αi ∼ α, σα2
it ∼ 0, σ2
Estimateur nº5 EA
I On appelle estimateur EA l’estimateur MCG
I dans lequel la matrice Σ des erreurs est celle de la diapo
précédente
I La version faisable de cet estimateur est MCO
I appliqué aux données transformées de la façon suivante :
0
yit − λ̂ȳi = 1 − λ̂ µ + xit − λ̂x̄i β + νit (10)
Estimateur EA
I On ajoute l’intercept (non-aléatoire) scalaire µ afin de
normaliser les effets aléatoires αi à une espérance nulle
I et ainsi faire coincider l’estimateur avec l’hypothèse EA (5)
I C’est-à-dire µ correspond à α dans (5)
I La dérivation de cet estimateur (10) et des manières d’estimer
σα2 et σε2 , et donc λ,
I sont détaillés dans Cameron & Trivedi
I Remarque
I λ̂ = 0 correspond à l’estimateur MCO
I λ̂ = 1 correspond à l’estimateur within
I λ̂ → 1 lorsque T → ∞ (regardez la formule)
I Il s’agit d’un estimateur en deux étapes de β
1. estimer λ (il y a plusieurs manières)
2. estimer β par MCO sur les données transformées
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Estimateurs pour données de panel
Estimateur approprié pour EA
Propriétés de l’estimateur EA
Sommaire
Discussion sur EA et EF
I La plupart des disciplines de stat appliquées
I traitent l’hétérogénéité inobservée (individuelle) αi comme
distribuée indépendamment des régresseurs
I Sauf la micro/macroéconométrie
I Cette hyp d’indépendance
I a l’avantage de permettre une estimation consistante de tous
les paramètres
I y-compris ceux invariants dans le temps
I si l’hyp est vraie
I est souvent considérée par les économistes comme non
supportée par les données
I Les deux modèles ont des intérêts distincts
I EA : Précise la structure temporelle → Efficience
I EF : Endogénéité de l’hétérogénéité inobservée → Consistance
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Estimateurs pour données de panel
Interprétation : EF vs. EA
0
I Le modèle est yit = αi + xit β + it aussi bien pour EA que
pour EF
I L’effet individuel αi est une v.a. dans les deux modèles
I On prend l’espérance conditionnelle aux régresseurs
I E [yit |xit ] = E [αi |xit ] + xit0 β
I Que peut-on en dire ? (prochaine dia)
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Estimateurs pour données de panel
Interprétation : EF vs. EA
Modèle
Estimateur de β MRL (1) EA (3) & (5) EF (3)
MCO (1) Consistant Consistant Inconsistant
Between (7) Consistant Consistant Inconsistant
Within (EF) (8) Consistant Consistant Consistant
D1 (9) Consistant Consistant Consistant
EA (10) Consistant Consistant Inconsistant
Cette table ne présente que la consistance des estimateurs de β
I L’estimation des αi est toujours inconsistante, sauf si αi = α∀i
I La consistance ne tient que si les propriétés des modèles
tiennent
Le seul estimateur efficient est EA si le bon modèle est EA
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Estimateurs pour données de panel
Application
Sommaire
Package plm
CKE formel
I Les niveaux plus élevés de revenu par habitant PIBh
I sont graduellement associés avec des niveaux plus faibles
d’émissions y
I Jusqu’à une baisse nette à un “turning point”
Évidence de CKE
I Bien que décrite comme une relation temporelle
I CKE a + souvent été étudiée en coupe-transversale ou en panel
I Lorsqu’on la trouve, est-ce causal ou spurieux ?
I Stern 2004
I CKE pour les émissions de CO2 & CO2 eq sont spurieuses
I L’apparence de CKE est due à un mélange d’effets
1. La pollution % de façon monotone, voire linéaire, avec le
revenu
2. Mais le “temps” fait baisser les émissions, on émet moins
3. Dans les pays à croissance rapide, l’effet revenu (% émissions)
est plus fort que l’effet temps
4. Dans les pays riches, la croissance est faible, donc les efforts
de réduction des émissions peuvent dépasser l’effet revenu
I C’est ce qui cause un CKE apparent en coupe transversale ou
en panel
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Estimateurs pour données de panel
Application
CKE déforestation
CKE déforestation
I Il y a un problème d’échelle
I Déforestation en niveau, par habitant ou par km² ?
I On fait abstraction de cela ici, mais c’est certainement
important
I PIB local ou national ?
I Interprétation, p.e. Kauppi et.al. (2006)
I avec la hausse du PIB, la déforestation devient moins
intéressante que d’autres alternatives
I On est donc plutôt sur le PIB national, mais on va faire le
cours avec le PIB par état par simplicité
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Estimateurs pour données de panel
Application
Régression dans R
Estimateur EF Within
I plm(Defor_km2~PIBh2010R+I(PIBh2010R^2), data=pama,
model = "within")
I Unbalanced Panel : n=9, T=25-26, N=233
I Tocantins n’a pas de donnée de revenu en 1988
I La sortie ne présente pas d’intercept
I Suit la théorie, mais + difficile à comparer avec EA
I On ne regarde pas les t-stat et les tests pour le moment
I Les autres modèles linéaires fonctionnent de la même manière
I en changeant juste l’option model
I Les α̂i sont extraits par la commande fixef avec des options de
calcul
I Même non-consistants, on peut corréler ces α̂i avec des
variables d’intérêt
I Juste pour within
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Estimateurs pour données de panel
Application
Estimateur EF D1 - fd
Estimateur EA - random
I Plusieurs versions
I random.method = c("swar", "walhus", "amemiya", "nerlove",
"kinla")
I Se différencient essentiellement selon le mode de calcul de
MCG
I Je ne détaille pas - on laisse tomber
I Défaut : swar : Swamy and Arora
I summary informe sur la variance de chaque composante de
l’error
I idiosyncratic : σ2 ; individual : σα2
I Theta est le θ de MCG
I L’estimateur EA avec effets temporels (“two way”) n’est pas
implémenté
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Estimateurs pour données de panel
Application
I Between
I Nombre d’observations réellement utilisées = “Observations
used in estimation” = 9
I Pooling – même chose que MCO
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Estimateurs pour données de panel
Application
Sommaire
Les données de panel
Autres tests
Annexes
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Inférence avec données de panel
Matrice des erreurs en panel
Sommaire
Inférence
I L’inférence consiste en
I la prédiction
I les tests d’hypothèses
I L’inférence classique fait des tests d’hyp.
I dont la significativité des coefficients
I à partir de la matrice Σβ de variance-covariance des β̂
I Donc : essentiel de disposer d’une estimation
I au minimum consistante
I de cette matrice Σβ
I Celle-ci s’appuie sur la matrice Σu
I Var-Cov des erreurs uit = αi + it
I Prochaine dia
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Inférence avec données de panel
Matrice des erreurs en panel
σv211
σv112 ··· σv11T
.. ..
.
σv212 .
0 ··· 0
.. .. ..
. . . σv1(T − 1)T
SYM ··· σv21T
.. .. ..
0 . . .
.. .. ..
. . . 0
σv2N1 σvN12 ··· σvN 1T
.. ..
σv2N2 . .
0 ··· 0
.. .. ..
. . .
σvN(T − 1)T
SYM ··· σv2NT
Rappel 2 : Matrice Σu dans le modèle EA avec
hétéroscédasticité
Estimateur MC
I Tous les estimateurs panel sont MC sur données transformées
I MC traite chacune des T années comme de l’information
indépendante, mais
I Le contenu informationnel est moindre
I puisque les erreurs (et donc les obs.) sont corrélées
I Ceci tend à surestimer la précision
I Le modèle qui fait le plus d’hypothèses sur Σu est EA
I Si ce modèle est exact, on peut procéder à l’inférence
habituelle
I à partir des données transformées MCG
I Dans les autres cas,
I On utilise des corrections panel des écarts-types (et) quand on
applique MCO
I Beaucoup de corrections sont possibles, selon les hyp. sur la
corrélation et l’hétéroscédasticité
I Et aussi selon la longueur du panel – mais on ne verra pas
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Inférence avec données de panel
Matrice des erreurs en panel
Efficience en panel
Sommaire
générales
0
I ˆi est le résidu MCO ˆ = y − x β̂MCO
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Inférence avec données de panel
Inférence robuste : White
Notation
où ^
~
ui = ~ ~ 0 θ̂
yi − W i
Détail
~ 0E ~ ~i W~i
X h 0 i
I On cherche W i ui ~
u i | W
i
0
~ 0^
ui ^ ~i
X
I On prend W i~ ~
ui W
i
I simplification de notation
···
zi11 zik1 ei1
. .. .. ˆ .
..
I W̃i = Zi = . . , ũi = ei = ..
zi1T ··· zikT eiT
0 0
X
Zi ei ei Zi =
i
0 0
zi11 · · · zik1 ei1 ei1 zi11 · · · zik1
X . .. .. .. .. ..
. . . ..
. . . . . . . .
i zi1T · · · zikT eiT eiT zi1T · · · zikT
(k × T ) × (T × 1) × (1 × T ) × (T × k) = (k × k)
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Inférence avec données de panel
Inférence robuste : White
X 0 0
Détail : Zi ei ei Zi
i
2
z ··· zi1T ei1 ··· ei1 eiT zi11 ··· zik1
X i11
. .. .. .. .. ..
.. .. ..
= . . . . . . .
i 2
zik1 ··· zikT sym ··· eiT zi1T ··· zikT
P P
ei1 · · · eiT t zi1t eit
t zi1t eit zi11 · · · zik1
X .. .. .. .. .. ..
= . . . . . .
i
P P
ei1 t zikt eit · · · eiT t zikt eit zi1T · · · zikT
P P P P
t zi1t eit t zi1t eit · · · t zikt eit t zi1t eit
X .. .. ..
= . . .P
i
P
sym ··· t zikt eit t zikt eit
On voit comment on se rapproche d’une matrice de var-cov
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Inférence avec données de panel
Inférence robuste : White
Sommaire
Rappel
I Le fichier de données est en ligne sur le site du cours
I Données de 1988 à 2015
I États de l’Amazone légale (un état n’a pas 1988)
I 9 états du bassin brézilien de l’Amazone
I Modèle CKE
vcovHC
vcovHC(x,
I x : objet de class "plm" (résultat d’une estimation EA ou
within), ou class "pgmm" ou class "pcce"
method = c("arellano", "white1", "white2"),
I white1 : hétérocédasticité de tout type, pas d’autocorrélation
I white2 : même variance au sein d’un groupe i
I arellano : structure générale hétérocédasticité comme white 1
et autocorrélation à l’intérieur d’un groupe
I Entre groupes, pas de corrélation
type = c("HC0", "sss", "HC1", "HC2", "HC3", "HC4"),
I diverses corrections pour la taille d’échantillon entre autres
cluster = c("group", "time"), ...)
I normalement le cluster est sur “group”
I Si on prend “time”, on groupe par t au lieu que par i
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Inférence avec données de panel
Application White
vcovHC estimée
Sommaire
I Hyp. Bootstrap :
I Si on pouvait ré-échantillonner la pop. dans les mêmes
conditions, on obtiendrait un échantillon semblable à celui
qu’on a déjà
I “Principe de médiocrité”
I Pas la même chose que représentativité
I Principe (et 2nde hyp.)
I Échantillonner l’échantillon de taille n avec remplacement
I soit n tirages, chaque i a une probabilité 1/n de sortir
I S’appelle “Bootstrap par paire” car y et X sont tirés
I On obtient un échantillon Bootstrap (de taille n)
I Hyp. : semblable à ce qu’on aurait obtenu en
ré-échantillonnant la pop.
I Répliquer ce processus B fois
I B pseudo-échantillons différents
I Pour chaque pseudo-échantillon < Yb , Xb >
I un vecteur θ̂b
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Inférence avec données de panel
Inférence robuste : Bootstrap
Rappel : le Bootstrap
I Pour construire un intervale de confiance pour un élément θk
de θ
I On a B estimations θ̂kb p.e. B = 10 000
I Ordonner ces estimations de la plus petite à la plus grande
I Alors l’intervale de confiance à 95% est délimité par
I l’estimation numéro 250, borne inférieure
I l’estimation numéro 9750, borne supérieure
Pourquoi est-ce intéressant ?
1. Pas d’hypothèse sur la distribution des erreurs
1.1 Mais il ne peut y avoir de corrélation entre observations
1.2 Dès lors, en panels, on ré-échantillonne seulement sur i, en
utilisant toutes les T périodes de chaque i sélectionné
2. On peut calculer des intervales de confiance
2.1 pour toute fonction des paramètres estimés, y-compris
non-linéaire
2.2 pour des paramètres estimés de modèles sans propriétés
d’échantillons finis connues
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Inférence avec données de panel
Inférence robuste : Bootstrap
où θ̂¯ = B −1 b θ̂b
P
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Inférence avec données de panel
Inférence robuste : Bootstrap
Sommaire
Rappel
I Le fichier de données est en ligne sur le site du cours
I Données de 1988 à 2015
I États de l’Amazone légale (un état n’a pas 1988)
I 9 états du bassin brézilien de l’Amazone
I Modèle CKE
Bootstrap
Boucle for de 1 à R
Boucle for de 1 à R
I for(i in 1 :R) {
I a <- myfunc(ama3$Etat, ama3)
I # A chaque i on relance le bootstrap & les estimations
I a$E <- rep(1 :9, each = 27)
I On ne peut pas utiliser directement “Etat” dans un call plm
car il y a des doublons par construction
I c <-
cbind(c,coef(plm(Defor_km2~PIBh2010R+I(PIBh2010R^2),
data=a, index = c("E","Year"), model = "within")))
I # crée une matrice avec tous les 1º coefs sur la 1º ligne, tous
les 2º sur la seconde et ainsi de suite pour l’ensemble des coef
du modele (ici 2)
I }
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Inférence avec données de panel
Application Bootstrap
I colMeans(t(c))
I # moyenne sur chaque coef
I sqrt(apply(t(c), MARGIN = 2, var))
I # écarts-types par coef
I apply : appliquer la fonction “var” sur la matrice t(c) par
colonne (MARGIN=2)
I apply(t(c), MARGIN = 2, quantile, probs=c(.025, .975))
I # 95% CI over coef value
I Conclusion
I le bootstrap ne conclut pas à autant de significativité que la
procédure robuste White (option )
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Inférence avec données de panel
Application Bootstrap
En résumé
Sommaire
Les données de panel
Autres tests
Annexes
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Éléments du choix hors tests
Sommaire
Causalité
I Le modèle EF peut établir la causalité avec moins d’hyp.
que pour
I des données de coupe transversale
I le MRL ou les EA
I Dans quelques cas, la causalité est claire, donc EA est
approprié
I p.e. dans une expérience contrôlée, la causalité est claire, il
s’agit plus de mesurer sa force
I des rendements de culture causés par 6= quantités d’engrais,
en labo
I dans ce cas, le traitement xit est alloué aléatoirement, donc
non-corrélé à αi
I Parfois, on ne veut mesurer que la corrélation, pas la
“causation”
I p.e. pour de la prédiction (data mining)
I EA est alors suffisant
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Éléments du choix hors tests
Causalité
I Les économistes sont inhabituels
I ils préfèrent une approche EF car ils veulent mesurer la
causalité
I avec des données observationnelles
I plutôt qu’expérimentales
I Dans ce cas, utiliser EA ou MCO n’aboutit qu’à une corrélation
spurieuse souvent due à une hétérogénéité inobservée
I “facteurs confondants” : variables non-incluses corrélées avec
régresseurs
I EF élimine l’hétérogénéité inobservée
I due aux variables inobservées invariantes dans le temps
I (mais pas due à l’hét. inobs. variable dans le temps)
I L’effet causal de x sur y est mesuré par la corrélation entre des
changements individuels dans y et dans x
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Éléments du choix hors tests
Échantillon
Sommaire
I Principe
I Soit 2 estimateurs θ̂ et θ̃
0
I dans le même modèle ỹit = w̃it θ + ũit
I S’ils sont tous 2 consistants
I alors leur différence θ̂ − θ̃ ne devrait pas être
statistiquement 6= 0, asymptotiquement
I On teste H0 : plim θ̂ − θ̃ = 0 , Ha : plim θ̂ − θ̃ 6= 0
I Sous H0 , la différence entre ces 2 estimateurs converge à une
normale d’espérance zéro
√
I N θ̂ − θ̃ → N [0, VH ]
I VH est la matrice de var-cov de la distribution limite
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Test de Hausman
B 0
δ̂b − δ̂¯ δ̂b − δ̂¯
h\ i
1
X
I avec Vboot ˜βEA − ˆβW = B−1
b=1
I b est la b ème de B replications bootstrap et δ̂ = ˜βEA − ˆβW
I Cette stat de test peut
I être appliquée à des sous-vecteurs de β
I utiliser d’autres estimateurs tels que β̃MCO à la place de β̃EA et
β̂D1 à la place de β̂W
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Effets Fixes vs. Effets Aléatoires
Test de Hausman
I plm fournit une version basée sur une méthode plus moderne
de calculer H
I form <- Defor_km2~PIBh2010R+PIBSQR
I phtest(form, data=ama3)
I exactement le même que la version de base
I phtest(form, data=ama3, method = "aux")
I method = "aux" est la méthode + moderne
I p-val passe à presque 19%
I phtest(form, data = ama3, method = "aux", vcov = vcovHC)
Hausman : Conclusion
Sommaire
Les données de panel
Autres tests
Annexes
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Autres tests
Test de “poolability”
pooltest
Tests d’autocorrélation
Protocole pratique
1. Estimateurs pour EF
1.1 Within
1.2 Différences premières
I S’il y a des différences notables entre ces deux estimateurs, il
y a probablement des racines unitaires
I Section sur dynamique, différences premières est plus
probablement correct
2. Estimateur EA
I Hausman
I En principe, ça s’arrête là et on interprête
I En économie, si on préfère un modèle sans EF, il faut le
justifier en passant un test de Hausman
3. (optionel) Estimateurs pour MRL
I Si Hausman & la théorie rejette EF
I Si on a de bonnes raisons de soupçonner qu’il pourrait ne pas
y avoir d’EA
I Alors, test d’effets individuels / poolability
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Autres tests
Protocole pratique
Sommaire
Les données de panel
Autres tests
Annexes
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Données de panel non-cylindré
Attrition
Consistance
0
I yit = αi + xit β + it
I Soit dit = 1 si i observé au temps t, = 0 sinon
I alors T devient Ti
I Within est consistant si l’hyp d’exogénéité forte devient
Consistance
Cylindrage (Balancing)
I Opération consistant à convertir un panel non-cylindré en
cylindré
I En excluant de l’échantillon tous les individus dont les données
ne sont pas disponibles tous les ans
I Ou en rejetant les années pour lesquelles tous les individus ne
sont pas observés
I En général, cela réduit beaucoup l’efficience
I D’un autre côté, dans la pratique,
I Il arrive que seules certaines variables ne sont pas observées
tous les ans
I p.e. les questions sur le revenu
I Plutôt que de cylindrer le panel à cause de ça, des méthodes
d’imputation de données sont souvent préférables
I Package mice (on verra en M2 CEE)
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Données de panel non-cylindré
Conclusions
I Un panel permet de
I traiter l’hétérogénéité inobservée constante dans le temps
I et donc établir la causation plus facilement
I Il existe plusieurs modèles linéaires non-dynamiques en panel
I selon les hyp. sur les αi
I Et plusieurs estimateurs
I Tous basés sur MC
I On souligne EF, EA et D1
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Données de panel non-cylindré
Conclusions
I Hétéroscédasticité & autocorrélation sont normalement
présentes ensemble
I Souvent on ne va pas traiter
I Mais utiliser une version robuste du calcul des et
I White ou bootstrap
I Les estimateurs EF et D1 sont toujours consistants dans ce
contexte
I Mais ne peuvent prédire ou estimer les coef. des régresseurs
constants dans le temps
I Ce que peut EA
I qui de + est + efficient
I Mais repose sur une absence de corrélation en αi et xi
I Le choix entre EF et EA peut être justifié par un test de
Hausman
I Dont le calcul a fréquemment recours à bootstrap
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Annexes
Sommaire
Les données de panel
Autres tests
Annexes
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques
Annexes
Compacter la notation
N
" #−1
~ i0 W
~i ~ i0 ~
X X
θ̂MCO =θ+ W W ui
i=1 i