Cours Econometrie Des Panel

Rappels d’économétrie
Panels : les effets linéaires non observés

Traitement de la variance
Au-delà...
Économétrie des panels
Patrick Sillard
janvier 2007
Sillard Économétrie des panels

Au-delà...
Plan
1 Rappels d’économétrie
La solution des moindres carrés ordinaires (mco)
Rappels de probabilités
Retour sur la solution des mco
L’endogénéité
2 Panels : les effets linéaires non observés
3 Traitement de la variance
4 Au-delà...

Au-delà...
Introduction
Définition
On appelle panel la donnée de p + 1 caractéristiques zit relatives à
un individu i à une date t. On dispose de cette information pour N
individus (i ∈ {1, . . . , N}) et T instants différents
(t ∈ {1, . . . , T }). zit est un vecteur ligne à p + 1 composantes.
Les résultats de l’économétrie ne valent que si l’une des dimensions

(T ou N) au moins est très grande.
Si N : économétrie des données de panels
Si T : économétrie des séries temporelles

Au-delà...
Exemples de panels
Une enquête qui ne suivrait pas des individus d’une date à l’autre
ne permettrait pas de construire un panel, au sens économétrique.
enquête emploi de l’INSEE
enquêtes annuelles d’entreprise
utilisation de données administratives

Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité
Plan
4 Au-delà...

Économétrie classique
Différence avec l’approche panel

Il n’y a pas de dimension temporelle dans l’approche classique de
l’économétrie. On observe donc les caractéristiques de N individus,
en coupe, c’est-à-dire à un instant donné. On omet donc l’indice
de temps dans les écritures.

Rappels et notations
On dispose de p + 1 caractéristiques d’individus regroupées dans
un vecteur ligne (de dimension p + 1) zi pour i ∈ {1, . . . , N}. On
veut étudier la dépendance de l’une de ces caractéristiques, notée
yi aux autres, notées xi (zi = (yi |xi )). On suppose que
yi = xi β + εi
où εi est un aléa et β un vecteur colonne de p paramètres
inconnus.
On ”empile” les observations. On obtient un système matriciel
(appelé système des équations d’observations) :
     
y1 x1 ε1
 ..   ..   .. 
 .  =  . β +  . 
yN xN εN
| {z } | {z } | {z }
Y X
Solution des moindres carrés (1)

On veut trouver β solution de l’équation
Y = Xβ +
Il n’y a pas de solution car en général Y ∈
/ Im(X ). On cherche
donc β qui minimise l’écart entre les observations (Y ) et le modèle
explicatif (X β).
L’écart précédent s’entend au sens de la norme euclidienne. On
définit donc la fonction à minimiser en β par :
ϕ(β) = kY − X βk2
On note que
ϕ(β) = (Y − X β)0 .(Y − X β)
et aussi
N
X
ϕ(β) = 0 = ε2i
i=1
La solution des moindres carrés β̂ est le vecteur en lequel ϕ est

minimale, ou encore en lequel la somme des carrés des résidus est
minimale.
On montre (voir calcul transparent suivant) que le point β̂ en

lequel ϕ est minimale est solution de l’équation normale
X 0 X β̂ = X 0 Y


Calcul (pour information) : Au point où ϕ(β) est minimale, les
conditions du premier ordre sont vérifiées. La différentielle totale de
ϕ est donc uniformément nulle : dϕ(β) = 0
dϕ(β) = ϕ0 (β)dβ
= d {(Y 0
0 − X β)0 .(Y − X β)}
= d Y Y − β X 0 Y − Y 0 X β + β0 X 0 X β

Or tous les termes de la somme précédente sont des réels, donc ils
sont égaux à leur transposée. Par ailleurs, le seul élément
différentiel est β, donc dY 0 Y = 0 et
dϕ(β) = 2dβ 0 −X 0 Y + X 0 X β

La différentielle précédent est uniformément nulle pour tout dβ,

donc il est nécessaire que
X 0 X β̂ = X 0 Y
au point β̂ où ϕ est minimale.

Interprétation graphique

RN Y ˆ

?
*

...............
...
..

X β̂
...............
ImX .........
...
..

Convergence en probabilité
Définition
Convergence en probabilité : Soit (xn )n∈Z une suite de variables
aléatoires. On dit que xn converge en probabilité vers une variable
x lorsque
∀α > 0 , lim P(|xn − x| > α) = 0
n→∞
On note plimn→∞ xn = x.
Propriété
Inégalité de Markov : Soit x une variable aléatoire telle que pour
r ∈ N∗ , E(|x|r ) existe. Alors
E(|x|r )
∀α > 0 , P(|x| > α) 6
αr
Application : la convergence en moyenne quadratique
Soit (xn )n∈N une suite de variables aléatoires iid telle que ∀n,
E(xn ) = µ et E[(xn − µ)2 ] = σ 2 . Alors on peut définir la moyenne
empirique :
n
1X
µn = xn
n
i=1
On vérifie que

E(µn ) = µ
σ2
E[(µn − µ)2 ] = var(µn ) = n

L’inégalité de Markov appliquée à µn − µ pour r = 2 conduit à :
σ2
∀α > 0 , P(|µn − µ| > α) 6
nα2
Finalement, plimn→∞ µn = µ.
De même : si (xn ) est une suite de vecteurs aléatoires iid tels que
E(xn ) = x et var(xn ) = Σ < ∞, alors
n
1X 0
plim xi xi = E(x0i xi ) = x0 x
n→∞ n
i=1

Convergence en loi : loi faible des grands nombres
Propriété
Soit (xn )n∈N une suite de vecteurs aléatoires iid telle que ∀n,
E(xn ) = µ et var(xn ) = Σ. Alors la moyenne empirique µn définie
1 Pn
par µn = n i=1 xn est telle que
√
n(µn − µ) N (0, Σ)
Cette dernière propriété indique que, lorsque n est grand (mais

fini), µn est une variable dont la loi de probabilité correspond
approximativement à une loi normale : N (µ, n1 Σ).

Une nouvelle interprétation de la solution des moindres

carrés ordinaires
Soit un système d’équations d’observations

     
y1 x1 ε1
 ..   ..   .. 
 .  =  . β +  . 
yN xN εN
| {z } | {z } | {z }
Y X
L’estimateur des moindres carrés de β, noté β̂ N est la solution du
système matriciel
X 0 X β̂ N = X 0 Y

En développant. . . (1)
Or
N
X N
X
0
XX = x0i xi 0
et X Y = x0i yi
i=1 i=1
Il s’ensuit :
N N
! !
0 0 1 X 0 1 X 0
X X β̂ N = X Y ⇔ xi xi β̂ N = xi y i
N N
i=1 i=1
Puis,
N

1 X 0
= E(x0i xi )


 p lim
 N→∞ N
 xi xi
i=1
N
 1 X 0
= E(x0i yi )


 p lim
 N→∞ N xi y i
i=1

Par continuité on a :
−1
plim β̂ N = E(x0i xi ) E(x0i yi )

Enfin, comme yi = xi β + εi , on en déduit :

−1
plim β̂ N = E(x0i xi ) E(x0i xi )β + E(x0i εi )


Et par suite (on note désormais β̂ ≡ plim β̂ N )
−1
β̂ = β + E(x0i xi ) E(x0i εi )

| {z }
biais éventuel
L’estimateur des moindres carrés β̂ est biaisé (asymptotiquement)

lorsque E(x0i εi ) 6= 0.
1 Si x0 et ε sont indépendantes, alors E(x0 ε ) = E(x0 )E(ε ).
i i i i i i
Dans ce cas, si E(εi ) = 0 alors β̂ n’est pas biaisé.
2 Si x et ε ne sont pas indépendantes, alors β̂ est biaisé,
i i
même lorsque E(εi ) = 0.
Propriété
Si E(x0i εi ) 6= 0, β̂ est biaisé. Il y a endogénéité : les variables xi
sont déterminées simultanément à l’aléa εi .
Espérance conditionnelle
On considère l’équation d’observation
yi = xi β + εi
et β̂ l’estimateur des mco. Une CNS pour que β̂ soit sans biais est E(xi εi ) = 0.
Il est pratique de remplacer cette hypothèse par E(εi |xi ) = 0.
Propriété
E(εi |xi ) = 0 ⇒ E(εi xi ) = 0
Démonstration (pour information)

Supposons E(εi |xi ) = 0. Calculons
 
E(εi xi ) = E [E (εi xi |xi )] = E E (εi |xi ) xi  = 0

 
| {z }
0

Propriétés à distance infinie

On considère β̂ N solution des mco associé à l’équation
d’observation (1 6 i 6 N)
yi = xi β + εi
On suppose E(εi |xi ) = 0. On suppose aussi E(ε2i |xi ) = σ 2 .

Propriété
Sous les hypothèses précédentes, la variance de β̂N vaut
−1
plim varβ̂ N = σ 2 E(x0i xi )

Remarque
(plim varβ̂ N ) est la variance de β̂ (avec la notation plim β̂ N = β̂).

Convergence en loi (pour information)

On suppose que (1) : E(εi |xi ) = 0 et (2) : E(ε2i |xi ) = σ 2 .
On a !−1 !
N N
1 X 0 1 X 0
β̂ N = β + xi xi xi εi
N i=1 N i=1
Le théorème central-limite nous donne
N
!
√ 1 X 0 loi
N x i εi −→ N (0, B)
N i=1
où B = E(ε2i x0i xi ). [Remarque : la moyenne est nulle en vertu de l’hypothèse (1).]
A l’aide
de (2), E(ε2i x0i xi ) = E(ε2i )E(x0i xi ) = σ 2 E(x0i xi ). Et comme
PN 0
plim N i=1 xi xi = E(x0i xi ), alors
1
√ loi −1 −1
N(β̂ N − β) −→ N (0, σ 2 E(x0i xi ) .E(x0i xi ). E(x0i xi )

)
| {z }
{E(x0i xi )}−1

Validation d’un calcul par moindres carrés

Soit (yi )i∈{1,...,n} , ȳ la moyenne empirique des yi et ŷi la valeur de
yi prédite par un modèle linéaire du type

 y i = x i β + εi
ŷ = xi β̂
 i
ε̂i = yi − ŷi
alors on a :
n
X n
X n
X
(yi − ȳ )2 = (ŷi − ȳ )2 + (ε̂i )2
|i=1 {z } |i=1 {z } |i=1{z }
variance expliquée résiduelle
Pn
2 (ε̂i )2
R = 1 − Pn i=1 2
i=1 (yi − ȳ )

Les tests
On considère β̂ solution des mco associé à l’équation d’observation
yi = xi β + εi
On test l’hypothèse nulle H0 : F (β) = 0.

test de Student : F = (0, . . . , 0, 1, 0, . . . 0) avec Fk = 1. Alors
ˆ
β
sous H0 , q k ˆ T (n − p)
ˆ βk
var
test du rapport de vraisemblance : pour tester une restriction
sur une partie de β, on calcule la log-vraisemblance LNC du
P et L du modèle contraint. Dans le cas
modèle non contraint
des mco, L = − 21 ε̂2i et la statistique de test vaut
LR = 2(LNC − L). Sous H0 , LR χ2 (nc) où nc est le
nombre de contraintes.
Les statistiques de test

Lecture : valeur du fractile α tel que P(|X | > α) = p
loi normale
p 1% 5% 10%
α 2.58 1.96 1.64
loi du χ2
p 1% 5% 10%
α 1 6.63 3.84 2.71
2 9.21 5.99 4.61
3 11.34 7.81 6.25
4 13.28 9.49 7.78
5 15.09 11.07 9.24
6 16.81 12.59 10.64
7 18.48 14.07 12.02
8 20.09 15.51 13.36
9 21.67 16.92 14.68
10 23.21 18.31 15.99
.
.
.
20 37.57 31.41 28.41
.
.
.
30 50.89 43.77 40.26

L’endogénéité (1)
ATTENTION
C’est le principal problème auquel on doit faire face dans les
travaux d’estimation économétriques en sciences sociales :
dés que les variables explicatives sont corrélées au terme d’erreur,
alors l’estimateur des mco est biaisé.

L’endogénéité par variable omise

Exemple : équation de salaire avec variable omise
On veut expliquer le salaire yi d’individus 1 6 i 6 N à partir de leurs
caractéristiques observables (diplôme, âge, sexe, CSP des parents). On
note xi ces caractéristiques. On postule donc un modèle de la forme
yi = c + xi β + εi
On sait aussi qu’une part de salaire est due à une aptitude personnelle ηi
inobservable. Donc l’erreur du modèle est donc de la forme εi = ηi + νi .
Mais cette aptitude personnelle a sûrement joué dans le niveau du
diplôme obtenu. Donc E(ηi |xi ) 6= 0 et l’estimateur des mco est biaisé.
Il est possible de déterminer le sens du biais. Soit di le diplôme. On a

ηi = αdi + ξi avec α > 0. Alors yi = c + (βd + α)di + x̃i β̃ + ξi + νi et
donc le coefficient estimé, pour le diplôme, vaut (βd + α) au lieu de βd .
Si βd > 0, alors l’effet du diplôme est surévalué.
L’endogénéité par équation simultanée (1)

Exemple : équation de prix
On suppose qu’on observe les prix (pi? ) et les quantités d’équilibre
(yi? ) sur un marché quelconque. Supposons que l’on cherche à
modéliser une fonction de demande. On régresse les quantités sur
les prix :
yi? = a + bpi? + ξi
En réalité, prix et quantités sont solution d’équations simultanées :
d
yi = c d + αpi + εdi
yio = c o + γpi + εoi
avec α < 0 et γ > 0. Il est raisonnable de penser dans ces écritures

que E(εdi |pi ) = 0 et E(εoi |pi ) = 0. Pourtant, pi? est endogène dans
l’équation de demande.
L’endogénéité par équation simultanée (2)

En effet, à l’équilibre, c d + αpi? + εdi = c o + γpi? + εoi , donc
pi? = (c d + εdi − c o − εoi )/(γ − α). Par hypothèse, l’équation de
demande est de la forme
yid = c d + αpi + εdi
dont la contrepartie empirique est l’équation de régression
yi? = c d + αpi? + εdi

σ2
Et par construction, E(εdi pi? ) = γ−α
εd
. Cette quantité est positive,
ce qui entraı̂ne un biais positif sur le coefficient de dépendance de
la demande aux prix (qui lui, devrait être négatif). On peut donc,
dans les cas extrêmes, se retrouver avec une dépendance positive
de la demande aux prix si on néglige le biais de simultanéité.
Résolution
Par la méthode des variables instrumentales (voir cours

d’économétrie classique)
Par l’approche panel qui enlève une grosse partie des
problèmes

Au-delà...
Plan
4 Au-delà...

Au-delà...
Principes
On considère un panel d’individus i ∈ {1, . . . , N} observés à T

instants différents t ∈ {1, . . . , T }.
yit = c + xit β + ai + εit

| {z }
ηit
ai est un effet individuel inobservé. C’est une variable aléatoire

dans le cas général.

Au-delà...
Quelques idées préalables
Si E(ηit |xit ) = 0 ; dans ce cas, l’estimateur β̂ obtenu par mco

est convergent. On peut l’améliorer en estimant un paramètre
ai associé à une indicatrice :
N
X
ŷit = ĉ + xit β̂ + âj .1{i==j}
j=1
En pratique on a plutôt E(εit |xit ) = 0, mais pas E(ηit |xit ) = 0.

Or E(ηit |xit ) = E(ai |xit ) + E(εit |xit ). Donc pour qu’un
estimateur des mco soit convergent dans ce contexte, il faut
que E(ai |xit ) = 0. Ce n’est pas le cas en général.

Au-delà...
Exemple
Un panel d’individus {1, . . . , N} × {1, . . . , T } dont on observe le

salaire yit , le diplôme di , l’age ait , la csp des parents csi . On veut
calculer une équation de salaire :
ŷit = ĉ + α̂d .di + α̂cs .csi + α̂age .ageit
L’individu a des capacités propres qui lui ont permis d’obtenir un

diplôme donné, mais qui jouent aussi sur son niveau de salaire
contemporain. Donc l’équation théorique est :
yit = c + αd .di + αcs .csi + αage .ageit + ai + εit

| {z }
ηit
Par hypothèse, E(ai |di ) 6= 0, donc l’estimateur des mco est biaisé.

Au-delà...
Au-delà. . . l’exogénéité stricte


| {z }
ηit
Un des clés d’identification des coefficients en panel est

l’exogénéité des εit . On opère une transformation sur les yit et xit
pour se débarrasser des ai . Mais dans ce cas, on se retrouve à mêler
des xit 0 et des εit avec t 6= t 0 . Il faut donc une hypothèse du type :
E(yit |xi1 , . . . , xiT , ai ) = E(yit |xit , ai )
pour identifier. Cette dernière est appelée exogénéité stricte.

Au-delà...
Exogénéité forte et faible


| {z }
ηit
exogénéité forte :
E(yit |xi1 , . . . , xiT , ai ) = E(yit |xit , ai )
exogénéité faible :
E(yit |xi1 , . . . , xiT , ai ) = E(yit |xit , xi(t+1) , . . . , xiT , ai )

Au-delà...
Les transformations possibles


| {z }
ηit
Pour ôter l’effet ai , on peut procéder par transformation de

l’équation d’observation
Estimateur à effet fixe
Estimateur à effet individuel aléatoire
Estimateur en différence première
On peut aussi l’identifier en l’estimant (estimateur à effet aléatoire
ou à effet fixe estimé) mais l’estimateur résultant n’est pas
nécessairement sans biais.
Au-delà...
L’estimateur poolé
Le modèle
| {z }
ηit
L’estimateur poolé est celui issu de la régression :
ŷit = ĉ + xit β̂
Cet estimateur est convergent lorsque E (ηit |xit ) = 0, ou encore
E(ai |xit ) = 0

Au-delà...
L’estimateur à effet fixe

Le modèle
| {z }
ηit
1 PT
On définit ȳi• = T τ =1 yiτ et x̄i• de manière cohérente. On a
ȳi• = c + x̄i• β + ai + ε̄i•
Donc par différence
yit − ȳi• = (xit − x̄i• )β + (εit − ε̄i• )
| {z }
νit
L’estimateur des mco de β est convergent lorsque

E(νit |(xit − x̄i• )) = 0
C’est vrai en cas d’exogénéité stricte.
Au-delà...
L’estimateur à effet fixe
Le modèle

| {z }
ηit
On montre que l’estimateur à effet fixe coı̈ncide avec la solution de la

regression par mco
N
X
ŷi = ĉ + xit β̂ + âj .1(j==i)
j=1
dans laquelle aj est traité comme un paramètre inconnu.
Problème
Le degré de liberté : quand N est grand devant T , il y a trop de paramètres
inconnus pour le nombre d’observations.
N (paramètres) = N × T , N (inconnues) = N + dim(xit ) + 1

Au-delà...
Variantes de l’estimateur à effet fixe et terminologie

Le modèle
| {z }
ηit
Estimateur ”Between” : β̂ B est l’estimateur des mco de la

regression
ȳˆi• = x̄i• β B
Cet estimateur n’est pas convergent en général.
Estimateur ”Within” : β̂ W est l’estimateur des mco de la
regression
(yit\
− ȳi• ) = (xit − x̄i• )β̂ W
Cet estimateur est convergent en cas d’exogénéité stricte.
Au-delà...
L’estimateur à effet individuel aléatoire
Le modèle

| {z }
ηit
On suppose que ai N (0, σa2 ) et que εit N (0, σ 2 ). Il est alors possible
d’exprimer la vraisemblance de l’échantillon. La densité de (yit |ai ) vaut :

yit − c − xit β − ai
f (yit |ai , xit ) = ϕ
σ2
et donc, par la formule de Bayes :

Z ∞
a
f (yi1 , . . . , yiT |xi1 , . . . , xiT ) = f (yi1 |xi1 , a)×. . .×f (yiT |xiT , a)ϕ da
−∞ σ a
On calcule alors β par maximum de vraisemblance.

Au-delà...
L’estimateur en différences
Le modèle
| {z }
ηit
On définit ∆ȳit = yit − yi(t−1) et ∆xit de manière cohérente. On a
∆yit = ∆xit β + ∆εit

|{z}
vit
L’estimateur des mco de β est convergent lorsque
E(vit |∆xit ) = 0
C’est vrai en cas d’exogénéité faible.

Au-delà...
Quel estimateur choisir ?
L’estimateur en différence s’appuie a priori sur moins d’hypothèses.

En pratique, il est utile de pratiquer plusieurs type d’estimation (en
niveau, en différence, à effet fixe), car si endogénéité il y a, elle ne
se traduit pas par le même effet sur l’estimateur obtenu. Ainsi, les
différences entre les divers estimateurs est interprétable et permet
généralement de préciser la forme de l’endogénéité.

Au-delà...
Plan
4 Au-delà...

Au-delà...
Hétéroscédasticité
On reprend l’équation de base :
yit = c + dt + xit β + ai + εit
L’hétéroscédasticité correspond à la situation dans laquelle

E(εit εi(t−1) ) = 0 et E(ε2it ) = σ 2 (i, t). Le cas le plus fréquent est
E(ε2it ) = σi2 . L’estimateur par différence :
dit = d̂ + xit β̂
∆y
donne sous les conditions d’exogénéité faible un estimateur

convergent de β. Donc ν̂it = ∆yit − (d̂ + ∆xit β̂) est un estimateur
de νit = εit − εi(t−1) .

Au-delà...
Hétéroscédasticité (2)
1
σ̂i2 =
P 2
ν est un estimateur convergent de σi2 . Finalement, si on
t it 
ni
.. .. ..
 
 .   . .  2
∆yit , Z =  1 ∆xit  et Σ̂ = diag(. . . , σ̂i , . . .), alors
note z =    
.. .. ..
. . .
0 0

d̂ β̂ = (Z 0 Σ̂−1 Z )−1 Z 0 Σ̂−1 z

d̂
est un estimateur sans biais de et dont la variance vaut
β̂

d̂
var = (Z 0 Σ̂−1 Z )−1
β̂

Au-delà...
Problème...
Il faut noter qu’on estime σi2 par une somme sur ni termes,
c’est-à-dire le nombre d’observations de ∆yit dont on dispose pour
l’individu i. Ce nombre peut être très faible dans le cas de panel,
donc les propriétés de convergence asymptotique des estimateurs
ne s’appliquent pas.
On peut aussi utiliser la même méthode (estimateur de White)
pour une hétéroscédasticité dans le temps (identique pour chaque
individu, mais variable sur t). C’est la méthode de la rgéressions
SUR (Seemingly unrelated regressions).

Au-delà...
Plan
4 Au-delà...

Au-delà...
Panels dynamiques (1)

C’est un panel dans apparaı̂t la variable dépendante retardée dans
les explicatives. On reprend l’équation de base :
yit = c + dt + αyi(t−1) + xit β + ai + εit
En différenciant, on a
∆yit = d + α∆yi(t−1) + ∆xit .β + νit
avec νit = ∆εit . On travaille désormais sur le panel différencié. On
suppose que (exogénéité forte) :

0 E(εit εit 0 ) = 0 (i)
∀(t, t ) ,
E(xit εit 0 ) = 0 (ii)
Par contre,
E(∆yi(t−1) νit ) 6= 0
Au-delà...
En effet, par hypothèses
∆yi(t−1) = d + α∆yi(t−2) + ∆xi(t−1) β + εi(t−1) − εi(t−2)
εi(t−1) apparaı̂t explicitement dans l’expression de ∆yi(t−1) ,

variable explicative, et dans l’expression du terme d’erreur de
l’équation de définition de ∆yit .
Donc le régresseur ∆yi(t−1) est endogène dans l’équation de
régression de l’expliquée ∆yit .

Au-delà...
On pourrait imaginer d’instrumenter la variable ∆yi(t−1) par la

variable yi(t−2) ou par ∆yi(t−2) . Mais cela ne fonctionne pas car
pour la même raison, yi(t−2) ou ∆yi(t−2) sont endogènes dans la
régression (ici auxiliaire) de ∆yi(t−1) sur l’une de ces deux
variables (puisque la modélisation initiale reste valable). Il faut
donc procéder autrement.
Seule solution : la méthode des moments généralisés (Arellano et

al).

Au-delà...
Panels dynamiques (4) : les GMM
On définit le mk -moment empirique de type d’un échantillon

d’observations (y1 , . . . , yN ) par
1
m̄k = mk (yi )
N
mk est une fonction continue. Par exemple, le moment d’ordre 2
est tel que m2 (y ) = y 2 . Par la loi des grands nombres, on a
plim m̄k = µk (θ)
où la forme de µk est connue et θ est un jeu de paramètres

inconnus.

Au-delà...
La méthode des moments consiste à estimer le jeu de paramètres θ

en imposant autant de condition de moments (appelés équations
de moments) que nécessaire :
m̄k − µk (θ) = 0
Si on a plus de conditions que nécessaires, on minimise un distance

entre moments empiriques et moments théoriques.
On pose explicitement les équations de moments associés aux
conditions orthogonalité retenues. Dans le cas présent, il s’agit de
l’orthogonalité des aléas εit (conditions (i)).

Au-delà...
Panel à variable dépendante binaire (1)
On suppose que la variable dépendante est une variable binaire :

1 avec P(yit = 1) = p(c + xit β + ai )
yit =
0 avec P(yit = 0) = p(c + xit β + ai )
S’il n’y a pas d’effet fixe, on utilise une régression logit ou probit.
Exemple : la régression logistique :
exp(c + xit β)
P(yit = 1) =
1 + exp(c + xit β)
c et β sont estimées par maximum de vraisemblance.

Au-delà...
Panel à variable dépendante binaire (2)
Si
exp(c + xit β + ai )
P(yit = 1) =
1 + exp(c + xit β + ai )
P
il faut utiliser une conditionnement par rapport à ni = t yit :
modèle logit à effet fixe.
Sinon, on peut traiter le problème en supposant que ai est
aléatoire et suit une distribution (ai |xi ) ,→ N (ψ, σ 2 ). On peut
alors construire la vraisemblance de (yit |xit ) (voir par exemple
Wooldridge, 2001).

Au-delà...
Quelques exemples
Évaluation de politiques publiques : article de Kiel et McClain

(1995) : conséquences de l’implantation d’un incinérateur sur
les prix de l’immobilier à North Andover (Massachusetts).
Relation entre criminalité et chômage aux États-Unis
Relation entre taux communal de taxe professionnelle et base
communale imposable sur 1998-2005
Ressources numériques du cours

site internet : http ://monsite.orange.fr/quelquestats, lien
panels
les données sont sous le lien panels/donnees

Au-delà...
Références
Sur l’économétrie en général (avec des chapitres sur les panels) :

Green W. (2005) : Économétrie, Person education [en
version française ; version originale en anglais, a priori meilleure.]
Wooldridge J. M., (2005) : Introductory econometrics : a
modern approach, Thomson, 3rd edition.
Plus spécifiquement sur les panels :
Sevestre P. (2002) : Econométrie des données de panel,
Dunod.
Baltagi B. (2005) : Econometric analysis of panel data, John
Wiley and Sons, 3rd edition.
Wooldridge J. M. (2002) : Econometric analysis of cross
section and panel data, The MIT press.

Cours Econometrie Des Panel

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Cours Econometrie Des Panel

Transféré par

Droits d'auteur :

Formats disponibles

Rappels d’économétrie

Panels : les effets linéaires non observés

Économétrie des panels

Sillard Économétrie des panels

2 Panels : les effets linéaires non observés

Sillard Économétrie des panels

Les résultats de l’économétrie ne valent que si l’une des dimensions

Sillard Économétrie des panels

Sillard Économétrie des panels

2 Panels : les effets linéaires non observés

Sillard Économétrie des panels

Différence avec l’approche panel

Sillard Économétrie des panels

Solution des moindres carrés (1)

Solution des moindres carrés (2)

La solution des moindres carrés β̂ est le vecteur en lequel ϕ est

On montre (voir calcul transparent suivant) que le point β̂ en

Sillard Économétrie des panels

Solution des moindres carrés (3)

La différentielle précédent est uniformément nulle pour tout dβ,

Solution des moindres carrés (4)

Sillard Économétrie des panels

Application : la convergence en moyenne quadratique

Sillard Économétrie des panels

L’inégalité de Markov appliquée à µn − µ pour r = 2 conduit à :

Sillard Économétrie des panels

Convergence en loi : loi faible des grands nombres

Cette dernière propriété indique que, lorsque n est grand (mais

Sillard Économétrie des panels

Une nouvelle interprétation de la solution des moindres

Soit un système d’équations d’observations

Sillard Économétrie des panels

Sillard Économétrie des panels

Enfin, comme yi = xi β + εi , on en déduit :

Sillard Économétrie des panels

L’estimateur des moindres carrés β̂ est biaisé (asymptotiquement)

E(εi |xi ) = 0 ⇒ E(εi xi ) = 0

Démonstration (pour information)

E(εi xi ) = E [E (εi xi |xi )] = E E (εi |xi ) xi  = 0

Sillard Économétrie des panels

Propriétés à distance infinie

On suppose E(εi |xi ) = 0. On suppose aussi E(ε2i |xi ) = σ 2 .

Sillard Économétrie des panels

Convergence en loi (pour information)

Sillard Économétrie des panels

Validation d’un calcul par moindres carrés

Sillard Économétrie des panels

On test l’hypothèse nulle H0 : F (β) = 0.

Les statistiques de test

Sillard Économétrie des panels

Sillard Économétrie des panels

L’endogénéité par variable omise

Il est possible de déterminer le sens du biais. Soit di le diplôme. On a

L’endogénéité par équation simultanée (1)

avec α < 0 et γ > 0. Il est raisonnable de penser dans ces écritures

L’endogénéité par équation simultanée (2)

yid = c d + αpi + εdi

dont la contrepartie empirique est l’équation de régression

yi? = c d + αpi? + εdi

Par la méthode des variables instrumentales (voir cours

Sillard Économétrie des panels

2 Panels : les effets linéaires non observés

Sillard Économétrie des panels