Vous êtes sur la page 1sur 58

Rappels d’économétrie

Panels : les effets linéaires non observés


Traitement de la variance
Au-delà...

Économétrie des panels

Patrick Sillard

janvier 2007

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Plan

1 Rappels d’économétrie
La solution des moindres carrés ordinaires (mco)
Rappels de probabilités
Retour sur la solution des mco
L’endogénéité

2 Panels : les effets linéaires non observés

3 Traitement de la variance

4 Au-delà...

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Introduction

Définition
On appelle panel la donnée de p + 1 caractéristiques zit relatives à
un individu i à une date t. On dispose de cette information pour N
individus (i ∈ {1, . . . , N}) et T instants différents
(t ∈ {1, . . . , T }). zit est un vecteur ligne à p + 1 composantes.

Les résultats de l’économétrie ne valent que si l’une des dimensions


(T ou N) au moins est très grande.
Si N  : économétrie des données de panels
Si T  : économétrie des séries temporelles

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Exemples de panels

Une enquête qui ne suivrait pas des individus d’une date à l’autre
ne permettrait pas de construire un panel, au sens économétrique.
enquête emploi de l’INSEE
enquêtes annuelles d’entreprise
utilisation de données administratives

Sillard Économétrie des panels


Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

Plan

1 Rappels d’économétrie
La solution des moindres carrés ordinaires (mco)
Rappels de probabilités
Retour sur la solution des mco
L’endogénéité

2 Panels : les effets linéaires non observés

3 Traitement de la variance

4 Au-delà...

Sillard Économétrie des panels


Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

Économétrie classique

Différence avec l’approche panel


Il n’y a pas de dimension temporelle dans l’approche classique de
l’économétrie. On observe donc les caractéristiques de N individus,
en coupe, c’est-à-dire à un instant donné. On omet donc l’indice
de temps dans les écritures.

Sillard Économétrie des panels


Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

Rappels et notations
On dispose de p + 1 caractéristiques d’individus regroupées dans
un vecteur ligne (de dimension p + 1) zi pour i ∈ {1, . . . , N}. On
veut étudier la dépendance de l’une de ces caractéristiques, notée
yi aux autres, notées xi (zi = (yi |xi )). On suppose que
yi = xi β + εi
où εi est un aléa et β un vecteur colonne de p paramètres
inconnus.
On ”empile” les observations. On obtient un système matriciel
(appelé système des équations d’observations) :
     
y1 x1 ε1
 ..   ..   .. 
 .  =  . β +  . 
yN xN εN
| {z } | {z } | {z }
Y X 
Sillard Économétrie des panels
Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

Solution des moindres carrés (1)


On veut trouver β solution de l’équation
Y = Xβ + 
Il n’y a pas de solution car en général Y ∈
/ Im(X ). On cherche
donc β qui minimise l’écart entre les observations (Y ) et le modèle
explicatif (X β).
L’écart précédent s’entend au sens de la norme euclidienne. On
définit donc la fonction à minimiser en β par :
ϕ(β) = kY − X βk2
On note que
ϕ(β) = (Y − X β)0 .(Y − X β)
et aussi
N
X
ϕ(β) = 0  = ε2i
i=1
Sillard Économétrie des panels
Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

Solution des moindres carrés (2)

La solution des moindres carrés β̂ est le vecteur en lequel ϕ est


minimale, ou encore en lequel la somme des carrés des résidus est
minimale.

On montre (voir calcul transparent suivant) que le point β̂ en


lequel ϕ est minimale est solution de l’équation normale

X 0 X β̂ = X 0 Y

Sillard Économétrie des panels


Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

Solution des moindres carrés (3)


Calcul (pour information) : Au point où ϕ(β) est minimale, les
conditions du premier ordre sont vérifiées. La différentielle totale de
ϕ est donc uniformément nulle : dϕ(β) = 0
dϕ(β) = ϕ0 (β)dβ
= d {(Y 0
 0 − X β)0 .(Y − X β)}
= d Y Y − β X 0 Y − Y 0 X β + β0 X 0 X β

Or tous les termes de la somme précédente sont des réels, donc ils
sont égaux à leur transposée. Par ailleurs, le seul élément
différentiel est β, donc dY 0 Y = 0 et
dϕ(β) = 2dβ 0 −X 0 Y + X 0 X β


La différentielle précédent est uniformément nulle pour tout dβ,


donc il est nécessaire que
X 0 X β̂ = X 0 Y
au point β̂ où ϕ est minimale.
Sillard Économétrie des panels
Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

Solution des moindres carrés (4)


Interprétation graphique






RN Y  ˆ
  
  
  
 
?
   *
 
   
...............
...
..

 X β̂ 
 ............... 
 ImX ......... 
...
 .. 

Sillard Économétrie des panels


Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

Convergence en probabilité

Définition
Convergence en probabilité : Soit (xn )n∈Z une suite de variables
aléatoires. On dit que xn converge en probabilité vers une variable
x lorsque
∀α > 0 , lim P(|xn − x| > α) = 0
n→∞

On note plimn→∞ xn = x.

Propriété
Inégalité de Markov : Soit x une variable aléatoire telle que pour
r ∈ N∗ , E(|x|r ) existe. Alors

E(|x|r )
∀α > 0 , P(|x| > α) 6
αr
Sillard Économétrie des panels
Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

Application : la convergence en moyenne quadratique

Soit (xn )n∈N une suite de variables aléatoires iid telle que ∀n,
E(xn ) = µ et E[(xn − µ)2 ] = σ 2 . Alors on peut définir la moyenne
empirique :
n
1X
µn = xn
n
i=1

On vérifie que

E(µn ) = µ
σ2
E[(µn − µ)2 ] = var(µn ) = n

Sillard Économétrie des panels


Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

L’inégalité de Markov appliquée à µn − µ pour r = 2 conduit à :

σ2
∀α > 0 , P(|µn − µ| > α) 6
nα2
Finalement, plimn→∞ µn = µ.

De même : si (xn ) est une suite de vecteurs aléatoires iid tels que
E(xn ) = x et var(xn ) = Σ < ∞, alors
n
1X 0
plim xi xi = E(x0i xi ) = x0 x
n→∞ n
i=1

Sillard Économétrie des panels


Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

Convergence en loi : loi faible des grands nombres

Propriété
Soit (xn )n∈N une suite de vecteurs aléatoires iid telle que ∀n,
E(xn ) = µ et var(xn ) = Σ. Alors la moyenne empirique µn définie
1 Pn
par µn = n i=1 xn est telle que

n(µn − µ) N (0, Σ)

Cette dernière propriété indique que, lorsque n est grand (mais


fini), µn est une variable dont la loi de probabilité correspond
approximativement à une loi normale : N (µ, n1 Σ).

Sillard Économétrie des panels


Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

Une nouvelle interprétation de la solution des moindres


carrés ordinaires

Soit un système d’équations d’observations


     
y1 x1 ε1
 ..   ..   .. 
 .  =  . β +  . 
yN xN εN
| {z } | {z } | {z }
Y X 
L’estimateur des moindres carrés de β, noté β̂ N est la solution du
système matriciel
X 0 X β̂ N = X 0 Y

Sillard Économétrie des panels


Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

En développant. . . (1)
Or
N
X N
X
0
XX = x0i xi 0
et X Y = x0i yi
i=1 i=1
Il s’ensuit :
N N
! !
0 0 1 X 0 1 X 0
X X β̂ N = X Y ⇔ xi xi β̂ N = xi y i
N N
i=1 i=1

Puis,
N

1 X 0
= E(x0i xi )


 p lim
 N→∞ N
 xi xi
i=1
N
 1 X 0
= E(x0i yi )


 p lim
 N→∞ N xi y i
i=1

Sillard Économétrie des panels


Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

En développant. . . (2)

Par continuité on a :
−1
plim β̂ N = E(x0i xi ) E(x0i yi )


Enfin, comme yi = xi β + εi , on en déduit :


−1
plim β̂ N = E(x0i xi ) E(x0i xi )β + E(x0i εi )
 

Sillard Économétrie des panels


Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

En développant. . . (3)
Et par suite (on note désormais β̂ ≡ plim β̂ N )
−1
β̂ = β + E(x0i xi ) E(x0i εi )

| {z }
biais éventuel

L’estimateur des moindres carrés β̂ est biaisé (asymptotiquement)


lorsque E(x0i εi ) 6= 0.
1 Si x0 et ε sont indépendantes, alors E(x0 ε ) = E(x0 )E(ε ).
i i i i i i
Dans ce cas, si E(εi ) = 0 alors β̂ n’est pas biaisé.
2 Si x et ε ne sont pas indépendantes, alors β̂ est biaisé,
i i
même lorsque E(εi ) = 0.
Propriété
Si E(x0i εi ) 6= 0, β̂ est biaisé. Il y a endogénéité : les variables xi
sont déterminées simultanément à l’aléa εi .
Sillard Économétrie des panels
Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

Espérance conditionnelle
On considère l’équation d’observation

yi = xi β + εi

et β̂ l’estimateur des mco. Une CNS pour que β̂ soit sans biais est E(xi εi ) = 0.
Il est pratique de remplacer cette hypothèse par E(εi |xi ) = 0.

Propriété

E(εi |xi ) = 0 ⇒ E(εi xi ) = 0

Démonstration (pour information)


Supposons E(εi |xi ) = 0. Calculons
 

E(εi xi ) = E [E (εi xi |xi )] = E E (εi |xi ) xi  = 0


 
| {z }
0

Sillard Économétrie des panels


Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

Propriétés à distance infinie


On considère β̂ N solution des mco associé à l’équation
d’observation (1 6 i 6 N)

yi = xi β + εi

On suppose E(εi |xi ) = 0. On suppose aussi E(ε2i |xi ) = σ 2 .


Propriété
Sous les hypothèses précédentes, la variance de β̂N vaut
−1
plim varβ̂ N = σ 2 E(x0i xi )


Remarque
(plim varβ̂ N ) est la variance de β̂ (avec la notation plim β̂ N = β̂).

Sillard Économétrie des panels


Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

Convergence en loi (pour information)


On suppose que (1) : E(εi |xi ) = 0 et (2) : E(ε2i |xi ) = σ 2 .
On a !−1 !
N N
1 X 0 1 X 0
β̂ N = β + xi xi xi εi
N i=1 N i=1
Le théorème central-limite nous donne
N
!
√ 1 X 0 loi
N x i εi −→ N (0, B)
N i=1

où B = E(ε2i x0i xi ). [Remarque : la moyenne est nulle en vertu de l’hypothèse (1).]
A l’aide
 de (2), E(ε2i x0i xi ) = E(ε2i )E(x0i xi ) = σ 2 E(x0i xi ). Et comme
PN 0 
plim N i=1 xi xi = E(x0i xi ), alors
1

√ loi −1 −1
N(β̂ N − β) −→ N (0, σ 2 E(x0i xi ) .E(x0i xi ). E(x0i xi )
 
)
| {z }
{E(x0i xi )}−1

Sillard Économétrie des panels


Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

Validation d’un calcul par moindres carrés


Soit (yi )i∈{1,...,n} , ȳ la moyenne empirique des yi et ŷi la valeur de
yi prédite par un modèle linéaire du type

 y i = x i β + εi
ŷ = xi β̂
 i
ε̂i = yi − ŷi

alors on a :
n
X n
X n
X
(yi − ȳ )2 = (ŷi − ȳ )2 + (ε̂i )2
|i=1 {z } |i=1 {z } |i=1{z }
variance expliquée résiduelle
Pn
2 (ε̂i )2
R = 1 − Pn i=1 2
i=1 (yi − ȳ )

Sillard Économétrie des panels


Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

Les tests
On considère β̂ solution des mco associé à l’équation d’observation

yi = xi β + εi

On test l’hypothèse nulle H0 : F (β) = 0.


test de Student : F = (0, . . . , 0, 1, 0, . . . 0) avec Fk = 1. Alors
ˆ
β
sous H0 , q k ˆ T (n − p)
ˆ βk
var
test du rapport de vraisemblance : pour tester une restriction
sur une partie de β, on calcule la log-vraisemblance LNC du
P et L du modèle contraint. Dans le cas
modèle non contraint
des mco, L = − 21 ε̂2i et la statistique de test vaut
LR = 2(LNC − L). Sous H0 , LR χ2 (nc) où nc est le
nombre de contraintes.
Sillard Économétrie des panels
Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

Les statistiques de test


Lecture : valeur du fractile α tel que P(|X | > α) = p
loi normale
p 1% 5% 10%
α 2.58 1.96 1.64

loi du χ2
p 1% 5% 10%
α 1 6.63 3.84 2.71
2 9.21 5.99 4.61
3 11.34 7.81 6.25
4 13.28 9.49 7.78
5 15.09 11.07 9.24
6 16.81 12.59 10.64
7 18.48 14.07 12.02
8 20.09 15.51 13.36
9 21.67 16.92 14.68
10 23.21 18.31 15.99
.
.
.
20 37.57 31.41 28.41
.
.
.
30 50.89 43.77 40.26

Sillard Économétrie des panels


Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

L’endogénéité (1)

ATTENTION
C’est le principal problème auquel on doit faire face dans les
travaux d’estimation économétriques en sciences sociales :
dés que les variables explicatives sont corrélées au terme d’erreur,
alors l’estimateur des mco est biaisé.

Sillard Économétrie des panels


Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

L’endogénéité par variable omise


Exemple : équation de salaire avec variable omise
On veut expliquer le salaire yi d’individus 1 6 i 6 N à partir de leurs
caractéristiques observables (diplôme, âge, sexe, CSP des parents). On
note xi ces caractéristiques. On postule donc un modèle de la forme

yi = c + xi β + εi

On sait aussi qu’une part de salaire est due à une aptitude personnelle ηi
inobservable. Donc l’erreur du modèle est donc de la forme εi = ηi + νi .
Mais cette aptitude personnelle a sûrement joué dans le niveau du
diplôme obtenu. Donc E(ηi |xi ) 6= 0 et l’estimateur des mco est biaisé.

Il est possible de déterminer le sens du biais. Soit di le diplôme. On a


ηi = αdi + ξi avec α > 0. Alors yi = c + (βd + α)di + x̃i β̃ + ξi + νi et
donc le coefficient estimé, pour le diplôme, vaut (βd + α) au lieu de βd .
Si βd > 0, alors l’effet du diplôme est surévalué.
Sillard Économétrie des panels
Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

L’endogénéité par équation simultanée (1)


Exemple : équation de prix
On suppose qu’on observe les prix (pi? ) et les quantités d’équilibre
(yi? ) sur un marché quelconque. Supposons que l’on cherche à
modéliser une fonction de demande. On régresse les quantités sur
les prix :
yi? = a + bpi? + ξi
En réalité, prix et quantités sont solution d’équations simultanées :
 d
yi = c d + αpi + εdi
yio = c o + γpi + εoi

avec α < 0 et γ > 0. Il est raisonnable de penser dans ces écritures


que E(εdi |pi ) = 0 et E(εoi |pi ) = 0. Pourtant, pi? est endogène dans
l’équation de demande.
Sillard Économétrie des panels
Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

L’endogénéité par équation simultanée (2)


En effet, à l’équilibre, c d + αpi? + εdi = c o + γpi? + εoi , donc
pi? = (c d + εdi − c o − εoi )/(γ − α). Par hypothèse, l’équation de
demande est de la forme

yid = c d + αpi + εdi

dont la contrepartie empirique est l’équation de régression

yi? = c d + αpi? + εdi


σ2
Et par construction, E(εdi pi? ) = γ−α
εd
. Cette quantité est positive,
ce qui entraı̂ne un biais positif sur le coefficient de dépendance de
la demande aux prix (qui lui, devrait être négatif). On peut donc,
dans les cas extrêmes, se retrouver avec une dépendance positive
de la demande aux prix si on néglige le biais de simultanéité.
Sillard Économétrie des panels
Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité

Résolution

Par la méthode des variables instrumentales (voir cours


d’économétrie classique)
Par l’approche panel qui enlève une grosse partie des
problèmes

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Plan

1 Rappels d’économétrie
La solution des moindres carrés ordinaires (mco)
Rappels de probabilités
Retour sur la solution des mco
L’endogénéité

2 Panels : les effets linéaires non observés

3 Traitement de la variance

4 Au-delà...

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Principes

On considère un panel d’individus i ∈ {1, . . . , N} observés à T


instants différents t ∈ {1, . . . , T }.

yit = c + xit β + ai + εit


| {z }
ηit

ai est un effet individuel inobservé. C’est une variable aléatoire


dans le cas général.

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Quelques idées préalables

Si E(ηit |xit ) = 0 ; dans ce cas, l’estimateur β̂ obtenu par mco


est convergent. On peut l’améliorer en estimant un paramètre
ai associé à une indicatrice :
N
X
ŷit = ĉ + xit β̂ + âj .1{i==j}
j=1

En pratique on a plutôt E(εit |xit ) = 0, mais pas E(ηit |xit ) = 0.


Or E(ηit |xit ) = E(ai |xit ) + E(εit |xit ). Donc pour qu’un
estimateur des mco soit convergent dans ce contexte, il faut
que E(ai |xit ) = 0. Ce n’est pas le cas en général.

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Exemple

Un panel d’individus {1, . . . , N} × {1, . . . , T } dont on observe le


salaire yit , le diplôme di , l’age ait , la csp des parents csi . On veut
calculer une équation de salaire :

ŷit = ĉ + α̂d .di + α̂cs .csi + α̂age .ageit

L’individu a des capacités propres qui lui ont permis d’obtenir un


diplôme donné, mais qui jouent aussi sur son niveau de salaire
contemporain. Donc l’équation théorique est :

yit = c + αd .di + αcs .csi + αage .ageit + ai + εit


| {z }
ηit

Par hypothèse, E(ai |di ) 6= 0, donc l’estimateur des mco est biaisé.

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Au-delà. . . l’exogénéité stricte

On considère un panel d’individus i ∈ {1, . . . , N} observés à T


instants différents t ∈ {1, . . . , T }.

yit = c + xit β + ai + εit


| {z }
ηit

Un des clés d’identification des coefficients en panel est


l’exogénéité des εit . On opère une transformation sur les yit et xit
pour se débarrasser des ai . Mais dans ce cas, on se retrouve à mêler
des xit 0 et des εit avec t 6= t 0 . Il faut donc une hypothèse du type :

E(yit |xi1 , . . . , xiT , ai ) = E(yit |xit , ai )

pour identifier. Cette dernière est appelée exogénéité stricte.

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Exogénéité forte et faible

On considère un panel d’individus i ∈ {1, . . . , N} observés à T


instants différents t ∈ {1, . . . , T }.

yit = c + xit β + ai + εit


| {z }
ηit

exogénéité forte :

E(yit |xi1 , . . . , xiT , ai ) = E(yit |xit , ai )

exogénéité faible :

E(yit |xi1 , . . . , xiT , ai ) = E(yit |xit , xi(t+1) , . . . , xiT , ai )

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Les transformations possibles


On considère un panel d’individus i ∈ {1, . . . , N} observés à T
instants différents t ∈ {1, . . . , T }.

yit = c + xit β + ai + εit


| {z }
ηit

Pour ôter l’effet ai , on peut procéder par transformation de


l’équation d’observation
Estimateur à effet fixe
Estimateur à effet individuel aléatoire
Estimateur en différence première
On peut aussi l’identifier en l’estimant (estimateur à effet aléatoire
ou à effet fixe estimé) mais l’estimateur résultant n’est pas
nécessairement sans biais.
Sillard Économétrie des panels
Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

L’estimateur poolé

Le modèle
yit = c + xit β + ai + εit
| {z }
ηit

L’estimateur poolé est celui issu de la régression :

ŷit = ĉ + xit β̂

Cet estimateur est convergent lorsque E (ηit |xit ) = 0, ou encore

E(ai |xit ) = 0

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

L’estimateur à effet fixe


Le modèle
yit = c + xit β + ai + εit
| {z }
ηit

1 PT
On définit ȳi• = T τ =1 yiτ et x̄i• de manière cohérente. On a
ȳi• = c + x̄i• β + ai + ε̄i•
Donc par différence
yit − ȳi• = (xit − x̄i• )β + (εit − ε̄i• )
| {z }
νit

L’estimateur des mco de β est convergent lorsque


E(νit |(xit − x̄i• )) = 0
C’est vrai en cas d’exogénéité stricte.
Sillard Économétrie des panels
Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

L’estimateur à effet fixe

Le modèle

yit = c + xit β + ai + εit


| {z }
ηit

On montre que l’estimateur à effet fixe coı̈ncide avec la solution de la


regression par mco
N
X
ŷi = ĉ + xit β̂ + âj .1(j==i)
j=1

dans laquelle aj est traité comme un paramètre inconnu.

Problème
Le degré de liberté : quand N est grand devant T , il y a trop de paramètres
inconnus pour le nombre d’observations.

N (paramètres) = N × T , N (inconnues) = N + dim(xit ) + 1

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Variantes de l’estimateur à effet fixe et terminologie


Le modèle
yit = c + xit β + ai + εit
| {z }
ηit

Estimateur ”Between” : β̂ B est l’estimateur des mco de la


regression
ȳˆi• = x̄i• β B
Cet estimateur n’est pas convergent en général.
Estimateur ”Within” : β̂ W est l’estimateur des mco de la
regression
(yit\
− ȳi• ) = (xit − x̄i• )β̂ W
Cet estimateur est convergent en cas d’exogénéité stricte.
Sillard Économétrie des panels
Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

L’estimateur à effet individuel aléatoire

Le modèle

yit = c + xit β + ai + εit


| {z }
ηit

On suppose que ai N (0, σa2 ) et que εit N (0, σ 2 ). Il est alors possible
d’exprimer la vraisemblance de l’échantillon. La densité de (yit |ai ) vaut :
 
yit − c − xit β − ai
f (yit |ai , xit ) = ϕ
σ2

et donc, par la formule de Bayes :


Z ∞  
a
f (yi1 , . . . , yiT |xi1 , . . . , xiT ) = f (yi1 |xi1 , a)×. . .×f (yiT |xiT , a)ϕ da
−∞ σ a

On calcule alors β par maximum de vraisemblance.


Sillard Économétrie des panels
Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

L’estimateur en différences

Le modèle
yit = c + xit β + ai + εit
| {z }
ηit

On définit ∆ȳit = yit − yi(t−1) et ∆xit de manière cohérente. On a

∆yit = ∆xit β + ∆εit


|{z}
vit

L’estimateur des mco de β est convergent lorsque

E(vit |∆xit ) = 0

C’est vrai en cas d’exogénéité faible.


Sillard Économétrie des panels
Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Quel estimateur choisir ?

L’estimateur en différence s’appuie a priori sur moins d’hypothèses.


En pratique, il est utile de pratiquer plusieurs type d’estimation (en
niveau, en différence, à effet fixe), car si endogénéité il y a, elle ne
se traduit pas par le même effet sur l’estimateur obtenu. Ainsi, les
différences entre les divers estimateurs est interprétable et permet
généralement de préciser la forme de l’endogénéité.

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Plan

1 Rappels d’économétrie
La solution des moindres carrés ordinaires (mco)
Rappels de probabilités
Retour sur la solution des mco
L’endogénéité

2 Panels : les effets linéaires non observés

3 Traitement de la variance

4 Au-delà...

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Hétéroscédasticité

On reprend l’équation de base :

yit = c + dt + xit β + ai + εit

L’hétéroscédasticité correspond à la situation dans laquelle


E(εit εi(t−1) ) = 0 et E(ε2it ) = σ 2 (i, t). Le cas le plus fréquent est
E(ε2it ) = σi2 . L’estimateur par différence :

dit = d̂ + xit β̂
∆y

donne sous les conditions d’exogénéité faible un estimateur


convergent de β. Donc ν̂it = ∆yit − (d̂ + ∆xit β̂) est un estimateur
de νit = εit − εi(t−1) .

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Hétéroscédasticité (2)
1
σ̂i2 =
P 2
ν est un estimateur convergent de σi2 . Finalement, si on
t it 
ni
.. .. ..
 
 .   . .  2
∆yit , Z =  1 ∆xit  et Σ̂ = diag(. . . , σ̂i , . . .), alors
note z =    
.. .. ..
. . .

0 0
 
d̂ β̂ = (Z 0 Σ̂−1 Z )−1 Z 0 Σ̂−1 z
 

est un estimateur sans biais de et dont la variance vaut
β̂
 

var = (Z 0 Σ̂−1 Z )−1
β̂

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Problème...

Il faut noter qu’on estime σi2 par une somme sur ni termes,
c’est-à-dire le nombre d’observations de ∆yit dont on dispose pour
l’individu i. Ce nombre peut être très faible dans le cas de panel,
donc les propriétés de convergence asymptotique des estimateurs
ne s’appliquent pas.
On peut aussi utiliser la même méthode (estimateur de White)
pour une hétéroscédasticité dans le temps (identique pour chaque
individu, mais variable sur t). C’est la méthode de la rgéressions
SUR (Seemingly unrelated regressions).

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Plan

1 Rappels d’économétrie
La solution des moindres carrés ordinaires (mco)
Rappels de probabilités
Retour sur la solution des mco
L’endogénéité

2 Panels : les effets linéaires non observés

3 Traitement de la variance

4 Au-delà...

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Panels dynamiques (1)


C’est un panel dans apparaı̂t la variable dépendante retardée dans
les explicatives. On reprend l’équation de base :
yit = c + dt + αyi(t−1) + xit β + ai + εit
En différenciant, on a
∆yit = d + α∆yi(t−1) + ∆xit .β + νit
avec νit = ∆εit . On travaille désormais sur le panel différencié. On
suppose que (exogénéité forte) :

0 E(εit εit 0 ) = 0 (i)
∀(t, t ) ,
E(xit εit 0 ) = 0 (ii)
Par contre,
E(∆yi(t−1) νit ) 6= 0
Sillard Économétrie des panels
Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Panels dynamiques (2)

En effet, par hypothèses

∆yi(t−1) = d + α∆yi(t−2) + ∆xi(t−1) β + εi(t−1) − εi(t−2)

εi(t−1) apparaı̂t explicitement dans l’expression de ∆yi(t−1) ,


variable explicative, et dans l’expression du terme d’erreur de
l’équation de définition de ∆yit .
Donc le régresseur ∆yi(t−1) est endogène dans l’équation de
régression de l’expliquée ∆yit .

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Panels dynamiques (3)

On pourrait imaginer d’instrumenter la variable ∆yi(t−1) par la


variable yi(t−2) ou par ∆yi(t−2) . Mais cela ne fonctionne pas car
pour la même raison, yi(t−2) ou ∆yi(t−2) sont endogènes dans la
régression (ici auxiliaire) de ∆yi(t−1) sur l’une de ces deux
variables (puisque la modélisation initiale reste valable). Il faut
donc procéder autrement.

Seule solution : la méthode des moments généralisés (Arellano et


al).

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Panels dynamiques (4) : les GMM

On définit le mk -moment empirique de type d’un échantillon


d’observations (y1 , . . . , yN ) par

1
m̄k = mk (yi )
N
mk est une fonction continue. Par exemple, le moment d’ordre 2
est tel que m2 (y ) = y 2 . Par la loi des grands nombres, on a

plim m̄k = µk (θ)

où la forme de µk est connue et θ est un jeu de paramètres


inconnus.

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Panels dynamiques (5)

La méthode des moments consiste à estimer le jeu de paramètres θ


en imposant autant de condition de moments (appelés équations
de moments) que nécessaire :

m̄k − µk (θ) = 0

Si on a plus de conditions que nécessaires, on minimise un distance


entre moments empiriques et moments théoriques.
On pose explicitement les équations de moments associés aux
conditions orthogonalité retenues. Dans le cas présent, il s’agit de
l’orthogonalité des aléas εit (conditions (i)).

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Panel à variable dépendante binaire (1)

On suppose que la variable dépendante est une variable binaire :



1 avec P(yit = 1) = p(c + xit β + ai )
yit =
0 avec P(yit = 0) = p(c + xit β + ai )

S’il n’y a pas d’effet fixe, on utilise une régression logit ou probit.
Exemple : la régression logistique :

exp(c + xit β)
P(yit = 1) =
1 + exp(c + xit β)

c et β sont estimées par maximum de vraisemblance.

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Panel à variable dépendante binaire (2)

Si
exp(c + xit β + ai )
P(yit = 1) =
1 + exp(c + xit β + ai )
P
il faut utiliser une conditionnement par rapport à ni = t yit :
modèle logit à effet fixe.
Sinon, on peut traiter le problème en supposant que ai est
aléatoire et suit une distribution (ai |xi ) ,→ N (ψ, σ 2 ). On peut
alors construire la vraisemblance de (yit |xit ) (voir par exemple
Wooldridge, 2001).

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Quelques exemples

Évaluation de politiques publiques : article de Kiel et McClain


(1995) : conséquences de l’implantation d’un incinérateur sur
les prix de l’immobilier à North Andover (Massachusetts).
Relation entre criminalité et chômage aux États-Unis
Relation entre taux communal de taxe professionnelle et base
communale imposable sur 1998-2005

Ressources numériques du cours


site internet : http ://monsite.orange.fr/quelquestats, lien
panels
les données sont sous le lien panels/donnees

Sillard Économétrie des panels


Rappels d’économétrie
Panels : les effets linéaires non observés
Traitement de la variance
Au-delà...

Références

Sur l’économétrie en général (avec des chapitres sur les panels) :


Green W. (2005) : Économétrie, Person education [en
version française ; version originale en anglais, a priori meilleure.]
Wooldridge J. M., (2005) : Introductory econometrics : a
modern approach, Thomson, 3rd edition.
Plus spécifiquement sur les panels :
Sevestre P. (2002) : Econométrie des données de panel,
Dunod.
Baltagi B. (2005) : Econometric analysis of panel data, John
Wiley and Sons, 3rd edition.
Wooldridge J. M. (2002) : Econometric analysis of cross
section and panel data, The MIT press.

Sillard Économétrie des panels