Académique Documents
Professionnel Documents
Culture Documents
Patrick Sillard
janvier 2007
Plan
1 Rappels d’économétrie
La solution des moindres carrés ordinaires (mco)
Rappels de probabilités
Retour sur la solution des mco
L’endogénéité
3 Traitement de la variance
4 Au-delà...
Introduction
Définition
On appelle panel la donnée de p + 1 caractéristiques zit relatives à
un individu i à une date t. On dispose de cette information pour N
individus (i ∈ {1, . . . , N}) et T instants différents
(t ∈ {1, . . . , T }). zit est un vecteur ligne à p + 1 composantes.
Exemples de panels
Une enquête qui ne suivrait pas des individus d’une date à l’autre
ne permettrait pas de construire un panel, au sens économétrique.
enquête emploi de l’INSEE
enquêtes annuelles d’entreprise
utilisation de données administratives
Plan
1 Rappels d’économétrie
La solution des moindres carrés ordinaires (mco)
Rappels de probabilités
Retour sur la solution des mco
L’endogénéité
3 Traitement de la variance
4 Au-delà...
Économétrie classique
Rappels et notations
On dispose de p + 1 caractéristiques d’individus regroupées dans
un vecteur ligne (de dimension p + 1) zi pour i ∈ {1, . . . , N}. On
veut étudier la dépendance de l’une de ces caractéristiques, notée
yi aux autres, notées xi (zi = (yi |xi )). On suppose que
yi = xi β + εi
où εi est un aléa et β un vecteur colonne de p paramètres
inconnus.
On ”empile” les observations. On obtient un système matriciel
(appelé système des équations d’observations) :
y1 x1 ε1
.. .. ..
. = . β + .
yN xN εN
| {z } | {z } | {z }
Y X
Sillard Économétrie des panels
Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité
X 0 X β̂ = X 0 Y
Or tous les termes de la somme précédente sont des réels, donc ils
sont égaux à leur transposée. Par ailleurs, le seul élément
différentiel est β, donc dY 0 Y = 0 et
dϕ(β) = 2dβ 0 −X 0 Y + X 0 X β
RN Y ˆ
?
*
...............
...
..
X β̂
...............
ImX .........
...
..
Convergence en probabilité
Définition
Convergence en probabilité : Soit (xn )n∈Z une suite de variables
aléatoires. On dit que xn converge en probabilité vers une variable
x lorsque
∀α > 0 , lim P(|xn − x| > α) = 0
n→∞
On note plimn→∞ xn = x.
Propriété
Inégalité de Markov : Soit x une variable aléatoire telle que pour
r ∈ N∗ , E(|x|r ) existe. Alors
E(|x|r )
∀α > 0 , P(|x| > α) 6
αr
Sillard Économétrie des panels
Rappels d’économétrie La solution des moindres carrés ordinaires (mco)
Panels : les effets linéaires non observés Rappels de probabilités
Traitement de la variance Retour sur la solution des mco
Au-delà... L’endogénéité
Soit (xn )n∈N une suite de variables aléatoires iid telle que ∀n,
E(xn ) = µ et E[(xn − µ)2 ] = σ 2 . Alors on peut définir la moyenne
empirique :
n
1X
µn = xn
n
i=1
On vérifie que
E(µn ) = µ
σ2
E[(µn − µ)2 ] = var(µn ) = n
σ2
∀α > 0 , P(|µn − µ| > α) 6
nα2
Finalement, plimn→∞ µn = µ.
De même : si (xn ) est une suite de vecteurs aléatoires iid tels que
E(xn ) = x et var(xn ) = Σ < ∞, alors
n
1X 0
plim xi xi = E(x0i xi ) = x0 x
n→∞ n
i=1
Propriété
Soit (xn )n∈N une suite de vecteurs aléatoires iid telle que ∀n,
E(xn ) = µ et var(xn ) = Σ. Alors la moyenne empirique µn définie
1 Pn
par µn = n i=1 xn est telle que
√
n(µn − µ) N (0, Σ)
En développant. . . (1)
Or
N
X N
X
0
XX = x0i xi 0
et X Y = x0i yi
i=1 i=1
Il s’ensuit :
N N
! !
0 0 1 X 0 1 X 0
X X β̂ N = X Y ⇔ xi xi β̂ N = xi y i
N N
i=1 i=1
Puis,
N
1 X 0
= E(x0i xi )
p lim
N→∞ N
xi xi
i=1
N
1 X 0
= E(x0i yi )
p lim
N→∞ N xi y i
i=1
En développant. . . (2)
Par continuité on a :
−1
plim β̂ N = E(x0i xi ) E(x0i yi )
En développant. . . (3)
Et par suite (on note désormais β̂ ≡ plim β̂ N )
−1
β̂ = β + E(x0i xi ) E(x0i εi )
| {z }
biais éventuel
Espérance conditionnelle
On considère l’équation d’observation
yi = xi β + εi
et β̂ l’estimateur des mco. Une CNS pour que β̂ soit sans biais est E(xi εi ) = 0.
Il est pratique de remplacer cette hypothèse par E(εi |xi ) = 0.
Propriété
yi = xi β + εi
Remarque
(plim varβ̂ N ) est la variance de β̂ (avec la notation plim β̂ N = β̂).
où B = E(ε2i x0i xi ). [Remarque : la moyenne est nulle en vertu de l’hypothèse (1).]
A l’aide
de (2), E(ε2i x0i xi ) = E(ε2i )E(x0i xi ) = σ 2 E(x0i xi ). Et comme
PN 0
plim N i=1 xi xi = E(x0i xi ), alors
1
√ loi −1 −1
N(β̂ N − β) −→ N (0, σ 2 E(x0i xi ) .E(x0i xi ). E(x0i xi )
)
| {z }
{E(x0i xi )}−1
alors on a :
n
X n
X n
X
(yi − ȳ )2 = (ŷi − ȳ )2 + (ε̂i )2
|i=1 {z } |i=1 {z } |i=1{z }
variance expliquée résiduelle
Pn
2 (ε̂i )2
R = 1 − Pn i=1 2
i=1 (yi − ȳ )
Les tests
On considère β̂ solution des mco associé à l’équation d’observation
yi = xi β + εi
loi du χ2
p 1% 5% 10%
α 1 6.63 3.84 2.71
2 9.21 5.99 4.61
3 11.34 7.81 6.25
4 13.28 9.49 7.78
5 15.09 11.07 9.24
6 16.81 12.59 10.64
7 18.48 14.07 12.02
8 20.09 15.51 13.36
9 21.67 16.92 14.68
10 23.21 18.31 15.99
.
.
.
20 37.57 31.41 28.41
.
.
.
30 50.89 43.77 40.26
L’endogénéité (1)
ATTENTION
C’est le principal problème auquel on doit faire face dans les
travaux d’estimation économétriques en sciences sociales :
dés que les variables explicatives sont corrélées au terme d’erreur,
alors l’estimateur des mco est biaisé.
yi = c + xi β + εi
On sait aussi qu’une part de salaire est due à une aptitude personnelle ηi
inobservable. Donc l’erreur du modèle est donc de la forme εi = ηi + νi .
Mais cette aptitude personnelle a sûrement joué dans le niveau du
diplôme obtenu. Donc E(ηi |xi ) 6= 0 et l’estimateur des mco est biaisé.
Résolution
Plan
1 Rappels d’économétrie
La solution des moindres carrés ordinaires (mco)
Rappels de probabilités
Retour sur la solution des mco
L’endogénéité
3 Traitement de la variance
4 Au-delà...
Principes
Exemple
Par hypothèse, E(ai |di ) 6= 0, donc l’estimateur des mco est biaisé.
exogénéité forte :
exogénéité faible :
L’estimateur poolé
Le modèle
yit = c + xit β + ai + εit
| {z }
ηit
ŷit = ĉ + xit β̂
E(ai |xit ) = 0
1 PT
On définit ȳi• = T τ =1 yiτ et x̄i• de manière cohérente. On a
ȳi• = c + x̄i• β + ai + ε̄i•
Donc par différence
yit − ȳi• = (xit − x̄i• )β + (εit − ε̄i• )
| {z }
νit
Le modèle
Problème
Le degré de liberté : quand N est grand devant T , il y a trop de paramètres
inconnus pour le nombre d’observations.
Le modèle
On suppose que ai N (0, σa2 ) et que εit N (0, σ 2 ). Il est alors possible
d’exprimer la vraisemblance de l’échantillon. La densité de (yit |ai ) vaut :
yit − c − xit β − ai
f (yit |ai , xit ) = ϕ
σ2
L’estimateur en différences
Le modèle
yit = c + xit β + ai + εit
| {z }
ηit
E(vit |∆xit ) = 0
Plan
1 Rappels d’économétrie
La solution des moindres carrés ordinaires (mco)
Rappels de probabilités
Retour sur la solution des mco
L’endogénéité
3 Traitement de la variance
4 Au-delà...
Hétéroscédasticité
dit = d̂ + xit β̂
∆y
Hétéroscédasticité (2)
1
σ̂i2 =
P 2
ν est un estimateur convergent de σi2 . Finalement, si on
t it
ni
.. .. ..
. . . 2
∆yit , Z = 1 ∆xit et Σ̂ = diag(. . . , σ̂i , . . .), alors
note z =
.. .. ..
. . .
0 0
d̂ β̂ = (Z 0 Σ̂−1 Z )−1 Z 0 Σ̂−1 z
d̂
est un estimateur sans biais de et dont la variance vaut
β̂
d̂
var = (Z 0 Σ̂−1 Z )−1
β̂
Problème...
Il faut noter qu’on estime σi2 par une somme sur ni termes,
c’est-à-dire le nombre d’observations de ∆yit dont on dispose pour
l’individu i. Ce nombre peut être très faible dans le cas de panel,
donc les propriétés de convergence asymptotique des estimateurs
ne s’appliquent pas.
On peut aussi utiliser la même méthode (estimateur de White)
pour une hétéroscédasticité dans le temps (identique pour chaque
individu, mais variable sur t). C’est la méthode de la rgéressions
SUR (Seemingly unrelated regressions).
Plan
1 Rappels d’économétrie
La solution des moindres carrés ordinaires (mco)
Rappels de probabilités
Retour sur la solution des mco
L’endogénéité
3 Traitement de la variance
4 Au-delà...
1
m̄k = mk (yi )
N
mk est une fonction continue. Par exemple, le moment d’ordre 2
est tel que m2 (y ) = y 2 . Par la loi des grands nombres, on a
m̄k − µk (θ) = 0
S’il n’y a pas d’effet fixe, on utilise une régression logit ou probit.
Exemple : la régression logistique :
exp(c + xit β)
P(yit = 1) =
1 + exp(c + xit β)
Si
exp(c + xit β + ai )
P(yit = 1) =
1 + exp(c + xit β + ai )
P
il faut utiliser une conditionnement par rapport à ni = t yit :
modèle logit à effet fixe.
Sinon, on peut traiter le problème en supposant que ai est
aléatoire et suit une distribution (ai |xi ) ,→ N (ψ, σ 2 ). On peut
alors construire la vraisemblance de (yit |xit ) (voir par exemple
Wooldridge, 2001).
Quelques exemples
Références