Vous êtes sur la page 1sur 29

Econométrie

1ère séance

Romain Aeberhardt

Supélec

http://econometrie-supelec-2012.blogspot.com/

Février 2012

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 1 / 29


Plan

1 Introduction

2 L’idéal expérimental

3 Donner du sens aux MCO – Fondamentaux

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 2 / 29


Exemples de cas pratiques

1 Quel est l’impact de la taille des classes sur la réussite des élèves ?
2 Quel est le lien entre le nombre de policiers et le nombre de
délits/crimes ?
3 Quel est l’impact d’une formation professionnelle continue sur le
salaire ?
4 Quel est l’impact des différents types de dépenses publicitaires (télé,
panneaux, ...) sur les ventes de shampoing ?

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 3 / 29


Répondez aux questions suivantes

1 Restreignez le sujet en formulant une question très précise de la


forme : Si j’augmente de x [la variable dont on veut mesurer l’effet],
de combien augmente [la variable sur laquelle on mesure l’effet] ?
2 Quelles sont les données a priori disponibles, ou facilement
collectables sur ce sujet ?
3 Comment répondre à la question avec ces données à l’aide de simples
comparaisons ?
4 Quels sont les risques d’erreurs ? Est-ce que le comportement naturel
des individus observés peut perturber cette analyse ?
5 Imaginez une expérience qui permette de répondre à cette question
par simple comparaison

10 min de réflexion par groupe, 15-20 min de discussion

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 4 / 29


Qu’est-ce qu’une étude économétrique ?

Une relation causale à étudier (plus que de la description, aider à la


prise de décision)
Une expérience idéale qui permettrait de mesurer cette relation
causale
Une stratégie d’identification : ce qui permet de rendre des données
non expérimentales aussi proches que possible de données
expérimentales
Un mode d’inférence (la technique statistique/économétrique)

Ce dont vous allez voir besoin :


Du bon sens
Les cours de tronc commun de première année
I Probabilités
I Statistiques pour l’ingénieur

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 5 / 29


Plan

1 Introduction

2 L’idéal expérimental

3 Donner du sens aux MCO – Fondamentaux

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 6 / 29


L’idéal expérimental
Le problème de la sélection

Exemple : Quel est l’effet d’être allé à l’hôpital au cours des 12 derniers
mois sur la santé des personnes âgées ?

Groupe Niveau de santé moyen


de 1 (mauvais) à 5 (excellent)
Est allé à l’hôpital 3.21
N’est pas allé à l’hôpital 3.93

L’exposition aux autres malades est-elle si dangereuse ?

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 7 / 29


L’idéal expérimental
Le modèle de Rubin

Traitement binaire :
I Ti = 1 si la personne est allée à l’hôpital
I Ti = 0 si la personne n’est pas allée à l’hôpital
Résultats individuels potentiels
I Y1i : niveau de santé si la personne est allée à l’hôpital (Ti = 1)
I Y0i : niveau de santé si la personne n’est pas allée à l’hôpital (Ti = 0)
I Attention : un seul des deux résultats est observé !
I Yi = Y0i (1 − Ti ) + Y1i Ti = Y0i + (Y1i − Y0i )Ti
I Y1i − Y0i est l’effet causal de l’hospitalisation pour l’individu i
(inobservable en pratique)

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 8 / 29


L’idéal expérimental
Le biais de sélection

Comparaison naı̈ve entre hospitalisés et non hospitalisés

E [Yi |Ti = 1] − E [Yi |Ti = 0]


| {z }
Différence de niveau de santé observée
= E [Y1i |Ti = 1] − E [Y0i |Ti = 1] + E [Y0i |Ti = 1] − E [Y0i |Ti = 0]
| {z } | {z }
Effet moyen du traitement sur les traités Biais de sélection

E [Y1i |Ti = 1] − E [Y0i |Ti = 1] = E [Y1i − Y0i |Ti = 1] : Effet moyen


de l’hospitalisation sur ceux qui ont été hospitalisés par rapport à la
situation hypothétique où ils ne l’auraient pas été
E [Y0i |Ti = 1] − E [Y0i |Ti = 0] : biais de sélection, traduit une
différence structurelle moyenne (dans le niveau de santé potentiel sans
hospitalisation) entre le groupe qui a été hospitalisé et celui qui ne l’a
pas été.

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 9 / 29


L’idéal expérimental
Le biais de sélection

Si le biais de sélection est fortement négatif, il peut masquer un


éventuel effet positif du traitement dans le cas d’une comparaison
naı̈ve.
Exemples :
I Hormones de remplacement
I Suivi renforcé des jeunes en difficulté
But de l’analyse empirique : éliminer le biais de sélection

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 10 / 29


L’idéal expérimental
L’affectaction aléatoire résoud le problème de la sélection !
L’affectation aléatoire au traitement Ti le rend indépendant des
résultats potentiels Y1i et Y0i

E [Yi |Ti = 1] − E [Yi |Ti = 0] = E [Y1i |Ti = 1] − E [Y0i |Ti = 0]


= E [Y1i |Ti = 1] − E [Y0i |Ti = 1]
= E [Y1i − Y0i |Ti = 1]
= E [Y1i − Y0i ]
exemple d’expérimentations : STAR (taille des classes), RCA,
apprentissage, JD
En développement en économie (cf. J-PAL)
Attention ça ne veut pas dire que l’affectation aléatoire résoud tous
les problèmes !
I Cher
I Les résultats prennent longtemps à arriver
I Problèmes éthiques
R. Aeberhardt (DARES et CREST) Econométrie Février 2012 11 / 29
L’idéal expérimental
Analyse des expérimentations par les MCO
Estimateur des MCO pour le modèle linéaire simple

Yi = α + βTi + ηi

1 X 1 X 1 X
α̂ = P Yi , β̂ = P Yi − P Yi
1 − Ti Ti 1 − Ti
Ti =0 Ti =1 Ti =0

Si l’assignation au traitement est aléatoire, β̂ est un estimateur sans


biais de l’effet moyen du traitement.

E [β̂] = [E [Yi |Ti = 1] − E [Yi |Ti = 0] = E [Y1i − Y0i ]

En général on estime un modèle avec des variables de contrôle Xi

Yi = α + βTi + Xi γ + εi

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 12 / 29


Plan

1 Introduction

2 L’idéal expérimental

3 Donner du sens aux MCO – Fondamentaux

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 13 / 29


Donner du sens aux MCO

Pour l’instant on oublie la question de la causalité


On se concentre sur les propriétés mécaniques / géométriques des
MCO
On oublie les problèmes d’échantillonnage (on se place sur la
population totale)

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 14 / 29


L’espérance conditionnelle – 0
Un résumé de l’information
Chaque individu a ses spécificités mais il y a des relations statistiques
globales
I exemple : les gens plus éduqués gagnent en moyenne plus d’argent
I pouvoir prédictif important
I pas de notion de causalité à ce stade pour autant
E [Yi |Xi = x], moyenne de la variable Y au sein de la population des
individus ayant pour caractéristiques x (vecteur de caractéristiques de
dimension K )
E [Yi |Xi = x] est une valeur en Xi = x de la fonction de Xi : E [Yi |Xi ]
Yi , Xi et E [Yi |Xi ] sont des variables aléatoires
I Exemple : niveau de santé et hospitalisation, E [Yi |Ti ] est une fonction
qui prend deux valeurs suivant que Ti = 0 ou Ti = 1 (ici, Xi est
unidimensionnel)
I Si Y est continue, de densité conditionnelle fY (t|X = x),
Z
E [Yi |Xi = x] = tfY (t|Xi = x)dt

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 15 / 29


Distribution conditionnelle

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 16 / 29


Espérance conditionnelle – 1

Espérance conditionnelle de Yi sachant Xi : E (Yi |Xi )


Loi des espérances itérées : E (Yi ) = EX (E (Yi |Xi ))
I exemple : Y = salaire et X = {homme, femme}
Propriété de décomposition : Yi = E (Yi |Xi ) + εi , avec
1 E (εi |Xi ) = 0
2 εi non corrélé avec n’importe quelle fonction de Xi .
N’importe quelle variable peut être expliquée en une part qui est
expliquée par X et une part qui est orthogonale à X .
Preuve : il suffit de définir εi comme εi = Yi − E [Yi |Xi ]

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 17 / 29


Espérance conditionnelle – 2

Propriété de prédiction : soit m(Xi ) une fonction de Xi , l’espérance


conditionnelle est telle que :

E (Yi |Xi ) = argmin E [(Yi − m(Xi ))2 ]


m(Xi )

E (Yi |Xi ) est le prédicteur de Yi qui minimise l’erreur quadratique


moyenne étant donné Xi
Propriété d’analyse de la variance (ANOVA) :

V (Yi ) = V (E (Yi |Xi )) + E (V (Yi |Xi ))

I E [ε2i ] = E [E [ε2i |Xi ]] = E [E [(Yi − E [Yi |Xi ])2 |Xi ]] = V [Yi |Xi ]
Attention : jusqu’ici on n’a fait aucune hypothèse sur la linéarité
éventuelle de l’espérance conditionnelle en tant que fonction des X .

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 18 / 29


Définition de la régression linéaire (MCO)

On définit le vecteur de coefficients des MCO β par :

β = argminE [(Yi − Xi0 b)2 ]


b

Ce qui correspond, en utilisant la condition du premier ordre, à trouver b


qui résoud :
E [Xi (Yi − Xi0 b)] = 0

β = E [Xi Xi0 ]−1 E [Xi Yi ]


par construction, E [Xi (Yi − Xi0 β)] = 0
le résidu ei = Yi − Xi0 β est non corrélé avec les Xi

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 19 / 29


Quelques formules de calcul
cas particulier du modèle linéaire simple : y = α + βx + u
Cov (Yi , xi )
β= , α = E [Yi ] − βE [Xi ]
V (xi )
P
Cas multivarié : y = α + k βk xx + e
Cov (Yi , x̃ki )
βk =
V (x̃ki )
où x̃ki est le résidu des MCO de xki sur toutes les autres covariables
chaque coefficient d’une régression multivariée correspond au
coefficient d’un modèle linéaire simple sur la partie spécifique de cette
variable, i.e. une fois qu’on a purgé l’effet des autres variables
(partialing out)
vérification : x̃k est une combinaison linéaire des autres x`
X
Cov (Y , x̃k ) = Cov (α + βk xk + e, x̃k ) = βk Cov (xk , x̃k )
k

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 20 / 29


Justification de la régression linéaire
Si on est intéressé par l’espérance conditionnelle alors, on doit être
intéressé par le coefficient β issu des MCO.
1 Si l’espérance conditionnelle est une fonction linéaire des X , alors la

régression permet de l’obtenir.


I Ex : normalité jointe ou modèles saturés
2 La fonction Xi0 β est la meilleure approximation linéaire de Yi sachant
Xi au sens de la minimisation de l’erreur quadratique moyenne
I E [Y |X ] est la meilleure approximation de Y dans la classe des
fonctions de X , et Xi0 β est la meilleure approximation de Y dans la
classe des fonctions linéaires de X .
3 La fonction Xi0 β est la meilleure approximation linéaire de E (Yi |Xi )
au sens de la minimisation de l’erreur quadratique moyenne :

β = argmin E [(E (Yi |Xi ) − Xi0 β)2 ]


b

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 21 / 29


Régression de l’espérance conditionnelle
3.1. REGRESSION FUNDAMENTALS 31
Figure 3.1.2 - A conditional expectation function and weighted regression line
7.2

6.8
Log weekly earnings, $2003

6.6

6.4

6.2

5.8

0 2 4 6 8 10 12 14 16 18 20+
Years of completed education

Sample is limited to white men, age 40-49. Data is from Census IPUMS 1980, 5% sample.

Figure 3.1.2: Regression threads the CEF of average weekly wages given schooling

R. Aeberhardt
estimates(DARES et CREST)
should be Econométrie
interpreted. Whatever a regression Févrierdistribution
coe¢ cient may mean, it has a sampling 2012 22 / 29
Inférence asymptotique

On n’a en général pas accès aux données exhaustives sur une


population donnée
On va donc estimer β sur un échantillon, on obtient β̂
On va chercher à savoir si β̂ est proche, ou non de β
Pour cela
On va travailler avec des moments empiriques (moyennes, variances,
covariances)
On va utiliser les résultats suivants : loi des grands nombres, théorème
de la limite centrée, théorème de Slutsky, théorème de continuité,
méthode delta

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 23 / 29


Moments empiriques
Supposons que l’on dispose d’un échantillon iid de taille N des
vecteurs Wi = Xi Yi
Un estimateur naturel de E [Xi Yi ] est : N1 N
P
i=1 Wi
Cet estimateur est convergent quand N tend vers l’infini (LGN)
De même, un estimateur naturel de la matrice E [Xi Xi0 ] est :
1 PN 0
N i=1 Xi Xi
On retombe sur la formule qui résoud le problème de minimisation de
la somme des carrés des résidus dans l’échantillon :
N
!−1 N
!
1 X 0 1 X
β̂ = Xi Xi Xi Yi
N N
i=1 i=1

La distribution de β̂ va dépendre uniquement de ce qu’on estime (β)


et du fait qu’on a un échantillon iid.

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 24 / 29


Résultats utiles de théorie asymptotique

LGN : les moments empiriques convergent en probabilité vers les


vrais moments (population totale)
TCL : les moments empiriques
√ sont asymptotiquement normaux
(après multiplication par N)
Théorème de Slutsky : si aN converge en loi vers a et bN converge
en probabilité vers b, alors aN + bN a la même distribution
asymptotique que aN + b et idem pour aN bN vis-à-vis de aN b
Théorème de continuité : si bN converge en probabilité vers b et h
est continue en b, alors h(bN ) converge en probabilité vers h(b)
Delta
√ méthode : soit bN vecteur tel que la distribution asymptotique
de N(bN − b) est normale de moyenne
√ 0 et de variance Ω, si h est
continûment différentiable en b, N(h(bN ) − h(b)) est
∂h 0 ∂h
asymptotiquement normale de moyenne 0 et de variance ∂b Ω ∂b

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 25 / 29


Distribution asymptotique de l’estimateur des MCO

1 Delta méthode
I β̂ est une fonction des moments empiriques
I le théorème de continuité assure la convergence vers β
I la delta méthode assure que β̂ est asymptotiquement normal et il ne
reste plus qu’à calculer la variance...
2 Slutsky et TCL
I On considère le vrai beta de la population : β = E [Xi Xi0 ]−1 E [Xi Yi ]
I On pose Yi = Xi0 β + ei avec ei = Yi − Xi0 β
I On a alors E [Xi ei ] = 0
PN PN
I on réécrit l’estimateur β̂ = β + ( i=1 Xi Xi0 )−1 ( i=1 Xi ei )

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 26 / 29


Distribution asymptotique de l’estimateur des MCO (suite)

On cherche la distribution asymptotique de :

N
!−1 N
!
√ X 1 X
N(β̂ − β) = N Xi Xi0 √ Xi ei
i=1
N i=1

(Slutsky) c’est la même distribution asymptotique que :


N
1 X
E [Xi Xi0 ]−1 √ ( Xi ei )
N i=1

√1 ( N Xi ei ) N N1 ( N
P P
De plus, comme : N i=1 = i=1 Xi ei )
(TCL) sa distribution est asymptotiquement normale, de moyenne 0
et de variance E [Xi Xi0 ei2 ]

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 27 / 29


Distribution asymptotique de l’estimateur des MCO (fin)

β̂ a donc une distribution asymptotiquement normale de moyenne β


et de variance :

E [Xi Xi0 ]−1 E [Xi Xi0 ei2 ]E [Xi Xi0 ]−1

il s’agit de la matrice de variance-covariance robuste de White


sous hypothèse d’homoscédasticité :

E [Xi Xi0 ei2 ] = E [Xi Xi0 E (ei2 |Xi )] = σ 2 E [Xi Xi0 ]



la variance asymptotique de N(β̂ − β) se simplifie en σ 2 E [Xi Xi0 ]−1
les écarts-types souvent présentés par défaut par les logiciels sont
calculés sous hypothèse d’homoscédasticité
préférer les écarts-types robustes

R. Aeberhardt (DARES et CREST) Econométrie Février 2012 28 / 29


Note sur les modèles saturés
Une indicatrice par modalité de la variable explicative
Dans ce cas, les coefficients estimés correspondent aux moyennes
dans chacun des sous-groupes
Si X a K modalités, E [Y |X ] est une fonction à K points de support.
Elle est linéaire dans les indicatrices correspondant à ces points de
support. Le modèle contient autant de paramètres qu’il y a de points
de support.
Exemple 1 : salaire et âge.
Dans ce cas, les MCO permettent d’obtenir l’espérance conditionnelle
(et pas juste sa meilleure approximation linéaire)
Exemple 2 : avec deux variables explicatives binaires, un modèle
saturé contient les 2 indicatrices et l’indicatrice croisée (en plus de la
constante)
En général, on cherche de la parcimonie et on cherche un modèle
avec un fit raisonnable mais moins de paramètres
R. Aeberhardt (DARES et CREST) Econométrie Février 2012 29 / 29

Vous aimerez peut-être aussi