Vous êtes sur la page 1sur 43

LES VARIABLES INSTRUMENTALES

Cours de Pauline Chauvin


Université de Paris

1
Introduction
• Comment estimer les conséquences d’une PP ?
• Deux cas de figure possibles :
• Les expériences « contrôlées » (1)
ÞDonnées expérimentales
• Les expériences « naturelles » (2)
Þ Données observationnelles / de vie réelle
ÞMise en œuvre de méthodes statistiques pour mesurer un impact causal
• Les variables instrumentales
• Les doubles différences
• Le modèle de discontinuité de la régression
• Les techniques d’appariement

2
I. Présentation
• Si utilisation d’un modèle de régression ci-dessous pour étudier l’impact
d’une PP sur une variable de résultat
• Modèle à estimer :
• 𝑌! = 𝛽" + 𝛽# 𝑇! + 𝛽$ 𝑋#! + 𝛽% 𝑋$! + 𝑈!
• Modèle estimé :
• 𝑌(! = 𝛽)" + 𝛽)# 𝑇! +𝛽)$ 𝑋#! + 𝛽)% 𝑋$!
• Pour pouvoir estimer une relation causale, il faut que l’hypothèse
indépendance conditionnelle des erreurs (CIA) tienne
Þ corr(Ti,ui)=0
Þ Pas d’hétérogénéité inobservée
Þ Pas de relation de simultanéité ou de causalité inverse
Þ Pas d’erreur de mesure
• Remarques : les variables
• corrélées avec ui sont dites endogènes
• Non corrélées avec ui sont dites exogènes
3
I. Présentation

• Les variables instrumentales


• Approche assez ancienne: premières intuitions proposées par Wright (1928)
• On va chercher une variable qui explique le traitement mais non corrélée
avec les autres variables du modèle
• Objectif de l’estimateur à variables instrumentales
Þ Scinder la variation de T en deux parties :
• Une partie corrélée avec u
• Une partie non corrélée avec u
Þ Pour cela, détermination d’un instrument ou d’une variable instrumentale, Z,
qui :
• n’est pas corrélée avec u
• Corr(Zi,ui)=0
• Mais qui est corrélé avec T
4
• Corr(Zi,Ti)≠0
I. Présentation

• Les variables instrumentales


• On cherche une variable ou des variables qui influent sur la probabilité
de bénéficier de la PP mais pas sur le résultat attendu de la PP
• Exemples :
• Affectation aléatoire d’une expérimentation qui n’a pas fonctionné (ex Rapp et al
(2015):
• Base de données: données expérimentales de l’étude PLASA (essai contrôlé d’un
programme d’accompagnement des personnes âgées dépendantes visant à améliorer
leur santé mais qui n’a pas été efficace)
• Variable expliquée: le fait d’être hospitalisé
• Variable explicative endogène: bénéficier de l’APA
• Instrument: le fait d’avoir été dans le groupe de traitement de l’étude PLASA

5
Exemple 1

• Exemple 1: Quel est l’impact de l’APA sur le risque


d’hospitalisation ?
• Ce que l’on voudrait observer :
?

APA Hospitalisa)on

6
Exemple 1

• Exemple 1: Quel est l’impact de l’APA sur le risque


d’hospitalisation ?
• Ce qui nous empêche de l’observer :
?

APA Hospitalisa)on

- Hétérogénéité inobservée (état


de santé)
- Causalité inverse
Etat de santé

7
Exemple 1

• Exemple 1: Quel est l’impact de l’APA sur le risque


d’hospitalisation ?
• Principe des VI: utiliser une variable (instrument) qui explique la
variable endogène mais pas les autres variables pour isoler le lien de
causalité
?

APA Hospitalisa)on

Être dans le
groupe de
traitement de
Etat de santé
l’étude PLASA
I. Présentation

• Les variables instrumentales


• On cherche une variable ou des variables qui influent sur la probabilité
de bénéficier à la PP mais pas sur le résultat attendu de la PP
• Exemples :
• Affectation aléatoire d’une expérimentation qui n’a pas fonctionné (ex Rapp et al
(2015):
• Base de données: données expérimentales de l’étude PLASA (essai contrôlé d’un
programme d’accompagnement des personnes âgées dépendante visant à améliorer
leur santé mais qui n’a pas été efficace)
• Variable expliquée: le fait d’être hospitalisé
• Variable explicative endogène: bénéficier de l’APA
• Instrument: le fait d’avoir été dans le groupe de traitement de l’étude PLASA
• Variations exogènes de l’environnement :
• Changements législatifs
• Événements sociaux (grève, ...), géographique (réorganisation territoriale, …),
climatiques (sécheresse), …
9
I. Présentation

• Estimation par la méthode des doubles moindres carrés


• Deux étapes:
1. Régresser T en fonction de Z
• 𝑇! = 𝜋" + 𝜋# 𝑍! + 𝜋$ 𝑋#! + 𝜋% 𝑋$! + 𝑉!
• On estimera: 𝑇(! = 𝜋 )" + 𝜋
)# 𝑍! + 𝜋
)$ 𝑋#! + 𝜋
)% 𝑋$!
• Objectif: isoler les variations de T qui ne sont pas corrélées avec ui
ÞComme Corr(Zi,ui)=0, Corr(𝑇(! ,ui)=0
2. Régresser Yi en fonction de 𝑇!!
• 𝑌! = 𝛽" + 𝛽#&' 𝑇(! + 𝛽$ 𝑋#! + 𝛽% 𝑋$! + 𝑈!

• Attention, la variance de 𝛽!-./ n’est pas la variance de l’estimateur de la


deuxième étape !
Þ Les logiciels de statistiques sont programmés pour la calculer
10
I. Présentation

• Exemple : la demande de produits agricoles


• On souhaite mesurer l’impact de la variation des prix sur la demande
de pommes
ó On souhaite mesurer l’élasticité prix de la demande pour les pommes
• Modèle à estimer :
• ln(𝑄! ) = 𝛽" + 𝛽# ln(𝑃! ) + 𝑈!
• 𝛽" mesure la variation relative de la quantité correspondant à une variation de
prix de 1%
• On dispose d’une base de données avec les quantités vendues et les
prix sur plusieurs années
• Mesurera-t-on effectivement l’élasticité prix de la demande pour les pommes en
estimant 𝛽" avec les MCO ?

11
I. Présentation Conclusion:
-
Prix Demande
+

Prix
Offre 1 Offre

P1 P’1
Offre 2

P2 P’2

Demande Demande 1
Demande 2

12 Q1 Q2 Quan)tés 12 Q’2 Q’1 Quan)tés


I. Présentation

• Exemple : la demande de produits agricoles


• Solution ?
• On va chercher à estimer la courbe de demande en isolant les déplacements
des prix et des quantités dus à un déplacement de la courbe de l’offre.
Þ Quel instrument permettra d’isoler ces déplacements ?
• La quantité de pluie dans les régions de production (Zi)
• Instrument valide ?
• Oui si on pense que
1. La pluie n’affectera pas la demande:
ÞCorr(Zi,ui) = 0
2. La pluie affectera la production et donc les prix sur le marché
ÞCorr(Zi,Pi) ≠ 0

13
Exemple 2

• Exemple 2 : Mesure de l’élasticité-prix de la demande de pommes


• Ce que l’on voudrait observer :

?
Prix de marché Demande de
des pommes pommes

14
Exemple 2

• Exemple 2: Mesure de l’élasticité-prix de la demande de pommes


• Ce qui nous empêche de l’observer :

?
Prix de marché Demande de
des pommes pommes

- Causalité inverse

15
Exemple 2

• Exemple 2: Mesure de l’élasticité-prix de la demande de pommes


• Principe des VI: utiliser une variable (instrument) qui explique la
variable endogène mais pas les autres variables pour isoler le lien de
causalité

?
Prix de marché Demande de
des pommes pommes

Pluie
I. Présentation

• Exemple : la demande de produits agricoles


• Modèle à estimer :
• ln(𝑄! ) = 𝛽" + 𝛽# ln(𝑃! ) + 𝑈!
• Etape pour l’estimation de 𝛽!-./
(6 )
1. On régresse ln(𝑃6 ) en fonction de Zi pour obtenir ln(𝑃
Þ Contient les variations relatives du prix suite à une variation de l’offre due à une
variation du niveau de pluie
(6 )
2. On régresse ln(𝑄6 ) en fonction de ln(𝑃
Þ Mesure les variations de quantités échangées suite à des variations de prix dues
à une variation de l’offre uniquement

17
I. Présentation

• L’estimateur des variables instrumentales 𝛽!$%& est


• Convergent
ÞIl faut un grand échantillon pour obtenir une estimation sans biais de 𝛽-
;6< ! ./
: 7→9: :𝛽- = 𝛽-
• Suit asymptotiquement une loi normale:𝛽!-./ ~𝑁(𝛽-, 𝜎=(>"# )
!
ÞLes intervalles de confiance et les tests habituels peuvent être utilisés
sur les grands échantillons
• Mais variance plus grande que celle de l’estimateur des MCO

18
I. Présentation

• Concernant les estimations par la méthode des doubles moindres


carrés :
• Si Zi est une variable quantitative
1 )
𝑆%& 𝑛 ∑!(" 𝑌! − 𝑌/ 𝑍! − 𝑍̅
𝛽'" =
#$
=
𝑆'& 1 ∑) 𝑇 − 𝑇/ 𝑍 − 𝑍̅
𝑛 !(" ! !

• Si Zi est une variable binaire (estimateur de wald)

E(Y|Z =1)−E(Y|Z =0)


𝛽'"#$ =
E(T|Z = 1) − E(T|Z = 0)
• On peut utiliser plusieurs instruments pour expliquer les variations de Ti
• Si on utilise un seul instrument
• On dira que 𝛽#&' est identifié
• Si on utilise plusieurs instruments
19
• On dira que 𝛽#&' est suridentifié
I. Présentation

• Interprétation de l’estimateur des variables instrumentales


• On supposera ici que la variable de traitement ainsi que l’instrument
sont des variables binaires.
• 𝛽!-./ ≠ ∆?@@ , effet moyen du traitement sur l’ensemble des traités
• 𝛽!-./ = effet moyen du traitement sur les « compliers ».
• Complier:
• Sous-population des traités
• Pour laquelle l’instrument a effectivement un pouvoir prédictif sur la variable
endogène
• Il y a 4 cas de figure possibles concernant le comportement vis-à-vis de
l’instrument et du traitement (Angrist et alii, 1996):
T=1, Z=1 T=0, Z=1
T=1, Z=0 Always taker Defier
T=0, Z=0 Complier Never taker
I. Présentation

• Interprétation de l’estimateur des variables instrumentales


• 𝛽!-./ = effet moyen du traitement sur les « compliers »
• 𝛽!-./ = ∆A?@B , avec LATE « Local Average Treatment Effect »
• Problèmes ?
• Selon la proportion de compliers, limite la validité externe de l’estimation…
• Autre problèmes:
• On ne connaît pas a priori la population des compliers
• 𝛽C#&' dépendra de l’instrument utilisé
ÞIntérêt de la théorie économique pour déterminer qui sont les compliers et
comprendre les différences entre les estimations de 𝛽C#&'

21
I. Présentation

• Exemples 3:
• Joshua D. Angrist, William N. Evans (1998). Children and Their Parents' Labor
Supply: Evidence from Exogenous Variation in Family Size. The American Economic
Review. 88(3) :450-477.
• Objectif de l’étude: mesurer l’impact d’une naissance sur l’offre de travail des mères

22
I. Présentation

• Objectif de l’étude: mesurer l’impact d’une naissance sur l’offre de travail


des mères
• Population d’analyse:
• Les couples mariés ayant déjà au moins deux enfants
• Modèle estimé:
-
• Participation au marché du travail = f(avoir plus de deux enfants) Nb
Travail
d’enfants
• Problème rencontré pour mesurer cet effet ?
-
• Détermination simultanée entre offre de travail et du nombre d’enfants
• Risque de surestimation de l’effet du nombre d’enfants sur l’offre de travail
• Solution:
• Variable instrumentale pour la variable « avoir plus de deux enfants »
• Instrument proposé: Le sexe des deux premiers enfants est le même
ÞBon instrument ?
23
Exemple 3

• Exemple 3: Mesure de l’impact d’une naissance sur l’offre de


travail des mères
• Ce que l’on voudrait observer :
?

Naissance Offre de travail

24
Exemple 3

• Exemple 3: Mesure de l’impact d’une naissance sur l’offre de


travail des mères
• Ce qui nous empêche de l’observer :

Naissance Offre de travail

- Causalité inverse

25
Exemple 3

• Exemple 3: Mesure de l’impact d’une naissance sur l’offre de


travail des mères
• Principe des VI: utiliser une variable (instrument) qui explique la
variable endogène mais pas les autres variables pour isoler le lien de
causalité
?
Offre de travail
Naissance des mères

Avoir deux
enfants du
même sexe
I. Présentation

27
28
II. Les tests usuels

• Pour rappel,
• La méthode des VI vise à estimer des coefficients non biaisés en
cas de variable explicative endogène
• Un instrument Z est valide s’il
• n’est pas corrélé avec u (condition 1): Corr(Zi,ui)=0
• Mais est corrélé avec T (condition 2): Corr(Zi,Ti)≠0
Þ Les tests présentés visent à vérifier ces différents points.
• Trois tests couramment effectués quand on met en œuvre les VI:
1. Le test de Wu-Haussman
2. Le test contre les instruments faibles
3. Le test d’exogénéité des instruments
29
II. Les tests usuels
1. Le test de Wu-Haussman
• Test de l’endogénéité de la variable de traitement
• Déroulement du test:
• Première étape: 𝑇! = 𝜋" + 𝜋# 𝑍! + 𝜋$ 𝑋#! + 𝜋% 𝑋$! + 𝑉!
• Seconde étape: on régresse Y en fonction des variables explicatives (endogène
incluse) et du résidu de la régression de la première étape: 𝑌! = 𝛽" + 𝛽# 𝑇! +
𝛽$ 𝑋#! + 𝛽% 𝑋$! + 𝛽& 𝑉1! + 𝑈!
• Conclusion:
• Si le coefficient du résidu de la première étape (𝛽& ) est significatif,
ÞIl y a des variables inobservées et corrélées avec T, capturées par 𝑉1! qui
expliquent Y
Þ T est bien endogène et il faut utiliser les DMC
• Sinon, il faut utiliser un MCO
• Problème de ce test:
30
• Pour pouvoir le réaliser, il faut un bon instrument…
II. Les tests usuels

2. Test contre les instruments faibles


• Les instruments sont ils suffisamment puissants pour corriger le biais
observés avec les MCO ?
• On souhaite vérifier la condition (2): Corr(Zmi,Ti)≠0 , ∀𝑚
• Quel est le problème en cas d’instruments faibles ?
Cov(z,u)
• Par définition, 𝑝𝑙𝑖𝑚 𝛽7#'( = 𝛽# + Cov(z,T)
• Si Cov(z,T) proche de 0 :
• L’estimateur sera imprécis, voire plus biaisé que l’estimateur MCO
« naif »
• L’approximation par la loi normale ne sera pas possible
Þ L’ensemble des tests d’hypothèse et des intervalles de confiance seront
31
faussés
II. Les tests usuels

2. Test contre les instruments faibles


• Considérons le cas où il n’y a qu’une seule variable
explicative endogène et qu’il existe trois instruments (m=3)
• Avec les DMC, on aurait à estimer
• Etape 1: 𝑇! = 𝜋" + 𝜋# 𝑍#! + 𝜋$ 𝑍$! + 𝜋% 𝑍%! + 𝑉!
• Etape 2: 𝑌! = 𝛽" + 𝛽#'( 𝑇?! + 𝑈!
Þ À l’étape 1, il faut qu’au moins un des coefficients 𝜋 soit
significativement différent de 0. Sinon on dira que les instruments sont
faibles

32
II. Les tests usuels

2. Test contre les instruments faibles


• À la première étape, on peut faire un test de Fisher
𝐻D: 𝜋- = 𝜋- = ⋯ = 𝜋< = 0
• 2
𝐻-: 𝜋- ≠ 0 ou 𝜋> ≠ 0 ou…ou 𝜋< ≠ 0
• Règle de décision: si F<10, on considère que les instruments
sont faibles

33
II. Les tests usuels

2. Test contre les instruments faibles


• Et si on conclut que les instruments sont faibles ?
Þ Si m>1, éliminer les instruments avec les statistiques de
Student les plus faibles
Þ Trouver de meilleurs instruments…

34
II. Les tests usuels
3. Le test d’exogénéité des instruments
• Appelé aussi :
• J-test
• test de Sargan-Hansen
• test de suridentification
• On souhaite vérifier la condition (1): Corr(Zmi,ui)=0 , ∀𝑚
• Quel est le problème en cas de non exogénéité des instruments ?
Cov(z,u)
• 𝑝𝑙𝑖𝑚 𝛽7#'( = 𝛽# + )
Cov(z,T)
Þ Estimateur des variables instrumentales sera biaisé
• L’hypothèse conditionnelle d’indépendance des erreurs ne tient pas
Þ La première étape des DMC n’a pas permis d’isoler la part de T qui n’est
35
pas corrélée avec les erreurs
II. Les tests usuels

3. Le test d’exogénéité des instruments


• Attention !
• Test de cohérence globale des instruments, pas de validation
rigoureuse de la condition (1)
• Qui teste le fait que les deux instruments corrigent de la même
façon le biais
• Possible seulement lorsque 𝛽!"# est suridentifié.

36
II. Les tests usuels

3. Le test d’exogénéité des instruments


• Soient T une variable explicative endogène et Z1 et Z2 deux instruments
• Les étapes du J-Test:
1) Estimer le modèle par les doubles moindres carrés en utilisant les m instruments
' calculer les valeurs ajustées 𝑌G! en utilisant 𝑇! et non 𝑇G! :
2) À partir des 𝛽,
• 𝑌(! = 𝛽)" + 𝛽)#&' 𝑇! + 𝛽)$ 𝑋#! + 𝛽)% 𝑋$!
3) Calculer les résidus 𝑢H ! = 𝑌! − 𝑌G!
4) Estimer le modèle auxiliaire par les MCO.
• 𝑢* ! = 𝛿" + 𝛿# 𝑍#! + 𝛿$ 𝑍$! + 𝛿% 𝑋#! + 𝛿( 𝑋$! + 𝜂 !
5) Calcul de la statistique J : J=mF,
• avec F la statistique de Fisher du modèle auxiliaire
• On a 𝐽~𝜒 $ (m-1)
𝐻* : les instruments sont exogènes
6) L
𝐻" : les instruments ne sont pas exogènes
37
38
II. Les tests usuels

3. Le test d’exogénéité des instruments


• Les limites du J-test:
• Nécessite d’avoir trouver au moins deux instruments…
• Permet de vérifier le fait que les deux instruments corrigent de la même
façon le biais
• Le test peut valider deux mauvais instruments…
ÞAu moins un des instruments doit être bon !!
• Le test peut invalider deux bons instruments impactant des populations
différentes …
ÞLes compliers doivent être les mêmes

39
II. Les tests usuels
2. Tester l’exogénéité des instruments
• Exemple: mesure de l’impact des variations de prix sur la demande
de cigarettes
• Référence: Stock, James H. and Mark W. Watson (2003)Introduction to
Econometrics, Addison-Wesley Educational Publishers, chapter 10
• Données:
• 48 Etats des Etats–Unis
• de 1985 à 1995
• Modèle:
• Variable expliquée :
• Les différences de log des consommations entre 1985 et 1995.
• Variables explicatives:
• Les différences de log des prix entre 1985 et 1995. (variable endogène)
• Les différences de log des revenus entre entre 1985 et 1995.
• Instruments:
• Sales tax
40 • Impôts sur les cigarettes.
II. Les tests usuels

41
II. Les tests usuels

2. Tester l’exogénéité des instruments


• Conclusion:
• 𝐻D est rejetée à 5%
• Par contre, le test ne dit pas quel instrument pose problème…
• On peut supposer que l’impôt direct sur le tabac peut être lié à la demande de
cigarettes, contrairement à la TVA
ÞIl vaut mieux n’utiliser que saletax.

42
Conclusion
• La méthode des variables instrumentales:
• Une approche possible pour mesurer un effet causal lorsque l’hypothèse
d’indépendance conditionnelle des erreurs ne semble pas tenir
• Limites des variables instrumentales:
• On mesure un effet local
Þ Remise en question possible de la validité externe de la mesure d’impact de
la PP
• On ne peut jamais valider rigoureusement les estimations par la méthode des
VI
• La validité des tests est une condition nécessaire mais non suffisante pour montrer la
qualité des régressions
• Il faut aussi réussir à convaincre le lecteur que l’instrument influence la variable
explicative endogène et n’influence que celle-ci !
• Pas toujours applicable: il n’existe pas toujours de bon instrument
43

Vous aimerez peut-être aussi