Académique Documents
Professionnel Documents
Culture Documents
D’IMPACT CAUSAL
1
• Les méthodes de mesure d’impact causal déjà évoquées en cours ?
• Les expérimentations aléatoires
• La méthode des variables instrumentales
• Présentation de trois autres méthodes
• Les doubles différences
• L’estimation par discontinuité
• Les appariements
2
LES DOUBLES DIFFÉRENCES OU
DIFFÉRENCES DE DIFFÉRENCES
3
Plan
I. Principe
II. Les tests usuels
III. Cas pratique
4
I. Principes
5
I. Principes
Evolu9on moyenne
E(Y0 / T=0) des non bénéficiaires
7 t0 t1 Temps
I. Principes
• Point de vigilance : une hypothèse est nécessaire pour pouvoir mesurer
un effet causal
• L’évolution temporelle est identique pour les deux groupes en l’absence de la PP
ÞHypothèse de séparabilité entre l’effet tendance et l’effet groupe
• On parlera aussi d’hypothèse identifiante, permettant de mesurer l’effet causal
• Condition suffisante: L’exposition au traitement doit dépendre d’une variable
exogène (corr(Ti, uit)=0)
8
II. Les tests usuels
• Il faut réussir à trouver un groupe de contrôle pour lequel l’hypothèse de séparabilité
semble crédible.
• L’hypothèse de séparabilité ne tient que si:
• Les groupes sont stables dans le temps
• La conjoncture impacte de la même façon les deux groupes
• Le contrefactuel peut être
• Un groupe semblable au groupe de traitement mais n’ayant pas bénéficié de la PP
• Un groupe « synthétique », composées de sous-groupes pondérés en fonction de leur ressemblance au
groupe de traitement
• Un groupe construit artificiellement à partir de méthode de matching (cf section suivante), présentant des
caractéristiques observables identiques
!! L’hypothèse de séparabilité est impossible à tester mais on peut tester sa vraisemblance
avec:
1. Une comparaison des évolutions passées de la variable de résultat.
• On teste si avant la mise en place de la PP, les deux groupes connaissaient effectivement la même évolution
Þ Graphique des évolutions des variables de résultats
2. Des tests “Placebo”
• On effectue une estimation DD autour d’une date où il ne s’est rien passé.
• Si le coefficient 𝛽! est significativement différent de 0 => Problème
9
3. Une comparaison de différentes estimations DD si plusieurs plusieurs groupes de contrôle
existent
II. Cas pratique
• Abadie A., Diamond A. & Hainmueller J. (2010) Synthetic Control Methods for Comparative Case Studies:
Estimating the Effect of California’s Tobacco Control Program, Journal of the American Statistical Association,
105(490): 493-505.
• Population d’analyse:
• Les californiens en 1988
• Objectif:
• Évaluer l’impact de la “proposition 99”, une loi anti-tabac mise en
place en Californie en 1988
• La proposition 99:
• Augmentation des taxes sur le tabac de 25% par paquet,
• Réservation des revenus de ces taxes pour les dépenses de santé, les
programmes éducatifs et de promotion de l’arrêt du tabac,
• Incitation à la création d’espaces non fumeur
10
II. Cas pratique
• Abadie A., Diamond A. & Hainmueller J. (2010) Synthetic Control Methods for Comparative Case
Studies: Estimating the Effect of California’s Tobacco Control Program, Journal of the American
Statistical Association, 105(490): 493-505.
• Modèle estimé:
• Consommation de tabac = f(proposition 99)
• Problèmes rencontrés si on mesure cet effet naïvement ?
ÞLa consommation de tabac en Californie a pu évoluer dans le temps
pour d’autres raisons que la mise en œuvre de la loi anti-tabac
ÞSolution utilisation d’une estimation DD
• Mais la Californie connaissait déjà une évolution très différente de
celles des autres États américains
ÞProblème pour trouver un contrefactuel crédible
11
II. Cas pratique
12
II. Cas pratique
• Solution:
• Estimation par DD avec un contrefactuel construit à partir d’une
moyenne pondérée des consommations par tête dans d’autres États.
• Les pondérations sont inversement proportionnelles aux écarts observés entre
l’État considéré pour
• Les consommations passées de tabac,
• Les déterminants de ces consommations
• Revenu moyen,
• Proportion de jeunes,
• Prix du paquet avant la réforme,
• Consommation de bière par tête.
13
II. Cas pratique
14
II. Cas pratique
15
Conclusion sur la méthode des DD
• La méthode des DD:
• Une approche possible pour mesurer un effet causal lorsque l’on a des données de
panels
• Limites des DD:
• L’hypothèse de séparabilité entre l’effet tendance et l’effet groupe doit être
vérifiée
• Il n’existe pas toujours de contrefactuel crédible vérifiant l’hypothèse
d’évolu;on temporelle iden;que
Þ Ne se prête pas à toutes les PP
• On travaille souvent sur des sous-popula;ons restreintes
• Remise en ques;on possible de la validité externe de la mesure d’impact
de la PP
• La période de temps considérée doit être rela;vement courte pour ne pas
16
capter d’évolu;ons qui ne seraient pas liées à la mesure.
ESTIMATION PAR DISCONTINUITÉ
17
I. Principes
• Certaines PP utilisent une variable continue décrivant la
population de bénéficiaires potentiels pour définir les personnes
éligibles
• Exemple:
• Revenu,
• Indice de pauvreté,
• Note à un examen,
• Âge.
• Ces seuils sont en général utilisés pour :
• Classer ces participants par ordre de priorité
• Établir un seuil déclenchant le statut de bénéficiaires
18 Þ Discontinuité dans l’éligibilité à la PP
I. Principes
• Pons, V. and Tricaud, C. (2018), Expressive Voting and Its Cost: Evidence From Runoffs With
Two or Three Candidates. Econometrica, 86: 1621-1649. https://doi.org/10.3982/ECTA15373
• Règle de qualification pour le second tour pour les élections
législatives et départementales françaises :
• Les candidats arrivés en première et deuxième position au premier tour sont
éligibles d’office
• Un troisième candidat se qualifie uniquement s’il obtient un nombre de voix
supérieur à 12,5 % des inscrits.
• Objectif de l’étude: Mesurer l’impact de la présence d’un troisième
candidat sur les résultats d’une élection
• Stratégie d’identification
• Comparaison des résultats dans les circonscriptions ou cantons dans
lesquels le troisième candidat a obtenu un score entre 12,4 % et 12,6 %
• Données:
• Résultats des élections législatives et départementales françaises selon que
19 deux ou trois candidats sont en lice au second tour.
I. Principes
• Pons, V. and Tricaud, C. (2018), Expressive Voting and Its Cost: Evidence From Runoffs
With Two or Three Candidates. Econometrica, 86: 1621-1649.
• Résultats :
1. La présence d’un troisième candidat au second tour augmente la
participation électorale
20
I. Principes
• Pons, V. and Tricaud, C. (2018), Expressive Voting and Its Cost: Evidence From Runoffs
With Two or Three Candidates. Econometrica, 86: 1621-1649.
• Résultats :
2. La présence d’un troisième candidat au second tour diminue le
nombre de voix obtenues par les deux premiers candidats de 6,9
points de pourcentage
21
I. Principes
• Pons, V. and Tricaud, C. (2018), Expressive Voting and Its Cost: Evidence From Runoffs
With Two or Three Candidates. Econometrica, 86: 1621-1649.
• Résultats :
3. La présence du troisième candidat affaiblit principalement le
candidat à l’idéologie la plus proche de la sienne et entraîne sa
défaite dans 19,2 % des élections
22
I. Principes
• La méthode d’estimation par discontinuité exploite la discontinuité
dans le fait de bénéficier de la PP
Þ les personnes bénéficiaires et non bénéficiaires au voisinage de ce seuil
sont très similaires.
Þ Il est crédible de penser qu’au voisinage du seuil : l’hypothèse CIA est
vérifiée dans cette sous-population
• Estimation :
Þ Effectuée sur un sous-échantillon localisé autour du seuil
Þ 𝑌! = 𝛽" + 𝛽# 𝑇! + ∑&$%# 𝛽$'# 𝑋$'# + 𝑢!
• AHen;on:
• 𝛽# ≠ Δ())
• 𝛽# = Δ*()+
Þ Mesure la différence entre les par;cipants et les non-par;cipants localisés
au voisinage du seuil d’éligibilité.
23
24
Graphique 9ré de Josselin et al. (2018. Page 513
I. Principes
• Remarques :
1. L’estimation par discontinuité ne peut être utilisée que si
• La PP évaluée u<lise un indice con<nue pour iden<fier ses bénéficiaires,
auquel on applique un seuil d’éligibilité
• Le seuil d’éligibilité ne doit pas être u<lisé pour une autre PP
Þ Sinon on n’évalue pas seulement les effets de la PP qui nous intéresse
25
I. Principes
• Remarques :
2. La mesure de la causalité est valide si et seulement si
l’indice ne peut pas être manipulé (exogène)
26
Graphique 9ré de Gertler, P.J. et al. 2016. p.120
I. Principes
• Remarques :
3. Il y a deux types d’estimation par discontinuité: franche versus floue
• La régression par discon<nuité franche (« sharp »)
Þ Toutes les personnes éligibles bénéficient de la PP et les non-éligibles
n’en bénéficient pas
• La régression par discon<nuité floue (« fuzzy »)
Þ Une par<e des personnes éligibles ne bénéficient pas de la PP et/ou une
par<e des personnes non éligibles en bénéficient
Þ Traitement sta<s<que différent car la discon<nuité est dans la
probabilité d’être traité
• Pour les es<ma<ons, u<lisa<on de la méthode des variables
instrumentales avec le seuil comme instrument
• Inconvénient: l’es<mateur de l’impact est encore plus localisé car il
est autour du seuil et pour les compliers de l’instrument
27
II. Exemple
Guthmuller S. et Wittwer J., « L’effet de la Couverture maladie universelle complémentaire (CMU-C) sur le nombre de visites chez
le médecin : une analyse par régression sur discontinuités », économie publique/Public economics.
• Population d’analyse:
• Les ménages modestes français
• La CMUC:
• Non obligatoire
• Peuvent y souscrire les ménages dont le revenu est inférieur à 8 951€
• Permet de compléter le remboursement de l’AMO
• Objectif:
• Déterminer si les ménages modestes qui ne sont pas éligibles à la CMU-C recourent moins aux soins que les ménages
bénéficiant de cette couverture gratuite.
• Modèle estimé:
• Nombre de visites chez le médecins = f(CMUC)
• Problèmes rencontrés pour mesurer cet effet ?
• Solution?
• Ne comparer que les individus autour autour du seuil d’éligibilité
=> Sélection des personnes dont le revenu familial par Unité de consommation l’année précédent est compris dans l’intervalle défini par le plafond de la CMU-C + ou – 20%
28
29
30
Conclusion
• L’estimation par discontinuité est possible
• Uniquement pour les PP avec un seuil déclenchant le statut de bénéficiaire
• En cas de grands échantillons
• Car u&lisa&on d’un sous-échan&llon d’individus autour du seuil d’éligilité
Þ Problème fréquent de puissance sta&s&que
Þ Arbitrage entre l’éloignement du seuil d’éligibilité et la crédibilité de l’hypothèse CIA
pour la sélec&on de la sous-popula&on d’analyse
• Faire des analyses de sensibilité pour tester différents choix méthodologiques
• Attention à l’interprétation :
Þ Effet local de la PP: les résultats ne sont valables que pour les individus
à proximité du seuil !
• Problème important si l’objectif de la PP est de déterminer si une PP doit être
mise en place dans la population cible
Þ Validité externe limitée
31 • Aucun problème si l’objectif est de contribuer à une réflexion autour de la valeur
du seuil
LES TECHNIQUES D’APPARIEMENT
Pauline Chauvin
University of Paris Descartes
pauline.chauvin@parisdescartes.fr
32
I. Principes
33
I. Principes
34
I. Principes
35
I. Principes
36
Table 9ré de Gertler et al. (2016). Page 108.
I. Principes
• Différentes étapes de la mise en œuvre:
1. Détermination des variables observables expliquant la participation à
la PP
2. Constitution d’un sous-échantillon de bénéficiaires et de non-
bénéficiaires à partir de ces variables observables
• Il existe différentes méthodes d’appariement:
ÞSélection de paire d’individus (bénéficiaire / non béneficiaire) ayant
• Les mêmes caractéristiques ou ayant la même probabilité de bénéficier de la PP
ÞSi les variables sont nombreuses, estimation de la probabilité de bénéficier du
traitement (Rosenbaum et Rubin 1983).
ÞOn parlera de méthode d’appariement par le score de propension
• Des probabilités proches de bénéficier de la PP.
ÞPlusieurs méthodes existent:
• Méthode du plus proche voisin
• Méthode « caliper matching ».
37 • Défini:on d’une distance maximum pour que le matching soit acceptable
Graphique 9ré de Josselin et al. (2018). Page .
38
Unité jaune= unité bénéficiaire
Unité bleue = unité non bénéficiaire
40
Graphique +ré de Josselin et al. (2018). Page 502.
I. Principe
41
Table 9ré de Gertler et al. (2016). Page 111.
I. Principes
42
II. Limites
43
II. Limites
44
III. Exemple
• Karl Even, Tristan Klein, Denis Fougère, Valentine Henrard, Cyril Nouveau (2007). Les contrats et stages aidés : un
profit à moyen terme pour les participants ? Les exemples du CIE, du CES et du Sife. Economie et Statistique Année
2007 408-409: 3-43.
• Méthodes
• Etape 1:
• une régression logistique pour estimer la probabilité de participer à l’un des
dispositifs (= score de propension)
• Variables explicatives
• Démographiques (sexe - âge) ;
• tenant à la situation antérieure à la date d’entrée dans un des dispositifs (objectif
avant l’entrée en dispositif (au début de l’inscription à l’ANPE pour les demandeurs
d’emploi) - parcours professionnel - catégorie d’emploi - ancienneté au chômage -
démarches de recherche d’emploi - niveau de formation - situation familiale - niveau
de vie - être propriétaire) ;
• liées à des difficultés particulières (handicap physique - discrimination sur l’origine -
problèmes de transport).
46
III. Exemple
47
III. Exemple
• Karl Even, Tristan Klein, Denis Fougère, Valentine Henrard, Cyril Nouveau (2007). Les contrats et stages aidés :
un profit à moyen terme pour les participants ? Les exemples du CIE, du CES et du Sife. Economie et
Statistique Année 2007 408-409: 3-43.
• Méthodes
• Etape 2: estimation de l’efficacité des programmes, à partir de deux méthodes
pondérant le poids des individus du groupe de contrôle en fonction de leur score de
propension
• L’estimateur à noyau développé par Heckman et al. (1997)
• Chaque individu du groupe de contrôle participe à la construction du contrefactuel
d’un bénéficiaire avec une importance qui varie selon la distance entre son score et
celui de l’individu considéré
• L’estimateur pondéré proposé dans Dehejia et Wahba (2002)
• Pondère la situation de chaque témoin selon son score calculé dans l’étape
précédente
48
III. Exemple
• Karl Even, Tristan Klein, Denis Fougère, Valentine Henrard, Cyril Nouveau (2007). Les contrats et stages aidés :
un profit à moyen terme pour les participants ? Les exemples du CIE, du CES et du Sife. Economie et
Statistique Année 2007 408-409: 3-43.
• Résultats :
• En moyenne le CIE est efficace du point de vue du retour à
l’emploi et de l’améliora9on du niveau de vie
• Le CES et les Sife collec9fs n’améliorent pas significa9vement les
trajectoires des bénéficiaires par rapport à celles des témoins.
49
III. Exemple
50
III. Exemple
51
III. Exemple
52
III. Exemple
53
III. Exemple
54
III. Exemple
55