Vous êtes sur la page 1sur 9

TD 

: Evaluation des politiques publiques


Section 3 : La méthode des doubles différences
3.1. Question de cours
1) Qu’est ce que la méthode des doubles différences ?

2) Quels sont les avantages de cette méthode ?

3) Rappelez les hypothèses identifiantes

4) Quelle différence entre simple et double différence ?

3.3.2.a
t.test(table3$health_expenditure~table3$round, data=table3, enrolled==0)
Welch Two Sample t-test
data: table3$health_expenditure by table3$round
t = -4.9283, df = 2607.2, p-value = 0.0000008813
alternative hypothesis: true difference in means between group 0 and group
1 is not equal to 0
95 percent confidence interval:
-2.1155698 -0.9112626
sample estimates:
mean in group 0 mean in group 1
20.79149 22.30491

Interprétation  : en période 0 la dépense était de 20.79 et en période 1 de 22.30 pour les non traités.
La dépense a donc augmenter pour les non traités en avant et après le traitement.

3.3.2.b
t.test(table3$health_expenditure~table3$round, data=table3, enrolled==1)
Welch Two Sample t-test
data: table3$health_expenditure by table3$round
t = 39.768, df = 4581.9, p-value < 2.2e-16
alternative hypothesis: true difference in means between group 0 and group
1 is not equal to 0
95 percent confidence interval:
6.321709 6.977321
sample estimates:
mean in group 0 mean in group 1
14.489694 7.840179

Interprétation  : en période 0 la dépense était de 14.48 et en période 1 de 7.84 pour les traités. La
dépense a donc augmenté pour les traités en avant et après le traitement.
Section 4 : La régression par discontinuité
4.1. Question de cours
1) Qu’est ce que la méthode de régression par discontinuité ?

2) Quelles sont les hypothèses identifiantes ?

4.3.1
table1<-Dataset[Dataset$treatment_locality==1 & Dataset$round==0,]

4.3.2
RegModel.1 <- lm(table1$health_expenditures ~ table1$poverty_index,
data=table1, round==0)

summary(RegModel.1)

Call:
lm(formula = table1$health_expenditures ~ table1$poverty_index,
data = table1, subset = round == 0)

Residuals:
Min 1Q Median 3Q Max
-18.1134 -3.0887 -0.0425 2.9392 16.7317

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.127431 0.356504 0.357 0.721
table1$poverty_index 0.301659 0.006256 48.217 <2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 4.608 on 4957 degrees of freedom


Multiple R-squared: 0.3193, Adjusted R-squared: 0.3191
F-statistic: 2325 on 1 and 4957 DF, p-value: < 2.2e-16

4.3.3

r1<- lm(health_expenditures~poverty_index, data=table1)


summary(r1)

r2<- predict(r1)
table1$predict = r2

summary(r2)
Min. 1st Qu. Median Mean 3rd Qu. Max.
7.074 14.931 16.873 17.025 18.847 30.293

numSummary(table1[,"health_expenditures", drop=FALSE],
statistics=c("mean", "sd", "IQR", "quantiles"),
quantiles=c(0,.25,.5,.75,1))
mean sd IQR 0% 25% 50% 75% 100%
n
17.0249 5.584955 8.089426 6.252154 12.8254 16.67715 20.91482 35.62636
4959

Interprétation : la valeur moyenne de la prédiction est la même que la valeur moyenne du modèle

4.3.4

plot(table1$health_expenditures, table1$poverty_index)
plot(table1$predict, table1$poverty_index)

Interprétation : oui il y a bien une relation linéaire entre pauvreté et dépense de santé

4.3.5

install.packages("kdensity")
kde<-kdensity(table1$poverty_index)
plot(kde, main = "Kernel Density")
Interprétation : la plus grande densité se trouve autour de la valeur du seuil de pauvreté

4.3.6

scatterplot(enrolled~poverty_index, regLine=FALSE, smooth=FALSE,


boxplots=FALSE, data=table1)
4.4.2

table2$poverty_index_left = table2$poverty_index - 58

table2$poverty_index_left = ifelse(table2$poverty_index>58,0,table2$poverty_index_left)

table2$poverty_index_right = table2$poverty_index + 58

table2$poverty_index_right = ifelse(table2$poverty_index<58,0,table2$poverty_index_right)

4.4.3

table3<-table2[table2$round==1,]

Section 5 : Les variables instrumentales


5.1 Questions de cours

1) Rappelez ce qu’est le problème de l’endogénéité

2) Rappelez ce qu’est un instrument

3) Qu’est-ce qu’une 2SLS ? Expliquez

5.3.2
table(table5[table5$promotion_locality==1 & table5$round==1,]$enrolled)

0 1
2529 2554

table(table5[table5$promotion_locality==0 & table5$round==1,]$enrolled)

0 1
4420 411

t.test(table5$enrolled ~ table5$promotion_locality, data=table5, round==1)

Welch Two Sample t-test


data: table5$enrolled by table5$promotion_locality
t = -51.648, df = 8048.3, p-value < 2.2e-16
alternative hypothesis: true difference in means between group 0 and group
1 is not equal to 0
95 percent confidence interval:
-0.4332251 -0.4015422
sample estimates:
mean in group 0 mean in group 1
0.08507555 0.50245918

5.3.3
Interprétation  :
La moyenne des gens qui n’ont pas eu la campagne 0,08 (8%) et qui se sont engagé
La moyenne des gens qui ont eu la campagne 0,5 (50%) et qui se sont engagé

La p value est très faible (2.2e-16) : la campagne de pub a une incidence sur le taux d’engagement

5.3.4
Si on ne met pas promotion_locality dans l’équation, T i sera biaisé
Il y a bien endogénéité entre enrolled et promotion_locality

5.3.5
t.test(table5$health_expenditures ~ table5$promotion_locality,
data=table5, round==0)

Welch Two Sample t-test

data: table5$health_expenditures by table5$promotion_locality


t = 0.46812, df = 9855.4, p-value = 0.6397
alternative hypothesis: true difference in means between group 0 and group
1 is not equal to 0
95 percent confidence interval:
-0.1676524 0.2728498
sample estimates:
mean in group 0 mean in group 1
17.23795 17.18535

Interprétation : La dépense de santé moyenne dans les villes qui n’ont pas eu la campagne et les
villes qui vont avoir la campagne (avant la campagne) sont environ égale. Ceux qui est normal la
campagne n’a pas encore eu lieu

t.test(table5$health_expenditures ~ table5$promotion_locality,
data=table5, round==1)
Welch Two Sample t-test

data: table5$health_expenditures by table5$promotion_locality


t = 16.494, df = 9824.8, p-value < 2.2e-16
alternative hypothesis: true difference in means between group 0 and group
1 is not equal to 0
95 percent confidence interval:
3.413464 4.334257
sample estimates:
mean in group 0 mean in group 1
18.84538 14.97152

Interprétation  : La dépense de santé a baissé dans les villes qui ont reçu la campagne du pub. La p
value est petite donc très significative. On conclue que la campagne de pub a un effet sur la dépense
de santé

Causalité simultané car promotion_locality explique enrolled et promotion_locality est corrélé a Y i


(c’est la définition même de l’endogénéité)

5.4.1
install.packages("AER")

5.4.2
table6<-Dataset[Dataset$round==1,]

5.4.3
iv <- ivreg(table6$health_expenditures ~ table6$enrolled |
table6$promotion_locality, data=table6)

summary(iv)

Call:
ivreg(formula = table6$health_expenditures ~ table6$enrolled |
table6$promotion_locality, data = table6)

Residuals:
Min 1Q Median 3Q Max
-11.428 -6.858 -2.763 3.590 97.196

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 19.6350 0.1836 106.95 <2e-16 ***
table6$enrolled -9.2813 0.5035 -18.43 <2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 10.46 on 9912 degrees of freedom


Multiple R-Squared: 0.2264, Adjusted R-squared: 0.2264
Wald test: 339.8 on 1 and 9912 DF, p-value: < 2.2e-16

Interprétation  : Par cette procédure on a traité l’endogénéité en intégrant promotion_locality


comme instrument. L’effet enrolled est négatif et significatif

Vous aimerez peut-être aussi