Vous êtes sur la page 1sur 43

Propensity Score Matching

Rafael Terra
Universidade de Braslia-Unb

28 de Setembro, 2015

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 1 / 43
Introducao

O procedimento de Propensity Score Matching (PSM) guarda uma


similaridade muito grande com o metodo experimental.
Umas das vantagens do PSM e ser bastante intuitivo.
Sua ideia basica e a de encontrar um grande grupo de nao tratados com
caractersticas pre-tratamento semelhantes `as dos tratados.
Uma vez encontrado esse grupo muito parecido, qualquer diferenca em
termos de resultados pode ser atribuda ao tratamento.
Rosenbaum e Rubin (1983) sugerem o uso dos chamados Balance Scores
b(X ), dentre os quais podemos mencionar o Propensity Score (PSM).

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 2 / 43
Passos para Calculo do PSM

Figura 1: Passos para o pareamento

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 3 / 43
Arcabouco de Avaliacao e Princpios de Pareamento

Partimos do modelo de Roy-Rubin, de acordo com o qual, para inferirmos


o impacto de um tratamento sobre o resultado de interesse de um indivduo,
deveramos conhecer o resultado do indivduo se ele nao tivesse recebido o
tratamento (ver Roy (1951) e Rubin (1974)).
Di = {0, 1} em que 0 representa ausencia de tratamento, e 1 representa a
presenca de tratamento.
Os resultados potenciais sao representados por Yi (Di ) para cada indivduo i
tal que i = 1, ..., N.
O efeito do tratamento para um indivduo e dado por:
i = Yi (1) Yi (0) (1)

i.e. o efeito do tratamento e dado pela diferenca entre os resultados


potenciais se o indivduo tivesse recebido o tratamento e se nao tivesse
recebido. O resultado nao observado e chamado de contrafactual, i.e. se
Di = 1, Yi (1) e observado, e Yi (0) e o contrafactual.
Sem hip
oteses especficas nao e possvel identificar i
Rafael Terra (Unb) Econometria do Setor P
ublico 28 de setembro, 2015 4 / 43
Arcabouco de Avaliacao e Princpios de Pareamento

O parametro que recebe a maior atencao na literatura de avaliacao e o


Efeito do Tratamento sobre os Tratados (ATT)
O ATT e dado por

ATT = E ( |D = 1) = E [Y (1)|D = 1] E [Y (0)|D = 1] (2)

E [Y (0)|D = 1] e o contrafactual.
Usar E [Y (0)|D = 0] como substituto em estudos nao experimentais
geralmente nao e uma boa ideia.
Em estudos nao experimentais, e provavel que as variaveis que determinam a
selecao ao tratamento tambem determinem o resultado de interesse Yi .

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 5 / 43
Arcabouco de Avaliacao e Princpios de Pareamento

O estimador ingenuo dado pela diferenca de medias e viesado. Para ver isso,
basta notar que

E [Y (1)|D = 1] E [Y (0)|D = 0] = ATT + E [Y (0)|D = 1] E [Y (0)|D = 0]


(3)
S
o podemos identificar ATT se E [Y (0)|D = 1] = E [Y (0) = 0|D = 0].
Isso pode ser garantido pela randomizacao do tratamento.
Lembre que o Efeito Medio do Tratamento e dado por

ATE = E [Y (1) Y (0)] (4)

O problema para obter ATE e que ambos os resultados contrafactuais


E [Y (1)|D = 0] e E [Y (0)|D = 1] devem ser conhecidos (ou estimados).

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 6 / 43
Independencia Condicional

Uma forma de garantir que a distribuicao do tratamento e independente


dentro de um grupo com caractersticas parecidas consiste em recorrermos `a
hip
otese de independencia condicional.
Dado um conjunto de covariadas observaveis X , nao afetadas pelo
tratamento, os resultados potenciais sao independentes da designacao do
tratamento:

(Unconfoundedness)Y (0), Y (1)


D|X , X (5)

Ou seja, a selecao e baseada exclusivamente em caractersticas observaveis e


as variaveis que em influenciam simultaneamente a designacao do
tratamento e os resultados potenciais sao observadas pelo pesquisador.
Esta e uma suposicao forte.
Assumiremos daqui em diante que essa hip
otese e valida.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 7 / 43
Independencia Condicional

Como visto anteriormente, se a selecao ao tratamento se der com base em


uma variavel dummy D = {0, 1}, observamos uma probabilidade diferente
de tratamento quando D = 0 ou D = 1.
Podemos eliminar esse vies se calcularmos o ATT pela formula
EbD {[Eb[Yi |T = 1, D] Eb[Yi |T = 0, D]}.
Podemos dizer que essa formulacao constitui um Matching nao parametrico.
A realizacao deste procedimento se torna problematica quando o numero de
dimensoes aumenta (aumenta o n umero de variaveis independentes em X ),
ou trabalhamos com mais de uma variavel contnua.
Se tivermos s variaveis dummy, o n oes sera 2s .
umero de dimens
Para lidar com o problema de dimensionalidade podemos usar o Propensity
Score - derivado do trabalho de Rosenbaum e Rubin (1983).

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 8 / 43
Independencia Condicional

Os autores mostram que, se os resultados potenciais sao independentes do


status do tratamento condicional em X , tambem serao independentes do
status de tratamento condicional em P(D = 1|X ) = P(X ). A hipotese de
independencia condicional nesse caso e dada por

(Unconfoundedness)Y (0), Y (1)


D|P(X ), X (6)

Outra hipotese importante para identificacao do Efeito do Tratamento e a


hip
otese de Suporte Comum.
Essa hip
otese requer que haja sobreposicao entre as distribuicoes dos escores
de propensao estimados P(X ) de tratados e controles. Isto e

(Sobreposicao) 0 < P(D = 1|X ) < 1 (7)

Essa condicao garante que pessoas com os mesmos valores de X tem a


mesma probabilidade (positiva) de serem tratadas, independentemente de
serem ou nao tratadas.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 9 / 43
Estrategia de estimacao

Considerando que as hip


oteses (6) e (7) sejam satisfeitas temos o que
Rosembaum e Rubin (1983) denominam ignorabilidade forte. Portanto,
com base nessa hip
otese podemos escrever o ATT como
x
ATT = E ( |D = 1) = EP(X ) {E [Y (1)|D = 1, P(X )]E [Y (0)|D = 0, P(X )]}
(8)
O Estimador PSM e simplesmente a media da diferenca entre resultados de
tratados e controles sobre o suporte comum, dentro de um determinado
estrato de propensity score, ou entre unidades de tratados e controles com
P(X ) muito parecido.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 10 / 43
Implementacao de Propensity Score Matching: estimando
P(X )

Podemos usar Logit ou Probit, pois retornam probabilidades dentro do


intervalo unitario.
Pode-se usar Modelo Linear Probabilsticos. Nesse caso a concentracao nas
caudas da distribuicao sera maior.
No caso de tratamentos m
ultiplos (mais de uma opcao de tratamento),
Imbems (2000) e Lechner (2001) recomendam o uso de Multinomial Probit.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 11 / 43
Implementacao de Propensity Score Matching: escolha de
covariadas

Para satisfazer a condicao de ignorabilidade forte devemos escolher X com


cuidado.
Heckman, Ichimura e Todd (1997 ) mostram que a omissao de variaveis
importantes pode aumentar seriamente o vies das estimativas.
Apenas variaveis que afetem simultaneamente o resultado e a participacao
do tramento precisam ser includas.
Tais variaveis devem ser ex
ogenas ao tratamento. Isto e, o tratamento, ou a
antecipacao do tratamento, nao pode afetar as variaveis em X .
Essas variaveis devem ser fixas no tempo ou pre-tratamento.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 12 / 43
Implementacao de Propensity Score Matching: escolha de
covariadas

Se P(X ) = 0 ou P(X ) = 1, para alguns valores de X, entao nao podemos


usar o matching condicional esses valores de X para estimar o efeito do
tratamento, pois pessoas com essas caractersticas sempre ou nunca
recebem o tratamento.
Nesse caso, a condicao de suporte comum em (7) falha, e o matching nao
pode ser feito nessas observac
oes.
Alguma aleatoriedade e necessaria para garantir que pessoas com
caractersticas identicas possam ser observadas nos dois estados (tratamento
e controle) (Heckman, Ichimura e Todd, 1998).
A inclusao de variaveis nao significativas nao enviesara as estimativas, mas
aumentara sua variancia.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 13 / 43
Implementacao de Propensity Score Matching: escolha de
covariadas

Com esse aumento na variancia das estimativas, alguns tratados podem ser
descartados da analise, ou os mesmos controles podem acabar sendo usados
mais de uma vez.
Os autores mostram que o matching realizado somente com base nas
variaveis significativas produz melhores estimativas do ATE.
Por outro lado, Rubin e Thomas (1996) recomendam nao excluir variaveis
da estimacao do propensity score a nao ser que haja consenso de que essas
variaveis nao estejam correlacionadas com os resultados ou nao sao
apropriadas com base na teoria e achados empricos anteriores.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 14 / 43
Implementacao de Propensity Score Matching: escolha de
covariadas - Hit or Miss

Heckman, Ichimura, Smith e Todd (1998) e Heckman e Smith (1999)


prop
oem um procedimento para escolha das covariadas denominado Hit or
Miss.
1 De acordo com esse metodo, primeiramente obtemos a probabilidade
estimada de receber o tratamento pelos metodos Probit ou Logit.
2 Em seguida, dada a proporcao de tratados P na amostra, criamos uma
variavel igual a 1 para cada P(X
b ) > P, e igual a 0 caso P(X
b ) < P.
3 Sempre que a variavel criada V apresentar valor igual a 1 e o indivduo
for tratado, i.e. D = 1, ou sempre que V = 0 e o indivduo for um
controle, i.e. T = 0, temos um Hit. Quando V 6= D temos um
Miss. Quanto maior a proporcao de Hits, melhor sera o modelo
que determina o tratamento.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 15 / 43
Implementacao de Propensity Score Matching: escolha de
covariadas - Significancia Estatstica

Esse metodo requer que se parta de um modelo parcimonioso, e a partir da,


adicionamos variaveis explicativas, e s
o as retemos no modelo se se
mostrarem estatisticamente significantes.
Note que essas variaveis devem ser ex
ogenas.
Podemos combinar esse procedimento com o metodo Hit or Miss.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 16 / 43
Implementacao de Propensity Score Matching: escolha de
covariadas - Cross-Validation

Black e Smith (2003) sugerem comecar com um modelo parcimonioso, e


proceder inserindo blocos de variaveis (demograficas, economicas, etc), e
comparar o R 2 .
Quanto mais variaveis sao includas, maior sera a variancia de P(X ), o que
pode provocar problemas de falta de sobreposicao entre a distribuicao de
tratados e controles em determinados pontos da distribuicao (problema de
suporte comum).

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 17 / 43
Implementacao de Propensity Score Matching: escolha de
covariadas - Pesos maires para algumas variaveis

` vezes pode-se achar que algumas variaveis tem um papel mais


As
importante na determinacao da participacao no programa e do resultado.
No Metodo de Propensity Score Matching, se tivermos duas regioes A e B,
com homens e mulheres, em que o salario na regiao A e maior que em B, e
o salario de homens e maior do que o de mulheres, podemos acabar
pareando mulheres de uma regiao com homens de outra.
Pode-se, nesse caso, realizar o pareamento por subgrupos. Por exemplo,
dentro de um subgrupo composto por mulheres da regiao A, pode-se realizar
o pareamento. Assim garantiremos que os pares de tratados e controles, sao
do mesmo sexo e vivem na mesma regiao, e ganham renda parecida.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 18 / 43
Implementacao de Propensity Score Matching: escolha de
covariadas - Alternativas ao Propensity Score

Como mencionado anteriormente, podemos usar um modelo linear


probabilstico no lugar do propensity score para realizar o matching.
Quando o tratamento ocorre ao longo do tempo, alguns apresentarao
maiores chances de serem tratados em um perodo do que em outro. Nesse
caso, Brodaty, Crepon, e Fougere (2001) e Sianesi (2004) recomendam a
estimacao de um ndice por meio de modelos de duracao.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 19 / 43
Implementacao de Propensity Score Matching: Escolha do
Algoritmo de Matching

Existem varios formas de criar um grupo contrafactual por meio de PSM.


Tais procedimentos diferem tambem quanto a definicao de pesos para cada
observacao e quanto a maneira como o suporte comum e determinado.
Dentre os diferentes algoritmos podemos citar
1 Nearest Neighbour(NN)
2 Caliper e Radius
3 Estratificacao e Matching por Intervalo
4 Kernel e Regressao Linear Local
5 Ponderacao pelo PS.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 20 / 43
Implementacao de Propensity Score Matching: Nearest
Neighbour

Para cada unidade tratada, o algoritmo busca a unidade nao tratada com
propensity score mais pr
oximo.
Podemos escolher que o pareamento seja feito com ou sem reposicao.
1 Com reposicao implica que uma vez que um indivduo nao tratado e
pareado com um tratado, esse controle volta para o pool de unidades
nao tratadas e pode ser escolhido novamente. Portanto, uma mesma
unidade pode ser usada duas ou mais vezes como controle.
Se permitirmos a reposic ao, a qualidade media do pareamento
aumentara e o vies ir
a diminuir.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 21 / 43
Implementacao de Propensity Score Matching: Nearest
Neighbour

2 Sem reposicao implica que uma vez que o indivduo nao tratado e
pareado, ele nao pode ser usado como controle de outra unidade.
Quando n ao h
a reposic
ao o vies pode aumentar, mas a vari ancia e
menor.
No caso de n ao haver reposic
ao, a ordem segundo a qual as observaco es
s
ao pareadas afetara o resultado final. Softwares especficos permitem
fixar a semente para reproduzir exatamente os resultados.

Pode-se tambem atribuir mais de um vizinho mais pr


oximo, e.g. 2,5,10
vizinhos mais pr
oximos.
Tambem nesse caso ha um trade-off entre variancia e vies. Quanto mais
vizinhos sao utilizados para construir o contrafactual (controle), menor sera
a variancia, mas aumenta o vies.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 22 / 43
Implementacao de Propensity Score Matching: Radius e
Caliper

Se o vizinho mais pr oximo esta distante, o algoritmo de Nearest Neighbour


corre o risco de realizar pareamentos ruins.
Nesse caso, podemos estabelecer um nvel de tolerancia em termos de
unidades de propensity score que denominamos caliper, e procurarmos
vizinhos mais pr
oximos dentre desse intervalo.
Esse procedimento diminui o vies, mas pode aumentar a variancia, pois
pode nao existir nenhum vizinho dentro do caliper.
Dehija e Wahba (2002) sugerem outro procedimento semelhante
denominado radius matching, que consiste em usar a media de todos os
vizinhos dentro do caliper.
Esse procedimento aumenta o vies em relacao ao caliper matching,
mas pode diminuir a variancia.
Difcil saber qual intervalo de tolerancia utilizar.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 23 / 43
Implementacao de Propensity Score Matching:
Estratificacao e Matching por Intervalo

Dividimos o suporte comum do propensity score em intervalos (strata) e


entao calculamos o impacto do programa em cada intervalo (diferenca de
media entre tratados e controles). Depois tiramos uma media ponderada
pelo numero de tratados em cada intervalo.
Cochrane e Chambers (1965) mostram que 5 classes sao suficientes para
remover 95% do vies associado a uma u
nica covariada.
Para saber a quantidade de estratos ideal, defina uma quantidade de
estratos, e.g. igual a 5, e teste se ha balanceamento entre tratados e
controles em termos de propensity score.
Se nao estiverem balanceados, o estratos estao muito grandes, e preciso
mais estratos.
Se estiverem balanceados, mas nao estiverem balanceados em termos das
caractersticas observaveis X , o propensity score deve ser reespecificado,
com a inclusao de termos ao quadrado e interac oes entre as variaveis.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 24 / 43
Implementacao de Propensity Score Matching: Kernel

O Kernel Matching (KM) consiste em usar todas as unidades


R de controle
ponderadas por uma funcao densidade K (u) tal que K (u)du = 1, que
atribui pesos maiores quanto mais pr
oxima da unidade de tratamento as
unidades de controle estiverem. Note que podemos definir que a funcao
kernel seja definida em uma banda (intervalo) ao redor da unidade de
tratamento.
Por usar mais informac
oes, esse metodo tem menor variancia.
Os pesos sao definidos como
 
Pj Pi
K an
(i, j)KM = P   (9)
Pk Pi
kC K an

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 25 / 43
Implementacao de Propensity Score Matching: Kernel

an e o tamanho da banda, e K () e a funcao kernel, que pode ser uma dentre

1
Uniforme : K (u) = 1|u|1
2
Triangular : K (u) = (1 |u|)1|u|1
3 (10)
Epanechnikov : K (u) = (1 u 2 )1|u|1
4
1 1 2
Gaussiana : K (u) = e 2 u
2

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 26 / 43
Implementacao de Propensity Score Matching: Kernels

Uniform
1.0 Triangle
Epanechnikov
Quartic
Triweight
0.8
Gaussian
Cosine

0.6

0.4

0.2

0.0

-1.0 -0.5 0.0 0.5 1.0

Figura 2: Kernels

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 27 / 43
Implementacao de Propensity Score Matching: Local
Linear Matching

Considerando o plano (Y C P(X )), o Metodo de Local Linear Regression


consiste em ajustar retas ou polin
omios de forma a minimizar os erros de
observac
oes no entorno de cada unidade de tratamento.
Essa regressao pondera dados mais pr
oximos da unidade de tratamento mais
fortemente.
Com isso, e possvel obter uma reta e estimar um contrafactual Y C para
cada valor de P(X ) para os tratados.
O problema pode ser expresso por

n0  
X P(Xi ) P(Xj )
mina,b (Y0j a b(P(Xj ) P(Xi )))2 K
hn (11)
j=1

p/ Dj = 0

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 28 / 43
Implementacao de Propensity Score Matching: Local
Linear Matching

em que hn e a distancia ate o vizinho mais distante (banda).


Nao ha consenso sobre o tamanho da banda a ser escolhida.
De fato o problema pode ser expresso como uma ponderacao tambem (Ver
Shahidur et al. (2010)).

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 29 / 43
Implementacao de Propensity Score Matching:Local Linear
Regression

Figura 3: LLR

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 30 / 43
Implementacao de Propensity Score Matching:Ponderacao
pelo Propensity Score

Pode-se ponderar diretamente as observac


oes de tratados pelo propensity
score pela f
ormula

Di 1 Di
wi = + (12)
P(Xi ) 1 P(Xi )

Pragmaticamente, a escolha de um algoritmo dentre todos mencionados


depende do problema.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 31 / 43
Sobreposicao e Suporte Comum

O ATT e o ATE s
o estao definidos na regiao de suporte comum.
Na figura, somente onde ha sobreposicao e possvel realizar um matching
bem feito. Pode-se checar isso visualmente, por meio de histogramas.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 32 / 43
Sobreposicao e Suporte Comum

Figura 4: Suporte Comum

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 33 / 43
Sobreposicao e Suporte Comum: Criterio de Maximo e
Mnimo

Um criterio de definicao do suporte comum e o de maximo e mnimo.


Para o ATT e suficiente que sempre existam unidades de controle no
intervalo da distribuicao de P(X ) dos tratados. Para o ATE, e necessario
tambem que haja unidades tratadas no intervalo de distribuicao dos
controles.
Esse criterio nao lida muito bem com casos em que ha intervalos dentro do
suporte comum em que nao ha observac oes de tratados ou controles.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 34 / 43
Sobreposicao e Suporte Comum: Criterio de Descarte
(Trimming)

Se a densidade em determinado ponto da distribuicao for muito pequena,


pode-se usar uma regra de descarte.
Podemos definir o suporte comum como aqueles intervalos de valores de
P(X ) com densidade positiva para D = 1 e D = 0.

SbPq = {Pq : fb(P|D = 1) > q e fb(P|D = 0) > q} (13)

q determina um percentual de pontos de tratados e controles mnimo que


deve existir no intervalo do suporte comum sob analise.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 35 / 43
Sobreposicao e Suporte Comum: Problemas

Uma vez determinado o suporte comum, unidades fora deste sao


descartadas.
Se muitos indivduos caem fora do suporte comum, ha uma preocupacao se
o resultado e representativo do efeito do tratamento.
No caso do ATT, isso ocorre quando muitos tratados caem fora do suporte
comum.
No caso do ATE, ocorre tanto quando tratados quanto quando controles
caem fora do suporte comum.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 36 / 43
Avaliando a qualidade do Matching

Varios metodos permitem avaliar a qualidade do pareamento.


Temos que verificar se o balanceamento das covariadas observaveis entre
tratados e controles foi atingido.
Quando o balanceamento nao foi atingido, e as variaveis sao as corretas,
podemos inserir interacoes entre as variaveis de controle e termos de ordem
mais alta dessas variaveis (quadrado, cubo, etc).
Rosembaum e Rubin (1983) afirmam que ap os condicionar no propensity
score (i.e. para intervalos de valores semelhantes) as variaveis observaveis
devem ser parecidas entre tratados e controles. Isto e:

X
D|P(D = 1|X ) (14)

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 37 / 43
Avaliando a qualidade do Matching: Vies Padronizado

Um teste que permite identificar se o balanceamento foi atingido se chama


vies padronizado sugerido por Rosenbaum e Rubin (1985).
Para cada variavel em X e realizado o seguinte teste antes do pareamento
X1 X0
SBantes = 100 p (15)
0, 5(V1 (X ) + V0 (X ))
Ap
os o pareamento calculamos novamente o teste.

X 1Par X 0Par
SBdepois = 100 p (16)
0, 5(V1Par (X ) + V0Par (X ))
em que Vj (X ) e a variancia das caractersticas X para as amostras de
tratados j = 1 e de controles j = 0.
Um vies abaixo de 5% e suficiente para atingir o balanceamento.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 38 / 43
Avaliando a qualidade do Matching: Outros testes

Outro teste, bastante comum, e o teste t. Consiste em um teste de


diferenca de medias de covariadas entre tratados e controles apos o
pareamento. P-valores acima de 10% nao nos permitem rejeitar que as
caractersticas em ambos os grupos (tratados e controles) sao iguais.
Um outro teste consiste em reestimar o propensity score somente para a
amostra pareada. Como ja deveramos ter atingido o balanceamento apos o
pareamento, o Pseudo R 2 deveria ser muito pequeno. Pode-se fazer um
teste F de que os regressores dessa regressao Probit sao conjuntamente
estatisticamente significantes.
Um u ltimo teste consiste em dividir os propensity scores em estratos e
realizar um teste de diferencas de medias das covariadas entre tratados e
controles de cada estrato. Se houver diferencas, termos de ordem mais alta
podem ser adicionados ao modelo de selecao ao tratamento (Probit).

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 39 / 43
Estimativa dos Erros-Padrao

Os erros-padrao calculado apos o pareamento pelo teste de diferenca de


medias nao sao adequados, pois o propensity escore e uma variavel
estimada, portanto, temos para cada unidade, um intervalo de confianca de
valores que o propensity escore pode assumir.
Esse erro, nao e levado em conta no calculo do erro padrao de uma simples
diferenca de medias.
Uma solucao e calcular o erro padrao por Bootstrap. Esse metodo pode ser
computacionalmente proibitivo se a amostra ou o modelo forem grandes.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 40 / 43
Estimativa dos Erros-Padrao

Lechner (2001) propoe a seguinte f


ormula para o erro padrao corrigido do
ATT.
( jI0 (wj )2 )
P
1
Var (ATT ) = Var (Y (1)|D = 1) + Var (Y (0)|D = 0) (17)
N1 N12
em que N1 e o n
umero de unidades de tratamento pareadas, wj e o n umero
de vezes que um indivduo de controle j e usado no pareamento (se houver
reposicao).
Se nenhuma unidade foi usada mais de uma vez no pareamento, a formula
usual da variancia coincide com esta.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 41 / 43
Advertencias

Use covariadas pre-tratamento para o modelo de selecao ao tratamento.


Pode haver o chamado efeito enclausuramento. Ocorre por exemplo
quando o tratamento e um programa de treinamento. Se a variavel de
resultado for empregabilidade, pode-se verificar menor empregabilidade entre
os tratados, pois estes tiveram que participar do treinamento ao inves de
procurarem emprego.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 42 / 43
Referencias

Caliendo, M.; Kopeinig, S. (2005) Some Practical Guidance for the


Implementation of Propensity Score Matching. IZA working paper number
1588.

Rafael Terra (Unb) Econometria do Setor P


ublico 28 de setembro, 2015 43 / 43

Vous aimerez peut-être aussi