Propensity Score

Transcrição

Propensity Score
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Econometria para Avaliação de Políticas Públicas
Aula 1: Propensity Score
Prof. Cristine Campos de Xavier Pinto
Itaú Social
08/01/2016
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
O problema da identi…cação
Revisão
Como determinar se há efeito causal de um programa social
em alguma variável de interesse.
Exemplo 1: Programa de treinamento/quali…cação de
trabalhadores:
Comparam-se trabalhadores submetidos ao programa com
trabalhadores não submetidos ao programa. Em geral, pode-se
dizer que a diferença média de renda do trabalho entre os
grupos é devida, de forma inequívoca, ao efeito do
treinamento?
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
O problema da identi…cação
Exemplo 2: Bolsa-escola, bolsa-família:
Comparam-se crianças cujas famílias pertencem ao programa
com crianças que não pertencem ao programa. Em geral,
pode-se dizer que a diferença média de escolaridade (medida
de alguma forma, como matrícula, defasagem, número de
reprovações) entre os grupos de crianças é devida, de forma
inequívoca, ao efeito do programa?
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
O problema da identi…cação
Quais são as condições em que se pode determinar se há
efeito causal?
Desenho da avaliação:
Grupos escolhidos de forma aleatória;
Grupos escolhidos com base em características observáveis;
Grupos auto-selecionados;
Hipóteses sobre auto-seleção:
Feita com base em variáveis observáveis ao pesquisador;
Feita com base em variáveis não observáveis ao pesquisador.
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
O problema da identi…cação
Comparação de médias entre tratados e não tratados só tem
interpretação causal se o programa tivesse sido alocado de
maneira aleatória. Por quê?
Seja Y a variável de interesse (resultado) e T uma dummy
que indica se o indivíduo (ou família) está no programa.
Comparação entre médias de tratados e não-tratados pode ser
escrita como
G = E [Y jT = 1]
Prof. Cristine Campos de Xavier Pinto
E [Y jT = 0]
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
O problema da identi…cação
Pergunta: esse é o efeito causal do programa sobre Y ?
Para responder, precisamos pensar qual teria sido o resultado
dos indivíduos tratados caso eles não tivessem recebido
tratamento.
De…na Y1 como resultado potencial de ser tratado.
De…na Y0 como resultado potencial de não ser tratado.
Observamos resultado Y = Y1 T + Y0 (1
observamos Y1 jT = 1 e Y0 jT = 0.
Prof. Cristine Campos de Xavier Pinto
T ). Isto é,
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
O problema da identi…cação
Mas nunca observamos Y1 jT = 0 ou Y0 jT = 1.
Esse problema é conhecido como “problema fundamental da
inferência causal” (Holland, 1986).
É um problema pois um potencial parâmetro de interesse é o
efeito médio sobre os tratados (ATT )
ATT
= E [Y1 jT = 1] E [Y0 jT = 1]
= E [Y1 Y0 jT = 1]
ATT é o ganho médio causado pelo programa, para a
subpopulação que é atendida pelo programa.
Note que Y1
Y0 é o ganho associado ao programa
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
O problema da identi…cação
A diferença entre G e ATT é o viés B, também chamado de
viés de seleção:
B
= G ATT
= E [Y jT = 1] E [Y jT = 0]
(E [Y1 jT = 1] E [Y0 jT = 1])
= E [Y1 jT = 1] E [Y0 jT = 0]
(E [Y1 jT = 1] E [Y0 jT = 1])
= E [Y0 jT = 1] E [Y0 jT = 0]
Viés surge do uso de um grupo de comparação inadequado.
Os indivíduos que não foram tratados podem ter um
comportamento muito diferente daquele que os indivíduos
tratados teriam tido caso não o tivessem recebido tratamento.
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
O problema da identi…cação
A …m de eliminar ou reduzir o viés, precisamos re‡etir sobre a
auto-seleção ao programa.
Feita com base em variáveis observáveis ao pesquisador;
Feita com base em variáveis não observáveis ao pesquisador.
Contudo, se a seleção tivesse sido aleatória, isto é, T
independente de Y1 e Y0 , então B = 0.
Isto ocorre pois
B = E [Y0 jT = 1]
E [Y0 jT = 0] = E [Y0 ]
Prof. Cristine Campos de Xavier Pinto
E [Y0 ] = 0.
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Seleção nos Observáveis
Até aqui de…nimos
ATT = E [Y1 jT = 1] E [Y0 jT = 1] = E [Y1 Y0 jT = 1],
o efeito do tratamento médio sobre os tratados, como sendo o
parâmetro de interesse, pois ele captura o efeito causal do
programa ou tratamento para a subpopulação dos tratados.
Contudo, há outros parâmetros que podemos de…nir como
sendo de interesse para o analista:
ATE
ATNT
= E [Y1 ] E [Y0 ] = E [Y1 Y0 ]
= E [Y1 jT = 0] E [Y0 jT = 0] = E [Y1
Prof. Cristine Campos de Xavier Pinto
Y0 jT = 0]
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Seleção nos Observáveis
O ATE é o efeito do tratamento sobre toda a população.
Corresponde a tratar todos e comparar com não tratar
ninguém. Note que precisa de dois contrafactuais:
E [Y1 jT = 0] e E [Y0 jT = 1].
O ATNT é o efeito do tratamento apenas sobre os
não-tratados. Usa apenas um contrafactual, E [Y1 jT = 0]
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Seleção nos Observáveis
Sob aleatorização esses três parâmetros são idênticos, pois
)
)
=
=
?T
(Y1 , Y0 ) ?
E [Y1 jT = 1] = E [Y1 jT = 0] = E [Y1 ]
E [Y0 jT = 1] = E [Y0 jT = 0] = E [Y0 ]
ATE = E [Y1 ] E [Y0 ]
E [Y1 jT = 1] E [Y0 jT = 1] = ATT
E [Y1 jT = 0] E [Y0 jT = 0] = ATNT
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Seleção nos Observáveis
Exemplo: Aleatorização dos Planos de Saúde
Experimento de 1974 a 1982.
3.958 indivíduos com idade entre 14 e 61 anos.
EUA: 6 regiões diferentes
Participantes foram aleatoriamente alocados em 14 planos de
saúde.
Participantes não tinham que pagar os planos, mas os planos
tinham opções diferentes relacionados a co-pagamentos e
coberturas.
O mais generoso oferecia cobertura completa de graça. O pior
plano era praticamente nenhuma cobertura.
As famílias participantes …cavam nos planos de 3 a 5 anos, e
tinham que deixar qualquer plano anterior.
As famílias recebiam mensalmente um pagamento …xo mensal
que não precisava estar ligados a gastos com saúde.
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Seleção nos Observáveis
Pergunta: Quando e quanto o cuidado com a saúde cai
quando os preços aumentam?
Os tamanhos dos grupos de tratados em cada uma das opções
é muito pequeno.
Para fazer uma análise estatística, precisaram agrupar os
diversos planos.
O agrupamento foi feito pelo grau de cobertura: sem
cobertura, dedutível, co-pagamento e de graça.
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Seleção nos Observáveis
Comparar que tem com quem não tem plano de saúde, pode
gerar viés de seleção.
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Prof. Cristine Campos de Xavier Pinto
Seleção nos Observáveis
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Seleção nos Observáveis
Findings:
Indivíduos no plano de graça teve um cuidado maior com a
saúde que os demais (na média).
Indivíduos no plano de graça gastaram mais em saúde (2/3 na
média) do que os indivíduos que praticamente não tinham
plano de saúde.
No entanto, os níveis de colesterol, pressão arterial e os índices
de saúde no geral são bem similares entre os dois grupos.
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Prof. Cristine Campos de Xavier Pinto
Seleção nos Observáveis
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Seleção nos Observáveis
Seleção baseada em observáveis:
Dado X , resultado potencial é independente do tratamento, ie,
T independente de Y1 e Y0 j X .
Escrito formalmente:
Pr [T = 1jY (1) , Y (0) , X ] = Pr [T = 1jX ]
p (X )
onde p (X ), ou a probabilidade de ser tratado dado X , é o assim
chamado propensity-score.
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Seleção nos Observáveis
A hipótese de independência condicional (em X ) entre T e os
resultados potenciais Y (1) e Y (0) também é conhecida
como hipótese de ignorabilidade do tratamento.
T é ignorável se
Pr [T = 1jY1 , Y0 , X ] = Pr [T = 1jX ]
ou
(Y1 , Y0 ) ? T jX
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Seleção nos Observáveis
A hipótese sobre seleção é que condicional em X não há nada
sistemático que faça com que um indivíduo seja ou não
tratado. Isto é, apenas algo estritamente aleatório faz com
que alguém seja ou não tratado. A probabilidade de ser
tratado, contudo, depende de X e é p (X ).
Este é um caso em que pode-se pensar que há auto-seleção e
que o analista conhece e observa todas as características
relevantes, a menos de um erro aleatório.
A hipótese de seleção em observáveis é não-testável. Note que
ela envolve sempre ou variáveis aleatórias que apresentam
dados faltantes, como quando escrevemos
(Y1 , Y0 ) ? T jX
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Seleção nos Observáveis
Lembrem-se que
ATT
ATE
= E [Y1 jT = 1] E [Y0 jT = 1]
= E [Y jT = 1] E [Y0 jT = 1]
= E [Y1 ] E [Y0 ]
= E [Y1 jT = 1] Pr [T = 1] + E [Y1 jT = 0] Pr [T = 0]
(E [Y0 jT = 1] Pr [T = 1] + E [Y0 jT = 0] Pr [T = 0])
= E [Y jT = 1] Pr [T = 1] + E [Y1 jT = 0] Pr [T = 0]
(E [Y0 jT = 1] Pr [T = 1] + E [Y jT = 0] Pr [T = 0])
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Seleção nos Observáveis
A primeira forma de se identi…car as médias é pensando em
um método de imputação ou de regressão:
ATE
ATT
=
=
=
=
=
=
=
=
E [Y1 ]
E [Y0 ]
E [E [Y1 jX ]]
E [E [Y0 jX ]]
E [E [Y1 jX , T = 1]]
E [E [Y jX , T = 1]]
E [Y1 jT = 1]
E [Y jT = 1]
E [Y jT = 1]
E [Y jT = 1]
Prof. Cristine Campos de Xavier Pinto
E [E [Y0 jX , T = 0]]
E [E [Y jX , T = 0]]
E [Y0 jT = 1]
E [E [Y0 jX , T = 1] jT = 1]
E [E [Y0 jX , T = 0] jT = 1]
E [E [Y jX , T = 0] jT = 1]
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Seleção nos Observáveis
Portanto, para cada valor de X , identi…camos a distribuição
de Y0 jT = 1 usando Y jT = 0. Isto é, imputamos os valores
dessa distribuição usando observações do grupo de controle
(T = 0) que tenha o mesmo X do grupo de tratamento
(T = 1).
Depois, como estamos interessados na distribuição
não-condicional de Y0 jT = 1, precisamos tirar uma média
usando a distribuição de X jT = 1.
O primeiro método usado para estimar estes "contrafactuias"
é o de regressão.
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Podemos escrever os resultados potenciais como:
Yi (1) = XiT α + β + ε1i
Yi (0) = XiT α + ε0i
Sob a hipótese de seleção nos observáveis,
E [ ε0i j Xi ] = 0
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Usando os resultados de uma regressão linear de Y em X para
amostra de não-tratados, podemos estimar o efeito médio do
tratamento sobre os tratados:
[= 1
ATT
N1
N
∑ Ti (Yi
i =1
b0 (Xi ))
µ
b0 (Xi ): valor previsto para o grupo de tratamento usando os
µ
coe…cientes estimados por MQO para a regressão dos
controles e as características (X ) dos tratados.
Para este método funcionar precisamos que esta extrapolção
seja válida (Hipótese do Suporte Comum).
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Antes é importante notarmos que implicitamente lançamos
mão de uma outra hipótese, a qual garante comparabilidade
entre os dois grupos T = 1 e T = 0.
Trata-se da hipótese de suporte comum:
0 < p (x ) < 1 8x 2 X
onde X é o suporte da distribuição de X .
Dito de outra forma, não há valor de X para o qual se possa
dizer com certeza a que grupo (T = 1 ou T = 0) o indivíduo
pertence, usando apenas informação obtida pelo X .
A combinação das hipóteses de ignorabilidade e do suporte
comum é conhecida como ignorabilidade forte (Rubin, 1977).
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Se tivéssemos feito a imputação para cada observação tratada
(T = 1), teríamos feito o que chamamos de matching, ou o
nosso segundo método de identi…cação.
O procedimento seria muito parecido: para cada observação
tratada acharíamos um match (par) no grupo de controle
(T = 0) com um mesmo X e imputaríamos o valor que
aquele indivíduo tratado teria tido caso não tivesse sido
tratado usando a observação do seu match no grupo de
controle.
Depois que tivéssemos isso para todos os tratados,
calcularíamos a média. Essa média (populacional), sob a
hipótese de seleção em observáveis, será E [Y0 jT = 1].
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Para indivíduo i, se Yi (1) é observado (Ti = 1), então Yi (0)
é faltante (missing ).
Encontram-se indivíduos j, tais que Tj = 0, e que satisfaçam:
kXj
Xi k
kXl
Xi k ,
8 l, Tl = 0
Suponha que encontremos apenas um j satisfazendo restrição
bi (0) = Yj (0) = Yj .
anterior. Então Y
De forma análoga, faz-se o mesmo se Ti = 0. Imputa-se
bi (1) = Yj (1) = Yj .
Yi (1) com Y
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Estima-se E [Y (1)] como:
b [Y (1)] = 1
E
N
N
∑ Ti
Yi + (1
i =1
portanto, estima-se ATE como
d match,1 =
ATE
1
N
N
∑ Ti
i =1
N
1
N
∑ (1
i =1
e ATT por
[ match,1 = 1
ATT
N1
Prof. Cristine Campos de Xavier Pinto
Yi + (1
i =1
bi (1)
Ti ) Y
bi (0)
Ti ) Yi + Ti Y
N
∑ Ti
bi (1)
Ti ) Y
Yi
bi (0)
Y
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Algumas questões relevantes na implementação:
1
Com mais de uma unidade como candidata a par (se há
empate, por exemplo), como escolher?
2
Se for usar mais de uma unidade, deve-se “repor” unidade que
serviu como par? Ou fazer matching sem reposição?
3
Que noção de distância k k deve ser usada?
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Observação: Matching, ao contrário do método da imputação
(usando toda a amostra), não é e…ciente. Razão para isso é que
matching tipicamente …xa o número de “matches”
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
De…ne-se um “balancing-score”, b (X ), como uma função de
X tal que a distribuição de X nos dois grupos esteja
“equilibrada”, i.e.,
X ? T jb (X )
Pode-se mostrar que o b (X ) de menor dimensionalidade é o
propensity-score:
X ? T jp (X )
Importante: Esse resultado não é dependente da hipótese de
ignorabilidade:
(Y1 , Y0 ) ? T jX
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Ele é um simples resultado de teoria da probabilidade:
X ? T jp (X ) , Pr [T = 1jX , p (X )]
Pr [T = 1jp (X )]
Podemos rescrever o lado direito como:
Pr [T = 1jp (X )]
= E [Pr [T = 1jX , p (X )] jp (X )]
Contudo, novamente temos Pr [T = 1jX , p (X )] = p (X ), o
que nos dá:
Pr [T = 1jp (X )] = E [p (X ) jp (X )] = p (X ) .
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Um segundo resultado, mais interessante, diz que sob a hipótese
de ignorabilidade, se b (X ) é “balancing-score”, então:
(Y1 , Y0 ) ? T jb (X )
e em particular
(Y1 , Y0 ) ? T jp (X )
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Usamos a mesma lógica anterior para provar esse resultado:
(Y1 , Y0 ) ? T jp (X )
, Pr [T = 1jY1 , Y0 , p (X )]
Pr [T = 1jp (X )]
Vimos que o lado direito da equivalância é simplesmente
p (X ).
O lado esquerdo pode ser reescrito como
=
=
=
=
Pr [T = 1jY1 , Y0 , p (X )]
E [Pr [T = 1jY1 , Y0 , p (X ) , X ] jY1 , Y0 , p (X )]
E [Pr [T = 1jY1 , Y0 , X ] jY1 , Y0 , p (X )]
E [Pr [T = 1jX ] jY1 , Y0 , p (X )]
E [p (X ) jY1 , Y0 , p (X )] = p (X ) .
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Qual vantagem de se usar p (X ) em vez de X ? Principal é
redução da dimensionalidade.
Qual desvantagem de se usar p (X ) em vez de X ? Principal é
que verdadeiro p (X ) é uma função desconhecida de X e
precisa, portanto, ser estimada. Estimação do p (X ) em um
primeiro estágio pode afetar variância do estimador do
segundo estágio.
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Vamos ver três métodos baseados no escore de propensão:
1
Regressão usando propensity-score estimado.
Rodamos uma regressão de Y em T e o p(X ) estimado.
Como p (X ) é estimado, temos que fazer correção nos
erros-padrão reportados. Além disso, método é válido se
con…armos na hipótese sobre a forma funcional da média
condicional. Mais sobre isso em breve.
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
1
Matching no propensity-score estimado:
Embora bastante popular, apenas muito recentemente foi
estabelecida teoria assimptótica para esse caso (Abadie and
Imbens, 2009).
2
Reponderação usando p-score estimado
Esse método parece que usa versão da ignorabilidade
condicionando em p (X ).
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Reponderação
ATE
= E [E [Y jX , T = 1]] E [E [Y jX , T = 0]]
= E [E [T Y jX , T = 1]] E [E [(1 T ) Y jX , T = 0]]
E [T Y jX ]
E [(1 T ) Y jX ]
E
= E
p (X )
1 p (X )
T
1 T
Y
E
Y
= E
p (X )
1 p (X )
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
usamos aqui
E [TY jX ]
p (X )
= E [TY jX , T = 1] + E [TY jX , T = 0]
(1
p (X ))
p (X )
= E [TY jX , T = 1] + 0 = E [Y jX , T = 1]
e
E
T
Y
p (X )
=E E
T
Y jX
p (X )
Prof. Cristine Campos de Xavier Pinto
=E
E [TY jX ]
p (X )
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Fazendo-se contas similares, chegamos para ATT :
= E [Y jT = 1] E [E [Y jX , T = 0] jT = 1]
E [T Y ] E [p (X ) E [Y jX , T = 0]]
=
p
p
onde p = Pr [T = 1]. O resultado acima deriva de
ATT
E [T Y ]
p
= E [T Y jT = 1] + E [T Y jT = 0]
1
p
p
= E [Y jT = 1]
e da regra de Bayes:
fX j T ( x j 1 ) =
fX j T ( x j 0 ) =
Prof. Cristine Campos de Xavier Pinto
p (x )
fX ( x )
p
1 p (x )
fX ( x )
1 p
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Assim:
ATT
=
=
=
=
=
=
E [T
p
T
E
p
T
E
p
T
E
p
T
E
p
T
E
p
Y]
Y
Y
Y
Y
Y
E [p (X ) E [Y jX , T = 0]]
p
p (X )
E
E [Y jX , T = 0]
p
p (X )
E
E [(1 T ) Y jX , T = 0]
p
p (X ) E [(1 T ) Y jX ]
E
p
1 p (X )
p (X )
1 T
E
Y
p
1 p (X )
p (X )
1 p
1 T
E
Y
p
1 p (X ) 1 p
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
P (X ) aparece como um peso nas equações acima.
Procedimento em dois passos:
Passo 1: Estimamos P (X ) por um modelo Probit ou Logit.
Passo 2: Obtemos estimadores consistentes dos parâmetros de
interesse:
0
1
Ti
1 Ti
N
1
p
b
X
1
p
b
X
(
)
(
)
i
i
d rew ,norm =
@
A Yi
ATE
Tj
1 Tl
N
N
N i∑
∑
∑j =1 pb(X j )
=1
l =1 1 p
b (X l )
1
0
N
p
b (Xi ) 1 1 pb(TXi i )
1
T
i
[ rew ,norm =
A Yi
@
ATT
N
1 Tl
N i∑
∑ j = 1 Tj
p
b
X
=1
(
)
∑N
l
l =1
1 p
b (X l )
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Como isso se relaciona com regressão?
b ATE ,i como:
De…na λ
b ATE ,i =
λ
Ti
p
b (Xi )
1
1
Ti
Ti p
b (Xi )
=
p
b (Xi )
p
b (Xi ) (1 p
b (Xi ))
o coe…ciente associado ao T na regressão ponderada de Y em T e
b ATE ,i como peso é:
uma constante, usando λ
b
δ =
=
b ATE ,i T i Y i
∑λ
b ATE ,i
∑λ
1
N
b ATE ,i T 2
∑λ
i
b ATE ,i
∑λ
0
Ti
p
b (X i )
@
T
∑j pb(Xj j )
i =1
N
∑
b ATE ,i T i
∑λ
b ATE ,i
∑λ
b ATE ,i T i
∑λ
b ATE ,i
∑λ
1 Ti
1 p
b (X i )
1 T
∑j 1 pb(Xj j )
Prof. Cristine Campos de Xavier Pinto
b ATE ,i Y i
∑λ
b ATE ,i
∑λ
2
1
d rew ,norm
A Yi = ATE
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
b ATT ,i como:
De…na λ
b ATT ,i = Ti
λ
p
b
p
b (Xi )
1 Ti
Ti p
b (Xi )
=
p
b
1 p
b (Xi )
p
b (1 p
b (Xi ))
o coe…ciente associado ao T na regressão ponderada de Y em T e
b ATT ,i como peso é:
uma constante, usando λ
b
δ =
=
b ATT ,i T i
∑λ
b ATT ,i
∑λ
b ATT ,i T i Y i
∑λ
b ATT ,i
∑λ
1
N
N
b ATT ,i T 2
∑λ
i
b ATT ,i
∑λ
0
Ti
∑ @ ∑N
i =1
j =1
Tj
b ATT ,i Y i
∑λ
b ATT ,i
∑λ
2
b ATT ,i T i
∑λ
b ATT ,i
∑λ
p
b (Xi )
∑N
l =1
Prof. Cristine Campos de Xavier Pinto
p
b (Xl )
1 Ti
1 p
b (X i )
1 Tl
1 p
b (X l )
1
[ rew ,norm
A Yi = ATT
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Matching
Mesma ideia do matching baseado no vetor X .
Escolhemos os indvíduos no grupo de controle que se parecem
mais com os indivíduos no grupo de tratamento em termos do
escore de propensão.
O pareamento baseado no escore de propensão também irá
depender de uma métrica pré-determinada, que de…nirá a
proximidade do escore de propensão dos indivíduos tratados
em relação ao escore de propensão dos indivíduos
não-tratados.
Exemplo: The Nearest Neighbor Matching - usa o resultado
de M indivíduos do grupo de controle.
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Sendo HM o conjunto das M observações com o menor valor
b (Xj ) P
b (Xi ) , podemos construir o análogo amostral
de P
para o resultado potencial do indivíduo caso ele não fosse
tratado, como:
bi (0) = 1
Y
M
∑
Yj
j 2H M (i )
e estimamos os parâmetros de interesse.
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Regressão
Como
(Y (1) , Y (0)) ? T jp (X )
temos que
ATE
=
=
=
=
E [Y (1)]
E [Y (0)]
E [E [Y (1) jp (X )]]
E [E [Y (0) jp (X )]]
E [E [Y (1) jp (X ) , T = 1]]
E [E [Y jp (X ) , T = 1]]
Prof. Cristine Campos de Xavier Pinto
E [E [Y (0) jp (X ) , T = 0]
E [E [Y jp (X ) , T = 0]]
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Podemos estimar as médias condicionais através de regressões.
Por exemplo, o que acontece se
E [Y jp (X ) , T = 1] = α1 + β1 p (X ),
E [Y jp (X ) , T = 0] = α0 + β0 p (X )?
E [Y jp (X ) , T ] = α0 + β0 p (X ) + ( α1
α0 ) T + ( β1
β0 ) p (X )
mas
ATE = (α1
α0 ) + ( β1
Prof. Cristine Campos de Xavier Pinto
β0 ) p = δ
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
e
E [Y jp (X ) , T ] = α0 + β0 p (X ) + δ T + ( β1
β0 ) (p (X )
p) T
Portanto, nesse caso, regressão de Y em T , p (X ) e interação
p (X ) T , onde p (X ) = p (X ) p, identi…ca ATE.
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Em alguns casos, escolhemos modelos paramétricos para o
p-score ou para E [Y jT , X ] sem a necessária con…ança de que
eles se aproximem dos objetos populacionais da maneira
adequada.
Métodos que surgiram dá combinação dos métodos acima são
menos sensíveis a essas hipóteses.
Exemplos:
Pareamento e Regressão Linear
Regressão Linear e Reponderação
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Pareamento e Regressão Linear
ei (0) = 1
Y
M
∑
j 2H M (i )
b0 (Xi )
(Yj + µ
b0 (Xj ))
µ
b0 (Xi ) , µ
b0 (Xj ) : valores previstos de Y para os indivíduos no
µ
grupo de controle e também para os indivíduos no grupo de
tratamento obtidos com os coe…cientes da regressão de Y em
X somente para a subamostra de indivíduos que não
receberam tratamento
Prof. Cristine Campos de Xavier Pinto
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
e
d matchreg ,1 =
ATE
1
N
N
∑ Ti
Yi + (1
i =1
N
1
N
∑ (1
i =1
e ATT por
[ matchreg ,1 = 1
ATT
N1
Prof. Cristine Campos de Xavier Pinto
bi (0)
Ti ) Yi + Ti Y
N
∑ Ti
i =1
bi (1)
Ti ) Y
Yi
bi (0)
Y
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Regressão Linear e Reponderação
Yi = α0 + τTi + XiT α1 + Ti Xi
X1
T
α2 + εi
X 1 : média amostral de X na subamostra de indivíduos
tratados.
τ: efeito médio do tratamento sobre os tratados (ATT)
Estimamos esta regressão podenderada por:
w ( T , X ) = Ti + ( 1
Prof. Cristine Campos de Xavier Pinto
Ti )
P̂ (Xi )
1 P̂ (Xi )
Econometria para Avaliação de Políticas Públicas
Introdução
Parâmetros de Interesse
O método de Regressão
Suporte Comum
Matching (Pareamento Simples)
Métodos Baseados no Escore de Propensão
Combinação de Métodos
Para obter o ATE, estimamos a seguinte regressão:
Yi = α0 + τTi + XiT α1 + Ti Xi
X
T
α2 + εi
X : média amostral de X na amostra como um todo.
Ponderada por:
w (T , X ) =
Prof. Cristine Campos de Xavier Pinto
Ti
1 Ti
+
P̂ (Xi ) 1 P̂ (Xi )
Econometria para Avaliação de Políticas Públicas