QALYs: Alguns Desafios

Transcrição

QALYs: Alguns Desafios
QALYs: Alguns Desafios
S11
QALYs: Alguns Desafios
1
2
Autores: Erik Nord, PhD, Norman Daniels, PhD, Mark Kamlet, PhD
1
3
2
Norwegian Institute of Public Health, Oslo, Noruega; Department of Population and International Health,
3
Harvard School of Public Health, Boston, MA, EUA; Heinz School of Public Policy and Management,
Carnegie Mellon University, Pittsburgh, PA, EUA
Tradução validada por:
Marcelo Fonseca, Professor, HTA & Clinical Research, Federal University of São Paulo (UNIFESP) and Director, Axia.Bio, São Paulo,
Brazil
Tassia Decimoni, AxiaBio Consulting, São Paulo, Brazil
A citação para este relatório é:
Nord E, Daniels N, Kamlet M. QALYs: some challenges. Value Health 2009;12(Suppl.):S10-15.
Palavras-chaves: QALY, MAU, utilidade de experiência, método de subtração, imparcialidade.
Introdução
No artigo anterior, Weinstein et al. [1] explicam o conceito QALY, seus métodos e suas suposições
subjacentes. Vários temas interessantes para discussão emergem desta apresentação fatual. Restringimonos a abordar quatro tópicos que julgamos particularmente desafiadores.
Como um fundamento geral para nossa seleção de tópicos, reiteramos um ponto básico sobre as
perspectivas de avaliação: os QALYs padrão pretendem expressar a utilidade pessoal de desfechos em
saúde, conforme estes são julgados prospectivamente (ex ante) e “em média” pelo público geral, por trás
de um manto de desconhecimento sobre a saúde futura (a assim chamada “utilidade de decisão”). Os
QALYs padrão, assim sendo, expressam o valor em termos de interesse próprio desde o início. Existem,
entretanto, possíveis alternativas. Em primeiro lugar, utilidades de estado de saúde podem, em princípio,
ser extraídas retrospectivamente (ex post) em vez de prospectivamente, ou seja, a partir de pessoas que
têm, ou tiveram, experiência direta com os estados de saúde que são objeto da avaliação (a assim
chamada “utilidade experimentada”). Em segundo lugar, os QALYs podem ser construídos para expressar
a avaliação pela sociedade dos desfechos de saúde, quando não apenas o interesse próprio, mas também
preocupações pela imparcialidade forem levadas em conta. A escolha da abordagem depende da questão
que se deseja responder, e a escolha das técnicas de avaliação do estado de saúde depende da escolha da
perspectiva.
Os tópicos que abordaremos a seguir refletem a pluralidade supracitada nas possíveis perspectivas de
avaliação e são, em parte, independentes um do outro. Um tópico é a variação intermétodo na estimativa
das utilidades prospectivas do estado de saúde. Um segundo é a existência de relutância em permutar
tempo de vida nas extrações da utilidade experimentada. Um terceiro é a discrepância entre a utilidade
individual agregada dos programas de saúde por um lado, e, por outro lado, as avaliações societárias que
incluem preocupações pela imparcialidade. Um quarto é uma distinção, até aqui muito negligenciada,
entre as avaliações dos estados de doença por indivíduos saudáveis (o que é crucial no procedimento do
QALY convencional) e as avaliações do tratamento pelas pessoas (avaliações de ganhos de saúde –
incluindo efeitos colaterais não pretendidos – ou perdas de saúde evitadas), distinção esta que deveria,
afinal de contas, ser o propósito da avaliação econômica.
Entre os tópicos importantes que não abordamos aqui, estão os descontos para preferência no tempo e as
atitudes frente à incerteza. Para discussões sobre esses tópicos, os leitores são dirigidos à literatura
pregressa, por exemplo, [2,3]. Devido a estarmos enfocando aqui os desafios ao QALY, nós, além de
tudo, desconsideramos as preocupações de alguns, que julgam que a saúde deva ser avaliada pelo seu
impacto sobre a faixa utilizável de oportunidades comumente aberta às pessoas, e não com base em
fundamentos relacionados ao bem-estar [4].
Bombardier et al. 1982 (5).
Assistência à saúde,
pessoal, pacientes, família
SG
TTO
RS
Necessário o uso de
bengala para movimentase
0,85
0,78
0,65
Necessário o
acompanhamento ao
caminhar
0,64
0,41
0,29
Necessita de dois
assistentes para
movimentar-se
0,38
0,11
0,08
QALYs: Alguns Desafios
S12
Figura 1 Diferenças entre técnicas primárias na avaliação de estados de saúde. SG, Standard Gamble ou aposta
padronizada; TTO, Time Trade-Off ou permuta de tempo; RS, Rating Scale ou escala de classificação.
Variação nas Utilidades do Estado de Saúde
Nas análises de custo utilidade das tecnologias e programas de saúde, uma variedade de ferramentas é
usada para avaliar estados de saúde. Na literatura de economia da saúde e na tomada de decisão,
resultados de análises baseadas em ferramentas diferentes são, não raramente, comparados uns aos outros.
Para que tais comparações sejam de alguma utilidade, ferramentas diferentes devem fornecer valores
muito próximos para os mesmos estados. De fato, este não é o caso. Tipicamente, a ‘aposta padronizada’
(Standard Gamble) oferece valores mais elevados que a ‘permuta de tempo’ (Time Trade-Off), a qual,
novamente, resulta em valores mais elevados que a ‘escala de classificação’ (Rating Scale). A Figura 1 dá
um exemplo [5]. Para uma comparação posterior, veja, por exemplo [6]. Existem diferenças similares
entre instrumentos multiatributo de utilidade. A Figura 2 mostra um exemplo [7]. Embora as evidências
sobre esta questão variem um pouco na literatura, a coluna à direita da tabela sugere que diferenças nas
avaliações dos estados podem ter importantes consequências sobre as avaliações dos ganhos em saúde.
EQ-5D
(RU tto)
HUI 2
15-D
A: Muletas, dor
leve, incapaz de
caminhar
0,45
B: Dificuldades ao movimentarse para fora, algum desconforto,
capaz de algum trabalho
0,80
U(A)-U(B)
0,70
0,86
0,92
0,92
0,22
0,06
0,35
Figura 2 Diferenças entre instrumentos multiatributo de utilidade (Fonte: [7]). HUI, Health Utilities Index ou Índice de
Utilidades em Saúde.
O problema da variação intermétodo pode, em princípio, ser aliviado pelo desenvolvimento de algoritmos
para “intercruzar”, ou seja, para “traduzir” as utilidades de uma dada ferramenta para as correspondentes
utilidades segundo outras ferramentas. Pesquisa sobre esse efeito está sendo conduzida (entre outros, por
Dennis Fryback et al. na University of Wisconsin); a confiabilidade do intercruzamento ainda está por ser
estabelecida. Se sua confiabilidade e justificação forem obscuras, permanecerá então um questionamento
sobre a validade das ferramentas de custo-utilidade.
Utilidade Experimentada: Relutância em Permutar Tempo de Vida
Para estimar os reais benefícios de um programa de cuidados à saúde, um forte questionamento pode ser
feito sobre a necessidade de informações de qualidade de vida provenientes de pessoas que tenham
experimentado os estados de saúde envolvidos no programa [8–10]. Não obstante, quando a ‘aposta
padronizada’ e a ‘permuta de tempo’ são aplicados a pacientes e pessoas incapacitadas, muitos relatam
disposição zero para sacrificar sua expectativa de vida no sentido de obter alívio de seu problema de
saúde [11–13]. Trata-se da indisposição em permutar resultados em utilidades de 1.0, que parece
claramente irracional para estados que não sejam de saúde completa. Discutivelmente, o problema é que a
unidade de tempo usada nesses estudos – um ano completo – é extensa demais. Se alguém inquirir sobre a
disposição em sacrificar um mês, uma semana ou um dia de seu tempo de vida, presumivelmente, haverá
um ponto no qual qualquer um que pareça “irredutível em fazer a permuta” estará, realmente, disposto a
fazê-la (George Torrance, comunicação pessoal). Mas mesmo se isto for verdade, dois problemas
permanecem. Um é em termos de relevância política. Se pessoas com um problema considerável, por
exemplo, dependência de cadeira de rodas para se movimentar, declararem que estão dispostas a
sacrificar apenas um mês, num total de 10 anos de tempo de vida, para livrar-se de seu problema, elas
ganharão uma utilidade de 0,99. Seria um número tão elevado, realmente útil para avaliar um programa
que retirasse essas pessoas da cadeira de rodas? O número elevado também prejudicaria o investimento
em programas de prevenção, que visassem reduzir a prevalência das condições que levam à dependência
de cadeira de rodas. O outro problema é em termos de significado. A ideia por trás da ‘aposta
padronizada’ e da ‘permuta de tempo’ é que a utilidade (valor) de um dado ganho de saúde é refletida na
disposição das pessoas em sacrificar-se para obtê-lo. Mas seria a disposição em permutar uma quantidade
muito pequena de um tempo de vida distante, necessariamente, uma expressão da disposição ao
sacrifício? Nós achamos que é possível para os indivíduos dizer “Bem, se você me pergunta sobre um
mês, então, certamente estaria preparado para a permuta; mas isto seria sem qualquer sensação de
sacrifício, já que esse tempo é bem curto e está muito distante”. Se esta é a psicologia por trás da resposta,
a mesma é dificilmente utilizável como indicação de valor. Pesquisa sobre esta questão se faz necessária.
QALYs: Alguns Desafios
S13
Acreditamos que informações sobre a qualidade de vida experimentada pelos pacientes sejam essenciais à
avaliação econômica de intervenções em saúde, mas achamos que as limitações potenciais das
ferramentas convencionais de mensuração da utilidade, tais como o ‘aposta padronizada’ e a ‘permuta de
tempo’ em pacientes e pessoas incapacitadas, precisam ser cuidadosamente consideradas. Também
estamos preocupados por saber menos sobre a qualidade de vida experimentada pelas pessoas em vários
estados de saúde, do que o geralmente assumido quando déficits sensoriais ou mobilidade são tomados
como exemplo chave. Discutivelmente, algumas das lacunas, onde houver uma, entre as avaliações
prospectivas e aquelas decorrentes da experiência, vem daquelas prospectivas que não são adaptadas de
antemão; quando as mesmas são sugeridas, a lacuna diminui. Parte da lacuna pode também refletir a
perda objetiva de oportunidade, que não é capturada pelas avaliações experimentadas que descontaram
certas oportunidades. Também, a adaptação pode ser menos bem sucedida naqueles com, por exemplo,
depressão ou lesão cerebral traumática, em comparação àqueles com problemas de mobilidade [14].
Preocupações pela Imparcialidade
Conforme notado acima, o padrão QALY expressa valor em termos de utilidade individual agregada.
Uma questão levantada por muitos, ao longo dos últimos 20 anos, é se os benefícios de saúde avaliados
dessa maneira representam adequadamente a avaliação da sociedade sobre programas de saúde para
diferentes grupos de pessoas, quando preocupações pela imparcialidade também são levadas em conta. Na
nossa óptica, três problemas éticos particularmente salientes foram identificados.
O primeiro problema surge do fato de que não há, na abordagem QALY padrão, nenhuma preocupação
com o nível de utilidade pré-tratamento dos indivíduos analisados. Tanto a teoria ética, como a opinião
pública, em diversos países industrializados, sugere que ao estabelecer prioridades, a sociedade enfatize
quão pior estariam os indivíduos, se a intervenção não tivesse lugar [15–19]. Em outras palavras, quanto
pior esteja o indivíduo sem uma dada intervenção, melhor a sociedade tenderá a avaliar aquela
intervenção. Este aspecto da avaliação societária é frequentemente chamado de uma preocupação
independente da gravidade. Em estudos quantitativos da preferência na população (por exemplo, de
autoria de Peter Ubel et al. nos Estados Unidos, Jeff Richardson na Austrália, Paul Dolan et al. no Reino
Unido, Erik Nord na Noruega), os ganhos de QALY para grupos gravemente doentes foram pesados de
maneira duas a dez vezes mais elevada, do que os ganhos para grupos menos gravemente doentes (ver
revisões em [18,19]).
Em segundo lugar, o modelo QALY convencional implica que o valor de uma intervenção é proporcional
à capacidade do beneficiário em se beneficiar. O modelo, assim, favorece aqueles com condições mais
tratáveis e aqueles com maior potencial para saúde – seja isto, em termos de funcionamento ou de
longevidade. Isto está, em certa medida, em desacordo tanto com a teoria ética, como com a opinião
pública; as quais sugerem que não deve ser usado contra as pessoas que venham a ter condições para a
qual não há cura completa; ou então de que seu tempo restante de vida é, de certa maneira, limitado [15–
17,20–23]. A conclusão parece ser que, para grupos com a mesma gravidade de doença, a sociedade não
deseja dar forte prioridade àqueles cujos ganhos em saúde sejam maiores, em relação àqueles cujos
ganhos em saúde sejam menores; isto, se os ganhos forem substanciais em ambos os grupos. Os estudos
empíricos de preferência, majoritariamente, se referem à priorização entre grupos com diferentes
potenciais de melhoria na qualidade de vida. Não obstante, em um estudo qualitativo de preferências
públicas no Reino Unido, Dolan e Cookson [24] encontraram a mesma relutância em discriminar, dentro
de situações onde os grupos diferiam em termos de ganho potencial de tempo de vida (por exemplo, 10
versus 20 anos). Sua conclusão global foi que “50 anos após a criação do Serviço Nacional de Saúde
Britânico, as pessoas ainda parecem acreditar que deveria haver prioridade acordada para aqueles com
necessidade urgente de atenção médica. Apesar de a ‘capacidade de beneficiar-se’ realmente importar, ela
é uma consideração secundária”.
O terceiro problema é um caso especial do segundo. Avaliar ganhos de saúde em termos de QALYs
significa que os anos de vida ganhos desfrutando de plena saúde – através de, por exemplo, prevenção de
acidentes fatais em pessoas com saúde normal – são contados como mais valiosos, que os anos de vida
ganhos por aqueles que são cronicamente doentes ou incapacitados – por exemplo, evitando episódios
fatais em pessoas com asma, doença cardíaca ou doença mental. Isto está em conflito com a ideia de um
direito igual de proteção à vida para todos, independentemente de sua condição de saúde; desde que todos
tenham o desejo de viver [25,18]; e também vai contra os resultados obtidos em um estudo de
preferências públicas por cenário de prioridade nos Estados Unidos [26].
QALYs: Alguns Desafios
S14
As preocupações notadas acima podem levar a consideráveis discrepâncias entre – por um lado –
classificações de programas de saúde conforme razões de custo por QALY padronizadas, e – por outro
lado – sua classificação segundo julgamentos de valor societários e políticos mais amplos. Nós
argumentaríamos que em boa parte da literatura sobre análise de custo-utilidade, a magnitude potencial
destas discrepâncias tem sido apreciada de forma insuficiente. Parece haver uma necessidade de maior
reconhecimento e aceitação das proporções convencionais de custo por QALY, como sendo informações
apenas parciais sobre o valor do dinheiro, em diferentes áreas de cuidados à saúde. Segundo nossa visão,
a razão de custo por QALY de uma intervenção é um tipo de indicador de produtividade. A mesma diz
aos tomadores de decisão quanto – neste caso, saúde – é produzida por unidade de recurso usada. Embora
isto, certamente, seja informação útil; estabelecer prioridades em cuidados à saúde deve basear-se em um
lote mais amplo de considerações. O ponto é claramente reconhecido na discussão do Instituto de
Medicina, sobre as limitações éticas da análise de custo-efetividade nos cenários regulatórios [27].
Dito isto, pode-se perguntar se existem maneiras de incorporar formalmente as preocupações pela
imparcialidade ao modelo QALY. Retornaremos a isto numa seção posterior.
O Valor Prospectivo (Ex Ante) dos Estados de Saúde Versus o Valor das Intervenções
para Pessoas com a Doença
O fato de os cálculos QALY padrão não capturarem preocupações societárias para imparcialidade, não
implica em que esses cálculos sejam falhos per se. Em princípio, eles podem ainda ser estimativas válidas
daquilo que visa expressar, especialmente utilidade individual agregada. Nesta seção, entretanto, nós
levantamos uma questão mais fundamental: se os QALYs padrão estão construídos de maneira a exigir a
subavaliação sistemática da utilidade individual dos ganhos em saúde, quando os potenciais de tratamento
são, de alguma maneira, limitados. A hipótese baseia-se em três premissas.
Uma é que, no procedimento QALY padrão, não há extração da utilidade sobre ganhos em saúde
resultando de intervenções; mesmo se tal estimativa de utilidade for realmente a meta do procedimento.
Para ganhos funcionais e sintomáticos, existe somente avaliação indireta através da extração da
preferência prospectiva (julgamentos de desutilidade) sobre estados de doença (estados de saúde) e
subsequente subtração dos valores dos estados de saúde um do outro. O “procedimento de subtração” é
compreensível em termos de exequibilidade da coleta de dados: O número de mudanças possíveis é muito
maior que o número de estados possíveis (n/2[n - 1] mudanças possíveis se n estados). Trata-se, não
obstante, uma abordagem substituta, que não foi discutida, nem muito menos validada, na literatura de
economia da saúde. Para tempo de vida ganho, não há nenhuma avaliação dos diferentes números
(quantidades) de anos ganhos, mas apenas de sua qualidade. Também neste aspecto do modelo QALY,
falta validação.
Uma segunda premissa é que o QALY não faz diferença entre comparações de desfechos diferentes para
o mesmo indivíduo e resultados diferentes para indivíduos diferentes, com distintos potenciais para saúde.
Assuma, por exemplo, que o usuário de cadeira de rodas A pode ser introduzido ou à categoria
“dependente de muletas”, ou àquela de “saúde plena”; enquanto que o usuário de cadeira de rodas B pode,
na melhor das hipóteses, ser trazido à categoria “dependente de muletas”. Uma intervenção que leve
ambos à categoria “dependente de muletas” terá a mesma pontuação em termos de utilidade individual no
modelo QALY padrão. Isto parece uma mera fusão de contextos de avaliação muito diferentes, que
podem invocar questões e processos psicológicos muito diferentes. Por exemplo, para a pessoa A acima,
“o melhor (saúde plena) será, provavelmente, o inimigo do bom (muletas)”. O que não é o caso para a
pessoa B.
A terceira premissa, relacionada à segunda, é que o valor dos ganhos em saúde precisa ser compreendido
à luz de dois aspectos bem conhecidos da psicologia humana. Um é que julgamentos de valor dependem
de pontos referenciais (o ponto de comparação do indivíduo, ou o “status quo” em face ao qual os
cenários alternativos são contrastados) e aplicações [28–30]. O outro é que os bens tendem a ter utilidade
marginal decrescente (como um puro efeito de quantidade, ou seja, também quando os desfechos são
certos).
A seguir, argumentamos que a falha em levar em conta estes dois mecanismos psicológicos, pode levar o
procedimento QALY padrão a relacionar de maneira excessivamente intensa, a utilidade individual dos
cuidados à saúde ao “tamanho” do benefício de saúde que pode ser obtido.
QALYs: Alguns Desafios
S15
Considere dois casos de incapacitação, A e B. O procedimento QALY padrão é deixar que uma amostra
randômica da população geral julgue a má (e a boa) qualidade dos estados, em relação à saúde plena.
Assuma que, a partir do ponto de referência típico de “saúde normal” da amostra, A é considerado como
sendo duas vezes mais indesejável que B, e que, em média, as pessoas estão dispostas a sacrificar 40% de
sua expectativa de vida para evitar A e 20% para evitar B. Assim, A tem uma pontuação de 0,6 na escala
de utilidade QALY, enquanto que B tem uma pontuação de 0,8; veja a Figura 3.
Estados avaliados por amostra
da comunidade (majoritariamente
em saúde normal)
Grupos no estado A com
diferentes potenciais
Figura 3 Avaliação de estados versus avaliação de ganhos em saúde
Agora, considere dois grupos de pessoas, G1 e G2, que casualmente contraíram duas doenças diferentes.
Ambos os grupos encontram-se no estado A (0,6). Pessoas em G1 podem ser reabilitadas à saúde normal.
Para as pessoas em G2, isso não é possível. Mas a melhor tecnologia médica disponível pode melhorar
sua condição e elevá-las ao estado B (0,8).
A questão interessante para a análise de custo-utilidade é até que ponto pode se elevar, a avaliação dessas
duas intervenções – que levam a diferentes mudanças na saúde – por aqueles nelas envolvidos. Ao exame
dessa questão, o seguinte problema aparece: De acordo com o “método de subtração” do QALY, a
intervenção para as pessoas no grupo G1 atinge pontuação duas vezes maior que aquela da intervenção
para pessoas no grupo G2 (0,4 vs. 0,2). Mas as pessoas no grupo G2, necessariamente, avaliariam a ajuda
possivelmente recebida, como correspondendo somente à metade daquela recebida pelas pessoas no
grupo G1? Partindo-se da posição de saúde plena, B não é atraente. Mas após o início da doença, o ponto
de referência do grupo G2 mudou, e, presumivelmente, também suas aspirações. A preocupação mais
importante seria então, possivelmente, atingir um nível melhor que o estado A. Além disso, partindo-se da
posição de que estando em A, tem-se B como o melhor desfecho possível, B possivelmente parecerá mais
atraente que antes. Talvez, a avaliação da ajuda pelo grupo G2 não seja tão menor que aquela feita pelo
grupo G1, dada a igualdade na gravidade das condições nos dois grupos e a redução no índice máximo de
saúde que o grupo G2 tem, agora, de aceitar. O método de subtrair-se os valores prospectivos do estado
de saúde um do outro, omite esta possibilidade.
Embora o que estamos dizendo aqui se refira à avaliação da utilidade individual, está também diretamente
relacionado ao que dissemos na seção anterior, sobre a variabilidade nos potenciais para saúde. Caso se
requeira consistência matemática dentro de perspectivas muito diferentes (prevendo uma perda de saúde e
estando numa condição de saúde diminuída na qual se requer uma intervenção), a consistência é obtida ao
custo de se desvalorizar o interesse que as pessoas que não puderem ser reabilitadas à saúde plena têm,
em intervenções que, assim mesmo, melhorem a sua saúde.
A ideia de que a utilidade dos ganhos em saúde depende dos pontos de referência e dos potenciais para
saúde parece relevante, também, com relação aos ganhos em anos de vida. Considere dois grupos, G1 e
G2, com diferentes tipos de condição ameaçadora à vida. Os indivíduos no G1 podem ser reabilitados a
uma expectativa de vida normal de, por exemplo, 20 anos; enquanto que os indivíduos no G2 podem
receber uma expectativa de vida de, somente, 10 anos. Assuma que tudo mais é igual. Dada a situação de
ambos os grupos, ou seja, dado que eles têm um risco de morte como ponto de referência, a preocupação
primária de ambos pode ser evitar a morte no futuro próximo e ganhar, pelo menos, “alguns anos”. Este
possível efeito do ponto de referência pode ser fortalecido pelo fenômeno geral da diminuição da
utilidade marginal: Mesmo que não houvesse preferência no tempo, é razoavelmente improvável que se
considerasse uma perspectiva de 20 anos como duas vezes mais valiosa que uma perspectiva de 10 anos.
Em resumo, embora esses dois grupos pudessem avaliar diferentemente seus ganhos potenciais, suas
QALYs: Alguns Desafios
S16
avaliações, provavelmente, não difeririam tanto quanto poderia sugerir a diferença em anos de vida
combinada às taxas de desconto convencionais para a preferência no tempo.
O raciocínio acima – com relação a ambos, melhoras funcionais e ganhos em anos de vida – se aplica a
avaliações da utilidade de cuidados à saúde que sejam retrospectivas à doença. Em princípio, sensações e
avaliações retrospectivas podem ser previstas antes da doença. É então possível, que a não
proporcionalidade entre o tamanho do efeito e a utilidade possa ser verdadeira também, em relação às
preferências prospectivas do indivíduo pelos cuidados à saúde, conforme expresso nas preferências pelo
seguro de saúde.
O exame das questões que levantamos aqui é assunto para pesquisas empíricas. Alguns resultados
preliminares, provenientes de estudo piloto, foram apresentados na oficina de consenso da Filadélfia, em
novembro de 2007 (publicação em breve). Aqui, nos restringimos a observar um estudo publicado de
preferências por cenário de prioridade, em numa série de oficinas de grupos focais com administradores
de saúde, em diferentes municípios na Noruega [31]. Uma das questões era a respeito do interesse
próprio. Indivíduos foram solicitados a pensar em dois hospitais, A e B. O hospital A dava igual
prioridade a pacientes com a mesma gravidade da doença, independentemente do grau de tratabilidade se
o efeito do tratamento fosse substancial. O hospital B dava prioridade àqueles com maior potencial para
melhora. Os indivíduos eram lembrados de que não poderiam saber que tipos de doença poderiam
contrair no futuro e perguntava-se então a eles, a qual hospital prefeririam “pertencer”, caso levassem em
conta apenas seu interesse próprio, como possíveis pacientes futuros. Dos 51 indivíduos, 31 preferiram o
hospital A (prioridade igual para pessoas com diferentes potenciais de tratamento), enquanto que 20
preferiram o hospital B (prioridade conforme o potencial de tratamento). O resultado é consistente com
nosso raciocínio acima. De modo geral, percebemos – ao observar condições diferentes e pacientes com
diferentes tratabilidade e potencial – que estimar a utilidade pessoal das intervenções observando-se
simplesmente as diferenças entre os valores prospectivos do estado de saúde, é um elemento do
procedimento QALY que requer reconsideração.
Incorporação de Preocupações pela Imparcialidade
Em teoria, o modelo QALY pode ser modificado para incorporar as preocupações pela imparcialidade
notadas anteriormente neste artigo e, dessa maneira, torna-se um modelo de “QALYs ajustados para a
equidade”. Uma modificação seria contar como 1 todos os anos de vida ganhos, mesmo se eles
transcorressem numa condição inferior à de plena saúde, já que são suficientemente bons para ser
desejados pelos indivíduos sob análise [9]. Embora concordando com a premissa ética subjacente,
Johannesson [32] alegou que tal abordagem levaria a inconsistências com as preferências individuais por
cuidados à saúde. Uma resposta a esta objeção foi dada [33]. Uma segunda modificação seria colocar
peso menor na duração dos benefícios de saúde, nas comparações de programas para pacientes com
diferentes expectativas de vida. Isto poderia ser feito, por exemplo, descontando-se os ganhos de saúde
distantes, mais fortemente do que na costumeira taxa anual de 3%–5%, usual na análise convencional de
custo-efetividade; ou então desconsiderando-se benefícios que estão além de um certo ponto no tempo.
Uma terceira modificação seria acrescentar pesos de equidade explícita [34], ou – mais especificamente –
pesos de gravidade e pesos de potencial [9], aos pesos de qualidade de vida do modelo convencional.
Alternativamente, poder-se-ia transformar utilidades convencionais em valores societários que
incorporem preocupações pela gravidade da doença e a relutância em discriminar fortemente aqueles com
condições menos tratáveis e/ou menor potencial para saúde [7,9]. Como pode ser visto na Figura 4, uma
curva de transformação que é convexa para o eixo y e tem forte compressão na extremidade superior
pode, em princípio, acomodar ambas destas preocupações. Por exemplo, na figura, a curva transforma
utilidades convencionais de 0,4 e 0,7 em valores societários de 0,8 e 0,95. Se substituir as utilidades do
eixo x pelos valores do eixo y, o valor, por exemplo, de uma cura de A em relação a B aumenta de 2:1
para 4:1 (preocupação pela gravidadee), enquanto que o valor, por exemplo, de levar-se alguém de A para
B em relação ao curso de A para saúde plena, aumenta de ½ para ¾ (preocupação para potencial
reduzido). Algumas funções experimentais deste tipo, baseadas empiricamente, de transformação de
utilidades a partir do Índice de Utilidades de Saúde, do EQ-5D e de outros instrumentos multiatributo de
utilidade, foram publicadas [35].
QALYs: Alguns Desafios
S17
Valores societários
Utilidades partindo-se do ponto de vista de plena saúde
Figura 4 Ganhos de avaliação no funcionamento/qualidade de vida: Transformação de Utilidades (Fonte: [7], comparar
com [9]).
A ideia de incorporar preocupações pela imparcialidade em um modelo numérico de avaliação pode soar
lógica, mas não é desprovida de problemas. Alguns podem achar que, já que a validade do QALY como
uma medida da utilidade individual é, em si mesma, questionável, dever-se-ia devotar escassos recursos
intelectuais à resolução dessa questão, antes que fossem encarados desafios mais amplos. Outros estão
aflitos com a possibilidade de a incorporação de preocupações pela imparcialidade sobrecarregar o
modelo e, talvez, torná-lo mais difícil de compreender e menos confiável [36–39]. Sua preferência é
deixar que os tomadores de decisão levem em conta de modo informal, as preocupações pela
imparcialidade nos processos deliberativos plausíveis, ao lidar com os resultados das análises de custoefetividade.
Como uma alternativa a elaborar o QALY para incorporar preocupações de imparcialidade, os processos
deliberativos plausíveis poderiam ser usados para determinar uma faixa de limites de custo por QALY
segundo o contexto (em vez de modificar o próprio QALY). Tal abordagem poderia consistir no
estabelecimento de um arranjo de “classes de prioridade”, às quais os tratamentos seriam designados de
acordo com outros critérios, que não a custo-efetividade (por exemplo, a gravidade da condição, a falta de
melhores alternativas de tratamento ou considerações especiais de final de vida). Quanto mais merecedora
de financiamento for considerada uma dada intervenção conforme esses outros critérios, mais elevada
seria sua designação a uma determinada classe. Quanto mais elevada a classe de prioridade, maiores
seriam os limites experimentais de custo por QALY. Um considerável leque de limites poderia ser
decidido sobre a faixa de classes, com base em deliberações cuidadosas, feitas por pessoas imparciais, a
respeito dos valores societários no cenário de prioridades. Na apreciação de novas tecnologias, dois tipos
de avaliação seriam realizados simultaneamente e de forma independente um do outro (por pessoas
diferentes).
Um tipo seria a designação da classe, baseada sempre em deliberações de pessoas informadas e
imparciais. O outro tipo seria a análise de custo-efetividade. O resultado dessa segunda avaliação seria
comparado ao limite relevante, ou seja, àquele limite que resultou da designação independente da classe.
Tal processo de dois canais, teoricamente, removeria a atual supremacia das considerações de custoefetividade na avaliação econômica; particularmente se um amplo leque fosse decidido, entre os limites
de custo por QALY mais elevado e mais baixo.
A escolha dos métodos e procedimentos para incorporar as preocupações pela imparcialidade é uma
questão prática importante para a continuação do debate, conforme notado em outro local nesta edição
[40]. As possibilidades acima foram mencionadas para indicar o quanto as modificações do modelo
QALY convencional teriam de ser complicadas ou não; trazendo assim, clareza ao debate.
Mas a Figura 4 revela um problema mais profundo. Os valores societários sobre o eixo y têm o objetivo
de indicar quão importante a sociedade pensa ser, tratar as pessoas no estado A, em comparação àquelas
no estado B. No exemplo na figura, a razão é 4:1. Por outro lado, conforme os números no eixo x, pessoas
em condição normal de saúde disseram ver o estado A, como somente duas vezes pior que o estado B. Ao
avaliar programas preventivos, parece que a última razão é mais relevante que a razão resultante da
transformação.
Alguns verão este como um problema de inconsistência matemática. Nós o vemos de forma diferente.
Prevenção e tratamento são atividades que têm lugar em diferentes contextos, nos quais as pessoas – tanto
QALYs: Alguns Desafios
S18
pacientes, quanto tomadores de decisão – têm diferentes pontos de referência, expectativas e sensação de
obrigação para com os demais. Não se espera, necessariamente, consistência matemática nos valores e
preferências, em todas as situações que difiram sobre tais questões.
Isto nos leva a levantar a questão sobre a possibilidade de, nas avaliações societárias de programas de
saúde, haver necessidade de distinguir-se entre avaliações de programas preventivos e curativos. É,
talvez, ingênuo pensar que um único método de avaliação seja suficiente, para informar a definição de
prioridades em dois contextos tão diferentes. Pelo fato de o QALY convencional refletir os julgamentos
prospectivos do público geral, a respeito da inconveniência de diferentes estados de saúde, poder-se-ia
dizer que ele, primariamente, fala sobre os desafios de se estabelecer prioridades entre programas
preventivos. Quando se trata de avaliar e comparar intervenções e programas de tratamento para pessoas
com diferentes graus de gravidade da doença e diferentes potenciais para saúde, o modelo QALY
convencional pode, razoavelmente, ter menos a dizer; então, modelos mais sofisticados seriam
requeridos.
Observação Final
Este artigo baseia-se na premissa de que modelos de avaliação formal podem ser úteis, no sentido de
aumentar a responsabilidade na tomada de decisão sobre alocação de recursos para cuidados à saúde. Esta
além do escopo deste artigo, discutir exatamente em que extensão tais modelos podem ser úteis; incluindo
a discussão sobre quão sofisticados podem ser os modelos, sem que se tornem mais mistificadores que
informativos. Insistimos em que quaisquer que sejam os modelos formais escolhidos para uso pelos
analistas, os resultados das avaliações formais não devem ser tomados como “respostas” finais a questões
de alocação de recursos. Em vez disso, eles devem sempre servir como contribuições a outras
deliberações e processos de decisão [36,37]. Esta é também a posição oficial do relatório do NICE
(National Institute for Health and Clinical Excellence) e Instituto de Medicina (Institute Of Medicine –
IOM) no relatório sobre a custo-efetividade em cenários regulatórios [41,27].
Agradecemos Ali McGuire, George Torrance e Milton Weinstein por seus valiosos comentários aos esboços prévios
deste artigo.
Fonte de apoio financeiro: O financiamento para a Oficina de Desenvolvimento de Consenso da ISPOR “Construindo
uma Via Pragmática: Desenvolvendo o QALY” tornou-se possível, em parte, pelo fundo 1R13 HS016841-01 da
Agência para Pesquisa e Qualidade em Cuidados à Saúde (Agency for Healthcare Research and Quality – AHRQ).
As visões expressas nos materiais escritos ou publicações da oficina, e pelos palestrantes ou moderadores, não
necessariamente refletem as políticas oficiais do Departamento de Saúde e Serviços Humanos; nem a menção a
nomes comerciais, práticas de comércio ou organizações implica em endosso pelo governo dos EUA. Financiamento
para esta Edição Especial de Value in Health, “Construindo uma Via Pragmática: Desenvolvendo o QALY”, foi
tornado possível, em parte, pelo contrato nº HHSN261200800148P do Instituto Nacional do Câncer.
Erik Nord, Norman Daniels e Mark Kamlet não têm conflitos a declarar.
Referências
1
Weinstein M, McGuire A, Torrance G. QALYs: the basics. Value Health 2009;12(Suppl. 1):S5–9.
2
Gold M, Siegel JE, Russell LB, Weinstein MC. Cost-Effectiveness in Health and Medicine. New
York: Oxford University Press, 1996.
3
Drummond M, Sculpher MJ, Torrance GW, et al. Methods for the economic evaluation of health
care programmes. New York: Oxford Medical Publications, 2005.
4
Daniels N. Just Health. Meeting Health Needs Fairly. New York: Cambridge University Press, 2008.
5
Bombardier C, et al. Comparison of three preference measurement methodologies in the evaluation
of a functional status index. In: Deber RB, Thompsom GG, eds. Choice in Health Care. Toronto:
University of Toronto, Department of Health Administration, 1982.
6
Salomon J, Murray C. A multi-method approach to measuring health state valuations. Health Econ
2003;13:281–90.
QALYs: Alguns Desafios
S19
7
Nord E. Health status index models for use in resource allocation decisions. Int J Technol Assess
Health Care 1996;12:31–44.
8
Berg R. Establishing the values of various conditions of life for a health status index. In: Berg R,
ed., Health Status Indexes. Chicago: Hospital Research and Educational Trust, 1973.
9
Nord E, Pinto JL, Richardson J, et al. Incorporating societal concerns for fairness in numerical
valuations of health programmes. Health Econ 1999;8:25–39.
10
Dolan P, Kahneman D. Interpretations of utility and their implications of the valuations of health.
Econ J 2008;118:215–34.
11
Fowler FJ, Cleary PD, Massagli MP, et al. The role of reluctance to give up life in the measurement
of the value of health states. Med Decis Making 1995;15:195–200.
12
O’Leary J, Fairclough DL, Jankowski MK, Weeks JC. Comparison of time trade-off utilities and
rating scale values of cancer patients and their relatives. Med Decis Making 1995;15:132–7.
13
Nord E. Time-trade off scores in patients with chronic disease. Comparison with the York
hypothetical TTO tariff. In: Nord E, ed., EuroQol Plenary Meeting Proceedings 1997. Working
Paper 2/97. Oslo: Norwegian Institute of Public Health, 1997.
14
Daniels N, Rose S, Zide ED. Disability, adaptation, and inclusion. In: Kimberley B, Cureton A, eds.
Disability and Disadvantage: Re-examining Topics in Moral and Political Philosophy. New York:
Oxford University Press, (in press).
15
Daniels N. Just Health Care. Cambridge, MA: Harvard University Press, 1995.
16
Daniels N. Rationing fairly programmatic considerations. Bioethics 1993;7:224–33.
17
Kamm FM. Morality, Mortality: Death and Whom to Save From it: Volume 1. Oxford: Oxford
University Press, 1993.
18
Nord E. Cost-Value Analysis in Health Care. New York: Cambridge University Press, 1999.
19
Dolan P, Shaw R, Tsuchyia A, Williams A. 2005. QALY maximization and people’s preferences: a
methodological review of the literature. Health Econ 2005;14:197–208.
20
Nord E. The relevance of health state after treatment in prioritizing between patients. J Med Ethics
1993;19:37–42.
21
Nord E. The trade-off between severity of illness and treatment effect in cost-value analysis of
health care. Health Policy 1993;24:227–38.
22
Nord E, Richardson J, Street A, et al. Maximising health benefits versus egalitarianism. Soc Sci
Med 1995;41:1429–37.
23
Abellan-Perpinan JM, Pinto-Prades JL. Health state after treatment: a reason for discrimination?
Health Econ 1999;8: 701–7.
24
Dolan P, Cookson R. Measuring Preferences Over the Distribution of Health Benefits. Mimeo.
York, UK: University of York, Centre for Health Economics, 1998.
25
Harris J. QALYfying the value of life. J Med Ethics 1987;13:117–23.
26
Ubel P, Richardson J, Pinto-Prades JL. Life-saving treatments and disabilities. Are all QALYs
created equal? Int J Technol Assess Health Care 1999;15:738–48.
27
Miller W, Robinson LA, Lawrence RS, eds. Valuing Health for Regulatory Cost Effectiveness
Analysis. Washington, DC: Institute of Medicine, National Academies Press, 2006.
QALYs: Alguns Desafios
S20
28
Simon HA. A behavioural model of rational choice. Q J Econ 1955;69:99–118.
29
Kahneman D, Tversky A. Prospect theory: an analysis of decision under risk. Econometrica
1979;47:263–91.
30
Schoemaker PJ. The expected utility model: its variants, purposes, evidence and limitations. J Econ
Lit 1982;20:529–63.
31
Nord E. The person trade-off approach to valuing health care programs. Med Decis Making
1995;15:201–8.
32
Johannesson M. Should we aggregate relative or absolute changes in QALYs? Health Econ
2001;10:573–7.
33
Nord E, Richardson J, Menzel P. The value of life: individual preferences and social choice. Health
Econ 2003;12:873–7.
34
Williams A. Economics, society and health care ethics. In: Gillon R, ed., Principles of Health Care
Ethics. London: Wiley and Sons, 1994.
35
Nord E. Health state values from multi-attribute utility instruments need correction. Ann Med
2001;33:371–4.
36
Daniels N, Sabin J. Setting Limits Fairly: Can We Learn to Share Medical Resources? New York:
Oxford University Press, 2002.
37
Daniels N, Sabin J. Setting Limits Fairly: Learning to Share Resources for Health (2nd ed.). New
York: Oxford University Press, 2008.
38
Dolan P, Olsen JA. Distributing Health Care: Economic and Ethical Issues. Oxford, UK: Oxford
University Press, 2002.
39
Haninger K. The Role of EquityWeights in Allocating Health and Medical Resources. Boston:
Center for Risk Analysis, Harvard University, 2006.
40
Drummond M, Brixner D, Gold M, et al. Toward a consensus on the QALY. Value Health
2009;12(Suppl. 1):S31–5.
41
National Institute of Health and Clinical Excellence. Social Value Judgements. Principles for the
Development of NICE Guidance. London: NICE, 2005