scalon,+Journal+editor,+A10 v34 n4 60NV
scalon,+Journal+editor,+A10 v34 n4 60NV
scalon,+Journal+editor,+A10 v34 n4 60NV
RESUMO: O câncer de mama é o segundo tipo de câncer mais comum no mundo (WORLD
CANCER REPORT 2014 a, b). A evolução do tratamento do câncer da mama permite uma vida
mais longa para as pacientes. Neste artigo, será considerado um estudo com um conjunto de
dados relacionados a um estudo realizado no Hospital das Clínicas da Faculdade de Medicina da
Universidade de São Paulo, Ribeirão Preto, Brasil, com pacientes em estágios II e III de câncer
de mama HER2 atendidos na Divisão de Câncer de mama do HCFMRP- USP no período de
2008 a 2012, passando por quimioterapia neoadjuvante associado com o medicamento
Herceptin®. O principal objetivo deste estudo é verificar se há diferenças significativas nos
tempos de sobrevida das pacientes que receberam, pelo menos, quatro ciclos de Herceptin® e as
que receberam menos ciclos da medicação durante a meodjuvância. Como objetivo secundário,
será verificado se algumas covariáveis observadas (idade, estágio da doença, tipo de cirurgia,
resposta patológica completa, positividade para receptor de estrogênio ou positividade para
receptor) apresentam efeitos significativos sobre os tempos de sobrevivência das pacientes (SLD:
sobrevida livre da doença e ST: sobrevida total, ambas em meses). Para isso, são discutidas as
vantagens de um modelo estatístico com fração de curas em termos de ajuste aos dados quando
comparado com modelos tradicionais baseados na distribuição Weibull sem fração de curas sob
um enfoque clássico ou Bayesiano onde é feito um estudo comparativo. Sumários a posteriori de
interesse são obtidos usando métodos MCMC (Markov Chain Monte Carlo) existentes.
PALAVRAS-CHAVE: Dados censurados; covariáveis; modelos de fração de curas; dados de
câncer de mama; análise Bayesiana.
1 Introdução
A cada ano estima-se que cerca de um milhão e meio de novos casos de câncer de
mama são diagnosticados em todo o mundo. É a forma de câncer mais comum em
mulheres, compreendendo 25% de todos os tipos de câncer (WORLD CANCER
1
Universidade de São Paulo - USP, Faculdade de Medicina de Ribeirão Preto, Departamento de Medicina
Social, CEP: 14049-900, Ribeirão Preto, SP, Brasil. E-mail: [email protected]; [email protected]
2
Universidade de São Paulo - USP, Faculdade de Medicina de Ribeirão Preto, Departamento de Ginecologia e
Obstetrícia, CEP: 14049-900, Ribeirão Preto, SP, Brasil. E-mail: [email protected];
[email protected]
2 Materiais e métodos
Cada paciente foi acompanhada desde a data de entrada no estudo (entre os anos de
2008 e 2012) até a data de encerramento (01/01/2014). Todas as pacientes receberam o
medicamento Herceptin® sendo que 39 das pacientes em estudo receberam pelo menos 4
ciclos do medicamento antes da cirurgia, enquanto que 15 receberam menos do que 4
ciclos do medicamento pré-cirurgia. Os dados desse estudo apresentam duas variáveis
respostas de interesse para cada paciente: o tempo de sobrevida livre da doença (SLD) (a
paciente pode apresentar recidiva ou não) e o tempo de sobrevida total (ST) (óbito por
câncer de mama ou sobrevida até o último tempo de seguimento), dados em meses. São as
colunas “Recid” e “Óbito” do Anexo 1. Além disso, o Anexo 1 contêm as informações de
censuras associadas respectivamente aos tempos livres da doença e aos tempos de
sobrevida total. No anexo 1 as dicotomizações das covariáveis, como por exemplo, idade
e hercept foram feitas a partir de critérios estabelecidos por pesquisadores da área de
oncologia.
A distribuição de Weibull (1951) tem sido muito utilizada na análise de dados
médicos (ver, por exemplo, COX e OAKES, 1984; COLOSIMO e GIOLO, 2006) e
industriais (ver, por exemplo; NELSON, 2004; LAWLESS, 1982; MEEKER e
ESCOBAR, 1998) dada a sua grande flexibilidade de ajuste.
Inicialmente é assumida uma análise de dados baseada em uma distribuição de
Weibull com dois parâmetros desprezando a possível presença de uma fração de cura na
amostra. Sua função densidade de probabilidade é dada por:
(1)
(3)
(4)
(5)
(6)
(7)
(10)
(12)
,
em que , ,
e
Na presença de um vetor de covariáveis que afeta os parâmetros p e
, mas não afeta o parâmetro de forma , assume-se o seguinte modelo de regressão:
e . (13)
(14)
(16)
(17)
.
Na obtenção de inferências estatísticas para os modelos propostos são considerados
métodos clássicos baseados em estimação de máxima verossimilhança para os parâmetros
do modelo e resultados assintóticos na obtenção de intervalos de confiança e testes de
hipóteses e métodos Bayesianos.
Os métodos Bayesianos são uma boa alternativa para os modelos de regressão na
presença de fração de cura e dados censurados (ver, por exemplo, PAULINO et al., 2003),
pois os métodos clássicos baseados na distribuição normal assintótica para os estimadores
de máxima verossimilhança podem não ser muito precisos com tamanhos amostrais não
muito grandes e grande proporção de dados censurados. Além disso, consideram-se
métodos de simulação MCMC (Monte Carlo em Cadeias de Markov) para a obtenção de
sumários a posteriori de interesse (ver, por exemplo, GELFAND e SMITH, 1990;
CASELA e GEORGE, 1992; CHIB e GREENBERG, 1995) com o uso do software
OpenBugs (SPIEGELHALTER et al., 2003).
3 Resultados e discussões
Figura 1 - Estimadores de Kaplan-Meier: (a) Tempos de sobrevida livre da doença, (b) Tempos de
sobrevida total.
30 Censurados 37
20
10
3
2
1
-5 -4 -3 -2 -1 0 1 2
Resíduos padronizados
Figura 2 - Gráficos dos resíduos padronizados para a regressão de Weibull (tempos livres da
doença e tempos totais).
Para uma análise Bayesiana dos tempos de sobrevida livre da doença ou tempos
totais de sobrevida assume-se agora uma distribuição de Weibull sem a presença de
covariáveis e na presença de fração de cura. São consideradas as seguintes distribuições a
priori: α ~ Gama(1,1), ~ Beta(70,30) e θ ~ U(0,300), onde U(a,b) denota uma
distribuição uniforme no intervalo (a,b) e Beta(a,b) denota uma distribuição beta com
média igual à a/(a+b) e variância igual áab/[(a+b)2(a+b+1)]. Observar que os hiper-
parâmetros da distribuição beta dados por a=70 e b=30 foram escolhidos levando a uma
priori informativa (uso de métodos Bayesianos empíricos, ver, por exemplo, Carlin e
Louis, 2002) para , com média igual à 0,70 (um valor próximo da proporção observada
de dados censurados, interpretados como pacientes imunes ou curados).
Na simulação de amostras da distribuição a posteriori de interesse, foi considerada
uma amostra de aquecimento “burn-in sample” de tamanho 1.000; a seguir foram geradas
outras 600.000 amostras tomando amostras de 100 em 100 totalizando uma amostra final
de tamanho 6.000 que será utilizada para obter as quantidades a posteriori de interesse. Na
Tabela 4, são apresentados os sumários a posteriori de interesse.
Tabela 4 - Sumários a posteriori de interesse modelo com fração de cura sem covariáveis.
Tempos de sobrevida livre da doença
Intervalo de Credib (95%)
Média Desvio Padrão
Limite Inferior Limite Superior
2,52 0,5685 1,508 3,771
42,94 6,5655 32,97 58,51
0,67 0,0409 0,5825 0,7411
Tempos totais de sobrevida
2,52 0,850 1,095 4,359
60,34 19,650 39,850 109,300
p 0,83 0,035 0,760 0,896
Sendo assim, as funções de sobrevivência sob uma abordagem Bayesiana
considerando os modelos de Weibull sem e com fração de cura (ver estimadores
Bayesianos nas Tabelas 3 e 4) são dadas, respectivamente (tempos livres da doença) por:
Considerar agora uma análise Bayesiana dos dados (SLD) assumindo uma
distribuição de Weibull com densidade f(t) = αθtα-1*exp{-θtα}, na presença de covariáveis
e o modelo de regressão dado por:
(19)
Considerar agora uma análise Bayesiana dos dados assumindo uma distribuição de
Weibull na presença de covariáveis, fração de cura e o modelo de regressão afetando o
parâmetro de escala da distribuição Weibull θ dado por (19).
Assumindo distribuições a priori não-informativas normais N(0,1) para todos os
parâmetros de regressão βr, r = 0, 1, 2,...,7; θ ~ Gama(1,1), ~ Beta(70,30) e usando o
software OpenBugs, versão 3.2.2, (burn-in sample =1.000 e 6.000 amostras finais
tomadas de 100 em 100), tem-se na Tabela 6 os sumários a posteriori de interesse.
Dos resultados da Tabela 6, também se observa que a covariável estágio tem um
efeito significativo (intervalo de credibilidade para o parâmetro de regressão β3
correspondente não inclui o valor zero).
Considerar uma análise Bayesiana dos tempos de sobrevida livre da doença
assumindo uma distribuição de Weibull na presença de covariáveis, fração de cura e os
modelos de regressão afetando o parâmetro de escala da distribuição Weibull dado por
(19) e o modelo para a fração de cura , dado por:
(20)
3.2.5 Modelo de Weibull com fração de cura com covariáveis afetando o parâmetro
de escala da distribuição Weibull e a probabilidade de cura para o tempo de
sobrevida livre da doença
3.2.7 Modelo Weibull com fração de cura e com covariáveis afetando o parâmetro
de escala da distribuição Weibull para o tempo de sobrevida total (ST)
3.2.8 Modelo Weibull com fração de cura e com covariáveis afetando o parâmetro
de escala da distribuição Weibull e a probabilidade de cura para o tempo de
sobrevida total (ST)
Considerar agora uma análise Bayesiana dos tempos de sobrevida total assumindo
uma distribuição de Weibull na presença de covariáveis, fração de curas e os modelos de
regressão afetando parâmetro de escala da distribuição Weibull e a fração de cura, dados
por (19 e 20).
Assumindo distribuições a priori não-informativas normais N(0,1) para todos os
parâmetros de regressão , ; r = 0, 1, 2,...,7 e θ ~ Gama(1,1) e usando o software
OpenBugs (burn-in sample = 1.000 e 6.000 amostras finais tomadas de 100 em 100), são
apresentados na Tabela 10, os sumários a posteriori de interesse.
Dos resultados da Tabela 10, observa-se que a covariável estágio tem efeito
significativo (intervalo de credibilidade para o parâmetro de regressão não inclui o
valor zero).
4 Resultados e discussão
O uso de modelos de fração de cura pode ser de grande interesse na análise de dados
de sobrevida para pacientes com câncer de mama, dado que novas terapias levam a
tempos de sobrevida maiores ou mesmo a cura de muitas pacientes, sendo assim em uma
grande parcela da amostra não ocorre o evento de interesse. Dessa forma, modelos
tradicionais sem a presença de fração de cura sob o enfoque clássico ou Bayesiano podem
não ser apropriados. Esses resultados são de grande interesse médico.
O uso de métodos Bayesianos tem crescido de forma substancial na análise de dados
médicos de sobrevivência na presença de censuras e covariáveis, especialmente usando
métodos MCMC de simulação de amostras da distribuição a posteriori de interesse para
determinar os sumários a posteriori de interesse com o uso do software OpenBugs, na
obtenção de inferências muito precisas que independem do tamanho amostral. É
importante salientar que os métodos clássicos usualmente baseados na distribuição normal
assintótica para os estimadores de máxima verossimilhança podem não ser muito precisos
com tamanhos amostrais não muito grandes e grande proporção de dados censurados,
especialmente com modelos na presença de fração de cura.
A análise dos dois tempos de sobrevida disponíveis deste estudo não evidenciou
diferença significativa nos tempos de sobrevida das pacientes que receberam pelo menos
quatro ciclos de Herceptin® antes da cirurgia ou menos de quatro ciclos.
Os modelos Weibull sob enfoque clássico na presença de covariáveis obtiveram
desempenho inferior em termos de sensibilidade na determinação de fatores significativos
nos tempos de sobrevida das pacientes com câncer na mama em relação aos modelos
Bayesianos apresentados neste artigo. Os modelos Bayesianos se ajustam melhor aos
Nos tempos de sobrevida livre da doença, estágio foi significativa nos modelos
Weibull (Bayesiano) sem a presença de fração de cura, no modelo Weibull com fração de
cura afetando o parâmetro de escala e no modelo Weibull Bayesiano com fração de cura
afetando o parâmetro de escala e a probabilidade de cura. No modelo Weibull (Bayesiano)
sem a presença de fração de cura, o tempo mediano de sobrevida livre da doença de
pacientes do estágio 2 é 2,77 vezes maior do que o tempo mediano de pacientes do estágio
3, os outros modelos estimaram este tempo mediano como 2,20 vezes e 2,15 vezes
respectivamente. Dos resultados da análise do tempo de sobrevida total, o modelo Weibull
Bayesiano com fração de cura afetando o parâmetro de escala e a probabilidade de cura
traz evidências de que a covariável estágio afeta o tempo de sobrevida total das pacientes,
estimando que o tempo mediano de sobrevida de pacientes do estágio 2 é 3,09 vezes
maior do que pacientes do estágio 3. Todas as outras covariáveis do estudo não
apresentaram evidências de influencia nos tempos de sobrevida das pacientes.
É interessante observar que outras distribuições paramétricas para dados de
sobrevivência poderiam ser usados na análise desses dados, mas a distribuição Weibull
apresentou um bom ajuste para os dados da Tabela 1. Nessa direção podemos mencionar
várias distribuições exponenciais generalizadas (ver, por exemplo, MUDHOLKAR e
SRIVASTAVA, 1993; GUPTA e KUNDU, 1999, 2007; RAQAB e AHSANULLAH,
Agradecimentos
O presente trabalho foi realizado com apoio do CNPq, Conselho Nacional de
Desenvolvimento Científico e Tecnológico – Brasil. Os autores agradecem às excelentes
sugestões apresentadas pelos revisores que levaram á grande melhoria na apresentação do
manuscrito.
ICUMA, T. R.; BUZZATTO, I. P. C.; TIEZZI, D. G.; ACHCAR, J. A. Analysis of survival data for
breast cancer patients: a case study assuming cure fraction models under the Bayesian approach.
Rev. Bras. Biom., Lavras, v.34, n.4, p.669-692, 2016.
ABSTRACT: Breast cancer is the second most common cancer in the world (WORLD CANCER
REPORT 2014 a, b). The evolution of the treatment of breast cancer allows a longer life for the
patients. In this article, it will be considered a study with a data set related to a study conducted
at the Hospital das Clinicas, Faculty of Medicine, University of São Paulo, Ribeirão Preto,
Brazil, with patients in stages II and III of HER2 breast cancer treated at the HCFMRP USP
breast cancer division from 2008 to 2012, undergoing neoadjuvant chemotherapy combined with
Herceptin drug. The aim of this study is to verify that there are significant differences in survival
times of patients who received at least four cycles of Herceptin. As a secondary objective, it will
be checked if some observed covariates (age, stage of disease, type of surgery, pathologic
complete response, positive for estrogen receptor or positive for receptor have significant effects
on the patients survival times (SLD: free survival disease and ST: overall survival, both in
months) for this, we discuss the advantages of a statistical cure fraction model in terms of fit to
the data when compared with traditional models based on the Weibull distribution without cure
fraction under an classical or a Bayesian approach where a comparative study is done.
Posterior summaries of interest are obtained using existing MCMC methods (MCMC).
KEYWORDS: Censored data; covariates; fraction models cures; breast cancer data; Bayesian
analysis.
Recebido em 03.02.2016
Aprovado após revisão em 03.06.2016
Ident Idade Hercep Est Cirur pCR Estr Proge Recid SLD Óbito ST
2 1 1 3 1 1 0 0 0 60 0 60
3 1 2 3 0 0 0 0 0 42 0 42
4 0 2 3 0 1 0 0 0 30 0 30
7 1 2 3 0 0 1 1 0 30 0 30
8 0 1 2 0 1 1 1 0 45 0 45
9 1 1 3 1 1 1 1 0 83 0 83
10 1 2 3 1 0 1 1 0 56 0 56
11 1 1 3 1 1 1 1 0 53 0 53
13 1 2 3 1 1 0 0 0 32 0 32
14 0 1 3 0 0 1 1 1 30 0 58
16 0 1 3 1 0 0 0 0 72 0 72
18 1 1 3 1 1 1 1 0 30 0 30
19 1 1 3 0 0 0 0 0 65 0 65
20 1 1 3 0 1 0 0 0 68 0 68
21 1 1 3 1 1 0 0 1 20 0 60
22 1 1 3 0 0 1 0 0 64 0 64
23 1 2 3 0 0 1 1 0 40 0 40
25 1 1 3 1 0 0 1 0 33 0 33
26 1 2 3 1 1 0 0 1 39 1 44
27 1 2 3 1 0 1 1 0 37 0 37
29 1 1 2 1 1 0 0 0 37 0 37
30 1 1 3 1 0 1 0 0 27 0 27
31 1 2 3 0 0 0 0 1 24 0 34
32 0 1 3 1 0 0 0 1 22 0 59
33 1 1 3 1 0 0 0 0 34 0 34
35 1 1 3 1 1 0 0 0 34 0 34
37 1 2 3 0 1 1 0 0 58 0 58
39 1 2 2 1 1 1 1 0 29 0 29
40 1 1 3 0 1 1 0 0 46 0 46
41 0 1 3 1 0 0 0 0 32 0 32
42 1 1 3 1 0 0 0 0 66 0 66
43 1 2 3 1 1 0 0 0 44 0 44
48 0 2 3 1 1 1 1 0 22 0 22
49 0 1 3 1 0 1 0 1 53 1 61
50 1 1 2 0 1 0 0 0 55 0 55
51 1 1 3 1 1 0 0 0 65 0 65
52 0 1 3 1 0 1 1 1 44 1 50
53 1 1 3 1 0 1 0 1 15 1 53
54 1 1 3 1 0 0 0 1 33 1 37
55 1 1 3 1 0 0 0 1 12 1 17
57 1 1 2 0 0 1 1 0 59 0 59
58 1 1 3 1 0 1 0 0 39 0 39
60 1 1 3 1 0 1 1 0 29 0 29
61 1 2 2 1 1 1 1 0 31 0 31
63 1 1 3 1 0 0 0 0 35 0 35
65 1 1 3 1 1 0 0 1 22 1 28
66 1 1 2 * * 0 0 * 8 1 8
68 1 1 3 1 0 0 0 * 22 0 22
70 0 1 3 0 0 0 0 1 47 0 62
71 0 1 2 1 0 0 0 0 25 0 25
72 0 1 3 1 1 0 0 1 48 0 58
73 1 1 3 1 0 1 1 1 49 0 83
74 1 1 2 0 1 0 0 1 31 0 41
75 1 2 2 0 1 1 1 0 16 0 16