Universidade do Minho Escola de Ciências Estudos Bioestatísticos em Leucemias Professor Doutor Luís Filipe Meira Machado e co-orientação do

September 25, 2017 | Autor: Edgar Mesquita | Categoria: N/A
Share Embed


Descrição do Produto

Universidade do Minho Escola de Ciências

Edgar Martins Mesquita

Estudos Bioestatísticos em Leucemias Mielóides Agudas e Linfomas

Tese de Mestrado em Estatística

Trabalho efetuado sob a orientação do Professor Doutor Luís Filipe Meira Machado e co-orientação do Dr. José Mário Mariz

Julho 2013

DECLARAÇÃO

Nome: Edgar Martins Mesquita Endereço eletrónico: [email protected] Telefone: 916 622 664 Número do Cartão de Cidadão: 12584759 Título da Tese: Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas Orientadores: Doutor Luís Filipe Meira Machado Dr. José Mário Mariz Ano de conclusão: 2013 Designação do Mestrado: Mestrado em Estatística

É AUTORIZADA A REPRODUÇÃO INTEGRAL DESTA TESE/TRABALHO APENAS PARA EFEITOS DE INVESTIGAÇÃO, MEDIANTE DECLARAÇÃO ESCRITA DO INTERESSADO, QUE A TAL SE COMPROMETE;

Universidade do Minho, ___/___/______

Assinatura: ________________________________________________

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

Agradecimentos Terminou uma etapa que me marcou particularmente. Marcou-me pelos conhecimentos adquiridos, pela excelsa relação com o corpo docente, pela fantástica experiência proporcionada pelo IPOPFG e pela rede de afetos que levo comigo para sempre. Este trabalho é o culminar de um desafio que abracei, e em grande parte é obra do inestimável papel que todos os que agora agradeço prestaram nesta caminhada.

Ao Doutor Luís Machado pela orientação, estímulo e inexcedível disponibilidade. Ao Dr. José Mário Mariz pela fantástica oportunidade de estágio que me proporcionou, orientação e disponibilidade. À Dr.ª Dulcineia Pereira à qual me faltam as palavras para agradecer tudo quanto fez por mim, revelando-se um apoio inolvidável. À minha família, pela compreensão que teve para comigo. À Ana Cecília, por estar sempre comigo. À Cristiana e ao Mário, que hoje posso chamar de amigos, pelo estímulo, presença, boadisposição e paciência. Jamais me esquecerei de vocês. Ao António Macedo e à Ana Moreira pelos importantes contributos que deram para a elaboração deste trabalho. A todos os professores do corpo docente do Mestrado, que tive o prazer de conhecer, por todo o conhecimento transmitido, apoio, disponibilidade e boa-disposição. Finalmente quero agradecer a todos aqueles que cujo apoio, sugestões ou simplesmente interesse demonstrado, contribuíram para a conclusão deste trabalho.

A todos, um muito obrigado!

Edgar Martins Mesquita

iii

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

Resumo Ao longo dos últimos anos tem-se assistido a um grande crescimento da importância das análises de dados de sobrevivência na aplicação em várias áreas, em particular na medicina e especificamente na área da oncologia. O serviço de Onco-Hematologia do Instituto Português de Oncologia do Porto Francisco Gentil, local onde decorreu o estágio, é reconhecido internacionalmente pela atividade científica de alta credibilidade sendo membro ativo da European Organization of Research and Treatment of Cancer. O trabalho desenvolvido durante o estágio teve em conta dois objetivos principais: Utilização de métodos estatísticos de análise de dados de sobrevivência aplicados à área da oncologia, em particular em leucemias; Construção de uma base de dados em ambiente Microsoft Access para realização de um ensaio clínico em linfomas não-hodgkin foliculares. Em primeiro lugar foram explorados os conceitos teóricos inerentes à vertente clinica das leucemias, como sintomas, etiologia ou tratamento bem como os conceitos teóricos afetos às análises de dados de sobrevivência, como censura, truncatura, função de sobrevivência, função de risco, estimação de Kaplan-Meier, modelo de Riscos Proporcionais de Cox, entre outros. De seguida foi elaborado um estudo empírico tendo em conta as necessidades de estudo do serviço de Onco-Hematologia preparando para o efeito um desenho de estudo retrospetivo assente em três tipos distintos de análises: análises exploratórias (e.g. teste Mann-Whitney, regressão logística), análises de sobrevivência univariadas (estimativas de Kaplan-Meier, modelos univariados de Cox) e análises de sobrevivência multivariadas (modelos multivariáveis de Cox). A base de dados foi constituída por 313 doentes com leucemia mieloide aguda (50,8% do sexo masculino) com idade superior a 15 anos. Os resultados encontrados vão no sentido de considerar como principais fatores de impacto na recidiva, considerando apenas doentes com resposta completa no Tratamento, (Modelo 1) o Risco SWOG e a Idade de Risco; do óbito, considerando todos os doentes, (Modelo 2) as covariáveis ECOG, Risco SWOG, Idade de Risco, Esplenomegalia, Segunda Indução, Classificação LMA e Transplante; do óbito, considerando apenas doentes com resposta completa no Tratamento, com inclusão da covariável recidiva

Edgar Martins Mesquita

v

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

(Modelo 3) as covariáveis Leucocitose, Idade de Risco, Recidiva e Classificação LMA; do óbito, considerando apenas doentes com resposta completa no tratamento, com inclusão da Recidiva como covariável dependente no tempo as covariáveis Idade de Risco, Risco SWOG, Esplenomegalia e Recidiva. Para o evento óbito, o modelo que clinica e estatisticamente fez mais sentido foi o modelo 4. Por fim há a salientar a construção de uma base de dados para realização de um ensaio clínico em linfomas não-Hodgkin foliculares. Este instrumento permitirá ao serviço de Onco-Hematologia alojar os dados de todos os doentes do estudo suportando uma das próximas investigações.

Palavras-chave: Leucemia, Linfoma, Análises de Dados de Sobrevivência

vi

Edgar Martins Mesquita

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

Abstract Survival data analysis have been increasing its importance in applications on several domains, particularly in medicine, and specifically in oncology. The Onco-Hematology division of the Portuguese Institute of Oncology of Oporto Francisco Gentil, place in which the internship occurred, is internationally recognized by the high standards of its scientific production and, moreover is an active member of the European Organization of Research and Treatment of Cancer. The two main goals were to apply survival analysis in oncology data – leukemia and to build a data base in Microsoft Access environment in order to prepare a future investigation related with non-Hodgkin follicular lymphoma. First of all we explored the theoretical concepts related to the clinical aspects of leukemia, such as symptoms, etiology or treatment, as well as the theoretical concepts of survival data analysis, such as censoring, truncating, survival function, hazard function, KaplanMeier, Cox proportional hazard model, among others. The next step was to construct a study design respecting the goals of the OncoHematology division. Hence, a retrospective design was made based on three different types of analysis: exploratory analysis (e.g. Mann-Whitney test, logistic regression), univariate survival analysis (Kaplan-Meier estimates, univariate Cox models) and multivariate survival analysis (multivariate Cox models). Our methods were applied to a database containing 313 acute myeloid leukemia patients (50,8% males) older than 15 years old. Results emphasize SWOG Risk and Risk Age as disease free predictors, considering only patients with complete response on treatment (Model 1); ECOG, SWOG Risk, Risk Age, Splenomegaly, Second Induction and LMA IPO Classification as overall survival predictors, considering all patients (Model 2); Leukocytosis, Risk Age, Relapse and LMA IPO Classification as overall survival predictors, considering only patients with complete response on treatment and including relapse as covariate (Model 3); Risk Age, SWOG Risk, Splenomegaly and Relapse as overall survival predictors, considering only patients with complete response on treatment and including relapse as a time dependent covariate (Model 4). Among overall survival models, the fourth was found to be the one with the best clinical and statistical meaning.

Edgar Martins Mesquita

vii

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

Finally, it’s important to refer the creation of a database that will support a study related to non-Hodgkin follicular lymphoma. This instrument will allow the Onco-Hematology division to allocate all patient data in order to use it to a near future investigation.

Key-words: Leukemia, Lymphoma, Survival Data Analysis

viii

Edgar Martins Mesquita

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

Índice de Conteúdos Introdução ..................................................................................................................................... 1 Capítulo 1 ...................................................................................................................................... 3 Enquadramento do Trabalho de Estágio....................................................................................... 3 1.1.

Da ideia ao objeto.......................................................................................................... 3

1.2. Local de Estágio: O Instituto Português de Oncologia do Porto, Francisco Gentil IPOPFG ..................................................................................................................................... 4 1.3.

Objetivos do Estágio ..................................................................................................... 5

Capítulo 2 ...................................................................................................................................... 7 Enquadramento Teórico ao Objeto de Estudo.............................................................................. 7 2.1.

Objeto de Estudo: Leucemias ........................................................................................ 7

2.1.1.

Tipos de Leucemia ................................................................................................ 8

2.1.2.

Sintomas .............................................................................................................. 10

2.1.3.

Etiologia e Tratamento ........................................................................................ 10

Capítulo 3 .................................................................................................................................... 13 Conceitos chave em Análise de Dados de Sobrevivência ........................................................... 13 3.1.

Censura e Truncatura .................................................................................................. 13

3.1.1.

Censura ................................................................................................................ 13

3.1.2.

Truncatura ........................................................................................................... 16

3.2.

Conceitos básicos de análise de sobrevivência ........................................................... 17

3.2.1.

A função de sobrevivência .................................................................................. 18

3.2.2.

A Função de Risco ou Hazard ............................................................................ 18

3.2.3.

A Função Densidade de Probabilidade ............................................................... 19

3.2.4.

Relações entre Funções ....................................................................................... 19

3.3.

Estimação não paramétrica da função de sobrevivência: o estimador de Kaplan-Meier 20

3.3.1. 3.4.

Estimação de Kaplan-Meier: Comparação entre grupos pelo teste de log - rank 23

O modelo de Riscos Proporcionais de Cox ................................................................. 25

3.4.1.

O modelo de regressão de Cox com covariáveis dependentes no tempo ............ 29

Capítulo 4 .................................................................................................................................... 33 Estudo Empírico .......................................................................................................................... 33 4.1.

Apresentação do Estudo e da Base de Dados .............................................................. 33

4.1.1.

Apresentação do Estudo ...................................................................................... 33

Edgar Martins Mesquita

ix

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas 4.1.2.

Apresentação da Base de Dados .......................................................................... 39

4.2.

Análise Exploratória de Dados .................................................................................... 43

4.3.

Análises de Dados de Sobrevivência........................................................................... 64

4.3.1.

Estimativas Kaplan-Meier ................................................................................... 65

4.3.2.

Modelos Univariados de Sobrevivência até aos Eventos Recidiva e Óbito ........ 82

4.3.2.1.

Modelos univariados de Sobrevivência até Recidiva ...................................... 83

4.3.2.2.

Modelos univariados de Sobrevivência até Óbito ........................................... 86

4.3.3.

Modelos multivariáveis de sobrevivência para os eventos Recidiva e Óbito...... 90

4.3.3.1.

Modelo 1: Modelo multivariável de sobrevivência até Recidiva .................... 93

4.3.3.2. Recidiva

Modelo 2: Modelo multivariável de sobrevivência até Óbito sem a Covariável 94

4.3.3.3. Modelo 3: Modelo multivariável de sobrevivência até Óbito com inclusão da Covariável Recidiva ............................................................................................................ 96 4.3.3.4. Modelo 4: Modelo multivariável de sobrevivência Global com Recidiva como Covariável Dependente no Tempo ...................................................................................... 98 Capítulo 5 .................................................................................................................................. 105 Construção de uma Base de Dados para Ensaio Clínico do Estudo de Linfomas ..................... 105 5.1.

Enquadramento Teórico ............................................................................................ 105

Capítulo 6 .................................................................................................................................. 109 Conclusão .................................................................................................................................. 109 Referências ................................................................................................................................ 114 ANEXO A ................................................................................................................................. 120 Plano de Estágio ........................................................................................................................ 120 ANEXO B ................................................................................................................................. 124 Glossário de Termos Onco-Hematológicos .............................................................................. 124 ANEXO C ................................................................................................................................. 128 Formulário ................................................................................................................................. 128 Anexo D .................................................................................................................................... 134 Resumos dos Artigos submetidos no 54º Encontro Anual da SAH .......................................... 134 Prognostic Impact of High Hematogones in Acute Myeloid Leukemia ............................... 134 Low-Dose Radiotherapy in Patients withNon Hodgkin Lymphoma .................................... 136 Anexo E..................................................................................................................................... 138 Questionário para recolha dados clínicos do grupo trabalho LMA ........................................... 138 Anexo F ..................................................................................................................................... 147 Estimativas de Sobrevivência Kaplan-Meier para o Tempo até aos eventos Recidiva e Óbito 147

x

Edgar Martins Mesquita

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas Anexo G .................................................................................................................................... 157 Modelo univariado para a Recidiva e Óbito.............................................................................. 157 Anexo H .................................................................................................................................... 161 Screenshots da Base de Dados em Microsoft Access para Ensaio Clínico do Estudo de Linfomas ................................................................................................................................................... 161

Índice de Tabelas Tabela 1: Exemplo de estimação da função de sobrevivência pelos métodos de Kaplan-Meyer e Kaplan-Meyer com pesos. ........................................................................................................... 22 Tabela 2: Notação para número de mortes, sobreviventes e indivíduos em risco ...................... 23 Tabela 3: Notação para total de mortes observadas e esperadas por tratamento ...................... 24 Tabela 4: Organização dos doentes em análise no estudo .......................................................... 38 Tabela 5: Descrição das variáveis quantitativas originais ......................................................... 42 Tabela 6: Descrição das variáveis quantitativas calculadas ...................................................... 42 Tabela 7: Resumo dos dados contidos na Base de Dados ........................................................... 45 Tabela 8: Análise descritiva das variáveis qualitativas .............................................................. 46 Tabela 9: Revisão bibliográfica dos fatores de pior prognóstico ............................................... 49 Tabela 10: Tabela de contingência e teste 𝜒2 para o cruzamento entre as variáveis qualitativas e a Recidiva ................................................................................................................................. 51 Tabela 11: Tabela de Contingência com teste 𝜒2 para o cruzamento entre as variáveis qualitativas e o óbito ................................................................................................................... 53 Tabela 12: Estatísticas descritivas para os tempos de sobrevivência calculados a partir das datas disponíveis ......................................................................................................................... 55 Tabela 13: Tabela de contingência com teste 𝜒2(1 g.l.) para as variáveis Recidiva e Óbito ..... 56 Tabela 14: Estatísticas descritivas para as variáveis Idade e Hemoglobina .............................. 57 Tabela 15: Testes de normalidade Kolmogorov-Smirnov e Shapiro-Wilks para as variáveis Idade e Hemoglobina .................................................................................................................. 59 Tabela 16: Testes de hipóteses de amostras independentes para a comparação das variáveis Idade e Hemoglobina pelas condições das variáveis Recidiva e Óbito (sim/não). ..................... 60 Tabela 17: Testes de Normalidade Kolmogorov-Smirnov e Shapiro-Wilks para Tempo de sobrevivência global por cada categoria de variáveis qualitativas............................................ 61 Tabela 18: Testes de hipóteses de amostras independentes para a comparação do Tempo de sobrevivência global pelas variáveis qualitativas consideradas ................................................ 62 Tabela 19: Regressão logística multivariável com evento óbito com método backward ............ 63 Tabela 20: Estimativas de sobrevivência Kaplan-Meier para eventos Recidiva e Óbito ........... 65 Tabela 21: Estimativas Kaplan-Meier e teste log-rank para Tipo de resposta (primeira indução) ..................................................................................................................................................... 66 Tabela 22: Estimativas Kaplan-Meier e teste log-rank para score de Hematogónias................ 68 Tabela 23: Estimativas Kaplan-Meier e teste log-rank para Idade de risco .............................. 69 Tabela 24: Estimativas Kaplan-Meier e teste log-rank para ECOG .......................................... 71 Tabela 25: Estimativas Kaplan-Meier e teste log-rank para Risco SWOG inicial ..................... 73

Edgar Martins Mesquita

xi

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas Tabela 26: Classificação dos doentes segundo o Risco SWOG HG ........................................... 74 Tabela 27: Estimativas Kaplan-Meier e teste log-rank para Risco SWOG associada a Hematogónias ............................................................................................................................. 75 Tabela 28: Estimativas Kaplan-Meier e teste log-rank para Segundo tratamento de indução .. 77 Tabela 29: Estimativas Kaplan-Meier e teste log-rank para Recidiva ....................................... 78 Tabela 30: Estimativas Kaplan-Meier e teste log-Rank para Classificação das LMA ............... 79 Tabela 31: Estimativas Kaplan-Meier e teste log-rank para Tempo até primeira recidiva........ 81 Tabela 32: Sumário das regressões de Cox univariada para Recidiva e Óbito .......................... 83 Tabela 33: Análise univariada da Sobrevivência até recidiva .................................................... 84 Tabela 34: Análise univariada da Sobrevivência até óbito ......................................................... 87 Tabela 35: Desenho da regressão de Cox multivariada para a Sobrevivência livre de doença e global........................................................................................................................................... 92 Tabela 36: Etapas de extração AIC do modelo multivariável de Sobrevivência até recidiva .... 93 Tabela 37: Análise multivariada de Sobrevivência até recidiva – 5ª Etapa (n=180; 94%) ....... 93 Tabela 38: Etapas de Extração AIC do modelo multivariável de Sobrevivência até Óbito sem a covariável Recidiva ..................................................................................................................... 94 Tabela 39: Modelo multivariável de sobrevivência até Óbito sem a covariável Recidiva (n=255; 81,5%) ......................................................................................................................................... 95 Tabela 40: Etapas de extração AIC do modelo multivariável de Sobrevivência global com covariável Recidiva ..................................................................................................................... 96 Tabela 41: Modelo multivariável de Sobrevivência global com covariável Recidiva (n=180; 94%) ............................................................................................................................................ 97 Tabela 42: Etapas de extração AIC do modelo multivariável de Sobrevivência global com Recidiva como covariável dependente no tempo ........................................................................ 99 Tabela 43: Análise Multivariada da Sobrevivência global com Recidiva como covariável dependente no tempo (n=180; 94%) ........................................................................................... 99

Índice de Figuras Figura 1: Exemplos de observações censuradas (adaptado de Leung, Elashoff & Afifi, 1997) . 15 Figura 3: Exemplo da estimativa da curva de sobrevivência com evento na última observação 21 Figura 3: Exemplo da estimativa da curva de sobrevivência sem evento na última observação 21 Figura 4: Desenho do Estudo ...................................................................................................... 34 Figura 5: Desenho do tratamento ................................................................................................ 36 Figura 6: Diagramas de caixa para as variáveis de tempo de sobrevivência............................... 56 Figura 7: Diagramas de caixa para as variáveis Idade e Hemoglobina ....................................... 58 Figura 8: Estimativas das funções de sobrevivência relacionadas com os eventos Óbito e Recidiva em doentes com LMA .................................................................................................. 65 Figura 9: Estimativas das funções de sobrevivência relacionadas com os eventos Óbito por Tipo de resposta à primeira indução .................................................................................................... 67 Figura 10: Estimativas das funções de sobrevivência relacionadas com os eventos Recidiva e Óbito por score de Hematogónias ............................................................................................... 68 Figura 11: Estimativas das funções de sobrevivência relacionadas com os eventos Recidiva e Óbito por Idade de risco .............................................................................................................. 70

xii

Edgar Martins Mesquita

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas Figura 12: Estimativas das funções de sobrevivência relacionadas com os eventos Recidiva e Óbito por ECOG ......................................................................................................................... 71 Figura 13: Estimativas das funções de sobrevivência relacionadas com os eventos Recidiva e Óbito por Risco SWOG .............................................................................................................. 73 Figura 14: Estimativas das funções de sobrevivência relacionadas com os eventos Recidiva e Óbito por Risco SWOG HG ........................................................................................................ 75 Figura 15: Estimativas das funções de sobrevivência relacionadas com os eventos Óbito por Segunda indução ......................................................................................................................... 77 Figura 16: Estimativas das funções de sobrevivência relacionadas com os eventos Óbito por Recidiva....................................................................................................................................... 78 Figura 17: Estimativas das funções de sobrevivência relacionadas com os eventos Recidiva e Óbito pela Classificação das LMA.............................................................................................. 80 Figura 18: Estimativas das funções de sobrevivência relacionadas com os eventos Óbito por Tempo de Recidiva ..................................................................................................................... 81 Figura 19: Base de dados com Recidiva como covariável dependente no tempo (Ambiente R) 98 Figura 20: Resíduos Cox-Snell do Modelo 4. ........................................................................... 101 Figura 21: Gráficos de diagnóstico para a constância dos coeficientes das covariáveis (𝛽) do Modelo 4 ao longo do Tempo. Apresenta-se ainda uma curva smooth spline e bandas de confiança (95%). ....................................................................................................................... 102

Lista de Siglas ADN: Ácido Desoxirribonucleico AED: Análise Exploratória de Dados AGR: Anormalidades genéticas recorrentes AIC: Critério de Informação de Akaike DM: displasia multilinhagem DR: Doença Resistente ECOG: Eastern Coperative Oncology Group FDNE: Falecido com doença não especificada FSED: Falecido sem evidência de doença FCED: Falecido com evidência de doença HR: Hazard Ratio IC: Intervalo de Confiança IPOPFG: Instituto Português de Oncologia Francisco Gentil – Porto K-M: Kaplan-Meier Edgar Martins Mesquita

xiii

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

LA: Leucemia Aguda LLA: Leucemia linfoide aguda/ Leucemia linfoblástica LLC: Leucemia linfoide crónica LMA: Leucemia mielóide aguda LMC: Leucemia mielóide crónica LPA: Leucemia Promielocítica Aguda MO: Medula Óssea MVP: Máxima Verosimelhança Parcial NOS: Not otherwise specified OR: Odds Ratio PC: Progressão citogenética RC: Resposta completa ao Tratamento de Indução RT: Relacionados com o tratamento SMD: Síndromes Mielodisplásicas SWOG: Southwest Oncology Group SR: Sem resposta ao Tratamento de Indução TMO: Transplante de Medula Óssea VIH: Vírus de Imunodeficiência Humana VSED: Vivo sem evidência de doença VCED: Vivo com evidência de doença

xiv

Edgar Martins Mesquita

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

Introdução A importância das análises de dados de sobrevivência tem crescido nos últimos anos. Altman, De Stavola e Stepniewska (1995) referiram-se à importância crescente destas análises, nomeadamente no que dizia respeito a estudos oncológicos. Ao analisarem as publicações de cinco revistas conceituadas na área da oncologia durante três meses, encontraram 28% de artigos que fizeram uso de métodos estatísticos de sobrevivência. No mesmo sentido, Thomas em 2007 concluía que nos últimos 20 anos tinha ocorrido uma expansão notável da utilização destes métodos com mais de 20.000 publicações na área da medicina. Bellera et al. (2010) são ainda mais específicos ao afirmarem que, até à data do seu trabalho, haviam sido contabilizadas aproximadamente 25.000 citações com respeito ao modelo de riscos proporcionais (Cox, 1972), 8.000 das quais na área da oncologia. Não obstante dos métodos de análise de sobrevivência terem conseguido firmar créditos nas publicações médicas, a partir do final do século passado os economistas começaram também a valorizar estas técnicas, utilizando-as para prever tempos de fidelização dos clientes face a uma organização, padrões de compra, ou prever insolvência (Seetharaman & Chintagunta, 2003; Helmers & Rogers, 2008). Mais recentemente também os estudos de marketing têm feito uso dos métodos de análise de sobrevivência, nomeadamente na previsão de eventos críticos ou valor potencial de um produto para os clientes (Dyre, Wetherill & Pinnock, 2001; Bhattacharjee, Gopal, Lertwachara & Marsden, 2007). É inegável a importância que os métodos de análise de sobrevivência obtiveram, desde que foram pela primeira vez aflorados na literatura com aplicações na medicina, economia ou marketing. Kaplan e Meyer (1958) e Cox (1972) são as principais referências desta área e dão também nome às técnicas mais utilizadas. Neste estudo foram aplicados métodos estatísticos de sobrevivência a dados reais de doentes com leucemia. O Capitulo 1, Enquadramento do trabalho de estágio, apresenta o local de estágio, serviço de Onco-Hematologia do Instituto Português de Oncologia do Porto Francisco Gentil (IPOPFG), bem como os objetivos do estágio. No Capítulo 2, Enquadramento teórico ao

Edgar Martins Mesquita

1

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

objeto de estudo, é realizada uma breve análise ao objeto de estudo leucemias. O Capítulo 3, Métodos estatísticos de análise de dados de sobrevivência, apresenta os vários conceitos teóricos inerentes à realização dos estudos estatísticos apresentados no capítulo seguinte. No Capítulo 4, Estudo empírico, são apresentados o desenho de estudo, base de dados e respetivos resultados relativos ao objetivo do estágio relacionado com o estudo das leucemias mieloides agudas (Objetivo 1). No Capítulo 5, Construção de uma base de dados para ensaio clínico do estudo de linfomas, são apresentados os conceitos teóricos relativos ao estudo dos linfomas, o projeto e desenho do estudo a ser implementado no IPOPFG, bem como os procedimentos que levaram à construção da base de dados (Objetivo 2). No Capítulo 6 são apresentadas as principais conclusões do estudo, complementadas por uma breve nota final. Por fim, surgem as referências bibliográficas seguidas pelos Anexos, que visam complementar todo o trabalho desenvolvido.

Para uniformizar os conteúdos do trabalho, para além das normas de formatação exigidas, as referências bibliográficas, formatação de tabelas e método de escrita obedeceram às normas APA (6ª Edição). Apesar das siglas estarem devidamente identificadas, foi doseada a utilização das mesmas ao longo do trabalho, em conjunto com a designação completa, que foi por vezes repetida, na tentativa de tornar a leitura mais clara.

2

Edgar Martins Mesquita

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

Capítulo 1

Enquadramento do Trabalho de Estágio 1.1.

Da ideia ao objeto

O presente estudo está enquadrado na opção de relatório de estágio do 2º ciclo de estudos em estatística da Universidade do Minho (Mestrado) e descreve a utilização de métodos estatísticos de análise de dados de sobrevivência aplicados à área da oncologia, em particular no estudo de leucemias agudas em adultos. Fez também parte dos objetivos deste estudo a construção de uma base de dados para realização de um ensaio clínico sobre linfomas. A instituição que acolheu o estágio foi o Instituto Português de Oncologia Francisco Gentil - Porto (IPOPFG), em particular, o serviço de Onco-Hematologia. A escolha desta Instituição como local de estágio, teve em consideração os seguintes aspetos: 

Reconhecimento do IPOPFG como centro oncológico de excelência a nível internacional, sendo membro ativo da European Organization of Research and Treatment of Cancer (EORTC);



Atividade científica de alta credibilidade desenvolvida e empenho em novos projetos de investigação científica.

O primeiro contacto com o serviço de Onco-Hematologia do IPOPFG ocorreu em março de 2011. Numa primeira abordagem pretendeu-se apurar a viabilidade para realizar o estágio neste serviço, pois havia conhecimento do dinamismo e empenho da equipa médica na investigação com uso de métodos estatísticos. Era percetível a vontade dos profissionais em recorrer à estatística para analisar dados clínicos, bem como a abertura demonstrada pelo diretor clínico do serviço de Onco-Hematologia, Dr. Mário Mariz, para receber um estagiário nesta área.

Edgar Martins Mesquita

3

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

Uma vez garantida a viabilidade para a realização do estágio foram realizados os contactos institucionais necessários, entre a Escola de Ciências da Universidade do Minho e o Centro de Ensino e Formação do IPOPFG para que fosse possível a concretização do projeto. O estágio iniciou em Outubro de 2011 e findou em Julho de 2012. Nas próximas páginas é feita uma contextualização do IPOPFG, bem como do serviço que acolheu o estágio – o Serviço de Onco-Hematologia.

1.2.

Local de Estágio: O Instituto Português de Oncologia do Porto, Francisco Gentil - IPOPFG

O IPOPFG, inaugurado em abril de 1974, foi o terceiro centro oncológico do país, tendo sido precedido pelos centros de Coimbra (1967) e Lisboa (1923), este último criado como Instituto Português para o Estudo do Cancro. Em dezembro de 2002, o IPOPFG foi reconvertido em hospital com estatuto de sociedade anónima de capitais exclusivamente públicos (S.A.) pelo Decreto-lei nº 282/2002, passando a designar-se IPOPFG-CROP, S. A. Já em 2005 sofreu nova reestruturação, pelo Decreto-Lei nº 233/2005, transformando-se em Entidade Pública Empresarial, passando a designar-se Instituto Português de Oncologia do Porto Francisco Gentil, E.P.E. O IPOPFG desenvolve a sua prática clínica no âmbito da prevenção, diagnóstico e tratamento de doenças oncológicas, baseando-se numa abordagem multidisciplinar. Enquanto organização está dividido nos departamentos das áreas Médica, Cirúrgica, de Radioterapia e Diagnóstico, que estão segmentados em vários serviços. No que diz respeito à atividade clínica, esta encontra-se dividida em internamento, consulta externa, serviço de atendimento não programado, bloco operatório, cirurgia de ambulatório, hospital de dia, radioterapia e meios complementares de diagnóstico e tratamento. A área de ambulatório está organizada em clínicas de patologia dispondo de enfermeiros, administrativos e auxiliares, num espaço individualizado. Conta com as seguintes clínicas: Mama, Digestivos, Cabeça e Pescoço, Urologia, Ginecologia, Pulmão, Pele, Tecidos Moles e Osso, Onco-Hematologia, Sistema Nervoso Central, Tumores Endócrinos e Pediatria. Cada clínica tem um coordenador proveniente das áreas Médica, Cirúrgica ou Radioterapia.

4

Edgar Martins Mesquita

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

O IPOPFG tem como missão a prestação de cuidados de saúde, em tempo útil, centrada no doente, bem como, a prevenção, a investigação, a formação e o ensino no domínio da oncologia, garantindo elevados níveis de qualidade, humanismo e eficiência. O serviço de Onco-Hematologia, dirigido pelo Dr. José Mário Mariz, integra o Departamento de Medicina e dedica-se ao diagnóstico, tratamento e seguimento de doenças hematológicas malignas e suas complicações. O serviço de Onco-Hematologia é constituído por duas unidades funcionais: o internamento e a consulta externa. Este serviço articula de forma importante com os serviços de Imuno-Hemoterapia, Anatomia

Patológica,

Patologia

Clínica,

Radioterapia,

Biologia

Molecular,

Microbiologia e Nutrição. O corpo médico é constituído por sete médicos especialistas: o Diretor de serviço, a Chefe de Serviço, um Assistente Hospitalar Graduado, quatro Assistentes Hospitalares, um dos quais Internista e outro Oncologista Médico. Tem ainda na sua composição nove internos complementares, em fase de formação específica em Hematologia Clínica. O corpo de enfermagem é composto por 29 enfermeiros, em estrita articulação com os médicos, que colaboram também com o capelão e com os voluntários do IPOPFG. No serviço existe ainda uma equipa administrativa/técnica que gere o serviço de atendimento ao público, entre outras funções administrativas e uma equipa de assistentes operacionais que desempenha funções de apoio à equipa de enfermagem para a prestação de cuidados de alimentação e higiene e é responsável pela limpeza e desinfeção dos quartos. São de seguida apresentados os objetivos do estágio.

1.3.

Objetivos do Estágio

Este trabalho de estágio foi dividido em dois objetivos fundamentais discutidos e estabelecidos aquando do delineamento do plano de trabalhos (cf. Anexo A):

1- Utilização de métodos estatísticos de análise de dados de sobrevivência aplicados à área da oncologia.

Com este primeiro objetivo pretendeu-se responder à necessidade do serviço de OncoHematologia do IPOPFG na análise de dados de sobrevivência de leucemias em adultos,

Edgar Martins Mesquita

5

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

nomeadamente no que diz respeito aos fatores de impacto associados aos tempos de sobrevivência até aos eventos recidiva e óbito.

2- Construção de uma base de dados em ambiente Microsoft Access para realização de um ensaio clínico em linfomas não-Hodgkin foliculares.

Com o segundo objetivo pretendeu-se dar resposta à necessidade do serviço de OncoHematologia do IPOPFG do estudo de doentes com linfoma não-Hodgkin folicular, diagnosticados e tratados no IPOPFG, entre 2000 e 2011.

6

Edgar Martins Mesquita

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

Capítulo 2

Enquadramento Teórico ao Objeto de Estudo 2.1.

Objeto de Estudo: Leucemias

Para que o estatístico desenvolva um trabalho consciente e fundamentado é necessário que conheça o objeto de estudo que está a analisar. Nos dias de hoje é muitas vezes pedido ao estatístico que extraia de um conjunto de dados em bruto um significado que procura explicar um dado fenómeno da realidade. Isso ocorre nas mais variadas áreas, como a psicologia, economia, engenharia ou medicina. Estar integrado em equipas de trabalho conjunto facilita a partilha de informações. Não obstante, o trabalho do estatístico é muitas vezes realizado de forma “solitária”. Desta forma, é essencial que, para além de possuir bom domínio da estatística, detenha também um conhecimento sólido do objeto de estudo e da realidade que está a ser estudada. Assim, antes de serem afloradas as metodologias estatísticas utilizadas para a realização deste estudo é apresentada uma contextualização do objeto de estudo: as leucemias, em particular nos adultos. A palavra leucemia deriva do grego leukos que significa “branco” e aima que significa “sangue”. Consiste numa neoplasia hematológica nos órgãos produtores de células sanguíneas (medula óssea e órgãos linfáticos), na qual ocorre uma proliferação anormal de células sanguíneas – leucócitos, os quais constituem as principais defesas do organismo no combate a infeções. Para compreender melhor este processo, e antes de descrever os tipos de leucemia, é realizada uma contextualização da fisiologia da medula óssea. A medula óssea é uma substância mole que se encontra no interior dos ossos, e que é responsável pela produção de células sanguíneas. Aproximadamente 4% do peso de um adulto consiste em medula óssea. Edgar Martins Mesquita

7

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

As células imaturas designam-se por estaminais, i.e. são totipotenciais e podem transformar-se em qualquer célula do nosso corpo (sanguíneas ou de outro qualquer tipo). A medula óssea é responsável pelo processo de maturação e diferenciação das células sanguíneas em circulação nos vasos sanguíneos. Esta estrutura produz diferentes tipos de células sanguíneas, cada uma com uma função específica: 

Células sanguíneas brancas (glóbulos brancos) ajudam a combater as infeções;



Células sanguíneas vermelhas (glóbulos vermelhos) transportam oxigénio para os tecidos através de todo o organismo;



Plaquetas ajudam à formação dos coágulos sanguíneos, que controlam as hemorragias.

Na leucemia, o ADN das células sanguíneas imaturas, em particular dos glóbulos brancos é, de alguma forma, alterado causando a sua divisão caótica e um crescimento exponencial associado a defeitos de apoptose, ao contrário das células normais, que vão sendo substituídas pelas novas células leucémicas. Com o tempo, estas células leucémicas ultrapassam, em número, os glóbulos brancos, os glóbulos vermelhos e as plaquetas impedindo que o sangue realize a sua função, como órgão hematopoiético.

2.1.1. Tipos de Leucemia As leucemias podem dividir-se mediante o grau de progressão da doença em agudas e crónicas. A leucemia aguda (LA) corresponde a um grupo de doenças heterogéneas, no que concerne à clonalidade, aberrações cromossómicas e resposta ao tratamento. Traduz uma proliferação clonal, com um processo patogénico definido em várias etapas, embora o padrão de expressão em células-tronco de diferenciação (detetado por meio de G6PD e outros marcadores de clonalidade de ADN) seja heterogéneo. Em adultos, ao diagnóstico, todas as linhagens de células hematopoiéticas são clonais. Em crianças menores de 16 anos, as células eritróides e plaquetas muitas vezes não fazem parte do clone leucémico. Ao contrário das LA, as leucemias crónicas (LC) implicam uma progressão mais lenta que permite a formação de um maior número de células e acumulação de células imaturas, e portanto inúteis, na medula óssea e no sangue.

8

Edgar Martins Mesquita

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

As leucemias também podem ser divididas mediante o tipo de célula sanguínea afetada. Se a transformação celular ocorrer ao nível dos linfócitos a doença toma a designação de leucemia linfóide. Caso as células brancas afetadas sejam de outro tipo como plaquetas, a leucemia designa-se mielóide. Desta forma são encontrados quatro tipos fundamentais de leucemia que resultam da combinação das duas categorias previamente referidas.

Leucemia linfoide crónica (LLC) Este tipo de leucemia é mais comum em adultos a partir dos 55 anos. Embora não seja exclusivo desta faixa etária, podendo afetar jovens adultos, é uma doença que raramente surge em crianças. A maioria dos doentes com leucemia linfoide crónica são homens (60%) e a sobrevivência global destes doentes ronda os 75% aos cinco anos.

Leucemia linfoide aguda/ Leucemia linfoblástica (LLA) A leucemia linfoide aguda, também conhecida como leucemia linfoblástica, é o tipo de leucemia mais comum nas crianças, muito embora também afete adultos, especialmente a partir dos 65 anos. A taxa de sobrevivência, ao quinto ano, nos doentes com este tipo de leucemia é de 85% nas crianças e 50% nos adultos.

Leucemia mielóide crónica (LMC) Neste tipo de leucemia a maior parte dos afetados são adultos e 90% dos doentes sobrevive até passar o quinto ano.

Leucemia mielóide aguda (LMA) A leucemia mielóide aguda é mais comum em adultos do que em crianças e afeta mais indivíduos do sexo masculino que feminino. A sobrevivência global destes doentes está estimada em 40%, ao quinto ano.

Edgar Martins Mesquita

9

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

2.1.2. Sintomas Apresenta-se de seguida o conjunto de sintomas mais comuns na Leucemia.

Distúrbio da hemóstase/Coagulopatia A diminuição das plaquetas e/ou o consumo de fibrinogénio resulta numa insuficiente capacidade de coagulação do sangue. O doente está mais suscetível ao aparecimento de hematomas e hemorragias que curam com mais dificuldade. Existe também maior probabilidade de desenvolvimento de petéquias (pequenos pontos vermelhos no corpo, causados por pequenas hemorragias).

Alterações no sistema imunitário As células brancas, cruciais para combater as infeções, encontram-se alteradas, suprimidas ou em número reduzido. Os doentes podem apresentar infeções recorrentes e o seu sistema imunitário pode atacar células saudáveis.

Anemia Devido à diminuição dos glóbulos vermelhos, os doentes apresentam maior probabilidade de desenvolver anemia. Nesta doença a capacidade de transportar oxigénio para os tecidos está reduzida devido à redução de eritrócitos ou hemoglobina.

Para além dos sintomas descritos, os doentes podem ainda experienciar náuseas, febre, arrepios, suores noturnos e cansaço.

2.1.3. Etiologia e Tratamento

No que diz respeito à etiologia da leucemia, os resultados atuais não são totalmente conclusivos. O aparecimento desta doença pode dever-se a uma predisposição genética como a Trissomia 21 (estes indivíduos apresentam maior risco de leucemia), à exposição a radiação ionizante, vírus, como VIH, entre outras causas menos frequentes como exposição a sangue materno infetado. Não existe no entanto, ainda, uma causa cuja relação seja inequívoca com a doença. Quanto ao tratamento, este varia de acordo com o tipo de leucemia, idade e estado de saúde. O tratamento das leucemias agudas deve iniciar-se com a maior brevidade possível 10

Edgar Martins Mesquita

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

e geralmente envolve terapia de indução com quimioterapia. Quando o doente entra em remissão completa é submetido a tratamento de consolidação, que pode envolver quimioterapia e/ou transplante de medula óssea, de acordo com o risco de recaída da leucemia aguda. O tratamento seguinte é a manutenção e tem como objetivo a erradicação da doença residual mínima. Estes e outros conceitos podem ser consultados no Anexo B. No próximo capítulo são abordadas os métodos estatísticos de análise de dados de sobrevivência.

Edgar Martins Mesquita

11

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

Capítulo 3

Conceitos chave em Análise de Dados de Sobrevivência 3.1.

Censura e Truncatura

3.1.1. Censura Em muitos estudos oncológicos o objetivo é estudar o tempo até a ocorrência de um determinado evento de interesse. Estas investigações têm habitualmente em conta o tempo que os doentes com determinado tipo de doença oncológica demoram a passar de um estado para outro, como o tempo desde o diagnóstico até à morte ou o tempo desde que é registada a ausência de doença até à recidiva (Clark, Bradburn, Love & Altman, 2003). O termo habitualmente empregue para designar este tempo é “tempo de sobrevivência” ou “sobrevida”. Apesar de amplamente utilizados como sinónimos em oncologia, Costa (2005) no Dicionário de Termos Médicos refere que, de facto, os seus significados são diferentes: sobrevida corresponde ao “ato de sobreviver” e sobrevivência significa “viver para além do esperado”. No entanto a nível Europeu, a diferença entre os termos encerra outro sentido: sobrevida é definida como “vida com continuação da doença” e sobrevivência como “sobreviver livre de doença” (Costa, 2005). Desta forma, uma vez que não existe clareza nas definições, apenas foi utilizado o termo sobrevivência com significado de sobreviver com ou sem doença. Não obstante, o termo sobrevivência será acompanhada de outros termos, sempre que se justifique, impondolhe significados mais específicos como: 

“tempo de sobrevivência global” que se refere ao intervalo temporal desde que se iniciou a contagem do tempo até ao evento final do estudo ou censura;

Edgar Martins Mesquita

13

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas



“tempo de sobrevivência livre de doença” que se refere ao intervalo temporal desde que um dado doente oncológico entrou em remissão, até à primeira recidiva.

Caso o evento tenha sido observado em todos os participantes do estudo, vários métodos estatísticos poderiam ser utilizados, visto que o evento não é fonte de variação. Contudo, na grande maioria dos estudos de sobrevivência o evento não é observado em todos os participantes até final do follow-up, pelo que, nestes indivíduos, o tempo real até ao evento é desconhecido. Aliado a isto surge o facto dos dados de sobrevivência raramente se distribuírem de forma normal pelo que é necessário analisa-los segundo métodos de sobrevivência (Clark, Bradburn, Love & Altman, 2003). Com efeito, é precisamente no desconhecimento acerca do tempo real de sobrevivência de todos os doentes, bem como na impossibilidade de saber se foi ou não observado o evento após terminar a “janela temporal do estudo” que reside uma das definições incontornáveis dos métodos estatísticos de sobrevivência: a censura (Leung, Elashoff & Afifi, 1997). A censura ocorre quando a informação disponibilizada acerca dos tempos de sobrevivência dos indivíduos está incompleta, i.e. existe conhecimento dos tempos de sobrevivência de alguns indivíduos pois observam o evento de interesse, ao passo que outros não observam o evento de interesse durante o período de observação. Em geral isto deve-se a uma observação do evento fora do período de duração do estudo ou a uma “perda para follow-up” da informação do individuo (Leung, Elashoff & Afifi, 1997; Clark, Bradburn, Love & Altman, 2003; Kleinbaum & Klein, 2005). Apresentam-se agora os diferentes mecanismos de censura existentes, ilustrados com os exemplos da Figura 1, onde alguns participantes fictícios são observados entre os tempos T0 e T1, e os intervalos temporais são todos conhecidos. As linhas horizontais representam o período de risco para cada indivíduo. Quanto estas terminam com “*” significa que ocorreu o evento de interesse, quando terminam com “o” significa que ocorreu um evento, mas não o de interesse como morte por causas não derivadas da doença em estudo, ou deixou de se observar informação do doente (e.g. impossibilidade de acompanhar a evolução do participante), configurando assim um caso de censura.

14

Edgar Martins Mesquita

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

A

*

B D E G

*

o

C

Dt

*

Et

* F

* TL

*

TR

T0

T1

Figura 1: Exemplos de observações censuradas (adaptado de Leung, Elashoff & Afifi, 1997)

O tempo a que o indivíduo A está exposto ao risco encontra-se dentro do período de observação e o tempo de ocorrência do evento é conhecido, pelo que não existe qualquer tipo de censura nesta observação. No caso do indivíduo B o período de risco inicia-se durante o tempo de observação e o evento ocorre fora desse tempo. Desta forma o indivíduo B é um caso de censura à direita (o tempo observado é inferior ao tempo real). Outro caso de censura à direita é o observado no indivíduo C, embora aqui esta não seja devida à ocorrência do evento fora do período de observação, mas antes à ocorrência de um evento que não o de interesse. Este tipo de censura é assim descrita como a saída de um indivíduo do estudo antes da ocorrência do evento de interesse (C) ou depois do período de observação terminar (B). Enquanto os casos B e C representam censura à direita, a situação D corresponde a truncatura à esquerda (explicada em detalhe mais à frente), algo comum quando por exemplo um individuo seropositivo entra no estudo depois de ter sido infetado e o tempo de estudo é o que vai desde a contaminação até ao diagnóstico da doença (SIDA). Caso o tempo Dt tivesse sido observado então poder-se-iam aplicar métodos aplicáveis aos casos de censura à direita ou ausência de censura. Outra situação é a representada no caso E, que corresponde a censura à esquerda e à direita, também denominada por dupla censura. Existem ainda casos (F e G) em que a origem e o evento ocorrem antes ou depois do período de observação. Apesar desses casos não afetarem o estudo, podem alterar a robustez dos resultados. Os casos F e G representam casos de censura completa à direita e à esquerda, respetivamente. Nestes casos o diagnóstico de SIDA (pós infeção) é feito fora do período de observação.

Edgar Martins Mesquita

15

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

Por fim pode ainda ser apontado outro caso de censura. A censura intervalar, que ocorre quando existe conhecimento da ocorrência do evento, mas não do seu tempo exato. Sabese que o evento de interesse do indivíduo A ocorreu no tempo Tx, mas suponha-se que apenas se sabia que o evento tinha ocorrido entre os tempos TL e TR. Esta situação enquadra-se no tipo de censura intervalar e pode ocorrer por exemplo em casos de doentes seropositivos avaliados mensalmente, em que o critério para que sejam considerados doentes se baseia na contagem de células CD34. Muito provavelmente, parte dos doentes serão casos de censura intervalar, pois o dia exato em que foi atingida a contagem necessária das referidas células é desconhecido. Existem ainda mecanismos que correspondem a situações de censura à direita: censura do Tipo I e censura do Tipo II. A censura do Tipo I (muito comum em estudos médicos) ocorre quando existe um tempo t, predeterminado, a partir do qual o estudo é encerrado. Caso o evento de interesse tenha ocorrido, antes de terminar a janela de observação do estudo, obtém-se o “tempo de sobrevivência” do indivíduo. Caso contrário a observação é censurada devido ao encerramento do período de observação. Neste mecanismo ocorre censura à direita quando o evento não ocorre dentro do período de observação do estudo. Na Figura 1, os indivíduos B e E configuram exemplos típicos de censura à direita e mecanismo de censura de Tipo I. Já o indivíduo C é um caso de censura à direita que não se enquadra na censura do Tipo I. A censura do Tipo II configura uma situação em que o estudo termina após terem ocorrido um número pré-determinado de eventos. Por exemplo, num estudo de uma doença rara, o investigador termina o estudo quando for observado o vigésimo evento de interesse.

3.1.2. Truncatura

A truncatura é uma variante da censura e ocorre quando a natureza incompleta das observações é devida a um processo sistemático de seleção inerente ao desenho do estudo (Leung, Elashoff & Afifi, 1997; Clark, Bradburn, Love & Altman, 2003). Por exemplo, num estudo sobre o tempo de sobrevivência de pessoas que depois de serem hospitalizadas por enfarte do miocárdio recebem algum tratamento em casa, a contagem do tempo inicia-se no dia do enfarte. Contudo, só os indivíduos que sobrevivem durante

16

Edgar Martins Mesquita

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

o período de internamento hospitalar são considerados para inclusão no estudo. Este constitui um exemplo de truncatura à esquerda. Já na truncatura à direita, apenas são considerados indivíduos cujo tempo de evento é inferior a um determinado limite imposto pelo desenho do estudo. Se o objetivo de uma investigação é estudar a idade de início do consumo de tabaco em menores, os dados estão necessariamente truncados, pois qualquer indivíduo com idade igual ou superior a 18 anos não é considerado. Apesar de terem sido avançadas explicações para vários tipos e mecanismos de censura e truncatura, de forma a ilustrar as várias situações possíveis em contexto de investigação, durante este estudo lidar-se-á apenas com casos de censura à direita. São abordados de seguida os conceitos teóricos relacionadas com as distribuições dos tempos de sobrevivência.

3.2.

Conceitos básicos de análise de sobrevivência

Seja T o tempo até à ocorrência de um evento específico. Este evento pode ser a morte, o diagnóstico de um tumor, de uma determinada doença ou a recidiva da mesma, entre outros. Mais ainda, apesar de na prática este evento ser na maior parte das vezes nefasto, concetualmente não existe limitação para esta delimitação, podendo este ser remissão após tratamento, cessação tabágica ou outro qualquer acontecimento de impacto positivo. A função de distribuição de T é definida como a probabilidade de observar o evento de interesse no intervalo [0, t ] e pode se representada por: 𝐹(𝑡) = Pr(𝑇 ≤ 𝑡) , 𝑡 ≥ 0 𝐹(𝑡) é uma função com as seguintes características: 

Monótona não decrescente;



Continua à direita;



𝐹(𝑡) = 0 para 𝑡 = 0 e 𝐹(𝑡) = 1 quando 𝑡 → + ∞.

Para caracterizar a distribuição da variável T considera-se habitualmente que existem três funções: a função de sobrevivência, que consiste na probabilidade de um indivíduo

Edgar Martins Mesquita

17

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

sobreviver para além de um determinado tempo, a função de risco, que corresponde à probabilidade de um indivíduo experienciar o evento naquele instante temporal e a função densidade de probabilidade, que é a probabilidade incondicional de ocorrência do evento no tempo t. Caso se tenha conhecimento de qualquer uma destas funções pode determinar-se as restantes.

3.2.1. A função de sobrevivência A função de sobrevivência é definida como a probabilidade de um indivíduo sobreviver para além do instante de tempo t, com o evento a ocorrer após este período. No fundo corresponde à probabilidade de não ocorrência do evento, pelo menos até ao instante t. Define-se então a função de sobrevivência da variável aleatória T como: 𝑆(𝑡) = Pr(𝑇 > 𝑡) , 𝑡 ≥ 0

Se T for uma variável aleatória contínua, a função de sobrevivência é complementar da função de distribuição cumulativa, i.e. 𝑆(𝑡) = 1 − F (t), onde 𝐹(𝑡) = Pr (𝑇 ≤ 𝑡).

A função de sobrevivência apresenta as seguintes propriedades: 

Monótona não crescente;



Contínua à esquerda;



𝑆(𝑡) = 1 para 𝑡 = 0 e 𝑆(𝑡) = 0, para 𝑡 → + ∞. A representação gráfica de 𝑆(𝑡) é denominada de curva de sobrevivência.

3.2.2. A Função de Risco ou Hazard A função de risco define a probabilidade do evento de interesse no tempo t, levando em conta que o indivíduo sobreviveu até ao instante t. Esta função representa a taxa instantânea de falha no instante t, condicionada à sobrevivência nesse instante. Assim sendo, 𝑃(𝑡 ≤ 𝑇 < 𝑡 + ∆𝑡|𝑇 ≥ 𝑡) , 𝑡 ≥ 0, ∆𝑡→0 ∆𝑡

ℎ(𝑡) = lim

18

Edgar Martins Mesquita

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

que corresponde à taxa instantânea de morte, caso o evento seja desse tipo.

Esta função apresenta as seguintes propriedades: 

ℎ(𝑡) ≥ 0;



∫0

+∞

ℎ(𝑡)𝑑𝑡 = + ∞.

Pode ainda definir-se uma função cujo objetivo é medir o risco de ocorrência do evento de interesse até ao instante t. Essa função, monótona, não decrescente corresponde à Função de Risco Cumulativa e define-se como: 𝑡

𝐻(𝑡) = ∫ ℎ(𝑢)𝑑𝑢, 𝑡 ≥ 0. 0

3.2.3. A Função Densidade de Probabilidade Em contexto de análise de sobrevivência a função 𝑓(𝑡) pode ser interpretada como a probabilidade de um indivíduo incorrer no evento de interesse no intervalo (𝑡, 𝑡 + ∆𝑡), em que ∆𝑡 → 0. 𝑃(𝑡 ≤ 𝑇 < 𝑡 + ∆𝑡) , 𝑡 ≥ 0. ∆𝑡→0 ∆𝑡

𝑓(𝑡) = lim

3.2.4. Relações entre Funções As funções apresentadas anteriormente estão intimamente relacionadas, podendo ser deduzidas várias relações entre elas, como: 𝑓(𝑡)

𝑆 ′ (𝑡)



ℎ(𝑡) = 𝑆(𝑡) = −



𝑆(𝑡) = exp(−𝐻(𝑡))



𝑓(𝑡) = ℎ(𝑡) exp (− ∫0 ℎ(𝑢)𝑑𝑢)



𝐻(𝑡) = − log(𝑆(𝑡))

𝑆(𝑡)

𝑡

Edgar Martins Mesquita

19

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

A distribuição de T pode ser assim determinada a partir de qualquer uma das funções acima enunciadas: função distribuição, função de sobrevivência, função de risco, função de risco cumulativa e função densidade de probabilidade.

3.3.

Estimação não paramétrica da função de sobrevivência: o estimador de Kaplan-Meier

O método de Kaplan-Meier (1958) é um método não paramétrico de estimação de tempos de sobrevivência (constituindo assim curvas de sobrevivência). Habitualmente é utilizado em medicina e biologia para calcular estimativas de tempos de sobrevivência tendo como evento

a morte/recidiva relacionada

com

determinada doença

(Huh,

Levi,

Rusmevichientong & Orlin, 2011). Não obstante, tem nos últimos tempos conquistado terreno nas ciências sociais e económicas (e.g. estudar o tempo que as pessoas permanecem desempregadas após perderem emprego). Uma curva de sobrevivência de Kaplan-Meier é graficamente representada por uma função em escada. No gráfico as pequenas marcas verticais ao longo da curva indicam os dados censurados. Quanto não existe censura ou truncatura a curva de Kaplan-Meier é equivalente à distribuição empírica (Huh, Levi, Rusmevichientong & Orlin, 2011). Numa amostra de dimensão n, a função de sobrevivência num instante t pode ser estimada com base nos tempos de vida observados. 𝑆̂(𝑡) =

𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎çõ𝑒𝑠 ≥ 𝑡 , 𝑡 ≥ 0. 𝑛

Este método não comporta a existência de censura. Caso existam observações censuradas, a estimativa será diferente porque o número de tempos de sobrevivência iguais ou superiores a t não são geralmente conhecidos. O método de estimação de Kaplan-Meier surge como tentativa de contornar os problemas relacionados com a inexistência de tempos de sobrevivência completos para todos os pacientes de uma dada amostra (Kaplan & Meyer, 1958). Esta situação verifica-se em grande parte dos estudos médicos, pois os pacientes podem sair do estudo por várias razões, não necessariamente relacionadas com o evento de interesse. Em 1958, Kaplan e Meier apresentaram um estimador não paramétrico da função de sobrevivência que tinha em conta a existência de censura.

20

Edgar Martins Mesquita

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

Sejam 𝑦1 < 𝑦2 < ⋯ < 𝑦𝑘 os k instantes de uma amostra de dimensão n, onde 𝑘 ≤ 𝑛, 𝑑𝑖 o número de eventos ocorridos em 𝑦𝑖 e 𝑛𝑖 o número de indivíduos em risco no instante 𝑦𝑖 , no fundo o número de indivíduos com vida (no caso do evento ser a morte) que não foram censurados imediatamente antes do instante 𝑦𝑖 , 𝑖 = 1, 2, … , 𝑘. O estimador de Kaplan-Meier da função de sobrevivência é dado por: 𝑛𝑖 − 𝑑𝑖 𝑑𝑖 𝑆̂(𝑡) = ∏ ( )= ∏( 1− ) 𝑛𝑖 𝑛𝑖 𝑖:𝑦 15 anos; (b) Doentes do sexo masculino ou feminino, com diagnóstico LMA de novo, secundária ou associada a terapêutica; 1

(c) Sem limite de ECOG ;

A colheita de dados foi efetuada pelos internos do IPOPFG, em exercício de funções no ano de 2010/2011.

4.1.2. Apresentação da Base de Dados A construção da base de dados foi feita tendo em conta as especificidades do estudo e o conhecimento do corpo médico acerca dos valores de referência, nomeadamente ao nível das categorias das variáveis qualitativas, cuja base foi o formulário (cf. Anexo E). A maior parte das variáveis possui uma natureza qualitativa pois era essa a sua génese original. Não foram utilizadas todas as variáveis do formulário, uma vez que nem todas tinham o

1

Eastern Coperative Oncology Group (medida de desempenho funcional que varia entre autonomia máxima e morte)

Edgar Martins Mesquita

39

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

propósito de responder aos objetivos propostos. Torna-se importante referir que este estágio contribuiu, em parte, para a publicação de dois trabalhos na Sociedade Americana de Hematologia um dos quais considerado pelo júri como clinicamente relevante (cf. Anexo D). Durante a exposição da base de dados serão utilizados os nomes das variáveis originais. Nos capítulos seguintes serão utilizadas designações completas para facilitar o entendimento dos resultados. Todas as variáveis são apresentadas no texto com letra inicial maiúscula. Em primeiro lugar são apresentadas as variáveis qualitativas. Dada a sua natureza e extensão da descrição surgem no corpo de texto e no seguinte formato: Variável: Descrição (categoria1, categoria2,…, categoria n) [unidades de medida, se aplicável].

Sexo: Sexo do doente (Masculino; Feminino). TipoResp: Tipo de resposta ao primeiro tratamento de indução. A indução corresponde à fase inicial do tratamento cujo objetivo é eliminar todas as células neoplásicas. (sem resposta; resposta completa). CD34: Marcador celular expresso em precursores hematopoiéticos (≤ 10%; ≥10%) [expressão medida em %]. Leuco20M: Nº Leucócitos ao diagnóstico – quanto maior o número pior o prognóstico (≤ 20.000; > 20.000) [nº células/mm3]. HG_Score: Classificação do score de hematogónias. As hematogónias são precursores normais de linfócitos B que podem ser encontradas na medula óssea de pessoas saudáveis (negativo; positivo). IdadeRisco: Idade categorizada em grupos de risco (≤ 35; 36-45; > 45) [anos]. Cel_Medular: Celularidade da medula óssea (MO) – reflete o nº células na MO (normocelular corresponde à normalidade; hipocelular significa que a MO não esta a produzir células por defeito das células produtoras; hipercelular corresponde a um excesso de células da MO e pode ocorrer numa MO reativa/a recuperar de alguma lesão ou, no caso da LMA, a uma medula invadida por blastos). ECOG: “Eastern Coperative Oncology Group”, critério que avalia a progressão da doença e a forma como esta afeta o desempenho do doente nas atividades da vida diária (0 = totalmente ativo; 1 = restrito a atividade física extenuante mas capaz de executar atrabalhos leves; 2 = Autónomo no cuidado próprio mas incapaz de exercer atividade 40

Edgar Martins Mesquita

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

laboral; 3 = autonomia limitada no cuidado próprio mas confinado à cama ou cadeira em mais de 50% do dia; 4 = incapacidade total e confinado à cama ou cadeira; 5 = morte). Risco SWOG: Risco “Southwest Oncology Group”, baseia-se nas alterações citogenéticas ao diagnóstico. Quanto mais alto maior o risco de recidiva e pior prognóstico face ao óbito (desfavorável/ intermédio/ favorável). Esplenomegalia: Baço aumentado de tamanho em mais de 15cm de altura. Quanto maior significa maior carga tumoral/invasão da MO e pior prognóstico (sim/não). PropAloTMO: Intenção clínica de transplante alogénico. A existir, o doente é proposto para um tratamento mais intensivo (sim/não). SegdaInd: Segundo tratamento de indução. Mede-se quando não há resposta à primeira indução ou após recidiva num doente com resposta completa ao 1º tratamento (sim/não). ConsolLPA: Consolidação nas leucemias promielocíticas – Fase de tratamento mais intensa (sim/não). ManLPA: Manutenção nas leucemias promielocíticas – Fase de tratamento menos intensa (sim/não). Recidiva: Ocorrência de Recidiva (sim/não). Óbito: Óbito relacionado com a doença (sim/não). TMO: Transplante de medula óssea (sim/não). LMA_IPO: Classificação do tipo de LMA (LMA “Not specified otherwise” (NOS); LMA com anormalidades genéticas recorrentes (AGR); LMA com displasia multilinhagem (DM); LMA ou Síndrome mielodisplasica (SMD) relacionados com tratamento). Tempo1Rec: Tempo decorrido até primeira recidiva (6 meses/ 6-12 meses/ >12 meses/ sem resposta ou doença persistente/ progressão citogenética/ doença resistente). EstadoClínico: Estado clínico à data de óbito/data da última observação (vivo sem evidência de doença; vivo com evidência de doença; falecido sem evidência de doença; falecido com evidência de doença; falecido com doença não especificada). Apresentam-se, de seguida, na Tabela 5, as variáveis quantitativas originais presentes da base de dados: Idade (anos), Hemoglobina (g/dl) e as Datas de Nascimento, Diagnóstico, Primeiro dia sem doença, Primeira Recidiva, Última Observação e Data de Óbito.

Edgar Martins Mesquita

41

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

Tabela 5: Descrição das variáveis quantitativas originais Variável

Descrição

Hemoglobina Idade DataNascimento DataDiagnóstico D1SDoença Data1Recidiva DataUltimObs DataObito

Concentração de hemoglobina no sangue Idade Data de nascimento Data do diagnóstico de leucemia Primeiro dia sem doença Data da recidiva Data da última observação Data do óbito

A partir das datas presentes na base de dados foi possível calcular vários tempos de sobrevivência (medidos em dias) (cf. Tabela 6).

Tabela 6: Descrição das variáveis quantitativas calculadas Tempo de Sobrevivência

Descrição

Tempo.OS

Tempo associado à sobrevivência global dos doentes que corresponde à diferença entre a data de diagnóstico e a data da última observação (perda de contacto, fim do estudo ou morte)

Tempo_ateLDoença

Tempo que levou até se considerar que o indivíduo estava sem doença

Tempo_ateRec

Tempo desde o primeiro dia sem doença até à recidiva

Rec_ateMorte

Tempo desde a recidiva até à morte

A base de dados ficou assim constituída por 35 variáveis: 23 variáveis qualitativas, oito variáveis quantitativas originais, das quais seis eram datas e mais quatro variáveis quantitativas calculadas a partir das datas presentes na Tabela 5. A próxima etapa prendeu-se com a utilização das variáveis apresentadas numa análise exploratória.

42

Edgar Martins Mesquita

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

4.2.

Análise Exploratória de Dados

Reis (1998) entende a análise exploratória de dados (AED) como um método que consiste na recolha, apresentação, análise e interpretação de dados numéricos sob a forma de instrumentos adequados como Tabelas, Gráficos e Indicadores Numéricos. As raízes da AED surgem implantadas nos trabalhos de John Tukey (1977) cuja obra “Exploratory Data Analysis” faz gravitar em seu redor grande parte da tradição associada à AED. A AED consiste numa metodologia de aprendizagem através de dados quantitativos vocacionada para a compreensão de um qualquer fenómeno e auxílio do processo científico. Segundo Tukey (1977) trata-se de um processo interativo com dois vetores: um proveniente da estatística (reconhecimento de padrões) e outro ligado à ciência a cujos dados pertencem (interpretação dos padrões). Nenhum pode funcionar sem o outro, pelo que coexistem em simbiose. A AED funciona também muitas vezes como um corpus de informação relativa aos dados disponíveis, possibilitando a formulação de hipóteses mais realistas e observar a realidade sob diferentes perspetivas, permitindo o lançamento de novas teorias. Segundo Pestana e Velosa (2010) não existe uma só estratégia para explorar os dados. Não obstante, recomendam uma exploração visual dos dados, acrescida de alguma “depuração”. Estas tarefas são úteis pois permitem encontrar dados que não encaixam no padrão geral possibilitando investigar se estes foram mal observados, mal registados ou se realmente refletem a realidade. De acordo com Tufte (2001) a AED está orientada para a criação de processos simplificados de apresentação de informação num processo análogo ao do processamento de linguagem: depois de ler um livro não é possível recordar todas as palavras, mas apenas as ideias genéricas. Apesar de ser um processo controlado a AED tem na sua principal vantagem também a sua maior limitação. Pelo facto de visar a parcimónia torna-se inevitável a perda de informação durante o processo de análise, sendo dada enfase a alguns aspetos, em detrimento de outros. Uma boa AED combina apresentação analítica e gráfica dos dados de tal forma que a informação seja apresentada não só de forma sintética mas também visualmente apelativa e útil para quem a ela acede. É assim essencial um equilíbrio de forças entre o que é relevante e o que pode ser deixado para

Edgar Martins Mesquita

43

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

segundo plano, por forma a não comprometer informação relevante, mas também não sobrecarregar a apresentação dos dados, comprometendo a sua eficácia. As páginas seguintes são dedicadas à exploração dos dados da base de dados de leucemias. Para além das análises descritivas, onde são apresentadas frequências absolutas e relativas das variáveis qualitativas em estudo e médias, desvios padrão e coeficientes de variação das variáveis quantitativas são ainda apresentados três tipos distintos de análises: 

Teste de independência para variáveis qualitativas com recurso ao teste quiquadrado;



Comparação de variáveis quantitativas com recurso ao teste Wilcoxon-MannWhitney;



Regressão logística.

Estas análises tiveram como objetivo mostrar que, na presença exclusiva de informação relativa à ocorrência de eventos é possível estudar a relação destes com outras variáveis através de associação com variáveis qualitativas, comparação de variáveis quantitativas ou cálculo da razão das possibilidades (cf. Anexo C), tradução da Sociedade Portuguesa de Estatística (Paulino, Pestana, Branco, Singer, Barroso & Bussab, 2011) da expressão inglesa Odds Ratio (OR). Apesar desta possibilidade estes métodos, não são a melhor escolha para a realização de estudos de sobrevivência, uma vez que não têm em conta o contributo da variável tempo, elemento fundamental para a compreensão do fenómeno da sobrevivência. Não obstante, não deixam de ser abordagens possíveis para quando esta informação não está disponível. Depois da AED são apresentadas as análises de sobrevivência que recorrem aos tempos de sobrevivência calculados a partir das datas presentes na base de dados.

44

Edgar Martins Mesquita

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

Em primeiro lugar são apresentados os resultados relativos à presença de dados omissos na base de dados.

Tabela 7: Resumo dos dados contidos na Base de Dados Variável

Nº Casos válidos

Sexo TipoResp CD34 Leuco20M HG_Score IdadeRisco Cel_Medular ECOG RSWOG_Inicial Esplenomegalia SegdaInd ConsolLPA ManLPA Recidiva PropAloTMO TMO Obito LMA_IPO Tempo1Rec EstadoClínico Idade Hemoglobina

313 243 238 313 86 311 25 313 274 313 282 313 313 313 313 313 313 313 106 312 313 309

Dados Omissos Frequência absoluta Frequência relativa 0 0% 70 22.4% 75 24% 0 0% 227 72.5% 2 0.6% 288 92% 0 0% 39 12% 0 0% 31 9.9% 0 0% 0 0% 0 0% 0 0% 0 0% 0 0% 0 0% 207 66% 1 0% 0 0% 4 1.3%

A Tabela 7 mostra que em mais de metade das variáveis não foram encontrados dados omissos, considerados relevantes, pelo que foi possível contar com a totalidade das 313 respostas. Das variáveis onde foram encontrados dados omissos, nos casos da Hemoglobina (1.3%) e Idade de risco (0.6%), foram encontradas frequências de dados omissos residuais. Na variável Tempo até primeira recidiva (Tempo1Rec), com relação direta com a condição “Sim” da variável Recidiva os dados omissos referem-se a todos os doentes que não recidivaram após experienciarem período sem doença. No caso das variáveis CD34 e Hematogónias (HG_Score) a justificação prende-se com o facto de desde 1998 até 2000 não existir no IPO técnica para a determinação destes valores. Quando às variáveis Tipo de resposta (TipoResp), Celularidade medular (Cel_Medular), Risco SWOG e Segunda indução (SgdaInd) não foram colhidas medidas em todos os pacientes. Apresenta-se de seguida um resumo das frequências absolutas e relativas das variáveis qualitativas presentes na base de dados.

Edgar Martins Mesquita

45

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

Tabela 8: Análise descritiva das variáveis qualitativas Variável

Sexo Tipo de Resposta Nº células CD34 Leucocitose 20M Hematogónias Idade de Risco Celularidade Medular ECOG

Categorias (n; %)

Masculino

Feminino

154 (49.2%)

159 (50.8%)

Sem resposta

Resposta completa

52 (21.4%)

191 (78.6%)

≤ 10%

> 10%

103 (43.3%)

135 (56.7%)

≤ 20 000

> 20 000

310 (68.1%)

100 (31.9%)

Negativo

Positivo

61 (70.9%)

25 (29.1%)

≤ 35

36-45

> 45

54 (17.4%)

48 (15.4%)

209 (67.2%)

Hipocelular

Normocelular

Hipercelular

0 (0%)

21 (84%)

4 (16%)

ECOG 0-1

[ECOG 2-3]

ECOG >3

221 (70.6%)

80 (25.6%)

12 (3.8%)

Desfavorável

Intermédio

Favorável

143 (52.2%)

65 (23%)

Esplenomegalia Segunda Indução Consolidação LPA Manutenção LPA Recidivaª Intenção de TMO Transplante MO Óbito

68 (24.8%) (n; %) 30 (9.6%) 32 (11.3%) 37 (11.8%) 33 (10.5%) 81 (42.4%) 81 (25.9%) 35 (11.2%) 156 (49.8%)

Variável (n; %)

LMA AGR

Risco SWOG Inicial Variável

LMA IPO Variáveis

157 (50.2%) 67 (21.4%) Tempo até 1ª Recidiva 12 meses 36 (34%) Categorias (n; %) SR 8 (7.5%) PC 4 (3.8%) DR 48 (7.5%) Nota. ªSó doentes com resposta completa na Primeira Indução

LMA e SMD RT 39 (12.5%) 50 (16%) Estado Clínico VSED 104 (33.2%) VCED 2 (1%) FSED 30 (9.6%) FCED 156 (49.8%) FDNE 20 (6.4%) LMA DM

A Tabela 8 mostra as frequências absolutas e relativas de todas as variáveis qualitativas presentes na base de dados. A amostra foi constituída por 154 homens (49.2%) e 159 mulheres (50.2%) e o Tipo de resposta ao primeiro tratamento de indução obteve resultados de 191 respostas completas (78.6%) e 52 não respostas (21.4%). A percentagem de precursores CD34 dividiu-se em 56.7% (n= 135) de doentes que tinham mais do que 10% destes precursores, e 43.3% (n= 103) de doentes com menos de 10%. Na Leucocitose encontraram-se 100 doentes (31.9%) com valores acima das 20.000 células por mm3 e 135 (56.7%) com valores iguais ou inferiores a esse limite. A

46

Edgar Martins Mesquita

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

distribuição do score de Hematogónias dividiu-se em 70.9% de doentes com score positivo e 29.1% com score negativo. No que diz respeito à Idade de risco os doentes distribuíram-se pelos grupos de idade igual ou inferior a 35 anos (n= 54; 17.4%), idade entre 36 a 45 anos (n= 48; 15.4%) e idade superior a 45 anos (n= 209; 67.2%). A variável Celularidade medular obteve uma distribuição concentrada sob os valores normais com zero doentes hipocelulares, 21 doentes normocelulares (84%) e quatro doentes hipercelulares (16%). Quanto aos valores de ECOG os resultados apontaram que a maioria dos doentes se encontrava nos primeiros estadiamentos [0,1] com 221 doentes (70.6%) em situação totalmente ativa ou apenas com atividade restrita a esforços físicos. Os restantes doentes distribuíram-se pelos intervalos de estadiamento [2,3], (n= 80; 25.6%) e maior que três (n= 12; 3.8%). Em relação ao Risco SWOG inicial (estabelecido ao diagnóstico) foram encontrados 68 doentes com risco “desfavorável” (24.8%), 143 doentes com risco “intermédio” (52.2%) e 65 doentes com risco “favorável” (23%). No que toca à presença ou ausência de Esplenomegalia a grande maioria dos doentes não tinha presente esta condição (n= 283; 90.4%) o que indica que, na amostra, poucos doentes (n= 30; 9.6%) possuíam a condição de baço aumentado em mais de 15 cm. Quanto à realização de Segunda indução esta condição foi verdadeira em 32 doentes (11.3%) e falsa nos restantes 250 (88.7%). As variáveis Consolidação LPA e Manutenção LPA mostraram que a maior parte dos doentes não fizeram consolidação (88.2%) ou manutenção (89.5%). Quanto ao Transplante de MO, 81 doentes (25,9%) foram propostos para esta intervenção, contra 232 doentes (74.1%) sem esta indicação. Os doentes efetivamente transplantados constituíram 11.2% do total de doentes (n= 35). No que se refere ao Óbito (relacionado com doença), 49.8% dos doentes morreram, valor muito próximo de 50%, o que colocar a sobrevivência dos doentes com LMA em 50%, aos cinco anos. Na classificação do tipo de LMA foram encontrados mais doentes em LMA NOS (n= 157; 50.2%) que nas restantes categorias em conjunto. A variável Tempo até primeira recidiva mostrou que 34% dos doentes recidivaram após 12 meses, 28.3% antes de completarem meio ano sem doença e 18.9% entre 6 e 12 meses. Ainda no que diz respeito a esta variável é de referir que 7.5% dos doentes nunca obtiveram qualquer resposta aos tratamentos, percentagem igual à dos doentes cuja doença foi considerada resistente, e ainda 3.8% encontraram-se na situação de progressão citogenética. Por último, no que se refere ao Estado clínico 104 doentes (33.3%) encontravam-se vivos no final do estudo (difere da negação da variável óbito pois alguns doentes saíram do estudo ou morreram de outras causas), 156 doentes (49.8%) faleceram com evidência de doença, dois doentes Edgar Martins Mesquita

47

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

permaneciam vivos, mas com evidência de doença (1%), 30 doentes faleceram sem evidência de doença (9.6%) e 20 doentes faleceram com doença não especificada (6.4%). Estes resultados podem ser analisados à luz do referencial presente na Tabela 9. Este resulta de uma síntese bibliográfica de estudos acerca do impacto de determinadas características do doente ou da doença na recidiva ou óbito. Os fatores de pior prognóstico para recidiva e óbito encontrados incidem na ausência de resposta na Primeira indução, número de células CD34 > 10%, número de leucócitos > 20.000/mm3 (apenas Recidiva), Hematogónias com score negativo, Idade de Risco superior a 45 anos, ECOG ≥ 2, Risco SWOG (quanto maior o risco pior o prognostico ), necessidade de realização de Segunda indução, ocorrência de Recidiva (apenas Óbito), ausência de Intenção de transplante, bem como de Transplante da MO, Classificação das LMA (pior em Sindrome Mielodisplásica), Tempo até primeira recidiva (quanto menor, pior prognóstico para óbito), Idade e valores mais baixos de Hemoglobina (apenas Óbito). As variáveis Celularidade medular e tratamentos de Consolidação e Manutenção não foram encontradas na literatura.

48

Edgar Martins Mesquita

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

Tabela 9: Revisão bibliográfica dos fatores de pior prognóstico

Sexo

Pior Prognóstico Recidiva Óbito Masc=Fem Masc=Fem

Suporte Bibliográfico Recidiva Óbito Hoelzer et al. (1988); Onida et al. (2002)

Primeira indução

SR

SR

Faderl, Jeha & Kantarjian (2003)

Nº células CD34

> 10%

> 10%

Elwin et al. (2004); Xu et al. (2004)

Leucocitose 20M (nº leucócitos/ mm3)

> 20.000

> 20.000 = ≤ 20.000

Hematogónias

> Negativo

> Negativo

Chantepie et al. (2011)

Idade de risco

>45 anos

>45 anos

Legrand et al. (2000); Faderl, Jeha & Kantarjian (2003); Breems et al. (2005)

Celularidade medular

-

-

ECOG

≥2

≥2

Legrand et al. (2000); Benderra et al. (2005); Gardin etal. (2007)

Risco SWOG inicial

> Risco

> Risco

Hoelzer et al. (1988); Rollig et al. (2010); Alessandrino et al. (2008)

Esplenomegalia

Sim= Não

Sim = Não

Segunda indução

2ªInd. (Sim)

2ªInd. (Sim)

Consolidação LPA

-

-

-

-

Manutenção LPA

-

-

-

-

Recidiva

NA

Rec. (Sim)

NA

Breems et al. (2005)

Intenção transplante

Prop. (Não)

Prop. (Não)

Zittoun et al. (1995)

Transplante de medula óssea

TMO (Não)

TMO (Não)

Zittoun et al. (1995)

LMA IPO

>LMA SMD

>LMA SMD

Alessandrino et al. (2008)

Arber et al. (2003)

Tempo até 1ª recidiva

NA

< Tempo

NA

Fielding et al. (2006)

Idade

> Idade

> Idade

Hemoglobina

SD

< Hemogb

Hoelzer et al. (1988)

Benderra et al. (2005)

-

-

Hoelzer et al. (1988)

Onida et al. (2002)

Breems et al. (2005)

Breems et al (2005) Benderra et al. (2005)

Elwin et al. (2004) Onida et al. (2002)

Nota. SR= Sem Resposta; SD= Sem diferenças

Esta abordagem é também útil para introduzir as análises seguintes, relacionadas com Recidiva e Óbito, que numa primeira fase incidem sob uma perspetiva unidimensional, i.e. não considerando o tempo como variável presente, e depois numa segunda fase,

Edgar Martins Mesquita

49

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

introduzindo o tempo como varável de interesse, aplicando assim, métodos de análise de dados de sobrevivência. Assim, são de seguida apresentadas as relações entre as variáveis qualitativas presentes na base de dados e os eventos Recidiva e Óbito. Para a medição dessas relações foi utilizada a estatística de qui-quadrado (Siegel & Castellan, 1988, cf. Anexo C) sob as hipóteses: 𝐻0 : A ocorrência de Recidiva/Óbito é independente da Variável X. 𝐻1 : 𝐴 𝑜𝑐𝑜𝑟𝑟ê𝑛𝑐𝑖𝑎 𝑑𝑒 𝑅𝑒𝑐𝑖𝑑𝑖𝑣𝑎/Ó𝑏𝑖𝑡𝑜 𝑛ã𝑜 é independente da Variável X. A cada variável X corresponde cada uma das variáveis qualitativas analisadas. Nas Tabelas 10 e 11 são apresentadas as relações estatisticamente significativas das variáveis qualitativas da base de dados com as variáveis Recidiva e Óbito, respetivamente. Para cada relação foi verificado o pressuposto do máximo de 20% de células com frequência esperada menor que 5 e ausência de frequência observada igual a 0. Uma vez que este pressuposto foi cumprido em todas as relações não foi necessário recorrer ao teste exato de Fisher (cf. Anexo C), conforme recomendação de Pestana e Velosa (2010) para tabelas do tipo 2x2, em que ambas as variáveis são dicotómicas. Tal como já referido, estes resultados devem ser vistos com precaução pois têm limitações inerentes ao facto de não considerarem o tempo até ao evento de interesse, dado disponível na base de dados. Não obstante, estas análises permitem fornecer uma primeira abordagem à relação existente entre o evento de interesse e cada covariável qualitativa.

50

Edgar Martins Mesquita

Estudos Bioestatísticos em Leucemias Mieloides Agudas e Linfomas

Tabela 10: Tabela de contingência e teste 𝜒 2 para o cruzamento entre as variáveis qualitativas e a Recidiva

Recidiva= Sim Recidiva= Não

Recidiva= Sim

Variáveis Consolidação LPA 29 (80.6%)

p-valor

p
Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.