Diagnosis of solitary lung nodule using texture e geometry in computerized tomography images: Preliminary results | Diagnóstico de nódulo pulmonar solitário utilizando textura e geometria em imagens de tomografia computadorizada: Resultados preliminares

July 3, 2017 | Autor: Aristófanes Silva | Categoria: Computerized tomography
Share Embed


Descrição do Produto

IEEE LATIN AMERICA TRANSACTIONS, VOL. 2, NO. 2, JUNE 2004

75

Diagnóstico de Nódulo Pulmonar Solitário Utilizando Textura e Geometria em Imagens de Tomografia Computadorizada: Resultados Preliminares A. C. Silva, P. C. Carvalho e M. Gattass



Resumo — Este trabalho analisa medidas baseadas em textura, no Método de Dependência Espacial de Níveis de Cinza — SGLDM — e na geometria utilizando o esqueleto, para diagnosticar nódulos pulmonares em imagens de tomografia computadorizada. Com base em uma amostra de 31 nódulos, sendo 25 benignos e 6 malignos, estes métodos são primeiro analisados individualmente e depois combinados, e utilizando um conjunto de técnicas para classificação e análise (análise discriminante, passo a passo, deixa um de fora e curva ROC), concluímos que os métodos individualmente e combinados produziram bons resultados no diagnóstico de nódulos pulmonares solitários. Para obtermos um padrão de comportamento mais preciso, necessitamos efetuar mais testes com um banco de dados amplo e nódulos mais complexos.

O nódulo pulmonar solitário possui uma estrutura de tecido muito complexo. Podem existir nódulos com alterações de tecido quase imperceptíveis ao olho humano, e outras com uma grande nitidez. A variação do tecido e, às vezes, o não desenvolvimento aparente da forma do nódulo, dificulta o seu diagnóstico. De um modo geral, é possível caracterizar um nódulo como maligno ou benigno através da análise da textura (coeficiente de atenuação). Se no nódulo existir calcificação do tipo pipoca, laminar concêntrica, difusa ou central, provavelmente será benigno. Entretanto, se o nódulo não tiver calcificação e possuir áreas de necrose, provavelmente será maligno[2]. A primeira linha na Fig. 1 ilustra dois nódulos benignos e dois nódulos malignos.

Palavras-chave — Diagnóstico de nódulo pulmonar solitário, textura, geometria, curva ROC, análise discriminante.

I. INTRODUÇÃO

N

o Brasil, o câncer de pulmão foi responsável por 14.069 óbitos em 1999, sendo o tipo de câncer que mais fez vítimas. Segundo o Instituto Nacional de Câncer – INCA[1], o câncer de pulmão deverá atingir cerca de 22.085 pessoas (15.165 homens e 4.915 mulheres) e causar aproximadamente 16.230 mortes em 2003. Estima-se para o ano de 2003 que o câncer de pulmão seja a principal causa de morte por câncer no sexo masculino e o segundo no sexo feminino. A doença está associada ao consumo de tabaco em 90% dos casos diagnosticados e tem uma taxa de crescimento anual de 2% em sua incidência no mundo todo.

Este trabalho teve apoio financeiro da CAPES e da FAPERJ. A. C. Silva é da Universidade Federal do Maranhão – UFMA, Depto. de Engenharia de Eletricidade, Rua Marquês de São Vicente, 225, Gávea, Maranhão, MA, 22453-900, Brasil (e-mail: [email protected]). P. C. Carvalho é do Instituto de Matemática Pura e Aplicada – IMPA, Estrada D. Castorina, 110, Jardim Botânico, Rio de Janeiro, RJ, 22460320, Brasil (e-mail: [email protected]). M. Gattass é do Lab. Tecgraf, Pontifícia Universidade Católica do Rio de Janeiro – PUC-Rio, Depto. de Informática, Rua Marquês de São Vicente, 225, Gávea, Rio de Janeiro, RJ, 22453-900, Brasil (e-mail: [email protected]).

Fig. 1. Exemplo de dois nódulos benignos e dois nódulos malignos.

A geometria é outra maneira de se caracterizar um nódulo como maligno ou benigno. Se o nódulo for arredondado ou de forma bem definida, provavelmente é benigno. Se for espiculado ou de geometria mal definida, provavelmente é maligno[2]. A segunda linha na Fig. 1 exemplifica estas características em 3D. Entretanto, em alguns casos é difícil distinguir estas características. O diagnóstico precoce de nódulos pulmonares solitários possibilita uma maior sobrevida ao paciente. Porém, algumas vezes, devido aos fatores já vistos, o diagnóstico pode ser muito difícil, o que pode levar a procedimentos desnecessários, causando até a morte do paciente. Para

76

amenizar estes casos, algumas pesquisas, utilizando o exame de tomografia computadorizada e o computador, têm sido realizadas nas últimas décadas. Aoyma et al. [3] desenvolveram um método de diagnóstico em radiografia convencional. O método consiste em extrair o nódulo de forma semi-automática e utilizar as características sexo, idade, diâmetro, circularidade, grau de irregularidade, histograma, gradiente como entrada para o método estatístico de Análise Discriminante Linear e Rede Neural Perceptron de Múltiplas Camadas. Armato et al. [4] descrevem uma ferramenta computadorizada que segmenta automaticamente o nódulo de um exame de tomografia computadorizada e sugerem seu diagnóstico. O método consiste em extrair o nódulo e analisar através de medidas baseadas na geometria (volume, esfericidade, raio equivalente à esfera, compacidade máxima e circularidade máxima) e textura (média e desvio padrão). O propósito do trabalho de Mcnitt-Gray et al. [5] é caracterizar nódulos como benignos ou malignos com base em medidas quantitativas de uma fatia (2D) de uma tomografia computadorizada de alta resolução. Várias medidas foram extraídas relacionadas ao tamanho do nódulo, forma, coeficiente de atenuação, distribuição de atenuação e textura, e a técnica de análise discriminante com o procedimento de seleção de variáveis passo a passo foram utilizadas para determinar que combinações de medidas são adequadas para discriminar os nódulos entre benignos e malignos. Kawata et al. [6] apresentam um método para caracterizar estruturas internas do nódulo 3D que faz uso do índice de forma (shape index) e da densidade da tomografia computadorizada para representar localmente cada voxel. É criado um histograma de características, baseado no índice de forma, chamado “medida de espectro de forma” (shape spectrum measures), que armazena o voxel com um determinado índice para caracterizar o nódulo. Além desse histograma, foram criadas matrizes semelhantes ao método de análise de textura, matrizes de co-ocorrência, para índice de forma e densidade. A técnica estatística de análise discriminante foi utilizada para classificar nódulos benignos e malignos. O objetivo deste trabalho é fornecer um conjunto de medidas de textura e geometria em 3D que podem ser usadas para apoiar o diagnóstico da natureza de uma lesão pulmonar. As medidas de textura se baseiam no método estatístico denominado Método de Dependência Espacial de Níveis de Cinza - Spatial Gray Level Dependence Method (SGLDM) [711]. As medidas de geometria levam em consideração o esqueleto do nódulo [15, 22]. Todas as medidas são baseadas em imagens provenientes de Tomografia Computadorizada (TC). A determinação da malignidade ou benignidade do nódulo é obtida através da estatística multivariada de análise discriminante linear e do procedimento passo a passo (stepwise)para a seleção de variáveis mais significativas. A validação da função discriminante é realizada através da técnica de deixa um de fora (leave-one-out). A análise e a avaliação dos testes foram efetuadas utilizando-se a área da curva ROC. A análise e o diagnóstico foram realizados com uma amostra de 31 nódulos, sendo 25 benignos e 6 malignos, e os

IEEE LATIN AMERICA TRANSACTIONS, VOL. 2, NO. 2, JUNE 2004

testes foram efetuados primeiro com as medidas de textura e de geometria separadamente e, em seguida, com as duas medidas combinadas. Desta forma, foi determinado qual das medidas teve maior poder discriminante e apresentou um bom desempenho na determinação da malignidade ou benignidade dos nódulos. II. MATERIAL E MÉTODOS A. Aquisição das Imagens As imagens foram adquiridas em um Tomógrafo Computadorizado Helicoidal GE pro Speed, sob as seguintes condições: voltagem do tubo de 120 kVp, corrente do tubo de 100 mA, tamanho da imagem de 512x512 pixels, e voxel com tamanho de 0,67x0,67x1,0 mm. As imagens foram quantizadas em 12 bits e armazenadas no formato DICOM [12]. B. Extração 3D do Nódulo Pulmonar Na maioria dos casos, o nódulo pulmonar é de fácil detecção visual pelos médicos, já que possui forma e localização que se destacam das outras estruturas pulmonares. Entretanto, a densidade do voxel se assemelha à de outras estruturas, como vasos sanguíneos, o que dificulta uma detecção automática através do computador. Isto ocorre, principalmente, quando o nódulo está situado adjacente à pleura. Por estas razões, utilizamos o algoritmo semiautomático chamado região de crescimento 3D por agregação de voxel [13], que permite que os médicos tenham maior interatividade e controle sobre a segmentação e determinação dos parâmetros necessários - limiares inicial e final, corte e semente. Dois outros recursos auxiliares possibilitam um maior controle sobre a segmentação: a barreira e a borracha. A barreira é um cilindro colocado em volta do nódulo pelo usuário que tem por objetivo limitar a região de interesse e impedir que a segmentação por região de crescimento invada outras estruturas do pulmão. A Fig. 2 ilustra o recurso da barreira. A borracha, por sua vez, é um recurso que possibilita ao médico apagar estruturas indesejadas antes ou depois da segmentação, visando evitar e corrigir erros durante a segmentação [14]. A segunda linha na Fig. 1 mostra o resultado da segmentação em 3D.

Fig. 2. Barreira ao redor do nódulo.

C. Medidas Baseadas em Textura 3D Uma das tarefas mais importantes em uma classificação textural de uma imagem médica digital é extrair eficientemente características que identifiquem particularidades e detalhes de mudanças de comportamento na textura. Estas características podem ser usadas para a descrição e classificação de diferentes texturas usando

SILVA et al.: DIAGNOSIS OF SOLITARY LUNG NODULE

técnicas de reconhecimento de padrões. Durante os últimos anos, muitos métodos de extração de características têm sido propostos, usando métodos estruturais ou estatísticos [15, 22]. Neste trabalho, será utilizado o Método de Dependência Espacial de Níveis de Cinza - Spatial Gray Level Dependence Method (SGLDM). Este método é também chamado de matriz de co-ocorrência. É importante salientar que o método foi aplicado no nódulo segmentado, levando-se em consideração sua característica tridimensional. Isto é, a análise é realizada em todos os voxels de todas as fatias do nódulo. O SGLDM realiza a tabulação da freqüência na qual diferentes combinações de valores de pixels ocorrem na imagem. A matriz resultante do SGLDM contém informações sobre a posição dos pixels com valores similares de níveis de cinza [16]. A extensão do algoritmo em 3D usado para calcular a matriz resultante é mostrada a seguir: 1.

2.

São percorridos os 26 vizinhos de um voxel específico a uma distância d e o número de ocorrências dos pares de níveis de cinza é acumulado em uma única matriz do SGLDM. A matriz é normalizada dividindo-a pelo número total de pares encontrados.

A Fig. 3 resume o algoritmo acima para d = 1.

Fig. 3. Algoritmo para calcular a matriz de SGLDM. Haralick e et.al. [16] determinaram 13 medidas baseadas na matriz resultante. Entretanto, Ohanian e Dubes [17] mostraram que apenas um pequeno grupo de medidas é suficiente para caracterizar a textura. Estas medidas são: contraste (CON), homogeneidade local (IDM), segundo momento angular (ASM), entropia (ENT), variância (VAR) e correlação (COR). O Apêndice A mostra as equações destas medidas. Um grande problema com o método SGLDM é que a escolha da direção e distância dos vizinhos de um voxel bem como o nível de quantização são arbitrários [11]. Neste trabalho, para o algoritmo descrito, utilizamos os 26 vizinhos de cada voxel. O número de vizinhos proposto analisa a característica 3D do nódulo, isto é, analisa todos os vizinhos (em todas as direções) dos voxels. Em relação à distância, adotamos 1, 2 e 3 voxels, pois existe interesse nos pequenos

77

detalhes do nódulo. Os níveis de quantização (relativos, baseado nos valores mínimo e máximo do voxel) adotados são 8, 16, 32 e 64 níveis de cinza. Não houve um critério específico para os níveis de quantização adotados, apenas desejamos verificar qual nível quantização é mais estatisticamente significante para a classificação dos nódulos. Entretanto, sabemos que quanto menores os níveis de cinza mais informações são perdidas, e que quanto maiores os níveis de cinza mais esparsa fica a matriz de SGLDM, e conseqüentemente, piores são os resultados das medidas analisadas. D. Medidas Baseadas em Geometria A esqueletização é uma ferramenta conveniente para se obter uma representação simplificada da forma que preserva muitas informações topológicas [15]. Um esqueleto captura o eixo de simetria local e, portanto, é centrado na imagem. Em análise de imagem, as características extraídas do esqueleto são comumente usadas em algoritmos de reconhecimento de padrões [20]. Os esqueletos contêm informações sobre as características da forma que são muito importantes no contexto deste trabalho. No processo de esqueletização foi utilizado o algoritmo de Zhou e Toga [21]. Eles propuseram um algoritmo de codificação de voxel muito eficiente para fazer esqueletos de objetos volumétricos. O algoritmo calcula o esqueleto através de dois códigos. Um é o Boundary Seeded (BS), que coincide com a transformada da distância tradicional [15] para indicar a distância mínima à borda do objeto. O segundo código é chamado Single Seeded (SS) e indica a distância para um ponto de referência específico. Estes caminhos são representados pelo conjunto seqüencial de voxels que comporão o esqueleto inicial. A idéia-chave da codificação do voxel é usar o código SS para gerar linhas (esqueleto) conectadas e o código BS para assegurar a centralização do esqueleto final. Os esqueletos gerados são formados por seqüências de voxels que representam curvas e não superfícies do nódulo. Maiores informações sobre este algoritmo podem ser obtidas em [18-19]. A terceira linha na Fig. 1 mostra os esqueletos dos nódulos exemplificados com a aplicação deste algoritmo. Foram extraídas oito medidas baseadas no esqueleto para analisar o nódulo: 1. Número de Segmentos (NS) 2. Número de Ramificações (NR) 3. Fração do Volume (FV), definida por:

v V

FV

4.

onde v é o volume do esqueleto e V é o volume do nódulo. Comprimento Relativo dos Segmentos (CS):

CS

5.

(1)

L 3

(2)

V

onde L é o comprimento de todos os segmentos e V é o volume do nódulo. Volume do Fecho Convexo (VFC)

78

IEEE LATIN AMERICA TRANSACTIONS, VOL. 2, NO. 2, JUNE 2004

6.

Taxa entre o número de segmentos e o volume do fecho convexo (NSVFC) [16]

NS VFC

NSVFC 7.

Coeficiente de Variação (CV) dos N maiores segmentos no esqueleto. O valor de N é baseado no esqueleto que tem a menor quantidade de segmentos na amostra estudada. O coeficiente de variação é independente de escala. Um valor alto de CV indica alta variabilidade nos segmentos do esqueleto. O CV é uma medida de dispersão relativa e é dado por:

V P

CV 8.

(3)

(4)

onde V é o desvio padrão e P é a média. Momentos do histograma (variância (M2), simetria (M3), e curtose (M4)) dos N maiores segmentos no esqueleto. O valor de N é baseado no esqueleto que tem a menor quantidade de segmentos na amostra estudada. Os três momentos do histograma são extraídos de cada segmento do esqueleto e são definidos por: n

¦ x Mn onde n = 2, 3 e 4 ,

P

i

 P fi N

(5)

é média, N é um número de

voxels no segmento e f é o histograma dos voxels dos esqueleto. Informações mais detalhadas sobre a teoria de momento podem ser encontradas em [22]. E. Classificação dos Nódulos Análise Discriminante é o nome dado a uma técnica estatística multivariada que visa gerar critérios para separar observações em grupos através de funções das variáveis associadas a estas observações [23]. Em nosso caso, cada observação é um nódulo e as variáveis associadas são as medidas apresentadas nas seções anteriores. Entretanto, neste trabalho, temos muitas variáveis em relação ao número de observações. Assim usamos o procedimento de seleção de variáveis passo a passo [23] para selecionar as variáveis mais significativas. Para validar o poder de discriminação da análise discriminante linear, a técnica de deixa um de fora (leave-oneout) [24] foi utilizada. Esta técnica é um caso especial de reamostragem que é uma técnica elegante para estimar erros de classificador. Como é computacionalmente cara, é freqüentemente reservada para problemas em que o tamanho da amostra é relativamente pequeno. Para uma amostra de tamanho N, um classificador é projetado usando (N-1) casos e testado no único caso restante. Isto é repetido N vezes, cada caso na amostra é usado como um caso de teste, e os demais são usados para projetar o classificador. A taxa de erro é o número de erros dividido por N. Em nosso banco de dados, temos 31 nódulos candidatos. Utilizando esta técnica, o

classificador é treinado com 30 nódulos, ficando um de fora para teste. Este processo é repetido para todos os 31 nódulos. Para avaliar a habilidade do classificador de diferenciar nódulos benignos de malignos, a área (AZ) sobre a curva ROC (Receiver Operation Characteristic) [25] é utilizada. Em outras palavras, a curva ROC descreve a habilidade da análise discriminante linear separar corretamente o conjunto de nódulos em duas classes baseado na fração verdadeiropositivo (sensibilidade) e na fração falso-positivo (1especificidade).

III. RESULTADOS Os testes descritos neste trabalho foram efetuados em uma amostra com 31 nódulos, sendo 25 benignos e 6 malignos. É importante salientar que os nódulos foram diagnosticados por médicos especialistas e tiveram o diagnóstico comprovado através de intervenção cirúrgica ou com base nas suas evoluções. Isto explica o tamanho da nossa amostra, pois o processo de avaliação da evolução do nódulo é de no mínimo 2 anos. Além disso, ainda não existe uma base dados padrão disponível para se efetuar validação de métodos propostos. Não houve nenhum critério específico para a escolha dos nódulos. A amostra possui nódulos com tamanhos e formas variadas, com características homogêneas e heterogêneas e em estágio inicial e avançado. O software estatístico SPSS (Statistical Package for the Social Sciences) [26] foi utilizado para fazer a análise, o treinamento e a classificação dos nódulos, e o software ROCKIT [27] para calcular a curva ROC e comparar a significância estatística entre os valores de AZ nos diferentes métodos estudados [28]. O teste do SGLDM foi efetuado agrupando-se todas as medidas estatísticas, de todas as distâncias e níveis de quantização, para a determinação da função discriminante. Este procedimento foi escolhido por ser difícil determinar a distância e o nível de quantização ideais. Desta forma, o método teve 72 medidas (variáveis) candidatas à seleção. Para o teste das medidas baseadas no esqueleto, mais especificamente o Coeficiente de Variação e Momentos do Histograma, é necessário verificar o menor número segmentos da amostra. Dos 31 nódulos da amostra, o nódulo que tem o menor número de segmentos possui apenas dois. Desta forma, o valor de N para estas medidas será 2 (N=2). O número total de medidas (variáveis) baseadas no esqueleto candidatas à seleção é de 10. A Tabela I mostra as variáveis selecionadas através da técnica passo a passo e que serão utilizadas na análise discriminante. Na tabela, ASM(16;1), por exemplo, significa medida estatística de segundo momento angular do método SGLDM, com 16 níveis de cinza e a uma distância igual a 1.

SILVA et al.: DIAGNOSIS OF SOLITARY LUNG NODULE

79

TABELA I MEDIDAS SELECIONADAS PARA ANÁLISE

Método

Medidas selecionadas ASM(16;1), ASM(16;2), ASM(16;3), ENT(32;3), ASM(64;3), IDM(64;1), IDM(64;3) NS, VFC

SGLDM Esqueleto SLGDM esqueleto

+

NS, VFC, ASM(64;3)

Com base na Tabela I, observamos que as medidas do método SGLDM que teve mais significância foi a ASM. O nível de quantização e a distância que mais contribuíram na análise discriminante são 64 e 3, respectivamente. Esse valor de quantização é explicado porque quanto menor os níveis de quantização, mais informações importantes da imagem são perdidas. Entretanto, quando a quantização tem níveis de cinza muito grande a matriz de SGLDM fica esparsa e o cálculo das medidas não é muito eficiente. O valor da distância mostra que nas imagens estudadas não existe muita variação à distâncias pequenas (1 e 2), e conseqüentemente, as medidas são muito correlacionadas. No trabalho de McNitt-Gray et al [11] foi feito um estudo com o método SGLDM em 2D, e eles mostraram que o nível de quantização mais utilizado foi o de 8, enquanto que em nosso caso nenhuma das variáveis escolhidas tem 8 de quantização. Entretanto, como os protocolos de aquisição e as amostras são diferentes e, além disso, eles usaram apenas uma fatia do exame de TC, é muito difícil fazer uma comparação entre os dois trabalhos. No método do esqueleto as medidas mais fortes estatisticamente foram NS e VFC. A Tabela II e a Fig. 4 mostram os resultados de cada método analisado. Com base na área da curva ROC pode-se observar que: 1) a área da curva (Az) de todos os métodos teve nível de precisão considerado entre regular e excelente [29]; 2) as medidas baseadas no esqueleto têm melhor desempenho que o SGLDM; 3) existe uma complementaridade entre as medidas de textura e geometria, trazendo como conseqüência mais precisão no diagnóstico. A comparação entre as medidas do método SGLDM e do método combinado SGLDM + esqueleto é estatisticamente significativa (p
Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.