Classificação de Patologias da Coluna Vertebral Usando Redes Neurais Artificiais Ajalmar R. Neto1, Guilherme A. Barreto2, Paulo C. Cortez3, Henrique da Mota4 1,2,3
Depto. Engenharia de Teleinformática, Universidade Federal do Ceará (UFC), Fortaleza-CE 4 Unidade de Cirurgia da Coluna, Hospital Monte Klinikum, Fortaleza-CE
Resumo - Este artigo apresenta resultados referentes ao módulo de diagnóstico automático da plataforma SINPATCO - Sistema INteligente de diagnóstico de PATologias da COluna vertebral. Este módulo é composto por uma unidade de pré-processamento, cujo objetivo é normalizar os dados e eliminar instâncias discrepantes (outliers) de um banco de dados de casos clínicos, e por um classificador neural baseado na rede Perceptron Multicamadas (MLP). O módulo de diagnóstico é avaliado quanto à capacidade de categorizar casos clínicos em uma das seguintes classes: Normal, Hérnia de Disco e Espondilolistese. Cada caso é representado por 6 atributos biomecânicos extraídos por um médico ortopedista a partir das imagens de Raio-X da coluna do paciente. A rede MLP foi comparada a dois outros classificadores (Naive Bayes e GRNN), tendo apresentado maiores taxas de acerto, maior robustez a outliers e menor número de falsos positivos e falsos negativos. Palavras-chave: Diagnóstico por computador, patologias da coluna vertebral, redes neurais, classificação de padrões, robustez a outliers. Abstract - This paper reports the results obtained from the diagnostics module of the software platform SINPATCO - System for INtelligent Diagnostics of PAThologies of the vertebral COlumn. This module comprises a preprocessing unit, whose goals are data normalization and outlier removal of a database of patients, and a MLP-based neural classifier. The diagnostics module is evaluated by its ability in classifying a new patient as belonging to one out of three categories: Normal, Disk Hernia or Spondylolisthesis. Each patient in the database is represented by six biomechanical attributes extracted by an orthopedic specialist from X-ray images of the vertebral column. The MLP classifier was compared to standard classifiers (Naive Bayes and GRNN), obtaining higher recognition rates, higher robustness to outliers and lower false positive and false negative rates. Key-words: Computer Aided Diagnostics, pathologies of the vertebral column, neural networks, pattern classification, robustness to outliers. Introdução Técnicas de inteligência computacional (IC) têm sido amplamente utilizadas em diagnóstico médico assistido por computador ao longo dos últimos anos, com destaque especial às redes neurais artificiais (RNAs) [1], [2]. De particular interesse para este trabalho é a aplicação de RNAs em ortopedia clínica. Nesta área da medicina, contudo, verifica-se que a aplicação de técnicas de classificação de padrões no diagnóstico de patologias da coluna vertebral não é amplamente difundida. A revisão bibliográfica feita para este artigo encontrou apenas dois trabalhos correlatos [3], [4], em que uma rede MLP é treinada para identificar a presença ou não de osteófitos com base no contorno da vértebra. Uma possível justificativa para a escassez de artigos sobre RNAs em ortopedia pode ser a inexistência de um conjunto específico de
variáveis (medidas) que permitam formalizar o problema de diagnóstico de patologias da coluna como um problema de classificação de padrões. Recentemente, um grupo de especialistas em ortopedia e biomecânica propôs um conjunto de atributos biomecânicos associados a dores e deformidades da coluna vertebral [5], [6]. De posse destes atributos passa a ser viável gerar uma base de dados de pacientes contendo os valores numéricos de seus respectivos atributos biomecânicos, para a partir dela projetar classificadores de padrões para diversas patologias da coluna vertebral. O objetivo deste artigo é, portanto, utilizar um subconjunto desses atributos biomecânicos no projeto de classificadores de padrões baseados na rede MLP, a fim de auxiliar no diagnóstico automático de patologias da coluna vertebral. O principal fruto deste estudo é a plataforma SINPATCO - Sistema INteligente de diagnóstico de PATologias da Coluna vertebral,
desenvolvida para auxiliar o diagnóstico médico assistido por computador. O módulo de diagnóstico da plataforma SINPATCO é composto por uma unidade de pré-processamento, responsável pela normalização dos dados e eliminação de instâncias discrepantes outliers, de um banco de dados de casos clínicos e uma rede MLP que é treinada e testada com os casos clínicos (dados) previamente obtidos por um ortopedista. O módulo de diagnóstico é avaliado quanto a sua capacidade de categorizar casos clínicos em uma das seguintes classes: Normal, Hérnia de Disco e Espondilolistese. Implementações alternativas do módulo de diagnóstico da plataforma SINPATCO usando outros classificadores (GRNN e Naive Bayes) são comparadas com aquela baseada na rede MLP. O restante do artigo está organizado da seguinte forma. Na Seção Patologias da Coluna Vertebral faz-se uma breve introdução às patologias de interesse para este artigo e aos atributos biomecânicos utilizados no projeto do classificador destas patologias. Na Seção Metodologia os classificadores utilizados são brevemente descritos. Os resultados da comparação de desempenho entre estes classificadores são apresentados na Seção Resultados. O artigo é concluído na Seção Discussão e Conclusões. Patologias da Coluna Vertebral A coluna vertebral é um sistema composto por um conjunto de vértebras, discos intervertebrais, nervos, músculos, medula e ligamentos. Segundo Hall [7], as principais funções da coluna vertebral são as seguintes: (i) eixo de suporte do corpo humano; (ii) protetor ósseo da medula espinhal e das raízes nervosas; e (iii) eixo de movimentação do corpo, possibilitando o movimento nos três planos: frontal, sagital e transversal. Esse complexo sistema está sujeito a disfunções que causam dor nas costas, das mais variadas intensidades. Hérnia de disco e espondilolistese são exemplos de patologias da coluna vertebral que causam dores intensas. A hérnia de disco surge quando o núcleo do disco intervertebral migra de seu local, no centro do disco para a periferia, em direção ao canal medular ou nos espaços por onde saem às raízes nervosas, levando à compressão das raízes nervosas. Espondilolistese ocorre quando uma das 33 vértebras da coluna vertebral desliza adiante em relação às outras. Este deslizamento quando verificado ocorre, geralmente, em direção a base da espinha na região lombar, ocasionando dor ou sintomatologia de irritação de raiz nervosa. O mecanismo que ocasiona esse tipo de lesão não é bem conhecido mas existem teorias que
sugerem algumas possíveis causas: fratura por fadiga conjugado a um defeito hereditário ou predisposição, fratura ocorrida durante o parto, trauma, deslocamento de uma vértebra sobre a outra secundária à lordose lombar, fraqueza dos ligamentos e estruturas faceais da região envolvida ou má formação das facetas articulares. Para projetar classificadores automáticos capazes de discriminar várias patologias da coluna vertebral faz-se necessário definir um conjunto de atributos que possam ser medidos para cada paciente analisado pelo ortopedista. Ao longo do tempo, o médico ortopedista terá a seu dispor um banco de dados de casos clínicos reais, contendo os valores dos atributos medidos a partir de pacientes portadores das mais diversas patologias, além de pacientes normais. Este banco de dados pode então ser usado para treinar e validar diversos classificadores. Atributos Biomecânicos - Os atributos biomecânicos a serem descritos nesta seção foram propostos por Joannés Dimnet, Eric Berthonnaud, Pierre Roussouly e Henrique da Mota a partir de estudos desenvolvidos no Laboratório de Biomecânica do Centre MédicoChirurgical de Réadaptation des Massues, localizado em Lyon, França. Estes especialistas montaram uma base de dados com informações de pacientes saudáveis, escolióticos, com hérnia de disco e com espondilolistese [5], [6]. O trabalho de Fieré [8] verificou a presença de uma forte correlação entre hérnia de disco e os atributos biomecânicos propostos, corroborando a hipótese de que tais atributos podem ser úteis no diagnóstico de patologias da coluna vertebral. A base de dados gerada contém dados extraídos de 310 pacientes, a partir de radiografias panorâmicas sagitais em formato de 30 x 90cm. Destes, 100 indivíduos foram voluntários do Hospital de Massues que não possuíam patologias na coluna. Os dados restantes foram obtidos a partir de radiografias de pacientes operados de hérnias de disco (60 indivíduos) ou espondilolistese (150 indivíduos). Um scanner Vidar VXR 8 é utilizado para digitalizar as radiografias, que são então processadas por um sistema semi-automatizado de tratamento de imagem, chamado de SagittalSpine, desenvolvido pelo Dr. Eric Berthionnaud. Este sistema calcula os ângulos da bacia e o traçado linear da coluna a partir dos centros de cabeça de fêmur, da determinação da linha do platô sacral e da determinação dos ápices das curvaturas lordóticas e cifóticas. Cada indivíduo é representado por seis atributos biomecânicos, que correspondem aos seguintes parâmetros angulares sagitais do sistema espinopélvico: (1) ângulo de incidência pélvica, (2) ângulo de versão pélvica, (3) ângulo de lordose, (4) declive sacral, (5) distância ou raio pélvico e (6) grau de deslizamento.
O ângulo de incidência pélvica (pelvic incidence, PI) é definido como o ângulo subtendido pelo segmento de reta ao , que é extraído do centro da cabeça femoral para o ponto médio da placa sacral terminal, e uma reta perpendicular ao centro da placa sacral a (Figura 1). A placa terminal sacral é definida pelo segmento de reta bc entre o canto superior posterior do sacrum e a ponta anterior da placa terminal S1 no promontório sacral. Para o caso em que as cabeças femorais não são sobrepostas, o centro de cada cabeça femoral é marcado, e um segmento de reta ligará os centros das cabeças femorais.
O ângulo de versão pélvica (pelvic tilt, PT), conforme indicado na Figura 2, é descrito como sendo o ângulo subtendido por uma reta de referência vertical originada do centro o da cabeça do fêmur e do raio pélvico oa. Esta afirmação está correta quando o verdadeiro eixo hipotético está em frente ao ponto médio da placa sacral terminal.
O declive sacral (sacral slope, SS) é definido como o ângulo subtendido por uma linha de referência horizontal (HRL) e pela linha sacral da placa terminal bc , conforme ilustrado na Figura 3. O ângulo de lordose é o maior ângulo sagital entre o platô superior do sacro e o platô superior da vértebra lombar ou torácica limite. A distância ou raio pélvico é a distância do centro do eixo bicoxofemural ao centro do platô sacral. Este segmento de reta ao , ilustrado na Figura 1. Por último, o grau de deslizamento é o grau percentual de deslizamento entre o platô inferior da quinta vértebra lombar e o sacro. O ângulo de incidência pélvica é uma constante anatômica individual que determina o comportamento de todo o sistema espinopélvico, através das variáveis posicionais de declive sacral e de versão pélvica. As variáveis posicionais têm, entre si, várias correlações. O surgimento de patologias na coluna vertebral está condicionada aos tipos morfológicos do sistema coluna e pelve. Por exemplo, a incidência pélvica, sendo de grau elevado, condiciona a um maior declive sacral, que gera aumento de cisalhamento pelo aumento da inclinação do plano de apoio para lordose lombar, além de facilitar o conflito de estruturas posteriores, levando ao surgimento de uma fratura de fadiga no arco que sustenta a vértebra e gerando um deslizamento chamado de Espondilolistese. Incidências pélvicas baixas levam ao efeito contrário, com surgimento de aumento de pressão no disco intervertebral e facilitação de surgimento de degenerações e hérnias de disco. O ângulo de incidência determina um padrão de normalidade. O projeto de classificadores automáticos com base nos atributos biomecânicos de casos clínicos reais permite que correlações lineares e/ou não-lineares, assim com as influências destas no diagnóstico, sejam capturadas de forma transparente para o ortopedista, de forma a auxiliá-lo na tomada de decisão. A seguir são
brevemente descritos os classificadores avaliados neste estudo. Metodologia O módulo de diagnóstico da plataforma SINPATCO foi implementado com a rede neural MLP, porém outros classificadores, tais como Naive Bayes e GRNN, foram também avaliados e seus desempenhos comparados. Para este artigo a rede MLP escolhida tem uma camada de entrada de dimensão p = 6, uma camada escondida com q neurônios e uma camada de saída com m = 3 neurônios. As saídas da rede no instante t, yk(t), k = 1, ... , m, são calculadas da seguinte forma:
(1)
treinamento. O vetor de pesos ligando uma certa base gaussiana (camada oculta) aos neurônios de saída é uma cópia exata do vetor de saída desejadas associado ao padrão de treinamento usado como centro daquela base. A abertura (spread) da i-ésima função de base gaussiana foi selecionada como sendo igual à média das distâncias do centro desta função aos cinco centros mais próximos. O classificador Naive Bayes [10] é um classificador gaussiano multivariável, em que cada atributo é assumido com estatisticamente independente dos outros. Assim, a distribuição estatística de cada atributo pode ser modelada por uma função gaussiana unidimensional, cujos parâmetros são a média e a variância amostral daquele atributo. Esta modelagem é feita para cada uma das classes, sendo que a função densidade de probabilidade (PDF) da i-ésima classe é dada por:
(2)
(3)
em que wij é o peso sináptico ligando a j-ésima entrada ao i-ésimo neurônio da camada escondida, mki é o peso sináptico que liga o iésimo neurônio da camada escondida ao k-ésimo neurônio da camada de saída. Os termos bi e θk correspondem aos limiares (threshold) de ativação dos neurônios da camada escondida e de saída, respectivamente. A função de ativação φ(.) escolhida para todos os neurônios da camada escondida e de saída foi a logística: φ (u) = 1/(1+exp(-u)). Os pesos e os limiares de ativação foram ajustados através do algoritmo backpropagation padrão por 2500 épocas, com taxa de aprendizagem igual a 0,01. O número de neurônios da camada escondida foi fixado em q = 2p = 12, valor este que se mostrou satisfatório. O número de neurônios de saída foi fixado em m = 3, devido à codificação adotada para as saídas desejadas (rótulos numéricos das classes). Foi escolhida uma codificação binária, na qual a saída desejada é igual a 1 (um) para o neurônio que representa a classe-alvo e 0 (zero) para as outras saídas desejadas. O rótulo numérico da classe de indivíduos normais é [1 0 0], para classe de indivíduos com hérnia de disco é [0 1 0], e para a classe com espodilolistese o rótulo é [0 0 1]. Esta codificação foi adotada para todos os classificadores avaliados. O classificador GRNN [9] é um tipo de rede RBF, construída diretamente a partir dos dados disponíveis e de seus respectivos rótulos. As saídas desejadas são definidas da mesma forma que as usadas pela rede MLP. Não há treinamento desta rede no sentido neural clássico, e sim a colocação de um kernel gaussiano centrado em cada padrão de
em que p(xj | Cl) é a PDF gaussiana do j-ésimo atributo com relação à i-ésima classe, i = 1, 2, 3. Assumindo que as classes são eqüiprováveis, a classe a qual pertence um novo padrão é aquela que apresentar o maior valor de p(x | Cl). Antes do treinamento de todos os classificadores foram criados três conjuntos a partir do conjunto T de amostras disponíveis: um conjunto W livre de amostras discrepantes (outliers), um conjunto N contendo somente outliers, e um terceiro conjunto S que está relacionado ao primeiro e ao segundo conjuntos da seguinte forma S = W U NP, em que NP representa um subconjunto de N contendo uma porcentagem P dos outliers de N. Note que T = W U N e que S é um subconjunto de T. As amostras (padrões) de treinamento e teste são tirados do conjunto S. Outliers são obtidos a partir do conjunto original de amostras como aquelas que apresentam atributos xj com valores fora do intervalo [µj – 2*σj, µj + 2*σj], em que µj e σj são a média e o desvio-padrão amostrais do j-ésimo atributo. Este subconjunto de amostras discrepantes forma o conjunto N. Eliminando-se estas amostras do conjunto completo T, obtém-se o conjunto W. O treinamento e teste de cada classificador é executado 50 vezes, sendo que o conjunto S é dividido em dois subconjuntos: um para treinamento com 70% das amostras e outro para teste com as 30% restantes. As amostras que compõem o conjunto de treinamento são selecionadas aleatoriamente, sendo as restantes usadas para teste. Inicialmente, trabalha-se com
um valor para P = 0%, resultando em um conjunto S igual ao conjunto W, ou seja, livre de outliers. O valor de P é então incrementado em passos de 20 unidades, até atingir P = 100%, quando então todos os outliers são adicionados ao conjunto S. Para cada grupo de 50 realizações de treinamento/teste, referentes a um valor de P especificado, são armazenadas as taxas de acerto médio, a variância das taxas de acerto, além da menor e a maior taxas observadas durante os testes. Além das taxas de acerto médias, máximas e mínimas, os classificadores são também comparados entre si com base no número de falsos negativos e falsos positivos gerados. Um diagnóstico é denominado falso negativo quando um indivíduo doente (com espondilolistese ou hérnia de disco) é diagnosticado como saudável, enquanto um diagnóstico é denominado falso positivo quando um indivíduo sadio é diagnosticado como doente. Estes números são comumente apresentados na forma de uma matriz de confusão. As linhas desta matriz correspondem às classes reais das amostras de testes, enquanto as colunas correspondem às classes preditas pelos classificadores. Se todas as amostras são corretamente classificadas, a matriz de confusão correspondente terá elementos não-nulos apenas ao longo da diagonal principal. Resultados Para o classificador MLP, os valores médio, máximo, mínimo e a variância da taxa de acerto obtidos durante o teste, em função da porcentagem de outliers presentes nos dados são mostrados na Tabela 1. O desempenho classificatório é máximo quando outliers não estão presentes nos dados (i.e. P = 0), à medida que esta porcentagem aumenta o desempenho do classificador se degrada. Contudo, mesmo para P = 100%, a taxa de acerto da rede MLP é elevada (bem próximo a 90%). Tabela 1 - Resultados do classificador MLP. Var p(%) Média Mínimo Máximo 0 98,48 94,82 100,0 2,01 20 93,82 90,71 98,48 4,26 40 91,69 90,27 95,83 2,48 60 90,74 88,55 94,96 3,29 80 89,86 88,37 94,18 2,21 100 89,67 88,11 93,54 2,48 A Tabela 2 apresenta uma matriz de confusão típica do classificador MLP. Os resultados mostrados correspondem aos obtidos em uma das 50 rodadas de treinamento/teste, para o melhor classificador obtido para P = 100%, ou seja, os dados contém todos os outliers. Para esta tabela e para as seguintes, os símbolos HD,
EL e NO denotam indivíduos com hérnia de disco, com espondilolistese e normais, respectivamente. Analisando a Tabela 2, pode-se verificar que existem 2 falsos positivos (indivíduos normais classificados pelo sistema com hérnia de disco) e 4 falsos negativos (indivíduos com hérnia de disco preditos como normais). Este resultado ilustra bem o comportamento geral do classificador MLP, com alta taxa de acerto e baixa quantidade de falsos positivos e falsos negativos. Tabela 2 – Matrix confusão (classificador MLP). HD EL NO HD 8 0 4 EL 0 48 0 NO 2 0 31 Para o Naive Bayes, os resultados da classificação em função da porcentagem de outliers nos dados estão mostrados na Tabela 3. Nota-se que o comportamento observado segue aquele do classificador MLP, ou seja, há um decréscimo na taxa de acerto média à medida que se aumenta a porcentagem de outliers no conjunto S. Contudo, as taxas de acerto média, mínima e máxima obtida para o classificador Naive Bayes são sempre inferiores àquelas reportadas pelo classificador MLP. Tabela 3 - Resultados obtidos pelo Naive Bayes p(%) Média Mínimo Máximo Var 0 96,51 89,65 100,0 6,73 20 91,96 84,61 98,46 8,08 40 89,29 81,69 97,22 16,15 60 86,68 77,21 93,67 9,62 80 83,04 73,25 89,65 11,87 100 82,02 74,19 89,24 9,96 A Tabela 4 apresenta a matriz de confusão do classificador Naive Bayes. Os valores mostrados correspondem aos obtidos em uma das 50 rodadas de treinamento/teste, selecionado o classificador com melhor desempenho, quando considerado a ocorrência de todos os outliers no conjunto S, ou seja, P = 100%. Nota-se que ocorrem 8 falsos positivos (indivíduos saudáveis classificados como herniados (6) ou com espondilolistese (2)), 2 falsos negativos (indivíduos com hérnia de disco classificados como saudáveis). Tabela 4 – Matriz confusão (Naive Bayes). HD EL NO HD 16 0 2 EL 0 45 0 NO 6 2 22 Na Tabela 5 estão resumidos os resultados para o classificador GRNN. Pode-se concluir que o desempenho deste classificador foi semelhante ao do classificador Naive Bayes.
Tabela 5 - Resultados do classificador GRNN p(%) Media Mínimo Máximo Var 0 95,79 86,20 100,0 10,45 20 89,38 81,53 96,92 11,13 40 84,94 76,38 94,44 17,03 60 81,06 72,15 88,60 13,07 80 77,88 65,11 86,04 14,54 100 75,78 64,51 87,09 23,04 A Tabela 6 apresenta a matriz de confusão do GRNN, para o melhor classificador selecionado entre aqueles gerados durante as 50 rodadas de treinamento/teste usando P = 100%. Verifica-se a ocorrência de 5 falsos positivos (indivíduo saudável classificado com espondilolistese-4 e hérnia de disco-1), 3 falsos negativos (indivíduos herniados-2 ou com espondilolistese-1 ditos saudáveis); e, por fim, 4 indivíduos classificados com doenças diferentes da que possuíam. Tabela 6 – Matrix confusão (GRNN). HD EL NO HD 11 3 2 EL 1 50 1 NO 1 4 20
Discussão e Conclusões Este artigo apresentou resultados referentes ao módulo de diagnóstico automático da plataforma SINPATCO - Sistema INteligente de diagnóstico de PATologias da COluna vertebral. Este módulo é avaliado quanto à capacidade de categorizar casos clínicos em uma das seguintes classes: Normal, Hérnia de Disco e Espondilolistese. Cada caso é representado por 6 atributos biomecânicos extraídos por um médico ortopedista a partir das imagens de Raio-X da coluna do paciente. A partir dos resultados mostrados anteriormente, pode-se facilmente concluir que dentre os classificadores comparados, aquele baseado na rede MLP foi o que apresentou o melhor desempenho classificatório global. Apresentado maiores taxas de acerto com menores variâncias, maior robustez à presença de outliers e menor número de ocorrências de flasos positivos e falsos negativos. Por estes resultados, a rede MLP foi escolhida para compor o módulo de diagnóstico automático da plataforma SINPATCO. Agradecimentos Os autores agradecem ao CNPq (processo 506979/2004-0), à CAPES/PRODOC e à FUNCAP pelo apoio financeiro.
Referências [1] Ramesh, A. N., Kambhampati, C., Monson, J. R. T. & Drew, P. J. (2004). Artificial intelligence in medicine, Annals of the Royal Colege of Surgeons of England 86(5): 334338. [2] Dybowsky, R. (2000). Neural computation in medicine: Perspective and prospects, in H. Malmgren, M. Borga & L. Niklasson (eds), Proceedings of the 1st Conference on Artificial Neural Networks in Medicine and Biology ANNIMAB-1, pp. 26-36. [3] Cherukuri, M., Stanley, R. J., Long, R., Antani, S. & Thoma, G. (2004). Anterior osteophyte discrimination in lumbar vertebrae using sizeinvariant features, Computerized Medical Imaging and Graphics 28(1-2): 99-108. [4] Antani, S., Long, L. R., Thoma, G. R. & Stanley, R. J. (2003). Vertebra shape classification using mlp for content-based image retrieval, Proceedings of the IEEEINNS International Joint Conference on Neural Networks (IJCNN’ 03), pp. 160-165. [5] Labelle, H., Roussouly, P. & Berthonnaud, E. (2005). The importance of spino pelvic balance in L5 S1 developmental spondylolisthesis, SPINE 30(6): 27-34. [6] Berthonnaud, E., Labelle, H., Grimard, G. & Mota, H. (2001). Sagittal spinopelvic radiological measurements of trunk balance, European Spine Journal 1: 33. [7] Hall, S. J. (2000). Biomecânica Básica, 3a edn, Guanabara Koogan, Rio de Janeiro, RJ. [8] Fiére, V. & Mota, H. (2001). Discal herniation pelvic incidence and spinopelvic balance: a correlation study, European Spine Journal 1: 45. [9] Specht, D. F. (1991). A general regression neural network, IEEE Transactions on Neural Networks 2(6): 568-576. [10]
Webb, A. (2002). Statistical Pattern Recognition, 2nd edn, John Wiley & Sons.
Contato Emails: {ajalmar, guilherme, cortez}@deti.ufc.br,
[email protected]. Fones: (85) 3366-9467 ou (85) 3366-9470.