Estudo Comparativo de Métodos para a Classificação da Atenção Seletiva Auditiva

June 1, 2017 | Autor: A. Furlani Bastos | Categoria: Selective Attention, Machine Learning, Auditory Attention, Auditory evoked Potentials
Share Embed


Descrição do Produto

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

´ ˜ DA ATENC ˜ ESTUDO COMPARATIVO DE METODOS PARA A CLASSIFICAC ¸ AO ¸ AO SELETIVA AUDITIVA ´ Alvaro F. Bastos∗, Bianca S. Rocha∗, Leonardo B. Felix∗ ∗

N´ ucleo Interdisciplinar de An´ alise de Sinais - NIAS, Departamento de Engenharia El´etrica, Universidade Federal de Vi¸cosa - UFV Av. Peter Henry Rolfs, Campus Universit´ ario - CEP: 36570-900 - Vi¸cosa, MG - Brasil Emails: [email protected], [email protected], [email protected]

Abstract— The auditory selective attention is related to the mental capacity of focusing the attention on determined stimulus, while ignoring others present at the same time. The nervous system creates evoked potentials due to this selective attention, thus enabling its classification. Using simultaneously Neural Networks, Support Vector Machines, and Magnitude Squared Coherence yields high success rates in the determination in which ear the user is focusing his/her attention. Keywords— Auditory Selective Attention , Auditory Evoked Potentials, Artificial Neural Networks, Support Vector Machines, Magnitude Squared Coherence. Resumo— A aten¸ca ˜o seletiva auditiva est´ a relacionada ` a capacidade mental de focar a aten¸c˜ ao em determinados est´ımulos, ignorando os demais presentes simultaneamente. O sistema nervoso gera potenciais evocados em fun¸ca ˜o dessa aten¸c˜ ao seletiva, possibilitando a sua posterior classifica¸ca ˜o. A utiliza¸c˜ ao conjunta dos m´ etodos Redes Neurais, M´ aquinas de Vetores de Suporte e Magnitude Quadr´ atica de Coerˆ encia fornecem altas taxas de acerto na determina¸c˜ ao de qual ouvido o usu´ ario est´ a focando sua aten¸c˜ ao. Palavras-chave— Aten¸c˜ ao Seletiva Auditiva, Potencial Evocado Auditivo, Rede Neural Artifical, M´ aquinas de Vetores de Suporte, Magnitude Quadr´ atica de Coerˆ encia.

1

Introdu¸ c˜ ao

Os valores do PEA sofrem altera¸c˜oes em dist´ urbios neurol´ogicos causados por tumores, les˜ oes, doen¸cas desmielinizantes e dist´ urbios funcionais. Dessa forma, ´e uma ferramenta para diagn´ostico de d´eficits auditivos (tais como les˜oes e tumores nas vias auditivas) que podem ser observados mesmo em caso neonatais e na avalia¸c˜ao da capacidade auditiva para altas frequˆencias. Al´em disso, essa ferramenta possibilita a verifica¸c˜ao da maturidade el´etrica de vias em neonatos, assim como na avalia¸c˜ao do grau de coma e determina¸c˜ao de morte cerebral (Lima et al., 2009). Devido a` importˆancia dos Potenciais Evocados Auditivos originados atrav´es da aten¸c˜ao seletiva, o objetivo desse trabalho ´e analisar t´ecnicas computacionais que possibilitem a classifica¸c˜ao dessas ocorrˆencias. Cada usu´ ario ser´a estimulado com sinais sonoros de frequˆencias distintas simultˆaneos, devendo focar sua aten¸c˜ao em determinado est´ımulo (previamente informado a ele). A an´alise ser´a em fun¸c˜ao da capacidade dos modelos obtidos em identificar corretamente o est´ımulo em que o volunt´ario focou a aten¸c˜ao.

Aten¸ca˜o seletiva ´e definida como a capacidade de focar em alguma atividade mental em detrimento de outras, representando a resistˆencia a est´ımulos distratores (Butler, 1983). Um caso cl´assico dessa situa¸c˜ ao foi definido por Cherry (1953) como Cocktail Party Effect, em que cada indiv´ıduo consegue focar sua aten¸c˜ ao apenas em determinado locutor em um ambiente que apresenta uma mistura de conversas e ru´ıdos de fundo. Esse fato ´e ilustrativo da limita¸c˜ ao do processamento paralelo do sistema nervoso. Estudos realizados anteriormente indicaram que a audi¸c˜ao seletiva humana produz uma altera¸ca˜o quantific´ avel na resposta ao est´ımulo focado (Hillyard et al., 1973). Essa resposta do sistema nervoso causada por est´ımulos sonoros ´e denominada Potencial Evocado Auditivo (PEA), podendo ser classificado em transit´ orio ou de regime permanente, variando de acordo com o tipo de est´ımulo aplicado. A aplica¸c˜ ao de um tom a taxas suficientemente elevadas, evitando a sobreposi¸c˜ao com a resposta de est´ımulos sonoros anteriores, gera as Respostas Auditivas de Regime Permanente (ASSR - Auditory Steady State Responses), possibilitando a grava¸c˜ ao de seus valores a partir do escalpo humano. Um sinal modulado em amplitude (AM), por exemplo, causa uma resposta em regime permanente, caracterizada por um aumento de energia na frequˆencia da moduladora no espectro de potˆencia do sinal registrado, sendo que o ouvido humano comporta-se como um demodulador AM (Galambos et al., 1981).

2 2.1

Metodologia

Estimula¸c˜ ao

Os est´ımulos sonoros apresentados aos volunt´arios consistem de um tom senoidal puro modulado em amplitude (tom AM), descrito de acordo com a Equa¸ca˜o 1, onde A ´e a amplitude do sinal, λ ´e a profundidade de modula¸c˜ao, fc e fm s˜ao as frequˆencias da onda portadora e moduladora, res-

2896

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

pectivamente. s(t) = A

2.3

Os dados dispon´ıveis foram separados em dois grupos: um para o treinamento e obten¸c˜ao dos parˆametros do modelo (10 volunt´arios ou 20 arquivos de dados) e outro para a valida¸c˜ao do modelo previamente obtido (4 volunt´arios ou 8 arquivos de dados), verificando a taxa de acertos obtida na classifica¸c˜ao da aten¸c˜ao. Antes de realizar o treinamento das redes de classifica¸c˜ao, os sinais coletados dos eletrodos precisam ser processados para remover ru´ıdos e otimizar a obten¸c˜ao dos parˆametros a serem utilizados na fase de classifica¸c˜ao. Inicialmente aplicouse um filtro rejeita-faixa para remover a componente espectral de 60 Hz da rede el´etrica (suas componentes harmˆonicas foram filtradas pelo filtro passa-faixa do BrainNet), que em geral apresentam elevado n´ıvel de potˆencia. Conforme discutido por Amabile et al. (2008), sinais coletados de eletroencefalogramas podem conter artefatos provenientes da movimenta¸c˜ao dos olhos, piscamento palpebral, movimenta¸c˜ao muscular e linha de base, os quais geralmente apresentam amplitude maior que a do pr´oprio sinal, acarretando em interpreta¸c˜oes errˆoneas dos sinais. A rejei¸c˜ao de artefatos objetiva remover trechos do sinal que contenham essas interferˆencias indesejadas. O m´etodo de rejei¸c˜ao adotado baseia-se no desvio padr˜ao de um segmento de referˆencia (preferencialmente que n˜ao contenha artefatos) com cerca de 20 segundos de dura¸ca˜o. O trecho analisado ser´a rejeitado se possuir mais de 5% de amostras cont´ınuas ou mais de 10% de quaisquer amostras coletadas excedendo o limiar de 3 desvios padr˜ao (a escolha desse limiar assegura a presen¸ca de 99,7% dos dados, assumindo uma distribui¸c˜ao normal para as amplitudes do EEG) (Infantosi et al., 2006). A elevada quantidade de dados coletados sugere a aplica¸c˜ao de algum m´etodo estat´ıstico para reduzir sua dimens˜ao, mantendo o m´aximo poss´ıvel da varia¸c˜ao observada no conjunto inicial. Essa etapa ´e especialmente importante para acelerar a classifica¸c˜ao online da aten¸c˜ao auditiva. Uma das t´ecnicas mais comumente utilizadas na redu¸c˜ao de dados em processos de reconhecimento de padr˜oes, e que ser´a utilizada nesse trabalho, ´e a An´alise de Componentes Principais (PCA - Principal Component Analysis). Seu objetivo ´e obter um conjunto de valores linearmente descorrelacionados e com a maior variˆancia poss´ıvel, sendo que as primeiras componentes s˜ao as mais significativas para representar a variˆ ancia observada nos dados originais, al´em de conter menos redundˆancia (Haykin, 1999). De fato, a utiliza¸c˜ao de apenas 5 componentes dos dados de treinamento ´e capaz de explicar cerca de 99% de sua variˆancia, conforme Figura 2,

1 sin(2πfc t)(1 + λsin(2πfm t)) (1) 1+λ

A profundidade de modula¸ca˜o foi fixada em 100% e intensidade sonora de 75,8dB. Para o ouvido esquerdo, adotou-se a frequˆencia da portadora em 500Hz e da moduladora em 32Hz; no ouvido direito, esses valores foram 2000Hz e 38Hz, respectivamente. De acordo com Felix et al. (2005), as frequˆencias das moduladoras foram ajustadas para a frequˆencia mais pr´ oxima que resulte em um n´ umero primo de ciclos em 1024 pontos, de forma a evitar o espalhamento espectral na detec¸c˜ao objetiva da ASSR, resultando em 31,132 e 39,356Hz. Inicialmente executa-se cada est´ımulo individualmente por 5s para instruir o volunt´ ario e facilitar o reconhecimento do som posteriormente, quando os dois sinais sonoros s˜ ao executados simultaneamente por 2 minutos. Os fones de ouvidos utilizados, al´em de representar o sistema de entrega de som, tamb´em selam completamente os ouvidos, atenuando os ru´ıdos em torno de 30 a 40dB. 2.2

Processamento dos dados

Aquisi¸c˜ ao dos dados

O estudo contou com a participa¸c˜ ao de 14 volunt´arios, resultando em um banco de dados composto por 28 arquivos (2 para cada volunt´ ario: estimula¸c˜ao no ouvido esquerdo e direito). Os dados foram coletados do eletroencefalograma seguindo o Sistema Internacional 10-20, que padroniza o posicionamento dos eletrodos no escalpo do volunt´ario, conforme ilustrado na Figura 1.

Figura 1: Sistema Internacional 10-20. A - vista lateral, B - vista superior. A coleta dos sinais foi realizada com o amplificador de sinais biol´ ogicos BrainNet BNT-36, com filtro passa-faixa entre 0,1 e 100Hz, frequˆencia de amostragem de 600Hz e referˆencia Oz em uma cabine acusticamente isolada. A etapa de ´ coleta foi aprovada pelo Comitˆe de Etica em Pesquisa com Seres Humanos da Universidade Federal de Vi¸cosa.

2897

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

sendo, por isso, uma boa aproxima¸c˜ ao na redu¸c˜ao da dimens˜ao dos dados no presente trabalho.

A MSC pode ser utilizada como um potencial detector de respostas a est´ımulos, desde que o est´ımulo em quest˜ao seja sempre o mesmo e a janela sincronizada com ele (S´a and Felix, 2002). Os valores cr´ıticos que representam os limiares para a detec¸c˜ao objetiva, a partir dos quais ´e poss´ıvel determinar se n˜ao existe resposta detectada, s˜ao dados pela Equa¸c˜ao 3, sendo α o n´ıvel de significˆancia do teste. A detec¸c˜ao ´e obtida a partir da rejei¸c˜ao da hip´otese nula (ausˆencia de resposta) quando os valores da coerˆencia excedem o valor cr´ıtico. 1 2 (3) γˆxy−crit = 1 − α M −1 Aplicando a magnitude quadr´atica de coerˆencia, Ranaudo et al. (2012) obteve taxas de acerto na ordem de 82% na determina¸c˜ao do ouvido em que o volunt´ario est´a focando sua aten¸c˜ao.

Figura 2: Variˆ ancia por componente principal. 2.5

Os dados obtidos pelo eletroencefalograma representam um s´erie temporal, que de acordo com Hefftner et al. (1988) podem ser aproximados por um modelo autorregressivo (AR) de ordem finita. Esse modelo corresponde a um filtro com entrada ru´ıdo branco de m´edia 0 e desvio padr˜ ao 1, sendo o valor atual do processo estimado a partir da soma ponderada dos p (ordem do modelo) valores passados. A ordem do modelo ´e relacionada ` a quantidade de informa¸c˜ ao necess´ aria para representar os dados coletados. Os coeficientes do modelo AR ser˜ao utilizados como a entrada para treinamento e do classificador da aten¸ca˜o auditiva. Nesse trabalho, o treinamento de cada tipo de classificador ser´ a realizado com v´ arias combina¸c˜oes da ordem de PCA e do modelo AR, de forma a obter o que produza melhores taxas de acerto. Todo o trabalho foi desenvolvido utilizando o R desde a coleta dos dados at´ software Matlab , e a classifica¸c˜ao dos potenciais evocados. 2.4

Redes neurais artificiais (RNA) s˜ao modelos matem´aticos inspirados no sistema nervoso central humano e animal, por´em de complexidade significativamente menor. Esses modelos s˜ao capazes de aprendizado e reconhecimento de padr˜oes, sendo melhor ajust´ aveis a fun¸c˜oes n˜ao-lineares. As unidades processadoras da rede neural, tamb´em chamadas de neurˆonios artificiais, est˜ao interconectados e trocam sinais entre si. Elas s˜ao capazes de realizar fun¸c˜oes coletivamente e em paralelo, ao inv´es de existir uma delimita¸ca˜o de subtarefas para cada unidade (Marques, 2001). A estrutura mais simples de uma rede neural ´e composta de 2 layers, com M entradas e N sa´ıdas. Cada uma das entradas ´e conectada a todas as sa´ıdas, sendo que cada uma dessas conex˜oes ´e associada a um peso, conforme Figura 3. Os valores de cada um desses pesos ´e adaptativo, representando parˆametros num´ericos que s˜ao ajustados atrav´es do algoritmo de aprendizado. Em geral, os pesos da rede neural s˜ao determinados de forma incremental `a medida que novos valores entrada-sa´ıda est˜ao dispon´ıveis; isso diminui o esfor¸co computacional, uma vez que n˜ao ´e necess´ario a presen¸ca de todo o conjunto de treinamento ao mesmo tempo (Yegnanarayana, 2009). Entre os diversos algoritmos dispon´ıveis para o ajustes dos pesos, utilizou-se o de LevenbergMarquardt (fun¸c˜ao trainlm do MATLAB) por ser geralmente o mais r´ apido e o mais indicado como primeira op¸c˜ao de teste. Al´em disso, adotou-se a rede neural com apenas uma camada oculta de neurˆonios. Ap´os a pondera¸ca˜o de todas as entradas pelos seus respectivos pesos, um combinador linear agrega todos esses valores para produzir um potencial de ativa¸c˜ao. Outro parˆ ametro da rede ´e o limiar de ativa¸c˜ao, que representa um patamar de compara¸ca˜o para gerar o valor de sa´ıda do neurˆonio; o potencial produzido pelo neurˆonio ser´a ex-

Magnitude quadr´ atica de coerˆencia

A magnitude quadr´ atica de coerˆencia (MSC Magnitude Squared Coherence) ´e uma t´ecnica para examinar a rela¸c˜ ao existente entre dois sinais. Seu valor ´e utilizado para indicar o grau de dependˆencia linear entre as componentes harmˆonicas do est´ımulo e a resposta obtida no eletroencefalograma; a estimativa da MSC entre dois sinais aleat´orios, discretos e de dura¸c˜ ao finita x[k] e y[k] (X e Y representam a Transformada de Fourier desses sinais, respectivamente) ´e dada conforme Equa¸ca˜o 2 (Dobie and Wilson, 1989).

2 γˆxy (f ) =

M 2 X ∗ Xi (f )Yi (f ) i=1

M X i=1

2

|Xi (f )|

M X

Rede Neural Artificial

(2) 2

|Yi (f )|

i=1

2898

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

Figura 3: Esquema b´ asico de rede neural artificial (adaptado de Silva et al. (2010)). Figura 4: Varia¸c˜ao da taxa de acerto da rede neural artificial. citat´orio ou inibit´ orio, em fun¸c˜ ao do valor da diferen¸ca entre a sa´ıda do combinador linear e o limiar de ativa¸c˜ao ser positivo ou negativo, respectivamente (Silva et al., 2010). Para garantir que a sa´ıda do neurˆ onio seja limitada, o potencial de ativa¸c˜ ao ´e aplicado a uma fun¸ca˜o de ativa¸c˜ ao, a qual faz com que a sa´ıda esteja limitada entre certos valores. Al´em disso, o uso de fun¸c˜ oes n˜ ao-lineares possibilita o uso de RNA para dados complexos. Para fun¸c˜ oes do tipo Heaviside, como a fun¸c˜ ao limiar, a linear por partes e a sigm´oide (a forma mais utilizada, apresentando um equil´ıbrio entre os comportamentos lineares e n˜ao-lineares), os valores de sa´ıda situamse entre 0 e 1, assumindo o valor 1 se o campo de tal neurˆonio ´e n˜ ao-negativo e 0 caso contr´ario. Caso seja necess´ ario, pode-se fazer a fun¸c˜ao de ativa¸c˜ao variar entre -1 e 1, assumindo uma forma antissim´etrica em rela¸c˜ ao ` a origem; s˜ ao exemplos desse tipo a fun¸c˜ ao sinal e a tangente hiperb´ olica (Haykin, 1999). Nesse trabalho, optou-se por utilizar a fun¸c˜ao sigm´ oide sim´etrica, atribuindo os valores 0 e 1 para a aten¸c˜ ao auditiva nos ouvidos direito e esquerdo, respectivamente. Com o objetivo de determinar a melhor combina¸ca˜o entre o n´ umero de componentes principais e a ordem do modelo AR (a qual foi estipulada em ser no m´aximo 10), verificou-se a taxa de acerto obtida pela rede neural com o conjunto dos dados de valida¸c˜ao, conforme representado na Figura 4. Fica evidente que o aumento na ordem do modelo AR e na quantidade de componentes principais utilizadas na obten¸c˜ ao da rede neural tende a aumentar a taxa de acertos, ` as custas da redu¸c˜ao da velocidade do processo de identifica¸c˜ao. Na gama de valores considerados, o modelo AR de ordem 8 e com 4 componentes principais resultou em uma taxa de acerto da ordem de 95%, valor significativamente elevado. 2.6

cimento de padr˜oes utilizado em dados que podem ser classificados em exatamente duas categorias (Cortes and Vapnik, 1995). Essa caracter´ıstica o torna apropriado para o problema analisado nesse trabalho, em que as duas categorias s˜ao representadas pela aten¸c˜ao nos ouvidos esquerdo e direito, respectivamente. A ideia central desse m´etodo ´e obter hiperplanos separando os pontos das duas classes distintas; o hiperplano que apresenta a maior distˆancia em rela¸c˜ao aos dados de treinamento ´e considerado o melhor, pois assume-se que a maior margem de separa¸c˜ao corresponde `a melhor generaliza¸c˜ao do classificador. Os dados mais pr´oximos do hiperplano ´otimo s˜ao denominados vetores de suporte, pois o caracterizam e s˜ao os mais informativos no processo de classifica¸c˜ao (Duda et al., 2001). A Figura 5 representa um caso gen´erico bidimensional da aplica¸c˜ao do SVM. Cada categoria ´e representada por c´ırculos brancos e cinzas, respectivamente, e cada ponto marcado com X corresponde a um vetor de suporte. O hiperplano ´otimo obtido com esses dados de treinamento ´e representado pela reta central.

Figura 5: Representa¸c˜ao b´asica da obten¸c˜ao do hiperplano ´otimo.

M´ aquinas de Vetores de Suporte

Em casos como o ilustrado, com vari´aveis linearmente separ´aveis, torna-se simples obter a fronteira de decis˜ao do m´etodo. Entretanto, dados

A M´aquina de Vetores de Suporte (SVM - Support Vector Machine) ´e um m´etodo de reconhe-

2899

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

pr´aticos geralmente n˜ ao apresentam essa caracter´ıstica, sendo necess´ ario transform´ a-los para outro espa¸co dimensional na tentativa de torn´ a-los mais espa¸cados e, consequentemente, separ´ aveis. Comumente utiliza-se uma fun¸c˜ ao Kernel para essa transforma¸c˜ao, uma vez que esta simplifica o c´alculo do produto interno (Wu and Wang, 2009). Para esses casos, Hsu et al. (2010) prop˜ oe utilizar a fun¸c˜ao de base radial gaussiana (RBF - Gaussian Radial Basis Function). A grande quantidade de dados provenientes dos eletrodos (mesmo ap´ os seu processamento com PCA e AR) torna invi´ avel sua visualiza¸c˜ ao para a an´alise de sua separabilidade. Por isso, inicialmente optou-se por utilizar a fun¸c˜ ao kernel linear R e verificar a eficiˆ (default do Matlab ) encia do m´etodo de classifica¸ca˜o assim obtido. Seguindo o mesmo procedimento para o treinamento da RNA, variou-se os valores do n´ umero de componentes principais e da ordem do modelo AR para obter a respectiva taxa de acerto, conforme ilustrado na Figura 6. O treinamento e classifica¸c˜ ao foram realizados a partir das fun¸c˜ oes svmtrain e svmclassify do MATLAB, respectivamente.

na se¸c˜ao anterior, apresentou-se a taxa de acertos m´axima obtida para cada um deles considerandose os potenciais obtidos dos eletrodos durante os 17 segundos iniciais de estimula¸c˜ao. Como essas taxas para RNA e SVM foram significativamente superiores daquela obtida pelo m´etodo da Magnitude Quadr´atica de Coerˆencia, apenas os dois primeiros ser˜ao analisados em maiores detalhes. Aplicando os mesmos dados na entrada dos modelos RNA e SVM, observou-se que em algumas situa¸c˜oes eles fornecem resultados contradit´orios; isto ´e, enquanto RNA indica que o volunt´ario focou sua aten¸c˜ao no ouvido esquerdo, SVM identifica o foco da aten¸c˜ao no ouvido direito, e vice-versa. Essa situa¸ca˜o ´e ilustrada na Figura 7. Analisando apenas os 17 segundos iniciais da estimula¸c˜ao, os dois m´etodos de classifica¸c˜ao foram condizentes em 71,43% dos volunt´ arios, sendo 67,86% classificados corretamente.

Figura 7: Taxa de volunt´arios com aten¸c˜ao seletiva classificada por RNA e SVM. Na tentativa de aumentar a taxa de classifica¸c˜ao, considerou-se maiores intervalos de tempo (m´aximo de 85 segundos). A Figura 7 deixa evidente que a coleta de dados por mais tempo provoca maior similaridade nos resultados obtidos independentemente pelos dois classificadores. Por exemplo, aos 85 segundos de coleta, apenas o teste de 1 indiv´ıduo n˜ao teve classifica¸c˜ao satisfat´oria pelos dois m´etodos. Entretanto, a taxa de acertos n˜ao acompanhou o crescimento do total de exames classificados. Percebe-se facilmente que, a partir dos 17 segundos, a classifica¸c˜ao de maior parte dos novos testes resultou em erros na identifica¸c˜ao da aten¸c˜ao auditiva. Acredita-se que isso n˜ao seja devido aos parˆametros do modelo; o fator que provavelmente mais contribuiu para as elevadas taxas de erro para longos tempo de coleta foi a falta de aten¸ca˜o do volunt´ ario. De fato, a concentra¸c˜ao em determinado est´ımulo ´e maior no in´ıcio do teste e tende a decair ao longo do tempo, sendo que para algumas pessoas a capacidade dessa concentra¸c˜ao inicial dura apenas poucos segundos.

Figura 6: Varia¸c˜ ao da taxa de acerto do Support Vector Machine. A utiliza¸c˜ ao de componentes principais mais elevadas e alta ordem do modelo AR tendem a aumentar a taxa de acertos obtida, apesar de verificar-se uma satura¸c˜ ao desse valor. Na gama de combina¸c˜oes testadas, o melhor resultado ´e obtido com 5 componentes principais e modelo AR de ordem 6, o qual foi capaz de classificar corretamente todos os est´ımulos do conjunto de valida¸c˜ao. Al´em disso, as elevadas taxas de acerto obtidas sugerem que a fun¸c˜ ao de ativa¸c˜ ao linear ´e adequada para esse estudo, n˜ao sendo necess´ario utilizar fun¸c˜ oes n˜ ao-lineares que aumentariam a complexidade do modelo. 3

Resultados e Discuss˜ ao

Durante a apresenta¸c˜ ao dos trˆes m´etodos de classifica¸c˜ao da aten¸c˜ ao seletiva utilizada nesse trabalho

2900

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

4

Conclus˜ oes

of auditory steady-state evoked responses in the inferior colliculus of rat using coherence, Journal of Neurosciece Methods 144(2): 249– 255.

Os resultados na valida¸c˜ ao dos trˆes modelos de classifica¸c˜ao discutidos representam altas taxas de acerto, muito superior ao que seria esperado de um processo aleat´ orio (50% para esquerda e 50% para direita). Isso evidencia que o treinamento para obten¸c˜ao dos parˆ ametros do modelo foi bem sucedido. Para aumentar a confiabilidade em rela¸c˜ao ao lado da aten¸ca˜o detectada, optou-se por considerar que a classifica¸c˜ ao foi realizada apenas se ambos os m´etodos RNA e SVM fornecerem o mesmo resultado. Nessa situa¸c˜ ao, a taxa de acertos para aproximadamente 1,5 minutos de coleta foi 78,86%, apesar de verificar-se que o aumento na dura¸ca˜o da coleta n˜ ao representa acr´escimos expressivos na taxa de acertos. Com a comprova¸c˜ ao da validade desses m´etodos na classifica¸c˜ ao da aten¸c˜ ao seletiva auditiva, ser´a vi´avel utilizar tais m´etodos para testes online, em que a detec¸c˜ ao do lado da aten¸c˜ ao ´e realizado ao mesmo tempo em que os dados s˜ ao coletados.

Galambos, R., Makeig, S. and Talmachoff, P. J. (1981). A 40-hz auditory potential recorded from the human scalp, Proceedings of the National Academy of Sciences of the United States of America 78: 2643–2647. Haykin, S. S. (1999). Neural Networks: A Comprehensive Foundation, 2nd edn, Prentice Hall. Hefftner, G., Zucchini, W. and Jaros, G. G. (1988). The electromyogram (EMG) as a control signal for functional neuromuscular stimulation - autoregressive modeling as a mean of EMG signature discrimination, Biomedical Engineering, IEEE Transactions 35: 230– 237. Hillyard, S., Hink, R., Schwent, V. and Picton, T. (1973). Electrical signs of selective attention in the human brain, Science 182: 177–180.

Agradecimentos

Hsu, C.-W., Chang, C.-C. and Lin, C.-J. (2010). A practical guide to support vector classification. Department of Computer Science, National Taiwan University, Taiwan.

Os autores agredecem ao CNPq pelo apoio financeiro, o que possibilitou o desenvolvimento desse trabalho.

Infantosi, A. F. C., Melges, D. B. and TierraCriollo, C. J. (2006). Use of magnitudesquared coherence to identify the maximum driving response band of the somatosensory evoked potential, Brazilian Journal of Medical and Biological Research 39: 1593–1603.

Referˆ encias Amabile, R. A. N., Miranda, R. A., Tierra-Criollo, C. J., Mendes, E. M. A., Pomp´eia, S. and Manzano, G. M. (2008). Remo¸c˜ ao autom´atica de artefatos em sinais de EEG usando Local SSA, XVII Congresso Brasileiro de Autom´ atica .

Lima, T. M. A., Crato, A. N., Mancini, P. C., oes, L. C. S. and Gon¸calves, D. U. (2009). Alterations in early auditory evoked potentials in multiple sclerosis patients, Revista Brasileira de Otorrinolaringologia 75.

Butler, K. G. (1983). Language processing: selective attention and mnemonic strategies, Park Press.

Marques, J. P. (2001). Pattern Recognition - Concepts, Methods and Applications, Springer.

Cherry, E. C. (1953). Some experiments on the recognition of speech, with one and with two ears, The Journal of the Acoustical Society of America 25: 975–979.

Ranaudo, F. S., S´a, A. M. F. L. M. and Felix, L. B. (2012). Magnitude quadr´atica de coerˆencia aplicada `a classifica¸c˜ao da aten¸c˜ao seletiva auditiva.

Cortes, C. and Vapnik, V. (1995). Support vector networks, Machine Learning 20: 273–297.

S´a, A. M. M. and Felix, L. B. (2002). Improving the detection of evoked responses to periodic stimulation by using multiple coherence application to EEG during phot stimulation, Medical, Engineering and Physics 24: 245– 252.

Dobie, R. A. and Wilson, M. J. (1989). Analysis of auditory evoked responses by magnitude squared coherence, Ear Hearing 10: 2–13. Duda, R. O., Hart, P. E. and Stork, D. G. (2001). Pattern Classification, 2nd edn, John Wiley & Sons.

Silva, I. N., Spatti, D. H. and Flauzino, R. A. (2010). Redes Neurais Artificiais para Engenharia e Ciˆencias Aplicadas - Curso Pr´ atico, Artliber.

Felix, L. B., Moraes, J. E., S´ a, A. M. M., Yehia, H. C. and Moraes, M. F. (2005). Avoiding spectral leakage in objective detection

2901

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

Wu, K.-P. and Wang, S.-D. (2009). Choosing the kernel parameters for support vector machines by the inter-cluster distance in the feature space, Pattern Recognition 42: 710–717. Yegnanarayana, B. (2009). Artificial Neural Networks, PHI Learning Pvt. Ltd.

2902

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.