Apresentação de método para contrução de portal de busca de conteúdos web em saúde

June 29, 2017 | Autor: Domingos Alves | Categoria: Pattern Recognition, Information Storage and Retrieval
Share Embed


Descrição do Produto

Apresentação de Método para Construção de Portal de Busca de Conteúdos Web em Saúde Felipe Mancini1, Alex Esteves Jaccoud Falcão1, Anderson Diniz Hummel1, Thiago Martini Costa1, Fabio Oliveira Teixeira1, Fabrício Alves Barbosa da Silva2, Domingo Alves3, Ivan Torres Pisa4 1

Programa de Pós-graduação em Informática em Saúde, Universidade Federal de São Paulo (UNIFESP) 2 Departamento de Informática, Universidade de Lisboa, Portugal 3 Departamento de Medicina Social, Faculdade de Medicina de Ribeirão Preto (FMRP), Universidade de São Paulo (USP) 4 Departamento de Informática em Saúde, UNIFESP

Resumo - O crescimento de informações disponíveis na web é inexorável, o que possibilita que seus usuários busquem cada vez mais informações sobre saúde na web. Este ambiente implica em um maior controle quanto adequações e a relevância das informações publicadas na área de saúde. O foco deste trabalho é apresentar um método para construção de um portal brasileiro específico para busca de conteúdos em saúde na web com foco no cidadão. O principal objetivo deste portal é possibilitar melhor orientação quanto à busca de conteúdos em saúde, a partir do uso de mineração web na filtragem de páginas web com conteúdos adequados em saúde, e na utilização de inferências, como a aplicação de sistemas de apoio à decisão, na recuperação de conteúdos paralelos a busca solicitada. Espera-se que o desenvolvimento deste portal melhor ajude o cidadão na pesquisa de conteúdos em saúde na web. Palavras-chave: Internet, recuperação da informação, reconhecimento automatizado de padrão. Abstract - The increase in the amount of available information on the worldwide web is inexorable, which, on one hand, provides the web user with more information. On the other hand, however, web searches become increasingly more difficult to handle due to the increasing number of retrieved documents. The present study is a proposal of development for a Brazilian search portal specific for health-related content. The aim of such development is to provide web users, mainly the non-specialist ones, with the largest number possible of web pages relevant to their search terms and inferred search intentions. The proposed search portal integrates web mining-based filters and a decision-making support tool. We hope that the portal development can help the web user with searching in the medical field. Keywords: Internet, information storage and retrieval, pattern recognition system. Introdução O crescimento do conteúdo na web é um fato inexorável, e junto com este crescimento surgem também tendências que impulsionam o desenvolvimento econômico mundial. Especificamente, a área da saúde se apresenta tanto como grande geradora de informação como uma vasta área para recuperação e qualificação de informação proveniente da web. No Brasil, cerca de 30% das buscas realizadas na web estão relacionadas a recuperação de informação sobre saúde e doenças [1]. Porém, adequações e a qualidade das informações disponíveis são dois pontos relevantes a serem levantados quanto a publicação de conteúdos da área de saúde na web. Diversos critérios para avaliação da qualidade e adequação surgiram desde 1997 [2], como o código Health On Net Foundation (HON)

[3] e os critérios para avaliação de qualidade do Health Information Technology Institute (HIN) [4]. Estas entidades certificadoras têm o intuito de garantir a qualidade e veracidade de parte das informações de saúde publicadas na web. Porém, a heurística de pesquisa das principais ferramentas de buscas da web não privilegia websites certificados. Em um estudo realizado por Chang et al. [5], a partir de um termo médico pesquisado na web, a primeira referência certificada HON foi localizada como o 763° website recuperado. Esta falta de adequação dos buscadores comerciais na recuperação de websites em saúde certificados desencadeia ao desuso destas ferramentas por parte do usuário de internet. Um estudo realizado no Brasil mostra que quando é necessário buscar informação sobre saúde na web, o usuário final privilegia sites especializados em saúde (83% dos acessos). Em segundo lugar

estes recorrem aos buscadores comerciais com 17% das solicitações de busca [6]. Tendo em vista os pontos discutidos acima, é de extrema necessidade o desenvolvimento uma ferramenta de busca em saúde que oriente coerentemente o cidadão. Esta necessidade é enfatizada em pesquisas que apontam que cerca de 60% dos usuários que utilizam a internet nos EUA confiam plenamente nos conteúdos em saúde disponíveis na web [7], e que este número sobe para 90% quando a pesquisa é aplicada a usuários brasileiros [6]. Desta maneira, o objeto deste trabalho é mostrar um método para o desenvolvimento de um portal brasileiro de busca e recuperação de conteúdo web em saúde com foco no cidadão, e alguns resultados preliminares de sua implementação. Método A arquitetura deste portal de busca, chamada de In Health Search Model (InHealth), seguirá fundamentos de arquitetura baseada em serviço (SOA) [8], de maneira que todos os módulos a serem incorporados para seu funcionamento deverão seguir padrões de interoperação baseados em serviços web [9]. O InHealth contemplará três módulos principais: indexador, chamado IndHealth, módulos de inferência, chamado InfHealth, e camada de interface gráfica com o usuário (grahfical user interface, GUI), chamada IntHealth. A Figura 1 apresenta um esboço da interação destes módulos dentro da arquitetura do InHealth.

Conforme apresentado na Figura 1, o termo solicitado para pesquisa é chamado pelo serviço web InfHealth. Este realiza um préprocessamento, sendo solicitado diferentes termos de busca ao serviço web IndHealth. Este retorna sites adequados e relevantes ao IntHealth. As sessões abaixo realizam uma descrição dos módulos IndHealth, InfHealth e IntHealth. Módulo IndHealth O portal de busca utilizará sistemas de metabusca para recuperação de websites. Sistemas de busca de bases heterogêneas denominados meta-buscadores não possuem base de dados própria; eles realizam a pesquisa simultaneamente em mais de um sistema de busca convencional [10]. Neste trabalho propõe© se utilizar o Google™ e Yahho como sistemas de busca. Este sistema de meta-busca é acoplado ao IndHealth. Este módulo é o núcleo do sistema de recuperação do InHealth, o qual realiza uma indexação de conteúdos a partir da aplicação de mineração de conteúdo na web [11]. A mineração de conteúdo na web é um processo que extrai conhecimento da web, analisando o conteúdo dos seus documentos. Diversas técnicas podem ser aplicadas a mineração de conteúdo na web, podendo listar a recuperação de informação [12] e as redes neurais artificiais (RNA) [13]. A partir da aplicação do web content mining, o módulo de indexação utilizará dois filtros: OHealth Filter (Only Health Filter) e o SuiHealth (Suitability Health Filter). Estes filtros são implementados usando as linguagens de programação Perl [14], Java [15] e banco de dados MySQL [16].

Páginas IndHealth

Termos InfHealth

Nova busca?

Filtro OHealth

Figura 1 - Interação entre módulos do InHealth Search Model

O objetivo OHealth Filter filtro é permitir apenas o retorno de páginas em saúde a partir de um termo buscado. O desenvolvimento deste tipo de filtro torna-se importante devido a falta de especificidade das páginas web retornadas, sites comerciais e propagandas de produtos que deixam incomodados usuários que buscam temas da área de saúde [17]. O princípio básico do funcionamento deste filtro é permitir a identificação automática do grau de similaridade de uma dada página com um dicionário ou descritor da área da saúde – como exemplo o DeCS [18] para o idioma português, ou o MeSH [19] para idomas em inglês. Como hipótese para este filtro, temos que páginas com conteúdo em saúde apresentem maior grau de similaridade se comparado a páginas com conteúdos não-saúde.

Filtro SuiHealth Tang e Ng [20] mostram que a estratégia de utilizar buscador de propósito geral, como o Google, para recuperação de páginas da área de saúde para auxiliar o diagnóstico e entendimento de doenças não é efetiva, devido à baixa relevância das páginas para o contexto. Corroborando com esses resultados Abraham e Reddy [21] criticam a adequação e relevância tanto de buscadores de propósito geral quanto de buscadores específicos na recuperação de páginas para esta área. Para isto, o foco do SuiHealth é retornar conteúdo adequado e relevante em saúde na web, a partir de um termo pesquisado. O desenvolvimento deste filtro é decorrente da pesquisa de Falcão que tem como um dos propósitos utilizar mídia social [22] a fim de determinar conjuntos de termos e ranking automático de conteúdos adequados e relevantes em saúde na web. A ferramenta de mídia social para avaliação de websites em saúde proposta por Falcão [23] está disponível em http://telemedicina6.unifesp.br/healthrank.

usabilidade desta GUI será determinada seguindo as heurísticas de usabilidade de Jakob Nielsen [29]. A Figura 2 com uma tela capturada do sistema, disponível em http://telemedicina6.unifesp.br/healthsearch, mostra a GUI proposta para este portal de busca. Em (a) é mostrado a interface inicial de busca deste portal com apenas um campo que permite o usuário inserir o termo em saúde a ser buscado. Em (b) é mostrado a resposta de cada item do InfHealth, encapsulados em três diferentes caixas propostas por Mini Ajax. O diferencial no uso do Mini Ajax é que este framework possibilita que cada inferência proposta pelo InfHealth tenha seu processamento assíncrono.

Módulo InfHealth Dado um termo a ser pesquisado, o papel deste módulo é realizar inferências dentro de um contexto de auxílio ao usuário na recuperação de websites em saúde. Dentre as inferências propostas, destacamos o uso de sistemas de apoio a decisão (SAD) [24]. Após o usuário informar o termo a ser pesquisado, este é apresentado como dados de sinais e sintomas ao SAD. O SAD torna-se responsável em informar os possíveis diagnósticos atrelados. Em mãos dos diagnósticos, este é repassado como termo de pesquisa ao IndHealth que fica responsável em retornar os websites ao IntHealth. O Lepidus [25] é um SAD voltado a clinica geral que apresenta cerca de 84% de taxa de acerto no diagnóstico. Este SAD pode ser um componente aplicado ao IntHealth. Outros componentes de inferência podem ser aplicado ao IntHealth como busca de conteúdos áudio-visual e imagens, temas atrelados e grupos de discussão e artigos científicos disponíveis em Biblioteca Virtual em Saúde [26]. Para a implementação deste componente, é utilizada a linguagem de programação PHP, Java e o banco de dados MySQL. Módulo IntHealth Para o desenvolvimento da GUI deste portal de busca propõe-se utilizar as linguagens Ajax [27] e PHP, e o framework Mini Ajax [28]. O design e

(a)

(b) Figura 2 - GUI proposta para o portal de busca de conteúdos web em saúde. Resultados É fato que usuário da internet utiliza a rede mundial a fim de buscar informações sobre saúde. O foco deste projeto é melhorar a busca de websites em saúde, tendo em vista que a heurística de busca das ferramentas atuais não privilegia a recuperação de websites em saúde adequados e relevantes. Desta maneira, a tentativa em utilizar filtros que melhorem a recuperação de websites relevantes e adequados em saúde, como um dos resultados esperados para este trabalho, torna-se fundamental para o

processo de busca de informações em saúde na internet. Além disto, outro problema implícito ao processo de busca na Internet é o desconhecimento ou falta de critério do usuário para recuperar websites em saúde [17]. Alguns estudos utilizaram sistemas que auxiliam ao processo de pesquisa, conforme relatado por [30]. Porém, a presença de um processo estratificado de busca reflete para uma desmotivação por parte do usuário em recuperar websites na web. Desta maneira, a partir da utilização de um SAD e filtros que informem páginas similares ou próximas a partir de um termo buscado, como um outro resultado esperado para este trabalho, é fundamental e de grande valia para o processo de busca de websites em saúde.

[11] Kosala, R., & Blockeel, H. Web Mining Research: a Survey. ACM SIGKDD Exploration 2000 1:1-15.

Referências

[16] MySQL. 01 jan 2008 [acesso 09 jul 2008]; Disponível em: http://www.mysql.com.

[1] CETIC. TIC Domicílios e usuários 2007. 01 fev 2007 [acesso 07 jul de 2008]; Disponível em: http://www.cetic.br/usuarios/tic/2007/rel-int10.htm. [2] Lopes, I. New paradigms for evaluation of the information quality health retrieved on the web. Cie da Inform 2004, 1:81-90. [3] HON. 07 jan 2008 [acesso 10 de jul de 2008]; Disponível em: http://www.hon.ch. [4] HITI. 12 jun 2000. [acesso 22 fev 2008]; Disponível em: http://hitiweb.mitretek.org/docs. [5] Chang, P., Hou, I., Hsu, C., & HF, L. Are Google or Yahoo a good portal for getting quality healthcare web information. AMIA Annu Symp Proc, 2006 1: p. 878. [6] Silva, WM. Navegar é preciso: Avaliação de impactos do uso da internet na relação médicopaciente. Tese de Mestrado – Universidade de São Paulo, 2006. [7] The Harris Poll. Harris Poll Shows Number of "Cyberchondriacs" – Adults Who Have Ever Gone Online for Health Information. 31 jul 2008 [acesso 11 jul 2008]; Disponível em: http://www.harrisinteractive.com/harris_poll/index. asp?PID=792. [8] Erl, T. SOA Principles of Service Design. Prentice Hall: New York; 2007. [9] Papazoglou, M. Web Services: Principles and Technology. Prentice Hall: New York; 2007. [10] Dunford II, T. Advanced Search Engine Optimization: A Logical Approach. Maui: American Creations of Maui, 2007.

[12] Hersh, W. Information Retrieval : a Health and Biomedical Perspective. New York: Springer; 2003. [13] Haykin, S. Neural Comprehensive Foundation. Prentice-Hall; 1999.

Networks: a New Jersey:

[14] Perl. 01 jan 2008 [acesso 08 de jul de 2008]; disponível em: http://www.perl.org/about.html. [15] Java. 01 de jul de 2008 [acesso 11 jul 2008; Disponível em: http://java.sun.com.

[17] Toms, E., & Latter, C. How consumers search for health information. H Inf Jour 2000 1:213-223. [18] DeCS. DeCS - Descritores em Ciências da Saúde. 01 jan 2008 [acesso 07 jul 2008]; Disponível em: http://decs.bvs.br/I/homepagei.htm. [19] MeSH. 04 jan 2008 [acesso 14 jul 2008, disponível em MeSH: http://www.nlm.nih.gov/mesh. [20] Tang, H., & NG, J. Googling for a diagnosis— use of Google as a diagnostic aid: internet based study. Brit M J , 1:1143-1145. [21] Abraham, J., & Reddy, M. Quality of Healthcare Websites: A Comparison of a GeneralPurpose vs. Domain-Specific Search Engine. AMIA Symp Proc 2006, 1:858. [22] O'Reilly, T. (30 de 09 de 2005). What Is Web 2.0: Design Patterns and Business Models for the Next Generation of Software. Acesso em 10 de 07 de 2008, disponível em http://www.oreillynet.com/pub/a/oreilly/tim/news/2 005/09/30/ what-is-web-20.html. [23] Falcão AEJ. HealthRank: Construção e Avaliação de um Software para Medir Adequação à Códigos de Ética e Relevância de Websites em Saúde. Tese de Mestrado em andamento – Universidade Federal de São Paulo, 2008. [24] Musen, M., Shahar, Y., & Shortliffe, E. Clinical Decision-Support Systems. New York: Springer-Verlag; 2006. [25] Silva, R., & Roque, A. Clinical medical diagnosis using a signal-processing approach.

Conf Mat Eng Techn Med Bio. Las Vegas: CSREA Press; 2000. p.13-18. [26] Bireme. 01 jan 2008) [acesso 11 jul 2008]; disponível em: http://www.bireme.br/php/index.php?lang=en. [27] Ajax. 01 jan 2008) [acesso 11 jul 2008]; disponível em: http://www.w3schools.com/Ajax. [28] MiniAjax. (01 de 01 de 2008). MiniAjax. Acesso em 11 de 07 de 2008, disponível em MiniAjax: http://miniajax.com. [29] Nilsen J. Ten Usability Heuristics. J. 01 jan 2005 [acesso 11 jul 2008]; Disponível em: http://www.useit.com/papers/heuristic/heuristic_lis t.html. [30] Zeng, Q., Crowell, J., Plovnick, R., Kim, E., Ngo, L., & Dibble, E. Assisting consumer health information retrieval with query recommendations. J Am Med Inform Assoc 2006 1: pp. 80–90.

Contato Felipe Mancini ([email protected]) é aluno de doutorado do Programa de Pós-graduação em Informática em Saúde do Departamento de Informática em Saúde (DIS), Universidade Federal de São Paulo (UNIFESP). Correspondências diretas ou para seu orientador, Prof. Dr. Ivan Torres Pisa ([email protected]), podem ser encaminhadas para Rua Botucatu 862, Vila Clementino, 04032-062, São Paulo, SP. Os telefones são (11) 5574-5659 / 5574-0158. Os demais autores podem ser contatados a partir destes e-mails: [email protected], [email protected], [email protected], [email protected], fabrí[email protected], [email protected], [email protected].

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.