Da Criação de Textos à Recuperação da Informação no Campo da Saúde: Aspectos Textuais, Lingüísticos e Culturais para a Estruturação de Documentos

June 29, 2017 | Autor: Joaquim Felipe | Categoria: Information Retrieval, Health information, Informing Science
Share Embed


Descrição do Produto

Da Criação de Textos à Recuperação da Informação no Campo da Saúde: Aspectos Textuais, Lingüísticos e Culturais para a Estruturação de Documentos Maria Cristiane Barbosa Galvão1, Paulo Mazzoncini de Azevedo Marques2, Joaquim Cezar Felipe1 1

Departamento de Física e Matemática (DFM) Faculdade de Filosofia Ciências e Letras de Ribeirão Preto (FFCLRP) Universidade de São Paulo (USP), Brasil 2

Centro de Ciências das Imagens e Física Médica (CCIFM) Faculdade de Medicina de Ribeirão Preto (FMRP) Universidade de São Paulo (USP), Brasil

Resumo – Tomando como referenciais teóricos estudos realizados pela ciência da informação, lingüística textual, ciência da terminologia e informática, este projeto tem por objetivo mapear e sistematizar as superestruturas das tipologias textuais mais freqüentes em áreas específicas do setor da saúde, pretendendo com isto aprimorar a análise e recuperação dos conteúdos informacionais contidos nestes textos e disponibilizar conhecimentos básicos para a gestão eletrônica dos documentos institucionais. A metodologia a ser empregada é de caráter qualitativo, enfocando os aspectos lingüísticos, cognitivos e culturais relacionados aos textos técnico-científicos, bem como à recuperação da informação.

Palavras chave: Criação da informação, Recuperação da Informação, Informação em saúde. Abstract Considering like reference the theoretical studies elaborated in the context of information science, textual linguistics, terminology and informatics, this project has like purpose to map and to systematize the textual superstructure plus common in specific areas of health sector for to increase the information creation, treatment and retrieval of texts and developing basics knowledge for digital documents management of health institutions. The methodology used is qualitative, observing cultural, cognitive and linguistics aspects of information retrieval and technical and scientific texts. Key-words: Information creation, Information retrieval, Health information.

Introdução Tomando como referenciais teóricos estudos realizados pela lingüística textual, ciência da terminologia, ciência da informação e informática, este projeto tem por objetivo mapear e sistematizar as superestruturas das tipologias textuais mais freqüentes empregadas em áreas específicas do setor da saúde, pretendendo com isto aprimorar a análise e recuperação dos conteúdos informacionais contidos nestes textos e disponibilizar conhecimentos de base para a estruturação e gestão eletrônica de documentos. Partimos do pressuposto de que não se deve propor a estruturação de documentos, sejam eles prontuários do paciente, laudos ou outros, sem se

pensar como estes documentos foram socialmente construídos e quais são as características que os tornam compreensíveis para uma dada comunidade técnico-científica. Muitas vezes o não refletir sobre tais características, levam os sistemas informatizados ao fracasso, seja pela sua não compreensão pelos usuários do sistema, seja porque os sistemas não refletem aspectos textuais, lingüísticos, culturais e comunicacionais importantes para os usuários. Agrega-se a isto, o fato de que sistemas de recuperação da informação, que almejem alto índice de precisão e baixo índice de revocação, devem, no contexto atual, pensar tal recuperação a partir do momento criativo da mensagem e de seu registro em um documento,

como já assinalado pelos estudos de metadados. É neste contexto que esta pesquisa se insere. Segundo Fávero e Koch [1], texto, em sentido amplo, designa toda comunicação realizada através de um sistema de signos. Em se tratando da linguagem verbal, no entanto, o texto consiste em qualquer passagem, falada ou escrita, que forma um todo significativo, independente de sua extensão. Trata-se, pois, de uma unidade de sentido, de um contínuo comunicativo contextual que se caracteriza pela coerência e coesão, conjunto de relações responsáveis pela tessitura do texto, e por elementos estruturadores que atuam como conectores além da fronteira da frase, ou de maneira retroativa, sobre a informação anterior do contexto já enunciado, ou de maneira projetiva, sobre a informação a ser veiculada no contexto subseqüente. Van DIJK [2] esclarece que os tipos de textos se diferenciam não apenas por suas diferentes funções comunicativas, por seus diferentes tipos de conteúdos e por suas diferentes funções sociais, mas também possuem diferentes tipos de construção. Dessa forma, os textos não apenas possuem uma estrutura semântica global, possuem também uma estrutura esquemática global, chamada de superestrutura. Uma estrutura esquemática consiste em uma série de categorias hierarquicamente ordenadas, muito similares às categorias de um esquema narrativo. Estas categorias possuem funções específicas relacionadas às respectivas macroproposições de um texto. Uma superestrutura esquemática é meramente uma estrutura formal, muito similar a sintaxe de uma oração. Ela é preenchida com o conteúdo da macroestrutura semântica. Por exemplo, em princípio, qualquer discurso jornalístico apresenta o mesmo esquema de notícias, mas o conteúdo global do texto é diferente em cada caso. Vale ressaltar que a comunicação se realiza mediante a utilização de gêneros textuais convencionados. Uma comunidade discursiva tem, desse modo: a) um conjunto de objetivos detectáveis; b) mecanismos de intercomunicação entre seus membros; c) um conjunto de propósitos que move os mecanismos participatórios; d) uma utilização seletiva e evoluinte desses mecanismos; e) um léxico específico em desenvolvimento; f) uma estrutura hierárquica explícita ou implícita que controla o processo de entrada na comunidade e a ascensão dentro dela. [3] Esclarece Kobashi [4] que a “superestrutura é um elemento fundamental para a compreensão dos textos porque: a) ela tem caráter convencional, sendo conhecida e reconhecida por uma

comunidade lingüística; b) a superestrutura configura-se como um esquema abstrato que estabelece a ordem global de um texto e se compõe de uma série de categorias, cujas possibilidades de combinação se baseiam em regras convencionais”. Van Dijk [2] afirma que existe um grande número de estruturas textuais globais que não são unicamente convencionais, mas sobretudo institucionais, e se baseiam em regras/normas de uma determinada instituição social, como a escola, uma empresa, a igreja, a comunidade e o Estado. Analisando a relação entre texto especializado e termo, Kocourek [5].explica que texto e termo são complementares, constituindo juntos a linguagem de especialidade. Os termos não são somente elementos do sistema, mas ocorrências em textos técnico-científicos. Além disso, nos textos manifestase a capacidade metalingüística definitória e redefinitória que permite uma delimitação semântica nova do termo. O texto é o lugar no qual se encontram as neologias, as co-ocorrências, os nomes próprios de pesquisadores, de organismos, de instrumentos, as abreviações, as unidades de medidas, os símbolos e as siglas. Mais recentemente, Gaudin [6] destaca as interações internas aos domínios técnico-científicos e destes com a sociedade. Afirma o autor que a pesquisa sobre linguagens de especialidade e textos especializados é inseparável de uma reflexão sobre o papel e funções econômicas, sociais, políticas das ciências. Refletir sobre os textos e escritores (cientistas, pesquisadores, jornalistas) é refletir sobre a relação entre um grupo e a comunidade. É colocar em questão o processo para obtenção do conhecimento. É refletir sobre as estratégias lingüísticas dos autores (por exemplo: nomear utilizando termos novos ou empregando termos já existentes; escolhas efetuadas para a comunicação com não-especialistas etc). Grosso modo, por mais que as pesquisas tenham avançado nas últimas décadas, o estudo sobre as tipologias e superestruturas textuais produzidas nos diferentes setores econômicos, técnicos e científicos é ainda insipiente e de certa forma genérico. A literatura parte da hipótese de que o contexto comunicativo e a comunidade que atua neste contexto geram textos que seguem tradições específicas, mas não prova isto de forma detalhada. Metodologia Segundo Faulstich [7], o estudo da linguagem de especialidade (composta pelos textos técnicocientíficos de uma dada comunidade e pela terminologia usada para construí-los) deve assumir posturas que o valide, tais como precisar as

condições de produção e de recepção do texto científico e técnico, identificando quem escreve, para quem escreve, com que finalidade, em que situação de fala e escrita o texto foi produzido, quais as condicionantes das variações lingüísticas ou mudanças dos termos. Assim, este projeto assumiu como etapas metodológicas: 1. Delimitação das instituições que serão objetos de estudo. Considerando que diferentes contextos institucionais podem elaborar diferentes superestruturas textuais [2], faz-se necessário identificar e caracterizar as instituições objetos de estudo; 2. Coleta de textos produzidos nestas instituições. Como não há estudos sobre quais são as tipologias textuais existentes e mais freqüentes em instituições de saúde, mapear-se-á, nesta etapa, os textos elaborados por elas; 3. Categorização dos tipos de texto encontrados. Textos aparentemente, diferentes, podem servir ao mesmo propósito e objetivo de comunicação. Dessa forma, categorizar-se-á os textos encontrados de acordo com seus conteúdos informacionais e objetivos comunicativos; 4. Seleção do corpus documental para análise. Após a categorização dos textos, de cada tipologia textual encontrada será analisada uma amostra qualitativa de textos; 5. Análise do corpus documental. Consiste em uma etapa de desconstrução dos textos selecionados para estudo, a fim de compreender, em profundidade, suas partes constituintes. Nesta análise, serão observados o eixo paradigmático e o eixo sintagmático priorizados na construção textual; 6. Descrição das superestruturas textuais. Consiste na fase de explicitação das superestruturas textuais encontradas e de suas partes e elementos constituintes; 7. Sistematização e testes para validação das superestruturas textuais. Consiste na etapa de comparação das superestruturas explicitadas com uma amostra dos documentos existentes. De forma complementar, pretende-se que a validação das superestruturas explicitadas seja realizada também pelos emissores/usuários do sistema. Assim a validação das superestruturas ocorrerá pela garantia literária (análise dos textos registrados) e

pela garantia de uso (análise dos usuários do sistema); 8. Revisão das superestruturas propostas, após testes.

textuais

Em se tratando de textos armazenados no formato digital, as etapas 4, 5, 6 e 7 deverão ser automatizadas ou semi-automatizadas computacionalmente. Resultados preliminares Priorizou-se como instituição de estudo o Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto (HCRP), da Universidade de São Paulo por se tratar de uma instituição com redes de informações complexas e expressivas, seja quantitativamente, seja qualitativamente. HCRP tem 850 leitos, contabilizando os leitos do campus e da unidade de emergência localizada no centro da cidade, atendendo, em média, por ano 33.973 pacientes internados e 588.000 pacientes de ambulatório. Em média são registrados anualmente 24.000 novos pacientes. Além dos números apresentados, o orçamento do HCRP para processamento de dados perfaz uma média anual de 1.300.000 reais. Em entrevista realizada com o Superintendente do HCRP, chegou-se à conclusão de que há uma necessidade de sistematização das informações daquela instituição, pois, de um lado, há conjuntos de informações que foram automatizados segundo perspectivas distintas, assim como, conjuntos de informações que ainda são tratadas manualmente. Durante a análise do HCRP, foram encontradas 263 diferentes superestruturas textuais, englobando-se aqui solicitações de exame, fichas cirúrgicas, fichas de evolução do paciente. Ou seja, uma quantidade muito grande de tipologias textuais. Comparativamente, podemos observar que os artigos científicos, em sua maioria, possuem a mesma superestrutura textual composta por: introdução, problema, hipótese, metodologia, descrição dos resultados e conclusão. Logo, 263 diferentes superestruturas textuais perfazem um número relativamente expressivo para estudo. Cabe observar que de cada tipologia textual pode prioriza em seu interior uma terminologia específica (ou seja, própria de uma especialidade e/ou reconhecida por um grupo de profissionais), ocorrendo ainda, em cada terminologia, variações terminológicas de acordo com as características sociolingüísticas do emissor da mensagem. Em decorrência desta constatação, optamos por estudar as superestruturas textuais produzidas no Centro de Ciências das Imagens e Física Médica (CCIFM) do HCRP – setor este que possui tradição

e pesquisa na informatização de sistemas, além de elaborar, em média, 120.000 exames de radiologia por ano. Observamos, então, que apenas relacionados à superestrutura de laudo de exames radiológicos, existem cerca de 660.000 textos prontos em formato digital, produzidos por residentes (em vários estágios de formação), sob a supervisão de docentes. Como pode ser observado na figura 1 e 2, o laudo de exame radiológico do CCIFM-HCRP contempla, em sua essência, a denominação da região do corpo humano analisada, o tipo de exame realizado, a descrição dos achados e a conclusão, que expressa o diagnóstico propriamente dito. Nota-se que esta tipologia textual apresenta uma mensagem com baixo nível de redundância, exigindo alta precisão terminológica a fim de que a mensagem seja apreendida, pelos seus leitores, sem ruídos. Além disso, a não adesão às categorias textuais que compõem esta superestrutura textual compromete o desempenho do sistema, sobretudo, se ele for baseado em indexação e recuperação em linguagem natural como é o caso do sistema do CCIFM-HCRP. Data do exame Nome da região Nome do exame Descrição do exame

Conclusão do laudo do exame

1/04/02 Quadril direito Fistulografia contrastada A grafia simples evidencia deformidade com achatamento da cabeça femural direita e alargamento do colo femural com áreas de esclerose em fêmur proximal e em acetábulo direito. Redução do espaço articular do quadril direito. Feito cateterização de orifício cutâneo em face medial da coxa direita, com progressão de aproximadamente 10cm do cateter em direção cranial e injetado contraste iodado, que evidenciou trajeto fistuloso até cabeça do fêmur onde se evidencia extensa loja. Osteomielite com fístula cutânea.

Figura 1 Superestrutura textual de laudo radiológico encontrada no CCIFM-HCRP: exemplo A

Data do exame Nome da região Nome do exame Descrição do exame

Conclusão do laudo do exame

04/05/05 Coxa direita Fistulografia contrastada Realizado exame com contraste iodado por orifícios fistulosos localizados em terço médio anteriormente e em extremidade distal da coxa, observando pertuito intra-ósseo com comunicação dos orifícios. Controle de osteomielite crônica.

Figura 2 Superestrutura textual de laudo radiológico encontrada no CCIFM-HCRP: exemplo B. Dito de outra forma, os laudos de exames radiológicos do CCIFM-HCRP, embora em formato digital, não podem ser adequadamente recuperados porque foram gerados empregando variações terminológicas e relações conceituais lógicas, ontológicas e lingüísticas não harmoniosas entre si. Esta situação gera alta revocação na recuperação da informação em decorrência de, por exemplo, polissemia, sinonímia e abreviações, bem como, siglas não padronizadas. Além dos aspectos terminológicos, observou-se que dos 660.000 laudos de exames radiológicos, apenas 3 empregaram adequadamente as categorias presentes na superestrutura proposta pelo sistema, fato que evidencia a não adesão dos emissores/usuários ao sistema. A partir dos dados mencionados, verificamos que cabe um estudo aprofundado da superestrutura do laudo de exame radiológico, a fim de melhor compreender as partes constituintes de sua superestrutura e das convenções textuais e terminológicas efetivamente empregadas pela comunidade. Discussão e conclusões Dada a complexidade da produção de documentos técnico-científicos no campo da saúde, a proposição de documentos estruturados e sua gestão eletrônica requerem um esforço multidisciplinar. Neste esforço, devem estar presentes não apenas os profissionais da informática, bem como, os profissionais da ciência da informação, da ciência da terminologia, da lingüística e os profissionais provenientes de diferentes campos técnico-científicos (medicina, enfermagem, assistência social, psicologia, farmácia, educação física, terapia ocupacional, entre

outras - que comporão e criarão os textos, assim como demandarão do sistema uma recuperação rápida e precisa da informação). Esta complexidade exige também uma quantidade expressiva de pesquisas que devem ser incentivadas internamente em cada instituição, e viabilizadas por políticas públicas que promovam a organização da informação no campo da saúde a fim de incrementar a recuperação rápida e precisa da informação, bem como a produção de conhecimentos científicos. Informações não sistematizadas nada acrescentam ao corpus de conhecimento de uma área e não podem ser tomadas como base para decisão [8]. Igualmente, pesquisas individuais ou pontuais pouco colaboraram para avanços expressivos no setor da saúde. Precisamos de alguns esforços concentrados em pesquisas de base. Considerando a massa documental disponível, no campo da saúde, seja em suporte material seja em meio digital, os esforços da gestão da informação devem ser não apenas projetivos (considerar a criação da informação do presente para o futuro), mas devem ser também retroativos (ou seja, devem se atentar para a organização e recuperação da informação já existente e armazenada). Neste contexto, o conhecimento das superestruturas textuais, assim como dos fenômenos terminológicos poderão trazer subsídios científicos relevantes. No que tange a documentação já existente e disponível em suporte eletrônico, o conhecimento sobre as superestruturas textuais e sobre os sintagmas nominais mais freqüentes em cada campo ou subcampo técnico-científico poderão constituir importante subsídio para a indexação automática. Observamos ainda alguns pontos que devem ser priorizados quando da estruturação de documentos no campo da saúde, apresentados a seguir. Antes da estruturação é preciso observar as convenções textuais historicamente construídas, sendo que dever haver alguma semelhança conceitual entre o documento estruturado e a superestrutura textual já reconhecida pela comunidade técnico-científica [9]. Por mais terminologias que estejam disponíveis e acessíveis no campo da saúde [10], é imprescindível conhecer as terminologias efetivamente empregadas em cada instituição de saúde, pois é a partir desde conhecimento que podem ser estabelecidas políticas de indexação mais condizentes a cada contexto, além de serem por meio destas terminologias que se dá o acesso físico e, sobretudo, cognitivo à informação. O estudo terminológico sistemático das linguagens empregadas nas instituições forma a base para a organização da informação, além de

garantir melhores índices de precisão durante a recuperação. Para finalizar, qualquer mudança nos sistemas de informação forçará as pessoas a se comportarem de forma diferente, modificando suas habilidades e suas convenções culturais. Por mais afinco com que o pessoal de sistemas ou a alta gerência de uma instituição confirmem os benefícios a serem obtidos com um sistema automatizado, este não será aceito de forma rápida. Muitas vezes o fato de estarmos acostumados a produzir informações de uma forma, leva-nos a não querer mudanças, nem tampouco uma nova tecnologia. Além disso, um novo sistema de informação pode demandar que informações sejam compartilhadas entre grupos, e é muito possível que estes grupos não tenham uma confiança mútua para que isto aconteça [11]. Portanto, apesar da globalidade do mundo em que vivemos, as informações são produzidas e acessadas por seres humanos com uma cultura e um perfil social, lingüístico e cognitivo. A estruturação de documentos deve partir desta abordagem para que consiga adesão dos usuários. Referências [1] Fávero, L.L.; Kock, I.G.V. Lingüística textual: introdução. São Paulo : Cortez, 1983. [2] Van Dijk, T A. La ciencia del texto. 5.ed. Barcelona : Paidós, 1997. [3] Bonini, A. Reflexões em torno de um conceito psicolingüístico de tipo de texto. Delta, v.5, n.2, 1999. Disponível em: . [4] Kobashi, N.Y. A elaboração de informações documentárias. São Paulo: CBD/ECA/USP, 1994. [5] Kocourek, R. Textes et termes. Meta, v.36, n.1, p.71-76,1991. [6] Gaudin, F. Socioterminologie. Bruxelles : De Boeck & Larcier, 2003. [7] Faulstich, E. Socioterminologia. Ciência da Informação, Brasília, v.24, n.3, p.281-298, set./dez. 1995. [8] Massad, E. Rocha, A.F. da. A construção do conhecimento médico. In: __, Marin, H.F., Azevedo Neto, R. (ed.) O prontuário eletrônico do paciente na assistência, informação e conhecimento médico. São Paulo : USP, OPAS, 2003.

[9] Wilson, R. Landoni, M. EBONI eletronic textbook design guidelines. [s.l.] : University of Strathclyde, 2002. [10] Amaral, M. B. do. Padrões de registro e transmissão de dados em saúde. In: Massad, E., Marin, H.F., Azevedo Neto, R. (ed.) O prontuário eletrônico do paciente na assistência, informação e conhecimento médico. São Paulo : USP, OPAS, 2003. [11] OPAS. Registros médicos electronicos para tres paises de centroamerica. Washington : OPAS, 1997.

Contatos Profa.Dra. Maria Cristiane Barbosa Galvão Prof. Dr. Joaquim Cezar Felipe Universidade de São Paulo Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto Departamento de Física e Matemática Av Bandeirantes 3900 - Bloco P1 - 14040-901 Ribeirão Preto - SP – Brasil E-mail: [email protected] E-mail: [email protected]

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.