ORGANIZAÇÃO E REPRESENTAÇÃO DO CONHECIMENTO EM TESAUROS: USO DO SISTEMA E-TERMOS ORGANIZATION AND REPRESENTATION OF KNOWLEDGE IN THESAURUS: USING E-TERMOS SYSTEM

Share Embed


Descrição do Produto

EIXO TEMÁTICO: Organização e Representação da Informação e do Conhecimento

ORGANIZAÇÃO E REPRESENTAÇÃO DO CONHECIMENTO EM TESAUROS: USO DO SISTEMA E-TERMOS ORGANIZATION AND REPRESENTATION OF KNOWLEDGE IN THESAURUS: USING E-TERMOS SYSTEM Filipi Miranda Soares - [email protected] Benildes Coura Moreira dos Santos Maculan - [email protected] Resumo: O conceito mais amplo de organização do conhecimento engloba os processos intelectuais que operam em nível conceitual para a construção de um sistema de organização do conhecimento (SOC), incluindo os tesauros terminológicos. Apresenta-se o sistema eTermos, que é um ambiente web para o desenvolvimento e gestão de produtos terminológicos. Esse software é analisado tendo como base um conjunto de critérios para avaliação de softwares para construção de tesauros. Conclui-se que o sistema e-Termos é adequado para cumprir as metodologias para o desenvolvimento de tesauros, ainda que não haja restrições específicas estabelecidas a priori. Considera-se que ele possui características positivas, que, em geral, atendem aos critérios de avaliação analisados. Palavras-chave: Sistema e-Termos. Tesauro. Software para construção de tesauros. Abstract: The broader concept of knowledge organization encompasses the intellectual processes that operate at a conceptual level for the construction of a knowledge organization system (KOS), including terminological thesauri. Shows the system e-Termos, which is a web environment for the development and management of terminological products. This software is analyzed based on a set of criteria for evaluating software for building thesauri. We conclude that the system e-Termos is adequate to build a thesauri following the methodologies for the development of thesauri, although there are no specific restrictions established a priori. It is considered that it has positive characteristics, which generally meet the evaluation criteria analyzed. Keywords: e-Termos System. Thesauri. Software for building thesauri.

1 INTRODUÇÃO Inútil querer me classificar: eu simplesmente escapulo não deixando, gênero não me pega mais. Estou num estado muito novo e verdadeiro, curioso de si mesmo, tão atraente e pessoal a ponto de não poder pintá-lo ou escrevê-lo.1

A ciência existe, ou se impõe como ciência, na medida em que consegue

1 LISPECTOR,

Clarice. Água viva: ficção. Rio de Janeiro: Rocco, 1998. p. 13.

1109

solidificar seus conceitos, isto é, quando se torna capaz de criar uma matriz definicional de si mesma (BENVENISTE, 1999, p. 249). Dada a importância dos conceitos para consolidação de uma ciência, torna-se indispensável a definição dos mesmos, os quais serão a base para o desenvolvimento das linguagens comunicativas. É sabido que a dinamicidade do saber científico dificulta a sua apreensão pela sociedade. Nessa perspectiva, conhecer exige que os saberes desenvolvidos pela ciência sejam registrados e que possam ser representados em linguagens de comunicação, de forma que seja possível recuperar tal conhecimento e aplicá-lo de forma útil. Para que haja eficácia no uso do conhecimento acumulado é necessário que essa linguagem comunicativa seja construída a partir de um objetivo de organização. Esse processo pode ser realizado por meio de agrupamentos (pelas semelhanças e diferenças), seja utilizando recortes, classificações ou segmentações, de forma a evidenciar os conceitos que representam tal conhecimento e as relações que são estabelecidos entre eles. Nesse sentido, no processo de representação do conhecimento é importante a definição do contexto, delimitando-se o domínio. Ademais, a representação (os signos) utilizada deve ser significativa para esse contexto, culturalmente construída e aceita em uma comunidade de especialidade (FURGERI, 2006). No âmbito da Biblioteconomia e da Ciência da Informação, pode-se considerar os sistemas de organização do conhecimento (SOCs), tais como tesauros e ontologias, como linguagens comunicativas. Essas linguagens são sistemas criados como modelos de representação do conhecimento de um dado domínio, possuindo maior grau de complexidade. Elas são capazes de fazer o controle terminológico e de minimizar a ambiguidade existente em qualquer domínio e melhorar a imprecisão da comunicação especializada. O desenvolvimento de SOCs é uma tarefa complexa, que pode ser auxiliado por diferentes softwares. Neste trabalho, apresenta-se o sistema e-Termos, que é um software gratuito de apoio à construção de diferentes tipos de produtos terminológicos, inclusive de tesauros. A sistematização da construção dessas linguagens exige adotar princípios e critérios de organização e representação do conhecimento. Logo, mostrase necessário definir os termos organização e representação do conhecimento, tomados como base teórica para o desenvolvimento deste trabalho.

1110

2 ORGANIZAÇÃO E REPRESENTAÇÃO DO CONHECIMENTO Os conceitos de organização e representação do conhecimento tendem a apresentarem-se juntos na literatura biblioteconômica devido à complementaridade semântica de um em relação ao outro. Entretanto, para entender a origem dos conceitos é necessário conhecer a estrutura lexical que os compõem. A definição vocabular de “organização”, descontextualizada, extraída de uma obra de referência não especializada (um dicionário de idioma) pode ser apresentada das seguintes formas: (1) ato ou efeito de organizar; (2) preparação, planeamento; (3) disposição, ordenação, estrutura; (4) constituição, composição; (5) instituição, corporação, organismo; (6) disposição que permite uso ou funcionamento eficiente, ordem; (7) relação de coordenação e coerência entre os diversos elementos que formam um todo. (DICIONÁRIO DA LÍNGUA PORTUGUESA, 2016, online).

Pode-se afirmar que todas as definições apresentadas pelo dicionário linguístico são apropriadas à definição de organização que aqui se deseja trabalhar. A organização, então, pode ser definida como o ato de organizar de maneira planejada, de estruturar “coisas” e dispô-las de forma coerente e coordenada, para permitir o uso eficiente dessas “coisas”. Aqui, analisadas sob a aura das teorias da Biblioteconomia e da Ciência da Informação (CI), essas “coisas” tomam forma e são definidas como o conhecimento sobre as “coisas”. Logo, os atos e efeitos de organizar o conhecimento, e suas implicações para o usuário, envolvem o conceito mais amplo de organização do conhecimento, que é complexo e cuja discussão deve ultrapassar o sentido lexical da palavra. O conceito mais amplo de organização do conhecimento, esclarecido por teorias da Biblioteconomia e da CI, refere-se a uma série de processos intelectuais complexos que operam em nível conceitual, que “visa[m] à construção de modelos de mundo que se constituem em abstrações da realidade” (BRASCHER; CAFÉ, 2008, p. 6). Isso envolve, segundo Dahlberg (2006), representações do conhecimento em diferentes níveis de complexidade: (a) elementos de conhecimento, por meio dos quais entendemos as características de conceitos que podem ser obtidos com a predicação de suas propriedades ou fazendo declarações sobre seus referentes; (b) unidades de conhecimento, que equivalemos aos conceitos. Elas são a síntese das características do conceito, obtidas pelas referidas declarações sobre um referente e são representadas por um signo (palavra, nome, termo, código); (c) unidades de conhecimento ampliado, que são a combinação de conceitos, por exemplo, em

1111

declarações ou em definições ou apenas em textos; e (d) sistemas de conhecimento, que são entidades compostas de unidades de conhecimento arranjados a partir de um planejamento adequado, em uma estrutura coesa (DAHLBERG, 2006, p. 12, tradução e grifo nossos).

Assim, conforme afirma Dahlberg (2006), a organização do conhecimento abarca conceitualmente apreender esses quatro elementos na representação de referentes (do mundo real ou não), para organizá-los (agrupamento, arranjo e denominação verbal) segundo um propósito. Para a autora, somente dessa forma é possível perceber e reconhecer as relações que são estabelecidas entre esses elementos, permitindo aos usuários “tirar conclusões úteis a partir deles” (idem, p. 12). É importante, segundo Brascher e Café (2008), que não se confunda organização do conhecimento com organização da informação 2, que, basicamente, objetiva a [...] organização de um conjunto de objetos informacionais para arranjá-los sistematicamente em coleções, [...] [como] [...] a organização da informação em bibliotecas, museus, arquivos, tanto tradicionais quanto eletrônicos. [...] A organização da informação é, portanto, um processo que envolve a descrição física e de conteúdo dos objetos informacionais (BRASCHER; CAFÉ, 2008, p. 5).

Nesse sentido, a organização da informação é uma representação da informação, tendo como objeto os documentos, que podem ser representados no todo ou em partes, individualmente ou em conjunto, abarcando os seus aspectos tanto descritivo quanto temático, que engloba organizações linguísticas e terminológicas (MACULAN, 2015). A organização do conhecimento também implica em representação, produzindo estruturas conceituais que têm como finalidade representar domínios de conhecimento e possibilitar a compreensão de fenômenos do mundo (BRASCHER; CAFÉ, 2008, p. 6). Essas estruturas podem ser denominadas sistemas de organização do conhecimento (SOCs) que, ainda segundo as mesmas autoras, “são sistemas conceituais que representam determinado domínio por meio da sistematização dos conceitos e das relações semânticas que se estabelecem entre eles” (p. 8), ou seja, estabelecendo o controle de vocabulário.

2

Lembrando-se que não existem conceitos de informação e conhecimento que sejam universalmente aceitos. Diferentes pesquisadores ao redor do mundo compreendem informação e conhecimento de formas diferentes, evidente nos trabalhos de Buckland (1991), Brascher e Café (2008), Dahlberg (2006), Hjørland (2008), por exemplo. Todavia, neste artigo optou-se por seguir a linha de raciocínio que define informação e conhecimento como elementos diferentes, apesar de possuírem forte ligação (DAHLBERG, 2006; BRASCHER; CAFÉ, 2008).

1112

Dentre os SOCs existentes, destacam-se os tesauros e as ontologias, que são ferramentas importantes para a organização e representação do conhecimento. SOCs também são utilizados pela comunidade de pesquisadores sobre linguagem natural como recurso para resolver os problemas de recuperação, incluindo a busca de texto-livre, expansão da consulta, extração de terminologia, mineração de texto, resumo e tradução (TUDHOPE; NIELSEN, 2006, p. 5, tradução nossa).

Devido à polissemia e ambiguidades que são inerentes à linguagem natural, o uso de SOCs se torna um recurso importante para dar uma interpretação adequada às entidades textuais dos documentos e à expressão de busca do usuário (expressa em linguagem natural). Ressalta-se que as pesquisas em Processamento da Linguagem Natural (PNL) estudam diferentes técnicas computacionais para a análise de textos em diferentes níveis linguísticos (lexical, sintático, semântico, entre outros) e buscam por soluções de problemas relacionados à recuperação da informação. Levando em consideração a ambiguidade da linguagem natural, considera-se que a construção de SOCs têm um importante papel na representação e organização do conhecimento de um dado domínio, para que se torne efetivo o seu uso e para facilitar a recuperação. Dessa forma, busca-se minimizar ou até mesmo eliminar os ruídos comunicacionais advindos da linguagem natural, o que pode garantir maior eficácia na comunicação de resultados científicos e no compartilhamento de conhecimentos. A saber: A precisão conceitual torna-se uma condição necessária para um eficiente intercâmbio comunicativo, seja no universo da transmissão do conhecimento científico, seja para o assentamento de toda sorte de contratos jurídicos e comerciais, bem como das múltiplas e variadas proposições de intercâmbio tecnológico e cultural, que se intensificam na atual sociedade globalizada. (KREIGER; FINNATO, 2004, p. 18).

Ainda tratando da atualidade, os recursos computacionais trouxeram enormes benefícios para criação e manutenção de SOCs. Primeiramente, porque permitiu a migração desses, que antes eram editados exclusivamente em papel, para o ambiente digital, o que facilita sua criação, gestão, manutenção e uso. Em segundo lugar, as tecnologias digitais possibilitaram aos terminológos, linguistas e profissionais da informação a consulta a uma infinidade de fontes credenciadas, pela comunidade científica ou de especialistas, o que auxilia a construção de SOCs semanticamente mais enriquecido. Em terceiro, os meios de comunicação web permitem a comunicação rápida e eficiente entre membros de uma equipe que trabalha com o desenvolvimento de um SOC. Dessa maneira, dentre outras coisas, a equipe pode

1113

trabalhar colaborativamente, em rede, compartilhando textos e análises em tempo real. Por fim, o ambiente digital facilita o uso e operação dos SOCs por usuários (tanto por usuários especialistas, isto é, indexadores e catalogadores, quanto por usuários comuns em busca de informações em bases de dados, por exemplo). Considera-se que para a construção e gerenciamento de SOCs torna-se necessário o uso de softwares e de outras ferramentas computacionais. Esses softwares devem atender perfeitamente às necessidades da equipe que desenvolve o SOC. Softwares pouco adequados ou adaptados podem interferir negativamente na qualidade do SOC, resultando em produtos inconsistentes e pouco funcionais. Logo, uma das decisões mais importantes a serem tomadas pela equipe de trabalho é qual software utilizar. Para isso, Campos et al. (2006) propõem um modelo de avaliação de softwares para a construção de tesauros, que determina as características desejáveis e indesejáveis desses softwares. Nessa perspectiva, o objetivo deste trabalho é apresentar o sistema e-Termos, software que é um ambiente colaborativo web de criação e gestão de produtos terminológicos, inclusive de SOCs do tipo tesauro. Primeiramente, serão descritos os elementos e atributos conceituais dos tesauros e, em seguida, as principais características, funcionalidades e especificidades do e-Termos, bem como as formas de acesso e uso do sistema. 3 TESAUROS O tesauro terminológico ou conceitual tem por base um sistema conceitual (ou nocional), e, como função principal, fazer o controle terminológico de um domínio específico do conhecimento, sendo, nesse sentido, uma linguagem especializada. Motta (1987) define tesauro como um [...] sistema de vocabulário baseado em conceitos, incluindo termos preferidos (descritores), termos não preferidos (não descritores) e suas inter-relações, que se aplica a um determinado ramo do conhecimento e que se destina a controlar a terminologia utilizada para a indexação/recuperação de documentos (MOTTA, 1987, p. 25).

Nesse sentido, um tesauro busca criar uma linguagem comum entre os especialistas de um dado domínio, visando a facilitar a comunicação entre pares e o compartilhamento de conhecimentos. Para isso, apresenta um sistema de conceitos ligados por meio de relações de equivalência (indicando a preferência de uso de um descritor), hierárquicas (gênero/espécie; todo/parte; instância) e associativas (não

1114

hierárquicas). Como insumos para a compilação de terminologias, utilizam-se tesauros da mesma área e/ou de áreas afins, glossários, dicionários, classificações, relatórios especializados e outras fontes da literatura da área. A construção, o gerenciamento e manutenção de tesauros é um processo longo e que demanda alto capital intelectual da equipe envolvida. Para executar um projeto de criação de tesauros, a equipe deve seguir uma metodologia de trabalho que, segundo Maculan (2015, p. 130), pode ser desenvolvido em três etapas: (a) Etapa inicial: Definição da equipe de trabalho; planejamento geral do tesauro, incluindo a delimitação do domínio a ser modelado; determinação de objetivos; recorte temático trabalhado; seleção do público-alvo; levantamento das principais fontes de terminologia (especialistas do domínio, vocabulários controlados, linguagens de indexação, dicionários, glossários e corpus textual). (b) Desenvolvimento: Elaboração da estrutura conceitual, com a escolha de critérios de modelagem; compilação de termos, que representam conceitos no domínio modelado, que são os candidatos a descritores; elaboração de um glossário de definições; seleção dos descritores (preferidos e não preferidos), com validação de especialistas; criação de classes básicas ou facetas; organização dos descritores em um mapa conceitual; estabelecimento das relações semânticas entre conceitos e termos. (c) Edição: Montagem da estrutura conceitual e suas relações; escolha do software para o gerenciamento das etapas de construção do tesauro; determinação dos símbolos que expressam as relações; elaboração de notas de escopo para orientar quanto ao sentido e uso de descritores; escolha da forma de apresentação. A terceira etapa (edição) é determinante para o sucesso ou insucesso do tesauro. A escolha de um software que não se adapte aos pormenores do projeto de desenvolvimento do tesauro pode resultar em um produto difícil de usar, com problemas de consistência e pouco amigável ao usuário. Logo, o software escolhido para desenvolver e gerenciar o projeto terminológico deve se adequar aos seus objetivos. Corroborando com isso, Campos et al. (2006) afirmam que Para auxiliar a construção desses vocabulários [tesauros] o uso de softwares de construção de tesauros é uma necessidade, devido às suas facilidades de armazenamento, manipulação e apresentação dos termos definidos e suas relações. Desta forma, o objetivo dos tesauros e a escolha criteriosa de um software para sua implementação é importante caracterizar o que se entende por este instrumento e como

1115

pode se dar a sua elaboração (CAMPOS et al., 2006, p. 69).

Existem diversos softwares disponíveis na web para a elaboração de tesauros. Tamanha diversidade exige que sejam adotados critérios rigorosos para selecionar o software mais adequado. 4 O SISTEMA E-TERMOS: DESENVOLVIMENTO E GESTÃO DE TERMINOLOGIAS O e-Termos é um ambiente colaborativo web, caracterizado como software gratuito baseado em rede, desenvolvido por Oliveira (2009) e apresentado em sua tese doutoral. Foi desenvolvido com aporte nos princípios teóricos da terminologia e nas etapas do trabalho terminológico. O software foi modelado para suportar diferentes projetos terminológicos, atendendo adequadamente aos processos de construção, gerenciamento e manutenção de tesauros. O ambiente e-Termos é dividido em seis etapas, além de uma interface principal, onde devem ser definidas as características gerais do tesauro e a equipe de trabalho. As etapas são interdependentes, logo é preciso que as seis etapas sejam seguidas racionalmente a fim de evitar falhas e inconsistências no tesauro. Quadro 1 - As seis etapas operacionais do e-Termos

ETAPA 1 e ETAPA 2

Compilação do corpus. Os documentos podem ser inseridos a partir de arquivos armazenados no computador ou importados do Portal de Córpus do Projeto PLN-Br. A qualquer momento, os documentos podem ser excluídos ou alterados, sem que ocorra problemas.

ETAPA 3

Reúne diferentes ferramentas para a extração automática de candidatos a termo. A extração pode ser feita a partir do córpus compilado nas Etapas 1 e 2. Para isso, disponibiliza diversas ferramentas para avaliar e validar os candidatos a termos, como medidor de frequência, stoplist e outros. Caso haja uma lista de termos pronta, basta fazer a importação dessa em formato de arquivo de texto (.txt, .pdf).

ETAPA 4

Criação e edição da estrutura dos termos (ontologia), quando necessário. Também possibilita definir as relações entre os termos, dependendo das finalidades do projeto. Para facilitar a detecção de erros e inconsistências na estrutura terminológica (ontologia), o sistema permite a visualização dessa estrutura de duas formas: (1) em árvore hierárquica, composta por todos os termos da ontologia; ou (2) em mapa conceitual hiperbólico, que permite observar

1116

pequenos grupos de termos por vez, exibindo os tipos de relacionamentos existentes entre eles.

ETAPA 5

ETAPA 6

Criação e edição de fichas terminológicas e da Base Definicional, juntamente com a elaboração de definições para todos os termos. Os excertos definitórios podem ser inseridos a partir de documentos externos ou a partir da base definitória. Edição dos verbetes do produto terminológico para a publicação, a partir de diversos recursos (diferentes estilos da fonte, para diferenciar termos ou trechos dos excertos; inserção de imagens que estejam associadas com o termo, etc.). Após, pode ser gerada uma pré-publicação, que irá passar pela validação de especialistas de domínio, antes da publicação definitiva. Por fim, os produtos terminológicos podem se tornar disponíveis para consulta pública ou não, conforme definido no projeto. Os produtos públicos podem ser acessados pelo link Acesso aos Produtos, na interface inicial do sistema, sem ser necessário, para isso, criar login e senha.

Fonte: elaborado pelos autores com base em informações do sistema e-Termos.

A etapa 4, em especial, oferece ferramentas importantes para os processos relacionados à organização do conhecimento. As ferramentas permitem visualizar a estrutura em de árvore hierárquica (Folder-Tree) e formato de mapa conceitual hiperbólico (Formato Grafo). Figura 1 - Formas de visualização Folder-Tree (esquerda) e Formato Grafo (direita)

Fonte: elaborado pelos autores.

Maculan (2015, p. 181) afirma que essas ferramentas “servem, principalmente, para criar um mapa conceitual do domínio do projeto em questão, com o objetivo de organizar o conhecimento e os conceitos de maneira hierárquica”. Além disso, a

1117

visualização das relações estabelecidas entre os termos (Fomato Grafo) permite avaliar se as relações entre os termos do domínio que está a ser modelado são verdadeiras, logo, uma forma de validação da estrutura conceitual. Alguns critérios podem auxiliar a equipe no momento de escolher o software. Campos et al. (2006) propõem uma forma de avaliação de softwares para construção de tesauros por meio de requisitos os quais esses devem atender. As autoras dividem esses requisitos em oito grupos: Quadro 1 - Critérios para avaliação de softwares para construção de tesauros

Elemento

Características gerais

Tratamento de relações

Tratamento de dados

Interface / Manipulação dos dados

Relatórios

Descrição Verificar as limitações genéricas, tais como restrição de tamanho, número de termos e possibilidade de uso de termos compostos, a existência da informação da fonte ou origem do termo, a possibilidade de criar classes de assuntos, e se os termos podem ser expressos em mais de um idioma. De que maneira o software permite tratar as relações. Se o software permite guardar o tesauro em banco de dados, se permite importação de termos de e para outras fontes, se existe crítica em relação à consistência de dados, se é feito algum controle de restrição de acesso para atualização do tesauro e se permite o gerenciamento da situação de termos, como por exemplo, termos candidatos ou termos obsoletos. Avaliar a maneira que o software permite interagir com os seus usuários, tanto no projeto do tesauro quanto na pesquisa. Avaliar a apresentação da estrutura do tesauro ao usuário final.

1118

Características de implementação

Apoio metodológico

Apoio ao uso

Avaliar os pré-requisitos que software possui para ser utilizado.

o

Se o software foi projetado com recursos que forneçam apoio ao uso de alguma metodologia de construção de tesauros. Avaliar o tipo de apoio que o fabricante do software disponibiliza aos seus clientes.

Fonte: CAMPOS et al., 2006.

Assim, um software ideal para tesauros deveria atender a todas essas características. O e-Termos, software a ser explorado neste trabalho, atende a todas estas características, com uma pequena ressalva em um dos critérios, como ficará evidente no item 5. 5 ANÁLISE E AVALIAÇÃO DO E-TERMOS Tendo como base os critérios de Campos et al. (2006) para avaliação de softwares para construção de tesauros, foi realizada uma análise no sistema eTermos, verificando se este atende a todos os critérios estabelecidos pelos autores. (a) Características gerais: o e-Termos é de livre acesso, podendo criar tesauros mono ou multilíngue. Ele não possui limitação ou restrição do número de termos que podem ser inseridos, sendo possível inserir termos compostos com duas ou mais palavras; é obrigatório referenciar a fonte de onde foram extraídos os excertos definitórios que compõem as fichas terminológicas; e aceita termos em vários idiomas. (b) Tratamento de relações: permite relacionar conceitos e os termos com as expressões tradicionais (BT, NT, RT, USE, UF, SN), mais generalizadas; também possibilita explicitar outros tipos específicos de relacionamentos pelo usuário, que podem ser criados ad hoc, editadas na etapa quatro. (c) Tratamento de dados: os dados do tesauro podem ser armazenados no próprio banco de dados do sistema, assim como permite a importação de termos de fontes diversas. Além disso, o sistema possui regras de restrição que impede a repetição de rótulos iguais, por exemplo, o que mantêm a consistência da

1119

estrutura do tesauro. O tesauro pode ser atualizado, constantemente, por uma equipe (mesmo geograficamente dispersa) com níveis diferenciados de autorização de gerenciamento, garantindo controle do acesso. Os dados do tesauro podem ser exportados em diferentes formatos, incluindo formato de triplas que permite a sua representação em linguagem Simples Knowledge Organization System (SKOS), por exemplo, que tem por base representações de vocabulários (declarados em RDF), possuindo os elementos: Conceitos, Propriedades e Relacionamentos. (d) Interface / Manipulação dos dados: o sistema disponibiliza recursos para a edição do layout do tesauro, que pode ser publicado no banco de dados do próprio sistema e-Termos. Se isso for feito, o tesauro pode ser acessado pelo menu “Acesso aos Produtos”, na sua tela inicial, junto com outros produtos terminológicos já publicados. A navegação no tesauro pode ser feita por meio da ordenação alfabética, de uma caixa de busca, navegação hiperbólica ou grafos. Como há níveis diferenciados de acesso ao gerenciamento e manutenção do tesauro, é possível aos membros da equipe interagir em relação ao projeto. É nesse momento, também, que o tesauro pode ser validado por um especialista de domínio, capacitando uma interação em nível conceitual, ou seja, da pesquisa. (e) Relatórios: antes de ser publicado, o e-Termos permite visualizar a prépublicação do tesauro, o que permite visualizar qual a melhor opção de layout para o usuário, antes que o tesauro seja publicado. Entretanto, o e-Termos não permite a publicação de classes encabeçadas pelos respectivos clusters, permite apenas a publicação de uma lista alfabética. Esse é um ponto negativo do software, pois os usuários deveriam poder acessar o tesauro e visualizar as classes de termos de forma sistemática. (f) Características de implementação: como o e-Termos é um ambiente web, não precisa ser instalado no computador, o que descarta problemas de requisitos de sistema operacional para rodar o software. Para ter acesso ao sistema, basta possuir um navegador (browser) instalado na máquina. (g) Apoio metodológico: os procedimentos no e-Termos foram divididos em etapas bastante completas, que atendem perfeitamente às metodologias para construção de tesauros e outros tipos de terminologias. Contudo, não há uma relação direta entre essas etapas e as metodologias propriamente ditas. A

1120

possibilidade da base definicional, entretanto, é uma ferramenta interessante para a modelagem conceitual e essencial na elaboração das definições dos conceitos. (h) Apoio ao uso: o software foi desenvolvido no âmbito de uma pesquisa de doutorado, vinculado à Embrapa, que tem interesse na ampliação do uso do eTermos. No próprio sistema, há uma opção de contato com o desenvolvedor na tela inicial, e não é preciso ter um login ativo para isso. Basta enviar uma mensagem pelo Fale Conosco. Conforme pôde ser observado, o sistema e-Termos possui características positivas em relação a cada um dos elementos que devem ser avaliados em softwares para a construção de tesauros. Destaca-se, porém, que apesar de o software estar adaptado para cumprir as etapas de metodologias para a construção de tesauros, ele não oferece restrições para atendimento a normas internacionais de construção de tesauros, tais como a ANZI/NISO Z39.19 (2005) e a ISO 25964 (2011; 2013). Em relação à reorganização de hierarquias, não é possível a remoção e relocação de hierarquias inteiras (conjunto de facetas e subfacetas), sendo necessário a reorganização individual delas. Considera-se que isso é uma limitação do software, sobretudo para lidar com tesauros muito grandes ou que possuem uma característica dinâmica, mudando com frequência. Ressalta-se que o desenvolvimento do sistema e-Termos teve por base a perspectiva da Teoria Comunicativa da Terminologia (TCT), apresentada por Cabré (1993; 1999; 2005) que

enfatiza o aspecto comunicativo de linguagens

especializadas, procurando lidar com os termos em seus efetivos contextos de uso. 6 CONSIDERAÇÕES FINAIS O objetivo deste trabalho foi apresentar o sistema e-Termos como uma opção para a gestão e manutenção de tesauros. Para isso, foram demonstrados as suas características gerais e os critérios que devem ser analisados nesse tipo de software. Esse conjunto de critérios pode fornecer auxílio às equipes no momento de tomar a decisão quanto a qual software escolher para criar e gerenciar um tesauro. Considera-se que o sistema e-Termos cumpre adequadamente com todas as etapas para o desenvolvimento de tesauros, conforme descrito por Maculan (2015), assim como possui características que podem atender aos critérios estabelecidos por

1121

Campos et al. (2006), para a avaliação de softwares para construção de tesauros. A exceção fica por conta, sobretudo, da limitação quanto aos tipos de relatórios para a publicação do tesauro, elemento que falta à maior parte dos softwares já analisados (CAMPOS et al., 2006). Mesmo com essa limitação, o sistema e-Termos pode se apresentar como uma boa opção às equipes que procuram por softwares para a edição de tesauros. REFERÊNCIAS BENVENISTE, Émile. Problemas de linguística general II. 15. ed. México, DF: Siglo Veintiuno; Madrid: Siglo Veintiuno de España, 1999. BUCKLAND, M. K. Information as thing. Journal of the American Society for Information Science, v. 42, n. 5, June 1991. CABRÉ, M. T. La Terminologia: teoría, metodología, aplicaciones. Barcelona: Antartida/Empuries, 1993. 529p. CABRÉ, M. T. La terminología: representación y comunicación. Barcelona: Institut Universitari de Linguística Aplicada, Universitat Pompeu Fabra, 1999. 369p. CABRÉ, M. T. La terminologia, una disciplina em evolución: pasado, presente y algunos elementos de futuro. Revista Debate Terminológico – Riterm, n. 1-3, 2005. CAFÉ, Ligia; BRASCHER, Marisa. Organização da informação ou organização do conhecimento? ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 9., 2008, São Paulo. Anais... São Paulo: Associação Nacional de Pesquisa e Pós-Graduação em Ciência da Informação, 2008. p. 1-14. Disponível em: . Acesso em: 22 maio 2016. CAMPOS, M. L. A. et al. Estudo comparativo de softwares de construção de tesauros. Perspectivas em Ciência da Informação, Belo Horizonte, v. 11, n. 1, p. 68-81, jan./abr. 2006. DAHLBERG, Ingetraut. Knowledge organization: a new science? Knowledge organization, v. 33, n. 1, p. 11-19, 2006. DICIONÁRIO da Língua Portuguesa: com acordo ortográfico. Porto: Porto Editora, © 2003-2016. (Aplicativo da área de trabalho). E-TERMOS: ambiente colaborativo web de gestão terminológica. Desenvolvido por Leandro Henrique Mendonça de Oliveira, 2009. Disponível em: . Acesso em: 13 fev. 2016. FURGERI, Sérgio. Representação de informação e conhecimento: estudo das diferentes abordagens entre a Ciência da Informação e a Ciência da Computação.

1122

2006. 161f. Dissertação (Mestre em Ciência da Informação) – Centro de Ciências Sociais Aplicadas, Pontifícia Universidade Católica de Campinas, Campinas, 2006. HJORLAND, B. What is Knowledge Organization (KO)? Knowledge Organization, v. 35, n. 2-3, p. 86-101, 2008. KRIEGER, Maria da Graça; FINATTO, Maria José Bocorny. Introdução à terminologia: teoria e prática. São Paulo: Contexto, 2004. MACULAN, Benildes Coura Moreira dos Santos. Estudo e aplicação de metodologia para reengenharia de tesauro: remodelagem do THESAGRO. 2015. 345f. Tese (Doutorado em Ciência da Informação) – Escola de Ciência da Informação, Universidade Federal de Minas Gerais, Belo Horizonte, 2015. MOTTA, Dilza Fonseca da. Método relacional como nova abordagem para construção de tesauros. Rio de janeiro: SENAI, 1987. (Coleção Albano Franco, 12). OLIVEIRA, Leandro Henrique Mendonça de. e-Termos: um ambiente colaborativo web de gestão terminológica. 2009. 243f. Tese (Doutorado em Ciências da Computação e Matemática Computacional) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2009. TUDHOPE, Douglas; NIELSEN, Marianne Lykk. Introduction to Knowledge Organization Systems and Services. New Review of Hypermedia and Multimedia, v. 12, n. 1, p. 3-9, 2006. AMERICAN NATIONAL INFORMATION STANDARDS ORGANIZATION. NISO Z39.19: Guidelines for the construction, format and management of monolingual controlled vocabularies. Bethesda: NISO, 2005. INTERNATIONAL STANDARD ORGANIZATION. ISO 25964: thesauri and interoperability with other vocabularies. Part 1: thesauri for information retrieval. Geneve: International Standard Organization, 2011. INTERNATIONAL STANDARD ORGANIZATION. ISO 25964: thesauri and interoperability with other vocabularies. Part 2: interoperability with other vocabularies. Geneve: International Standard Organization, 2013.

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.