Recensão crítica: \"A Web Semântica e suas contribuições para a ciência da informação\"

Share Embed


Descrição do Produto

Recensão crítica Souza, R. R., & Alvarenga, L. (2004). A Web Semântica e suas contribuições para a ciência da informação. Ciência da Informação, 33, n.1, 132-141. Retrieved from http://revista.ibict.br/ciinf/index.php/ciinf/article/view/50/50

por: Luís Machado [email protected] Faculdade de Letras da Universidade de Coimbra 2015.junho

O artigo “A Web Semântica e suas contribuições para a ciência da informação”, publicado no volume 33, nº 1 de 2004, da edição eletrónica da revista Ciência da Informação sob a responsabilidade do Instituto Brasileiro de Informação em Ciência e Tecnologia, tem como coautores Renato Rocha Souza e Lídia Alvarenga, professores universitários e investigadores na área da Ciência da Informação. Tendo como objetivo central indicar os pontos de convergência entre a ciência da informação e a “filosofia e as tecnologias que estão embutidas no projeto desta nova e atualizada Web” (p.140), chamada de web semântica, o artigo apresenta uma organização conceptual que poderá ser agrupada em três partes. Na primeira, os autores apresentam a Word Wide Web enquanto repositório de documentos, virtualmente ilimitado na capacidade de depósito de informação mas muito limitado na sua recuperação (p.133). Segue-se uma segunda parte descritiva, e bastante atualizada (Bikakis, Tsinaraki, Gioldasis, Stavrakantonakis, & Christodoulakis, 2013), das tecnologias em desenvolvimento associadas à web semântica que pretendem colmatar as limitações da web na recuperação de informação, (algumas das tecnologias descritas, uma década depois, estão ainda longe da maturação (Caro-Castro, 2012; Cuel, Delteil, Louis, & Rizzi, 2007)). Por fim, na última parte, são apresentadas as potencialidades de aplicabilidade das ferramentas da web semântica a domínios “fora da web” implicando mudanças na atividade dos profissionais da ciência da informação (p.139). Os autores começam por fazer uma distinção pertinente entre internet (o hardware) e web (o software). Embora optando por não mencionar explicitamente esses termos, hardware e software, descrevem o primeiro como a infraestrutura física de suporte à web, já para o segundo a opção dos autores foi apresentar a função e intenção do projeto da web. Apesar da opção fazer sentido, para uma melhor distinção entre os dois conceitos, poderiam ter considerado a web como uma aplicação informática (Marrafa, Amaro, Mendes, Chaves, & Louros, 2009). A apresentação da função e intenção do projeto da web é de extrema relevância pois a questão da facilidade de acesso aos documentos, tal como os autores referem, faz parte da visão de Tim Berners-Lee aquando do desenvolvimento do que viria a ser a web 1

(Berners-Lee & Fischetti, 1999, p.33). Conquanto importante, por si só o acesso aos documentos fica longe de ser a solução para quem procura alguma informação específica, sendo esse o objetivo, segundo os autores, dos Sistemas de Recuperação de Informações (SRIs). Dado a subjetividade, no que concerne ao conceito de informação, os autores enunciam de forma clara o que entendem por SRIs, “ao falar de sistemas de recuperação de informações, estamos falando em tecnologias para a recuperação de informações registradas em formato impresso ou digital” (p.132). Já a distinção entre sistemas de recuperação de informações e sistemas de recuperação de dados poderia ser abordada de forma um pouco mais clara, como um dos autores fez num artigo posterior onde a distinção entre os dois sistemas é clarificada (Souza, 2006). No que concerne à relação entre a web e os SRIs, o enfoque é colocado na indexação pois essa é, na opinião dos autores, a pedra de toque na recuperação de informação contida em documentos de acordo com as necessidades dos utilizadores. Esse é um dos grandes problemas da web apontados pelos autores: a inexistência de uma “estratégia abrangente e satisfatória para a indexação dos documentos nela contidos” (p.132). Os autores apontam vários fatores que contribuíram ou agravam esse problema: a forma descentralizada e “quase anárquica” como a web foi implementada, seu crescimento exponencial e “caótico”, um sistema de recuperação de informação, usado pelos motores de busca, pouco eficaz e o facto das tecnologias e linguagens utilizadas nas páginas web estarem focadas nos aspetos de exibição e apresentação de dados, sendo a informação “pobremente descrita e pouco passível de ser consumida por máquinas e seres humanos” (p.133). Visão que encontra eco em vários autores (Mika, 2010; Morais & Ambrósio, 2007; Patel-Schneider & Horrocks, 2006). É neste contexto que surge o projeto da Web Semântica que, nas palavras dos autores, “pretende embutir inteligência e contexto nos códigos XML utilizados para confecção de páginas Web, de modo a melhorar a forma com que programas podem interagir com estas páginas e também possibilitar um uso mais intuitivo por parte dos usuários” (p.133). Sendo essa a intenção por trás do projeto da Web Semântica, a criação de uma “web inteligente” é encarada como uma visão muito otimista ou mesmo utópica por vários investigadores da área, tais como Alon Halevy, Clay Shirky ou David Weinberger (Ray, 2009). Essa posição é partilhada por Lluís Codina, que considera o objetivo da web semântica uma aspiração muito ambiciosa que, a cumprir-se, mudaria radicalmente a web tal como a conhecemos (Codina, 2003, p.149). Os autores abordam a forma de operacionalizar a visão de Berners-Lee no que respeita à web semântica (Berners-Lee & Fischetti, 1999, p.157) apontando como condição essencial a padronização de tecnologias, linguagens e metadados descritivos, para que os intervenientes no processo, agentes humanos e não humanos, possam partilhar mais que informação, partilhar significado, de forma automática e não ambígua. É nesse 2

sentido que, dizem-nos Souza e Alvarenga neste artigo, a “semântica” se liga à web e, mais especificamente, na resolução dos problemas lógicos. Justificam essa perspetiva pelas imensas possibilidades que o desenvolvimento técnico associado à web semântica acarreta na associação dos documentos a seus significados por meio dos metadados descritivos (p.134). Por outro lado, autores como Clay Shirky, apontam essa característica como uma desvantagem, descrevendo a web semântica como “a machine for creating syllogisms” e silogismos não são de grande utilidade no “mundo real”, logo a web semântica também não terá grande utilidade (Shirky, 2003). No entanto, indo de encontro à opinião de Souza e Alvarenga, Paul Ford rebate as afirmações de Shirky demonstrando que, não só a web semântica não é uma máquina, como nela são utilizados vários outros processamentos lógicos diferentes dos silogismos e, por fim, que até esse tipo de lógica é usada correntemente no “mundo real” (Ford, 2003). Relativamente aos agentes não humanos, já aqui referidos, estes são descritos pelos autores do artigo como “entidades de software que empregam técnicas de inteligência artificial com o objetivo de auxiliar o usuário na realização de uma determinada tarefa, agindo de forma autônoma” (p.137). Descrição que encontra correspondência na introdução ao conceito de Agent Technology realizado pela AgentLink III - Information Society Technologies Coordination Action for Agent-Based Computing (Luck, McBurney, Shehory, & Willmott, 2005, p.11). Também os pressupostos técnicos mencionados por Souza e Alvarenga, isto é, a criação e implementação de padrões tecnológicos como as linguagens XML e RDF, são indicados pela AgentLink como condição essencial ao

desenvolvimento desses agent systems sendo que, as linguagens referidas, são mesmo consideradas como tecnologias de base (Luck et al., 2005, p.15). No que diz respeito ao desenvolvimento de padrões e linguagens envolvidas na web semântica, passando em revista o estado da arte da época, verifica-se a grande atualidade do artigo. Destacando-se a menção à versão 5.0 da linguagem HTML cujo desenvolvimento, por parte do World Wide Web Consortium (W3C), só iniciou em 2007 e apenas no ano transato obteve o “estatuto” de recomendação W3C (W3C - World Wide Web Consortium, 2014). Também relativamente ao padrão RDF, tal como foi “previsto” pelos autores, o seu desenvolvimento foi no sentido da não repetição da descrição dos namespaces e da “compreensão” de mais propriedades (p.136). Desse desenvolvimento surgiu em 2008 o RDFa (Resource Description Framework in attributes), com o intuito de embutir informação “compreendida” pelas máquinas no mesmo documento que comporta informação para os agentes humanos (W3C - World Wide Web Consortium, 2008). Por outro lado, o artigo poderia ter dado um pouco mais de atenção aos URI (Uniform Resource Identifier), uma vez que os mesmos têm um papel importante na construção dos RDF triples (W3C - World Wide Web Consortium, 2002). 3

Todo este desenvolvimento caminha para aquilo que os autores referem como a aproximação da web a um grande SRI, apresentando as dez “entidades” envolvidas e respetivo papel que desempenham no circuito (p.138). Uma descrição necessária para a interpretação da figura apresentada no artigo (Figura 1: O roadmap da Web Semântica) e um melhor entendimento da articulação entre as várias tecnologias envolvidas e seu inter-relacionamento. Os autores identificam e descrevem dois circuitos, o “da representação e indexação de documentos” e o “da recuperação e uso dos documentos”. No sentido de tornar a perceção dos mesmos mais imediata os autores poderiam ter associado aos circuitos a cor com que os elementos gráficos de ligação entre entidades aparecem representados na figura. Assim, no primeiro circuito estão envolvidas as entidades (ligadas com setas azuladas): ferramentas e tecnologias para anotação semântica das páginas web; ferramentas para construção de ontologias; páginas web marcadas semanticamente; metadados descritos em namespaces de domínio público; ontologias; meta-ontologias e ferramentas de articulação de ontologias. O segundo circuito (setas vermelhas e violetas) envolve: agentes; mecanismos de busca e inferência; utilizadores, humanos e não humanos; e portais comunitários (p.138). Para os autores as condições para que este sistema seja uma realidade estavam praticamente reunidas: a infraestrutura já existe, a Internet e as intranets, as tecnologias para implementação, assim como os protótipos destas ferramentas, também já se encontram disponíveis e uma estratégia padronizada de indexação está em andamento, pelo que “o processo de atualização da Web está em pleno curso” (p.139). E, segundo James Hendler, Director do Rensselaer Institute for Data Exploration and Applications, a tecnologia associada à web semântica excedeu largamente as expectativas de todos a não ser, talvez, as de Tim Berners-Lee (Hendler, 2011). No que concerne a uma aplicação das inovações desta “web atualizada” fora desse contexto ou com corelação direta com a área e a atividade dos profissionais da ciência da informação, os autores apontam: novos e melhorados motores de busca (a); novas interfaces com o usuário para sistemas de informação (b); construção automática de tesauros e vocabulários controlados (c); indexação automática de documentos (d); gestão do conhecimento organizacional (e); gestão da informação estratégica e da inteligência competitiva (f). A ligação que os autores fazem entre estas áreas de aplicação e as tecnologias descritas no artigo são: padronização de metadados e marcação semântica de dados (áreas: a; d; e); lógica de triplas do RDF (áreas: a; b; c); tecnologia de agentes (áreas: b; f); ontologias comunitárias (áreas: d; e); interoperabilidade oferecida pelo XML (área: e). Aplicações nessas áreas são também referidas por outros autores (Caro-Castro, 2012; Cuel et al., 2007; Hendler, 2011). Para os autores o reconhecimento que “todo o embasamento filosófico, metodológico e conceitual da Web Semântica parte do núcleo duro da ciência da informação” (p.140), 4

deverá ser motivo e incentivo para marcar presença ativa neste novo paradigma, no que concerne à demarcação e valorização do contributo indispensável desta área do saber nestes novos panoramas informacionais. Carmen Caro-Castro aponta algumas áreas onde esse contributo é crucial como, por exemplo, o problema da compatibilidade entre vocabulários controlados que as linguagens de interoperabilidade desenvolvidas não resolvem, estes apenas permitem o intercâmbio entre sistemas (Caro-Castro, 2012, p.10). Ou, ainda, na adaptação dos vocabulários controlados aos padrões e recomendações da web semântica e linked data (recomendação do W3C desde fevereiro de 2015) e especificações do modelo SKOS (Simple Knowledge Organization System, recomendação do W3C desde de 2009). Uma área que ainda necessita de muito desenvolvimento, uma vez que a sua aplicação na recuperação de informação ainda é muito limitada (Caro-Castro, 2012, p.9). O artigo apresenta uma visão abrangente do que se pode entender por web semântica. Trata-se de uma abordagem claramente favorável ao conceito, focando as potencialidades e benefícios que esta “atualização” da web promete. Poder-se-ia apontar como aspeto negativo o facto de não mencionar críticas ou outros aspetos menos favoráveis. No entanto, os autores são claros nos objetivos que pretendem atingir, não se trata de uma análise de pós e contras. E, nesse sentido, pode-se afirmar que os autores foram bem-sucedidos. Fazem uma exposição bastante completa, conseguindo um equilíbrio entre detalhes técnicos precisos e explicações acessíveis a leitores iniciados na área. Referências Berners-Lee, T., & Fischetti, M. (1999). Weaving the Web: The original design and ultimate destiny of the world wide web by its inventor. New York: Harper Collins. Bikakis, N., Tsinaraki, C., Gioldasis, N., Stavrakantonakis, I., & Christodoulakis, S. (2013). XML World vs. Semantic Web World — A Comparison. In The XML and Semantic Web Worlds: Technologies, Interoperability and Integration: A survey of the State of the Art (pp. 3–14). Athens: National Technical University of Athens, Greece. http://doi.org/10.1007/978-3642-28977-4-12 Caro-Castro, C. (2012). Vocabularios estructurados, Web Semántica y Linked Data: oportunidades y retos para los profesionales de la documentación. Retrieved from http://gredos.usal.es/jspui/handle/10366/121953 Codina, L. (2003). La web semántica: una visión crítica. El Profesional de La Información, 12(2), 149–152. http://doi.org/10.1076/epri.12.2.149.15480 Cuel, R., Delteil, A., Louis, V., & Rizzi, C. (2007). Knowledge Web Technology Roadmap: “The Technology Roadmap of the Semantic Web. Business. Knowledge Web. Retrieved from http://knowledgeweb.semanticweb.org/o2i/menu/KWTR-whitepaper-43-final.pdf 5

Ford, P. (2003). A Response to Clay Shirky’s “The Semantic Web, Syllogism, and Worldview.” Retrieved June 6, 2015, from http://www.ftrain.com/ContraShirky.html Hendler, J. (2011). “Why the Semantic Web will never work” (note the quotes) [Video file]. videolectures.net. Retrieved from http://videolectures.net/eswc2011_hendler_work/?q=Jim Hendler Luck, M., McBurney, P., Shehory, O., & Willmott, S. (2005). Agent Technology: Computing as Interaction (A Roadmap for Agent Based Computing). (M. Luck, P. McBurney, O. Shehory, & S. Willmott, Eds.). Southampton: University of Southampton. Retrieved from http://www.agentlink.org/roadmap/index.html Marrafa, P., Amaro, R., Mendes, S., Chaves, R. P., & Louros, S. (2009). Aplicação, aplicação informática. In Lextec: Léxico Técnico do Português. Instituto Camões. Retrieved from http://www.instituto-camoes.pt/lextec/por/domain_7/definition/19279.html Mika, P. (2010). Making the Web searchable [Video file]. Retrieved from https://youtu.be/Dw2OhqvB0cE Morais, E. A. M., & Ambrósio, A. P. L. (2007). Ferramentas de Busca na Internet. Goiânia. Retrieved from http://www.portal.inf.ufg.br/biblioteca-digital Patel-Schneider, P. F., & Horrocks, I. (2006). A comparison of two modelling paradigms in the Semantic Web. Web Semantics, 5(4), 240–250. http://doi.org/10.1016/j.websem.2007.09.004 Ray, K. (2009). Kate Ray: Web 3.0: A story about the Semantic Web [Video file]. Retrieved from https://vimeo.com/11529540 Shirky, C. (2003). The Semantic Web, Syllogism, and Worldview. Retrieved June 4, 2015, from http://www.shirky.com/writings/semantic_syllogism.html Souza, R. R. (2006). Sistemas de recuperação de informações e mecanismos de busca na web: panorama atual e tendências. Perspectivas Em Ciência Da Informação, 11(2), 161–173. http://doi.org/10.1590/S1413-99362006000200002 W3C - World Wide Web Consortium. (2002). Resource Description Framework (RDF): Concepts and Abstract Syntax. Retrieved June 10, 2015, from http://www.w3.org/TR/2002/WDrdf-concepts-20021108/ W3C - World Wide Web Consortium. (2008). RDFa Primer: Bridging the Human and Data Webs. Retrieved June 9, 2015, from http://www.w3.org/TR/2008/NOTE-xhtml-rdfa-primer20081014/ W3C - World Wide Web Consortium. (2014). HTML5: A vocabulary and associated APIs for HTML and XHTML. Retrieved June 6, 2015, from http://www.w3.org/TR/html5/

6

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.