Recuperação da Informação em Ambientes Semânticos: uma ferramenta aplicada à publicações científicas

June 15, 2017 | Autor: C. Saraiva Coneglian | Categoria: Ontology, Semantic Web Technologies, Semantic Web, Ontologia, Recuperação da Informação
Share Embed


Descrição do Produto

aos aosusuários, usuários,conseguindo conseguindodesta destaforma formaatender atendersuas suasnecessidades. necessidades. Palavras-Chaves—web Palavras-Chaves—web semântica, semântica, ontologia, ontologia, agente agente de de extração, extração,recuperação recuperaçãoda dainformação informação

Recuperação da Informação em Ambientes I.I. II Semânticos: uma ferramenta aplicada àdiantededeumumuniverso ss instituições eeorganizações estão instituições organizações estão diante universo Recuperação da Informação em Ambientes A onde onde ocorre ocorre um um aumento aumento exponencial exponencial das das informações informações publicações científicas geradas geradas tanto tanto internamente internamente quanto quanto externamente. externamente. OO final Semânticos: uma ferramenta aplicada à tudo oofinalquequedodoéé século século XX XX iniciou iniciou uma uma era era onde onde praticamente praticamente tudo gerado digitalmente, gerado fica fica disponível disponível digitalmente, se se tornando tornando assim assim um um Recuperação da Informação em Ambientes publicações científicas grande desafio para as avançadas tecnologias Caio Saraiva Coneglian, UNESP – Universidade Estadual Paulista; UNIVEM – Centro grande desafioElvis paraFusco, as mais mais avançadas tecnologias de de armazenamento, Universitário Eurípides de Marília tratamento, armazenamento, tratamento, transformação transformação ee análise análise de de Semânticos: uma ferramenta àdo tratamento Caio Saraiva Coneglian, Universidade Estadual Paulista - UNESP;Testando, Elvisaplicada Fusco, Centro informações. assim, as áreas informações. Testando, assim, asUniversitário áreas do tratamento ee Eurípides deEstadual Marília -Paulista; UNIVEM recuperação da informação, Caio Saraiva Coneglian, UNESP – Universidade Fusco, no UNIVEM Centro ao recuperação daElvis informação, no que que diz diz–respeito respeito ao volume, volume, publicações científicas variedade ee de velocidade uma de inclui conjuntos dados comde tamanhos além da capacidade variedade velocidade de uma inundação inundação de dados dados Universitário Eurípides de Marília

JADI - Marília - v.1 - 2015

NTRODUÇÃO NTRODUÇÃO



natureza complexa. Resumo— Os dados disponíveis na Web estão crescendo dasemiestruturados tecnologia atual,de métodos e teorias para capturar, gerenciar semiestruturados de natureza complexa. exponencialmente, oferecendo informações de alto valor Dentro contexto, conceito de que e processar os dados dentrosurgiu de umum tempo determinado [22]. Dentro desse desse contexto, surgiu um conceito deBig Big Data Data que agregado àsCaio organizações. Tais informações podem estar Estadual Saraiva Coneglian, UNESP – Universidade Paulista; Elvis Fusco, UNIVEM – Centro classifica os dados gerados em ambientes informacionais Beyer e Laney [2] define também tal conceito, dizendo que classifica os de dados em ambientes dispostas em diversas bases e em formatos variados, como vídeos inclui conjuntos dadosgerados com tamanhos além da informacionais capacidadeo Universitário Marília digitais, principalmente aqueles aoa Internet como Big Datadecontém três características essências, alto volume, digitais, principalmente aqueles que tem Internet como Os dados disponíveis Web não estão crescendo Eurípides da tecnologia atual, métodos e teoriasque paratem capturar, gerenciar e Resumo— fotos em mídias sociais. Contudo,nadados estruturados plataforma. Big Data é definido como representação alta velocidade e alta variedade das informações, que plataforma. Big Data definido como representação do exponencialmente, de alto valor apresentam grandeoferecendo dificuldadeinformações para a recuperação da e processar os dados dentroé de um tempo determinado [22].do requerem novos meios processamento edizendo análise dos andamento dos cognitivos humanos, que geralmente agregado organizações. informaçõesas podem estar andamento dos processos cognitivos humanos, que geralmente informaçãoàs não atendendo Tais eficientemente necessidades Beyer e Laney [2]processos define para também tal conceito, que o dispostas em diversas e em formatos variados, como vídeos informacionais dos bases usuários, pois ocorre problemas em dados, uma melhor tomada de nova  inclui conjuntos de dados com tamanhos além da capacidade Big Datapermitindo contém três características essências, odecisão, alto volume, o sentido dos documentos na Web. No ecompreender fotos em mídias Contudo, armazenados dados não estão estruturados descoberta do conhecimento e otimização de processos. Resumo— Os sociais. dados disponíveis na Web crescendo da tecnologia atual, métodos e teorias para capturar, gerenciar Caio Saraiva Coneglian – Departamento de Ciência da Informação Caio Saraiva Coneglian Ciência da Informação(e-mail: (e-mail: [email protected]). velocidade e alta– Departamento variedade de das informações, que contexto de uma arquitetura de Recuperação Informação, apresentam grande dificuldade para a darecuperação da exponencialmente, oferecendo informações de alto esta valor [email protected]). e Santarem exploram[22]. e eConeglian, processar Fusco os dados dentro de Segundo um tempo[20] determinado requerem novos meios para processamento e análise dos pesquisa temnão como objetivo a eficientemente implementação de agente estar de informação atendendo as um necessidades Elvis –– Departamento da Computação (e-mail: Elvis Fusco Fusco Departamento de de Ciência Ciênciapor da Beyer Computação (e-mail: agregado às organizações. Tais informações podem exemplificam as características expostas e Laney, Beyer e Laney [2] define também tal conceito, dizendo que o extração contexto da ocorre Webvariados, que permita [email protected]). [email protected]). informacionais dos no usuários, pois problemas ema dados, permitindo uma melhor tomada de decisão, nova dispostassemântica em diversas bases e em formatos como vídeos dizendo quecontém o alto três volume dos dadosessências, dentro de Big volume, Data Big Data características o alto localização, tratamento e recuperação de informações no compreender documentos armazenados Web. No e fotos emo sentido mídias dos sociais. Contudo, dados nãonaestruturados descoberta do conhecimento e otimização de processos. a alta conjuntose dealta dados de grande alta velocidade variedade dasmagnitude; informações, que contexto douma Big grande Data nasdificuldade mais variadas informacionais contexto de arquitetura de Recuperação daa Informação, esta da representa apresentam parafontes recuperação Coneglian, Fusco e Santarem Segundo [20] exploram ee queinformação sirva decomo base para implementação de variedade remete a Fusco, heterogeneidade, complexidade requerem novosElvis meios para UNIVEM processamento e análise dos pesquisa tem objetivo aaimplementação um ambientes agente de Estadual não atendendo eficientemente as necessidades Caio Saraiva Coneglian, UNESP de – Universidade Paulista; – Centro exemplificam dos as características expostas por Beyer e Laney, informacionais quedos auxiliem o processo de que Recuperação dadosuma gerados, podendo ser de em decisão, formatos de extração semântica no usuários, contexto da Web permita da aem variabilidade informacionais pois ocorre problemas dados, permitindo melhor tomada nova Universitário Eurípides de Marília Informação, utilizando de ontologia para agregar semântica ao dizendo que o alto volume dos dados dentro de Big Data compreender o sentido dos documentos armazenados na Web. localização, tratamento e recuperação de informações noNo vídeos, figuras, textos entre outros e; a alta velocidade diz descoberta do conhecimento e otimização de processos. processo dedeBig recuperação apresentação dos resultados obtidos deedados de grande magnitude; a alta contexto uma arquitetura devariadas Recuperação dainformacionais Informação, esta representa contexto do Data nase mais fontes respeito ao conjuntos fluxo Fusco constante de consultas geradas em tempo real e Coneglian, Santarem Segundo [20] exploram aos usuários, conseguindo desta forma atender suas necessidades. implementação de um agente de variedade quepesquisa sirva tem de como base objetivo para a a implementação ambientes remete a heterogeneidade, complexidade e com informações para a tomada de decisão. exemplificam as características expostasalém por da Beyer e Laney,  extração semântica inclui conjuntos de dados com tamanhos capacidade no contexto da de WebRecuperação que permita informacionais que auxiliem o processo da a variabilidade dos dados gerados, podendo ser em formatos de Na publicação do Journal of [22] Big Data é queatual, o alto volume dosScience dados dentro degerenciar Big Data Palavras-Chaves—web semântica, agente deno dadizendo Resumo—utilizando Os dadosdedisponíveis naontologia, Web crescendo localização, tratamento e recuperação deestão informações tecnologia métodos eoutros teorias para capturar, Informação, ontologia para agregar semântica ao vídeos, figuras, textos entre e;grande a alta velocidade dizalta definido como a representação do andamento dos processos extração, recuperação da informação representa conjuntos de dados de magnitude; a exponencialmente, oferecendo de informacionais altoobtidos valor contexto Big Data nas maisinformações variadas processo de do recuperação e apresentação dos fontes resultados e processar os dados dentro de um tempo determinado [22]. ao humanos, fluxo constante de consultas geradas em tempo real cognitivos quea geralmente inclui conjuntos de dados agregado àsconseguindo organizações. informações podem estar respeito que sirva de base desta para Tais a implementação de ambientes variedade heterogeneidade, aos usuários, forma atender suas necessidades. e Laneyremete [2] define também tal conceito,complexidade dizendo que o e Abstract --The data available on the web are growing expo- Beyer informações para a da tomada de decisão. tamanhos dos além capacidade da tecnologia atual, de dispostas em diversas e em formatos variados, como vídeosda com informacionais quebases auxiliem o processo de Recuperação variabilidade dados gerados, podendo ser em formatos Big Data contém três características essências, o alto volume, information of highpara value to organizations. enentially, fotos emoffering mídias sociais. Contudo, dados não estruturados Informação, utilizando ontologia agregar semântica I. de Isemântica, NTRODUÇÃO Na publicação do capturar, Journal of Science [22] Big osData é e figuras, teorias para gerenciar dados Palavras-Chaves—web ontologia, agente de ao métodos vídeos, outros e; eaprocessar alta velocidade alta velocidade etextos alta entre variedade das informações, quediz Such information may be arranged in different bases and apresentam para adosrecuperação da definido processo degrande recuperação e apresentação resultados obtidos dentro decomo um tempo determinado. Beyer e Laney [2] define a representação do andamento dosem processos extração, recuperação dadificuldade informação s instituições e organizações estão diante de um universo respeito ao fluxo constante de consultas geradas tempo real requerem novos meios para processamento e análise dos in aos different formats like videos and photos social media. Big informação não atendendo eficientemente as necessidades usuários, conseguindo desta forma atenderin suas necessidades. Data como o que alto geralmente volume, alta velocidade alta cognitivos humanos, inclui conjuntos e/ou de dados onde unstructured ocorredos um usuários, aumento exponencial das informações com informações tomada de decisão. informacionais pois ocorre problemas em dados, permitindo para uma a melhor tomada de decisão, nova However, data present great difficulty for the variedade de informações que requerem novas formas de é tamanhos alémdodaJournal capacidade da tecnologia geradas tanto quanto externamente. O agente final do Na publicação of Science [22] Big atual, Data compreender o internamente sentido dosnot documentos armazenados na Web. Node com Palavras-Chaves—web semântica, ontologia, descoberta do conhecimento e otimização de processos. retrieval of information meet efficiently the information processamento para permitir melhor tomada de decisão, nova I.da INTRODUÇÃO e teorias para capturar, gerenciar e processar osprocessos dadose século XX iniciou uma era praticamente tudo o que é métodos contexto de uma arquitetura deonde Recuperação da Informação, esta definido como a representação do andamento extração, recuperação Coneglian, Fusco e Santarem Segundo [20] dos exploram needs of users, because it informação occurs trouble understanding the descoberta dohumanos, conhecimento e otimização de processos. pesquisa temdisponível comoe objetivo a implementação de um agente de dentro de um tempo determinado. Beyer e Laney [2] define gerado fica digitalmente, se tornando assim um cognitivos que geralmente inclui conjuntos de dados s instituições organizações estão diante de um universo exemplificam as características expostas por Beyer e Laney, meaning of Web documents. In the context of anpermita Informa-a extração desafio semântica noascontexto da Web que Nos ambientes de Bigvolume, Data apenas o da uso tecnologia de bancos de grande para mais avançadas tecnologias de Big Data como o alto alta velocidade e/ou alta com tamanhos além da capacidade atual, onde ocorre um aumento exponencial das informações tion Recovery architecture, this researchde aims to implement dizendorelacionais que o alto não volume dos dados para dentroa de Big Data localização, tratamento e recuperação informações no dados é adequado persistência, armazenamento, tratamento, e to análise de variedade I. quanto INTRODUÇÃO informações que de requerem formas de métodosde econjuntos teorias para gerenciar novas e processar os dados geradas tanto internamente Oallow final the do a semantic agent intransformação the externamente. Web fontes context representa de capturar, dados a alta contexto do extraction Big Data nas mais variadas informacionais processamento etempo recuperação dosgrande dadosmagnitude; em ambientes informações. Testando, assim, as áreas do tratamento e processamento para permitir melhor tomada de decisão, nova dentro de um determinado. Beyer e Laney [2] define século XX iniciou uma era onde praticamente tudo o que é s instituições e organizações estão diante de um universo retrieval, processing and retrieval of information in the conque sirva de base para a implementação de ambientes variedade e remete a heterogeneidade, complexidade e escaláveis Para tentar alta resolver esta questão recuperação da informação, no que diz volume, Big Datadoheterogêneos. como o alto volume, velocidade e/ou no alta conhecimento e otimização deser processos. informacionais que auxiliem o processo de Recuperação da text of onde Big in various informational sources to serveum as descoberta ocorre um digitalmente, aumento exponencial dasao informações gerado fica Data disponível se respeito tornando assim variabilidade dos dados gerados, podendo em formatos de da persistência da informação surgem conceitos variedade eutilizando velocidade de quanto uma inundação deO dados Informação, para agregar semântica aodo âmbito variedade de textos informações que requerem novas formas Nos ambientes de Big Data apenas usonovos de bancos de de a basis for the implementation of information environments geradas tanto internamente externamente. final grande desafio para de as ontologia mais avançadas tecnologias de vídeos, figuras, entre outros e; aooalta velocidade diz nas tecnologias de banco de dados, como NoSQL (Not Only processo de recuperação e apresentação dos resultados obtidos semiestruturados de natureza complexa. processamento para melhor tomada decisão, nova relacionais nãopermitir é deadequado para ade persistência, to século assist the of information retrieval using ontology XXprocess iniciou uma era transformação onde praticamente tudo o que é dados respeito ao fluxo constante consultas geradas em tempo real armazenamento, tratamento, e análise de que para De Diana e e Gerosa [4] deveio representar aosDentro usuários, conseguindo forma atender suas necessidades. desse contexto,desta surgiu um conceito de Big Data que SQL) descoberta do conhecimento otimização processos.

Recuperação da Informação em Ambientes Semânticos: uma ferramenta aplicada à publicações científicas

A

A A

e para recuperação dos dados em ambientes to gerado add semantics to the recovery process presentation fica Testando, disponível digitalmente, seand tornando assim of com informações a tomada de decisão. informações. assim, as áreas do tratamento eum processamento soluções alternativas ao modelo relacional, maior de classifica os dados gerados emto ambientes informacionais Nos ambientes de Big Data apenas ooferecendo uso de bancos escaláveis e heterogêneos. Para tentar resolver estaBig questão no results to users, thus being able meet their needs. grande desafio para as mais avançadas tecnologias de Na publicação do Journal of Science [22] Data recuperação da informação, no que dizontologia, respeito ao volume, Palavras-Chaves—web semântica, agente de escalabilidade e velocidade no armazenamento dos dadosé digitais, principalmente aqueles transformação que tem a Internet como de âmbito dados relacionais não é adequado para a persistência, da persistência da informação surgem novos conceitos armazenamento, tratamento, e análise definido como a representação do andamento dos processos extração, recuperação da informação variedade e Big velocidade de uma inundação de agent, dados Index Terms -- Data Semantic web, ontology, extracting surgindo como uma opção mais eficaz e barata. plataforma. é definido como representação do processamento e que recuperação dos em(Not ambientes de banco dados, como NoSQL Only informações.retrieval Testando, assim, as áreas do tratamento e nas cognitivos geralmente incluiodados conjuntos de dados semiestruturados de natureza complexa. information Otecnologias uso dehumanos, conceitos dede Business Intelligence e Inteligência andamento dos processos cognitivos humanos, que geralmente escaláveis e heterogêneos. Para tentar resolver esta questão no SQL) que para De Diana e Gerosa [4] veio representar recuperação da informação, no que diz respeito ao volume, com tamanhos além da capacidade da tecnologia atual, Dentro desse contexto, surgiu um conceito de Big Data que Competitiva e tecnologias como Data Warehouse, OLAP, âmbito da persistência da informação surgem novos conceitos modelo gerenciar relacional, oferecendo I. INTRODUÇÃO variedade velocidade de inundação de dados soluções métodos ealternativas teorias paraaocapturar, os maior dados classifica os edados gerados em uma ambientes informacionais Analytics, Datamining, NoSQL e robôs edeprocessar busca semântica Caio Saraiva Coneglian – Departamento de Ciência da Informação (e-mail: nas tecnologias de banco deno dados, comoeoLaney NoSQL (Not Only semiestruturados de natureza complexa. escalabilidade e velocidade armazenamento dos dados dentro de um tempo determinado. Beyer [2] define digitais, principalmente aqueles estão que tem a de Internet como s instituições e organizações diante um universo representam abordagens para capturar, gerenciar e analisar [email protected]). SQL) que para De Diana e Gerosa [4] veio representar Dentro desse contexto, surgiu um conceito Big Data Big Datacomo o opção alto Avolume, altae barata. velocidade e/ou alta umaData. mais eficaz Elvis Fusco – Departamento de exponencial Ciência da representação Computação (e-mail: plataforma. Big Data é definido como doque surgindo onde ocorre um aumento dasdeinformações cenários decomo Big necessidade da utilização dessas soluções alternativas aoBusiness modelo relacional, oferecendo maior [email protected]). classifica os dados gerados em ambientes informacionais variedade de informações que requerem novas formas de O uso de conceitos de Intelligence e Inteligência geradas tanto quanto externamente. O final do andamento dos internamente processos cognitivos humanos, que geralmente escalabilidade e velocidade no armazenamento dos dados digitais, que tem a tudo Internet processamento permitircomo melhorData tomada de decisão, nova e para tecnologias Warehouse, OLAP, século XX principalmente iniciou uma eraaqueles onde praticamente o quecomo é Competitiva surgindoDatamining, como uma opção barata. plataforma. Big Datadigitalmente, é definido se como representação descoberta do conhecimento emais otimização processos. NoSQL e eficaz robôsede busca semântica gerado fica Coneglian disponível tornando assim umdo Analytics, Caio Saraiva – Departamento de Ciência da Informação (e-mail: O uso de conceitos de Business Intelligence Inteligência andamento dos para processos cognitivos humanos, que geralmente Nos ambientes de Bigpara Datacapturar, apenas ogerenciar uso de eebancos de abordagens analisar [email protected]). grande desafio as mais avançadas tecnologias de representam Competitiva e tecnologias como Data Warehouse, OLAP, Elvis Fusco – Departamento de Ciência da Computação (e-mail: dados relacionais não Aé necessidade adequado para a persistência, de Big Data. da utilização dessas armazenamento, tratamento, transformação e análise de cenários Analytics, Datamining, NoSQLdos e robôs buscaambientes semântica [email protected]). processamento e recuperação dadosde em Caio SaraivaTestando, Coneglian – Departamento Ciência informações. assim, as de áreas doda Informação tratamento(e-mail: e representam abordagens para capturar, gerenciar e analisar [email protected]). escaláveis e heterogêneos. Para tentar resolver esta questão no recuperação da informação, no dequeCiência diz respeito ao volume, Elvis Fusco – Departamento da Computação (e-mail: cenários de Big Data. A necessidade da novos utilização dessas âmbito da persistência da informação surgem conceitos variedade e velocidade de uma inundação de dados [email protected]). nas tecnologias de banco de dados, como o NoSQL (Not Only semiestruturados de natureza complexa. Dentro desse contexto, surgiu um conceito de Big Data que 30SQL) que para De Diana e Gerosa [4] veio representar soluções alternativas ao modelo relacional, oferecendo maior classifica os dados gerados em ambientes informacionais escalabilidade e velocidade no armazenamento dos dados digitais, principalmente aqueles que tem a Internet como surgindo como uma opção mais eficaz e barata. plataforma. Big Data é definido como representação do

A

respei respe com comi Na Na defini defin cogni cogn com com métod méto dentro dentr Big Big D varied varie proce proce desco desco No No dados dado proce proce escalá escal âmbit âmbi nas nastet SQL) SQL) soluçõ soluç escala escal surgin surgi OO u Comp Com Analy Anal repres repre cenár cenár

Recuperação da Informação em Ambientes Semânticos: uma ferramenta aplicada a publicações científicas - Caio Saraiva Coneglian, Elvis Fusco (p. 30 a 37)

JADI - Marília - v.1 - 2015

tecnologiasnonotratamento tratamentodesses dessesdados dadosmassivos massivose ecomplexos complexos tecnologias estão causando uma mudança de paradigma que está levando estão causando uma mudança de paradigma que está levando as organizações a reexaminar sua infraestrutura de TI sua as organizações a reexaminar sua infraestrutura de TI e esua capacidade de análise e gestão corporativa da informação. capacidade de análise e gestão corporativa da informação. gestãoeficaz eficaze ea aanálise análisedededados dadosem emlarga largaescala escala AAgestão representam um interessante, mas crítico desafio, pois representam um interessante, mas crítico desafio, pois osos modelosdedegestão gestãobaseados baseadosnanaInteligência InteligênciaCompetitiva Competitivaestão estão modelos sendo influenciados por esse universo complexo sendo influenciados por esse universo complexo dede informaçõesgeradas geradascom como oconceito conceitodedeBig BigData Datae enovas novas informações investigações são necessárias para dar solução a esse desafio investigações são necessárias para dar solução a esse desafio usoeficiente eficientedas dasinformações informaçõesnonoprocesso processodedegestão. gestão. dedeuso No processo de busca da informação em cenáriosdada No processo de busca da informação em cenários Inteligência Competitiva e Big Data são utilizados robôsdede Inteligência Competitiva e Big Data são utilizados robôs extração de dados na Internet, que segundo Deters e Adaime extração de dados na Internet, que segundo Deters e Adaime [5] são sistemas que coletam os dados da Web e montam uma [5] são sistemas que coletam os dados da Web e montam uma basedededados dadosque queé éprocessada processadapara paraaumentar aumentara arapidez rapideznana base recuperaçãodedeinformação informaçãoe eque quesegundo segundoSilva Silva[18], [18],a a recuperação extraçãodedeinformações informaçõesrelevantes relevantespode podeclassificar classificaruma uma extração páginasegundo segundoum umcontexto contextodededomínio domínioe etambém tambémretirar retirar página informaçõesestruturando-as estruturando-ase earmazenando-as armazenando-asem embases basesdede informações dados. dados. Como opropósito propósitodedeadicionar adicionarsignificado significadoaos aosconteúdos conteúdos Com buscadosem emdomínio domínioespecífico específicoassociam-se associam-seaos aosrobôs robôsdede buscados buscananaWeb Webconceitos conceitossemânticos, semânticos,que quepermitem permitemrealizar realizara a busca procuranão nãomais maispor porpalavras palavraschaves chavesnum numprocesso processodedebusca busca procura textual,mas massim simpor porsignificado significadoe evalor, valor,extraindo extraindodas daspáginas páginas textual, e serviçosdadaWeb Webinformações informaçõesdedereal realrelevância, relevância,descartando descartando e serviços aquiloque queé édesnecessário. desnecessário.AApartir partirdisto, disto,a aontologia ontologiaaparece aparece aquilo comosolução soluçãonanabusca buscadedeinserir inserirsemântica semânticaneste nesteprocesso. processo. como ontologia,nonocontexto contextofilosófico, filosófico,é édefinida definidapor porSilva Silva AAontologia, [18]como comoa aparte partedadaciência ciênciaque queestuda estudao osersere eseus seus [18] relacionamentose eneste nestesentido, sentido,o ouso usodedeontologias ontologiasé é relacionamentos essencialnonoprocesso processodededesenvolvimento desenvolvimentodos dosrobôs robôsdedebusca busca essencial semântica,sendo sendoaplicada aplicadananaCiência CiênciadadaComputação Computaçãoe enana semântica, CiênciadadaInformação Informaçãopara parapossibilitar possibilitaruma umabusca buscadedemaneira maneira Ciência mais inteligente inteligente e e mais mais próxima próxima dodo funcionamento funcionamento dodo mais processocognitivo cognitivododousuário usuáriodedeforma formaque quea aextração extraçãodede processo dadossesetorne tornemuito muitomais maisrelevante. relevante. dados Atualmentevivencia-se vivencia-seuma umanova novadisrupção disrupçãotecnológica tecnológica Atualmente pela convergência convergência dada colaboração, colaboração, mobilidade mobilidade e e grande grande pela volumedededados dados(Big (BigData). Data).OOgrande grandedesafio desafiopara paraa apesquisa pesquisa volume sistemascomputacionais computacionaise epara paraa aforma formadedeuso usodas das dedesistemas informaçõesnas nasorganizações organizaçõesestá estáem empromover promovera aintegração integração informações destastecnologias tecnologiaspara parabalancear balancearasasnecessidades necessidadesdedegeração, geração, destas acesso e e controle controle destas destas informações, informações, bem bem como como asas acesso oportunidades deste deste comportamento comportamento emergente emergente e e suas suas oportunidades inovações. inovações. Estapesquisa pesquisatem temcomo comoobjetivo objetivocriar criaruma umaplataforma plataforma Esta semânticadedeRecuperação RecuperaçãodedeInformação InformaçãonanaWeb Webque quepermita permita semântica localização,armazenamento, armazenamento,tratamento tratamentoe erecuperação recuperaçãodede a alocalização, informaçõesinseridos inseridosem emum umcontexto contextodedeBig BigData, Data,nas nasmais mais informações variadas fontes informacionais na Internet que sirvam de base variadas fontes informacionais na Internet que sirvam de base para uma arquitetura computacional que transforme para uma arquitetura computacional que transforme a a informaçãodesagregada desagregadaem emum umambiente ambientededeconhecimento conhecimento informação estratégico, relevante, preciso e utilizável para permitiraos aos estratégico, relevante, preciso e utilizável para permitir usuários o acesso as informações com maior valor agregado, usuários o acesso as informações com maior valor agregado, queconsiga consigasatisfazer satisfazerasasnecessidades necessidadesinformacionais informacionaisdodo que 31

usuário,aderindo aderindouma umasemântica semânticaaoaoprocesso processodedeRecuperação Recuperação usuário, da Informação. da Informação. RECUPERAÇÃO DA INFORMAÇÃO DA INFORMAÇÃO II.II.RECUPERAÇÃO recuperaçãodadainformação informaçãotem temsesetornado tornadoalvo alvodedemuitos muitos AArecuperação estudos, devido à grande quantidade de informações que hoje estudos, devido à grande quantidade de informações que hoje se encontram espalhados pela rede. se encontram espalhados pela rede. recuperaçãodadainformação informaçãolida lidacom coma arepresentação, representação, AArecuperação armazenamento, organização e acesso as informações. armazenamento, organização e acesso as informações. Devendo prover ao usuário aquilo que ele necessita uma Devendo prover ao usuário aquilo que ele necessita dedeuma maneira facilitada [21]. maneira facilitada [21]. conceitodederecuperação recuperaçãodedeinformação informaçãoé édiferente diferentedede OOconceito recuperação de dados. A recuperação de dados consisteem em recuperação de dados. A recuperação de dados consiste extrair de um banco de dados qualquer documento que contém extrair de um banco de dados qualquer documento que contém umaexpressão expressãoregular regularououosostermos termosalialicontidos. contidos.Sendo Sendoque quea a uma recuperação da informação vai além, levando em conta recuperação da informação vai além, levando em conta a a sintaxee ea asemântica semânticadaquela daquelainformação, informação,buscando buscandosatisfazer satisfazer sintaxe o que o usuário está pesquisando [21]. o que o usuário está pesquisando [21]. Destamaneira maneiraa arecuperação recuperaçãodadainformação informaçãotem temassumido assumido Desta um papel diferenciado na Ciência da Informação e na Ciência um papel diferenciado na Ciência da Informação e na Ciência da Computação, pois aparece como elo final na busca pela da Computação, pois aparece como elo final na busca pela apresentação da informação mais adequada ao usuário apresentação da informação mais adequada ao usuário nono menortempo tempopossível. possível. menor O processo recuperaçãodadainformação informaçãonão nãoconsiste consiste O processo dederecuperação apenas em em técnicas técnicas e e métodos métodos que que envolvem envolvem o o apenas armazenamentoe eososalgoritmos algoritmosdederecuperação, recuperação,mas mastambém também armazenamento emadaptar adaptar osos sistemas sistemas nono comportamento comportamento dodo usuário, usuário, em entendendodesta destamaneira, maneira,como comoé aé construção a construçãodadainformação informação entendendo e dasinstruções instruçõespara paraa recuperação a recuperaçãodadainformação informação[17]. [17]. e das Como osurgimento surgimentodadaWeb Webhouve houvegrande grandeaumento aumentonono Com volumedas dasinformações informaçõeseletrônicas, eletrônicas,que quetrouxeram trouxerammuitas muitas volume vantagens quanto quanto à à possibilidade possibilidade dede troca, troca, difusão difusão e e vantagens transferênciadededados. dados.Entretanto, Entretanto,este estecrescimento crescimentotrouxe trouxe transferência muitosproblemas problemasrelacionados relacionadosaoaoacesso, acesso,busca buscae erecuperação recuperação muitos dasinformações informaçõesdedereal realvalor valorimerso imersoem emgrandes grandesvolumes volumesdede das dados[14]. [14]. dados Assim,um umdos dosdesafios desafiosdadarecuperação recuperaçãodadainformação informaçãoé é Assim, conseguirfazer fazercom comososAmbientes AmbientesInformacionais InformacionaisDigitais Digitais conseguir entendamo oque queo ousuário usuárioestá estánecessitando, necessitando,dedeforma formaque queosos entendam resultadosvindos vindosdadabusca buscapossam possamserserdedereal realvalor valore e resultados importânciapara parao ousuário. usuário. importância termoRecuperação RecuperaçãodadaInformação Informaçãofoifoitrazido trazidopela pela OOtermo primeiravez vezem em1951, 1951,por porMooers Mooers[15], [15],quando quandodefiniu definiuosos primeira problemasque queseriam seriamtratados tratadospor poresta estanova novadisciplina. disciplina.Desta Desta problemas maneiraa aRecuperação RecuperaçãodadaInformação Informaçãotrata tratados dosaspectos aspectosdada maneira descriçãoe eespecificação especificaçãodas dasbuscas buscasdadainformação. informação.Tratando Tratando descrição tambémdedequalquer qualquersistema, sistema,técnicas técnicase emáquinas máquinasutilizadas utilizadas também processodederecuperação recuperaçãodadainformação. informação. nonoprocesso Destamaneira maneirao oprocesso processodedeRecuperação RecuperaçãodadaInformação, Informação, Desta consisteem emencontrar encontrarem emum umconjunto conjuntodededocumentos documentosdedeum um consiste sistema, quais quais são são osos que que atendem atendem àsàs necessidades necessidades sistema, informacionais dodo usuário. usuário. Assim, Assim, o o usuário usuário não não está está informacionais interessadoem emrecuperar recuperardados, dados,nem nemachar achardocumentos documentosque que interessado satisfaçamsua suaexpressão expressãodedebusca, busca,e esim simem emencontrar encontrara a satisfaçam informaçãosobre sobreum umdeterminado determinadoassunto assunto[7]. [7]. informação Assimosossistemas sistemasdedeRecuperação RecuperaçãodedeInformação Informaçãodevem devem Assim representarososdocumentos documentose eapresenta-los apresenta-losaos aosusuários usuáriosdede representar

Recuperação da Informação em Ambientes Semânticos: uma ferramenta aplicada a publicações científicas - Caio Saraiva Coneglian, Elvis Fusco (p. 30 a 37)

JADI - Marília - v.1 - 2015

maneira que, que, o o usuário usuário através através daqueles daqueles documentos documentos domínio, domínio, servindo assim base para a comunicação entre servindo assim dede base para a comunicação entre osos maneira recuperados consigam satisfazer total parcialmente suas agentes, agentes, e e para para conseguir conseguir fazer fazer suas suas extrações extrações nono recuperados consigam satisfazer total ouou parcialmente asas suas necessidades informacionais [7]. conhecimentoememque queeles elesestão estãopresentes. presentes.Gruber Gruberainda aindadizdiz conhecimento necessidades informacionais [7]. quea aontologia ontologiaé éuma umaespecificação especificaçãoexplícita explícitadedeuma uma que Recuperação Informação Web A.A.Recuperação dada Informação nana Web conceitualização. conceitualização. Como ogrande grandeaumento aumentonanaWeb, Web,ultimamente ultimamenteo ofoco focodede Com PosteriormenteBorst Borst[3][3]complementa complementaesta estadefinição definiçãodede Posteriormente pesquisas relacionadas a Recuperação Informação tem sido Gruber pesquisas relacionadas a Recuperação dada Informação tem sido Gruber dizendo que a ontologia é uma especificação formal dizendo que a ontologia é uma especificação formal dede como conseguir recuperar dados Web. como conseguir recuperar osos dados dada Web. umaconceitualização conceitualizaçãocompartilhada. compartilhada.Desta Destamaneira maneiratraz trazque que uma grande desafio recuperação informação Web OO grande desafio dada recuperação dada informação nana Web é oé o umum dos dos principais principais objetivos objetivos dada ontologia ontologia é é o o fatoque queesta estafoifoiconstruída construídadedemaneira maneiradescentralizada, descentralizada,dede compartilhamento fato compartilhamento para o reuso destas informações. para o reuso destas informações. formaque quemuitas muitasestratégias estratégiasdedebuscas buscascitadas citadasa acima, cima,não não forma Segundo Santarém Segundo [17] a Ciência Computação Segundo Santarém Segundo [17] a Ciência dada Computação conseguem bom funcionamento. conseguem terter umum bom funcionamento. utilizoua aontologia ontologiaquando quandose serefere referea aaquisição aquisiçãodede utilizou Segundo Santarem Segundo [17] Segundo Santarem Segundo [17] p. p. 39:39: conhecimentosa partir a partirdededados dadossemiestruturados, semiestruturados,utilizando utilizando conhecimentos “[...]Dentro Dentrodedeuma umanova novadimensão dimensãocomo comoa Internet, a Internet,fica fica dada “[...] ontologia para aplicar técnicas e métodos, para processar ontologia para aplicar técnicas e métodos, para processar asas visívelo oesgotamento esgotamentodedealternativas alternativascom comrelação relaçãoa aesses esses informações. visível informações. modelos conhecidos, visto que existe uma clara mudança modelos já já conhecidos, visto que existe uma clara mudança dodo Santarém Segundoainda ainda que ontologias vêm com Santarém Segundo dizdiz que asas ontologias vêm com oo corpus consulta. Com a introdução Internet contexto principal corpus dede consulta. Com a introdução dada Internet nono contexto principal objetivodede vocabuláriocompartilhado, compartilhado,onde onde objetivo terter umum vocabulário usuário,passa-se passa-sea ter a terumum depósitodedeinformações informaçõesmuito muito essas dodousuário, depósito essasinformações informaçõespossam possamsersertrocadas, trocadas,e usadas e usadaspara paraoutros outros maisamplo, amplo,que quecarrega carregaconsigo consigoa ligação a ligaçãodededocumentos documentose e usuários. mais usuários.Sendo Sendoque queestes estesusuários usuáriossãosãotanto tantoseres sereshumanos humanos informaçõesatravés atravésdedelinks, links,criando criandouma umainterligação interligaçãoentre entre quanto informações quanto agentes inteligentes. agentes inteligentes. documentos armazenados e disponíveis rede[...]”. osos documentos armazenados e disponíveis nana rede[...]”. Partindodisto, disto,Guarino Guarino[10] [10]diferencia diferenciaosostipos tiposdede Partindo Um dos métodos mais utilizados ultimamente para realizar ontologia, Um dos métodos mais utilizados ultimamente para realizar ontologia, acordo com utilização: dede acordo com suasua utilização: buscadadainformação informaçãonanaWeb, Web,é éo ométodo métodoPage PageRanking. Ranking. a abusca Ontologiadedetopo topo(top-level (top-level ontology):tem tem umafunção função • •Ontologia ontology): uma Este método proposto pelo Google, e funciona maneira dede Este método foifoi proposto pelo Google, e funciona dede maneira descrever conceitos gerais, como o tempo, objeto, matéria, descrever conceitos gerais, como o tempo, objeto, matéria, que verifica a importância site, através quantidade e que que se se verifica a importância dede umum site, através dada quantidade e que não estão dentro problema domínio particular. não estão dentro dede umum problema ouou domínio particular. vezes que este site é citado outros, seja, quanto mais É Éaplicado dede vezes que este site é citado porpor outros, ouou seja, quanto mais aplicadonanaconceitualização conceitualizaçãodedeconceitos conceitosmuito muitograndes grandese e vezesaparecer aparecero olink linkdedeuma umapágina páginaememoutras outraspáginas, páginas, utilizados vezes utilizados grandes comunidades usuários; emem grandes comunidades dede usuários; indicam grau importância. forma que mecanismos indicam gogo grau dede importância. DeDe forma que osos mecanismos Ontologiadededomínio domínio(domain (domainontology): ontology):já játem temuma uma • •Ontologia buscaindexam, indexam,e ordenam e ordenamosossites sitespela pelasuasuaimportância, importância, função dedebusca funçãodede descrever conceitos domínioparticular. particular. São descrever conceitos dede umum domínio São que é definida pelo algoritmo Page Ranking [17]. que é definida pelo algoritmo dede Page Ranking [17]. exemplosdisto, disto,áreas áreasdodoconhecimento, conhecimento,como comomedicina, medicina, exemplos Verifica-se,portanto, portanto,a anecessidade necessidadededebuscar buscarnovas novas ciência Verifica-se, ciência computação, entre outros; dada computação, entre outros; maneiras realizar a recuperação informação, neste novo maneiras dede realizar a recuperação dada informação, neste novo Ontologia tarefa (task ontology): resolvem uma tarefa • •Ontologia dede tarefa (task ontology): resolvem uma tarefa ambiente, chamado Web, onde informações dos mais (um ambiente, chamado dede Web, onde asas informações sãosão dos mais (um problema) dentro domínio. seja, dentro problema) dentro dede umum domínio. OuOu seja, dentro dede umum variáveistipos, tipos,onde ondeososmotores motoresdedebusca, busca,apresentam apresentamuma uma domínio, variáveis domínio, trata algo específico, como uma doença dentro trata dede algo específico, como uma doença dentro dada quantidade muito grande links e páginas para que o usuário medicina, quantidade muito grande dede links e páginas para que o usuário medicina, compra e vendas veículos. ouou compra e vendas dede veículos. possa encontrar o que atende a sua necessidade. possa encontrar o que atende a sua necessidade. Ontologia dede aplicação aplicação (application (application ontology): ontology): • •Ontologia terceirocapítulo capítuloserá seráabordado abordadoo otema temadadaontologia, ontologia, descrevem NoNoterceiro descrevemconceitos conceitostanto tantodedeumumdomínio domínioespecífico específicoquanto quanto ondeneste nestetrabalho, trabalho,faz-se faz-seuso usodedeontologias ontologiaspara parapoder poder dede onde uma tarefa, que especializações ambas ontologias. uma tarefa, que sãosão especializações dede ambas asas ontologias. aprimoraro oprocesso processodedeRecuperação RecuperaçãodadaInformação Informaçãoneste neste Estes aprimorar Estesconceitos conceitoscorrespondem correspondema apapéis papéisdesempenhados desempenhadosporpor ambiente Web. ambiente dada Web. entidades domínio durante a execução uma atividade. entidades dede domínio durante a execução dede uma atividade. Berners-Lee que para uma semântica dentro web Berners-Lee [1][1] dizdiz que para uma semântica dentro dada web ONTOLOGIA III.III.ONTOLOGIA funcione,é éimportante importanteque quea amáquinas máquinastenham tenhamacesso acessoa a funcione, palavra ontologia vem ontos (ser, ente) e logos (saber, coleções AA palavra ontologia vem dede ontos (ser, ente) e logos (saber, coleções estruturadas informações e quetenham tenham regras estruturadas dedeinformações e que regras dede doutrina),e ededemaneira maneiraestrita estritasignifica significao o“estudo “estudododoser”. ser”. inferências doutrina), inferênciasque queconduzam conduzama amáquina máquinanonoprocesso processodedebusca busca Surgiu estudo filósofos, ainda época Aristóteles, Surgiu dodo estudo dede filósofos, ainda nana época dede Aristóteles, e e automatizada. automatizada. usadaneste nestecontexto contextopara parafazer fazeruma umaabordagem abordagemdodoserser eraerausada Dentrodeste desteprocesso processoa aontologia ontologiaaparece aparececomo comouma uma Dentro enquanto ser, seja uma maneira geral. Mais tarde solução enquanto ser, ouou seja dodo serser dede uma maneira geral. Mais tarde soluçãoneste nestesentido, sentido,pois poisa aontologia, ontologia,conforme conformevisto vistonos nos aindananafilosofia, filosofia, o termoontologia ontologia passou a ser mais usado conceitos ainda o termo passou a ser mais usado conceitos apresentados acima, será conjunto estruturado apresentados acima, será umum conjunto estruturado dede para saber aquiloque que é fundamental irredutível, comum para saber aquilo é fundamental ououirredutível, comum a a informações. informações. todos seres. todos osos seres. Metodologia para Construção Ontologias A.A.Metodologia para Construção dede Ontologias DentrodadaComputação, Computação,Guarino Guarino[9][9]dizdizque quea ontologia a ontologiaé é Dentro Váriasmetodologias metodologiasforam foramdesenvolvidas desenvolvidaspara parafazer fazera a Várias umateoria teorialógica lógicaque querepresenta representaumumvocabulário vocabuláriopretendido, pretendido, uma construção da ontologia, ou seja, a engenharia da ontologia. construção da ontologia, ou seja, a engenharia da ontologia. seja, é uma contextualização algo particular existente ouou seja, é uma contextualização dede algo particular existente nono Falbo que independente domínio, a construção Falbo [6][6] dizdiz que independente dodo domínio, a construção dede mundo. Neste sentido observa-se que com uma ontologia você mundo. Neste sentido observa-se que com uma ontologia você uma ontologia é uma tarefa bastante complexa, e a partir disto, uma ontologia é uma tarefa bastante complexa, e a partir disto, consegue definir contextos e domínios particulares mundo. consegue definir contextos e domínios particulares dodo mundo. algunsmecanismos mecanismosdededecomposição decomposiçãosãosãonecessários necessáriospara para Gruber que contexto múltiplos agentes, Gruber [8][8] dizdiz que emem umum contexto dede múltiplos agentes, a a alguns facilitar este processo. facilitar este processo. ontologiapoderia poderiadefinir definiro ocontexto, contexto,o ovocabulário vocabuláriodaquele daquele ontologia 32

Recuperação da Informação em Ambientes Semânticos: uma ferramenta aplicada a publicações científicas - Caio Saraiva Coneglian, Elvis Fusco (p. 30 a 37)

JADI - Marília - v.1 - 2015

interessante notar que não existe uma metodologia ÉÉ interessante interessantenotar notarque quenão nãoexiste existeuma umametodologia metodologia É Éinteressante notar que não existe uma metodologia definida de como se deve construir uma ontologia, não definida de como se deve construir uma ontologia, não É interessante notar que construir não existeuma umaontologia, metodologia definida de como se deve não definida deum como se deve construir uma ontologia, não existindo consenso de qual metodologia se deva utilizar, existindo um consenso de qual metodologia se deva utilizar, definida de como se de deve construir uma seontologia, não existindo um consenso qual metodologia deva utilizar, existindo um consensoosdedesenvolvedores qual metodologia se deva utilizar, assim, normalmente acabam fazendo sua assim, ososdesenvolvedores acabam sua existindo um consenso de qual metodologia se fazendo deva utilizar, assim,normalmente normalmente desenvolvedores acabam fazendo sua assim, normalmente os desenvolvedores acabam fazendo sua própria metodologia [13]. própria metodologia [13]. assim, normalmente os desenvolvedores acabam fazendo sua própria metodologia [13]. própria metodologia [13]. Para aametodologia construção da ontologia deste trabalho, utilizada Para a construção da[13]. ontologia deste trabalho, foifoi utilizada a aa própria Para construção da ontologia deste trabalho, utilizada Para a construção da ontologia deste trabalho, foifoiutilizada a Metodologia definida por Noy e McGuiness [16], que Metodologia definida por Noy e McGuiness [16], que Para a construção da ontologia trabalho, foi utilizada a Metodologia definida por Noy Noydeste e McGuiness McGuiness [16], que que Metodologia definida por e [16], explicam uma forma realizar aaeengenharia ontologia. explicam uma forma dede sese realizar a engenharia dada ontologia. Metodologia definida por Noy McGuiness [16], que explicam uma forma de se realizar engenharia da ontologia. explicam uma formaNoy de see realizar a engenharia da ontologia. Neste contexto McGuiness [16] definiu como deve Neste Noy e McGuiness explicam uma forma de realizar a [16] engenharia dacomo ontologia. Nestecontexto contexto Noy ese McGuiness [16]definiu definiu comodeve deve Neste contexto Noy e McGuiness [16] definiu como deve ser o processo da construção da ontologia, para que esta serseroNeste processo dadaNoy construção dadaontologia, para que esta contexto e McGuiness [16] definiu como deve o processo construção ontologia, para que esta serontologia o processo da falha, construção da ontologia, para que esta não seja e não apresente defeitos durante o seu ontologia não seja falha, e não apresente defeitos durante o seu ser o processo dafalha, construção da ontologia, para que esta ontologia não seja e não apresente defeitos durante o seu ontologia não seja falha, e não apresente defeitos durante o seu funcionamento. funcionamento. ontologia não seja falha, e não apresente defeitos durante o seu funcionamento. funcionamento. Noy McGuiness [16] explica ossete sete passos que são Noy funcionamento. Noyee eeMcGuiness McGuiness[16] [16]explica explicaos setepassos passosque quesão são Noy McGuiness [16] explica ososontologia, sete passos que são necessários para a construção de uma esses passos necessários a construção uma ontologia, esses passos Noy e para McGuiness [16] de explica osontologia, sete passos que são necessários para a construção de uma esses passos necessários para aabaixo: construção de uma ontologia, esses passos estão descritos Determinar ooDomínio Domínio Escopo estão abaixo: 1)1) Determinar oee ooEscopo necessários para a construção de umao ontologia, passos estãodescritos descritos abaixo: 1) Determinar Domínioeeesses Escopo estão descritos abaixo: 1) Determinar o Domínio o Escopo da Ontologia; 2) Reutilizar Ontologias Existentes; 3) Levantar daestão Ontologia; 2) Reutilizar Ontologias Existentes; 3) Levantar descritos abaixo: 1) Determinar o Domínio e o Escopo daOntologia; Ontologia;2)2)Reutilizar ReutilizarOntologias OntologiasExistentes; Existentes;3)3)Levantar Levantar datermos importantes; Definir classes sua hierarquia; termos importantes; 4)4) classes e eesua 5)5) da Ontologia; 2) Reutilizar Ontologias 3) Levantar termos importantes; 4)Definir Definir classesExistentes; suahierarquia; hierarquia; 5) termos importantes; 4) Definir classes e sua hierarquia; 5) Definir propriedades das classes; 6) Restrições das Definir Restrições das termos importantes; Definir classes6)e6) sua hierarquia; 5) Definir propriedades propriedades4)das das classes; classes; Restrições das Definir propriedades das classes; 6) Restrições das Propriedades; Criação de instâncias. Propriedades; 7)7) Criação dedas instâncias. Definir propriedades classes; 6) Restrições das Propriedades; Criação instâncias. Propriedades; 7)7)Criação dedeinstâncias. A partir destes passos, é possível então, construir uma A Apartir destes passos, é possível Propriedades; 7) Criação de instâncias. partirdestes destespassos, passos,é épossível possívelentão, então,construir construiruma uma A partir então, construir uma ontologia que siga regras, e tenha uma boa consistência.A ontologia que siga boa A partir destes passos, possível então, construir uma ontologia que sigaregras, regras,ee éetenha tenhauma uma boaconsistência.A consistência.A ontologia que siga regras, tenha uma boa consistência.A partir destes passos, é possível então, construir uma ontologia partir destes passos, possível construir ontologia ontologia que sigaé regras, eentão, tenha uma boauma consistência.A partir destes passos, possível então, construir uma ontologia partir destes passos, é épossível então, construir uma ontologia que siga regras, e tenha uma boa consistência. que siga regras, e tenha boa consistência. partir destes passos, éuma possível então, construir uma ontologia que siga regras, e tenha uma boa consistência. que siga regras, e tenha uma boa consistência. que siga regras, e tenha uma boa consistência. IV. A IV. RQUITETURA IV.A ARQUITETURA RQUITETURA IV. ARQUITETURA IV. ARQUITETURA sistemas de informação tradicionais são incapazes de OsOs sistemas de informação sistemasdedeinformação informaçãotradicionais tradicionaissão sãoincapazes incapazesde OsOssistemas tradicionais são incapazes dede lidar de forma eficiente com todas as novas fontes de dados lidar dede forma com todas as asnovas dededados Os sistemas de informação tradicionais são incapazes de lidar formaeficiente eficiente com todas novasfontes fontes dados lidar de forma eficiente com todas as de novas fontes de que dados dinâmicas e de contextos múltiplos informações têm dinâmicas e de contextos múltiplos de informações que têm lidar de forma eficiente com todas as novas fontes de dados dinâmicase ededecontextos contextosmúltiplos múltiplosdedeinformações informaçõesque quetêm têm dinâmicas principalmente aacontextos Internet como plataforma. principalmente a Internet como plataforma. dinâmicas e de múltiplos de informações que têm principalmente Internet como plataforma. principalmente a Internet como plataforma. São encontrados problemas recuperar, padronizar, São problemas emem principalmente a Internet como plataforma. Sãoencontrados encontrados problemas emrecuperar, recuperar,padronizar, padronizar, São encontrados problemas em recuperar, padronizar, armazenar, processar e utilizar informações geradas por armazenar, processar geradas por São encontrados em recuperar, padronizar, armazenar, processareproblemas eutilizar utilizarinformações informações geradas por armazenar, processar e utilizar informações geradas por diversas fontes heterogêneas que servem de base para diversas heterogêneas que servem base armazenar, processar e utilizar por diversasfontes fontes heterogêneas queinformações servemde degeradas basepara para diversas fontes heterogêneas que servem de base para alimentar sistemas apoio àà decisão das organizações. alimentar osos sistemas dede apoio à decisão das organizações. diversas fontes heterogêneas que servem de base para alimentar sistemas apoio decisão das organizações. alimentar osossistemas dede apoio à decisão das organizações. Para resolver esta problemática foi proposta criação de Para resolver esta problemática foi proposta alimentar os sistemas de apoio à decisão das organizações. Pararesolver resolveresta estaproblemática problemáticafoifoiproposta propostaaa aacriação criaçãode de Para criação dede uma arquitetura de Recuperação de Informação no contexto uma arquitetura de Recuperação de Informação no contexto de Para resolver esta problemática foi proposta a criação de uma arquitetura de Recuperação de Informação no contexto uma arquitetura de Recuperação deFigura Informação no contexto dede Big Data como pode ser visto Big Data como pode visto nana Figura 1. 1. uma arquitetura de ser Recuperação de Informação no contexto de Big Data como pode ser visto na Figura 1. Big Data como pode ser visto na Figura 1. Big Data como pode ser visto na Figura 1.

Figura Arquitetura Contextualização Agente Figura 1: 1: Arquitetura dede Contextualização dodo Agente Figura Arquitetura de Contextualização Agente Figura 1:1:Arquitetura de Contextualização dodoAgente Semântico Semântico Figura 1: Arquitetura de Contextualização do Agente Semântico Semântico arquitetura proposta, contempla ideia deserserrealizada realizada AA Semântico Aarquitetura arquiteturaproposta, proposta,contempla contemplaaa aideia aideia ideiade realizada A arquitetura proposta, contempla dedeserserrealizada uma recuperação de informações tanto em ambientes internos uma recuperação de informações tanto em ambientes internos A arquitetura proposta, contempla a ideia de ser realizada uma recuperação de informações tanto em ambientes internos uma recuperação dequanto informações tanto em ambientes internos (banco de dados) externos (Web), utilizando-se deumum (banco de dados) quanto externos (Web), utilizando-se de uma recuperação de informações tanto em ambientes internos (banco de dados) quanto externos (Web), utilizando-se um (banco dededados) quanto externos (Web), utilizando-se dedeum agente extração, que para analisar o domínio da informação agente de extração, que para analisar o domínio da informação (banco de dados) quanto externos (Web), utilizando-se de um agente de extração, que para analisar o domínio da informação agente deontologias. extração, que para analisar o domínio da informação usa usa dede ontologias. agente de extração, que para analisar o domínio da informação usa ontologias. usa dedeontologias. usa de ontologias.

Este trabalho tratará das camadas espaço semântico, do Este trabalho das camadas dodo espaço Este trabalhotratará tratará das camadas espaçosemântico, semântico,do do Este trabalho tratará das camadas dodoespaço semântico, doda Agente Semântico e do Espaço Informacional. Tratando dodo Agente Semântico e do Espaço Informacional. Tratando da Este trabalho trataráe das camadas do espaço semântico, do do Agente Semântico do Espaço Informacional. Tratando doquestão Agente Semântico e do Espaço Informacional. Tratando dada recuperar, processar utilizar informações questão dede recuperar, processar e eeutilizar informações do Agente Semântico e do Espaço Informacional. Tratando da questão de recuperar, processar utilizar informações questão de recuperar, processar e utilizar informações diversas. diversas. questão diversas. de recuperar, processar e utilizar informações diversas. Neste trabalho foiconstruído construído esta arquitetura de forma Neste diversas. Nestetrabalho trabalhofoi construídoesta estaarquitetura arquiteturade deforma forma Neste trabalho foifoiconstruído esta arquitetura deonde forma parcial, sendo realizado o espaço semântico, parcial, sendo realizado o espaço semântico, onde foifoi Neste sendo trabalhorealizado foi construído esta semântico, arquitetura de forma parcial, o espaço onde parcial, sendo realizado o Também espaço semântico, onde foifoi construída uma ontologia. foi utilizado o Agente construída uma ontologia. Também foi utilizado o Agente parcial, sendo realizado oTambém espaço foi semântico, onde foi construída uma ontologia. utilizado o Agente construída uma ontologia. Também foi informacional. utilizado o Agente Semântico de Extração ooespaço espaço Sendo Semântico deuma Extração e eeo Também informacional. construída ontologia. foiinformacional. utilizado o Sendo Agente Semântico de Extração espaço Sendo Semântico de Extração o espaço informacional. Sendo também construída toda aae relação entre estes espaços. também construída toda a relação entre estes espaços. Semântico de Extração erelação o espaço informacional. também construída toda entre estes espaços. Sendo também construída toda a relação entre estes espaços. Esta arquitetura busca provar oouso uso ontologias para Esta dede também construídabusca toda aprovar relação estes espaços. Estaarquitetura arquitetura busca provarooentre uso deontologias ontologiaspara para Esta arquitetura busca provar uso de ontologias para conseguir inserir semântica, dentro de um contexto de Big conseguir inserir semântica, dentro umum contexto dedeBig Esta arquitetura busca provar odede uso de ontologias para conseguir inserir semântica, dentro contexto Big conseguir inserir semântica, dentro de grande um contexto de Big Data, que faz uso de um número muito de informações. Data, que fazfaz uso dede umum número muito grande informações. conseguir inserir semântica, dentro degrande um de contexto de Big Data, que uso número muito de informações. Data,Para queprovar faz usoisto, de um número muito grandededemaneira informações. este projeto, funciona que, Para provar este dedemaneira que, Data, faz isto, uso de umprojeto, número muito grande de informações. Paraque provar isto, este projeto,funciona funciona maneira que,oo oo Para provar isto, este projeto, funciona de maneira que, espaço informacional são bases de dados de artigos científicos, espaço informacional bases dede dados dede artigos científicos, Para provar isto, são este projeto, funciona de maneira que, o espaço informacional são bases dados artigos científicos, espaço informacional são bases de dados de artigos científicos, no caso, utilizado base dados do IEEE Xplore noespaço caso, foifoi utilizado a aabase dede dados IEEE Xplore informacional são bases dados dedoartigos científicos, no caso, foi utilizado base de dados do IEEE Xplore no(http://ieeexplore.ieee.org). caso, foi utilizado a base de dados do IEEE Xplore (http://ieeexplore.ieee.org). no caso, foi utilizado a base de dados do IEEE Xplore (http://ieeexplore.ieee.org). (http://ieeexplore.ieee.org). figura 2,é éémostrado mostrado processo feito pelo sistema. O NaNa figura (http://ieeexplore.ieee.org). figura2, mostradooo ooprocesso processofeito feitopelo pelosistema. sistema.O NaNafigura 2,2,éuma mostrado processo feito pelo sistema. OO usuário realiza busca sobre algum tema, o agente extrai usuário uma busca algum tema, extrai Na realiza figura 2, é mostrado o processo feito sistema. O usuário realiza uma buscasobre sobre algum tema,oopelo oagente agente extrai usuário realiza uma busca sobre algum tema, agente extrai das bases de dados resumos referentes a este tema. Estes das bases de dados resumos referentes a este tema. Estes usuário realiza uma busca sobre algum tema, o agente extrai dasbases basesdededados dadosresumos resumosreferentes referentesa aeste estetema. tema.Estes Estes das resumos irão passar por um processo, estes serão resumos irão das bases depassar dados resumos referentes a onde esteestes tema. Estes resumos irão passarpor porum umprocesso, processo,onde onde estesserão serão resumos irão passar por um processo, onde estes serão analisados, levando consideração aspalavras palavras contidas analisados, levando emem sese contidas resumos passar por um processo, onde estes serão analisados,irão levando emconsideração consideração seas palavras contidas analisados, levando em consideração sedomínio asaspalavras contidas neste resumo, estão presentes no daquele tema neste resumo, estão presentes no domínio daquele tema analisados, levando em consideração se as palavras contidas nesteresumo, resumo,estão estãopresentes presentesnonodomínio domíniodaquele daqueletema tema neste procurado. Isto será possível, utilizando uma ontologia procurado. Isto será uma ontologia neste resumo, presentes no domínio daquele tema procurado. Istoestão serápossível, possível,utilizando utilizando uma ontologia procurado. Isto será possível, utilizando uma ontologia construída, que trata tema específico área de construída, umum específico nana área procurado. Istotrata serádede possível, utilizando uma ontologia construída,que que trata umtema tema específico áreade construída, que trata dedeum tema específico nanaárea dede pesquisa científica. pesquisa científica. construída, que trata de um tema específico na área de pesquisa científica. pesquisa científica. Neste trabalho, ontologia trata-se da área de Banco de Neste trabalho, pesquisa científica. Nestetrabalho, trabalho,aa aaontologia ontologiatrata-se trata-seda daárea áreade deBanco Bancode de Neste ontologia trata-se da área de Banco de Dados, portanto, processo funcionará buscas Dados, este processo funcionará buscas Nesteportanto, trabalho, a este ontologia trata-se da área por depor Banco de Dados, portanto, este processo funcionará por buscas Dados, portanto, este processo funcionará por buscas realizadas neste domínio. realizadas neste domínio. Dados, portanto, este processo funcionará por buscas realizadas neste domínio. realizadas neste domínio. realizadas neste domínio.

Figura Processo realizado pelo sistema extração Figura 2: 2: Processo realizado pelo sistema dede extração Figura Processo realizado pelo sistema extração Figura 2:2:Processo realizado pelo sistema dedeextração possível verificar que o processo é finalizado quando ÉÉ possível verificar que o processo é finalizado quando Figura 2: Processo realizado pelo sistema de extração É possível verificar que o processo é finalizado quandoéé éé É possível verificar que oinformações processo é extraídas finalizadopelo quando apresentado ao usuário as agente, apresentado ao usuário as informações extraídas pelo É possível verificar que o processo é finalizado quando é apresentadoaoaousuário usuárioasasinformações informaçõesextraídas extraídaspelo peloagente, agente, apresentado agente, após passar pela ontologia. Buscando apresentar um resultado após passar pela ontologia. Buscando apresentar um resultado apresentado ao usuário as informações extraídas pelo agente, apóspassar passarpela pelaontologia. ontologia.Buscando Buscandoapresentar apresentarum umresultado resultado após mais consistente, com uma semântica bem estruturada. mais consistente, uma semântica bem estruturada. após passar pelacom ontologia. Buscando apresentar um resultado mais consistente, com uma semântica bem estruturada. mais consistente, com uma semântica bem estruturada. mais consistente, com uma semântica bem estruturada. R V.V. RESULTADOS RESULTADOS ESULTADOS V.V.RESULTADOS V. R ESULTADOS A. Construção da Ontologia A.A.Construção dada Ontologia Construção Ontologia A. Construção da Ontologia A. Construção da Ontologia ontologia encontra-se espaço semântico arquitetura, AA ontologia encontra-se nono espaço semântico dada arquitetura, ontologiaencontra-se encontra-se espaço semântico da arquitetura, AAontologia noanoespaço semântico da arquitetura, seja, será a ontologia responsável pela busca mais ouou seja, será a ontologia a responsável pela busca sersermais A ontologia encontra-se no espaço semântico da arquitetura, ou seja, será a ontologia a responsável pela busca mais ousemântica seja, seráe menos a ontologia a responsável pela busca sersermais sintática. semântica e menos sintática. ou seja, será a ontologia a responsável pela busca ser mais semântica e menos sintática. semântica e menosnecessária sintática. para a utilização deste projeto, é ontologia AA necessária para semântica e menos sintática. Aontologia ontologia necessária paraaa autilização utilizaçãodeste desteprojeto, projeto,éé é A ontologia necessária para utilização deste projeto, uma ontologia que deve tratar de um domínio específico, onde uma ontologia que deve tratar de um domínio específico, onde A ontologia necessária para a utilização deste projeto, umaontologia ontologiaque quedeve devetratar tratardedeum umdomínio domínioespecífico, específico, ondeé uma onde uma área do conhecimento é representada em sua totalidade, uma área do conhecimento é representada em sua totalidade, uma ontologia que deve tratar de um domínio específico, onde umaárea áreadodoconhecimento conhecimentoé érepresentada representadaem emsua suatotalidade, totalidade, uma com aárea função de utilizada aa determinação algumas com a função serser utilizada para a determinação sese algumas uma dodeconhecimento é para representada em sua totalidade, com a função de ser utilizada para determinação se algumas com a função de ser utilizada para a determinação se algumas com a função de ser utilizada para a determinação se algumas

33

Recuperação da Informação em Ambientes Semânticos: uma ferramenta aplicada a publicações científicas - Caio Saraiva Coneglian, Elvis Fusco (p. 30 a 37)

JADI - Marília - v.1 - 2015

informações informaçõesestão estãoouounão nãocontidas contidasdentro dentrodaquele daquelecontexto. contexto. Seguindo Seguindoesta estanecessidade, necessidade,foifoiverificado verificadoque quea aontologia ontologia que quefoifoiconstruída construídaé éclassificada, classificada,segundo segundoGómez-Perez Gómez-Perez[11], [11], como comouma umaontologia ontologiadededomínio, domínio,pois poistrata tratadedeum umdomínio domínio mais maisespecífico específicodedeuma umaárea áreadodoconhecimento. conhecimento. Esta Estaontologia ontologiatem tema afunção funçãodederepresentar representaruma umaárea áreadodo conhecimento, conhecimento,para paraa autilizar utilizarnanaverificação verificaçãodos dosartigos, artigos, determinando determinando sese estes estes estão estão contidos contidos nesta nesta área área dodo conhecimento. conhecimento.Devido Devidoaoaofato fatododoautor, autor,terterum umconhecimento conhecimento mais maisamplo amplonanaárea áreadedebanco bancodededados, dados,foifoiutilizado utilizadoeste este domínio domíniopara paraa implementação a implementaçãodadaontologia. ontologia. Neste Nestesentido, sentido,a aontologia ontologiarepresenta representaa aárea áreadedeBanco Bancodede Dados Dadoscomo comoum umtodo, todo,abrangendo, abrangendo,osostópicos tópicosdedepesquisa pesquisa relacionada relacionadaà esta à estaárea. área. Para Paraa aconstrução construçãodesta destaontologia, ontologia,foifoiutilizado utilizadoo ométodo métododede Noy Noy[16], [16],que quedetermina determinaosossete setepassos passospara paraa aconstrução construçãodada ontologia. ontologia.OsOspassos passosdesta destametodologia metodologiaaplicados aplicadosa aeste este projeto projetosão sãodemostrados demostradosabaixo: abaixo: 1.1.Determinar Determinaro oDomínio Domínioe eo oEscopo EscopodadaOntologia: Ontologia:o o domínio domínioé éa aárea áreadedeBanco BancodedeDados, Dados,abrangendo abrangendoosostópicos tópicos dedepesquisa pesquisamais maiscomum comumnesta nestaárea; área; 2.2.Reutilizar ReutilizarOntologias OntologiasExistentes: Existentes:foifoipesquisado pesquisadonas nas principais principaisbibliotecas bibliotecasonline onlinededeontologias, ontologias,para paraverificar verificarsese havia haviaontologias ontologiasque quetratavam tratavamdedeBanco BancodedeDados Dadoscomo comoum um todo, todo,não nãosendo sendoencontrada encontradanenhuma nenhumaontologia ontologiaque queatendesse atendesse esta estanecessidade; necessidade; 3.3.Levantar Levantar termos termos importantes: importantes: foram foram levantados levantados osos seguintes seguintestermos: termos:SQL, SQL,NoSQL, NoSQL,Modelo, Modelo,Datawarehouse, Datawarehouse, relacionamento, relacionamento, bancos bancos relacionais, relacionais, bancos bancos orientados orientados a a documentos, bancos orientados a colunas, bancos orientados documentos, bancos orientados a colunas, bancos orientadosa a grafos, grafos, restrições, restrições, normalização, normalização, segurança, segurança, esquemas, esquemas, instâncias, transação, objetos, administração, instâncias, transação, objetos, administração, esquemas, esquemas, álgebra álgebrarelacional, relacional,modelo modeloentidade entidaderelacionamento, relacionamento,modelo modelo entidade relacionamento estendido, projeto entidade relacionamento estendido, projetodedebanco bancodededados dados relacionais, relacionais,diagrama diagramaER, ER,MongoDB, MongoDB,CouchDB, CouchDB,Cassandra, Cassandra, Neo4J, Neo4J,Big BigTable, Table,Oracle, Oracle,MySQL, MySQL,PostgreSQL, PostgreSQL,Firebird, Firebird, Microsoft MicrosoftSQL SQLServer; Server; 4.4.Definir Definirclasses classese esua suahierarquia: hierarquia:foifoidefinida definidautilizando utilizando mapas mapasmentais, mentais,asasclasses classese easasrelações relaçõesdedehierarquia hierarquiaentre entre elas. elas. 5.5.Definir Definirpropriedades propriedadesdas dasclasses: classes:este estepasso passonão nãofoifoi realizado realizadodevido devidoaoaofato fatoque quenesta nestaontologia, ontologia,não nãoháháa a necessidade necessidadededelevar levarem emconsideração consideraçãoasaspropriedades propriedadesdedecada cada nónódadaontologia, ontologia,pois poiso omais maisimportante importanteé éa arelação relaçãoentre entreasas classes classespropriamente propriamentedita; dita; 6.6.Restrições Restriçõesdas dasPropriedades: Propriedades:como comonão nãoháhápropriedades, propriedades, não nãoé necessário é necessáriotratar tratardas dasrestrições restriçõesentre entreestas; estas; 7.7.Criação Criaçãodedeinstâncias: instâncias:Não Nãoháháa anecessidade necessidadededecriar criar instâncias, instâncias,pois poisasasinstâncias instânciasserão serãopropriamente propriamenteosostermos termos retirados retiradospelo peloagente agentededeextração. extração. Posteriormente Posteriormentea aconstrução construçãodadaontologia, ontologia,seguindo seguindoa a metodologia metodologiadedeNoy, Noy,foifoirealizada realizadaa aimplementação implementaçãodada ontologia ontologiautilizando utilizandoo osoftware softwareProtégé Protégé[19], [19],foifoirealizado realizadoa a construção construçãodadaontologia, ontologia,onde ondeapós apósa realização a realizaçãodadamodelagem modelagem pelo peloProtégé, Protégé,é égerado geradoum umarquivo arquivoOWL OWLque querepresenta representaa a ontologia. ontologia.

Figura Figura3:3:Relação RelaçãodedeClasses ClassesdadaOntologia Ontologia AAontologia ontologiamodelada modeladapelo pelosoftware softwareProtégé, Protégé,pode podeserser visualizado visualizadoatravés atravésdadafigura figura3,3,que quemostra mostraasasrelações relaçõesdada ontologia. ontologia.Nesta Nestamodelagem, modelagem,a aontologia, ontologia,jájáfoifoiconstruída construídaem em inglês, inglês,pelo pelofato fatoque queasasfontes fontesdedeinformações informaçõesque queserão serão retirados retiradosososartigos artigossão sãodadalíngua línguainglesa. inglesa. B.B.Agente AgentededeExtração Extraçãoe Integração e Integraçãocom coma aOntologia Ontologia Após Apósserserrealizado realizadoa aimplementação implementaçãodadaontologia ontologiae ea a transformação transformaçãodesta destaem emclasses classesJava. Java.Foi Foipossível possíveliniciar iniciara a integração integraçãodadaontologia ontologiacom como oagente agentededebuscas. buscas. AAimplementação implementaçãoconsistiu consistiunanaintegração integraçãododoagente agentedede buscas buscas com com a a ontologia, ontologia, ouou seja, seja, a a comunicação comunicação das das informações que são extraídas, com o intuito de dar semântica informações que são extraídas, com o intuito de dar semântica a abusca. busca.Desta Destamaneira, maneira,o oagente agenteextrai extraium umtexto textodedeuma uma página, e um algoritmo irá avaliar se aquela informação página, e um algoritmo irá avaliar se aquela informaçãoestá está dentro dentrododocontexto contextodadaontologia, ontologia,e eseseaquela aquelainformação informaçãodede fato fatoserá seráútil útilpara parao ousuário. usuário. 1)1)Extração ExtraçãodadaInformação Informação OO agente agente extrai extrai dada página página dodo IEEE IEEE Xplore Xplore (http://ieeexplore.ieee.org), os resumos, baseado na pesquisa (http://ieeexplore.ieee.org), os resumos, baseado na pesquisa que queo ousuário usuárioexecuta. executa.Baseado Baseadonanalocalização localizaçãodos dosresumos resumosnono HTML na página, o agente extrai as informações, e transforma HTML na página, o agente extrai as informações, e transforma isto istonuma numacadeia cadeiadedeString. String. OOprocesso processododoagente agenteé édivido dividoem emtrês trêsfases: fases:busca buscanana página, página,extração extraçãodos dostítulos títulose eresumos resumose edevolução devoluçãoaoao programa programaprincipal principaluma umalista listacom comososartigos. artigos. • •Busca Buscananapágina páginaHTML: HTML:esta estaprimeira primeirafase fasesesecaracteriza caracteriza por porrealizar realizaruma umabusca buscanonosistema sistemadedebusca buscadodoIEEE IEEEXplore, Xplore, dedeforma formaque quea abusca buscarealizada realizadasesecaracteriza caracterizapor poruma uma requisição requisiçãoa aeste estesistema, sistema,sendo sendoinserido inseridonanaurl, url,qual qualé éo otema tema que queo ousuário usuáriodeseja desejabuscar. buscar.Por Porexemplo, exemplo,caso casoo ousuário usuário deseje desejerealizar realizaruma umabusca buscasobre sobreDatawarehouse, Datawarehouse,o oagente agenteiráirá abrir abrir uma uma conexão, conexão, e e buscar buscar nono seguinte seguinte endereço endereço (http://ieeexplore.ieee.org/search/searchresult.jsp (http://ieeexplore.ieee.org/search/searchresult.jsp ?newsearch=true&queryText=datawarehouse). ?newsearch=true&queryText=datawarehouse).AApartir partirdisto distoa a página páginadodoIEEE, IEEE,iráiráretornar retornarum umHTML, HTML,contendo contendoososartigos artigos relacionados relacionadosa aeste estetema. tema.NaNafigura figura4 4é émostrada mostradacomo comoé éa a página páginaHTML HTMLdodoretorno. retorno.

34

Recuperação da Informação em Ambientes Semânticos: uma ferramenta aplicada a publicações científicas - Caio Saraiva Coneglian, Elvis Fusco (p. 30 a 37)

JADI - Marília - v.1 - 2015

Figura HTML extraído pelo agente Figura 4: 4: HTML extraído pelo agente Figura 4: 4: HTML extraído pelo agente Figura HTML extraído pelo agente • Extração de títulos e resumos da página: após o retorno • Extração de títulos e resumos da página: após o retorno dodo Figura 4: HTML extraído pelo agente • •Extração de títulos e resumos dada página: após o retorno dodo Extração de títulos e resumos página: após o retorno HTML, agente extrai deste,odaotítulo títuloe oeapós oresumo resumo cada o oagente extrai deste, dedecada •HTML, Extração de títulos e resumos página: o retorno do HTML, o agente extrai deste, o título e o resumo de cada HTML, o éagente extrai deste, oanálise título e da opágina resumo de cada artigo. Isto é possível por uma análise página HTML, artigo. Isto possível por uma da HTML, HTML, oIsto agente extrai por deste, o título e da o da resumo de cada artigo. Isto é as uma análise página HTML, artigo. épossível possível por uma análise página HTML, verificando tags cujo os dados dos resumos e dos títulos verificando as tags cujo os dados dos resumos e dos títulos artigo. Isto é possível por uma análise da página HTML, verificando as tags cujo os dados dos resumos e dos títulos verificando as Desta tags cujo os dados dos resumos ecriado dos títulos estão inseridos. Desta maneira para cada artigo é criado estão inseridos. maneira para cada artigo é umum verificando as tags cujomaneira os dados dos resumos eé dos títulos estão inseridos. Desta para cada artigo criado um estão inseridos. Desta maneira para cada artigo é ecriado um objeto Java que contém os dados do título, do resumo e do link objeto Java que contém os dados do título, do resumo do link estão inseridos. Desta maneira para cada artigo é criado um objeto Java que contém os dados do título, do resumo e do link objeto Java que contém os dados do título, do resumo e do link para o acesso ao artigo completo. Para realizar esta retirada para o Java acesso artigo completo. Para realizar esta retirada dede objeto queao oscompleto. dados do título, do resumo eretirada do link para o acesso aocontém artigo completo. Para realizar esta retirada dede para o dentro acesso ao artigo Para realizar esta dados de uma página HTML, foi utilizada a ferramenta dados dentro de uma página HTML, foi utilizada a ferramenta para o acesso ao artigo completo. Para realizar esta retirada de dados dentro de uma página HTML, foi utilizada a ferramenta dados dentro deEsta uma página HTML, foi utilizada aum ferramenta JSOUP [12]. ferramenta funciona como HTML JSOUP [12]. ferramenta funciona como HTML dados dentro deEsta uma página HTML, foi utilizada aum ferramenta JSOUP [12]. Esta ferramenta funciona como um HTML JSOUP [12]. Esta ferramenta funciona como um HTML Parser, ou seja, trabalha com a página HTML, de maneira que Parser, ou seja, trabalha com a página HTML, de maneira que JSOUP [12]. Esta ferramenta funciona como um HTML Parser, ou seja, trabalha com adas página HTML, deede maneira que Parser, ou seja, trabalha com aclasses, página HTML, maneira que consiga extrair os dados classes, tags estruturas do consiga extrair os dados das tags e estruturas do Parser, ouextrair seja, trabalha comdas adas página HTML, maneira que consiga ososdados classes, tags dodo consiga extrair dados classes, tagsedeeestruturas estruturas HTML. HTML. consiga extrair os dados das classes, tags e estruturas do HTML. HTML. Criação uma lista com artigos extraídos: fim, • •Criação dede uma lista com osos artigos extraídos: porpor fim, o o HTML. • •Criação deuma uma lista com osos artigos extraídos: por fim, oo Criação de uma lista com artigos extraídos: por fim, agente cria lista contendo todos os artigos que foram agente cria uma lista contendo todos os artigos que foram • Criação deuma uma lista com os todos artigos extraídos: por fim, o agente cria uma lista contendo os artigos que foram agente cria lista contendo todos os artigos que foram extraídos dapágina página HTML.Esta Estalista lista seráutilizada utilizada pelo extraídos pelo agente criada lista HTML. contendo todos os será artigos que foram extraídos dauma HTML. Esta lista será utilizada pelo extraídos dapágina página HTML. Esta lista será utilizada pelo programa principal que irá unir a ontologia com este agente de programa principal que irá unir a ontologia com este agente de extraídos daprincipal páginaque HTML. Esta lista será utilizada pelo programa principal iráirá unir a ontologia com este agente dede programa que unir a ontologia com este agente recuperação de informação. recuperação de informação. programa principal que irá unir a ontologia com este agente de recuperação dede informação. recuperação informação. Destaforma, forma, esterobô robôdedebusca, busca,consegue conseguerealizar realizaruma uma Desta este recuperação de informação. Desta este robô dedebusca, realizar uma Destaforma, forma, este robô busca,consegue consegue realizar uma extração sintática dos artigos contidos na base de dados do extração sintática dos artigos contidos na base de dados do Desta forma, este robô de contidos busca, consegue realizar uma extração sintática dos artigos nanabase de do extração sintática dos artigos contidos base dedados dados do IEEE Xplore, pois, o robô de busca recupera os artigos que IEEE Xplore, pois, o robô de busca recupera os artigos que extração sintática dos artigos contidos na baseosde dados do IEEE Xplore, pois, o orobô busca recupera que IEEE Xplore, pois, robôdebase de busca recupera osartigos artigos que foram indexados pela própria base dados, criando uma lista foram indexados pela própria dede dados, criando uma lista IEEE Xplore, pois, o robô de busca recupera os artigos que foram indexados pela própria base de dados, criando uma lista foram indexados pela própria base de dados, criando uma lista comtodos todosososartigos artigos que foram apresentados, para com que foram apresentados, para serser foram indexados pela própria base de dados, criando uma lista com todos osontologia. que foram apresentados, para serser com todos osartigos artigos que foram apresentados, para utilizado na utilizado na ontologia. com todos osontologia. artigos que foram apresentados, para ser utilizado nana ontologia. utilizado utilizado na ontologia. Integração Ontologia com o Agente Extração 2) 2)Integração dada Ontologia com o Agente dede Extração 2)2)Integração da Ontologia com o fato Agente dede Extração Integração da Ontologia com o aAgente Extração Para que o programa tenha de a semântica apresentada, Para que o programa tenha de fato semântica apresentada, 2) Para Integração Ontologia com o fato Agente de Extração que o programa tenha de fato a semântica apresentada, Para que oda programa tenha de a para semântica apresentada, programa faz o uso da ontologia, avaliar quaisdosdos o oPara programa faz o uso da ontologia, para avaliar quais que o faz programa tenha de fato a para semântica apresentada, o oresultados programa oforam dadaontologia, avaliar quais dos programa faz ouso uso ontologia, para avaliar quais dos que extraídos da base de dados, são fato resultados que foram extraídos da base de dados, são dede fato oresultados programaque faz oforam usoextraídos da ontologia, para avaliar quais dos foram dadabase dededados, são dedefato resultados que extraídos base dados, são fato úteis, e tem relação com o contexto daquela busca. úteis, e tem relação com o contexto daquela busca. resultados que foram extraídos da base de dados, são de fato úteis, e tem relação com o contexto daquela busca. úteis, e tem relação com oem contexto daquela busca. Esta integração acontece em cinco momentos: Esta integração acontece cinco momentos: úteis, e tem relação com o contexto daquela busca. Esta integração acontece emem cinco momentos: integração acontece cinco momentos: •Primeiramente, Primeiramente, verificado onde termopesquisado pesquisado • Esta é éverificado o otermo Esta integração acontece em cincoonde momentos: • •Primeiramente, é éverificado onde o otermo pesquisado Primeiramente, verificado onde termo pesquisado pelo usuário se encontra dentro da ontologia. Por exemplo, pelo usuário se encontra dentro da ontologia. Por exemplo, se se • Primeiramente, é verificado onde o termo pesquisado pelo usuário sese encontra dentro dada ontologia. Por exemplo, seirá pelo usuário encontra dentro ontologia. Por exemplo, se o usuário realiza uma busca de Datawarehouse, o sistema o usuário realiza uma busca de Datawarehouse, o sistema irá pelo usuário se encontra dentro da ontologia. Poroexemplo, seirá o ousuário realiza uma busca dede Datawarehouse, sistema irá usuário realiza uma busca Datawarehouse, o sistema verificar onde este termo está dentro ontologia. onde este termo está dentro dada ontologia. overificar usuário realiza uma busca de Datawarehouse, o sistema irá verificar onde este termo está dentro da ontologia. verificar onde este termo está dentro da ontologia. • Depois são obtidos, quais são as classes hierarquicamente • Depois são obtidos, quais são as classes hierarquicamente verificar onde este termo está dentro da ontologia. • •Depois são obtidos, quais sãosão asas classes hierarquicamente Depois são obtidos, quais classes superior inferior termo pesquisado. Noexemplo exemplododo superior e einferior aoaotermo pesquisado. Nohierarquicamente • Depois são obtidos, quais são as classes hierarquicamente superior e einferior aoaotermo pesquisado. NoNoexemplo dodo superior inferior termo pesquisado. exemplo Datawarehouse, serão obtidos, as classes inferiores: OLAP, Datawarehouse, serão obtidos, as classes inferiores: OLAP, superior e inferior ao obtidos, termo pesquisado. No exemplo do Datawarehouse, serão as classes inferiores: OLAP, Datawarehouse, serão obtidos, as classes inferiores: OLAP, OTAPe modeling, e modeling, a classesuperior superior Database. possível OTAP e aeobtidos, classe Database. É Épossível Datawarehouse, serão assuperior classes inferiores: OLAP, OTAP e emodeling, e ea aclasse superior Database. Évisualizados OTAP modeling, classe Database. Épossível possível visualizar este processo na figura 5, onde são visualizar este processo na figura 5, onde são visualizados OTAP e modeling, e a classe superior Database. Évisualizados possível visualizar este nanafigura 5, 5,onde sãosãovisualizados visualizar esteprocesso processo figura apenas classes que tem relação com oonde termo pesquisado, apenas as as classes que tem relação com oonde termo pesquisado, nono visualizar este processo na figura 5, são visualizados apenas asas classes que tem relação com o termo pesquisado, nono apenas classes que tem relação com o termo pesquisado, caso Datawarehouse. caso Datawarehouse. apenas as classes que tem relação com o termo pesquisado, no caso Datawarehouse. caso Datawarehouse. caso Datawarehouse.

Figura Fragmento relação classes ontologia Figura 5: 5: Fragmento dada relação dede classes dada ontologia dodo Figura 5: 5: Fragmento dada relação dede classes dada ontologia dodo Figura Fragmento relação classes ontologia termo Datawarehouse termo Datawarehouse Figura 5: Fragmento da relação de classes da ontologia do termo Datawarehouse termo Datawarehouse Posteriormenteé termo é verificado dentrododoresumo resumoe do e dotítulo título • •Posteriormente verificado dentro Datawarehouse • •dos Posteriormente é éverificado dentro do resumo e termos Posteriormente verificado dentro do resumo edodotítulo título artigos pesquisados, se contém ou não, os que dos artigos pesquisados, se contém ou não, os termos que •dos Posteriormente é verificado dentro do resumo e termos do título artigos pesquisados, sesecontém ou não, osostermos que dos artigos pesquisados, contém ou não, que fazem parte daquela hierarquia do termo pesquisado. No fazem parte daquela hierarquia do termo pesquisado. No dos artigos pesquisados, se contém ou não, pesquisado. ospesquisado. termos que fazem parte daquela dodo termo NoNo fazem parte daquelahierarquia hierarquia termo exemplo do Datawarehouse, seria verificado se os termos exemplo do Datawarehouse, seria verificado se os termos fazem parte daquela hierarquia doverificado termo pesquisado. No exemplo do seria se exemplo doDatawarehouse, Datawarehouse, seria verificado seosostermos termos OLAP,OTAP, OTAP, modeling,datawarehouse datawarehouse database, estão OLAP, modeling, e edatabase, estão exemplo do Datawarehouse, seria verificado se os termos OLAP, OTAP, modeling, datawarehouse e edatabase, estão OLAP, OTAP, modeling, datawarehouse database, estão contidos dentro dos resumos e dos títulos daqueles artigos contidos dentro dos resumos e dos títulos daqueles artigos OLAP, OTAP, modeling, datawarehouse e daqueles database, estão contidos dentro dos e edos contidos dentro dosresumos resumos dostítulos títulos daquelesartigos artigos extraídos. extraídos. contidos dentro dos resumos e dos títulos daqueles artigos extraídos. extraídos. Após, é realizado uma comparação entre quantidade • •Após, é realizado uma comparação entre quantidade dede extraídos. • •Após, é realizado uma entre quantidade dede Após, éestão realizado umacomparação comparação entre quantidade termos que na hierarquia e os que estão contidos dentro termos que estão na hierarquia e os que estão contidos dentro •termos Após, é realizado uma comparação entre quantidade de termos que estão na hierarquia e os que estão contidos dentro que estão na hierarquia eartigo. os que estão contidos dentro resumo e do título daquele Resultando assim uma dodo resumo e do título daquele assim uma termos que estão natítulo hierarquia eartigo. os queResultando estão contidos dentro dodoresumo e do título daquele artigo. Resultando assim uma resumo e do daquele artigo. Resultando assim uma porcentagem da quantidade de termos que estão na hierarquia, porcentagem quantidade de termos que estão na assim hierarquia, do resumo e da doda título daquele artigo. Resultando uma porcentagem da quantidade dede termos que estão nana hierarquia, porcentagem quantidade termos que estão hierarquia, queestão estãodentro dentro doresumo resumo edo dotítulo título daquele artigo.NoNo que do etermos daquele artigo. porcentagem da quantidade de que estão na hierarquia, que estão dentro resumo e edo título artigo. NoNo que estão dentrodo resumo títulodaquele daquele artigo. mesmo exemplo, conter osdo termos Database, OLAP, mesmo exemplo, sedose conter osdo termos Database, OLAP, que estão dentro do resumo e título daquele artigo. No mesmo exemplo, se conter os termos Database, OLAP, mesmo exemplo, se conter os de termos Database, OLAP, Datawarehouse esemodeling, dentro deumum artigo,vaivai conter Datawarehouse e modeling, artigo, conter mesmo exemplo, conterdentro os termos Database, OLAP, Datawarehouse e emodeling, dentro dedeumum artigo, vaivai conter Datawarehouse modeling, dentro artigo, conter quatro dos cinco termos da hierarquia, o que resulta numa quatro dos cinco termos da dentro hierarquia, o que resulta numa Datawarehouse e modeling, de um artigo, vai conter quatro dos cinco termos dadahierarquia, o oque resulta numa quatro dos cinco termos hierarquia, que resulta numa porcentagem de 80% dos termos. porcentagem de 80% dos termos. quatro dos cinco termos datermos. hierarquia, o que resulta numa porcentagem dede 80% dos termos. porcentagem 80% dos • Por fim, é apresentado aousuário usuáriotodos todos artigos que • Por fim, é apresentado ao osos artigos que porcentagem deé 80% dos termos. • •Por fim, apresentado aoao usuário todos ososartigos que Por fim, é apresentado usuário todos artigos que alcançaram uma porcentagem acima dos 35%. alcançaram uma porcentagemao acima dos 35%. • Por fim, é apresentado usuário todos alcançaram uma porcentagem acima dos 35%. alcançaram uma porcentagem acima dos 35%.os artigos que alcançaram uma porcentagem acima dos 35%. Interação Usuário com o Programa 3) 3)Interação dodo Usuário com o Programa 3)3) Interação do Usuário com o Programa Interação do Usuário com o Programa O usuário na primeira tela pode escrevero otema temaque queeleele usuário na primeira com tela opode escrever 3) O donaUsuário Programa OInteração usuário na primeira tela pode escrever o otema que eleele O usuário primeira tela pode escrever tema que deseja realizar sua busca. No caso do programa que deseja realizar sua busca.telaNopode casoescrever do programa que foifoi O usuário na primeira o tema que ele deseja realizar sua busca. No caso do programa que foi deseja realizar sua busca. No caso do programa que foi implementado, o usuário necessariamente precisa realizar uma implementado, osua usuário necessariamente precisa realizar uma deseja realizar busca. No caso do programa que foi implementado, o usuário necessariamente precisa realizar uma implementado, o usuário necessariamente precisa realizar uma busca relacionado a banco de dados. busca relacionado a banconecessariamente de dados. implementado, o usuário precisa realizar uma busca relacionado a banco dede dados. busca relacionado aescrever banco dados. Após o usuário o que ele necessita, o sistema Após o usuário escrever o que ele necessita, o sistema fazfaz a a busca relacionado aescrever banco de dados. Após o usuário ousuário, que eleele necessita, o sistema fazfaz ano Após o usuário escrever o que necessita, o sistema a integração da pesquisa do com a extração realizada integração da pesquisa do usuário, com a extração realizada no Após o usuário escrever o que ele necessita, o sistema faz a integração da pesquisa do usuário, com a extração realizada no integração da pesquisa do usuário, com a extração realizada no site do IEEE Xplore, com a ontologia. site do IEEE com a ontologia. integração daXplore, pesquisa do usuário, com a extração realizada no site do IEEE Xplore, com a ontologia. site do IEEE Xplore, com a oontologia. Após realizar estes passos, o sistema retorna para o usuário, Após realizar estes passos, sistema retorna para o usuário, siteApós do IEEE Xplore, com a ontologia. realizar estes passos, o sistema retorna para o usuário, Após realizar estes passos, o sistema retorna para o usuário, uma tela contendo quais são os artigos e os links destes uma telarealizar contendo são os artigos e os links destes Após estesquais passos, osão sistema retorna para o usuário, uma tela contendo quais são ososartigos e eos links destes uma tela contendo quais artigos os links destes artigos, queo osistema sistema extraiu verificou quetinha tinharelação relação artigos, extraiu uma telaque contendo quais são eeoseeverificou artigos eque os links destes artigos, que extraiu verificou que relação artigos, queorealizada osistema sistema extraiu verificou quetinha tinha relação com a busca realizada pelo usuário. Este resultado é possível com a busca pelo usuário. Este resultado é possível artigos, orealizada sistema extraiu e verificou que tinha com a busca pelo usuário. Este resultado é possível com aque busca realizada pelo usuário. Este resultado érelação possível visualizar figura onde sãoapresentados apresentados nomes e os visualizar nana figura 6, 6, onde são osos nomes e os com a busca realizada pelo usuário. Este resultado é possível visualizar na figura 6, onde são apresentados os nomes e os visualizar na figura 6, onde são apresentados os nomes e os links, para que o usuário possa acessar ao artigo completo. links, para que o usuário possa acessar ao artigo completo. visualizar na figura 6, onde são apresentados os nomes e os links, para que o usuário possa acessar aoao artigo completo. links, para que o usuário possa acessar artigo completo. links, para que o usuário possa acessar ao artigo completo.

Figura Tela Resultados Apresentados Usuário Figura 6: 6: Tela dede Resultados Apresentados aoao Usuário Figura 6: 6: Tela dede Resultados Apresentados aoao Usuário Figura Tela Resultados Apresentados Usuário Figura 6: Tela de Resultados Apresentados ao Usuário 35

Recuperação da Informação em Ambientes Semânticos: uma ferramenta aplicada a publicações científicas - Caio Saraiva Coneglian, Elvis Fusco (p. 30 a 37)

JADI - Marília - v.1 - 2015

JISBD 2008 + TELECOM I+D 2008 C. Testes 0 0 NÃO JISBD 2008 + TELECOM I+D 2008 C. Testes = INTRODUCTIONS 0 0 NÃO JISBD 2008 + TELECOM I+D 2008 C. Testes = INTRODUCTIONS 0 0 NÃO Como teste para averiguar se o sistema está extraindo e Normed principal components = INTRODUCTIONS Como teste para averiguar se o sistema está extraindo e Normed principal components Como teste para averiguar se o sistema está extraindo e verificando a semântica dos artigos extraídos, foi feita uma analysis: A new approach to data 0 0 NÃO Normed principal components verificando a semântica dos artigos foi feita uma analysis: Afragmentation new approach to data 0 0 NÃO warehouse verificando artigos extraídos, extraídos, analysis: A new approach to data 0 0 NÃO busca com a osemântica usuáriodos pesquisando pelofoi feita termouma warehouse fragmentation busca com o usuário pesquisando pelo termo Enriching hierarchies in warehouse fragmentation busca com o usuário pesquisando pelo termo Enriching hierarchies in “Datawarehouse”, como mostrado na figura 5. multidimensional of datain 0 0 NÃO Enrichingmodel hierarchies “Datawarehouse”, como mostrado na 5. multidimensional model of data 0 0 NÃO “Datawarehouse”, na figura figurasão 5. os termos: A hierarquia do como termo mostrado Datawarehouse warehouse using WORDNET multidimensional model of data 0 0 NÃO A hierarquia do termo Datawarehouse são os termos: warehouse using WORDNET A hierarquia do termo Datawarehouse são os termos: The fragmentation of data warehouse using WORDNET Database, Datawarehouse, OLAP, OTAP e modeling. The An fragmentation of data Database, Datawarehouse, OLAP, OTAP e modeling. warehouses: approach based on 0 0 NÃO The fragmentation of data Database, Datawarehouse, OLAP,todos OTAP modeling. Na tabela 1, é possível visualizar os etítulos dos artigos warehouses: An approach based on 0 0 NÃO principal components analysis Na tabela 1, é possível visualizar todos os títulos dos artigos warehouses: An approach based on 0 0 NÃO Na tabela 1, é possível visualizar todos os títulos dos artigos principal components analysis que foram extraídos do site do IEEE, a quantidade dos termos Evaluation of different database principal components analysis que foram extraídos do site do IEEE, a quantidade dos termos Evaluation of different database foram extraídos que do site do encontrados IEEE, a quantidade dosetermos designs for integration da que cadeia da ontologia foram no resumo no Evaluation of differentofdatabase 2 40 SIM designs for integration of da cadeia da ontologia que foram encontrados no resumo ee no heterogeneous distributed Electronic 2 40 SIM designs for integration of da cadeia da ontologia que foram encontrados no resumo no título, a relação entre os termos encontrados no artigo e os heterogeneous distributed Electronic 2 40 SIM título, a relação entre os termos encontrados no artigo e os Health Records heterogeneous distributed Electronic título, a relação entre os termos encontrados no artigo e os Health Records termos da cadeia da ontologia do termo “Datawarehouse” (no Keynote talkHealth data warehouses: Records termos da cadeia da do “Datawarehouse” (no Keynote talk data warehouses: termos da ontologia ontologia do termo termo caso serádaacadeia porcentagem resultante da “Datawarehouse” divisão entre a(no Construction, exploitation and 1 20 NÃO Keynote talk data warehouses: caso será a porcentagem resultante da divisão entre a Construction, exploitation and 1 20 NÃO personnalisation caso seráde apalavras porcentagem resultante da divisão Construction, exploitation and 1 20 NÃO quantidade encontradas na ontologia por 5,entre que a personnalisation quantidade de palavras encontradas na ontologia por 5, que Security Analysis of Future personnalisation de palavras encontradas na ontologia por 5, eque sãoquantidade os termos contidos na hierarquia da cadeia de ontologia) 0 0 NÃO Security Analysis of Future Business Intelligence são os termos contidos na hierarquia da de e Enterprise 0 0 NÃO Security Analysis of Future Business Intelligence termosatende contidos da cadeia cadeia de ontologia) ontologia) 0 0 NÃO se são esteosartigo ou na nãohierarquia ao requisito mínimo de pelo e QVTEnterprise transformation by modeling: Enterprise Business Intelligence se este artigo atende ou não ao requisito mínimo de pelo 1 20 NÃO QVT transformation by modeling: se este artigo atende ou não ao requisito mínimo de pelo From UML model to MDbymodel menos 35% dos termos contidos no resumo e no título. 1 20 NÃO QVT transformation modeling: From UML model to MD model 1 20 NÃO menos From UML model MD model menos 35% 35% dos dos termos termos contidos contidos no no resumo resumo ee no no título. título. Tabela 1:toAnálise dos artigos extraídos. Tabela 1: Análise dos artigos extraídos. 1: Análise dos artigos Qtd. de No caso de Tabela 25 artigos, 7 foram os queextraídos. atenderam aos Atende ao Qtd. de No caso de 25 artigos, 77 foram os atenderam aos Título palavras Atende ao Qtd. de % No caso de 25 artigos, foram os que que atenderam requisitos, sendo estes apresentados aos usuários, esta aos requisito? Título palavras % Atende ao requisitos, sendo estes apresentados aos usuários, esta encontadas requisito? Título palavras % requisitos,pode sendo estes apresentados encontadas requisito? apresentação ser visualizada da figura 6. aos usuários, esta Testing a Datawarehouse - An encontadas apresentação pode ser visualizada da 6. 2 40 SIM Testing a Datawarehouse - An apresentação pode ser visualizada daafigura figura 6. dos resumos Para visualizar como o programa faz análise Industrial Challenge 2 40 SIM Testing a Datawarehouse - An Para visualizar como o programa faz a análise dos Industrial Challenge 2 40 SIM Telecom datawarehouse prototype Para visualizar como o programa faz a análise dos resumos resumos Industrial Challenge e dos títulos, abaixo na figura 7, é apresentado um artigo dos Telecom datawarehouse prototype e dos títulos, abaixo na figura 7, é apresentado um artigo dos for bandwidth and network 3 60 SIM Telecom datawarehouse prototype e dos títulos, abaixo na figura 7, é apresentado um artigo dos que atenderam aos requisitos. for bandwidth and network 3 60 SIM throughput monitoringand andnetwork analysis for bandwidth 3 60 que atenderam aos requisitos. SIM throughput monitoring and analysis que atenderam aos requisitos. Unifying and incorporating throughput monitoring and analysis Unifying and incorporating functional andand nonincorporating functional Unifying functional and non functional requirements datawarehouse functionalinand non functional requirements in datawarehouse conceptualindesign requirements datawarehouse conceptual design Knowledgeconceptual datawarehouse: designWeb Knowledge datawarehouse: Web usage OLAP application Web Knowledge datawarehouse: usage OLAP application Datawarehouse and dataspace — usage OLAP application Datawarehouse and dataspace — information base of decision support— Datawarehouse and dataspace information base of decision support systeof decision support information base syste The implementation syste of The implementation of datawarehouse in Batelco: a case The implementation of datawarehouse in Batelco: a case study evaluation and a case datawarehouse in Batelco: study evaluation and recommendation study evaluation and recommendation E-Businessrecommendation Model Approach to E-Business Model Approach to Determine ModelsModel to Datawarehouse E-Business Approach to Determine Models to Datawarehouse Production Models datawarehouse and Determine to Datawarehouse Production datawarehouse and software toolset to support and Production datawarehouse software toolset to support productivity improvement software toolset to activities support productivity improvement activities A genomic datawarehouse model for productivity improvement activities genomic datawarehouse fastA using repeat model region for Amanipulation genomic datawarehouse model for fast manipulation using repeat region A managing fastdatawarehouse manipulation for using repeat region A datawarehouse for managing commercial softwareforrelease A datawarehouse managing commercial software release Modeling Analytical Indicators commercial software release Modeling Analytical Indicators UsingModeling DataWarehouse Metamodel Analytical Indicators Using DataWarehouse Metamodel An SLA-Enabled Grid Using DataWarehouse Metamodel An SLA-Enabled Grid DataWarehouse An SLA-Enabled Grid DataWarehouse BusinessDataWarehouse Metadata for the Business Metadata for the DataWarehouse Business Metadata for the DataWarehouse A partition-based approach to DataWarehouse A partition-based approach to support streaming updates over to A partition-based approach support streaming updates over persistent data in anupdates active over support streaming persistent data in an active datawarehouse persistent data in an active datawarehouse Study of localized data cleansing datawarehouse Study of localized data cleansing process forlocalized ETL performance Study of data cleansing process for ETL performance improvement independent process forinETL performance improvement in independent datamart improvement in independent datamart Visualizing Clouds on Different datamart Visualizing Clouds on Different StagesVisualizing of DWH - Clouds An Introduction to on Different Stages of DWH - An Introduction to Data Warehouse Service Stages of DWH - as Ana Introduction to Data Warehouse as a Service GIApSCart: A geo-intelligence Data Warehouse as a Service GIApSCart: A geo-intelligence application based on semantic GIApSCart: A geo-intelligence application based on semantic cartography application based on semantic cartography cartography

3 2 1

1 1 2 1 1 1 1 1 1

1

0 2

3 3 2 2 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 1 1 1 1

1 1 0 0 2 2

60 40 20

20 20 40 20 20 20 20 20 20

20

0 40

60 60

SIM SIM SIM

40 40

SIM SIM SIM

20 20

NÃO NÃO NÃO

20 20

NÃO NÃO NÃO

20 20

NÃO NÃO NÃO

40 40

SIM SIM SIM

20 20

NÃO NÃO NÃO NÃO NÃO NÃO NÃO NÃO NÃO NÃO NÃO NÃO NÃO NÃO NÃO

20 20

NÃO NÃO NÃO

20 20

NÃO NÃO NÃO

0 0

NÃO NÃO NÃO

40 40

SIM SIM SIM

20 20 20 20 20 20 20 20

Figura 7: Exemplo de um artigo analisado. Figura Figura 7: 7: Exemplo Exemplo de de um um artigo artigo analisado. analisado. Este artigo, como visto na tabela 2, apresentou 2 dos 5 termos Este visto tabela 2, 2 dos 55 termos Este artigo, artigo,dacomo como visto na na tabela 2, apresentou apresentou termos da hierarquia ontologia. Neste caso apresentou 2osdos termos da hierarquia da ontologia. Neste caso apresentou os termos da hierarquia da ontologia. apresentou termos OLAP e Datawarehouse. Na Neste figuracaso 7 está grifadoos em OLAP Datawarehouse. Na 77 está OLAPoseetermos Datawarehouse. Na figura figurapelo está grifado grifado em em vermelho que foram encontrados programa. vermelho vermelho os os termos termos que que foram foram encontrados encontrados pelo pelo programa. programa. VI. CONSIDERAÇÕES FINAIS VI. FINAIS VI. C CONSIDERAÇÕES ONSIDERAÇÕES FINAIS Este trabalho apresenta o uso de ontologias na melhoria do Este apresenta oo uso Estedetrabalho trabalho apresenta uso de de ontologias ontologias na na melhoria melhoria do do processo Recuperação de Informação. processo de Recuperação de Informação. Recuperação Informação. Oprocesso objetivode desta pesquisa éde aderir semântica ao processo de O desta pesquisa aderir ao O objetivo objetivo pesquisa ééutilizando aderir semântica semântica ao processo processo de de Recuperação da desta Informação, das informações Recuperação da Informação, utilizando das informações Recuperação Informação, informações dentro do contextoda do Big Data, parautilizando realizar um das processo que dentro do do Data, realizar um dentro do contexto contexto do Big Bigrealizadas Data, para parapelo realizar um processo processo que que agregue mais valor às buscas usuário. agregue mais valor às buscas realizadas pelo usuário. agregue mais valor às buscas realizadas pelo usuário. 36

Recuperação da Informação em Ambientes Semânticos: uma ferramenta aplicada a publicações científicas - Caio Saraiva Coneglian, Elvis Fusco (p. 30 a 37)

JADI - Marília - v.1 - 2015

Para VII. Paracomprovar comprovareste esteobjetivo, objetivo,foifoiutilizado utilizadoo odomínio domíniodede VII.AGRADECIMENTOS AGRADECIMENTOS pesquisas científicas, emem que o usuário aoao realizar uma pesquisas científicas, que o usuário realizar umabusca busca O Otrabalho trabalhoapresentado apresentadoneste nesteartigo artigofoifoifomentado fomentadopela pela emembases basesdededados dadosdedeartigos artigoscientíficos, científicos,sesedepara deparacom como o FAPESP (Fundação dodoEstado São FAPESP (FundaçãodedeAmparo Amparoa Pesquisa a Pesquisa Estadodede São problema dede terter uma quantidade muito grande dede documentos, problema uma quantidade muito grande documentos, Paulo), processo 2013/16369-3. Paulo), processo 2013/16369-3. sendo sendoque queboa boaparte partedestes, destes,não nãosãosãodedefato fatoúteis, úteis,não não atendendo àsàs necessidades que o usuário possui. atendendo necessidades que o usuário possui. REFERÊNCIAS REFERÊNCIAS Foi, Foi,então, então,criado criadouma umaontologia ontologiae eumumrobô robôdedebuscas buscase e [1][1]Berners-Lee, T.,T., Hendler, J. J. e Lassila, O. O. (2001) TheThe semantic web. Berners-Lee, Hendler, e Lassila, (2001) semantic web. realizada estes para alcançar desta oo realizadaa conexão a conexãoentre entre estes para alcançar destamaneira maneira Scientific american 284.5. 28-37. Scientific american 284.5. 28-37. [2][2] Beyer, M.M. A.,A., e Laney, D. D. (2012) TheThe importance of of ‘big data’: a a Beyer, e Laney, (2012) importance ‘big data’: objetivo inicial. objetivo inicial. Stamford, CT:CT: Gartner. definition. Stamford, Gartner. Para Paraa realização a realizaçãodedetestes, testes,nonosentido sentidodedeaveriguar averiguaro oreal real [3] definition. [3] Borst, Borst,W.W.N. N.(1997) (1997)Construction Constructionof ofengineering engineeringontologies ontologiesforfor funcionamento funcionamento deste deste processo, processo, o o robô robô dede buscas buscas foifoi knowledge sharing andand reuse. 1997. 227227 f. Tese (Doutorado). Centre forfor knowledge sharing reuse. 1997. f. Tese (Doutorado). Centre Telematics implementado com a capacidade dede extrair artigos dada base dede TelematicsforforInformation InformationTechnology, Technology,University Universityof ofTwence, Twence, implementado com a capacidade extrair artigos base Enschede. Enschede. dados dodo IEEE Xplore, e ae ontologia foifoi construída utilizando dados IEEE Xplore, a ontologia construída utilizando [4][4] DeDe Diana, M.,M., e Gerosa, M.M. A. A. (2010) Nosql na na web 2.0:2.0: UmUm estudo Diana, e Gerosa, (2010) Nosql web estudo o domínio dada disciplina dede banco dede dados. o domínio disciplina banco dados. comparativo de de bancos não-relacionais para armazenamento de de dados na na comparativo bancos não-relacionais para armazenamento dados Após web 2.0.2.0. Apósa arealização realizaçãodedetestes, testes,foifoiobservado observadoque queo ouso usodede web Deters,J. J.I., I.,e Adaime, e Adaime,S. S.F. F.(2003) (2003)UmUmestudo estudocomparativo comparativodosdos ontologia para o agente dede pesquisa é uma maneira eficaz para ontologia para o agente pesquisa é uma maneira eficaz para [5][5]Deters, sistemas de de busca na na web. Anais do do VV Encontro de de Estudantes de de sistemas busca web. Anais Encontro Estudantes seseobter obterinformações informaçõesdedevalor valore econseguir conseguiratender atenderasas Informática do do Tocantins. Palmas, TO.TO. 189-200. 2003. Informática Tocantins. Palmas, 189-200. 2003. necessidades informacionais dodo usuário. necessidades informacionais usuário. [6][6] Falbo, R. R. A. A. (1998) Integração DeDe Conhecimento EmEm UmUm Ambiente DeDe Falbo, (1998) Integração Conhecimento Ambiente Desenvolvimento DesenvolvimentoDeDeSoftware. Software.1998. 1998.215215f. f.Tese Tese(Doutorado (Doutoradoemem AA ontologia pode serser eficiente nono presente processo, porque ontologia pode eficiente presente processo, porque Ciências CiênciasememEngenharia Engenhariade deSistemas Sistemase eComputação) Computação)– –COPPE, COPPE, sesetorna tornauma umaforma formadedeorganizar organizara ainformação informaçãosemântica, semântica,e e Universidade Federal do do RioRio de de Janeiro, RioRio de de Janeiro. Universidade Federal Janeiro, Janeiro. assim, assim,apenas apenasa ainformação informaçãosignificativa significativaserá seráapresentada apresentadaaoao [7][7]Ferneda, Ferneda,E. E.(2003) (2003)Recuperação Recuperaçãoda daInformação: Informação:Análise Análisesobre sobrea a contribuição da da Ciência da da Computação para a Ciência da da Informação. contribuição Ciência Computação para a Ciência Informação. usuário. usuário. 2003. 147147 f. Tese (Doutorado emem Ciência da da Informação) – Escola de de 2003. f. Tese (Doutorado Ciência Informação) – Escola Embora Semântica Emborao termo o termoWeb Web Semânticaé usado é usadojá jáa alguns a algunsanos, anos, Comunicação e Artes, Universidade de de SãoSão Paulo, SãoSão Paulo. Comunicação e Artes, Universidade Paulo, Paulo. ainda existe uma limitação emem seuseu uso, porque grande parte dada [8][8]Gruber, ainda existe uma limitação uso, porque grande parte Gruber,T. T.R. R.(1993) (1993)A Atranslation translationapproach approachto toportable portableontology ontology specifications. Knowledge acquisition 5.2.5.2. 199-220. specifications. Knowledge acquisition 199-220. Web está organizada de uma forma sintática, em que a maioria Web está organizada de uma forma sintática, em que a maioria Guarino,N. N.(1998) (1998)Formal Formalontology ontologyin ininformation informationsystems. systems. dasdas páginas sãosão criadas para que apenas o ser humano consiga páginas criadas para que apenas o ser humano consiga [9][9]Guarino, Proceedings of of thethe first international conference (FOIS'98), June 6-8, Proceedings first international conference (FOIS'98), June 6-8, lerlero oque lá está escrito, sem serem estruturadas de uma que lá está escrito, sem serem estruturadas de uma Trento, Italy. Vol. 46.46. IOS press, Trento, Italy. Vol. IOS press, maneira Guarino,N. N.(1997) (1997)Understanding, Understanding,building buildingandandusing usingontologies. ontologies. maneiraque queagentes agentescomputacionais computacionaisconsigam consigamextrair extrairosos [10][10]Guarino, International Journal of Human-Computer Studies 46.2. 293-310. International Journal of Human-Computer Studies 46.2. 293-310. dados ali contidos dentro de um contexto, com um significado dados ali contidos dentro de um contexto, com um significado [11] A. A. (1999) Ontological engineering A A state of of thethe art.art. [11]Gómez-Pérez, Gómez-Pérez, (1999) Ontological engineering state implícito dentro dodo HTML. implícito dentro HTML. Expert ExpertUpdate: Update:Knowledge KnowledgeBased BasedSystems SystemsandandApplied AppliedArtificial Artificial O Oagente Intelligence 2.3.2.3. 33-43. agentededeextração extraçãoconsegue consegueretirar retirarososdocumentos documentosdada Intelligence 33-43. [12] JSOUP. Java HTML Parser. Disponível em:em: acesso [12] JSOUP. Java HTML Parser. Disponível acesso Web e um programa consegue por meio do uso de ontologia, Web e um programa consegue por meio do uso de ontologia, em:em: 14 14 de de setembro de de 2014 setembro 2014 tratar as informações, conseguindo assim apresentar resultados tratar as informações, conseguindo assim apresentar resultados [13][13]Martimiano, L. L. A. A. F. F. (2006) Sobre a estruturação de de informação emem Martimiano, (2006) Sobre a estruturação informação mais relevantes aquele usuário. mais relevantes aquele usuário. sistemas de de segurança computacional. 2006. 185185 f. Tese (Doutorado emem sistemas segurança computacional. 2006. f. Tese (Doutorado Ciências CiênciasememEngenharia Engenhariade deSistemas Sistemase eComputação) Computação)– –COPPE, COPPE, Desta Destamaneira maneiraososresultados resultadosobtidos obtidoscom coma autilização utilizaçãododo Universidade Federal do do RioRio de de Janeiro, RioRio de de Janeiro. Universidade Federal Janeiro, Janeiro. protótipo protótipo desenvolvido, desenvolvido, consegue consegue refinar refinar bastante bastante a a [14][14]Modesto, a a Modesto,L. L.R. R.(2013) (2013)Representação Representaçãoe Persistência e Persistênciapara paraacesso acesso quantidade quantidade dede artigos artigos apresentados apresentados aosaos usuários. usuários. Esta Esta Recursos RecursosInformacionais InformacionaisDigitais Digitaisgerados geradosdinamicamente dinamicamenteememsítios sítios oficiais do do Governo Federal. 2013. 103103 f. Tese (Doutorado emem Ciência oficiais Governo Federal. 2013. f. Tese (Doutorado Ciência pesquisa, portanto, o oque o ousuário pesquisa,busca busca portanto,fazer fazercom com que usuárioobtenha, obtenha, da daInformação) – –Faculdade de deFilosofia e Ciências, Universidade Informação) Faculdade Filosofia e Ciências, Universidade ememumumprocesso processodedeRecuperação RecuperaçãodedeInformação, Informação,resultados resultados Estadual Paulista, Marília. Estadual Paulista, Marília. mais maisexpressivos expressivose eque queapresente apresentemaior maiorvalor. valor.Assim, Assim,o o [15][15]Mooers, C. C. (1951) Zatocoding applied to to mechanical organization of of Mooers, (1951) Zatocoding applied mechanical organization knowledge. American Documentation, Washington, v. 2, knowledge. American Documentation, Washington, v. n. 2, 1, n. p.20-32. 1, p.20-32. usuário usuárioconseguirá conseguiráavaliar avaliarinformações informaçõesmais maisexpressivas, expressivas,e e N. N. F.,F., e McGuinness, D. D. L. L. (2001) Ontology development 101: AA Noy, e McGuinness, (2001) Ontology development 101: não nãoperderá perderátempo tempocom comaqueles aquelesdados dadosque quenão nãotem tematende atende [16][16]Noy, guide to creating your first ontology. guide to creating your first ontology. suas necessidades. suas necessidades. [17] Segundo, J. J. E. E. (2010) Representação Iterativa: umum modelo [17]Santarem Santarem Segundo, (2010) Representação Iterativa: modelo para Repositórios Digitais. 2010. 224224 f. Tese (Doutorado emem Ciência da da Portanto, para Repositórios Digitais. 2010. f. Tese (Doutorado Ciência Portanto,para paratratar tratara aquestão questãodedecomo comoinserir inseriruma uma Informação) – Faculdade de de Filosofia e Ciências, Universidade Estadual Informação) – Faculdade Filosofia e Ciências, Universidade Estadual inteligência inteligênciananarecuperação recuperação dedepáginas páginasWeb Webque quenão não Paulista, Marília. Paulista, Marília. apresentam apresentamuma umacontextualização contextualizaçãodedesuas suasinformações, informações,esta esta [18][18]Silva, T. T. M.M. S. S. (2003) Extração de de informação para busca semântica na na Silva, (2003) Extração informação para busca semântica pesquisa web baseada emem ontologias. pesquisapropõe propõeque queo oprocesso processodedeaderir aderirsemântica semânticaa aestas estas web baseada ontologias. University. Protégé. Disponível emem Disponível Stanford University. Protégé. páginas páginasocorra ocorrafora foradadaWeb, Web,ououseja, seja,a extração a extraçãodasdaspáginas páginas [19][19]Stanford acesso emem 3 de maio de de 2014. acesso 3 de maio 2014. ocorra ocorradedemaneira maneirasintática, sintática,e ea apartir partirdodoque quefoifoiextraído, extraído, [20][20]Coneglian, C. C. S.;S.; Fusco, E.;E.; Santarem Segundo, J. E. (2015) Semantic Coneglian, Fusco, Santarem Segundo, J. E. (2015) Semantic ocorra ocorrauma umaanálise análisedasdasinformações, informações,inserindo inserindodesta destaforma forma Information Retrieval Platform Applied ToTo Scientific Papers Extraction. Information Retrieval Platform Applied Scientific Papers Extraction. In:In:CONTECSI CONTECSI12ª12ªConferência ConferênciaInternacional Internacionalsobre sobreSistemas Sistemasde de semântica semânticaa aeste esteprocesso. processo.Este Estemétodo métodosesemostrou mostroumuito muito Informação e Gestão de de Tecnologia. Informação e Gestão Tecnologia. eficiente, eficiente,pois poisconsegue conseguededefato fatorealizar realizaruma umabusca buscamais mais [21][21]Baeza-Yates, R.;R.; Ribeiro-Neto, B. B. (1999) Modern information retrieval. Baeza-Yates, Ribeiro-Neto, (1999) Modern information retrieval. inteligente, além dedesimples inteligente,que quevaivai além simplesfórmulas fórmulasdedebuscas, buscas,que que New York: ACM; Harlow: Addison-Wesley. New York: ACM; Harlow: Addison-Wesley. D.,D., et et al. al. (2008) BigBig data: science in in thethe petabyte era. Graham-Rowe, (2008) data: science petabyte era. observam observamapenas apenasa sintaxe a sintaxedos dostextos, textos,e consegue e consegueanalisar analisaro o [22][22]Graham-Rowe, Nature 455. 1-50. Nature 455. 1-50. contexto contextonanaqual qualososdocumentos documentosextraídos extraídosestão estãoinseridos, inseridos,e e assim visualizar sese aquele documento atende aoao que o usuário assim visualizar aquele documento atende que o usuário necessita. necessita. 37

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.