Ferramenta para Visualização de Informações Temporais para Bancos de Dados “Mestre/Detalhe”

June 1, 2017 | Autor: Paulo Roberto | Categoria: Relational Database, Information Visualization, Visual Data Mining
Share Embed


Descrição do Produto

Ferramenta para Visualização de Informações Temporais para Bancos de Dados “Mestre/Detalhe” Edécio Fernando Iepsen1,2, Paulo Roberto Gomes Luzzardi1, Stanley Loh1 1

Programa de Pós Graduação em Informática – Universidade Católica de Pelotas Rua Félix da Cunha, 412 – 96010-000 – Pelotas – RS – Brasil

2

Curso Superior Tecnologia em Sistemas de Informação – Faculdade Tecnologia Senac Rua Dom Pedro II, 901 – 96010-300 – Pelotas – RS – Brasil [email protected], {luzzardi, loh}@atlas.ucpel.tche.br

Trabalho de pós-graduação Abstract: Information Visualization is a field of graphic computing which aims to represent information graphically, allowing better understanding of a great amount of information. It also allows identifying standards, or even detecting new information which, at first, was not possible to be perceived due to its way of representation. This study briefly describes this field and presents a tool for visual data mining executed on the web to relate the information of systems based on relational databases of master/detail type. The advantage of this tool, besides executing directly on the web, is its capacity of accepting data from several systems exported by the user in the XML format. Resumo: A Visualização de Informações é uma área da computação gráfica que procura representar informações graficamente, permitindo com isso uma melhor compreensão de um grande volume de informações. Permite também identificar padrões ou ainda detectar novas informações até então imperceptíveis devido a sua forma de representação. O presente trabalho faz uma breve descrição sobre esta área e apresenta uma ferramenta para visual data mining executada na Web para relacionar as informações de sistemas baseados em banco de dados relacionais do tipo mestre/detalhe. O diferencial desta ferramenta, além de executar diretamente na Web, é a sua capacidade de aceitar dados de diversos sistemas exportados pelo usuário no formato XML.

1. Introdução Diversas são as expressões que fazem parte da nossa cultura e que são ditas naturalmente sem maiores considerações. Uma delas é “uma imagem vale por mil palavras”. E não é preciso descrever muito para exemplificar o que esta expressão quer dizer. Pode-se escrever linhas e linhas sobre a beleza de uma paisagem, mas dificilmente se transmite a mesma sensação produzida por uma imagem exibindo o local. O mesmo vale para informações cadastrais, principalmente de gigantescas bases de dados. Pode-se tomar como exemplo um sistema que acompanha as internações e tratamentos de pacientes de um hospital. Verificar em quais períodos do ano determinadas doenças são mais freqüentes é muito mais complexa de ser realizada a partir da análise cadastral dos dados do que a partir de um gráfico que relacione estes dados. Com base nesta informação medidas preventivas poderiam ser tomadas. Enfim, o objetivo principal da área de Visualização de Informações é o de facilitar a

compreensão dos dados de um determinado sistema através de representações visuais interativas geradas a partir de um conjunto de dados, conforme ilustra a Figura 1.

Figura 1. Processo de Visualização de Informações

Vale destacar que uma das principais características desta área é de que, as ferramentas desenvolvidas para a visualização de informações, devem permitir a interação do usuário sobre as representações geradas por estes. Para que seja ele, usuário, o sujeito da análise. A ferramenta apenas exibe uma representação visual, para que a partir dela, seja explorada a imensa capacidade de percepção visual humana. Este trabalho inicialmente faz uma breve descrição sobre o assunto. Em seguida, capítulo 2, descreve sobre as áreas envolvidas no estudo. No capítulo 3 descreve a ferramenta Web desenvolvida através da técnica das Coordenadas Paralelas. No capítulo 4 mostra um caso de uso da ferramenta, e finaliza com comentários e indicações sobre trabalhos futuros.

2. Visualização de Informações A visualização de informações é uma área da computação gráfica, que tem por objetivo a geração de imagens que facilitem a compreensão humana sobre determinado assunto. Combinando aspectos de computação gráfica, interfaces homem-máquina e mineração de dados [2] [1] [6], a visualização de informações permite a apresentação de dados de forma gráfica de modo que o usuário possa utilizar sua percepção visual para melhor analisar e compreender as informações [3] [8] [17]. No mundo atual, em que convive-se com excesso de informações e grande competitividade, o uso de ferramentas que auxiliem o homem no entendimento de dados sobre uma área é de extrema utilidade. Sabe-se que a capacidade humana de lidar com informações visuais é muito maior do que com dados textuais [20]. Resumidamente, as técnicas de Visualização de Informações procuram representar graficamente dados de um determinado domínio de aplicação de modo que a representação visual gerada explore a capacidade de percepção do homem e este, a partir das relações espaciais exibidas, interprete e compreenda as informações apresentadas e, finalmente, deduza novos conhecimentos [5]. 2.1. Técnicas de Visualização de Informações As técnicas de visualização de informações já desenvolvidas utilizam representações ou metáforas visuais para exibir graficamente os dados que geralmente não possuem representação direta, óbvia e natural. Em diversas técnicas, freqüentemente, os autores buscam inspiração em objetos do mundo real (ou geométricos) para mapear o conjunto de informações. As técnicas de visualização podem utilizar representações visuais 1D, 2D ou 3D, não necessariamente de acordo com a dimensão do espaço de informação [12].

A escolha de uma técnica de Visualização de Informações para um determinado conjunto de dados depende de diversos fatores. Assim como no processo da criação de um gráfico em programas de planilhas eletrônicas, onde são apresentados diversos formatos para a criação do gráfico, a construção de ferramentas para visualização de informações segue a mesma lógica. Há ferramentas mais ou menos adequadas para representar determinados conjuntos de informações. São exemplos de técnicas de Visualização de Informações (ilustradas na figura 2): a) Foco + Contexto: permite exibir um conjunto de informações ao usuário, onde ele pode destacar a parte de seu interesse – geralmente ampliando a informação selecionada [16]. As técnicas do tipo foco+contexto são também conhecidas como Fisheye, por justamente simular um olho de peixe [4]. b) Landscapes: faz uso de paisagens (landscapes) para a representação das interrelações de grupos de dados contendo imagens metafóricas relacionadas [17]. Uma ferramenta que utiliza esta técnica é o kartoo (www.kartoo.com), um site de metabusca na web. c) Coordenadas Paralelas: foi proposta por Inselberg [9] e permite relacionar informações entre si. A técnica enfatiza, principalmente, relações entre eixos adjacentes e conjuntos de dados que possuem padrões similares [7].

Figura 2. Técnicas de Visualização de Informações

2.2. Visual Data Mining Para gerar uma visualização das informações a partir de um grande volume de dados é necessário, inicialmente, selecionar e organizar estes dados de forma que eles possam transmitir concisamente uma informação. Não basta simplesmente transformar dados textuais em representações gráficas. A visual data mining consiste na junção das técnicas de Mineração de Dados com as técnicas de Visualização de Informações. Para que uma mineração de dados seja efetiva, é importante incluir o usuário no processo de exploração de dados e combinar flexibilidade, criatividade e conhecimento geral do homem com a capacidade de armazenagem e o enorme poder computacional dos computadores de hoje. A idéia básica da visual data mining é apresentar os dados de alguma forma visual, permitir ao usuário obter uma visão dos dados, tirar conclusões e interagir diretamente com os dados [10].

3. Ferramenta de Visualização de Informações Temporais Inúmeras aplicações que utilizam banco de dados estão organizadas no formato “mestre/detalhe”. Neles, há uma tabela principal e uma tabela relacionada a ela que armazena interações do sistema sobre estes dados. A ferramenta Web de visualização de informações desenvolvida é genérica para estes sistemas e está disponível para uso no endereço eletrônico www.edecio.com.br/visinfo. A idéia do desenvolvimento desta ferramenta surgiu a partir da observação de que a estrutura das tabelas de aplicativos como controles de estoque, controles acadêmicos, consultórios médicos, hospitais, etc. possuem uma estrutura semelhante: tem-se produtos e vendas destes produtos; tem-se pacientes e consultas realizadas por estes pacientes no decorrer de um intervalo de tempo. Ou seja, para uma tabela “mestre” há uma tabela “detalhe” com indicações de ocorrências na tabela “mestre”. Observe os modelos típicos de estruturação destas tabelas na figura 3, que apresenta o relacionamento entre as tabelas Veículos (mestre) e Locações (detalhe) de um tradicional sistema de controle de locações de veículos de uma Auto-Locadora.

Figura 3: Estrutura das tabelas no modelo mestre/detalhe

Muitas instituições têm nos sistemas que utilizam tabelas estruturadas no modelo “mestre/detalhe” as informações que são o foco principal das suas atividades. Desenvolver uma ferramenta visual que possa facilitar a análise dos dados destes sistemas pode significar, em alguns casos, a percepção do desempenho da própria instituição. 3.1. Tipos de Dados Uma das características de maior destaque da ferramenta proposta é o fato dela ser adaptável aos dados a serem submetidos pelo usuário, ampliando em muito a sua utilização. Para um correto funcionamento da ferramenta os dados devem possuir algumas características de estruturação e conteúdo, descritas a seguir: Tabela Mestre: ƒ Deve possuir, no mínimo, um atributo (campo) a ser utilizado para exibição da listagem dos dados, a partir do qual os dados serão agrupados e também sobre o qual podem ser definidos filtros; ƒ Deve possuir um atributo que estabeleça o relacionamento com a tabela das interações (chave estrangeira), sendo eles do mesmo tipo; Tabela Detalhe: ƒ Deve possuir o atributo que cria o relacionamento com a tabela principal;

ƒ Deve possuir um atributo que indica a data de ocorrência do evento a ser analisado, que será exibido no eixo temporal da representação visual; ƒ Deve possuir um ou mais atributos do tipo numéricos sobre os quais serão realizados os cálculos a serem representados na ferramenta. Estes atributos são recomendados, porém não obrigatórios, visto que o cálculo básico de contagem de ocorrências das interações pode ser exibido, a partir dos dois atributos indicados acima. 3.2. Metodologia de Desenvolvimento Para construir uma nova ferramenta de Visualização de Informações, segundo Ferreira e Nascimento [7], deve-se utilizar uma metodologia que contemple as seguintes etapas: a) Estudo do problema e dos dados a serem visualizados; b) Construção de visualizações; c) Definição dos mecanismos de interação; d) Implementação de um sistema protótipo; e) Avaliação das visualizações. Etapas estas cuidadosamente observadas no desenvolvimento da ferramenta proposta. Também foi utilizado como referência para a construção da ferramenta o paradigma de exploração visual proposto por Keim [10], em seu artigo “Information Visualization and Visual Data Mining”, em que a exploração visual de dados deve seguir um processo de três etapas: visão geral, zoom & filtro e detalhe por demanda. O processo de avaliação da ferramenta está sendo realizado através dos dois conjuntos de critérios de avaliação, definidos por Luzzardi [12], para avaliar as técnicas de Visualização de Informações em relação aos aspectos relacionados a representação visual e aos mecanismos interativos presentes na ferramentas. 3.3. Técnica Utilizada pela Ferramenta A técnica de Visualização de Informações mais adequada para a representação dos dados estruturados no formato mestre/detalhe é a das Coordenadas Paralelas, onde os grupos de registros da tabela mestre são representados em linhas do tempo, enquanto que, os valores obtidos na tabela detalhe são representados nas “Coordenadas Paralelas” da técnica. Observe a representação visual exibida na figura 4 que mostra as locações de filmes agrupados por gênero. Com a técnica das Coordenadas Paralelas pode-se: ƒ Utilizar a coluna inicial para exibir os grupos da tabela principal; ƒ Fazer com que cada coluna da representação visual contenha um período a ser analisado, no exemplo, os meses do ano; ƒ Demonstrar pelo local em que as linhas percorrem estas colunas o valor aproximado de locações do grupo em cada um dos meses; ƒ Exibir após a coluna final a faixa de valores representada.

Figura 4: Exemplo de Uso da Técnica das Coordenadas Paralelas

3.4. Referência A ferramenta tem como referência o paradigma do processo de construção da visualização e interação com o usuário em três etapas (visão geral, zoom & filtro e detalhe por demanda) proposta por Keim [10]. Primeiramente a ferramenta exibe uma visão geral dos dados obtidos a partir da tabela principal e da tabela de monitoramentos. Os registros da tabela principal são agrupados a partir da hierarquia selecionada pelo usuário no formulário inicial da ferramenta. Após a indicação das tabelas, relacionamentos, atributos de agrupamento, filtro e de controle do eixo temporal, a ferramenta exibe uma representação visual com os valores default do sistema. A partir desta representação, permite ao usuário ampliar e restringir (filtrar) a visualização dos registros “clicando” sobre eles. Ainda nesta etapa, Keim sugere a especificação de filtros para melhor visualizar os dados sobre os quais o usuário pode identificar a incidência de prováveis padrões ou a descoberta de novas informações. Para isso, através do formulário exibido no frame superior da ferramenta, o usuário pode definir filtros selecionando os dados do seu interesse. Detalhes por demanda, indicado na 3ª etapa do processo de visual data mining, é um método usado no estágio da transformação de dados para ampliar um pequeno conjunto de objetos, revelando mais informações sobre eles [12]. Para esta etapa a ferramenta permite a seleção entre duas formas de destacar os itens apresentados no formulário: visualização da hierarquia ou destacar o item selecionado. Através da escolha do modo de seleção dos dados, permite ao usuário ampliar o detalhamento dos itens a serem apresentados ou então destacar um item, comparando o seu desempenho com todos os demais, ou ainda, relacionando dois ou mais itens específicos. 3.5. Funcionamento Para utilizar a ferramenta o usuário deve inicialmente exportar sua base de dados para o formato XML, recurso disponível na maioria dos Sistemas Gerenciadores de Banco de Dados (SGBDs). Em seguida, ele precisa acessar o site da ferramenta, www.edecio.com.br/visinfo, e selecionar os arquivos XML, mestre e detalhe, para serem enviados para a ferramenta. A partir deste ponto, o sistema identifica a estrutura das tabelas e submete esta estrutura para que o usuário indique os atributos que fazem o relacionamento entre a tabela principal e a tabela de monitoramentos. Após, o usuário deve fazer a seleção da hierarquia dos atributos da tabela principal em que ele quer que os dados fiquem organizados (podem ser definidos até quatro atributos). Ou seja, qual o grupo principal será inicialmente exibido pela ferramenta e quais os subgrupos estarão subordinados a ele. A ferramenta, a seguir, gera uma visualização padrão com todos os dados sendo exibidos, agrupados pelo primeiro nível de hierarquia indicado pelo usuário, totalizados pela contagem dos registros, com as cores indicativas de desempenho (+/-), com as datas totalizadas por intervalo de ano e abrangendo todo o período de tempo constante nas tabelas importadas, ou seja, as configurações default do sistema. A partir desta primeira visualização o sistema espera pelas interações do usuário, permitindo a definição de diversos filtros, seleções dos dados exibidos, bem como, características dos dados. Um exemplo é a seleção dos itens da tabela mestre que contém desempenho crescente, decrescente ou oposto no período analisado. Enfim, importantes informações podem ser obtidas através da representação visual gerada.

A figura 5 ilustra as etapas, bem como, as interações possíveis dos usuários na utilização da ferramenta de Visualização de Informações desenvolvida.

Figura 5: Diagrama de funcionamento da ferramenta

4. Estudo de Caso Para uma melhor compreensão das características da ferramenta de visualização desenvolvida será apresentado um exemplo de uso da ferramenta aplicada a um sistema real. O sistema contém as tabelas Produtos e Vendas, que realizam o controle das vendas de um determinado supermercado. As tabelas estão inicialmente armazenadas no Microsoft Access e são exportadas para “produtos.xml” e “vendas.xml”. A tabela 1 apresenta os atributos destas tabelas e a figura 6 apresenta o formulário preenchido para a representação dos dados deste sistema. Tabela 1: Estrutura das tabelas de Produtos e Vendas do estudo de caso

Produtos Código Número Descricao Texto Genero Texto Peso Número Validade Data/Hora Quantidade Número Preço Moeda

Numero CodPro Quant Preço DtMov

Vendas Número Texto Texto Número Data/Hora

Figura 6. Formulário inicial para importação dos dados XML

A partir do preenchimento do formulário com a indicação da tabela de produtos como tabela mestre e a tabela de vendas como tabela detalhe a ferramenta gera uma visualização inicial sobre a qual o usuário poderá interagir (figura 7).

Figura 7: Uso da ferramenta em um tradicional sistema de controle de vendas

Dentre as várias opções de interação disponíveis na ferramenta pode-se destacar: ƒ Cores: permitem ao usuário indicar a forma de uso das cores no gráfico. Ele pode optar por utilizar cores diferentes para cada item apresentado ou cores indicativas de acréscimo (+) ou decréscimo (-) nas interações da tabela detalhe. As cores diferentes permitem acompanhar melhor o desempenho de um item ou de um grupo de itens no decorrer do período visualizado. Já as cores indicativas servem para que o usuário tenha uma visão geral do desempenho dos itens de um período para outro. Por exemplo, se do ano de 2002 para o ano de 2003 prevalecer a cor verde sobre a cor vermelha, é sinal de que houve uma melhora geral nas vendas dos produtos neste período. ƒ Seleção: serve para definir se a seleção de um item no gráfico fará a ferramenta ampliar ou reduzir o nível de detalhamento dos itens apresentados ou destacar este item em comparação aos demais. A figura 8 relaciona os dois tipos de interação do gráfico disponíveis neste item. Caso Hierarquia esteja selecionado, um clique sobre Alimentos faz com que os produtos do grupo Alimentos fossem apresentados. Porém, se Destacar estiver selecionado, clicar sobre um item modifica a cor deste item, destacando-o dos demais. O usuário pode destacar/relacionar quantos produtos ele desejar, sendo que a ferramenta, neste caso, exibe cada item de uma cor diferente. ƒ Cálculo: indica o tipo de cálculo a ser aplicado sobre os itens da tabela detalhe. O usuário pode selecionar entre Somar, Contar ou Calcular o valor médio. No caso da soma ou média é necessário também indicar o campo sobre o qual será realizado o cálculo. Permite comparar quantas vezes um determinado produto foi vendido, ou então o montante total de vendas, ou ainda, efetuar o cálculo sobre o número médio de vendas dos itens em comparação aos demais.

ƒ Exibir: permite ao usuário selecionar o intervalo de tempo a ser exibido no gráfico. O usuário pode selecionar entre Ano, Mês, Quinzena, Semana e Dia. Serve também para ampliar a análise sobre os dados relacionados com o período de tempo em que as interações ocorrem. ƒ Comportamento: possibilita ao usuário destacar os grupos ou produtos que apresentam comportamento semelhante (acréscimo ou decréscimo), ou então, que se comportaram de maneira oposta no período analisado. Importantes correlações podem ser obtidas a partir da análise dos dados deste recurso da ferramenta.

Figura 8. Opções de seleção de itens da ferramenta

5. Conclusões e futuros trabalhos A área de visualização de informações apresenta um campo que permite o desenvolvimento de diversas ferramentas a serem utilizadas para facilitar a compreensão dos mais variados assuntos. Este artigo fez a descrição dos conceitos relacionados à área, bem como, de técnicas e ferramentas utilizadas para suas representações. Fez também a apresentação de uma ferramenta Web criada para a visualização das informações geradas por sistemas de bancos de dados relacionais do tipo “mestre/detalhe”. Um diferencial importante da ferramenta é a sua capacidade de permitir a importação de dados no formato XML, não sendo específica para análise de apenas um conjunto de dados. Isto faz com que a ferramenta possa ser utilizada para auxiliar na descoberta de conhecimento em diversas bases de dados. Por exemplo, em uma base de dados de um sistema de controle de internações de pacientes em um hospital. Informações como: quais os períodos do ano em que ocorrem um maior número de internações, quais os grupos de pacientes que apresentam taxas crescentes de consultas, quais os grupos apresentam taxas inversamente proporcionais, etc. podem facilmente ser analisadas através dos gráficos gerados pela ferramenta. O passo seguinte à apresentação deste artigo será a realização das devidas análises de desempenho da ferramenta apresentada, a partir da base de dados de diversos sistemas, buscando a realização de adequações e aperfeiçoamentos.

6. Referências Bibliográficas [1] Agrawal, R. (1995) “Data mining: the quest perspective” In: EDBT SUMMER SCHOOL, Gubbio, Italy. http://www.almaden.ibm.com/cs/quest, April 2002. [2] Agrawal, R.; Imielinski, T. (1993) “Database mining: a performance perspective” IEEE Transactions on Knowledge and Data Engineering, New York, v. 5, n. 6 p. 914-925

[3] Ahlberg, C.; Shneiderman, B.(1994) “Visual Information Seeking: Tight Coupling of Dynamic Query Filters with Starfield Displays”, In: ACM Conference on Human Factors in Computing Systems, pages 313–317, 479–480 [4] Card, S.K.; Mackinlay, J.D.; Shneiderman, B. (1999) “Information Visualization”, In: Readings in Information Visualization - Using Visualization to Think. San Francisco, Morgan Kaufmann Publications [5] Cava, R. A.; Chubachi, O. M.; Freitas, C. M.; Luzzardi, P. R. G (2001) “Introdução à Visualização de Informações”. UFRGS: Revista RITA, Porto Alegre. [6] Fayyad, U.; et al. (1996) “Advances in Knowledge Discovery and Data Mining.” Cambridge: MIT Press. [7] Ferreira, C. B. R.; Nascimento, H. A. D. (2005) “Visualização de Informações – Uma Abordagem Prática”. Congresso SBC, São Leopoldo, RS, Brasil. [8] Gershon, N.; Eick, S.; (1997) “Information Visualization. IEEE Computer Graphics and Applications”, Los Alamitos, v. 17, n. 4, p. 29-31, July/Aug. [9] Inselberg, A.; (1997) “Multidimensional detective. In IEEE Symposium on Information Visualization”, pages 100–107, Washington, Brussels, Tokyo. October. [10] Keim, D. A. (2002) “Information Visualization and Visual Data Mining”. IEEE Transactions On Visualization And Computer Graphics, v. 7, n. 1, January-March. [11] Loh, S.; Garin, R. S. (2001) “Web Intelligence – Inteligência Artificial para Descoberta de Conhecimento na Web”. http://www.inf.unisinos.br [12] Luzzardi, P. R. G.; (2003) “Critérios de Avaliação de Técnicas de Visualização de Informações Hierárquicas”. Tese de Doutorado. UFRGS: Porto Alegre. [13] Plaisant, C.; Shneiderman, B. (1998) “LifeLines: Using Visualization to Enhance Navigation and Analysis of Patient Records”. Revised version appeared in 1998 American Medical Informatics Association Annual Fall Symposium [14] Rao, R.; Card, S. K.; (1994). “The table lens: Merging graphical and symbolic representation in an interactive focus + context visualization for tabular information” In Proceedings of ACM Conference on Human Factors in Software, ACM-Press. [15] Robertson, G.; Card, S.; Mackinlay, J. (1994) “Cone Trees: Animated 3D Visualizations of Hierarchical Information” Proceedings of ACM CHI´99 p.189-194. [16] Shneiderman, B.(1996) “The eyes have it: a task by data type taxonomy for information visualizations” Proceedings of IEEE Symposium on Visual Languages, Boulder, CO, September 3-6. p. 336-343. [17] Spence, R. (2001) “Information Visualization”. ACM Press and Addison-Wesley. [18] Swan, R.; Jensen, D (2000) “TimeMines: Constructing Timelines with Statistical Models of Word Usage” Department of Computer Science, University of Massachusetts - Amherst, Massachusetts USA. [19] Viegas, F.; Donath, J. (1999) “Chat Circles” Computing System, New York: NY, USA. ACM Press new York, NY, USA. [20] Ware, C. (2004) “Information Visualization Perception for Design”, San Francisco: CA, USA. Morgan Kaufmann Publishers Agradecimentos: Este trabalho conta com o apoio do CNPq, UCPel e SENAC.

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.