USO DE FERRAMENTAS DE CÓDIGO ABERTO EM UM DATA WAREHOUSE SOBRE DADOS EDUCACIONAIS

September 24, 2017 | Autor: Ricardo Ciferri | Categoria: Data Warehouse
Share Embed


Descrição do Produto

USO DE FERRAMENTAS DE CÓDIGO ABERTO EM UM DATA WAREHOUSE SOBRE DADOS EDUCACIONAIS Jan Paulo Borges Schatz1, Thiago Luís Lopes Siqueira1, Ricardo Rodrigues Ciferri1, Marilde Terezinha Prado Santos1 1 Universidade Federal de São Carlos (UFSCar) [email protected]; [email protected]

1. Introdução Um data warehouse (DW) possui a capacidade de sintetizar grandes volumes de dados. E, por este motivo, é o núcleo dos principais sistemas de apoio à decisão. A base de dados – representada intuitivamente por um cubo – favorece a geração de relatórios e a obtenção de informações estratégicas do negócio analisado. As ferramentas OLAP (Online Analytical Processing) são voltadas à exploração do DW e geram respostas rápidas a consultas analíticas de natureza dimensional. Nelas é possível navegar por diferentes níveis de granularidades do cubo, usando recursos como drill-down e roll-up [1], bem como criar visões dos dados por meio de sua reorganização, de forma que eles possam ser examinados sob diferentes perspectivas.

2. Web-PIDE Visando a esse tipo de análise surgiu o projeto de pesquisa “Web-PIDE: Uma Plataforma de Integração e Avaliação de Dados Educacionais”, resultado de uma parceria entre os programas de pós-graduação dos Departamentos de Computação da UFSCar e da UFMS (Universidade Federal do Mato Grosso do Sul). Um de seus objetivos é apoiar e investigar soluções computacionais a partir de diferentes bases de dados educacionais do INEP (Instituto Nacional de Estudos e Pesquisas Educacionais). Estas bases contemplam, por exemplo, o SAEB (Sistema de Avaliação do Ensino Básico), o ENEM (Exame Nacional do Ensino Médio) e o ENADE (Exame Nacional de Desempenho dos Estudantes). Os dados do INEP estão distribuídos de maneira não uniformizada e de difícil reuso e integração. Para suprir esta deficiência, um DW vem sendo construído pela equipe do projeto alocada na UFSCar. Atualmente, há um DW com aproximadamente 830 mil tuplas sobre o SAEB. Apesar dos esforços para realizar a integração destes dados no DW, os mecanismos de consulta disponíveis até então eram limitados à SQL (Structured Query Language).

3. Ferramentas e resultados Este estudo teve foco na utilização de ferramentas gratuitas e de código aberto, visto que a desvantagem da implantação da maior parte das soluções para DW reside nos custos de projeto [2]. A base de dados foi construída sobre o gerenciador de banco de dados PostgreSQL, e os mecanismos para consultas multidimensionais foram providos por ferramentas “open source” da Pentaho Corporation, como o Mondrian e o Cube Designer. O Mondrian é um servidor OLAP escrito em Java [3] que recebe solicitações de um cliente e as submete a um banco de dados. Ele mapeia as consultas multidimensionais para um banco de dados relacional, utilizando a tecnologia ROLAP (OLAP Relacional) [4].

Além disso, sua praticidade está no fato de analisar diversos conjuntos de dados armazenados em tabelas, por meio do uso da linguagem MDX (Multidimensional Expressions). Isto lhe confere menor tempo de resposta às consultas. Todos os detalhes acerca da instalação, configuração e operação dos aplicativos foram documentados e disponibilizados na Internet por meio da tecnologia wiki (http://ccbd.dc.ufscar.br/wiki/index.php/). Com isso foi possível compartilhar o conhecimento adquirido. Foram ainda criadas diversas consultas analíticas sobre os dados do DW, como:

Figura 1 – Exemplo de consulta utilizada no estudo Esta consulta serve para analisar a proficiência mínima dos alunos segundo a localização – neste caso a região Sul, estado de Santa Catarina – no ano de 2003.

4. Conclusões Este trabalho possibilitou o estudo de ferramentas de código aberto usando um data warehouse sobre dados educacionais, bem como a elaboração de consultas OLAP usando os softwares citados. Conclui-se que ferramentas de código aberto, aliadas à modelagem dimensional, podem ser utilizadas no planejamento do processo de armazenamento e recuperação de informações estatístico-educacionais. Desta forma facilitam a tomada de decisões para o estabelecimento de políticas de melhoria da educação brasileira.

5. Referências

[1] Kimball, R.; Ross, M. The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling. São Paulo: Makron Books, 1998. 388 p. [2] Bomfim, M. M. A Implementação e Utilização de Data Warehouse em Instituições Públicas no Brasil Um Estudo Descritivo das Implicações Envolvidas. UFSC, 2001. 132 p. Disponível em: . Acesso em 30 mai. 2008. [3] Pentaho. Mondrian Project. Disponível em: . Acesso em 23 fev. 2008. [4] Martins, M. P. et. al., Analysis: uma proposta de ferramenta OLAP-Web para a análise de informações ambientais do Vale do Rio do Sinos. UFRGS, 2005. p. 3. Disponível em: . Acesso em 28 mar. 2008.

Agradecimentos À UFSCar, à UFMS e à CAPES pela possibilidade de realizar este estudo.

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.