Como importar planilhas no Gephi para gerar redes

June 28, 2017 | Autor: Rodrigo Horochovski | Categoria: Discourse Analysis, Sociology, Communication, Political Science
Share Embed


Descrição do Produto

Como importar planilhas no Gephi para gerar redes Rodrigo Rossi Horochovski - Universidade Federal do Paraná (UFPR) 12 jan. 2015

Escrevi este pequeno texto após um colega me perguntar se havia algum tutorial sobre importação de dados no Gephi, um dos programas de análise de redes mais usados atualmente. Dizia ele ter pesquisado e não localizado material deste tipo. Com frequência, outras pessoas me procuram com a mesma dúvida e, de fato, consultando o portal do programa na época, encontrei apenas tutoriais que explicavam como usar arquivos do Gephi com dados já importados. Neste documento apresento o conjunto de passos que o usuário deve dar para gerar as redes mais básicas. Não se trata, contudo, de um tutorial do Gephi. Para instalação e uso do programa, basta consultar www.gephi.org. Infelizmente, ele não roda em versões mais recentes do Java. É necessário, portanto, instalar uma versão antiga (até 7). Vamos imaginar uma rede formada por pessoas e suas frutas prediletas, obtidas a partir de uma enquete na qual se perguntou as duas frutas preferidas em ordem de preferência. Temos 10 pessoas e 5 frutas.  Pessoas: João, Maria, Pedro, José, Ana, Carlos, Marta, Antônio, Joaquim, Luciana.  Frutas: Banana, Laranja, Morango, Manga, Mamão. Depois de tabular os questionários, obtivemos a planilha Banco.xlsx. Recomendo usar o programa de planilha Calc, da suíte de escritório LibreOffice e assemelhadas (Excel, por exemplo). Usuários avançados podem usar gerenciadores de bancos de dados e fazer importações diretas no Gephi, mas isso foge ao escopo deste tutorial, destinado ao comum dos mortais.

A partir do banco original, é possível preparar as planilhas que serão importadas no Gephi. Elas precisam ser salvas em formato .csv (valores separados por vírgulas). Elaboramos uma para os nós e outra para as arestas. Na primeira planilha (Nós.csv), simplesmente substituímos o rótulo da coluna Nome por Nodes e acrescentamos duas colunas (Id e Label). Aqui, optamos por utilizar os mesmos nomes para as três colunas. Outra coisa importante é que as frutas, neste caso, também são nós, por isso as acrescentamos. Isso não é estritamente necessário, pois, como veremos adiante, o Gephi cria nós inexistentes a partir de uma planilha de arestas.

A segunda planilha (Arestas.csv) deve apresentar, obrigatoriamente, duas colunas, uma denominada Source (nó de origem) e outra, Target (nó de destino). O programa “lerá” cada uma das linhas como um vínculo/aresta entre dois nós. Optamos aqui por acrescentar duas outras colunas: Type e Weight. Type: refere-se ao tipo de aresta, se direcional (directed) ou não direcional (undirected). Escolhemos a segunda opção, pela qual a direção do vínculo não importa para os cálculos de rede. Estatísticas como centralidade de intermediação só têm sentido neste caso. Weight: refere-se ao peso da aresta. Para o nosso exercício, atribuímos peso 2 à primeira escolha do respondente e peso 1, à segunda.

Agora é só importar as planilhas no Gephi. Os passos são os seguintes: 1) Abrir o programa, clicando sobre o ícone que deve ter se fixado na área de trabalho após a instalação. Uma vez no programa, clicar em Arquivo > Novo Projeto > Salvar Como, escolher um nome (optamos por Rede), e escolher a opção “Arquivos Gephi (*gephi)” em Arquivos do tipo:

2) Clicar na guia Laboratório de dados. Nesta, selecionar a guia Tabela de dados. Deverá aparecer a seguinte tela:

Chegando aí, temos duas opções, a mais simples é importar somente a planilha de arestas e permitir que o programa crie os nós inexistentes. Para tanto: 3) Clicar em Arestas, logo abaixo de Tabela de dados, e em seguida em Importar planilha. A tela a seguir deverá aparecer:

Aqui é necessário prestar atenção a alguns aspectos:  para selecionar o arquivo a ser aberto, clicar no botão […];  no campo Separador:, é necessário selecionar a opção que separe adequadamente as colunas (vírgula, ponto e vírgula, marca de tabulação ou espaço);  no campo Tabela:, é necessário selecionar Tabela de arestas:;  o campo Codificação de caracteres: refere-se ao código das fontes utilizadas (em geral UTF-8 ou windows 1250). É importante que a seleção corresponda à do arquivo .csv gerado. Para tanto, basta ir testando as várias opções até encontrar aquela que não apresenta problemas com acentuação gráfica. Uma alternativa é não usar acentos no banco original.

4) Clicar no botão Próximo > e aparecerá a seguinte tela:

Atenção: é necessário selecionar a opção Criar nós inexistentes ao gerar uma rede a partir somente da planilha de arestas. 5) Clicar em Finalizar. A tabela de arestas deverá aparecer na tela:

Ao clicar em Nós, abaixo de Tabela de dados, deverá aparecer os nós que o próprio programa criou:

Ao clicar-se em Visão Geral, a rede aparece, porém sem os rótulos dos nós (explicaremos como mostrá-los adiante).

Esta é a forma mais simples de gerar uma rede. Ela apresenta, contudo, o inconveniente de gerar uma tabela de nós em que estes não têm atributos – lembremos que, em nosso banco original, os atores eram classificados em variáveis como idade e gênero, por exemplo. O máximo que podemos fazer é executar os cálculos que vão gerar colunas adicionais com as variáveis correspondentes – centralidade, grau etc. Para tanto, basta clicar em Estatísticas, na parte superior direita e executar os cálculos que se deseje. Isso é suficiente se em nossa análise não nos importamos com características individuais dos atores/nós que estamos investigando. Vejamos a tabela resultante:

Agora vejamos como gerar uma rede com os atributos dos atores. Para isso, basta executar alguns passos antes do passo 3:

I) Em Tabela de dados, clicar em Nós > Importar planilha, devendo aparecer a seguinte tela:

Aqui é necessário prestar atenção aos mesmos aspectos observados para a importação da planilha de arestas:  para selecionar o arquivo a ser aberto, clicar no botão […];  no campo Separador:, é necessário selecionar a opção que separe adequadamente as colunas (vírgula, ponto e vírgula, marca de tabulação ou espaço);  no campo Tabela:, é necessário selecionar Tabela de nós:;  o campo Codificação de caracteres: refere-se ao código das fontes utilizadas. É importante que a seleção corresponda à do arquivo .csv gerado. Para tanto, basta ir testando as várias opções até encontrar aquela que não apresenta problemas com acentuação gráfica (em geral UTF-8 ou windows 1250). II) Clicar no botão Próximo > e aparecerá a seguinte tela:

Antes de finalizar, é recomendável verificar se todas as colunas desejadas foram importadas, deslizando a barra lateral para baixo. É interessante também verificar o campo abaixo de cada nome de colunas, que se refere ao tipo de variável. No nosso exemplo, a variável idade é numérica, formada por números inteiros. Desse modo, optamos por selecionar a opção BigInteger no referido campo. Quando se opta por gerar uma rede importando a planilha de nós, não é necessário selecionar a opção Forçar nós a serem criados como novos:

III) Clicar em Finalizar. A tela resultante é esta:

Note-se que o Gephi importou todas as colunas do banco original. A partir daqui, basta executar os mesmos passos (3 a 5) para importação da planilha de arestas, descritos anteriormente. A única diferença é que, neste caso, não é necessário selecionar a opção Criar nós inexistentes nas Configurações de importação, como segue:

Basta então clicar em Finalizar e a tabela de arestas é importada:

A rede resultante encontra-se abaixo:

Para que os rótulos dos nós apareçam, é necessário clicar sobre o ícone direito da área de visualização do grafo. Na guia Rótulos, a opção Nó deverá estar selecionada:

Abaixo, a tela resultante:

Clicando

em

obtemos opções de visualização de rótulos:

localizado no canto inferior

A partir deste ponto, os tutoriais disponíveis no site do programa (www.gephi.org, no link Learn) devem dar conta das necessidades de quem queira aprender a utilizá-lo. Boa sorte!

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.