Bases de dados relacionais e análise de redes na investigação histórica
Descrição do Produto
Bases de dados relacionais e análise de redes na inves/gação histórica
h#p://'melink.fl.uc.pt
Ana Isabel Ribeiro©2014
O Problema • Reconstruir biografias individuais a par'r de fontes diversas.
• Poucas escolhas a priori sobre quem é importante: análise centrada nas redes de relações.
• Grande variedade e diversidade de fontes.
• A iden'ficação da mesma pessoa em fontes diferentes é central (cruzamento nominal).
• Fontes têm de ser transcritas com pouca perca de informação.
O Objec/vo • Transcrições próximas da fonte:
– Preservar informação. – Adiar decisões de perca de informação ou de irrelevância.
• Iden'ficação de pessoas a posteriori: – Iden'ficar apenas quando temos o máximo de informação. – Processo reversível, poder desfazer os inevitáveis erros a qualquer momento.
• Interface flexível e sofis'cado para a informação final. – Apresentar a complexidade das relações e as biografias individuais de forma simples.
• Dupla abordagem:
A Solução
– Um modelo orientado à fonte permite transcrever os documentos com poucas percas e de forma rápida (Thaller). – Um modelo orientado às pessoas permite criar uma base dados com informação variável e complexa sobre pessoas, incluindo decisões reversíveis sobre quem é quem. (Carvalho)
• A notação Kleio (Thaller) é usada no modelo orientado às fontes.
• Um “framework” relacional (RCH) é usado no modelo orientado às pessoas (RCH = Reconstruc'ng Communi'es Historically)
• Um tradutor faz a conversão das transcrições em informação para o modelo orientado às pessoas.
• Resolve a inevitável tensão entre a a estrutura da fonte e a estrutura do modelo analí'co.
Modelo baseado na notação Kleio • Baseado numa estrutura fonte/acto/actor ou objecto • Uma fonte contém um ou mais actos. • Os actos contém actores (pessoas) e objectos (propriedades, ins'tuições…) • Os actores e os objectos são descritos por atributos que possuem um dado valor em determinado momento no tempo. • Actores e objectos estabelecem relações entre si em determinados momentos no tempo.
O Modelo orientado a pessoas • Cada pessoa é composta por três 'pos de informações: – As funções (o estatuto com que aparece num acto) – Os atributos (morada, idade, profissão…) – As relações
Exemplo de notação Kleio
Fonte: registos paroquiais (bap'smo) b$b1685.11/17/9/1685/fl. 65/igreja matriz de Atributos soure/manuel cordeiro n$manuel/m pai$jose luis/m ls$residencia/casal da corujeira mae$domingas jorge/f pad$francisco rodrigues/m/id=b1685.11.4 ls$residencia/moinhos do paleao mad$maria pereira/f Actores rel$parentesco/mulher/francisco rodrigues/b1685.11.4 Relações
escritura$not1782mlcf-‐84a10/29/4/1782/dinheiro a juro/fol=9v-‐11/loc=portaria do colegio de sao jose dos marianos/sumario=juro de 60000 reis que dao por seu reverendo procurador as religiosas do convento de santa teresa a jose de oliveira galvao e sua mulher, joana ferreira de condeixa a nova.
credor$convento de santa teresa de coimbra/id=n1782a10c procurador$manuel de jesus ls$'tulo/reverendíssimo ls$'tulo/frei ls$'tulo/conventual do colegio de sao jose dos marianos rel$sociabilidade/procurador/convento de santa teresa de coimbra/n1782a10c ls$assina/sim/obs=bem
devedor$jose de oliveira galvao/id=1782-‐e10-‐galvao ls$residencia/condeixa a nova rel$parentesco/marido/joana ferreira/n1782a10d ls$assina/sim/obs=bem devedora$joana ferreira/id=n1782a10d divida$60000 reis/juro de 5 por cento/prazo=1 ano
garan'a$umas casas de sobrado/obs= onde vive atr$localizacao/rua das bicas/obs=condeixa atr$valor/30000 reis rel$posse/pertence/jose de oliveira galvao/1782-‐e10-‐galvao … fiador$antonio mendes/id=1782-‐e10-‐mendes ls$residencia/condeixa a velha ls$assina/cruz garan'a$umas casas de sobrado /obs=onde vive que vive atr$valor/24000 reis atr$localizacao/condeixa a velha rel$posse/pertence/antonio mendes/1782-‐e10-‐mendes … test$francisco goncalves fino ls$profissao/carpinteiro ls$residencia/coimbra ls$assina/sim/obs=bem test$joao simoes ls$profissao/alfaiate ls$residencia/condeixa ls$assina/sim
O Framework para o Modelo Orientado a Pessoas
U/lização do Time Link na construção de biografias
Exploração da base de dados • Pesquisa genérica
• Pesquisa por atributos
• Cruzamento de atributos
• Pesquisa por sintaxe SQL
• Calendário
Exemplo de uma biografia consolidada
U/lização do Time link na geração de redes
Conclusão
• Nos úl'mos dois anos, em parte pelo efeito de orientação de teses, em parte pela colaboração com Colónia, consolidou-‐se um conjunto de conceitos, modelos e ferramentas que agilizam trabalhos complexos sobre informação biográfica, destacando-‐se:
-‐ Reformulação gráfica da aplicação web (a'ngir todo o 'po de u'lizadores); -‐ Pesquisas simplificadas (por palavra, por atributo, por cruzamento de atributos); -‐ Iden'ficação colec'va de pessoas (bases on-‐line: h#p://'melink.fl.uc.pt/mhk/login/);
-‐ Ferramenta para geração automá'ca de redes
A análise de redes em História
Potencialidades do uso da análise de redes:
ü a visualização das interacções dos actores num contexto social (ou de poder) específico pode desvendar ao historiador relações, dependências e evoluções nas relações e decisões, que metodologias mais tradicionais teriam mais dificuldade em detectar;
ü Permite ao historiador colocar o enfoque da sua análise na apreensão dos padrões de relacionamento que definem estruturas sociais, polí'cas e económicas e que resultam da arquitectura das ligações que os actores vão estabelecendo entre si.
Dificuldades:
-‐ A v i s u a l i z a ç ã o d a d i a c r o n i a e consequentemente dos padrões de evolução no tempo;
-‐ A análise de redes não fornece respostas óbvias, apenas tende a sinalizar actores e relações que, mediante uma análise mais aprofundada das fontes, se podem relevar significa'vos ou até vitais numa rede de relações sociais;
-‐ A dificuldade de leitura de algumas representações gráficas;
-‐ A dificuldade de transposição da análise da rede pelo historiador para um explicação clara des'nada a um leitor, especialista ou não.
1. A detecção da elite no município de Coimbra através da análise das escolhas dos elegíveis para o cargo de vereador (3 lugares).
Fonte principal – pautas enviadas ao desembargo do Paço (e recepcionados do desembargo do Paço para os anos de 1783, 1796, 1804, 1811, 1814, 1816), mais especificamente os arrolamentos que nelas constam.
Ferramenta metodológica – análise das redes geradas pela base dados a par'r de uma relação específica: A “arrolou para verador” B
Conceitos de redes • Actores e relações. • Representação matemática da rede: • A rede designa-se por grafo (graph) • Os actores correspondem a nós (nodes) • As relações correspondem a arestas (edges)
Direcção • • •
Uma distinção importante é entre
• •
Grafos dirigidos (directed graphs) Grafos não dirigidos (un-directed graphs)
Um grafo dirigido é um grafo onde uma relação entre A e B não significa que a mesma relação exista entre B e A. Um grafo não dirigido é um grafo em que A-B é equivalente a B-A
sexta-feira, 4 de Junho de 2010
11
Operações e medidas •
Existem várias operações e medidas que podem ser feitas sobre grafos/redes
•
Podem ser calculados atributos relacionais dos indivíduos.
•
Podem ser calculadas medidas globais sobre a rede.
•
Podem ser feitas operações de segmentação da rede.
Atributos relacionais •
Podemos calcular atributos para os indivíduos que decorrem do seu comportamento relacional:
• • •
Grau (degree): número de ligações de um nó.
•
Prestígio (prestige): grau ponderado de um indivíduo tendo em conta o prestígio de quem se liga com ele.
Nos grafos dirigidos distingue-se in-degree de out-degree. Betweeness (intermediação?) medida do número de fluxos que desapareceriam se o indivíduo fosse removido do grafo.
Medidas de rede • Distância: número de ligações existentes
entre dois indivíduos (teoria dos 6 graus).
• Densidade: relação entre o número de
ligações existentes e o número teórico de relações possíveis.
• Conectividade: todos os nós estão ligados, ou existem “ilhas” de ligações.
Operações sobre redes •
Detecção de sub-componentes:
•
Um componente fraco, ou componente simplesmente, é um conjunto de nós em que se pode ir de cada um para qualquer outro, ignorando as direcções das arestas
•
Um componente forte é a mesma coisa mas respeita a direcção das arestas.
•
Uma clique é um subrede de densidade máxima.
Alguns casos prá/cos
Resultados:
Indegree
Outdegree
Betweenness
Leituras • O primeiro ponto de destaque na rede, situado à esquerda, é um par de informantes fidalgos cujas escolhas recaem exclusivamente em elegíveis também fidalgos. Este cluster corresponde aos arrolamentos produzidos em 1783, a par'r do qual os eleitores compuseram as suas pautas para os de 1784, 1785 e 1786.
• A densidade das relações estabelecidas entre este grupo fidalgo e os restantes nós da rede também é baixa;
• Existe um grupo alargado de fidalgos, que não se relaciona com outros nós da rede de condição social diferente;
• Estes nós que representam os fidalgos elegíveis (em 1783) têm um indegree, ou seja, o número de vér'ces a eles direccionados, muito baixo – o indegree e outdegree, ou seja a direcção das suas escolhas, mostra-‐nos que estamos a lidar com um grupo pequeno e fechado socialmente que interage pouco com os outros actores da rede.
Os indivíduos com mais elevado indegree são bacharéis ou doutores, embora possamos encontrar também alguns fidalgos; • Tal explica-‐se que pelo facto dos informantes serem, no período em estudo, gente do meio das letras, que indicam maioritariamente outros letrados para o cargo de vereador e cada vez menos fidalgos. São os actores que, em termos do poder local execu'vo, ganham maior peso na cronologia analisada (1783-‐1817).
As outras secções da rede demonstram que:
• o número de informantes fidalgos tende a diminuir ao longo do período cartografado nesta rede;
• as escolhas dos que se mantêm, ou assumem esta função, tendem a diversificar-‐se socialmente, traduzindo-‐se no aparecimento de ligações entre informantes fidalgos e elegíveis pertencentes a outros grupos sociais.
O perfil dos informantes e dos elegíveis sofreu alterações compara/vamente ao momento de 1783:
• Os informantes que não são exclusivamente fidalgos; • Os arrolados têm uma proveniência social mais alargada as escolhas dos informantes fidalgos deixaram de se cingir exclusivamente ao seu estrato social
• O valor mais elevado de betweenness pertence a João Henriques Seco – o seu papel é, de facto, de agente de mudança e de intermediação entre o grupo dos fidalgos e dos letrados. • A sua nomeação pelo Desembargo do Paço permi'u mudar as escolhas eleitorais e abriu o acesso da vereação aos letrados.
2. Caracterização da rede de parentesco das elites de Coimbra – sécs. XVII-‐XIX
Fonte principais: genealogias, nobiliários, habilitações, mercês régias, registos paroquiais. (séculos XVII-‐XVIII)
Ferramenta metodológica: análise das redes geradas pela base dados a par'r de relações de parentesco detectadas – ex. A é filho de B
Medidas de análise usadas • Indegree: número de vér'ces (linhas) direccionados a um nó;
• Outdegree: número de vér'ces que partem de um nó direccionados a outros nós; • Betweeness: medida de centralidade que mede a importância de posição intermediária ocupada pelos actores de uma rede, ou seja, mede o número de fluxos que desapareceriam se um determinado indivíduo fosse removido dessa rede.
Resultados:
Rede do parentesco
A fidalguia na rede do parentesco
Fidalguia na rede de parentesco
Betweeness da rede de parentesco
nNEXT
Leitura da rede • O núcleo central é um núcleo de “actores fidalgos”, ligados por laços de parentesco;
• Encontramos, igualmente, algumas famílias fidalgas que não têm relações de sangue com este núcleo alargado de indivíduo;
• No núcleo principal, e no ponto onde as relações são mais densas, encontramos os Zuzartes, os Britos e Castro, os Homens Freires de Figueiredo, os Osórios da Gama, os Cou'nhos Pereiras, os Saraivas de Sampaio e os Garridos;
• Distanciados deste núcleo central, mas com ligações familiares à rede encontramos famílias como os Sás de Melo, os Pereiras de Sá, os Rangéis, os Varejões Viçosos, Figueiredos da Guerra, os Britos Alvins ou os Soares de Brito
distanciamento cronológico afastamento em termos de escolhas matrimoniais ´
Valores de betweenness na rede de parentesco das elites de Coimbra (séculos XVII-‐XIX)
• Os valores de betwenness da família Pereira Cou'nho, especialmente de Manuel Pereira Cou'nho, iden'fica-‐a como um elemento fundamental no impacto que as escolhas matrimoniais e nos parentescos que se vão estabelecendo irão ter na rede, permi'ndo a formação de um núcleo muito coeso.
Lei de Zipf nos apadrinhamentos
Soure (por ranking)
2.5
N.o Afilhados
Ranking
94
1
61
2
54
3
42
4
37
5
32
6
…
…
7
31
6
36
…
…
1
139
2
1.5
1
0.5
0 0
0.5
1
1.5
Y = Log (Nº Afilhados) X = Log (Ranking)
2
2.5
Apadrinhamentos • Numa estrutura social hierarquizada há poucas pessoas no topo e muitas pessoas na base. • Se os apadrinhamentos revelam relações de cima para baixo as pessoas no topo têm potencialmente mais possibilidades de apadrinharem que as pessoas na base. • Devemos por isso ter poucas pessoas que apadrinham muito e muitas pessoas que apadrinham pouco.
Desenvolvimentos futuros no sistema Time Link • Consolidação das fichas “biográficas” de objectos • Desenho automá'co de genealogias • Op'mização do interface para o u'lizador comum (sobretudo ao nível da introdução de dados)
Lihat lebih banyak...
Comentários