Bases de dados relacionais e análise de redes na investigação histórica

October 8, 2017 | Autor: Ana Isabel Ribeiro | Categoria: Digital Humanities, Social Networks, Database Systems
Share Embed


Descrição do Produto

   

Bases  de  dados  relacionais  e  análise  de  redes  na   inves/gação  histórica  

 

h#p://'melink.fl.uc.pt

     

Ana  Isabel  Ribeiro©2014  

 

O  Problema   •  Reconstruir   biografias   individuais   a   par'r   de   fontes   diversas.      

•  Poucas   escolhas   a   priori   sobre   quem   é   importante:   análise  centrada  nas  redes  de  relações.    

•  Grande  variedade  e  diversidade  de  fontes.    

•  A   iden'ficação   da   mesma   pessoa   em   fontes   diferentes  é  central  (cruzamento  nominal).    

•  Fontes   têm   de   ser   transcritas   com   pouca   perca   de   informação.  

O  Objec/vo   •  Transcrições  próximas  da  fonte:    

–  Preservar  informação.   –  Adiar  decisões  de  perca  de  informação  ou  de  irrelevância.  

•   Iden'ficação  de  pessoas  a  posteriori:     –  Iden'ficar  apenas  quando  temos  o  máximo  de   informação.   –  Processo   reversível,   poder   desfazer   os   inevitáveis   erros   a   qualquer  momento.    

•  Interface  flexível  e  sofis'cado  para  a  informação  final.   –  Apresentar   a   complexidade   das   relações   e   as   biografias   individuais  de  forma  simples.  

•  Dupla  abordagem:  

A  Solução  

–  Um   modelo   orientado   à   fonte   permite   transcrever   os   documentos   com  poucas  percas  e  de  forma  rápida  (Thaller).     –  Um  modelo  orientado  às  pessoas  permite  criar  uma  base  dados  com   informação   variável   e   complexa   sobre   pessoas,   incluindo   decisões   reversíveis  sobre  quem  é  quem.  (Carvalho)    

•  A  notação  Kleio  (Thaller)  é  usada  no  modelo  orientado  às  fontes.    

•  Um  “framework”  relacional    (RCH)  é  usado  no  modelo  orientado  às   pessoas    (RCH  =  Reconstruc'ng  Communi'es  Historically)    

•  Um  tradutor  faz  a  conversão    das  transcrições  em  informação  para   o  modelo  orientado  às  pessoas.      

•  Resolve   a   inevitável   tensão   entre   a   a   estrutura   da   fonte   e   a   estrutura  do  modelo  analí'co.  

Modelo  baseado  na  notação  Kleio   •  Baseado   numa   estrutura   fonte/acto/actor   ou   objecto   •  Uma  fonte  contém  um  ou  mais  actos.   •  Os   actos   contém   actores   (pessoas)   e   objectos   (propriedades,  ins'tuições…)   •  Os   actores   e   os   objectos   são   descritos   por   atributos   que   possuem   um   dado   valor   em   determinado  momento  no  tempo.   •  Actores  e  objectos  estabelecem  relações  entre  si   em  determinados  momentos  no  tempo.  

  O  Modelo  orientado  a  pessoas   •  Cada   pessoa   é   composta   por   três   'pos   de   informações:   –  As   funções   (o   estatuto   com   que   aparece   num   acto)   –  Os  atributos  (morada,  idade,  profissão…)   –  As  relações  

Exemplo  de  notação  Kleio  

Fonte:  registos  paroquiais  (bap'smo)   b$b1685.11/17/9/1685/fl. 65/igreja matriz de Atributos   soure/manuel cordeiro n$manuel/m pai$jose luis/m ls$residencia/casal da corujeira mae$domingas jorge/f pad$francisco rodrigues/m/id=b1685.11.4 ls$residencia/moinhos do paleao mad$maria pereira/f Actores   rel$parentesco/mulher/francisco rodrigues/b1685.11.4 Relações  

escritura$not1782mlcf-­‐84a10/29/4/1782/dinheiro  a  juro/fol=9v-­‐11/loc=portaria  do  colegio  de  sao  jose  dos   marianos/sumario=juro  de  60000  reis  que  dao  por  seu  reverendo  procurador  as  religiosas  do  convento   de  santa  teresa  a  jose  de  oliveira  galvao  e  sua  mulher,  joana  ferreira  de  condeixa  a  nova.  

 credor$convento  de  santa  teresa  de  coimbra/id=n1782a10c      procurador$manuel  de  jesus                          ls$'tulo/reverendíssimo                          ls$'tulo/frei                          ls$'tulo/conventual  do  colegio  de  sao  jose  dos  marianos                          rel$sociabilidade/procurador/convento  de  santa  teresa  de  coimbra/n1782a10c                          ls$assina/sim/obs=bem  

 devedor$jose  de  oliveira  galvao/id=1782-­‐e10-­‐galvao                          ls$residencia/condeixa  a  nova                          rel$parentesco/marido/joana  ferreira/n1782a10d                          ls$assina/sim/obs=bem            devedora$joana  ferreira/id=n1782a10d          divida$60000  reis/juro  de  5  por  cento/prazo=1  ano      

 garan'a$umas  casas  de  sobrado/obs=  onde  vive                          atr$localizacao/rua  das  bicas/obs=condeixa                          atr$valor/30000  reis                          rel$posse/pertence/jose  de  oliveira  galvao/1782-­‐e10-­‐galvao   …   fiador$antonio  mendes/id=1782-­‐e10-­‐mendes                          ls$residencia/condeixa  a  velha                          ls$assina/cruz     garan'a$umas  casas  de  sobrado  /obs=onde  vive  que  vive                          atr$valor/24000  reis                          atr$localizacao/condeixa  a  velha                          rel$posse/pertence/antonio  mendes/1782-­‐e10-­‐mendes   …   test$francisco  goncalves  fino                          ls$profissao/carpinteiro                          ls$residencia/coimbra                          ls$assina/sim/obs=bem      test$joao  simoes                          ls$profissao/alfaiate                          ls$residencia/condeixa                          ls$assina/sim      

O  Framework  para  o  Modelo  Orientado  a  Pessoas  

   

  U/lização  do  Time  Link  na   construção  de  biografias  

Exploração  da  base  de  dados   •     Pesquisa  genérica  

•   Pesquisa  por  atributos  

•  Cruzamento  de  atributos  

•   Pesquisa  por  sintaxe  SQL  

•   Calendário  

  Exemplo  de  uma  biografia   consolidada  

U/lização  do  Time  link  na   geração  de  redes  

Conclusão  

•  Nos   úl'mos   dois   anos,   em   parte   pelo   efeito   de   orientação   de   teses,   em   parte   pela   colaboração   com   Colónia,   consolidou-­‐se   um   conjunto   de   conceitos,   modelos   e   ferramentas   que   agilizam   trabalhos   complexos  sobre  informação  biográfica,  destacando-­‐se:    

-­‐  Reformulação   gráfica   da   aplicação   web   (a'ngir   todo   o   'po  de  u'lizadores);   -­‐  Pesquisas   simplificadas   (por   palavra,   por   atributo,   por   cruzamento  de  atributos);   -­‐  Iden'ficação   colec'va   de   pessoas   (bases   on-­‐line:   h#p://'melink.fl.uc.pt/mhk/login/);  

-­‐  Ferramenta  para  geração  automá'ca  de  redes  

A  análise  de  redes  em  História  

 

Potencialidades   do   uso   da   análise   de   redes:      

ü a   visualização   das   interacções   dos   actores   num   contexto   social   (ou   de   poder)   específico   pode   desvendar   ao   historiador   relações,   dependências   e   evoluções   nas   relações   e   decisões,  que  metodologias  mais  tradicionais   teriam  mais  dificuldade  em  detectar;    

ü   Permite  ao  historiador  colocar  o  enfoque  da   sua   análise   na   apreensão   dos   padrões   de   relacionamento   que   definem   estruturas   sociais,  polí'cas  e  económicas    e  que  resultam   da   arquitectura   das   ligações   que   os   actores   vão  estabelecendo  entre  si.    

 

Dificuldades:    

 

-­‐  A   v i s u a l i z a ç ã o   d a   d i a c r o n i a   e   consequentemente   dos   padrões   de   evolução   no  tempo;    

-­‐  A   análise   de   redes   não   fornece   respostas   óbvias,   apenas   tende   a   sinalizar   actores   e   relações   que,   mediante   uma   análise   mais   aprofundada   das   fontes,   se   podem   relevar   significa'vos   ou   até   vitais   numa   rede   de   relações  sociais;    

 

-­‐  A   dificuldade   de   leitura   de   algumas   representações  gráficas;      

-­‐  A   dificuldade   de   transposição   da   análise   da   rede   pelo   historiador   para   um   explicação   clara   des'nada   a   um   leitor,   especialista   ou   não.    

 

1.  A  detecção  da  elite  no  município  de  Coimbra   através   da   análise   das   escolhas   dos   elegíveis   para  o  cargo  de  vereador  (3  lugares).  

 

Fonte   principal   –   pautas   enviadas   ao   desembargo   do   Paço   (e   recepcionados   do   desembargo   do   Paço   para   os   anos   de   1783,   1796,   1804,   1811,   1814,   1816),   mais   especificamente  os  arrolamentos  que  nelas  constam.    

Ferramenta  metodológica  –  análise  das  redes  geradas   pela   base   dados   a   par'r   de   uma   relação   específica:   A   “arrolou  para  verador”  B  

Conceitos de redes • Actores e relações. • Representação matemática da rede: • A rede designa-se por grafo (graph) • Os actores correspondem a nós (nodes) • As relações correspondem a arestas (edges)

Direcção • • •

Uma distinção importante é entre

• •

Grafos dirigidos (directed graphs) Grafos não dirigidos (un-directed graphs)

Um grafo dirigido é um grafo onde uma relação entre A e B não significa que a mesma relação exista entre B e A. Um grafo não dirigido é um grafo em que A-B é equivalente a B-A

sexta-feira, 4 de Junho de 2010

11

Operações e medidas •

Existem várias operações e medidas que podem ser feitas sobre grafos/redes



Podem ser calculados atributos relacionais dos indivíduos.



Podem ser calculadas medidas globais sobre a rede.



Podem ser feitas operações de segmentação da rede.

Atributos relacionais •

Podemos calcular atributos para os indivíduos que decorrem do seu comportamento relacional:

• • •

Grau (degree): número de ligações de um nó.



Prestígio (prestige): grau ponderado de um indivíduo tendo em conta o prestígio de quem se liga com ele.

Nos grafos dirigidos distingue-se in-degree de out-degree. Betweeness (intermediação?) medida do número de fluxos que desapareceriam se o indivíduo fosse removido do grafo.

Medidas de rede • Distância: número de ligações existentes

entre dois indivíduos (teoria dos 6 graus).

• Densidade: relação entre o número de

ligações existentes e o número teórico de relações possíveis.

• Conectividade: todos os nós estão ligados, ou existem “ilhas” de ligações.

Operações sobre redes •

Detecção de sub-componentes:



Um componente fraco, ou componente simplesmente, é um conjunto de nós em que se pode ir de cada um para qualquer outro, ignorando as direcções das arestas



Um componente forte é a mesma coisa mas respeita a direcção das arestas.



Uma clique é um subrede de densidade máxima.

Alguns  casos  prá/cos  

Resultados:  

Indegree  

Outdegree  

Betweenness  

    Leituras   •  O  primeiro  ponto  de  destaque  na  rede,  situado   à   esquerda,   é   um   par   de   informantes   fidalgos   cujas   escolhas   recaem   exclusivamente   em   elegíveis   também   fidalgos.   Este   cluster   corresponde   aos   arrolamentos   produzidos   em   1783,  a  par'r  do  qual  os  eleitores  compuseram   as  suas  pautas  para  os  de  1784,  1785  e  1786.      

•  A   densidade   das   relações   estabelecidas   entre   este   grupo   fidalgo   e   os   restantes   nós   da   rede   também  é  baixa;  

•  Existe   um   grupo   alargado   de   fidalgos,   que   não   se   relaciona   com   outros   nós   da   rede   de   condição  social  diferente;    

•  Estes   nós   que   representam   os   fidalgos   elegíveis   (em   1783)   têm   um   indegree,   ou   seja,   o   número   de   vér'ces   a   eles   direccionados,   muito  baixo  –  o  indegree  e  outdegree,  ou  seja   a   direcção   das   suas   escolhas,   mostra-­‐nos   que   estamos   a   lidar   com   um   grupo   pequeno   e   fechado  socialmente  que  interage  pouco  com   os  outros  actores  da  rede.  

Os   indivíduos   com   mais   elevado   indegree   são   bacharéis  ou  doutores,  embora  possamos  encontrar   também  alguns  fidalgos;     •  Tal   explica-­‐se   que   pelo   facto   dos   informantes   serem,  no  período  em  estudo,  gente  do  meio  das   letras,   que   indicam   maioritariamente   outros   letrados   para   o   cargo   de   vereador   e   cada   vez   menos  fidalgos.  São  os  actores  que,  em  termos  do   poder   local   execu'vo,   ganham   maior   peso   na   cronologia  analisada  (1783-­‐1817).    

As  outras  secções  da  rede  demonstram  que:    

•  o   número   de   informantes   fidalgos   tende   a   diminuir   ao   longo   do   período   cartografado   nesta  rede;    

•  as   escolhas   dos   que   se   mantêm,   ou   assumem   esta   função,   tendem   a   diversificar-­‐se   socialmente,   traduzindo-­‐se   no   aparecimento   de   ligações   entre   informantes   fidalgos   e   elegíveis   pertencentes   a   outros   grupos   sociais.    

O  perfil  dos  informantes  e  dos  elegíveis  sofreu   alterações   compara/vamente   ao   momento   de   1783:      

•  Os   informantes   que   não   são   exclusivamente   fidalgos;   •  Os   arrolados   têm   uma   proveniência   social   mais  alargada     as   escolhas   dos   informantes   fidalgos   deixaram   de  se  cingir  exclusivamente  ao  seu  estrato  social    

•  O   valor   mais   elevado   de   betweenness   pertence  a  João  Henriques  Seco  –  o  seu  papel   é,   de   facto,   de   agente   de   mudança   e   de   intermediação  entre  o  grupo  dos  fidalgos  e  dos   letrados.       •  A   sua   nomeação   pelo   Desembargo   do   Paço   permi'u   mudar   as   escolhas   eleitorais   e   abriu   o   acesso  da  vereação  aos  letrados.  

2.   Caracterização   da   rede   de   parentesco   das   elites  de  Coimbra  –  sécs.  XVII-­‐XIX      

Fonte   principais:   genealogias,   nobiliários,   habilitações,   mercês   régias,   registos   paroquiais.   (séculos  XVII-­‐XVIII)    

Ferramenta   metodológica:   análise   das   redes   geradas  pela  base  dados  a  par'r  de  relações  de   parentesco  detectadas  –  ex.  A  é  filho  de  B  

Medidas  de  análise  usadas   •  Indegree:   número   de   vér'ces   (linhas)   direccionados    a  um  nó;    

•  Outdegree:   número   de   vér'ces   que   partem   de   um  nó  direccionados  a  outros  nós;   •  Betweeness:  medida  de  centralidade  que  mede  a   importância   de   posição   intermediária   ocupada   pelos   actores   de   uma   rede,   ou   seja,   mede   o   número   de   fluxos   que   desapareceriam   se   um   determinado   indivíduo   fosse   removido   dessa   rede.    

Resultados:  

Rede    do  parentesco  

A  fidalguia  na  rede  do  parentesco  

Fidalguia  na  rede  de  parentesco  

Betweeness  da  rede  de  parentesco  

nNEXT

Leitura  da  rede   •  O   núcleo   central   é   um   núcleo   de   “actores   fidalgos”,  ligados  por  laços  de  parentesco;  

 

•  Encontramos,   igualmente,   algumas   famílias   fidalgas   que   não   têm   relações   de   sangue   com   este  núcleo  alargado  de  indivíduo;  

 

•  No  núcleo  principal,  e  no  ponto  onde  as  relações   são   mais   densas,   encontramos   os   Zuzartes,   os   Britos   e   Castro,   os   Homens   Freires   de   Figueiredo,   os   Osórios   da   Gama,   os   Cou'nhos   Pereiras,   os   Saraivas  de  Sampaio  e  os  Garridos;    

•  Distanciados   deste   núcleo   central,   mas   com   ligações   familiares   à   rede   encontramos   famílias   como   os   Sás   de   Melo,   os   Pereiras   de   Sá,   os   Rangéis,   os   Varejões   Viçosos,   Figueiredos   da   Guerra,  os  Britos  Alvins  ou  os  Soares  de  Brito        

distanciamento  cronológico    afastamento  em  termos  de  escolhas  matrimoniais     ´  

Valores   de   betweenness   na   rede   de   parentesco   das   elites   de   Coimbra  (séculos  XVII-­‐XIX)  

   

•  Os   valores   de   betwenness   da   família   Pereira   Cou'nho,   especialmente   de   Manuel   Pereira   Cou'nho,   iden'fica-­‐a   como   um   elemento   fundamental   no   impacto   que   as   escolhas   matrimoniais   e   nos   parentescos   que   se   vão   estabelecendo   irão   ter   na   rede,   permi'ndo   a   formação  de  um  núcleo  muito  coeso.  

Lei  de  Zipf  nos  apadrinhamentos  

  Soure  (por  ranking)  

 

2.5

N.o  Afilhados

Ranking

94

1

61

2

54

3

42

4

37

5

32

6





7

31

6

36





1

139

2

1.5

1

0.5

0 0

0.5

1

1.5

Y = Log (Nº Afilhados) X = Log (Ranking)

2

2.5

Apadrinhamentos   •  Numa  estrutura  social   hierarquizada  há  poucas  pessoas   no  topo  e  muitas  pessoas  na  base.   •  Se  os  apadrinhamentos  revelam   relações  de  cima  para  baixo  as   pessoas  no  topo  têm   potencialmente  mais   possibilidades  de  apadrinharem   que  as  pessoas  na  base.   •  Devemos  por  isso  ter  poucas   pessoas  que  apadrinham  muito  e   muitas  pessoas  que  apadrinham   pouco.  

Desenvolvimentos  futuros  no   sistema  Time  Link   •  Consolidação  das  fichas  “biográficas”   de  objectos     •  Desenho  automá'co  de  genealogias   •  Op'mização   do   interface   para   o   u'lizador   comum   (sobretudo   ao   nível   da  introdução  de  dados)    

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.