Guia para o software T.N.T. (capítulo de dissertação de mestrado atualizado) [Guide for the software T.N.T. - updated MSc thesis chapter, in Portuguese]

September 3, 2017 | Autor: Tiago Simões | Categoria: Phylogenetics, Filogenia

Descrição do Produto

166 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

ANEXO III Guia para o software T.N.T. Este guia foi desenvolvido ao longo da disciplina de “Sistemática Filogenética” e durante as fases de análise cladística desta dissertação, tendo como intuito servir de auxílio aos comandos fundamentais do programa T.N.T. para iniciantes com este software. Este anexo contou com o auxílio de Natasha Picciani para revisão do texto.

I - Instalação: O T.N.T. é disponibilizado gratuitamente para download no site da Willi Hennig Society: http://www.cladistics.org O programa não requer instalação, sendo necessário apenas executá-lo para poder utilizá-lo. No entanto, recomenda-se que a pasta contendo o programa seja alocada dentro do diretório “Arquivos de programas” ou “Program files” do Windows para que os arquivos de extensão .T.N.T. possam ser abertos diretamente com o programa.

II- Importando uma matriz de dados: Em "File": "Open input file": selecione o arquivo da matriz em formato de texto (.txt) ou formato T.N.T. (.T.N.T.). Utilize editores de matrizes que permitam abrir e salvar dados em múltiplos formatos (Nexus, T.N.T., texto, etc), permitindo que bases de dados de qualquer proveniência possam ser rapidamente incorporados e editados para serem utilizados no T.N.T.. Recomendado: Mesquite (MADDISON & MADDISON, 2011), disponível gratuitamente em: http://mesquiteproject.org

167 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

III – Salvando o trabalho: A - Salvando os procedimentos realizados no T.N.T. em formato de texto (.txt): Em “File”: 1 – Ir em “Output” > “Open output file”. Cria arquivo log (.out) 2- Clique em “Save display buffer” para salvar todos os comandos realizados (armazenados temporariamente na memória buffer do programa). Ele será salvo no arquivo output (.out) criado e pode ser aberto pelo bloco de notas. 3 – Clique em “Close output file” após salvar todos os dados desejados. O arquivo de texto só poderá ser aberto após este procedimento.

Mesmo que o arquivo .out não tenha sido criado desde o início do trabalho, todas os procedimentos realizados e em exibição no display do T.N.T. serão salvos quando o procedimento “Save display buffer” for realizado.

B - Editando e salvando (exportando) alterações na matriz (em formato Nexus):

Todos os dados alterados na matriz, como nome de táxons/caracteres ou os estados de caráter, grupo externo, dentre outros, podem ser editados e salvos no próprio T.N.T. no formato Nexus, para que possam ser reabertos e editados posteriormente em um editor de matrizes. Mas veja considerações abaixo: Em “Data” > “Edit data” >“Data” > “Export (Nexus format)”

C - Editando e salvando o projeto em arquivo de formato T.N.T. (.T.N.T.):

168 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

Salva as alterações das configurações da matriz, incluindo as propriedades dos caracteres, táxons ativos/inativos, “step-matrix costs”, árvores encontradas, entre outros. Este método costuma ser mais eficiente do que salvar as alterações em formato NEXUS, pois o formato NEXUS pode ser interpretado com erros ao ser aberto no T.N.T. e os arquivos NEXUS exportados pelo T.N.T. muitas vezes são abertos com erros em programas de edição de matrizes, como o NDE. Salvar alterações nos dados em formato .T.N.T. garante que ele seja aberto pelo T.N.T. e também é reconhecido pelo Mesquite. Em “Data” : >“Save data” D – Salvando os comandos e opções dos menus utilizados durante a análise: Em “Settings” > “Batch” > “Set menus to batch”

As ações então podem ser visualizadas, salvas e re-executadas através das seguintes opções do sub-menu “Batch”: > “Show actions stored” > “Sabe actions to file” > “Execute”

IV - Formato dos dados: Em “Format”: > “Data Format” – permite definir os tipos de estados (nucleotídeos, aminoácidos) ou o número total de estados possíveis:

Modo DNA e proteínas: códigos da IUPAC Modo 16 estados: 0-9 estados, e os estados de 10 a 16 definidos pelas letras A-F Modo 32 estados: 0-9 estados, e os estados de 10 a 32 definidos pelas letras A-V

169 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

V - Caracteres: A - Exibindo e editando as propriedades dos caracteres discretos Em “Data”: “Character settings” para editar e “Show character status” para exibir as configurações ativas no momento: Em “Character settings”: > “of weight”- Adiciona peso diferente ao caráter selecionado. > “step-matrix of costs” – Define um custo (peso) para determinadas transformações de estados. > “ancestral (force root states)” – Define que o estado presente no grupo externo para um dado caráter (Ex: 0) permaneça fixo como o estado ancestral. Isto não traz diferenças na análise quando todas as transformações têm pesos iguais. Porém, em um caráter onde o estado do grupo externo seja, por exemplo, 0 e este mesmo caráter tiver uma transformação 1 –> 0 como tendo maior peso do que a 0 –> 1, este procedimento garante que, apesar deste peso maior, a transformação 0 –> 1 continue sendo sempre a que ocorre entre o grupo externo e o grupo interno. Em outras palavras, garante o estado 0 para o grupo externo, mas mantém a maior probabilidade de uma transformação 1 –> 0 dentre táxons do grupo interno. Isso é de particular importância para o estudo de caracteres moleculares, onde aplica-se maior peso para transformações de nucleotídeos que costumam ocorrer com maior freqüência: transições (conversões de uma purina em outra purina, ou uma pirimidina em outra pirimidina) são mais frequentes de ocorrerem do que transversões (onde uma purina se converte em uma pirimidina, ou vice-versa).

Default - T.N.T. considera todos os caracteres como sendo ativos e não-aditivos.

B - Caracteres contínuos: Não são transcritos na forma de caracteres discretos pelo programa. Além disso, muitas das configurações disponíveis para se editar as propriedades dos caracteres em "Character settings" não se aplicam aos caracteres contínuos. São um caso

170 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

especial onde são possíveis 0 – 65 estados de caráter, com até 3 casas decimais. Por exemplo, eles são sempre considerados como ordenados, sem opção de mudança. Não são editáveis pelos menus, apenas pela linha de comando. A padronização do peso dos caracteres quando todos têm o mesmo peso (default – “Implied weights”) não afeta este tipo de caráter. Devem ser sempre os primeiros caracteres listados numa análise.

O programa de edição de matrizes Mesquite não exporta matrizes com dados contínuos para o T.N.T.. Em função disso, os dados contínuos devem ser inseridos separadamente no arquivo .T.N.T. criado ao se exportar os dados discretos criados no Mesquite. Abra o arquivo .T.N.T. no bloco de notas e insira os dados dos caracteres contínuos. Eles devem ser inseridos em um bloco de caracteres a parte, produzindo a seguinte configuração final da matriz:

Em uma matriz com 9 caracteres (4 contínuos e 5 discretos) e 4 táxons:

nstates cont; xread 94 &[cont] Taxon1 4.145-5.248 0.77-0.823 0.093-0.107 0.058-0.077 Taxon2 2.917-3.274 0.723-0.803 0.023-0.032 0.11-0.134 Taxon3 4.598-5.309 0.708-0.776 0.102-0.114 0.032-0.04 Taxon4 1.336-1.424 0.616-0.657 0.056-0.074 0.029-0.042 &[num] Taxon1 00000 Taxon2 01000 Taxon3 01110 Taxon4 01010 ; proc /; comments 0 ;

171 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

VI - Pesagem de caracteres: Em “Settings” “Implied weighting”: > “Based on prior weights only”- Pesos pré-definidos ao se importar o arquivo com a matriz de dados. Se pesos não tiverem sido atribuídos previamente, o T.N.T. atribui pesos iguais a todos os caracteres (default). > ”Using implied weights”- Ativa os pesos implícitos configurados no próprio T.N.T.: os pesos atribuídos aos caracteres ou aos passos internos extras em “Data” > “Character Settings”. > “Weighting state transformations” - O programa irá gerar o peso dos caracteres baseando-se na frequência de transformações deles em cada árvore. Quanto mais vezes ele aparecer de maneira independente (homoplástica), menor peso relativo ele terá. * O ícone “Set parameters” apesar de permanecer ativo em todas as seleções, atua somente sobre o critério “Weighting state transformations”, se este for selecionado.

VII – Táxons

Para determinar quais táxons estão ativos: Em “Data”: > Taxa > selecione táxons que se deseja desativar (excluir da análise). > Show táxon status > permite ver nominalmente os táxons ativos e inativos no momento. “Contraint taxa”

172 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

Para forçar um grupo de táxons como um grupo monofilético antes de se realizar qualquer análise, é necessário utilizar-se a linha de comando. Após realizar-se pelo menos uma rodada de análises, pode-se escolher quais os táxons a se forçar um monofiletismo selecionando-os em uma das árvores armazenadas na memória buffer após a análise realizada. Porém, para realizar a primeira opção, digite na linha de comando:

Force+[A B C]

A, B e C acima representam os nomes dos táxons que se deseja incluir neste grupo de “constrained taxa”, e devem ser separados entre si por espaço. Alternativamente, pode-se inserir o número destes táxons na matriz.

Exemplo: Caso a matriz seja composta por:

Taxon 0: Sphenodon Taxon 1: Kuehneosaurus Taxon 2: Huehuecuetzpalli

Posso delimitar estes táxons através do comando: > Force+[0 1 2]

Para criar um subgrupo de táxons flutuantes dentre este grupo monofilético, coloca-se os mesmos entre “( )” > Force+[A B C (D E)]

Para formar uma constraint negativa (forçar certos táxons como não monofiléticos): > Force-[A B C] “Constraint” de táxons como monofiléticos em árvores presentes na memória Como mencionado acima, pode-se constringir táxons como um grupo monofilético selecionando-os em árvores obtidas em rodadas anteriores de análises pelo T.N.T.. Esta é geralmente a maneira mais prática, e também permite a seleção de um número grande de táxons, algo que por muitas vezes não é possível de se realizar pela linha de comando. Isto é

173 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

importante em algumas situações, como por exemplo, ao se utilizar buscas do tipo “Sectorial Search” (ver abaixo para uma explicação deste método). Isto ocorre porque ao se utilizar este método de busca, e dentro dele, utilizar as árvores armazenadas na memória RAM de buscas anteriores como árvores iniciais da análise, o T.N.T. poderá pedir que se realize o “constraint”dos táxons para esta busca. Para realizar isso: Em “Data”: > “Define constraints” No quadrante “for monophyly”, selecione o ícone “tree number”. Deste modo, você estará solicitando que ele utiliza “constraints”de certos grupos à partir de uma determinada árvore presente na memória RAM. Caso não se deseja atribuir nenhuma “constraint” para a análise (manter a análise livre de qualquer pré-concepção em termos de hipóteses de monofiletismo), selecione uma árvore qualquer dentro de “tree number” (exemplo: árvore 0) e depois clique em: > “Use selected groups” – será aberta uma janela com a árvore selecionada (e.g. árvore 0) e nela você deverá selecionar o grupo que se deseja manter como monofilético. Clique no nó mais basal da árvore (na bifurcação entre o se grupo externo e o seu grupo interno). O nó ficará vermelho. Após isso clique OK. Você retornará a janela inicial, e clique OK nela também. Desta forma, você constringiu como monofilético o grupo formado por todos os táxons da sua análise, incluindo o grupo externo. Na prática isso representa 0 “constraints”, já que todos os táxons poderão se agrupar de qualquer forma com outros táxons dentro da sua análise. Isso poderá ser confirmado pela mensagem que aparecerá no programa logo após clicar o último OK: “ 0 negative constraints” “ 0 positive constraints” “ 0 tree-constraints”

Caso deseja-se, de fato, fixar certos grupos como monofiléticos. Ao invés de selecionar o nó mais basal na etapa anterior, selecione o grupo em questão que se deseja manter como monofilético.

* Usando constraints para buscas

174 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

Ao executar buscar, deve-se reforçar as “constraints” pelo ícone “Enforce constraints” dentro do menu de opções de cada tipo de busca (“Implicit enumeration”, “Heuristic Search” e “New Technology Search”)

VIII - Buscas A - Buscas exatas:

Para análise de matrizes com número de táxons limitados, mas que garante encontrar a(s) árvore(s) mais parcimoniosa(s) (AMPs) existente(s). No T.N.T. o mecanismo oferecido é o de “Implicit enumeration”, limitado à 15 – 30 táxons (HOVENKAMP, 2004) Em “Analyze”: > “Implicit Enumeration” – equivalente ao branch-and-bound do PAUP*

B - Buscas heurísticas tradicionais:

Levando-se em conta uma matriz de dados com mais do que apenas alguns poucos táxons (Ex: mais de 10 táxons), os programas de análise filogenética precisam fazer uso de buscas não exatas, ou heurísticas, para conseguirem realizar a análise dentro de um período de tempo viável para a pesquisa. Estas buscas consistem em dois passos: a obtenção de uma árvore filogenética inicial (por “stepwise addition”) e o subseqüente rearranjo (ou “swapping”) de seus ramos de forma aleatória, onde se busca encontrar por tentativa e erro uma árvore tão ou mais parcimoniosa quanto à árvore inicial obtida. O T.N.T. realiza esta tarefa através dos seguintes procedimentos: Em “Analyze” > “Traditional search” – busca heurística equivalente à busca por branch swapping do PAUP*, 1 – Obtendo-se uma árvore inicial.

175 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

Stepwise addition – Esta metodologia computacional (algoritmo) permite que se crie uma cladograma inicial entre 3 táxons terminais. Posteriormente, é adicionado a este cladograma em desenvolvimento táxon a táxon, de acordo com uma ordem pré-determinada, até finalizarse o processo e obtermos uma árvore inicial completa. As árvores filogenéticas construídas por este método são denominadas árvores de Wagner.

A escolha dos 3 táxons iniciais, o critério para a ordem de inclusão dos outros táxons e qual o ramo do cladograma em construção ao qual eles são inseridos são fundamentais para o resultado final da análise. Alguns métodos foram desenvolvidos para tal tarefa, com o método de adição aleatória de táxons (random addition sequence - RAS) o preferido pelo T.N.T.: 

RAS (Random addition sequence) – Neste processo a ordem de inclusão dos táxons terminais é determinada de forma aleatória antes mesmo de a análise começar. Cada novo táxon será adicionado a algum ramo da árvore em construção de modo aleatório. Quanto maior o número de replicações (default = 10), maior a probabilidade de se encontrar as melhores árvores. Número de replicações sugerido = 1.000.

 Árvore pré-existente na memória RAM – também é possível de se obter uma árvore inicial dentre árvores mais parcimoniosas armazenada na memória RAM do programa proveniente de uma análise anterior. Para tal, utilize as árvores salvas em formato .tre de análises anteriores abrindo o arquivo .tre onde elas estão armazenadas.

Em todos estes métodos de “stepwise addition”, novos táxons são acrescentados em diferentes ramos, mas, uma vez adicionados, o algoritmo não voltará atrás. Mesmo que existam árvores mais curtas que poderiam ser descobertas através do rearranjo de árvores menos parcimoniosas (ou sub-ótimas) o algoritmo não seria capaz de identificá-las e seguir este caminho, como ocorre na “implicit enumeration” (ou “branch-and-bound”). Isto faz com que algumas das árvores mais curtas NUNCA sejam encontradas nesta análise, pois a ordem definida aleatoriamente para a inclusão dos táxons (RAS) impede que certas topologias sejam alcançadas. Ou seja, cada RAS terá um conjunto finito de árvores mais semelhantes entre si possíveis de se alcançar - as ilhas de árvores (Fig. 1). Uma ilha de árvore é definida como um conjunto de árvores conectadas entre si (separadas por apenas um “passo” de distância) e

176 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

separadas de outras ilhas por árvores com maior número de passos (MADDISON, 1991). Desta forma, os programas de análise filogenética ao esbarrar nas árvores mais longas interrompem a busca por árvores mais curtas naquele sentido, tornando a análise limitada ao conjunto de árvores constituintes de uma ilha. Por isso, os programas realizam novas e múltiplas análises ao mesmo tempo utilizando o mesmo conjunto de dados (replicações) alterando em cada uma a ordem aleatória dos táxons adicionados para poder enxergar todas as ilhas de árvores possíveis, cada ilha com uma ou algumas árvores inicias mais curtas. Ou seja, ter diferentes pontos de partida para se obter a maior variedade possível de ilhas dentro do universo de árvores possíveis.

Figura A.1. Duas ilhas de árvores (discos claros) separadas por árvores de maior número de passos (áreas cinzentas) – (MADDISON, 1991).

2 - Algoritmos de rearranjo de ramos utilizados (“swapping”):

Uma segunda etapa na estratégia de se encontrar árvores mais parcimoniosas em ilhas de árvores distintas é a realização de rearranjos de ramos de maneira aleatória dentre as árvores iniciais, buscando-se encontrar ao acaso uma combinação de ramos que produza uma árvore ainda mais curta do que as demais encontradas. Para esta finalidade, existem três algoritmos disponíveis no T.N.T.:  Nenhum – as árvores finais mais parcimoniosas são as árvores de Wagner mais curtas (sem “swapping”).

177 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).



SPR (Subtree Pruning and Regrafting) – equivalente ao “global rearrangements” do PHYLIP.



TBR (Tree bisection and reconnection) – equivalente ao “branch breaker” do Hennig86.

O mecanismo utilizando RAS + TBR realiza buscas com resultados consistentes em análises de até 100 táxons. Acima deste valor, a análise levará um tempo exponencialmente maior (na escala de semanas ou meses) para recuperar todas as AMPs.

C - Buscas heurísticas utilizando novas tecnologias:

Apesar de tornar buscas de matrizes amplas possíveis, o mecanismo de RAS + TBR ainda apresenta significativas limitações na medida em que matrizes com uma larga base de dados (Ex: com mais de 100 táxons) podem facilmente apresentar um grande número de árvores de Wagner e de ilhas de árvores que não podem ser totalmente analisadas por análises tradicionais de RAS+TBR em um tempo viável, dificultando a análise final (GOLOBOFF, 1999). Isto ocorre porque cada setor do cladograma de árvores com mais de 40 – 50 táxons (Fig. 2) terá sua configuração ótima (menor número de passos) encontrada em árvores distintas. Cada uma destas árvores, por sua vez, pode estar localizada em “ilhas de árvores” distintas. Por isso, para dados extremamente amplos, um grande número de replicações por RAS não é o suficiente para se vasculhar todo o universo de ilhas de árvores possível. Para solucionar isto, é necessário que cada setor das árvores encontradas ao longo da análise seja analisado independentemente do resto da árvore e que suas topologias ótimas sejam combinadas em uma única AMP. Por isso, O T.N.T. lança mão de um conjunto de quatro algoritmos que permitem isolar e analisar cada setor das árvores mais parcimoniosas de maneira independente. Além disso, as árvores mais parcimoniosas encontradas por “swapping” (e.g. RAS+TBR) diferem pouco das árvores iniciais utilizadas e raramente levam a um novo conjunto de árvores mais curtas (GOLOBOFF, 1999), tornando os novos algoritmos mais eficientes para se encontrar árvores mais curtas mesmo em análises de matrizes que poderiam teoricamente ser analisadas apenas por buscas heurísticas.

178 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

Figura A.2. Um cladograma e seus diferentes setores constituintes (GOLOBOFF, 1999).

Os quatro algoritmos extras utilizados pelo T.N.T. que permitem os avanços citados em análises com um grande número de dados (100 táxons ou mais) são: Ratched (RAT) – Durante a fase de “swapping” (TBR), ele realiza perturbações nas árvores de Wagner previamente encontradas, altera o peso dos caracteres e depois procura por árvores mais parcimoniosas do que aquelas sendo utilizadas na fase de swapping. Estas fases de perturbação são de três tipos: (O – original weight) mantendo o peso original; (U – upperweight) aumentando o peso de certos caracteres; ou (D - under-weight) diminuindo o peso dos caracteres, alternando cada uma com uma fase de busca (S – search) por árvores melhores dentre as possíveis novas árvores geradas. A sequência fica sendo: O, S, U, S, D, S, O, S, D, S... Estas perturbações e buscas são realizadas até um certo limite de substituições feitas ou até que uma determinada porcentagem do processo de rearranjo já tenha sido realizada, ambas podendo ser definidas pelo usuário. Tree-Drifting (DFT) – Método de perturbação das árvores semelhante ao “Ratchet” e também ocorre simultaneamente ao processo de rearranjo de ramos. Porém, ao invés de recalibrar o peso dos caracteres, ele calcula a diferença de “fit” entre as árvores sofrendo “swapping” naquela etapa do processo de rearranjo e a árvore seguinte sendo produzida. Com esta medida, o programa só irá permitir a realização de rearranjos de ramos que gerem novas árvores mais parcimoniosas ou árvores sub-ótimas dentro do limite estabelecido por este fit, sendo ambas armazenadas temporariamente na memória RAM do programa. Por ter um

179 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

armazenamento de dados na memória mais “fácil” do que o “Ratchet”, o “Tree-Drift” pode ser utilizado como um mecanismo de perturbação das árvores juntamente com o “Sectorial Search”. O “fit” é um índice que se apresenta de duas formas: o “fit” absoluto e o “fit” relativo. A diferença entre dois “fits” absolutos é obtida pelo cálculo da diferença no número de passos entre dois cladogramas, enquanto a diferença entre “fits” relativos (RFD) entre dois cladogramas A e B é calculado pela fórmula: RFD = (F-C)/F, aonde F é a soma da diferença entre o número de passos dos caracteres que são mais parcimoniosos ao cladograma A do que o cladograma B; e C a soma dos caracteres que são mais parcimoniosos no cladograma B em relação ao A (GOLOBOFF & FARRIS, 2001).

Sectorial searches (SS) – É um tipo especial de rearranjo de ramos das árvores. O programa seleciona, de modo aleatório, ou definido por um critério do usuário, certos setores de uma árvore já existente. Uma re-análise isolada deste pequeno conjunto de dados é feita, utilizando-se RAS+TBR e, se uma nova combinação dos táxons com menor número de passos for encontrada, esta irá substituir a original na árvore da qual ela foi retirada. Se um número X de substituições forem feitas em uma mesma árvore, esta passará por um novo processo de rearranjo por TBR após a “Sectorial search” se completar.

Nas configurações da "Sectorial search" o tamanho de cada setor (número de táxons em cada um) que será reanalisado pode ser definido pelo usuário, assim como o número X de substituições necessárias para se realizar um novo “Global rearrangement” (rearranjo de ramos) na árvore obtida.

Conjuntos de dados extremamente amplos e complicados geralmente apresentam regiões mais conflituosas dentre as árvores obtidas. O objetivo do “Sectorial search” é buscar e resolver estas áreas de conflito. Portanto, buscas randômicas (random sectorial searches RSS) por setores a serem re-analisados não é o processo ideal para estes tipos de dados, por ser menos eficiente. É então realizada uma busca definida pelo usuário, utilizando uma análise de consenso (consensus-based sectorial search – CSS). Nesta, uma árvore de consenso é calculada dentre os cladogramas mais parcimoniosos obtidos até então. As áreas

180 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

de maior conflito serão então expostas na forma de politomias, tendo então os setores com estas áreas mais conflitantes selecionados para a busca setorial. Por último, há a opção de uma busca setorial mista (mixed sectorial search – RSS + CSS). Neste tipo, cada replicação é feita utilizando-se o procedimento RAS + SPR. Ao final de cada réplica, é produzida uma árvore de consenso desta com a obtida anteriormente (como na CSS), com as áreas de consenso sendo constringidas e então encaminhadas para um rearranjo de ramos por TBR. Este processo se repete ao final de cada réplica e, ao se obter as árvores finais, as zonas de constrição são abandonadas e uma RSS é realizada com todas as árvores. Tree-fusing (TF) – No “Tree-fusing”, subgrupos (com 5 ou mais táxons) e com a mesma composição em duas árvores diferentes são transferidos de uma destas árvores (árvore fonte) para uma árvore alvo. Estas mudanças são realizadas utilizando o algoritmo de “down pass” (GLADSTEIN, 1997), que permite calcular o número de passos da árvore resultante desta fusão entre o subgrupo transferido e a árvore alvo. Múltiplos subgrupos são transferidos entre as árvores, gerando novas árvores mais parcimoniosas e mais próximas de um padrão ótimo global. Mecanismos de rearranjo de ramos são então realizados nestas novas árvores, para encontrar padrões ainda mais parcimoniosos. Os melhores resultados deste método foram obtidos utilizando-se vários subgrupos de diversas árvores simultaneamente.

Após o término da análise, o T.N.T. informa o número de replicações que obtiveram as árvores mais parcimoniosas. Se este representar uma grande parte do número total de replicações (Ex: 90 em 100 repls.), provavelmente foram alcançadas todas a(s) árvore(s) mais parcimoniosa(s). Porém, se um grande número de árvores são retidas e, na centésima replicação, novas árvores continuam surgindo, isto quer dizer que são grandes as chances de árvores igualmente ou até mais parcimoniosas ainda não terem sido encontradas, exigindo um maior número de replicações. Informa-se também o número total de rearranjos realizados na fase de “swapping” e se foram encontradas mais árvores mais parcimoniosas do que a memória foi capaz de armazenar – “some replications overflowed”. Se o objetivo for encontrar todas as árvores mais parcimoniosas, isto poderá ser feito aumentando a capacidade da memória: Em “Settings”: > “Memory” > “Max. Number of trees” (Default = 100)

181 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

IX – Vendo e editando árvores A - Ver árvores: Em “Trees” > “Tree view” ou “Tree display/save”

É importante notar que no seu modo default, o T.N.T. não colapsa os ramos das árvores mais parcimoniosas obtidas. Desta forma, agrupamentos não suporados por sinapomorfias permanecem “ladderizados”, formando pseudo grupos monofiléticos (Fig. A.3). Para evitar isso, selecione a regra de colapso desejada em: “Settings” > “Collapsing rules” Em seguida, selecione o ícone “Collapse trees after the search” na janela do modo de busca de árvores a ser utilizado. No exemplo abaixo (Fig. A.4), a regra de colapso é a de colapsar ramos com grupos de estados semelhantes, sem transformação entre estados (não suportados por sinapomorfias). Tree 0, char. 3 (3 steps) Out A B C E F G D

state 0 state 1 state 2 state 3 state 4 state 5 state 6 state 7 state 8 state 9 Ambiguous

Figura A.3. Colapso de ramos não utilizado. Quando um único caráter definindo as posições de E, F, G e D é utilizado (caracter 3, neste caso), observe que G+D formam um grupo monofilético na imagem, embora não exista nenhuma sinapomorfia definindo este grupamento.

182 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

Tree 0, char. 3 (3 steps) Out A B C E G F D

state 0 state 1 state 2 state 3 state 4 state 5 state 6 state 7 state 8 state 9 Ambiguous

Figura A.4. Colapso de ramos sendo utilizado. No mesmo exemplo da figura A.3, observe que G+D não formam mais um grupamento artificial, sendo colapsados juntamente com F no ponto onde a transformação do estado 02 ocorre como sinapomorfia, definindo o grupo monofilético G+F+D.

B - Editando árvores: Árvores trancadas – não permitem edição Árvores destrancadas permitem edições: “Settings” > “Lock trees”.

Selecionando nós (e seus táxons terminais): > “Clicar com botão esquerdo do mouse uma vez” - nó em vermelho – nó e seus táxons terminais selecionados > “Clicar com botão esquerdo do mouse duas vezes” – nó em verde – se este nó for interno a um nó em vermelho (selecionado), fará com que os táxons internos a este último fiquem desselecionados, tornando parafilético o conjunto de táxons efetivamente selecionados.

Nós não selecionados podem ser: Compactados – clicando-se com o botão esquerdo do mouse duas vezes seguidas em nós não-selecionados faz todo o agrupamento de táxons internos a este ser reduzido a um táxon terminal, de novo nome a ser definido pelo usuário; Esta ferramenta é útil para se mostrar versões reduzidas ou simplificadas de determinados setores das árvores obtidas quando estas são demasiadamente grandes para serem impressas em uma única página.

183 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

Árvores visualizadas no modo “Trees”>”Display/Save” e com nós selecionados no modo destrancado podem ter estes mesmos nós: Deletados – clicando-se com o botão direito do mouse sobre o mesmo Movidos – clicando-se em outro nó (que não seja o nó do grupo irmão do clado selecionado) com o botão direito do mouse Colapsados – clicando-se com o botão direito do mouse no nó imediatamente mais inclusivo do que o selecionado (ancestral). Adicionados – clicando-se com o botão direito do mouse em nós selecionados em verde, pode-se incluir um táxon da matriz no agrupamento selecionado. Rotacionados – na visualização da árvore de consenso, clique na letra “R” para entrar no modo de rotação e, ao clicar em um nó qualquer da árvore, este irá trocar de posição com um outro nó de posição equivalente na árvore. Todos representam apenas diferentes formas de visualização que não alteram a topologia da árvore.

X - Obtendo uma árvore de consenso: Em “Tree” “Consensus” permite quatro tipos de árvores de consenso: > "Strict (=Nelsen)” – consenso estrito > "Combinable components” – consenso de componentes combináveis ou consenso semiestrito > “Majority rule” – consenso de maioria > “Frequency Diffs.”

*Consenso de Adams não está disponível no T.N.T..

No mesmo quadro de escolha do método de cálculo da árvore de consenso, estarão disponíveis as opções para se salvar a árvore a ser obtida:

184 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

Em "Show/Save" > Selecione "show/save tree diagram" (default) - para obter a figura da árvore na tela de visualização, onde poderá salvá-la em formato de metarquivo (.emf) que pode ser editado como uma fotografia (ver item XIII abaixo)

> Selecione a opção "Save to RAM" - para incluir as árvores a serem obtidas na memória temporária do programa, juntamente com as árvores mais parcimoniosas já armazenadas na mesma. O T.N.T. irá informar no display o número atribuído a cada árvore de consenso obtida, para posterior localização delas dentre as demais árvores na memória. Automaticamente também serão criados grupos de árvores para abrigar cada árvore de consenso obtida onde, por exemplo, a árvore obtida pelo consenso estrito estará em um grupo denominado "Strict consensus". Para checar este processo, observe os grupos de árvores criados indo em:

> Trees > Tree Groups > Show

*Porém, veja a seção BUGs ao final.

XI - Selecionando a árvore com a qual se deseja trabalhar Após obterem-se as árvores de consenso, selecione a(s) árvore(s) com a(s) qual(is) deseja trabalhar para os passos seguintes. Para tal:

Em "Tree" > "Tree Buffer" > "Select Trees" – escolha individualmente as árvores obtidas através do seu número e armazene-as na memória temporária para as próximas análises em "select trees". Alternativamente, vá em "group of trees" e selecione um dos grupos de árvores de consenso que o programa cria automaticamente após a obtenção das mesmas.

XII – Obtendo-se dados das árvores obtidas:

185 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

IMPORTANTE: Abaixo estão definidas as diferentes formas de se mapear os estados de caráter e como estes se apresentam em cada nó e táxon terminal das árvores produzidas. No entanto, é crucial lembrar nesta etapa que o T.N.T. reduz em uma unidade o número de cada caráter em relação ao número atribuído ao mesmo em sua matriz original. Por exemplo, enquanto o primeiro caráter na matriz for o caráter 1, no T.N.T. o primeiro caráter é sempre interpretado como caráter 0. Portanto, se a sinapomorfia de um dado clado na árvore de consenso final for mapeada como sendo um estado referente ao caráter 283 pelo T.N.T., significa que este é na verdade o caráter 284 na matriz utilizada.

A - Listando e mapeando sinapomorfias das árvores mais parcimoniosas: Em “Optimize” “Synapomorphies”: > “Map synapomorphies” – permite ver todas as sinapomorfias em todas as árvores geradas com “see all trees” ou de uma árvore em especial em “select trees”. Novamente, pode-se clicar na letra “M” para salvar a árvore num metarquivo extendido para publicação. Nesta imagem, porém, não aparece o estado em que o caráter sinapomórfico se apresenta. Para tal, deve-se gerar a listagem deles (abaixo). > “List synapomorphies” - gera na tela a listagem de todos os táxons terminais e nós (do mais basal aos mais derivados) e suas respectivas autapomorfias e sinapomorfias de todas as árvores geradas com “see all trees” ou de uma árvore em especial em “select trees”. Ao aparecer a listagem, salve a tela no arquivo log (.out) e abra-o no bloco de notas para recuperar esta listagem em forma de texto editável. > “Map common synapomorphies” e “List common synapomorphies” - fazem o mesmo que as opções anteriores considerando sinapomorfias comuns a todas as árvores armazenadas na memória.

186 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

B - Listando e mapeando transformações sofridas por cada caráter ao longo das árvores selecionadas Em “Optimize” “Characters”: > “Map characters” – mapeia as transformações de cada caráter ocorridas ao longo da árvore. > “List Characters” – lista todas as transformações sofridas por cada caráter. > “Map common characters” e “List common characters”- fazem o mesmo que os anteriores considerando transformações comuns a todas as árvores armazenadas na memória. C – Outros dados Em “Optimize” : > "Character scores" – indica o número de transformações sofridas por todos os caracteres > "Count specific changes" – indica o número de transformações de cada estado (definido pelo usuário) para outro em cada caráter de cada árvore desejada. > "Branch lenght" – indica o tamanho (número de passos) de cada ramo da árvore > "Tree lenght" – indica o tamanho total das árvores Em “Trees”: > “Comparisons” > “Show resolutions” – reporta quais são os nós que apresentam politomias não-resolvidas na árvore de consenso estrito.

D - Índices de suporte:

Índice de Bremer Em “Tree”: > “Bremer support” - índices de Bremer (ou índice de decaímento): É calculado obtendo-se comparações entre as árvores mais parcimoniosas com árvores sub-ótimas. A diferença no número de passos (“fit”) de uma árvore de consenso que contenha o agrupamento cujo

187 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

suporte deseja-se calcular e a árvore sub-ótima mais curta onde ele esteja colapsado será o valor do índice. Para tal, um número significativo de árvores sub-ótimas deve ser calculado, o que pode ser realizado de duas maneiras: na primeira, realiza-se TBR sobre um conjunto de árvores sub-ótimas armazenadas na memória RAM plotando os índices encontrados ("plot on") sobre a árvore de consenso estrito. Na segunda maneira, seleciona-se as árvore subótimas da memória RAM que foram retidas durante as análises de busca. Neste caso, é aconselhável selecionar um número significativo de árvores sub-ótimas e que tenham uma larga diferença no número de passos em relação às AMPs (ex: fit de 10 passos). Para selecionar todas as árvores de fit absoluto ≤ 10, por exemplo, em relação às árvores mais parcimoniosas, utiliza-se no menu “Tree”: > “Tree Buffer” > “Filter” – Permite excluir árvores redundantes, ou árvores sub-ótimas. Por exemplo, elimina-se todas as árvores sub-ótimas com 10 ou mais passos em relação à árvore mais parcimoniosa. Esta ferramenta é importante para se decidir quais árvores sub-ótimas serão mantidas na análise para, por exemplo, se calcular o índice de Bremer com base nestas árvores sub-ótimas obtidas ao longo da análise.

Índices de Jackknife e Bootstrap Em “Analyze”: > “Resampling” – Para o cálculo dos índices de Boostrap e índices de Jackknife

Para este cálculo, uma re-análise da matriz será conduzida adquirindo novas árvores iniciais. Portanto, o número de réplicas deverá ser alto (default = 100). Se o tamanho da matriz exige uma análise utilizando “New Technology Search”, leve em consideração que o número total de réplicas será aquele produzido pelo “New Technology Search” vezes o número de réplicas da análise de Jackknife e Bootstrap. Logo, se o número de réplicas para o índice é de 100 e o de replicações utilizando “New Technology Search” é 10, o número total de réplicas para o cálculo dos índices será de 1.000 (100 x 10).

XIII - Salvando árvores:

188 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

Sempre após se obter as árvores mais parcimoniosas, e mais tarde, a árvore de consenso:

A - Salve-a como arquivo (.tre) para futuras edições no T.N.T. , outros programas de análise filogenética ou edição ou de edições de árvores: 1- Em “File”: “Tree Save File” > “Open, parenthetical” – para abrir um arquivo onde as árvores serão salvas. 2 - Em “File”: “Tree save file” > “Save trees to open file” – para salvar as árvores desejadas

Atenção: Se o usuário desejar salvar outras árvores neste mesmo arquivo posteriormente, permaneça com ele aberto e salve as futuras árvores como mencionado no ítem 2. Após ter salvo todas as árvores desejadas neste arquivo: 3 – Em "File": “Tree save file" > "Close tree file"- os arquivos (.tre) só poderão ser abertos nos diretórios onde foram salvos quando este procedimento for realizado. B - Transfira-a para o display clicando na letra “S” e, consequentemente, salvando-a na memória temporária e no arquivo .log onde todas as ações do display são salvas.

C - Salve a árvore num metarquivo extendido (.emf) para publicação (um arquivo de imagem que pode ser posteriormente aberto e editado por programas de edição de imagem vetorial (e.g. CorelDraw): Em “Trees”: > “Tree display/save” > clique na letra “M” para salvar a árvore

Produzindo imagens de qualidade para publicação

189 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

As opções de edição da árvore oferecidas pelo próprio T.N.T. (veja os procedimentos clicando em "H" ao visualizar a árvore dentro do modo “Trees”>”Display/Save”) são satisfatórios e permitem a produção de uma árvore de boa resolução quando comparado a maioria dos programas de edição de árvores. No entanto, o formato .emf no qual as árvores são exportadas como imagem pode ser interpretado com erros ou distorções por muitos programas de visualização de imagem e edição (e.g. Photoshop, Microsoft Picture Manager). Para se editar a imagem, a melhor opção encontrada foi abri-la no CorelDraw ou Adobe Illustrator, onde ela pode ser editada como imagem vetorial e posteriormente exportada em formato JPG, BMP ou TIF.

O programa Mesquite permite a importação dos arquivos de árvores no formato TRE e então editá-los com uma boa variedade de ferramentas disponíveis, sendo muito superior ao programa TreeView. No entanto, a única forma de exportar a árvore num formato de imagem é salvando-a como PDF no menu "File".

XIV - Para sair do programa: Em "File": "Exit"

Ferramentas adicionais 1 - Identificando e removendo os táxons problemáticos Se a árvore de consenso estrito apresentar resoluções que sejam insatisfatórias para o estudo sendo conduzido, pode-se tentar identificar e remover os táxons responsáveis pelos conflitos e subseqüentes agrupamentos colapsados. Para tal, deve-se primeiro identificar quantos nós colapsados seriam recuperados realizando a remoção de determinados táxons:

190 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

Em ”Trees” > “Comparisons” > “Prunned Trees”

Contendo todas (e apenas) as AMPs utilizadas no cálculo da árvore de consenso estrito da análise anterior na memória RAM, escolha o nó que apresente as politomias que desejam ser resolvidas (observando a árvore de consenso com os nós indicados ou pedindo a listagem dos nós não-resolvidos, veja este último em “Show resolutions” acima). Uma lista com o número de ramos (ou nós) colapsados que seriam recuperados e quais os táxons que devem ser removidos para tal fim será calculada. Numa segunda etapa deste processo, remova os táxons utilizando “Prune Taxa”, e depois, faça uma nova filtragem (“Filter”) para se obter as novas AMPs recuperadas após o “prunning”. Como um novo patamar de número de passos de AMPs foi alcançado, é importante realizar novas rodadas utilizando-se os algoritmos de busca para saber se há outras AMPs com este mesmo número de passos que não foram recuperadas utilizando-se apenas o “prunning”.

2 – Selecionando-se árvores com uma determinada topologia dentre todas as AMPs obtidas. O usuário pode eventualmente se deparar com a seguinte pergunta: se o consenso de maioria mostra uma certa topologia de táxons que não é recuperada no consenso estrito, qual seria a posição destes táxons nas outras árvores que diferem do consenso de maioria? Esta é uma pergunta relevante para apontar outras possibilidades de relacionamento caso uma resolução 100% resolvida não seja recuperada durante o consenso. Para tal, deve-se primeiramente abrir uma das AMPs com a topologia presente no consenso de maioria. Abre-se a janela “define constraints” e nela: > selecione a opção “...for non-monophyly” > “use selected groups”. Nele, selecione com o mouse o nó que sustenta os agrupamentos a serem investigados por não estarem presentes em 100% das AMPs.

191 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

Como deseja-se saber quais são as AMPs onde este agrupamento predominante está ausente, deve-se realizar a filtragem de todas as árvores que possuam esta configuração, de forma a remanescer apenas as de topologia distinta desta. Portanto, filtre as AMPs de modo a manter na memória RAM apenas as árvores com a topologia definida no “constraint”: > “Filter” > “Constraints” > “Delete if not fulfilled”

O mesmo processo pode ser realizado para um resultado oposto, como para se reter as AMPs que contém os agrupamentos que aparecem na árvore de consenso de maioria ou outras operações equivalentes.

192 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

ADDENDUM 1 – BUGs

Para uma lista dos BUGs presentes nas versões anteriores e que foram corrigidos a partir de 2004 veja o link “Bug fixes” disponível no pacote de arquivos providos no download da versão mais recente programa. Todos os BUGs de edições anteriores do T.N.T. já foram reparados na edição mais recente disponível para download (2012). Os aqui referidos são BUGs ainda presentes na edição de 2012. 1 – Índice de Bremer: Ao se calcular o índice de Bremer sobre uma árvore de consenso há duas opções de exibição destes valores sobre esta árvore: “show/save tree diagram” para a exibição da árvore no display de modo a ser salva como arquivo de imagem .emf ou “save to RAM” para salvá-la na memória RAM em formato .tre, que permite futuras edições da árvore em outros programas. No entanto, se escolhida a opção pela memória RAM a árvore salva não conterá os valores do índice de Bremer conforme esperado. Somente a função “show/save tree diagram” irá permitir a visualização dos valores. 2 – Valores do consenso de maioria: O problema ocorrido para se visualizar os valores do índice de Bremer na árvore salva na memória RAM também ocorre com a árvore de consenso de maioria. Para visualizar a porcentagm de vezes que cada ramo ocorre dentro das AMPs, somente aplicando a visualização da árvore como arquivo de imagem .emf no momento em que se pede o cálculo da mesma. 3 – Se a matriz importada para o T.N.T. conter caracteres aditivos (ordenados) já definidos como tal pelo editor de matrizes (NDE, Mesquite), utilize a função “Data”>”Show character sattus”>”Show additive characters” para exibir os caracteres considerados como tais e verificar se não houve erros de interpretação do T.N.T.. Em algumas ocasiões apesar da pré-definição de quais os caracteres são aditivos, o T.N.T. irá considerá-los todos como não aditivos (default do programa) e estes terão que ser re-programados como aditivos dentro do próprio T.N.T.. Neste caso, para este procedimento não ter que se repetir todas as vezes que a matriz for aberta no T.N.T., salve estas alterações com “Data”>”Save data” para salvar a matriz atualizada em formato .T.N.T..

193 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

194 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

ADDENDUM 2

Por que o T.N.T. é mais rápido do que o PAUP*? O mecanismo tradicional de buscas pelas árvores mais parcimoniosas utilizando RAS + TBR é empregado no PAUP, NONA e no T.N.T.. No entanto, a capacidade do algoritmo de Goloboff (GOLOBOFF, 1996) para maximizar o RAS + TBR (presente no NONA e posteriormente no T.N.T.) e de realizar análises em um tempo milhares de vezes menor do que o PAUP se baseia no fato dele colapsar árvores mais parcimoniosas com agrupamentos de suporte igual a zero durante as etapas de busca. Em outros programas de análise, todas estas árvores ótimas temporárias eram salvas na memória temporária do programa aumentando exponencialmente o tempo de análise sem efetivamente contribuir para uma melhor resolução da mesma. Desta forma, o T.N.T. permite uma capacidade operacional mais rápida, tornando viável completar a análise de todas as replicações por RAS (GOLOBOFF, 1999), seja para análises tradicionais (RAS+TBR) ou com os mecanismos de “New Technology Search”. Isto permite tornar a análise não apenas mais rápida, mas também mas eficiente, já que a análise do maior número de árvores iniciais possíveis obtidas por RAS é fundamental para se realizar uma amostragem significativa do universo de árvores existentes e evitar o problema das “ilhas de árvores” (FARRIS et al., 1996). Em função disso, a versão mais recente do PAUP* 4.0 (SWOFFORD, 1998) também passou a incorporar este novo algoritmo. Ainda assim, o mecanismo de RAS + TBR do T.N.T. é entre 5 – 10 vezes mais rápido do que o do PAUP* 4.0 para pequenos conjuntos de dados e até 900 (!) vezes mais rápido para matrizes com números de táxons na casa dos milhares, do que a versão 4.0 lançada por Swofford (GOLOBOFF et al., 2008). Como as análises com os mecanismos da “New Technology Search” utilizam a busca RAS + TBR como base, estas análises ficam, consequentemente, também mais rápidas do que se fossem realizadas no PAUP* 4.0. Portanto, o grande mérito do T.N.T. é conseguir obter árvores mais parcimoniosas e em menos tempo através tanto dos mecanismos tradicionais de busca heurística quanto através dos quatro novos algoritmos de busca, além de viabilizar análises de matrizes extensas em tempo viável de pesquisa através dos 4 novos algoritmos do “New Technologies Search”.

195 Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

REFERÊNCIAS BIBLIOGRAFIA FARRIS, J. S., ALBERT, V. A., KÄLLERSJÖ, M., LIPSCOMB, D. & KLUGE, A. G. 1996. Parsimony jackknifing outperforms neighbor-joining. Cladistics, 12, 99-124. GLADSTEIN, D. S. 1997. Efficient Incremental Character Optimization. Cladistics, 13, 2126. GOLOBOFF, P. A. 1996. Methods for Faster Parsimony Analysis. Cladistics, 12, 199-220. GOLOBOFF, P. A. 1999. Analyzing large data sets in reasonable times: solutions for composite optima. Cladistics, 15, 415-428. GOLOBOFF, P. A. & FARRIS, J. S. 2001. Methods for quick consensus estimation. Cladistics, 17, S26-S34. GOLOBOFF, P. A., FARRIS, J. S. & NIXON, K. C. 2008. T.N.T., a free program for phylogenetic analysis. Cladistics, 24, 774-786. HOVENKAMP, P. 2004. Review of: T.N.T.—Tree Analysis Using New Technology. Version 1.0, by P. Goloboff, J. S. Farris and K. Nixon. . Cladistics, 20, 378-383. MADDISON, D. R. 1991. The Discovery and Importance of Multiple Islands of MostParsimonious Trees. Syst. Biol., 40, 315-328. MADDISON, W. P. & MADDISON, D. R. 2011. Mesquite: a modular system for evolutionary analysis. Version 2.75 (http://mesquiteproject.org). SWOFFORD, D. 1998. Phylogenetic Analysis Using Parsimony (* and other methods), version 4. Sinauer Associates, Sunderland, MA. . In).

Tiago Rodrigues Simões, PhD candidate University of Alberta, Canada [email protected]

Lihat lebih banyak...

Guia para o software T.N.T. (capítulo de dissertação de mestrado atualizado) [Guide for the software T.N.T. - updated MSc thesis chapter, in Portuguese]

Descrição do Produto

Comentários