MAPEAMENTO GENÉTICO - O ESTADO DA ARTE DO SEQUENCIAMENTO

Share Embed


Descrição do Produto

UNIVERSIDADE DE MOGI DAS CRUZES FABIANO BEZERRA MENEGIDIO

MAPEAMENTO GENÉTICO - O ESTADO DA ARTE DO SEQUENCIAMENTO

Mogi das Cruzes, SP 2014

UNIVERSIDADE DE MOGI DAS CRUZES FABIANO BEZERRA MENEGIDIO

MAPEAMENTO GENÉTICO - O ESTADO DA ARTE DO SEQUENCIAMENTO

Trabalho de conclusão apresentado ao curso de Mestrado em Biotecnologia da Universidade de Mogi das Cruzes como parte dos requisitos para a conclusão da disciplina Fundamentos da Tecnologia do DNA Recombinante ministrada pela professora Dra Daniela Leite Jabes.

Mogi das Cruzes, SP 2014

Resumo

Durante as últimas décadas, o custo da tecnologia de sequenciamento de DNA tem diminuindo drasticamente, com o aumento proporcional da velocidade e taxa de transferência. Este progresso e disponibilidade de instrumentos de sequenciamento de larga escala levaram à substituição de muitas técnicas de sequenciamento de DNA e abriu novos espaços de pesquisa. Tecnologias de segunda e de terceira geração são utilizadas diariamente ao redor do mundo baseadas na escolha de seus benefícios em oposição as dificuldade apresentadas em cada método. As tendências atuais são destinadas para o sequenciamento de genomas baseados em uma única molécula de DNA, além do surgimento de uma quarta geração de sequenciadores que tentam não recorrer à uma detecção ótica para o mapeamento do DNA alvo. Palavras-chave: Sequenciamento de DNA, genoma, Biologia Molecular.

Lista de ilustrações

Figura 1 - Auto-radiografia do método de sequenciamento de Maxam e Gilbert........8 Figura 2 - Auto-radiografia do método de sequenciamento de Sanger.....................12 Figura 3 - Esquema do sequenciamento de segunda geração 454 da Roche.........17 Figura 4 - Esquema do sequenciamento de segunda geração da SOLiD................21 Figura 5 - Esquema do sequenciamento de segunda geração da Illumina...............23 Figura 6 - Esquema do sequenciamento de terceira geração da Helicos.................25 Figura 7 - Esquema do sequenciamento de terceira geração SMRT........................26 Figura 8 - Esquema do sequenciamento de quarta geração da Oxford....................28

Sumário

1. Introdução ................................................................................................................6 2. Sequenciamento de primeira geração ….................................................................7 2.1. Método de degradação química............................................................................7 2.2. Método enzimático, dideoxi ou de término da cadeia ….....................................10 2.4. Sequenciamento por hibridação (SBH) ..............................................................14 3. Sequenciamento de Segunda Geração ................................................................15 3.1. Roche/454 FLX Pyrosequencer .........................................................................15 3.2. Life Technologies’s Ion Proton ............................................................................18 3.3. Applied Biosystems SOLiD .................................................................................19 3.4. Plataforma Solexa …...........................................................................................21 3.5. Illumina genome analyzer ...................................................................................22 4. Sequenciamento de terceira geração ....................................................................24 4.1. Helicos HeliScope …...........................................................................................24 4.2. Pacific Biosciences SMRT ..................................................................................26 5. Sequenciamento de quarta geração .....................................................................27 5.1. Oxford Nanopore Technology ............................................................................27 6. Conclusão .............................................................................................................29 Referências Bibliográficas .........................................................................................30

6

1. Introdução Durante a última década, um rápido desenvolvimento de novas tecnologias de sequenciamento e suas aplicações em diversas áreas de pesquisa vem sendo observado no meio científico. Curiosamente, este progresso teve início após a conclusão do sequenciamento do genoma humano. O primeiro sequenciamento do genoma humano foi obtido utilizando a tecnologia de mapeamento conhecida como Sequenciamento de Primeira Geração em sua metodologia automatizada. Nos anos seguintes, metodologias que ficaram conhecidas como

Sequenciamento

de Nova Geração

(NGS) ou

Sequenciamento de Segunda Geração foram desenvolvidas, se caracterizando pela paralelização massiva dos processos, a melhoria da automação e velocidade, e, o mais importante, redução considerável do custo por reação (GUZVIC, 2013).

Enquanto as abordagens do Sequenciamento de Nova Geração (NGS) foram melhoradas e ampliadas, as tecnologias de Sequenciamento de Terceira Geração surgiram, desta vez caracterizadas pela utilização de uma única molécula no sequenciamento. Características como sequenciamento profundo, sequenciamento paralelo maciço e alta taxa de transferência de sequenciamento estão ligadas com as tecnologias de segunda e terceira geração. Algumas dessas tecnologias foram abandonadas durante a evolução do processo de sequenciamento, mas muitas ainda estão sendo desenvolvidas ou melhoradas, sendo rotineiramente usadas em laboratórios de pesquisa ao redor do mundo (GUZVIC, 2013).

O objetivo deste trabalho é fornecer revisão geral do desenvolvimento e descrição das principais tecnologias de sequenciamento genético e o atual estado da arte. Também tem como objetivo apresentar possíveis novas tecnologias baseadas em uma Quarta Geração de Sequenciamento e as principais aplicações futuras para essas metodologias.

7

2. Sequenciamento de primeira geração Os dois primeiros métodos amplamente conhecidos de sequenciamento de DNA apareceram durante a década de 70. Um deles, conhecido como método de degradação química, foi publicado em fevereiro por Maxam e Gilbert (MAXAM & GILBERT, 1977). O segundo, que foi conhecido inicialmente como método “mais e menos” (plus and minus) (SANGER, NICKLEN & COULSON, 1977; FRANÇA, CARRILHO e KIST, 2002) e posteriormente foi ampliado para uma nova abordagem que ficou conhecida como método enzimático, dideoxi ou de término da cadeia, publicada em dezembro de 1977 por Sanger e colaboradores (SANGER, NICKLEN & COULSON, 1977). Ambos os métodos baseiamse na separação da mistura de fragmentos de DNA de vários tamanhos em géis de poliacrilamida (PAA).

2.1 Método de degradação química

Em seu artigo publicado em 1977, Maxam e Gilbert apresentaram uma nova técnica de sequenciamento de moléculas de DNA que podia determinar a sequência de nucleótideos de uma determinada molécula de DNA, marcada terminalmente com um isótopo radioativo, quebrando as bases nitrogenadas adenina, guanina, citosina ou timina através de reações mediadas por agentes químicos (MAXAM & GILBERT, 1977). Essas reações quimicas clivavam o DNA de quatro formas diferentes: apenas nas guaninas (G), nas adeninas e guaninas igualmente (A+G), nas citosinas e timinas igualmente (C+T) ou apenas nas citosinas (C). Ela utilizava dois reagentes especificos para o seu funcionamento: (i) sulfato de dimetilo para as purinas e (ii) hidrazina para as pirimidinas (MAXAM & GILBERT, 1977). A reação química era baseada em três etapas especificas: alteração da base, remoção da base modificada a partir do seu açúcar e quebra das cadeias de DNA (FRANÇA, CARRILHO e KIST, 2002).

Inicialmente, os moldes de DNA utilizados no método eram marcados terminalmente com [32P] fosfato ou com um nucleotideo ligado a 32P e enzimaticamente incorporado no fragmento de extremidade (FRANÇA, CARRILHO e KIST, 2002). A clivagem parcial produzia um conjunto de fragmentos radioativos que se estendiam a partir da extremidade

8 de cada uma das bases com a marcação radioativa. Posteriormente, o produto dessa reação era analisado por tamanho através de uma eletroforese utilizando um gel de poliacrilamida. sendo as sequencias de DNA mapeadas com base nos padrões de bandas observadas no processo de eletroforese após a exposição a uma auto-radiografia (Figura 1), que daria origem a uma série de bandas mostrando a localização de moléculas marcadas identicas (MAXAM & GILBERT, 1977).

Figura 1 - Auto-radiografia do método de sequenciamento de Maxam e Gilbert. (MAXAM & GILBERT, 1977)

Segundo Maxam e Gilbert (1977) em seu artigo original, sua técnica estava limitada apenas pelo poder de resolução do gel de poliacrilamida, sendo que naquele momento o método só poderia sequenciar cerca de 100pb a partir da extremidade de qualquer fragmento de DNA marcado terminalmente (MAXAM & GILBERT, 1977). Para França, Carrilho e Kist (2002), o problema de resolução do gel de poliacrilamida foi tratado nos anos seguintes e a adoção de fragmentos de restrição por meio de [35S] didesoxiadenosina, 5' (α-thio) trifosfato, ([35S] ddATPαS) e desoxinucleotidiltransferase

9 terminal foram usados e mostraram diversas vantagens, incluindo uma vida útil mais longa, energia de baixa emissão, aumento da resolução da auto-radiografia e maior estabilidade após marcação (FRANÇA, CARRILHO e KIST, 2002).

Outro problema observado na técnica original era o perigo na utilização de marcadores radioativos (FRANÇA, CARRILHO e KIST, 2002). Para tentar resolver esse problema, técnicas de utilização de corantes fluorescentes ligados aos oligonucleotideos foram propostas, sendo que diversos métodos se mostraram estáveis durante as reações quimícas utilizadas para as degradações especificas de bases (FRANÇA, CARRILHO e KIST, 2002). Além dos corantes fluorescentes, uma outra técnica que se mostrou eficaz foi a utilização de biotina quimicamente ou enzimaticamente ligada a um iniciador de oligonucleótideo por meios enzimáticos ou anexada a uma reação de preenchimento de extremidade de locais de enzimas de restrição (FRANÇA, CARRILHO e KIST, 2002).

Nos anos seguintes, tentativas de automatizar a técnica de Maxam e Gilbert foram apresentadas. Dentre diferentes técnicas de automatização, o método de detecção quimioluminescente demonstrou resultados competitivos no processo de automação de marcação, com a possibilidade de utilização de PCR para amplificar os produtos. Nesta estratégia, o fragmento de DNA quimicamente clivado era transferido a partir de um gel de sequenciamento para uma membrana de nylon. Sequências específicas eram selecionadas por hibridação de oligonucleótideos de DNA marcados com fosfatase alcalina ou com biotina. Após as etapas da técnica, a membrana era embebida no substrato quimioluminescente (AMPPD) e exposta a um filme fotográfico (FRANÇA, CARRILHO e KIST, 2002).

Até o inicio da década de 1980, todos os passos destes métodos de sequencimaneto químico foram realizados manualmente. No ínicio dos anos 80, foi descrito por Wada et al. (1983 apud FRANÇA, CARRILHO e KIST, 2002) um sistema composto por um robô Microchemical controlado por computador que efetuava uma das quatro reações quimicas (G, AC, CT, ou C) em menos de 2 horas. Outras abordagens, como a técnica de fase sólida para sequenciamento de DNA simplificado, foram propostas nos anos seguintes e tinham como objetivo automatizar e facilitar a aplicação da técnica de sequenciamento quimico no meio científico (FRANÇA, CARRILHO e KIST, 2002). Essa técnica conseguiu

10 alcançar no ano de 1980, a marca de 250pb por ensaio (FRANÇA, CARRILHO e KIST, 2002). Com as posteriores melhorias, atualmente a técnica consegue sequenciar uma média de 500pb e realizar o processamento automático de várias amostras simultaneamente (FRANÇA, CARRILHO e KIST, 2002).

Mesmo com diversas vantagens obtidas durante os anos de desenvolvimento do método de Maxam e Gilbert, algumas desvantagens ainda são observadas. Em primeiro lugar, as reações químicas da maioria dos protocolos desenvolvidos ao longo dos anos ainda são lentas e a utilização de produtos químicos perigosos requerem cuidados especiais no manuseio. Mas o problema mais importante seriaé a ocorrência de reações incompletas que diminuem os comprimentos de leitura, reduzindo a resolução inter-banda (FRANÇA, CARRILHO e KIST, 2002).

2.2 Método enzimático, dideoxi ou de término da cadeia

No ano de 1975, Frederick Sanger e equipe publicaram um artigo contendo um primeiro esboço do que seria a técnica de sequenciamento de DNA que por muito tempo se tornaria padrão na área da Biologia Molecular (SANGER, NICKLEN & COULSON, 1977; FRANÇA, CARRILHO e KIST, 2002). Conhecido inicialmente como método “mais e menos” (plus and minus) (SANGER, NICKLEN & COULSON, 1977; FRANÇA, CARRILHO e KIST, 2002), essa abordagem era relativamente rápida e simples, sendo que sua amplificação tornou possível a determinação da sequência do genoma do bacteriófago 4X174 através da utilização da DNA polimerase transcrevendo regiões específicas do DNA molde sob condições controladas (SANGER, NICKLEN & COULSON, 1977).

O método “mais e menos” utilizava a DNA polimerase I de Escherichia coli e a DNA polimerase do bacteriófago T4 com diferentes limitadores trifosfatos de nucleosídeos (FRANÇA, CARRILHO e KIST, 2002). Os produtos obtidos pelas polimerases durante a técnica eram analisados através de ionoforese em géis de acrilamida (FRANÇA, CARRILHO e KIST, 2002).

Devido à ineficácia do método "mais e menos”, dois anos depois, Sanger et al. (1977)

11 apresentaram um novo método inovador para sequenciamento de oligonucleotídeos através de polimerização enzimática que ficou conhecido como método enzimático, dideoxi ou de término da cadeia (SANGER, NICKLEN & COULSON, 1977). Em seu artigo, Sanger et al. (1977) descreveram que o método de Maxam e Gilbert (1977) apresentava vantagens sobre o seu primeiro método de sequencimento “mais e menos”, sendo uma das vantagens apontadas o fato do método químico poder ser aplicado a um DNA de cadeia dupla, mas como desvantagem apontou que a técnica precisava de uma separação de cadeias ou o equivalente do fracionamento de cada fragmento de enzima de restrição estudados, o que o tornava um pouco mais trabalhoso (SANGER, NICKLEN & COULSON, 1977).

Diferente do método de degradação química apresentado por Maxam e Gilbert (1977), no método enzimático de Sanger e colaboradores, o DNA era sintetizado usando uma DNA polimerase I e sua extensão era mediada através de oligonucleotídeos que possuíam a função de iniciadores, tendo uma molécula de DNA de fita simples servindo como modelo. Esse modelo era dividido em quatro aliquotas iguais, sendo que cada uma das reações apresentavam a DNA polimerase, uma mistura composta por um dos quatro desoxirribonucleótidos trifosfatos (dNTPs) e um iniciador (GUZVIC, 2013). Para cada uma das reações era adicionado apenas um dos quatro didesoxirribonucleotídeos (ddATP, ddGTP, ddCTP, ou ddTTP), sendo que cada um apresentava uma marcação com um corante diferente (GUZVIC, 2013). Uma vez que os didesoxinucleotídeos não possuíam a oxidrila ou hidroxila na extremidade 3´, não seria possível continuar a extensão a partir do nucleotídeo adicionado, encerrando a síntese da cadeia de DNA (GUZVIC, 2013). Após etapas de extensão do modelo de DNA, os fragmentos resultantes eram desnaturados e separados por tamanho usando o método de eletroforese em gel (GUZVIC, 2013). Esta leitura era realizada usando um gel de poliacrilamida ureia desnaturante com cada uma das quatro reações realizadas em um dos quatro poços individuais (poços A, T, G, C). Na figura 2, podesse observar as bandas de DNA visualizadas por auto-radiografia e a sequência de DNA sendo lida diretamente a partir do filme de raios-X ou uma imagem em gel (GUZVIC, 2013).

12

Figura 2 - Auto-radiografia do método de sequenciamento de Sanger. (SANGER, NICKLEN & COULSON, 1977)

Este método, mesmo se tornando extremamente popular na biologia molecular e tendo se tornado um protocolo de sequenciamento padrão, também apresentava algumas dificuldades. Na publicação original, Sanger e seus colaboradores apontaram que sua abordagem muitas vezes gerava a formação de laços com emparelhamento de bases de DNA de fita simples, gerando sérias dificuldades na resolução de bandas em algumas localidades. Estas acumulações eram vistas como uma série de bandas na mesma posição ou próximas uma do outras na eletroforese (SANGER, NICKLEN & COULSON, 1977). Sanger e seus colaboradores consideravam que para uma determinação precisa da sequência alvo não seria possível confiar apenas nos resultados individuais obtidos pelo método enzimático, mas que a confirmação deveria ser obtida por alguma outra técnica ou por uma repetição do método na cadeia oposta (SANGER, NICKLEN & COULSON, 1977).

13

Além desse problema, por vezes artefatos eram visualizados no gel, sendo sua origem mais provável os confórmeros do DNA de fita simples. Estas dificuldades foram atenuadas pela introdução de géis mais finos, permitindo a corrida em voltagens mais altas e com menos material, resultando em bandas mais nítidas (GUZVIC, 2013). Mais tarde a introdução de coloração de géis com prata PAA e corantes fluorescentes eliminou a utilização de isótopos radioativos (GUZVIC, 2013).

Devido a simplicidade e confiabilidade, o método de Sanger rapidamente tornou-se o método dominante para sequenciamento, esse sucesso acabou motivando um grande número de investigadores em tentar automatizar esse processo. Os trabalhos mais proeminentes foram de L. Hood e M. Hunkapiller, associados a Applied Biosystems, Inc. (GUZVIC, 2013). Inicialmente, Hood e Hunkapiller ofereceram duas melhorias importantes: rotulagem de DNA com corantes fluorescentes e aquisição baseado em computador e análise dos dados em seqüência. O instrumento que foi desenvolvido continha um gel PAA com 16 pistas e utilizava apenas um corantes fluorescente para marcar o DNA molde em todas as reações. Posteriormente, corantes diferentes para cada uma das quatro reações de sequenciamento foram utilizados, possibilitando a execução de todas as reações em uma única pista do gel (GUZVIC, 2013). Em ambos os processos (um corante e quatro corantes) foram obtidos quatro eletroferogramas ou cromatogramas, que quando sobrepostos, produziam a sequência do fragmento analisado.

Melhorias adicionais da automação vieram da introdução de ddNTPs marcados com corante, o que tornou possível a realização de quatro reações em um tubo. Guzvic (2013) aponta que nas duas décadas seguintes, os sequenciadores ABI foram significativamente melhorados. O número de vias em modelos baseados em gel PAA aumentou de 16 (ABI 370A) a 96 (ABI 377). O primeiro sequenciador capilar ABI modelo 310 foi, com um capilar, e o modelo 3730xl tinha 96 vasos capilares. Ao mesmo tempo, o comprimento das leituras aumentou de 350 (ABI 370A) para mais de 900 (ABI 3730xl), enquanto que os tempos de funcionamento diminuiu de 18h para 3h. A introdução do modelo 3730 aumentou a velocidade do sequenciamento do genoma humano.

14 Como no caso do método químico, o protocolo de sequenciamento desenvolvido por Sanger também apresentava alguns problemas. O preço de sequenciamento por base e os problemas relacionados com a clonagem e o mapeamento de regiões que contêm seqüências repetitivas eram as principais desvantagens relacionados a essa metodologia (GUZVIC, 2013). Curiosamente, mesmo com o surgimento do sequenciamento de nova geração, os cientistas do Instituto J. Craig Venter utilizaram o método automatizado de Sanger para sequenciar o genoma diplóide de um indivíduo humano (o próprio JC Venter), utilizando o seqüenciador ABI 3730xl, provavelmente o último genoma humano a ser seqüenciado utilizando essa metodologia (GUZVIC, 2013).

2.3 Sequenciamento por hibridação (SBH)

Desenvolvido por uma equipe de cientistas da Sérvia no início de 1990, o método por hibridação (SBH) pode ser considerado como uma abordagem entre a primeira e segunda geração de sequenciamento, pois incluía paralelização maciça em sua abordagem (GUZVIC, 2013).

Pelo método por hibridação se era possível determinar o teor de oligonucleótideo de uma cadeia de DNA molde por hibridação com oligonucleótideos curtos (5-25 pb), realizando o alinhamento por sobreposição de oligonucleotídeos de seqüência conhecida hibridizado com o DNA modelo. Através desse processo era possível reconstruir uma sequência alvo (GUZVIC, 2013). Durante o desenvolvimento do protocolo, foram previstos dois formatos para sua realização: no primeiro, o DNA molde seria imobilizado em uma superfície sólida, enquanto que os oligonucleótideos curtos marcados de sequência conhecida seriam usados para consultar o molde; no segundo, os oligonucleótideos curtos de sequência conhecida seriam dispostos sobre a superfície sólida, enquanto o DNA marcado seria apresentado como uma sonda (GUZVIC, 2013).

Mesmo o método apresentando um grande potencial para o sequenciamento em larga escala, alguns inconvenientes impediram que

esta

abordagem fosse

utilizada

amplamente. O número de oligonucleótideos necessários para o sequenciamento completo dependia do seu comprimento e podia ser muito elevado e as condições de

15 hibridação e de lavagem que retêm apenas hibridações perfeitamente combinadas não eram fáceis de otimizar. A abordagem também não apresentou uma boa solução para lidar com seqüências repetitivas (GUZVIC, 2013).

3. Sequenciamento de segunda geração A principal característica do sequenciamento de próxima geração é a paralelização de elevado

número

de

reações

de

sequenciamento,

processo

conseguido

pela

miniaturização de reações de sequenciamento (GUZVIC, 2013). A utilização de diversos templates clonais em paralelo e de um processo de determinação da sequência com uso de replicação enzimática também é um diferencial dessa nova geração (MORENO, 2013). Essas mudanças influenciaram na redução do tempo necessário para determinar as sequências, passando de dias para horas (GUZVIC, 2013).

Uma outra caracteristica é que as reações do sequenciamento de segunda geração ocorrem por ciclos de adição de bases nitrogenadas intermediadas pela polimerização ou ligação

de

DNA,

sendo

posteriormente

visualizadas

por

processos

de

quimioluminescência (pirosequenciamento), fluorescência (Illumina Genome Analyser) ou sequenciamento por oligo-ligações e fluorescência (SOLiD) (MORENO, 2013).

3.1 Roche/454 FLX Pyrosequencer

Introduzida no mercado em 2004, a plataforma de sequenciamento 454 da Roche, foi a primeira de alto rendimento e se baseava na tecnologia de pirosequenciamento, desenvolvida por Pal Nyrén e Mostafa Ronaghi, do Royal Institute of Technology de Estocolmo, em 1996 (MORENO, 2013).

Segundo Moreno (2013), na tecnologia de pirosequenciamento, cada um dos nucleótideos inseridos pela enzima DNA polimerase provoca a liberação de um pirofosfato. Esse pirofosfato é responsavel pelo inicio de uma série de reações em cadeia que produzem luz através da quebra da oxiluciferina pela luciferase. A quantidade de luz produzida é equivalente ao número de nucleótideos incorporados, sendo regulada pelo

16 ponto de saturação do detector. Essa abordagem proporciona um sequenciamento em paralelo e em massa das bibliotecas após a amplificação por PCR, sendo que as reações ocorrem na superfície de milhares de esferas de agarose. A superfície destas esferas possui milhões de oligonucleotideos, complementares às sequências específicas do adaptador 454 continudo na biblioteca de fragmentos. Graças a essa caracteristica, cada esfera se associa a apenas um único fragmento (MORENO, 2013).

Mardis (2008) cita que as superfícies dessas esferas possuem milhões de oligômeros ligados, cada um dos quais é complementar para as sequencias do adaptador que foi ligado ao fragmento terminal durante a construção da biblioteca. Cada um dos complexos esfera/fragmento são isolados em micelas óleo/água individuais, que também possuem reagentes de PCR na fase aquosa. Após um ciclo térmico, cada micela produz em apenas algumas horas aproximadamente um milhão de moléculas prontas para a realização do sequenciamento (Figura 3) (MORENO, 2013). Após ciclos de amplificação, essas moléculas são sequenciadas em paralelo (MARDIS, 2008).

Várias centenas de milhares dessas esferas contendo um único fragmento amplificado são adicionadas à superfície da placa 454 picotiter (PTP). Em seguinda, esferas magnéticas e de látex de diâmetro de 1 mm, que estão ligados às enzimas ativas necessárias para o pirosequenciamento, são adicionados para rodear as esferas de agarose contendo DNA na placa 454 picotiter (PTP) (MARDIS, 2008). Do lado oposto da placa 454 picotiter (PTP) encontra-se uma câmara que registra a luz emitida por cada esfera proveniente da da quebra da oxiluciferina pela luciferase. A visualização dos flashes de luz correponde em qual dos poços estão sendo adicionados cada um nucleotideos (MORENO, 2013).

Os primeiros quatro nucleotideos (T, C, G e A) utilizados na construção da biblioteca permitem que o software do sequenciador 454 calibre a luz emitida por cada nova inserção. Mesmo com essa calibração, o sequenciador e software não conseguem interpretar extensões longas de nucleotídeos múltiplos, podendo provocar erros de inserção ou de deleção de bases durante o sequenciamento. Mas, como cada etapa de inserção é específica de um nucleotídeo, erros de substituição são raramente encontrados na leitura do sequenciador Roche/454 (MORENO, 2013).

17

As principais desvantagens desta tecnologia segundo Guzvic (2013) são o elevado custo de reagentes e as altas taxas de erro em extensões longas de nucleotídeos múltiplos. O sequenciamento do genoma do pesquisador James Dewey Watson, um dos autores do "modelo de dupla hélice" para a estrutura da molécula de DNA, foi realizado com a tecnologia de pirosequenciamento e demorou dois meses, utilizando três sequenciadores Roche/454. Esse foi um grande avanço. comparado com o sequenciamento do genoma do pesquisador John Craig Venter, que utilizando a tecnologia de sequenciamento de Sanger automatizado demorou quase 15 anos (GUZVIC, 2013).

Figura 3 - Esquema do sequenciamento de segunda geração 454 da Roche. (MORENO, 2013)

18

3.2 Life Technologies’s Ion Proton

O sequenciador IonTorrent Personal Genome Machine (PGM™) foi o primeiro aparelho comercializado pela empresa Life Technologies. Ele utiliza o método de incorporação enzimático de bases, tendo sido desenvolvido pelo mesmo inventor do sequenciador 454 da Roche (GUZVIC, 2013).

No entanto, ao invés de utilizar placas 454 picotiter (PTP), o sequenciador utiliza uma tecnologia semicondutora, detectando os protons libertados pela incorporação dos nucleotideos durante o processo de síntese. Durante o processo, os fragmentos de DNA contendo as sequencias e adaptadores específicos são ligadas e posteriormente amplificadas por clonagem em emulsão de PCR, na superfície de esferas de 3 micrómetros de diâmetro, conhecidas como Ion Sphere Particles. Essas esferas posteriomente são transferidas para poços sensíveis a protons e o sequenciamento é iniciado em um local específico da sequência. Cada uma das quatro bases nitrogenadas são introduzidas sequencialmente, sendo que cada incorporação bem sucedida é determinada pela variação de pH, medida por numerosos sensores de pH, devido à liberação de H+ durante a incorporação dos nucleotídeos (MORENO, 2013).

A Life Technologies também lançou posteriormente o sequenciador IonProton™ Sequencer baseado em chips. Nesse sequenciador, transístores de efeito de campo (FET’s) realizam a detecção das variações de pH numa estrutura de micro poços. Para aumentar o rendimento, o chip de sequenciamento do IonProton utilizava uma matriz densa de micro poços, onde cada poço funcionava como uma câmara individual de polimerização contendo uma DNA polimerase e um fragmento para sequenciamento. Sob esta camada de micro poços se encontra um estrato sensível a ions, seguido por uma outra subcamada composta por uma matriz de detectores FETs. Os transístores de efeito de campo detectam as variações de pH durante a inserção das bases nitrogenadas e convertem o sinal em voltagem, gravando a leitura no software do sequenciado (MORENO, 2013).

19 Segundo Guzvic (2013) as principais desvantagens do sequenciador IonTorrent são altas taxas de erro em extensões longas de nucleotídeos múltiplos, assim como o 454, e na leitura de fragmentos curtos, o que é parcialmente compensado pelo número de poços que pode chegar a até 11 milhões.

3.3 Applied Biosystems SOLiD

Na plataforma SOLiD a reação de sequenciamento de DNA é catalisada por uma DNA ligase, e não por uma DNA polimerase (CARVALHO & SILVA, 2010). O método se baseia no sequenciamento por ligação (SBL), procedimento que envolve a hibridização sequencial de sondas contra o DNA alvo e sua subsequente ligação, sendo portanto ligado ao método de sequenciamento por hibridização (SBH) (GUZVIC, 2013).

Durante o protocolo, o DNA alvo é fragmentado por um sonicador em pedaços de 60-90 pb para as bibliotecas de tags únicas (single-pair), ou pedaços de 1-10 Kb para as bibliotecas de tags duplas (mate-pair). Os fragmentos de tags únicas são ligados a adaptadores universais (P1 e P2) em ambas as extremidades. Diferentemente, os fragmentos de tags duplas são visualizados em gel para a seleção da faixa de tamanho de interesse, que posteriormente serão ligadas aos mesmos adaptadores universais P1 e P2. Esse conjunto, composto por fragmentos e adaptadores, será circularizado e clivado com uma enzima de restrição que corta o fragmento após o sítio do adaptador, liberando fragmentos formados por: 27 bases de uma região, mais a sequência dos adaptadores e mais 27 bases adicionais de outra região que estarão separadas da primeira pela distância utilizada no intervalo de seleção dos fragmentos (CARVALHO & SILVA, 2010). A preparação da amostra se mostra um pouco semelhante à da plataforma 454 de sequenciamento (GUZVIC, 2013).

As microesferas são ligadas a uma lâmina de vidro com uma substância desenvolvida pela própria Applied Biosystems que proporciona uma ligação covalente das mesmas. Embora as microesferas sejam aleatoriamente distribuídas sobre o chip, cada chip pode ser dividido em até oito áreas, as quais podem então ser utilizadas na análise de até oito bibliotecas diferentes. A empresa também fornece a alternativa da aquisição de um

20 sistema de código de barras que possibilita a identificação das diferentes amostras distribuídas sobre um mesmo chip não dividido, baseado em cinco nucleotídeos específicos (código de barras) que são adicionados ao adaptador P2 (CARVALHO & SILVA, 2010). Conforme relata Carvalho e Silva (2010), estão disponíveis 20 códigos distintos, os quais, se usados em chips divididos, possibilitam a análise simultânea de 320 amostras.

No sequenciamento, o DNA molde ligados as microesferas são combinados com os iniciadores universais, a enzima ligase e as sondas. Esse processo é dividio em diversas etapas bem definidas graças ao uso do iniciador universal. Durante a primeira etapa do sequenciamento, o iniciador universal apresenta n bases. Já na segunda etapa, o iniciador apresentará n-1 bases, e assim sucessivamente até a quinta etapa em que o iniciador possuirá n-4 bases (CARVALHO & SILVA, 2010). Pequenas sondas randômicas, marcadas com um entre quatro fluoróforos possíveis em função do tipo de dinucleotídeo que apresentam na sua extremidade 3’ e compostas por oito bases, também são utilizadas durante a reação de sequenciamento (CARVALHO & SILVA, 2010). Na primeira etapa do protocolo de sequenciamento o iniciador universal completo é anelado na extremidade do adaptador P1. Uma sonda complementar à sequência alvo se hibridizará com a sequência molde e será ligada ao iniciador universal através da ligase. A fluorescência da sonda ligada é detectada, e o fluoróforo é clivado, deixando um grupo 5’ fosfato disponível para a realização de reações adicionais. No próximo ciclo, adicionam-se novamente as sondas e a ligase para a leitura das próximas bases. Os ciclos se repetem até que toda a sequência seja coberta. Na segunda etapa do protocolo, o fragmento de DNA é desnaturado e tem a adição do segundo iniciador universal com n-1 bases, liberando desde a última base do adaptador para o sequenciamento (Figura 4). Segue-se todos os ciclos anteriores produzindo uma leitura de 35 pb nas bibliotecas de tags únicas ou de 50pb nas bibliotecas de tags duplas. As cinco etapas de sequenciamento se tornam necessárias porque a cada novo ciclo de hibridização da sonda apenas a sequência do iniciador universal somado aos dinucleotídeos marcadores das sondas são conhecidos (CARVALHO & SILVA, 2010).

21

Figura 4 - Esquema do sequenciamento de segunda geração da SOLiD. (MORENO, 2013)

3.4 Plataforma Solexa

Da mesma forma que no método dideoxi de Sanger, a plataforma Solexa realiza a sintese de DNA usando uma enzima de DNA polimerase e nucleotídeos terminadores marcados com fluoróforos diferentes. O que difere essa plataforma é a clonagem in vitro dos

22 fragmentos de DNA em uma plataforma sólida de vidro. Nesse processo conhecido como PCR de fase sólida, a superfície de clonagem é dividida em oito linhas que podem receber até oito bibliotecas para sequenciamento. Em cada uma das linhas, são fixados na superficie pela extremidade 5' adaptadores, sendo que a extremidade 3' livre é utilizada no processo de hibridização. Os fragmentos de DNA molde são ligados aos adaptadores

pelas

duas

extremidades,

permanecendo

presos

ao

suporte

de

sequenciamento por hibridização a um dos adaptadores fixados. No primeiro ciclo de amplificação, nucleotídeos não marcados são fornecidos para que haja a síntese da fita complementar do fragmento imobilizado no suporte. Após o ciclo de anelamento, o fragmento forma uma estrutura semelhante a uma ponte que permite a extensão do mesmo, formando a fita complementar também em formato de ponte. No ciclo de desnaturação, as fitas são separadas e linearizadas. os ciclos se repetem 35 vezes, formando um cluster de sequenciamento composto por cerca de mil cópias geradas de cada fragmento nessa etapa de PCR de fase sólida. A alta densidade dos clusters de sequenciamento possibilita que o sinal de fluorescência gerado com a incorporação de cada um dos nucleotídeos terminadores tenha uma intensidade suficiente para garantir sua detecção exata (CARVALHO & SILVA, 2010).

3.5 Illumina genome analyzer

A plataforma Solexa inicialmente permitia o sequenciamento paralelo de vários milhões de pequenas sequências em uma só reação. Posteriormente, foram feitas atualizações nessa plataforma dando origem ao Illumina Genome Analyzer (MORENO, 2013). Segundo Guzvic (2013), o sequenciador Illumina é capaz de produzir um maior volume de dados quando comparado com o sequenciador 454 da Roche. Com o comprimento de leitura de 100bp, e tempo de execução de 11 dias, o atual instrumento pode produzir 600Gbp de dados, sendo uma grande melhoria, em comparação com o relatório original, onde demonstrava obter leituras de 35bp e 2Gbp de dados (GUZVIC, 2013).

Esta tecnologia também utiliza o método de sequenciamento por síntese proposto por Frederick Sanger (SANGER, NICKLEN & COULSON, 1977). O sequenciamento utiliza a enzima DNA polimerase e nucleotídeos marcados com diferentes fluoróforos, sendo seu

23 diferencial a existência de uma colônia de PCR composta por clones dos fragmentos de DNA in vitro em uma superficie sólida de vidro de clonagem, processo conhecido como PCR de fase sólida. A superfície consiste de uma lâmina de vidro dividida em oito linhas onde as extremidades dos fragmentos são ligados, semelhante ao processo realizado na plataforma Solexa (GUZVIC, 2013; MORENO, 2013).

Semelhante ao sequenciamento 454, o DNA molde é fragmentado e dois conjuntos diferentes de adaptadores são ligados as extremidades terminais dos fragmentos - um conjunto necessário para a ligação da célula de fluxo e a segunda necessária para o sequenciamento (GUZVIC, 2013).

Figura 5 - Esquema do sequenciamento de segunda geração da Illumina. (MORENO, 2013)

Os fragmentos de DNA são fixados na superfície de clonagem, de modo que a extremidade 3’ fique sempre livre para a iniciação da reação de sequenciamento dos

24 fragmentos

imobilizados

no

suporte

(MORENO,

2013).

Estes

fragmentos

são

desnaturadas e as cadeias simples são então injetadas para dentro da célula de fluxo, que apresenta uma grande quantidade de iniciadores complementares as sequencias dos adaptadores (GUZVIC, 2013), facilitando a hibridização do adaptador livre (3’) e sua sequencia complementar fixa, próximo ao clone inicial durante o ciclo de anelamento (MORENO, 2013). Como no sequenciamento Solexa, durante o ciclo de anelamento o fragmento de DNA forma uma estrutura em formato de ponte e após a inserção dos reagentes necessários a extensão ocorre, formando uma fita complementar também em formato de ponte (MORENO, 2013). O processo seguinte é muito semelhante ao sequenciamento Solexa, com a formação de um cluster de sequenciamento composto por cerca de mil cópias obtidas pelo PCR de fase sólida (Figura 5). Conforme relatado por Guzvic (2013), essa abordagem permite o sequenciamento de fragmentos de 2-5 Kpb de comprimento e pode ser utilizada para a análise de variantes estruturais, como translocações ou inversões.

4. Sequenciamento de terceira geração As tecnologias de sequenciamento de terceira geração são movidas pelo objetivo de reduzir o custo do sequenciamento e simplificar os protocolos de execução (GUZVIC, 2013). Ao contrário das tecnologias de segunda geração, a terceira geração tenta evitar a preparação de amostras e amplificação, apresentando tecnologias que permitem o sequenciamento feito em moléculas únicas (MORENO, 2013), reduzindo assim o custo dos reagentes (GUZVIC, 2013). Outra inovação é a tentativa de evitar os sistemas ópticos para detecção de eventos de incorporação pelas desvantagens inerentes. Sendo uma outra tendência das tecnologias de terceira geração a utilização de sistemas de detecção não-ópticos (GUZVIC, 2013).

4.1 Helicos HeliScope

Baseada na tecnologia “true single molecule sequencing” – tSMS, a Helicos foi a primeira empresa a comercializar um aparelho capaz de sequenciar moléculas individuais, sem a necessidade de um processo de amplificação. Para a realização do método, uma amostra

25 de DNA é fragmentado antes da adição de uma cauda poly-A em cada molécula. No último passo da poliadenilação é adicionada uma adenina marcada com fluorescência. Posteriormente, a biblioteca é transferida para uma “flow cell” que possui na sua superfície milhões de nucleotideos poly-T universais. Cada molécula transferida hibridiza com as terminações poly-T, desencadeando as reações de sequenciamento. Com as amostra ligadas a “flow cell”, um laser ilumina a superfície revelando a localização de cada template fluorescente, sendo o próximo passo a remoção da adenina marcada com fluorescência na extremidade 3’ para o inicio do sequenciamento (MORENO, 2013).

Enzimas DNA polimerase passam pela “flow cell” com cada um dos nucleótideos com fluorescência e as sequências complementares são polimerizadas nesse processo pelos oligonucleotideos poli-T. Nessa etapa, a fluorescência das adenosinas que se ligaram às sequências antes de ser removido o fluoróforo são lidas, logo após as bases citosinas marcadas com fluorescência se ligarão complementando a sequência e a leitura é novamente realizada, com o processo se repetindo para as outras bases até se atingir o comprimento de leitura desejado (MORENO, 2013).

Figura 6 - Esquema do sequenciamento de terceira geração da Helicos. (MORENO, 2013)

26

4.2 Pacific Biosciences SMRT

Segundo Guzvic (2013), a tecnologia comercializado pela Pacific Biosciences é a mais proeminente para o sequenciamento baseado em uma única molécula. Moreno (2013), cita que essa tecnologia poderia ultrapassar limitações das tecnologias de segunda geração disponíveis no mercado, se diferenciando pelo aumento na quantidade de informação disponível em menor tempo, menor custos e menor quantidade de erros.

A reação de sequenciamento de um fragmento de DNA na plataforma SMRT é feita por uma única DNA polimerase ligada à base de cada uma das câmaras de visualização ZMW, assim o método permite a observação de uma síntese natural de DNA pela DNA polimerase (MORENO, 2013). A ZMW é uma câmara cilíndrica de metal, com o tamanho aproximado de 9 nm de diâmetro, possuindo uma base de vidro por onde trafega a luz, para que seja possível a leitura. Durante o sequenciamento, o DNA da amostra é polimerizado pela enzima DNA polimerase usando nucleotideos marcados na terminação fosfato com 4 tipos diferentes de fluorescência presentes na solução. A marcação no grupo fosfato, ao contrário da marcação feita na base, permite que a enzima corte a fluorescência como parte do processo de inserção do nucleotideo na nova cadeia de DNA (MORENO, 2013).

Figura 7 - Esquema do sequenciamento de terceira geração SMRT. (MORENO, 2013)

27 Uma vez que todos os quatro nucleotídeos são adicionados simultaneamente, e a análise é realizada em tempo real, a velocidade de sequenciamento é melhorada em comparação com as tecnologias anteriores. Essa tecnologia tem relatado uma precisão de 99,3%, e provavelmente poderia ser melhorada com a circularização do DNA molde (GUZVIC, 2013).

5. Sequenciamento de quarta geração Muitos pesquisadores já apontam o surgimento de novas abordagens que poderiam ser classificadas como uma tecnologia de sequenciamento de quarta geração. Esta classificação torna-se pertinente já que a identificação da sequência passa a ser feita sem recorrer à detecção ótica, juntamente com a eliminação das etapas de lavagem (MORENO, 2013).

5.1 Oxford Nanopore Technology

O método de sequenciamento por nanoporos foi demonstrado pela primeira vez em 1996 e se baseia em um princípio extremamente simples, permitindo a identificação de modificações individuais entre nucleotideos (MORENO, 2013).

O sequenciamento por nanoporos utiliza uma fina membrana, com elevada resistência elétrica, que contém poros com aproximadamente 1.5 – 2 nm de diâmetro, imersa em uma solução salina. Uma corrente elétrica é aplicada ao sistema conduzindo os ions pelos nanoporos, provocando uma mudança de potencial. Uma biomolécula negativa, como o DNA, atravessa ou bloqueia o canal em direção à carga positiva, criando uma resistência no fluxo de ions. Esta resistência gera alterações na corrente elétrica, na ordem dos picoamperes, que podem ser medidas num circuito elétrico. Moléculas de diferentes tamanhos vão bloquear o poro de forma diferente, ou durante espaços de tempo diferentes, possibilitando a descriminação entre as quatro bases nitrogenadas do DNA e assim a identificação da sequência (MORENO, 2013).

28 Para a realização do sequenciamento, a enzima exonuclease é ligada covalentemente à entrada do nanoporo, tendo a função de degradar a dupla hélice de DNA depositando no poro os nucleotideos, proporcionando a leitura individualizada de cada nucleotideo presente na sequência (MORENO, 2013).

Moreno (2013) descreve a existência de dois tipos de nanoporos, os biológicos - que utiliza a proteína α-hemolisina, originalmente presente em membranas celulares durante o processo de lise - e os solid-state, estruturas com um orifício na escala nanométrica formulados numa membrana sintética de sílica ou derivados (SiNx ou SiO2). Os nanoporos biológicos possuem como vantagem a possibilidade de serem facilmente modificados, o seu tamanho estar bem definido e poderem ser produzidos em massa, sem alterar o tamanho e estrutura. Já os solid-state aliviam a dificuldade de estabilizar a membrana e de posicionar as proteínas, que são desvantagens dos biológicos (MORENO, 2013).

Figura 8 - Esquema do sequenciamento de quarta geração da Oxford. (MORENO, 2013)

Apesar da sua extrema sensibilidade, este método tem a desvantagem de destruir a amostra em estudo, o que impossibilita uma segunda leitura para redução de erros (MORENO, 2013).

29

6. Conclusão Após os avanços na área de sequenciamento genético, a metodologia desenvolvida por Frederick Sanger ainda é considerada padrão graças à sua precisão e comprimento de leitura. O método automático de Sanger ainda produz as leituras mais longas, embora as tecnologias de sequenciamento de próxima geração estão chegando cada vez mais próximo desta marca. Mesmo tendo algumas vantangens quando comparado com outros métodos, o sequenciamento de Sanger é notoriamente lento e caro (GUZVIC, 2013). Já as tecnologias de segunda e terceira geração são capazes de sequenciar o genoma humano inteiro dentro de 10 dias, pelo custo de $10000. Os principais problemas compartilhafos por essas gerações são a baixa precisão e a geração de leituras curtas, o que torna a montagem final ou alinhamento difícil e gerando um novo desafio computacional para a área de Bioinformática (GUZVIC, 2013).

Segundo Guzvic (2013), a tecnologia ideal para o futuro deverá apresentar maior precisão, maiores comprimentos de leitura e um preço de reação reduzido. Ainda segundo Guzvic (2013), tecnologias de sequenciamento de molécula única demonstram ter potencial para se tornarem um novo padrão de sequenciamento no futuro, especialmente pela possibilidade de sequenciar diretamente moléculas de RNA. Moreno (2013) aponta que graças aos métodos de sequenciamento de moléculas únicas, será possível em um futuro próximo a detecção de mutações raras entre indivíduos em termos de saúde ao nível molecular, melhorando o papel importantíssimo do sequenciamento genético no diagnóstico.

Melhorias e o desenvolvimento de novas tecnologias de sequenciamento as tornarão cada vez mais disponíveis e acessíveis aos pesquisadoresm sendo que a escolha de uma tecnologia dependerá da aplicação necessária e de uma comparação entre as vantagens e desvantagens particulares de cada abordagem de sequenciamento escolhido (GUZVIC, 2013). Novas tecnologias de sequenciamento são desenvolvidas e aprimoradas rapidamente, se tornando extremamente difícil prever o destino das tecnologias existentes e emergentes.

30

Referências bibliográficas CARVALHO, Mayra Costa da Cruz Gallo de; SILVA, Danielle Cristina Gregorio da. Sequenciamento de DNA de nova geração e suas aplicações na genômica de plantas. Cienc. Rural, Santa Maria , v. 40, n. 3, Mar. 2010.

FRANÇA LTC, CARRILHO E, KIST TBL. A review of DNA sequencing techniques. Quarterly Reviews of Biophysics 35, 2 (2002), pp. 169–200. " 2002 Cambridge University Press.

GUZVIC M. The history of DNA sequencing. J Med Biochem 32: 301–312, 2013.

MARDIS ER. The impact of next-generation sequencing technology on genetics. Trends Genet, 24, 133-41, 2008.

MAXAM AM, GILBERT W. A new method for sequencing DNA. Proc Natl Acad Sci USA 1977; 74: 560–4.

MORENO, ACA. Diagnóstico Molecular na era da sequenciação de 3ª geração e da PCR digital. Universidade Fernando Pessoa. Porto, 2013

SANGER F, NICKLEN S, COULSON AR. DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci USA 1977; 74: 5463–7.

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.