Estudo do efeito da adição de frustração no enovelamento de proteínas utilizando modelos baseados em estruturas

June 1, 2017 | Autor: Vinicius Contessoto | Categoria: Protein Folding, Molecular Dynamics, Aleph
Share Embed


Descrição do Produto

DISSERTAÇÃO DE MESTRADO

ESTUDO DO EFEITO DA ADIÇÃO DE FRUSTRAÇÃO NO ENOVELAMENTO DE PROTEÍNAS UTILIZANDO MODELOS BASEADOS EM ESTRUTURAS

Discente: Vinícius de Godoi Contessoto Orientador: Prof. Dr. Vitor Barbanti Pereira Leite

São José do Rio Preto 2012

VINÍCIUS DE GODOI CONTESSOTO

ESTUDO DO EFEITO DA ADIÇÃO DE FRUSTRAÇÃO NO ENOVELAMENTO DE PROTEÍNAS UTILIZANDO MODELOS BASEADOS EM ESTRUTURAS

Dissertação de mestrado apresentado ao Programa de Pós-Graduação em Biofísica Molecular da Universidade Estadual Paulista “Júlio de Mesquita Filho” – UNESP – Campus de São José do Rio Preto, como parte dos requisitos para a obtenção do título de Mestre.

Orientador: Prof. Dr. Vitor Barbanti Pereira Leite

São José do Rio Preto 2012

Contessoto, Vinícius de Godoi. Estudo do efeito da adição de frustração no enovelamento de proteínas utilizando modelos baseados em estruturas / Vinícius de Godoi Contessoto. - São José do Rio Preto : [s.n.], 2012. 38 f. : il. ; 30 cm. Orientador: Vitor Barbanti Pereira Leite Dissertação (mestrado) - Universidade Estadual Paulista, Instituto de Biociências, Letras e Ciências Exatas 1. Biofísica molecular. 2. Proteínas – Enovelamento. 3. Proteínas – Estrutura. 4. Proteínas – Simulação computacional. I. Leite, Vítor Barbanti Pereira. II. Universidade Estadual Paulista, Instituto de Biociências, Letras e Ciências Exatas. III. Título. CDU – 577.112 Ficha catalográfica elaborada pela Biblioteca do IBILCE Campus de São José do Rio Preto - UNESP

Agradecimentos

Inúmeras pessoas contribuíram diretamente ou indiretamente para a realização desse trabalho. Agradeço aos meus pais, Francisco Contessoto Neto e Claudete Apª Ferreira de Godoi Contessoto, e ao meu irmão Allan de Godoi Contessoto, pela dedicação, incentivo e carinho por mim. Aos meus Avôs, Tios e Primos, pelo incentivo. À minha comunidade do caminho neocatecumenal. Aos amigos de pós-graduação, Haroldo de Lima Pimentel Cravo, Guilherme Volpe Bossa, Ícaro Putinhon Caruso e Gabriel Gouvêa Slade pela ajuda constante durante esses anos. Aos companheiros do grupo: Antonio Bento de Oliveira Junior, Débora Tavares de Lima e Ronaldo Júnio Oliveira pela ajuda e companheirismo. A todos os professores do Departamento de Física pela qualidade de ensino proporcionada. À equipe que gerência o GridUNESP pela competência para manter tudo aquilo funcionando. Ao programa de pós-graduação em Biofísica Molecular, que não me negou ajuda/auxilio/equipamento quando precisei. Ao Prof. Dr. Jorge Chahine pela paciência e pela ajuda na realização deste trabalho. Ao Prof. Dr. Vítor Barbanti Pereira Leite pela orientação, pela paciência e pela ajuda no amadurecimento e crescimento profissional. À CAPES pelo auxilio financeiro. À Deus. A todos que de forma ou de outra contribuíram com esse trabalho.

"The beauty of a living thing is not the atoms that go into it, but the way those atoms are put together"

Carl Sagan (1934 – 1996)

Resumo

No processo de enovelamento as proteínas seguem o principio de “mínima frustração”, garantindo ao estado nativo o seu mínimo global de energia e a sua estabilidade termodinâmica. Apesar de, a proteína estar no seu estado nativo, esta condição não impede o surgimento de algumas interações energeticamente desfavoráveis, caracterizando a frustração no estado nativo. Há evidências indicando que um pequeno grau de frustração pode favorecer o processo de enovelamento. Neste estudo são investigadas as condições em que a presença de frustração, é ou não, favorável ao processo de enovelamento. São realizadas simulações computacionais de dinâmica molecular utilizando o modelo Cα (um modelo baseado em estrutura e sem frustração). É adicionado um termo ao potencial do modelo associado à presença de frustração. As simulações do modelo Cα são realizadas para um grupo de proteína com características distintas. É introduzido um critério determinando os casos em que a frustração auxilia o processo de enovelamento. São observados os efeitos da presença de frustração ao longo do processo de enovelamento e sua influência na alteração da temperatura e do tempo de enovelamento. De acordo com o critério introduzido é possível separar as proteínas estudadas em dois grupos distintos, um grupo em que a adição de frustração auxilia o processo de enovelamento e outro grupo em que a presença de frustração não é favorável. A separação das proteínas em dois grupos distintos está relacionada com a ordem de contato absoluta e com a barreira de energia livre de cada proteína.

Palavras-chave: enovelamento de proteínas, modelos baseados em estruturas, dinâmica molecular, frustração.

1

Abstract In the folding process the proteins follow the "minimal frustration" principle, which guarantees to the native state the minimum global energy and the thermodynamic stability. However, not even the native state can prevent the occurrence of some unfavorable interactions, characterizing the frustration in the native state. There are evidences that a low degree of frustration can favorable to the folding process. In this work it was investigated the conditions under which some frustration helps the protein folding process. Through computer simulations of molecular dynamics, using a structure-based model (non-frustrated model) and adding a parameterized nonspecific energetic frustration to the potential, were studied the kinetics and the thermodynamics properties of a large group of proteins. It is introduced a criterion to determine when the presence of frustration assists the folding process. The effects of the frustration addition are observed and its influence produces changes in the folding temperature and in the folding time. In agree with the adopted criterion, it was observed two well separated groups: one in which some frustration helps the folding process, and another in which frustration hinders it, determining when the presence of frustration is favorable. These results are correlated with the proteins absolute contact order parameter and free energy barrier.

Keywords: protein folding, structure-based models, molecular dynamics, frustration.

2

Sumário Resumo ............................................................................................................................ 1 Abstract ........................................................................................................................... 2 Sumário ........................................................................................................................... 3 Lista de Ilustrações ........................................................................................................... 4 Lista de Tabelas ................................................................................................................ 4 Introdução ....................................................................................................................... 5 Motivação e Objetivos ...................................................................................................... 8 Modelo Cα ....................................................................................................................... 9 Adição de frustração....................................................................................................... 10 Proteínas estudadas ....................................................................................................... 11 Detalhes das simulações ................................................................................................. 11 Resultados ..................................................................................................................... 13 Conclusões ..................................................................................................................... 23 Apêndice A – Ordem de Contato Absoluta - OCA ............................................................. 25 Apêndice B - O método dos múltiplos histogramas ......................................................... 25 Apêndice C – Complementação dos resultados ............................................................... 27 Referencias Bibliográficas ............................................................................................... 29

3

Lista de Ilustrações Figura 1 – A) Ilustração do processo de enovelamento de uma proteína ao longo da coordenada de reação ࡽ. B) – Representação da energia livre para temperatura de enovelamento ࢀࢌ em função da coordenadas de reação ࡽ. ࡽ࢚ evidencia a região de transição entre o estado desenovelado e o estado nativo. 7 Figura 2 - Representação do calor específico ࡯ࢂ em função da temperatura, o pico representa a temperatura 13 de enovelamento ࢀࢌ para a proteína CI2. Figura 3 - Representação do perfil de energia livre para a proteína CI2 em função da coordenada de reação ࡽ. 14 A curva é construída para a temperatura de enovelamento ࢀࢌ . Figura 4 - Representação do calor específico ࡯ࢂ em função da temperatura para diferentes valores de frustração. É representado o valor de cada temperatura no pico de cada curva, evidenciando a modificação no valor da temperatura de enovelamento quando é adicionada uma frustração ao sistema. 15 A - A proteína utilizada é a CI2. B – A proteína utilizada é a α3D. Figura 5 - A - Representação da temperatura de enovelamento ࢀࢌ para diferentes valores de frustração, os valores das temperaturas estão normalizados pelo valor da temperatura de enovelamento sem a adição de frustração ࢀ૙ࢌ . B - Representação do tempo de enovelamento ࣎ࢌ para diferentes valores de frustração, os valores dos tempos estão normalizados pelo valor do tempo de enovelamento sem a adição de frustração ࣎૙ࢌ . 17 Figura 6 - Representação do perfil de energia livre bidimensonal. Os eixos representam os tipos de contatos, Native Contacts - Contatos nativos formados, Topological Contacts - Contatos topológicos formados. A intensidade e tipo da cor esta relacionada com o valor da energia livre, destaque para o valor da barreira de energia. A – Perfil para proteína CI2 sem frustração. B – Perfil para a proteína CI2 na sua frustração ótima de 0.1. C – Perfil para a proteína α3D sem frustração (frustração ótima). D – Perfil par a proteína 18 α3D com uma frustração de 0.05, que não ajuda o processo de enovelamento. Figura 7 - Representação da formação média dos contatos não nativos ൏ ࡯࢚ ൐ em função da formação dos contatos nativos ࡽ. A – A figura mostra as curvas para a proteína CI2, na qual sua frustração ótima é 0.1. B – A figura mostra as curvas para a proteína α3D, onde a presença de frustração não ajuda o processo de enovelamento. 20 Figura 8 - Representação da relação entre a barreira de energia οࡲ e a ordem de contato absoluta ‫۽‬۱‫( ۯ‬ACO – Absolut Contact Order) para todas as proteínas. O valor da frustração ótima de cada proteína é apresentado pelas diferentes cores e formatos geométrico dos pontos. 21 ࢕࢖࢚ Figura 9 - Representação do produto οࡲ࢞ࡻ࡯࡭em função da frustração ótima ࣕࢌ de cada proteína. É encontrado em valor de correlação positiva de 0.95. 23 Figura 10 - Apresentação dos resultados de PCA, onde é possível observar a separação em dois grupos de proteínas pelo Fator 1 (Factor 1). Os círculos azuis representam o grupo de proteínas em que a adição de frustração não favorece o processo de enovelamento, os quadrados vermelhos representam o grupo de proteínas em que o valor da frustração ótima é maior que zero. 27 Figura 11 - Apresentação dos resultados pela análise de PLS. Os eixos apresentam os valores de frustração ótima de cada proteína, o valor previsto – Predicted e o valor medido – Measured. É construído um modelo que prediz a frustração ótima de cada proteína, a correlação obtida, entre os dados obtidos e os dados preditos pela análise, é positiva com valor de 0.96. 28

Lista de Tabelas

Tabela 1 - Detalhes sobre as proteínas estudadas e apresentação de alguns parâmetros utilizados nas simulações. 12 Tabela 2 - Apresentação dos resultados da barreira de energia livre οࡲ , da ordem de contato absoluta ࡻ࡯࡭ e ࢕࢖࢚ do valor de frustração ótima ࣕࢌ para as proteínas estudadas. Os dados estão ordenados em função do produto οࡲ࢞ࡻ࡯࡭, para que a relação com a frustração ótima seja mais nítida. 22

4

Introdução As proteínas são macromoléculas biológicas de grande importância para os seres vivos. Elas constituem a maior parte da massa celular seca e são responsáveis por inúmeras funções em meio fisiológico. A construção celular, a regulação de entrada e de saída de íons, o transporte e a recepção de sinais, são exemplos de funções realizadas pelas proteínas [1]. Verificada a importância dessas macromoléculas em diversos processos da maquinaria biológica, as proteínas se tornam o alvo de estudo deste trabalho. A proteína é um heteropolímero onde cada monômero é constituído por um resíduo de aminoácido. O aminoácido é formado por um carbono da cadeia principal, denominado carbono-alfa. Este carbono realiza quatro ligações covalentes; uma com um átomo de hidrogênio, outra com um grupo amina, outra com um grupo carboxila e outra com um grupo radical. O grupo radical diferencia todos os aminoácidos encontrados na natureza quanto à estrutura, tamanho da cadeia lateral, carga elétrica, hidrofobicidade, etc. Cada aminoácido é ligado ao seu vizinho por uma ligação covalente e as combinações dos diferentes aminoácidos formam todas as proteínas [2,3]. Existem quatro níveis de organização que descrevem estruturalmente as proteínas. A estrutura primária consiste na representação linear da sequência de aminoácidos. A estrutura secundária se refere às conformações locais da proteína, como hélice α e conformações β. A estrutura terciária representa o arranjo tridimensional de todos os átomos, caracterizando uma configuração global da proteína. A estrutura quaternária é o arranjo espacial do agrupamento de subunidades de uma proteína com mais de uma cadeia de aminoácidos [1,3]. Cada proteína possui uma sequência unidimensional particular de aminoácidos em sua formação. A informação presente na sequencia de aminoácidos determina a estrutura tridimensional e a função biológica, caracterizando assim, o estado nativo da proteína. O processo em que a cadeia linear de aminoácidos da proteína encontra seu estado nativo é chamado de enovelamento. O estudo do processo enovelamento é um grande desafio da ciência atual. Este estudo envolve cientistas de diversas áreas do conhecimento, evidenciando que compreender em detalhes os princípios que governam esse mecanismo não é algo trivial. Se uma sequência de aminoácidos for montada de forma aleatória, o resultado não será, necessariamente, uma proteína. O resultado dessa sequência de aminoácidos é denominado como um heteropolímero aleatório. O heteropolímero aleatório é incapaz de 5

satisfazer a maioria das suas interações energéticas simultaneamente e esta incapacidade recebe o nome de frustração. Desta forma, o heteropolímero é classificado como sendo frustrado, não possuindo uma estrutura tridimensional estável e não realizando qualquer função biológica. A aplicação da teoria de spin glass a uma cadeia de aminoácidos [4–7], mostra que, mesmo a proteína se encontrando no estado nativo, não há como ela impedir o surgimento de algumas interações energeticamente desfavoráveis [8,9]. Regiões atrativas e repulsivas estão próximas em uma cadeia curta de aminoácidos, caracterizando a existência de frustração no estado nativo da proteína [10]. Diferentemente de um heteropolímero aleatório, as proteínas minimizam a frustração ao longo do processo de enovelamento. A tentativa é satisfazer o maior número de interações energéticas simultaneamente. Isto garante ao estado nativo o mínimo global de energia e a estabilidade termodinâmica, seguindo o princípio de mínima frustração [4,7,10]. Apesar desta frustração no estado nativo ser mínima, as interações desfavoráveis não podem ser negligenciadas. A presença dessas interações possui influência direta na dinâmica do processo do enovelamento [11] e está associada à adaptações locais da proteína [9]. Na área de estudo de enovelamento de proteínas, o formalismo conhecido como energy landscape (relevo de superfície de energia) procura, de maneira simplificada, descrever o processo de enovelamento e os princípios gerais que governam este mecanismo [10,12–14]. As superfícies de energia são rugosas, devido às inúmeras interações entre os aminoácidos, e possuem topografia afunilada com um gradiente de energia direcionado para a região do estado nativo da proteína [10,12–16]. Para se acompanhar o processo de enovelamento ao longo da superfície de energia, faz-se necessária a utilização de uma coordenada de reação. A escolha da coordenada de reação é fundamental para uma boa abordagem ao problema estudado [17]. Neste caso, a coordenada escolhida é o parâmetro de ordem de enovelamento denominada ܳ. Esta coordenada é dada como a fração entre os contatos formados na estrutura nativa e mede, ao longo do processo de enovelamento, o grau de similaridade entre uma estrutura desenovelada e o estado nativo. Os valores de ܳ variam entre 0 e 1, onde 0 significa que a proteína esta totalmente desenovelada e 1 significa que a proteína esta no seu estado nativo. A coordenada de reação ܳ é baseada na topologia do estado nativo da proteína e descreve de maneira satisfatória o processo de enovelamento [18].

6

O mecanismo de enovelamento pode ser entendido como uma dinâmica ao longo da superfície de energia quando se acompanha a coordenada de reação ܳ. A formação do estado nativo é realizada pela passagem da proteína por estados intermediários parcialmente enovelados. Desta forma, a energia e a entropia do sistema serão dependentes desta coordenada de reação (figura 1A).

Figura 1 – A) Ilustração do processo de enovelamento de uma proteína ao longo da coordenada de reação ࡽ – adaptada de [12, 13]. B) – Representação da energia livre para temperatura de enovelamento ࢀࢌ em função da coordenadas de reação ࡽ. ࡽ࢚ evidencia a região de transição entre o estado desenovelado e o estado nativo.

A grande quantidade de estruturas desenoveladas implica a existência de um valor elevado para a entropia ܵሺܳሻ em função da coordenada de reação ܳ. Ao longo do processo de enovelamento, a proteína acessa alguns estados parcialmente enovelados até encontrar o estado nativo. Há uma diminuição no número de possíveis estruturas para valores crescentes de ܳ. Portanto, o valor da entropia é reduzido durante o processo de enovelamento. A análise energética do processo de enovelamento mostra que, com o aumento do grau de similaridade da proteína em relação ao estado nativo, os valores para energia ‫ܧ‬ሺܳሻ decaem, fazendo o processo de enovelamento energeticamente favorável. Existe uma competição entre a contribuição energética e a contribuição entrópica para o processo de enovelamento. Desta forma, com a análise termodinâmica, o valor para a energia livre ‫ܨ‬ሺܳሻ é calculado em função da coordenada de reação. ࡲሺࡽሻ ൌ ࡱሺࡽሻ െ ࢀࡿሺࡽሻ

I 7

De acordo com a equação I, o perfil de energia livre é construído em função da coordenada de reação ܳ. A curva de energia livre evidencia três características: o estado desenovelado, o estado enovelado e a barreira de energia que existe entre os dois estados (Figura 1B). A temperatura utilizada na equação e na construção da curva é a temperatura de enovelamento ܶ௙ . Nesta temperatura, a probabilidade da proteína se encontrar no estado desenovelado é a mesma probabilidade da proteína se encontrar no estado nativo.

Motivação e Objetivos A proteína se encontrando no seu estado nativo não impede o surgimento de algumas interações energeticamente desfavoráveis, caracterizando a mínima frustração no estado nativo [9]. Há conjecturas indicando que um pequeno grau de frustração pode favorecer o processo de enovelamento [11,19,20]. Outros resultados obtidos pelo grupo de pesquisa do Profº. Dr. Vitor B. P. Leite, indicam que, há algumas proteínas em que a presença de frustração não é favorável ao processo de enovelamento. Por meio de simulações computacionais de dinâmica molecular, utilizando um modelo simples baseado em estruturas (modelo não frustrado) e acrescentando um parâmetro variável associado à frustração, são estudadas as propriedades cinéticas e termodinâmicas do enovelamento para um grupo de proteínas com características distintas. O intuito é investigar o efeito da presença de frustração e as condições em que sua adição, é ou não, favorável ao processo de enovelamento. É procurado um critério estipulando os casos em que a adição da frustração auxilia no processo de enovelamento. Este critério esta associado ao valor da barreira de energia livre e à ordem de contato absoluta de cada proteína.

8

Modelo Cα Neste estudo são realizadas simulações de dinâmica molecular utilizando um modelo baseado em estrutura, em particular, o modelo Cα [21–26]. Este modelo se caracteriza por duas aproximações; a primeira se refere à cadeia polipeptídica onde serão considerados apenas os carbonos α dos resíduos de aminoácidos e a segunda aproximação se refere ao potencial de interação entre os carbonos α. Esse potencial é construído a partir da estrutura nativa da proteína. A informação necessária com as características da proteína é previamente conhecida por estruturas depositadas no PDB (Protein Data Bank) [27,28]. A estrutura retirada do banco de dados é chamada de estado nativo para a construção do modelo. Desta forma, o mínimo de energia é atribuído a esse estado. O potencial para uma conformação qualquer ߁ de uma proteína, com base na conformação nativa ߁଴ é dado por: ࢂሺࢣǡ ࢣ૙ ሻ  ൌ  ෍ ࣕ࢘ ሺ࢘ െ ࢘૙ ሻ૛ ࢈࢕࢔ࢊ࢙

൅  ෍ ࣕࣂ ሺࣂ െ ࣂ૙ ሻ૛ ࢇ࢔ࢍ࢒ࢋ࢙

൅

෍ ࢈ࢇࢉ࢑࢈࢕࢔ࢋ

൅ ෍ ࢉ࢕࢔࢚ࢇࢉ࢚࢙

૚ ࣕࣘ ൜ሾ૚ െ  ࢉ࢕࢙ሺࢶ െ  ࢶ૙ ሻሿ ൅  ൣ૚ െ  ࢉ࢕࢙൫૜ሺࢶ െ  ࢶ૙ ሻ൯൧ൠ ૛

ࣕ࡯ ൥૞ ቆ

ࢊ࢏࢐ ቇ ࢘࢏࢐

૚૛

૚૙

െ ૟ ቆ

ࢊ࢏࢐ ቇ ൩ ൅ ࢘࢏࢐

෍ ࢔࢕࢔ିࢉ࢕࢔࢚ࢇࢉ࢚࢙

ࣕࡺ࡯ ቆ

࣌ࡺ࡯ ቇ ࢘࢏࢐

II

૚૛

Na expressão do potencial do modelo Cα, o primeiro termo representa a ligação entre dois carbonos α adjacentes, formando um potencial harmônico, onde ‫ݎ‬଴ é a distancia entre dois carbonos α da conformação nativa ligados entre si. O segundo termo se refere ao potencial harmônico angular formado por três carbonos α consecutivos, onde ߠ଴ é o ângulo formado pelos resíduos i, i+1 e i+2 da conformação nativa. O terceiro termo contabiliza a torção realizada na cadeia, o termo utiliza quatro carbonos α em sequência, os três primeiros carbonos α formam um plano que possui um ângulo ߔ଴ com o plano formado entre três últimos carbonos α. O quarto termo representa a interação entre o carbono α i e o carbono α j que realizam um contato na estrutura nativa. Para esta informação é atribuído um potencial 10 – 12, onde o parâmetro ݀௜௝ é o valor da distancia entre estes carbonos que realizam um 9

contato nativo. O último termo é um potencial repulsivo utilizado para manter a distância máxima de aproximação entre os carbonos α, este termo é utilizado para todos os carbonos α que não possuem um contato nativo. O valor do parâmetro ߪே஼ é de 4Å, este valor caracteriza aproximadamente o volume ocupado por um carbono do modelo. As constantes ߳௥ , ߳ఏ , ߳థ , e ߳ே஼ utilizadas no potencial possuem valores de 100, 20, 1 e 1, respectivamente, todas em unidades de ߳஼ .

Adição de frustração Como visto anteriormente, o modelo Cα possui a informação sobre as interações de caráter nativo na sua formação. Todas as interações realizadas pelo modelo minimizam a energia potencial, levando a proteína para seu estado nativo. Neste modelo, as interações de caráter não-nativo não são quantificadas (pode-se dizer interações de frustração, o termo “não-nativo” é colocado conforme a literatura [8,9,11,19,20,26], significando que estas interações não são atribuídas com base na estrutura nativa da proteína, como faz o modelo Cα). Portanto, o modelo Cα é considerado como um modelo que não possui frustração [26]. A frustração está associada à impossibilidade do sistema em satisfazer todas as suas interações energéticas simultaneamente. Para o estudo sobre a influência da frustração no processo de enovelamento, um novo termo associado à frustração é adicionado ao potencial do modelo Cα: ૛

ࢂࢌ ሺ࢘ሻ ൌ  െࣕࢌ ࢋ࢞࢖ ൥െ

ഥ൯ ൫࢘࢏࢐ െ  ࢊ ࣌૛ࢌ



III

no qual ݀ҧ é a média das distancias dos contatos nativos, ߪ௙ = 1 Å e ߳௙ é o parâmetro de frustração em unidades de ߳஼ . Este termo adicionado ao modelo Cα procura introduzir as interações de caráter não nativo, ou seja, interações que competem com as interações nativas aumentando a rugosidade da superfície de energia [29]. Todos os átomos do modelo, que não realizam um contato nativo, interagem entre si, de acordo com este potencial atrativo, sendo que, ‫ݎ‬௜௝ é a distância entre carbono α i e o carbono α j. A tentativa é simular a incapacidade do sistema em satisfazer todas as suas interações simultaneamente. O parâmetro ߳௙ modula a intensidade de ação deste potencial associado à frustração. Este é o único parâmetro 10

modificado durante o estudo e possui valores entre 0.0 e 0.5. O objetivo desta variação é encontrar uma frustração que favoreça o processo de enovelamento [19]. O valor de ߳௙ que ௢௣௧

favorece o processo de enovelamento é denominado como a frustração ótima ߳௙

do sistema.

Este valor de frustração ótima é particular para cada proteína estudada. Os critérios utilizados para determinar se a frustração é ótima ou não serão discutidos na seção de resultados.

Proteínas estudadas Os detalhes sobre as proteínas utilizadas no estudo estão mostrados na tabela 1. Este grupo de proteínas foi selecionado com a intenção de se obter proteínas com características distintas [30–48]. As diferenças existentes entre o tamanho da cadeia de aminoácidos, a quantidade de contatos nativos, a ordem de contato absoluta (OCA – para detalhes ver apêndice A), são exemplos das diferenças entre as proteínas estudadas. Esta variedade entre os parâmetros auxilia no entendimento do efeito da presença de frustração no processo de enovelamento, independentemente da proteína observada.

Detalhes das simulações Neste estudo são realizadas simulações de dinâmica molecular do modelo Cα. Após a escolha da proteína, a informação sobre a sua estrutura é retirada do banco de dados. Com base nesta estrutura, é construído um mapa de contato, determinando quantos contatos nativos existem na proteína e quais são os resíduos envolvidos nos contatos. O pacote computacional utilizado para a construção do mapa é o CSU (Contact of Structural Units) [49]. Para o caso particular do modelo Cα, o número de contatos nativos formados será a coordenada de reação ܳ. Com a construção do mapa de contato e utilizando as ferramentas computacionais disponíveis online [25,49], é formado o arquivo de topologia utilizado na simulação da dinâmica molecular realizada com o pacote computacional GROMACS versão 4.5-4 [51–55]. Para o cálculo das quantidades termodinâmicas, são utilizados scripts para executar o algoritmo do método dos múltiplos histogramas - WHAM (The Weighted Histogram Analysis

11

Method) [55,56] (para detalhes ver apêndice B). As simulações foram realizadas utilizando os recursos computacionais do “Núcleo de computação científica da UNESP – Gridunesp” [58]. Tabela 1 - Detalhes sobre as proteínas estudadas e apresentação de alguns parâmetros utilizados nas simulações.

Nome

Resíduos

Contatos

Nome

Resíduos

Contatos

(PDB)

[OCA]

{തതതത ࢊଙଚ }(Å)

Estrutura

(PDB)

[OCA]

{തതതത ࢊଙଚ }(Å)

ACR

53

57

CI2

66

151

(1ARR)

[2.66]

{7.240}

(1CIS)

[10.71]

{7.060}

EnHD

54

111

CSPTm

66

166

(1ENH)

[6.80]

{8.081}

(1G6P)

[11.68]

{6.475}

α 3D

73

136

SH3

61

148

(2A3D)

[6.77]

{7.690}

(1FMK)

[11.30]

{7.078}

PtABD

60

102

HPr

85

214

(1BDC)

[5.20]

{7.670}

(1HDN)

[15.61]

{6.834}

HP36

36

56

ADA2h

81

172

(1VII)

[3.97]

{7.180}

(1PBA)

[11.85]

{7.400}

PtG

56

133

PtL

60

134

(2K0P)

[9.56]

{7.026}

(2PTL)

[10.87]

{6.957}

ACBD

86

182

Ubiquitin

76

182

(2ABD)

[11.76]

{7.087}

(1UBQ)

[11.40]

{7.318}

HHCC

104

244

αAIT

74

182

(1HRC)

[11.59]

{7.350}

(2AIT)

[14.33]

{6.593}

Estrutura

12

Resultados

A primeira etapa da apresentação dos resultados será dedicada ao detalhamento sobre o procedimento de obtenção e de análise dos dados. Desta forma, a simulação é realizada de maneira usual, sem a utilização do potencial de frustração no modelo Cα. Os resultados serão apresentados apenas para algumas proteínas, uma vez que o perfil das curvas obtidas é similar para as diferentes proteínas estudadas. As grandezas termodinâmicas são obtidas por meio das simulações de dinâmica molecular do modelo Cα e pela aplicação do algoritmo do WHAM aos dados gerados. A temperatura de enovelamento ܶ௙ , ou temperatura de transição, é determinada pela análise do calor específico ‫ܥ‬௏ . O maior valor da curva do calor específico determina qual é a temperatura de enovelamento da proteína simulada (figura 2).

Figura 2 - Representação do calor específico ࡯ࢂ em função da temperatura, o pico representa a temperatura de enovelamento ࢀࢌ para a proteína CI2.

Após a determinação da temperatura de enovelamento, é construído o perfil de energia livre para esta temperatura, com destaque para a barreira de energia existente entre o estado desenovelado e o estado nativo (figura 3). O valor da barreira de energia livre é uma característica particular de cada proteína. Para todas as proteínas estudadas essas curvas são obtidas e os valores da barreira de energia livre, entre outros dados, estão presentes na tabela 2. 13

Figura 3 - Representação do perfil de energia livre para a proteína CI2 em função da coordenada de reação ࡽ. A curva é construída para a temperatura de enovelamento ࢀࢌ .

A segunda etapa de apresentação dos resultados mostra o efeito da adição do potencial de frustração ao modelo Cα. O parâmetro de frustração ߳௙ é variado entre 0.0 e 0.5 em unidades de ߳஼ . Para cada alteração no parâmetro de frustração é realizada uma nova ௢௣௧

análise das grandezas termodinâmicas, visando determinar o valor da frustração ótima ߳௙

do sistema. O critério para determinar se a frustração é ótima ou não, é apresentado nesta etapa. O procedimento utilizado para a obtenção das grandezas é o mesmo empregado para o caso sem frustração. Pela análise do calor específico, a variação do parâmetro de frustração modificou o valor da temperatura de enovelamento (figura 4).

14

Figura 4 - Representação do calor específico ࡯ࢂ em função da temperatura para diferentes valores de frustração. É representado o valor de cada temperatura no pico de cada curva, evidenciando a modificação no valor da temperatura de enovelamento quando é adicionada uma frustração ao sistema. A - A proteína utilizada é a CI2. B – A proteína utilizada é a α3D.

A adição de frustração no processo de enovelamento ocasiona um deslocamento na curva do calor específico. Para o caso da proteína CI2 (figura 4 A), a presença de frustração é favorável ao processo de enovelamento. O deslocamento do calor específico aponta para um aumento no valor da temperatura de enovelamento conforme é adicionada a frustração. Há um valor de frustração em que a temperatura de enovelamento é máxima. Este valor é determinado como a frustração ótima da proteína. Para esta proteína em particular, o valor da frustração ótima é 0.1, os demais valores de frustração não são ideais para o processo de enovelamento. Desta forma, a proteína CI2 é classificada como uma proteína em que a presença de frustração auxilia o processo de enovelamento. O efeito da presença de frustração é diferente em cada proteína. Para a proteína α3D, a presença de frustração não é favorável ao processo de enovelamento. O deslocamento da sua curva de calor específico mostra que, com a adição de frustração, o valor da temperatura de enovelamento diminui. Desta forma, a estabilidade termodinâmica da proteína é comprometida. A frustração ótima para a proteína α3D é zero, caracterizando uma proteína em que a adição de frustração não favorece o processo de enovelamento. Este procedimento foi realizado para todas as proteínas estudadas. Os valores para a frustração ótima de cada proteína estão mostrados na tabela 2. Esta mudança no valor da temperatura de enovelamento pela presença de frustração no processo de enovelamento 15

também é analisada na figura 5 A. Também são mostrados os valores para as temperaturas em função do parâmetro de frustração. Para cada proteína apresentada, o valor máximo da temperatura de enovelamento caracteriza o valor da frustração ótima, sendo possível verificar a diferença da presença de frustração entre as proteínas estudadas. A grandeza cinética calculada é o tempo de enovelamento ߬௙ . Este tempo é calculado como a média dos tempos de 500 simulações, no qual é medido o tempo em que a proteína leva para sair de uma estrutura desenovelada e encontrar seu estado nativo. O valor para o tempo de enovelamento é característico de cada proteína e é calculado em função da adição de frustração (figura 5B). O valor do tempo de enovelamento diminui em função da adição de frustração para as proteínas em que a presença de frustração auxilia o enovelamento. Para as proteínas em que a adição de frustração não ajuda o enovelamento, o tempo de enovelamento aumenta conforme é adicionada a frustração. Desta forma, é estipulado um critério sobre a influência da frustração nas proteínas. O valor da frustração ótima é aquele que maximiza o valor da temperatura de enovelamento. Para as proteínas em que um pequeno valor de frustração não modifica a temperatura de enovelamento, o valor do tempo de enovelamento é considerado. Portanto, o menor tempo de enovelamento analisado juntamente com a maior temperatura, determina o valor da frustração ótima daquela proteína. A proteína PtL é um exemplo desta abordagem, o valor da sua frustração ótima é 0.1. Este critério é adotado com o intuito de priorizar a parte termodinâmica do processo de enovelamento. Desta forma, a maior temperatura de enovelamento, em função do parâmetro de frustração, determina a frustração ótima do sistema. De acordo com o critério adotado, é possível separar as proteínas em dois grupos distintos, um em que a presença de frustração ajuda o processo de enovelamento e outro em que a presença de frustração não é favorável. A alteração do tempo de enovelamento com a adição das interações de caráter não nativo, esta relacionada com a influência da frustração no valor da barreira de energia [11,20].

16

Figura 5 – A - Representação da temperatura de enovelamento ࢀࢌ para diferentes valores de frustração, os valores das temperaturas estão normalizados pelo valor da temperatura de enovelamento sem a adição de frustração ࢀ૙ࢌ . B Representação do tempo de enovelamento ࣎ࢌ para diferentes valores de frustração, os valores dos tempos estão normalizados pelo valor do tempo de enovelamento sem a adição de frustração ࣎૙ࢌ .

A terceira etapa da apresentação dos resultados faz uma análise da energia livre para os dois grupos de proteínas. O intuito é explicar o efeito da frustração na analise termodinâmica e cinética do processo de enovelamento. O perfil de energia livre é construído para diferentes proteínas e para diferentes valores do parâmetro de frustração. Além da coordenada de reação ܳ uma segunda coordenada é utilizada. Esta segunda coordenada, denominada ‫ܥ‬௧ , é determinada pela quantidade de contatos, sendo eles nativos ou não, presentes na região de atuação do potencial de frustração. A região de atuação do potencial de frustração está em torno do valor médio das distâncias entre os contatos nativos ݀ҧ. Portanto, a coordenada ‫ܥ‬௧ é denominada como “Contato topológico”, pois apenas a informação sobre a topologia do estado nativo da proteína é necessária para quantificar esta coordenada. Para a definição desta coordenada ‫ܥ‬௧ , não há a necessidade que exista alguma interação energética entre os contatos (estipulando os casos em que o valor do parâmetro de frustração ߳௙ é zero), se dois carbonos do modelo estão presentes na região estipulada é determinado um contato topológico. Com base nestas informações e utilizando o método do WHAM, é construído o perfil de energia livre bidimensional ‫ܨ‬ሺܳǡ ‫ܥ‬௧ ሻ (figura 6). A figura 6 A apresenta o perfil de energia livre sem a adição de frustração para a proteína CI2. Há uma barreira de energia entre o estado desenovelado e o estado enovelado, agora observado de forma bidimensional. De maneira similar, é construído o perfil de energia livre com a adição de frustração (figura 6 B). É utilizado o valor da frustração ótima para este perfil, evidenciando a diminuição do valor da barreira de energia com a presença de 17

frustração. Como o valor da barreira de energia é menor, isto sugere que ocorra uma diminuição no tempo de enovelamento, como é observado. É construído também o perfil de energia livre, sem e com frustração para a proteína α3D, uma proteína em que a adição de frustração não auxilia o processo de enovelamento. A figura 6 C, mostra o perfil de energia livre sem a presença de frustração. É observado um valor baixo para a barreira de energia, quando comparado com o valor da barreira da proteína CI2. Quando é adicionada a frustração, o valor desta barreira de energia aumenta, induzindo que o tempo de enovelamento aumente conforme cresce o valor da frustração, da forma como é observado na figura 5 B.

Figura 6 - Representação do perfil de energia livre bidimensonal. Os eixos representam os tipos de contatos, Native Contacts - Contatos nativos formados, Topological Contacts - Contatos topológicos formados. A intensidade e tipo da cor esta relacionada com o valor da energia livre, destaque para o valor da barreira de energia. A – Perfil para proteína CI2 sem frustração. B – Perfil para a proteína CI2 na sua frustração ótima de 0.1. C – Perfil para a proteína α3D sem frustração (frustração ótima). D – Perfil par a proteína α3D com uma frustração de 0.05, que não ajuda o processo de enovelamento. A barrra de cor esta em unidades de ‫ܶܭ‬.

18

A análise do perfil de energia livre sem e com a presença de frustração, para as duas proteínas diferentes, auxilia no entendimento sobre o efeito da frustração na analise cinética do enovelamento. A diminuição ou o aparecimento da barreira de energia esta associada com a presença e com a quantidade de contatos topológicos formados. Quando é analisada a formação média dos contatos topológicos ൏ ‫ܥ‬௧ ൐ ao longo do processo de enovelamento, é caracterizada a diferença do efeito de frustração nos diferentes grupos de proteínas (figura 7). A figura 7 A mostra a relação entre a média dos contatos topológicos formados em função do número de contatos nativos formados ao longo do enovelamento da proteína CI2. É observado um aumento na quantidade média de contatos não nativos formados conforme a proteína se enovela (aumento do valor da coordenada ܳ). O perfil da curva para o valor da frustração ótima igual a 0.1 mostra que, a formação média de contatos topológicos e a formação de contatos nativos ocorrem de forma cooperativa, levando a proteína diretamente ao seu estado nativo. Para os valores mais altos do parâmetro de frustração, há um ganho na formação dos contatos topológicos. A formação de um contato topológico pode aproximar dois resíduos que estão distantes, favorecendo uma possível formação de um contato nativo. Desta forma, o tempo de enovelamento se torna menor, mas isto não reflete, necessariamente, na melhora da estabilidade termodinâmica da proteína. De acordo com o critério adotado, a prioridade é a análise termodinâmica, ou seja, o maior valor da temperatura de enovelamento caracteriza a frustração ótima do sistema. A figura 7 B é construída para a proteína α3D, onde também é observado um aumento significativo de contatos topológicos. Para valores de frustração diferentes de zero, há uma formação em excesso desses contatos. Ao decorrer do processo de enovelamento, estes contatos topológicos são quebrados, para que a proteína encontre o estado nativo. Desta forma, a quantidade média de contatos topológicos diminui e a quantidade de contatos nativos aumenta. Devido a esta formação em excesso de contatos topológicos e a necessidade da quebra desses contatos, ocorre um aumento no tempo de enovelamento, como observado. Os resultados apresentados nas três primeiras etapas tinham como objetivo abordar os efeitos da presença de frustração em diferentes proteínas. Desta forma, é possível determinar um critério para se encontrar a frustração ótima de uma proteína, mostrar a influência da frustração na energia livre e como isto altera a cinética e a termodinâmica do processo de enovelamento.

19

Figura 7 – Representação da formação média dos contatos não nativos ൏ ࡯࢚ ൐ em função da formação dos contatos nativos ࡽ. A – A figura mostra as curvas para a proteína CI2, na qual sua frustração ótima é 0.1. B – A figura mostra as curvas para a proteína α3D, onde a presença de frustração não ajuda o processo de enovelamento.

A quarta etapa da apresentação dos resultados discute sobre as características presentes em cada proteína que determinam se a presença de frustração auxilia ou não no processo de enovelamento desta proteína. A tentativa é propor um limiar, separando as proteínas em dois grupos distintos, estimando sem a necessidade de simulações, quando que a frustração é favorável ou não. Ao longo do estudo, diversas propriedades das proteínas foram utilizadas para que um limiar fosse encontrado. Foi encontrado que, ao se observar a relação entre a barreira de energia livre e a ordem de contato absoluta, é possível distinguir os dois grupos das proteínas (figura 8). Um grupo de proteínas é aquele em que a presença de frustração não auxilia o processo de enovelamento (área azul – figura 8), este grupo é marcado pela baixa barreira de energia livre e pela baixa ordem de contato absoluta. O outro grupo é caracterizado pelos valores mais altos de barreira de energia e da ordem de contato absoluta. Para este grupo a presença de frustração é favorável ao processo de enovelamento, onde é observado valor da frustração ótima de cada proteína (área vermelha – figura 8). Quando é analisado o valor do produto entre a barreira de energia livre e a ordem de contato absoluta ο‫( ܣܥܱݔܨ‬quarta coluna – tabela 2), é possível observar que, para valores do produto até aproximadamente 5.0, a presença de frustração não favorece o processo de enovelamento (quinta coluna – tabela 2). Quando o valor do produto é maior que 16.0, a frustração ótima do sistema passa a ser diferente de zero. É apresentado este intervalo de

20

valores para o produto, separando os casos em que a presença de frustração não auxilia o processo de enovelamento e os casos em que a frustração é favorável. Com base nos valores da tabela 2, é construído um gráfico relacionando o valor do ௢௣௧

produto ο‫ ܣܥܱݔܨ‬com o valor da frustração ótima ߳௙

de cada proteína (figura 9). É obtida

uma correlação positiva de 0.95 entre as duas grandezas. Este alto valor de correlação mostra que, a combinação da barreira de energia livre com a ordem de contato absoluta pode ser utilizada como um critério para estimar a frustração ótima de cada proteína. Desta forma, é possível estipular em qual dos grupos a proteína pertence.

Figura 8 - Representação da relação entre a barreira de energia οࡲ e a ordem de contato absoluta ‫۽‬۱‫( ۯ‬ACO – Absolut Contact Order) para todas as proteínas. O valor da frustração ótima de cada proteína é apresentado pelas diferentes cores e formatos geométrico dos pontos.

21

Tabela 2 - Apresentação dos resultados da barreira de energia livre οࡲ , da ordem de contato absoluta ࡻ࡯࡭ e do valor de ࢕࢖࢚

frustração ótima ࣕࢌ

para as proteínas estudadas. Os dados estão ordenados em função do produto οࡲ࢞ࡻ࡯࡭, para que a

relação com a frustração ótima seja mais nítida.

*Resultados de colaboradores. ࢕࢖࢚

ࣕࢌ

Nome

ࡻ࡯࡭

οࡲ

οࡲ࢞ࡻ࡯࡭

ACR

2.66

0.00

0.00

0.00

HP36

3.97

0.00

0.00

0.00

PSBD*

4,75

0.00

0.00

0.00

α3 D

6.77

0.20

1.35

0.00

PtABD

5.20

0.35

1.82

0.00

EnHD

6.80

0.75

5.10

0.00

IM9*

9.80

1.70

16.66

0.05

ACBD

11.76

1.50

17.64

0.05

HHCC

11.59

1.90

22.02

0.05

PtL

10.87

2.50

22.17

0.10

PtG

9.56

3.50

33.46

0.10

ADA2h

11.85

3.00

35.55

0.10

CI2

10.71

3.75

40.16

0.10

SH3

11.30

3.90

44.07

0.10

Ubiquitin

11.40

4.00

45.60

0.05

CSPTm

11.68

4.90

57.23

0.20

HPr

15.61

4.90

76.49

0.15

αAIT

14.33

6.00

85.98

0.25

TWIg*

18.78

5.20

97.65

0.25

22

࢕࢖࢚

Figura 9 - Representação do produto οࡲ࢞ࡻ࡯࡭em função da frustração ótima ࣕࢌ

de cada proteína. É encontrado em valor

de correlação positiva de 0.95.

Conclusões

De acordo com os resultados apresentados, é possível observar o efeito da adição de frustração no processo de enovelamento. Seguindo o critério adotado, a frustração ótima de cada proteína é determinada. O aumento no valor da temperatura de enovelamento com a adição de frustração, para algumas proteínas, é um indicativo de que a presença de frustração favorece o processo de enovelamento. A diminuição do tempo de enovelamento com a presença de frustração reforça a existência de uma frustração ótima para cada proteína. Priorizando a análise termodinâmica, a frustração ótima de cada proteína é determinada. Para algumas proteínas a presença de atrapalha o processo de enovelamento e para outras proteínas a presença de frustração é favorável. Portanto, as proteínas são separadas em dois grupos distintos, um grupo em que a presença de frustração não auxilia o processo de enovelamento e outro grupo em que a presença de frustração é favorável. Desta forma, é observado o diferente efeito da frustração em cada grupo. 23

O valor da barreira de energia livre é alterado com a adição de frustração. Para o grupo em que a adição de frustração auxilia o processo de enovelamento o valor da barreira de energia livre é menor para a análise com a frustração ótima. Esta diminuição no valor da barreira de energia livre está associada com o aumento na formação de contatos topológicos que acarreta na formação de contatos nativos, atuando de forma cooperativa e levando a proteína para seu estado nativo. Para o grupo em que a adição de frustração não é favorável ao processo de enovelamento, o valor da barreira de energia livre aumenta conforme é adicionada a frustração. Este aumento está associado com a formação em excesso dos contatos topológicos, sendo necessária a quebra desses contatos formados para que a proteína enovele de forma correta. Com os critérios para se determinar a frustração ótima de cada proteína estabelecidos e os efeitos associados à presença de frustração determinados, é realizada uma separação das proteínas em seus respectivos grupos. A separação é realizada utilizando os parâmetros simples e características de cada proteína, no caso particular, foram utilizadas a ordem de contato absoluta e a barreira de energia livre. O produto destas grandezas está fortemente correlacionado com o valor da frustração ótima de cada proteína. Sendo que o máximo valor do produto para uma proteína em que a frustração não auxilia o processo de enovelamento é 5.1 e o mínimo valor do produto para uma proteína em que adição é favorável ao processo de enovelamento é de 16.66. Há um fator de ordem 3 de escala entre esta proteínas que estão na fronteira de separação entre os grupos. Com a análise de PCA e PLS realizada por colaboradores, é confirmada esta separação das proteínas e é mostrada a boa capacidade predição da frustração ótima do modelo apresentado.

24

Apêndice A – Ordem de Contato Absoluta - OCA

A grandeza conhecida como ordem de contato absoluta foi estabelecida como um parâmetro que reflete a importância das interações locais e não locais existentes na proteína. O valor desta grandeza é determinado pela soma da distância de separação na sequência entre dois resíduos de aminoácidos que realizam um contato. O resultado desta soma é dividido pela quantidade de contatos formados: ே಴

ͳ ෍ οܵ௜௝ ܱ‫ ܣܥ‬ൌ ܰ஼

IV

௜௝

onde ܰ஼ é o número de contatos e οܵ௜௝ é a distância de separação sequencial entre o resíduos i e j que realizam um contato. Quando esta grandeza é normalizada pela quantidade de resíduos da proteína, ela recebe o nome de ordem de contato relativa, este parâmetro possui uma grande correlação com valores das taxas de enovelamento [59]. Para a realização dos cálculos da ܱ‫ܣܥ‬, os algoritmos necessários estão disponíveis online [60], sendo que, o único parâmetro de entrada é o arquivo PDB contendo a estrutura da proteína.

Apêndice B - O método dos múltiplos histogramas

O método dos múltiplos histogramas (The Weighted Histogram Analysis Method – WHAM) consiste basicamente em utilizar dados de várias simulações para aumentar a informação sobre o sistema visando a obtenção das grandezas termodinâmicas do sistema estudado [55,56]. Para o estudo do enovelamento de proteínas, em particular, apenas uma simulação em uma temperatura ܶ não é suficiente para representar todo o conjunto de estados conformacionais ܹ do sistema. Desta forma, não existindo uma boa estatística para a realização dos cálculos da determinação da temperatura de transição e da energia livre. Neste caso, são realizadas várias simulações em diferentes condições, para que a amostragem do sistema seja melhor. Portanto, com a melhora na amostragem do sistema e utilizando o método do WHAM, é possível realizar o calculo das grandezas termodinâmicas. 25

Para um conjunto de N simulações, sendo a enésima contendo ‫ܥ‬௡ configurações para a temperatura ܶ݊ ൌ  ͳΤ݇஻ ߚ௡ , a densidade de estados é dada por: ߗ௡ ሺܹሻ ൌ ‫ܪ‬௡ ሺܹሻ݁‫݌ݔ‬ሺߚ௡ ‫ ܧ‬െ ݂௡ ሻ

V

onde ‫ܪ‬௡ ሺܹሻ é o histograma da coordenada ܹ e ݂௡ é a energia livre adimensional. Para um grupo de vários histogramas retirados de várias simulações em diferentes temperaturas, a densidade de estados real ߗሺܹሻ amostrada com relação à coordenada ܹ é a média ponderada da densidade obtida em cada simulação ߗ௡ ሺܹሻ:



ߗሺܹሻ ൌ ෍ ‫ݓ‬௡ ߗ௡ ሺܹሻ

VI

௡ୀଵ

Os pesos atribuídos ‫ݓ‬௡ são obtidos pela minimização do erro de cada histograma utilizado. A probabilidade de, o sistema assumir a configuração ܹ na temperatura ܶ, é dada por: σே ௡ୀଵ ‫ܪ‬௡ ሺܹሻ݁‫݌ݔ‬ሺߚ௡ ‫ܧ‬ሻ ܲሺܹሻ ൌ ே σ௡ୀଵ ‫ܥ‬௡ ሺܹሻ݁‫݌ݔ‬ሺߚ௡ ‫ ܧ‬െ ݂௡ ሻ

VII

O método é auto-consistente, onde valores arbitrários são atribuídos para a energia livre adimensional, sendo realizado um processo de interação até que se obtenha a convergência desejada. Com a probabilidade definida as grandezas termodinâmicas são calculadas, como por exemplo, a energia livre:

݁‫݌ݔ‬ሺെ݂௜ ሻ ൌ ෍ ܲሺܹሻ

VIII

26

Apêndice C – Complementação dos resultados

Os resultados obtidos no trabalho, gerados pelas simulações, apresentam o limiar de separação dos grupos em função da barreira de energia livre e da ordem de contato absoluta, estes resultados foram obtidos de forma empírica. Os resultados complementares provenientes da analise de PCA (Principal Component Analysis) (figura 10) e PLS (Partial Least Square) (figura 11), realizada por colaboradores, apresentam a separação das proteínas em dois grupos distintos e a relação do produto ο‫ ܣܥܱݔܨ‬com o valor da frustração ótima ௢௣௧

߳௙ . Estes resultados reforçam a existência do limiar de separação das proteínas em dois grupos distintos. É observado que a influência da frustração no processo de enovelamento, não está dependente de como esta frustração é adicionada ao modelo, uma vez que, a informação sobre a frustração ótima de cada proteína não é utilizada para as analises dos dados. Desta forma, apenas com as características estruturais e algumas simulações do modelo simples, é possível estimar a frustração de cada proteína.

Figura 10 - Apresentação dos resultados de PCA, onde é possível observar a separação em dois grupos de proteínas pelo Fator 1 (Factor 1). Os círculos azuis representam o grupo de proteínas em que a adição de frustração não favorece o processo de enovelamento, os quadrados vermelhos representam o grupo de proteínas em que o valor da frustração ótima é maior que zero.

27

Figura 11 - Apresentação dos resultados pela análise de PLS. Os eixos apresentam os valores de frustração ótima de cada proteína, o valor previsto – Predicted e o valor medido – Measured. É construído um modelo que prediz a frustração ótima de cada proteína, a correlação obtida, entre os dados obtidos e os dados preditos pela análise, é positiva com valor de 0.96.

Posteriormente foram realizadas, algumas simulações envolvendo as mesmas proteínas descritas nos resultados, mas com os códigos de PDB’s diferentes [61–64]. Os resultados obtidos são coerentes com os apresentados nos resultados. Os detalhes das proteínas utilizadas estão descritas na tabela 3.

࢕࢖࢚

ࣕࢌ

Nome

PDB

ࡻ࡯࡭

οࡲ

οࡲ࢞ࡻ࡯࡭

PtG

3GB1

9.14

2.00

18.28

0.10

CI2

1YPA

9.82

2.75

27.00

0.10

SH3

1SHG

10.75

3.60

38.70

0.15

CSPB

1CSP

11.00

3.75

41.25

0.15

28

Referencias Bibliográficas

[1]

D. Voet, J. G. Voet, e C. W. Pratt, Principles of biochemistry. J. Wiley & sons, 2008.

[2]

B. Alberts, A. Johnson, J. Lewis, M. Raff, K. Roberts, e P. Walter, Molecular Biology of the Cell, 4o ed. Artmed, 2004.

[3]

A. L. Lehninger, D. L. Nelson, e M. M. Cox, Lehninger principles of biochemistry. W.H. Freeman, 2005.

[4]

J. D. Bryngelson e P. G. Wolynes, “Spin glasses and the statistical mechanics of protein folding”, Proceedings of the National Academy of Sciences, vol. 84, no. 21, p. 7524 7528, nov. 1987.

[5]

J. D. Bryngelson e P. G. Wolynes, “Intermediates and barrier crossing in a random energy model (with applications to protein folding)”, The Journal of Physical Chemistry, vol. 93, no. 19, p. 6902-6915, 1989.

[6]

E. I. Shakhnovich e A. M. Gutin, “Formation of unique structure in polypeptide chains. Theoretical investigation with the aid of a replica approach”, Biophys. Chem., vol. 34, no. 3, p. 187-199, nov. 1989.

[7]

R. A. Goldstein, Z. A. Luthey-Schulten, e P. G. Wolynes, “Optimal protein-folding codes from spin-glass theory”, Proceedings of the National Academy of Sciences, vol. 89, no. 11, p. 4918 -4922, jun. 1992.

[8]

S. S. Plotkin e J. N. Onuchic, “Understanding protein folding with energy landscape theory. Part I: Basic concepts”, Q. Rev. Biophys., vol. 35, no. 2, p. 111-167, maio 2002.

[9]

D. U. Ferreiro, J. A. Hegler, E. A. Komives, e P. G. Wolynes, “Localizing frustration in native proteins and protein assemblies”, Proceedings of the National Academy of Sciences, vol. 104, no. 50, p. 19819 -19824, dez. 2007.

[10] H. Frauenfelder, S. Sligar, e P. Wolynes, “The energy landscapes and motions of proteins”, Science, vol. 254, no. 5038, p. 1598 -1603, dez. 1991. [11] C. Clementi e S. S. Plotkin, “The effects of nonnative interactions on protein folding rates: theory and simulation”, Protein Sci., vol. 13, no. 7, p. 1750-1766, jul. 2004. [12] J. D. Bryngelson, J. N. Onuchic, N. D. Socci, e P. G. Wolynes, “Funnels, pathways, and the energy landscape of protein folding: A synthesis”, Proteins: Structure, Function, and Bioinformatics, vol. 21, no. 3, p. 167-195, mar. 1995. [13] J. N. Onuchic, Z. Luthey-Schulten, e P. G. Wolynes, “Theory of protein folding: the energy landscape perspective”, Annu Rev Phys Chem, vol. 48, p. 545-600, 1997. 29

[14] P. E. Leopold, M. Montal, e J. N. Onuchic, “Protein folding funnels: a kinetic approach to the sequence-structure relationship.”, Proc Natl Acad Sci U S A, vol. 89, no. 18, p. 8721-8725, set. 1992. [15] J. Nelson Onuchic, H. Nymeyer, A. E. García, J. Chahine, e N. D. Socci, “The energy landscape theory of protein folding: Insights into folding mechanisms and scenarios”, in Advances in Protein Chemistry, vol. 53, Elsevier, 2000, p. 87-152. [16] P. G. Wolynes, J. N. Onuchic, e D. Thirumalai, “Navigating the Folding Routes”, Science, vol. 267, no. 5204, p. 1619-1620, mar. 1995. [17] H. A. Scheraga, M. Khalili, e A. Liwo, “Protein-Folding Dynamics: Overview of Molecular Simulation Techniques”, Annual Review of Physical Chemistry, vol. 58, no. 1, p. 57-83, 2007. [18] S. S. Cho, Y. Levy, e P. G. Wolynes, “P versus Q: Structural reaction coordinates capture protein folding on smooth landscapes”, Proc Natl Acad Sci U S A, vol. 103, no. 3, p. 586-591, jan. 2006. [19] S. S. Plotkin, “Speeding protein folding beyond the Gō model: How a little frustration sometimes helps”, Proteins, vol. 45, no. 4, p. 337-345, 2001. [20] R. J. Oliveira, P. C. Whitford, J. Chahine, J. Wang, J. N. Onuchic, e V. B. P. Leite, “The origin of nonmonotonic complex behavior and the effects of nonnative interactions on the diffusive properties of protein folding”, Biophys. J., vol. 99, no. 2, p. 600-608, jul. 2010. [21] H. Nymeyer, A. E. García, e J. N. Onuchic, “Folding funnels and frustration in offlattice minimalist protein landscapes”, Proceedings of the National Academy of Sciences, vol. 95, no. 11, p. 5921 -5928, maio 1998. [22] C. Clementi, H. Nymeyer, e J. N. Onuchic, “Topological and energetic factors: what determines the structural details of the transition state ensemble and ‘en-route’ intermediates for protein folding? An investigation for small globular proteins”, J. Mol. Biol, vol. 298, no. 5, p. 937-953, maio 2000. [23] N. Koga e S. Takada, “Roles of native topology and chain-length scaling in protein folding: a simulation study with a Go-like model”, J. Mol. Biol, vol. 313, no. 1, p. 171180, out. 2001. [24] L. L. Chavez, J. N. Onuchic, e C. Clementi, “Quantifying the Roughness on the Free Energy Landscape:  Entropic Bottlenecks and Protein Folding Rates”, J. Am. Chem. Soc., vol. 126, no. 27, p. 8426-8432, 2004.

30

[25] J. K. Noel, P. C. Whitford, K. Y. Sanbonmatsu, e J. N. Onuchic, “SMOG@ctbp: simplified deployment of structure-based models in GROMACS”, Nucleic Acids Research, vol. 38, no. Web Server, p. W657-W661, jun. 2010. [26] S. Gosavi, L. L. Chavez, P. A. Jennings, e J. N. Onuchic, “Topological frustration and the folding of interleukin-1 beta”, J. Mol. Biol, vol. 357, no. 3, p. 986-996, mar. 2006. [27] H. M. Berman, J. Westbrook, Z. Feng, G. Gilliland, T. N. Bhat, H. Weissig, I. N. Shindyalov, e P. E. Bourne, “The Protein Data Bank”, Nucleic Acids Research, vol. 28, no. 1, p. 235 -242, jan. 2000. [28] “RCSB PDB”. [Online]. Available: http://www.rcsb.org/pdb/home/home.do. [Accessed: 06-mar-2012]. [29] J.-E. Shea, J. N. Onuchic, e C. L. Brooks, “Energetic frustration and the nature of the transition state in protein folding”, The Journal of Chemical Physics, vol. 113, no. 17, p. 7663-7671, nov. 2000. [30] P. Osmark, P. Sørensen, e F. M. Poulsen, “Context dependence of protein secondary structure formation: the three-dimensional structure and stability of a hybrid between chymotrypsin inhibitor 2 and helix E from subtilisin Carlsberg”, Biochemistry, vol. 32, no. 41, p. 11007-11014, out. 1993. [31] P. Robustelli, A. Cavalli, e M. Vendruscolo, “Determination of Protein Structures in the Solid State from NMR Chemical Shifts”, Structure, vol. 16, p. 1764-1769, dez. 2008. [32] A. D. Kline, W. Braun, e K. Wüthrich, “Determination of the complete threedimensional structure of the alpha-amylase inhibitor tendamistat in aqueous solution by nuclear magnetic resonance and distance geometry”, J. Mol. Biol., vol. 204, no. 3, p. 675-724, dez. 1988. [33] Y. Harpaz, N. Elmasry, A. R. Fersht, e K. Henrick, “Direct observation of better hydration at the N terminus of an alpha-helix with glycine rather than alanine as the Ncap residue”, Proceedings of the National Academy of Sciences, vol. 91, no. 1, p. 311 315, jan. 1994. [34] G. W. Bushnell, G. V. Louie, e G. D. Brayer, “High-resolution three-dimensional structure of horse heart cytochrome c”, J. Mol. Biol., vol. 214, no. 2, p. 585-595, jul. 1990. [35] J. Kuszewski, A. M. Gronenborn, e G. M. Clore, “Improving the Packing and Accuracy of NMR Structures with a Pseudopotential for the Radius of Gyration”, J. Am. Chem. Soc., vol. 121, no. 10, p. 2337-2338, 1999.

31

[36] C. J. McKnight, P. T. Matsudaira, e P. S. Kim, “NMR structure of the 35-residue villin headpiece subdomain”, Nat. Struct. Biol., vol. 4, no. 3, p. 180-184, mar. 1997. [37] A. M. Bonvin, H. Vis, J. N. Breg, M. J. Burgering, R. Boelens, e R. Kaptein, “Nuclear magnetic resonance solution structure of the Arc repressor using relaxation matrix calculations”, J. Mol. Biol., vol. 236, no. 1, p. 328-341, fev. 1994. [38] W. Kremer, B. Schuler, S. Harrieder, M. Geyer, W. Gronwald, C. Welker, R. Jaenicke, e H. R. Kalbitzer, “Solution NMR structure of the cold-shock protein from the hyperthermophilic bacterium Thermotoga maritima”, Eur. J. Biochem., vol. 268, no. 9, p. 2527-2539, maio 2001. [39] S. T. Walsh, H. Cheng, J. W. Bryson, H. Roder, e W. F. DeGrado, “Solution structure and dynamics of a de novo designed three-helix bundle protein”, Proc. Natl. Acad. Sci. U.S.A., vol. 96, no. 10, p. 5486-5491, maio 1999. [40] N. D. Clarke, C. R. Kissinger, J. Desjarlais, G. L. Gilliland, e C. O. Pabo, “Structural studies of the engrailed homeodomain”, Protein Sci., vol. 3, no. 10, p. 1779-1787, out. 1994. [41] S. Vijay-Kumar, C. E. Bugg, e W. J. Cook, “Structure of ubiquitin refined at 1.8 A resolution”, J. Mol. Biol., vol. 194, no. 3, p. 531-544, abr. 1987. [42] N. A. J. van Nuland, I. W. Hangyi, R. C. van Schaik, H. J. C. Berendsen, W. F. van Gunsteren, R. M. Scheek, e G. T. Robillard, “The High-resolution Structure of the Histidine-containing Phosphocarrier Protein HPr from Escherichia coli Determined by Restrained Molecular Dynamics from Nuclear Magnetic Resonance Nuclear Overhauser Effect Data”, Journal of Molecular Biology, vol. 237, no. 5, p. 544-559, abr. 1994. [43] J. Vendrell, M. Billeter, G. Wider, F. X. Avilés, e K. Wüthrich, “The NMR structure of the activation domain isolated from porcine procarboxypeptidase B”, EMBO J., vol. 10, no. 1, p. 11-15, jan. 1991. [44] K. V. Andersen e F. M. Poulsen, “The three-dimensional structure of acyl-coenzyme A binding protein from bovine liver: structural refinement using heteronuclear multidimensional NMR spectroscopy”, J. Biomol. NMR, vol. 3, no. 3, p. 271-284, maio 1993. [45] M. Wikström, T. Drakenberg, S. Forsén, U. Sjöbring, e L. Björck, “Three-dimensional solution structure of an immunoglobulin light chain-binding domain of protein L. Comparison with the IgG-binding domains of protein G”, Biochemistry, vol. 33, no. 47, p. 14011-14017, nov. 1994.

32

[46] H. Gouda, H. Torigoe, A. Saito, M. Sato, Y. Arata, e I. Shimada, “Three-dimensional solution structure of the B domain of staphylococcal protein A: comparisons of the solution and crystal structures”, Biochemistry, vol. 31, no. 40, p. 9665-9672, out. 1992. [47] W. Xu, S. C. Harrison, e M. J. Eck, “Three-dimensional structure of the tyrosine kinase c-Src”, , Published online: 13 February 1997; | doi:10.1038/385595a0, vol. 385, no. 6617, p. 595-602, fev. 1997. [48] H. Schindelin, M. A. Marahiel, e U. Heinemann, “Universal nucleic acid-binding domain revealed by crystal structure of the B. subtilis major cold-shock protein”, , Published online: 08 July 1993; | doi:10.1038/364164a0, vol. 364, no. 6433, p. 164-168, jul. 1993. [49] V. Sobolev, A. Sorokine, J. Prilusky, E. E. Abola, e M. Edelman, “Automated analysis of interatomic contacts in proteins.”, Bioinformatics, vol. 15, no. 4, p. 327 -332, abr. 1999. [50] “SMOG@ctbp: Structure-based MOdels in Gromacs”. [Online]. Available: http://smog.ucsd.edu/. [Accessed: 07-mar-2012]. [51] “Gromacs - Gromacs”. [Online]. Available: http://www.gromacs.org/. [Accessed: 09mar-2012]. [52] H. J. C. Berendsen, D. van der Spoel, e R. van Drunen, “GROMACS: A messagepassing parallel molecular dynamics implementation”, Computer Physics Communications, vol. 91, no. 1-3, p. 43-56, set. 1995. [53] E. Lindahl, B. Hess, e D. van der Spoel, “GROMACS 3.0: a package for molecular simulation and trajectory analysis”, Journal of Molecular Modeling, vol. 7, no. 8, p. 306317, 2001. [54] D. Van Der Spoel, E. Lindahl, B. Hess, G. Groenhof, A. E. Mark, e H. J. C. Berendsen, “GROMACS: Fast, flexible, and free”, Journal of Computational Chemistry, vol. 26, no. 16, p. 1701-1718, dez. 2005. [55] B. Hess, C. Kutzner, D. van der Spoel, e E. Lindahl, “GROMACS 4: Algorithms for Highly Efficient, Load-Balanced, and Scalable Molecular Simulation”, J. Chem. Theory Comput., vol. 4, no. 3, p. 435-447, 2008. [56] S. Kumar, J. M. Rosenberg, D. Bouzida, R. H. Swendsen, e P. A. Kollman, “THE weighted histogram analysis method for freeǦenergy calculations on biomolecules. I. The method”, Journal of Computational Chemistry, vol. 13, no. 8, p. 1011-1021, out. 1992.

33

[57] S. Kumar, J. M. Rosenberg, D. Bouzida, R. H. Swendsen, e P. A. Kollman, “Multidimensional freeǦenergy calculations using the weighted histogram analysis method”, Journal of Computational Chemistry, vol. 16, no. 11, p. 1339-1350, nov. 1995. [58] “Núcleo de Computação Científica”. [Online]. Available: http://www.unesp.br/grid/index_cat3_areas.php. [Accessed: 09-mar-2012]. [59] K. W. Plaxco, K. T. Simons, e D. Baker, “Contact order, transition state placement and the refolding rates of single domain proteins”, Journal of Molecular Biology, vol. 277, no. 4, p. 985-994, abr. 1998. [60] “Calculate the Contact Order of Proteins: Baker Laboratory, Department of Biochemistry, University of Washington.” [Online]. Available: http://depts.washington.edu/bakerpg/contact_order/. [Accessed: 09-mar-2012]. [61] Y. Harpaz, N. Elmasry, A. R. Fersht, e K. Henrick, “Direct observation of better hydration at the N terminus of an alpha-helix with glycine rather than alanine as the Ncap residue”, Proc. Natl. Acad. Sci. U.S.A., vol. 91, no. 1, p. 311-315, jan. 1994. [62] J. Kuszewski, A. M. Gronenborn, e G. M. Clore, “Improving the Packing and Accuracy of NMR Structures with a Pseudopotential for the Radius of Gyration”, J. Am. Chem. Soc., vol. 121, no. 10, p. 2337-2338, 1999. [63] A. Musacchio, M. Noble, R. Pauptit, R. Wierenga, e M. Saraste, “Crystal structure of a Src-homology 3 (SH3) domain”, , Published online: 29 October 1992; | doi:10.1038/359851a0, vol. 359, no. 6398, p. 851-855, out. 1992. [64] H. Schindelin, M. A. Marahiel, e U. Heinemann, “Universal nucleic acid-binding domain revealed by crystal structure of the B. subtilis major cold-shock protein”, , Published online: 08 July 1993; | doi:10.1038/364164a0, vol. 364, no. 6433, p. 164-168, jul. 1993.

34

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.