Tags

    Obtenção da Estrutura Inicial

    Comments

    /groups/ensambledocking/search/index.rss?tag=hotlist/groups/ensambledocking/search/?tag=hotWhat’s HotHotListHot!?tag=hot0/groups/ensambledocking/sidebar/HotListNo items tagged with hot.hot/groups/ensambledocking/search/index.rss?sort=modifiedDate&kind=all&sortDirection=reverse&excludePages=wiki/welcomelist/groups/ensambledocking/search/?sort=modifiedDate&kind=all&sortDirection=reverse&excludePages=wiki/welcomeRecent ChangesRecentChangesListUpdates?sort=modifiedDate&kind=all&sortDirection=reverse&excludePages=wiki/welcome0/groups/ensambledocking/sidebar/RecentChangesListmodifiedDateallRecent ChangesRecentChangesListUpdateswiki/welcomeNo recent changes.reverse5search

    Essa parte consiste de 3 etapas:

    1. Preparo da estrutura cristalina
    2. Complementação de resíduos não visíveis
    3. Restauração da unidade biológica
    Vamos discutir cada uma dessas etapas.

    Preparo da Estrutura Cristalina

    Vamos trabalhar com a enzima serine protease do vírus da dengue, a proteína "não estrutural 3", NS3. Essa enzima utiliza como cofator um trecho de outra proteína não estrutural codificada pelo vírus, a NS2b.

    Vamos começar com a estrutura obtida por difração de raios-x, disponível no PDB com o código 3U1I, aqui. Nessa página você encontrará detalhes sobre a estrutura, os autores, e o link para o artigo original. No lado direito da página há uma imagem da enzima e, se você clicar em "3D View", abrirá um visualizados que lhe permite manipular a estrutura. Note que unidade assimétrica existente é um dímero, contendo duas unidades biológicas completas do complexo NS3/NS2b (cadeias A/B, C/D) e, em cada unidade, está ligada covalentemente uma molécula do inibidor peptídico Bz-nKRR-H (Cadeias E e F). A estrutura contém também moléculas de água e íons fosfato. Para os cálculos de dinâmica precisaremos apenas das coordenadas de uma unidade da enzima, de forma que precisamos eliminar toda a informação extra.

    Por outro lado, é importante notar que a maioria das estruturas de raios-x não inclui átomos de hidrogênio, uma vez que sua densidade eletrônica é muito baixa para ser detectado no experimento. Além disso, unidades muito flexíveis também não são visíveis. Assim, será necessário adicionar essas informações ao arquivo pois a dinâmica molecular necessita das coordenadas de todos os átomos.

    Para começar, o que precisamos é dos arquivos com as coordenadas (.pdb) e a sequência (.fasta). Você encontrará no lado direito da página, acima da estrutura, o link "Download Files" e, ao clicar nesse link, aparecerá uma lista com os diversos arquivos associados à essa proteína. Faça o download dos arquivos "FASTA Sequence" e "PDB File", e coloque-os em um diretório local.

    Abra o arquivo PDB (3U1I.pdb) utilizando o editor de texto de sua preferência, e gaste alguns instantes observando a informação contida. Você encontrará informações sobre os autores, publicação, método utilizado, etc. Preste atenção especial para a existência do trecho "MISSING RESIDUES", que lista resíduos que não foram detectados no experimento. Vamos voltar à essa parte em instantes.

    Separação das Unidades

    Como vamos trabalhar apenas com uma unidade, é conveniente separar o arquivo nos seus constituintes. No processo, vamos também remover quaisquer informação extra desnecessária. A série de comandos abaixo utiliza a ferramenta awk para separar o arquivo em seus constituintes:

    $ awk '$1=="ATOM" {if ($5=="A") print}' 3U1I.pdb > ns3-A.pdb
    $ awk '$1=="ATOM" {if ($5=="B") print}' 3U1I.pdb > ns3-B.pdb
    $ awk '$1=="ATOM" {if ($5=="C") print}' 3U1I.pdb > ns3-C.pdb
    $ awk '$1=="ATOM" {if ($5=="D") print}' 3U1I.pdb > ns3-D.pdb
    $ awk '$1=="HETATM" {if ($5=="A") print}' 3U1I.pdb > ns3-A_HETATM.pdb
    $ awk '$1=="HETATM" {if ($5=="B") print}' 3U1I.pdb > ns3-B_HETATM.pdb
    $ awk '$1=="HETATM" {if ($5=="C") print}' 3U1I.pdb > ns3-C_HETATM.pdb
    $ awk '$1=="HETATM" {if ($5=="D") print}' 3U1I.pdb > ns3-D_HETATM.pdb
    $ awk '($1=="ATOM" || $1=="HETATM") {if ($5=="E") print}' 3U1I.pdb > ns3-E.pdb
    $ awk '($1=="ATOM" || $1=="HETATM") {if ($5=="F") print}' 3U1I.pdb > ns3-F.pdb

    Com esses comandos, voce deve ter criado arquivos pdb separados para cada cadeia. As cadeias A e C são o cofator, as cadeias B e D a NS3, e as cadeias E e F o inibidor. As unidades biológicas se agrupam como A/B/F e C/D/E. Além disso, moléculas de água e fosfato em cada cadeia foram também separadas nos arquivos "*-HETATM.pdb" e, caso necessário, poderemos recuperar essas informações facilmente.

    Complementação dos resíduos não visíveis

    Analise os resíduos faltando, segundo consta no trecho "REMARK 465 MISSING RESIDUES":
    Cadeia Resíduos Faltando
    A 45 a 49 90 a 95
    B -8 a -2 11 a 15 172 a 182
    C 45 a 49 90 a 95
    D -8 a 1 10 a 14 172 a 182
    E 1 a 3

    Note que as unidades dos cofatores (A e C) tem aproximadamente a mesma informação, e os resíduos faltando estão nas extremidades, que são naturalmente bastante móveis. Não precisaremos nos preocupar com esses trechos. Quanto à enzima (B e D), a estrutura na cadeia B é ligeiramente mais completa. A maior parte dos resíduos faltando é também nas extremidades, com as quais não precisaremos nos preocupar. No entanto, em ambos os casos, há um trecho de 5 resíduos que compõem um loop na estrutura, e precisa ser recomposto. Por fim, note que o inibidor na cadeia E está incompleto. Assim, vamos escolher usar a unidade biológica composta pelas cadeias A/B/F, e reconstruir o trecho 11-15 da NS3 (cadeia B).
    Há várias formas de reconstruir o trecho da cadeia, e vários programas comerciais e livres para isso. Vamos usar aqui um servidor online, o Swiss-Model, que e parte de um conjunto de ferramentas de livre acesso disponibilidades online pelo Instituto Suíço de Bioinformática. O Swiss-Model nos permite alinhar a sequência completa existente no arquivo FASTA com a estrutura no formato PDB, e reconstruir os resíduos que estiverem faltando. Ele preencherá o espaço vazio com a seqüência correta, e utilizará uma minimização de energia para ajustar os resíduos encaixados.

    Procedimento

    1. Edite o arquivo 3U1I.fasta para conter apenas a cadeia B.
    2. Abra a página do Swiss-Model aqui, e clique em "Start Modelling"
    3. No lado direito, sob "Supported Inputs", clique em "Upload Template"
    4. De volta ao lado esquerdo, em "Target Sequence", clique no no botão verde “Upload Target Sequence File”, e escolha o arquivo com a sequencia fasta da cadeia B;
    5. Em "Template File", clique no botão verde “Add Template File”, e escolha o arquivo PDB com a cadeia B;
    6. Clique no botão azul “Build model”. O processo de construção do modelo pode levar até alguns minutos;
    Quando o processo acabar, o modelo estará pronto, e você deve ver uma tela como a seguinte:
    Tire alguns instantes para examinar os resultados, e conferir se está tudo como esperado. Agora você já pode salvar o arquivo PDB gerado com o trecho completo. Para isso, aponte o mouse para o botão azul "Model 1" no lado esquerdo e, no menu que aparece, selecione "PDB File". (Em alguns sistemas, pode ser necessário clicar com o botão da direita e selecionar "Salvar arquivo como ...") Você pode dar o nome que desejar ao arquivo. Aqui, vamos nos referir a ele por ns3-B_SM-orig.pdb.

    Limpando o arquivo gerado pelo Swiss-Model

    O arquivo gerado ainda tem um problema: o Swiss-model trocou a cadeia de “B” para “A”, e incluiu uma série de comentários no arquivo. Antes de continuar, precisamos corrigir isso. Para restaurar a cadeia para “B”, dê o comando:
    $ sed 's/ A / B /g' ns3-B_SM-orig.pdb > temp.pdb
    Isso criará um arquivo temporário, temp.pdb, no qual a cadeia está com o c'digo correto (B), mas ainda possui os comentários. Vamos agora remover os comentários e colocar o arquivo final sobre o original:
    $ grep ATOM temp.pdb > ns3-B_model.pdb
    Finalmente, remova o arquivo temporário:
    $ rm temp.pdb

    Restauração da unidade Biológica

    Vamos agora unir as cadeias A e B novamente. Antes, vamos colocar uma terminação na cadeia A, adicionando uma linha no final do arquivo que contém apenas “TER”. O final do arquivo ns3-A.pdb deve ficar assim (o comando "tail" imprime apenas as últimas linhas do arquivo):
    $ tail -n 3 ns3-A.pdb 
    ATOM 308 OD1 ASP A 88 36.358 -30.531 -1.161 1.00 73.95 O
    ATOM 309 OD2 ASP A 88 34.647 -29.254 -0.547 1.00 70.83 O
    TER
    Agora, vamos juntar os arquivos:
    $ cat ns3-A.pdb ns3-B_model.pdb > ns3ns2b.pdb
    O novo arquivo criado, ns3ns2b.pdb, contém as duas cadeias (A e B). Para finalizar, acrescente no final do arquivo as duas linhas:
    TER
    END
    E o modelo inicial está pronto, no sentido em que temos agora um arquivo contendo todos os átomos com suas respectivas coordenadas. Agora vamos analisar esse modelo para ver que correções ele pode precisar.