Tags

    Agrupamento dos Resultados

    Comments

    /groups/ensambledocking/search/index.rss?tag=hotlist/groups/ensambledocking/search/?tag=hotWhat’s HotHotListHot!?tag=hot0/groups/ensambledocking/sidebar/HotListNo items tagged with hot.hot/groups/ensambledocking/search/index.rss?sort=modifiedDate&kind=all&sortDirection=reverse&excludePages=wiki/welcomelist/groups/ensambledocking/search/?sort=modifiedDate&kind=all&sortDirection=reverse&excludePages=wiki/welcomeRecent ChangesRecentChangesListUpdates?sort=modifiedDate&kind=all&sortDirection=reverse&excludePages=wiki/welcome0/groups/ensambledocking/sidebar/RecentChangesListmodifiedDateallRecent ChangesRecentChangesListUpdateswiki/welcomeNo recent changes.reverse5search

    A última etapa será o tratamento dos resultados. Em nosso caso, estamos interessados em agrupar as estruturas geradas de acordo com o arranjo do seu sítio ativo. Para isso, utilizaremos outro programa parte do pacote AmberTools, o cpptraj, que tem por função o tratamento de trajetórias geradas por dinâmica molecular.

    O cpptraj é um programa extremamente versátil, capaz de gerar diversos tipos de análise para dinâmica molecular. Em nosso caso, vamos nos concentrar apenas em agrupar as estruturas geradas nas etapas anteriores, para encontrar arranjos espaciais diferentes dos resíduos do sítio ativo da enzima NS3.

    Para executar o cpptraj, precisaremos do arquivo de parâmetros/topologia (prmtop, o mesmo que temos usado em todas as simulações), os arquivos com as trajetórias (mdcrd, criados nas simulações da etapa de produção) e um arquivo de controle, o cpptraj.in, que criaremos agora, com o seguinte conteúdo:

    # Carregar a trajetória
    parm ../ns3.prmtop [prmtop]
    trajin ../ns3_prod_0-15ns.mdcrd parm [prmtop]
    trajin ../ns3_prod_15-30ns.mdcrd parm [prmtop]

    # coloca as moléculas de volta à caixa principal
    autoimage

    # Remove moléculas de água
    strip :WAT,Na+ outprefix strip nobox

    # Calcula RMSD da proteína para verificar a convergência
    # usando como referência o primeiro frame
    rmsd @C,CA,N out rmsd.dat time 0.1 mass first

    # Calcula RMSF - flutuações dos resíduos
    # Considera apenas a cadeia principal (backbone)
    atomicfluct out rmsf.dat @C,CA,N byres

    # Raio de giro
    radgyr out rog.dat time 0.1 mass nomad

    # Calcula os clusters
    cluster hieragglo clusters 5 averagelinkage \
    :32-37,77,78,92,93,116,170-176,191-196,202 \
    summary summary.log info info.log \
    cpopvtime popvtime.dat normframe time 0.1 \
    clusterout cluster \
    repout rep_cluster repfmt pdb

    As primeiras instruções são apenas para ilustrar um pouco o tipo de análise que o cpptraj pode fazer. O agrupamento das estruturas é feito pelo último comando: "cluster". Execute o cpptraj com o comando:

    $ cpptraj -i cpptraj.in
    O cpptraj mostrará algumas informações na tela, e logo terminará a análise gerando uma série de arquivos:
    • As estruturas separadas por clusters nos arquivos cluster.c*
    • Informações diversas sobre o andamento, nos arquivos *.log
    • Propriedades medidas para as estruturas nos arquivos *.dat
    Aproveite para analisar os resultados. Por exemplo, você pode visualizar a convergência do RMSD (Root Mean Square Deviation) com o tempo, com o comando:
    $ xmgrace rmsd.dat
    Que gerará um gráfico mostrando a evolução do RMSD como referência a primeira estrutura da trajetória. Você pode usar o comando xmgrace para visualizar os outros arquivos com extensão .dat.

    Quanto à separação em clusters, que é nosso interesse aqui, o arquivo summary.log traz um resumo dos resultados:
    #Cluster   Frames     Frac  AvgDist    Stdev Centroid AvgCDist
    0 179 0.597 1.590 0.243 230 1.865
    1 58 0.193 1.469 0.184 185 1.832
    2 50 0.167 1.482 0.238 60 1.817
    3 7 0.023 1.381 0.185 124 1.800
    4 6 0.020 1.468 0.133 118 1.930
    O que precisamos é uma estrutura representativa de cada um desses clusters. O cpptraj escolhe dentre as estruturas em cada um a que melhor representa o cluster, e escreve nos arquivos rep_cluster.c*.pdb. Esses arquivos servirão de entrada para os cálculos de docking na próxima etapa, e representam a flexibilidade dos resíduos em torno do sítio ativo da enzima.