ROSETTA使用技巧随笔--蛋白蛋白对接
先寫簡略版,以后再詳細寫。
1. 對輸入結構進行預處理(refine)
$> relax.default.linuxgccrelease -in:file:s input_files/from_rcsb/1qys.pdb @flag_input_relax
flag_input_relax:
-nstruct 2 -relax:constrain_relax_to_start_coords -relax:ramp_constraints false -ex1 -ex2 -use_input_sc -flip_HNQ -no_optH false
2. local dock
執行局部對接之前應手動把受體和配體放到一個pdb文件中,用不同的鏈標注(例如A,B),相距~10A,并且要有口袋的先驗知識,把受體配體按照先驗知識對好朝向。
使用以下兩個option控制局部對接:
-partners A_B -dock_pert 3 8
當受體鏈和配體鏈同時有多條時,例如AB,LH,則相應的改變option:
-partners LH_AB
運行docking_protocol命令:
$> $ROSETTA3/main/source/bin/docking_protocol.linuxgccrelease @flag_local_docking
flag_local_docking (最好-nstruct設置在500及以上):
-in:file:s input_files/col_complex.pdb -in:file:native input_files/1v74.pdb -unboundrot input_files/col_complex.pdb -nstruct 500 -partners A_B -dock_pert 3 8 -ex1 -ex2aro -out:path:all output_files/local_dock -out:suffix _local_dock
3. 對得到的對接結果進行local refine
得到結果后,對結果進行relax前,先用docking_protocol的local refine對蛋白界面氨基酸進行優化
相對于local dock 的flag文件,local refine只有下面這兩個選項不同:
-docking_local_refine -use_input_sc
運行local refine命令:
$> $ROSETTA3/main/source/bin/docking_protocol.linuxgccrelease @flag_local_refine
flag_local_refine:
-in:file:s input_files/1v74.pdb -nstruct 1 -docking_local_refine -use_input_sc -ex1 -ex2aro -out:file:fullatom -out:path:all output_files -out:suffix _local_refine
運行完local refine后,就可以使用relax對對接結果進行優化處理了,命令如第一步使用relax預處理。
4. global dock
global dock適用于沒有蛋白相互作用的先驗知識,不知道結合位點,基本原理是對受體和配體均隨即取樣,相對于local dock來說,盲目性較大,運行時間也較長。
如下三個參數定義受體與配體的隨機取樣:
-spin -randomize1 -randomize2
-randomize1 表示對受體(蛋白1)進行隨機取樣,-randomize2 表示對配體(蛋白2)進行隨機取樣.
global dock的運行命令如下:
$> $ROSETTA3/main/source/bin/docking_protocol.linuxgccrelease @flag_global_docking
其中,flag_global_docking:
-in:file:s input_files/col_complex.pdb -in:file:native input_files/1v74.pdb -unboundrot input_files/col_complex.pdb -nstruct 1 -partners A_B -dock_pert 3 8 -spin -randomize1 -randomize2 -ex1 -ex2aro -out:path:all output_files -out:suffix _global_dock
相對于local dock,主要是上面提到的三個參數的變化,因global dock的隨機性較強,為達到收斂的效果,建議設置-nstruct 10000-100000。
5. Docking flexible proteins
之前提到的蛋白對接,蛋白的骨架都是固定的,對于柔性蛋白對接,rosetta采用的是使用centroid模式對受體和配體進行構象采樣,以受體或配體的構象集(ensemble)作為對接的輸入,至于蛋白的構象集,可以使用非限制性的relax來實現,因為relax本身就是一個對蛋白結構進行采樣(sample)程序。
首先,在做柔性對接前,我們要按以下格式分別準備受體及配體的構象列表,名詞為xxx_ensemblelist,這個列表類似于蛋白列表輸入:
xxx_ensemblelist:
input_files/COL_D_ensemble/COL_D_0001.pdb input_files/COL_D_ensemble/COL_D_0002.pdb input_files/COL_D_ensemble/COL_D_0003.pdb
分別準備好兩個列表后,使用-ensemble1 和-ensemble2 兩個參數,將pdb列表導入到程序中:
-ensemble1 COL_D_ensemblelist -ensemble2 IMM_D_ensemblelist
在運行dock之前,我們首先需要對兩蛋白集進行prepacking,此步用于對兩蛋白進行處理,方便下一步dock的進行:
$> $ROSETTA3/main/source/bin/docking_prepack_protocol.linuxgccrelease @flag_ensemble_prepack
flag_ensemble_prepack:
-in:file:s input_files/col_complex.pdb -in:file:native input_files/1v74.pdb -unboundrot input_files/col_complex.pdb -nstruct 1 -partners A_B -ensemble1 COL_D_ensemblelist -ensemble2 IMM_D_ensemblelist -ex1 -ex2aro -out:path:all output_files -out:suffix _ensemble_prepack
prepack運行完畢,xxx_ensemblelist會被重新編輯,更改后的格式如下:
input_files/COL_D_ensemble/COL_D_0001.pdb.ppk input_files/COL_D_ensemble/COL_D_0002.pdb.ppk input_files/COL_D_ensemble/COL_D_0003.pdb.ppk 0.77058 0 1.00377 -93.3588 -94.2715 -93.9065
prepack運行后,就可以執行柔性對接了,對接命令為:
$> $ROSETTA3/main/source/bin/docking_protocol.linuxgccrelease @flag_ensemble_docking
flag_ensemble_docking:
-in:file:s input_files/col_complex.pdb -in:file:native input_files/1v74.pdb -unboundrot input_files/col_complex.pdb -nstruct 1 -partners A_B -dock_pert 3 8 -ensemble1 COL_D_ensemblelist -ensemble2 IMM_D_ensemblelist -ex1 -ex2aro -out:path:all output_files -out:suffix _ensemble_dock
柔性對接的結果好壞取決于構象取樣的多少,同時,伴隨著構象數增多,程序運行時間也會變長,為保證效果,推薦-nstruct設置大于5000.
6. Symmetric docking
7. 對接結構分析
典型的對接結果的score.sc如下所示:
SEQUENCE: SCORE: total_score rms Fnat I_sc Irms cen_dock_ens_conf cen_rms conf_num1 conf_num2 conf_score dock_ens_conf1 dock_ens_conf2 dslf_ca_dih dslf_cs_ang dslf_ss_dih dslf_ss_dst fa_atr fa_dun fa_elec fa_pair fa_rep fa_sol hbond_bb_sc hbond_lr_bb hbond_sc hbond_sr_bb interchain_contact interchain_env interchain_pair interchain_vdw st_rmsd description SCORE: -202.141 13.143 0.061 -3.086 5.015 -1.004 14.583 1.000 1.000 -25.732 -93.359 -83.050 0.000 0.000 0.000 0.000 -326.487 12.899 -3.158 -8.467 8.982 139.078 -3.968 -4.390 -2.692 -13.937 -20.000 -23.791 -2.002 0.357 7.729 col_complex_ensemble_dock_0001
其中,我們在關注total_score的同時,應該更多的關注I_sc,這一項描述的是蛋白界面相互作用得分(interface score,-2~-10),而且I_sc僅限于體系內比較,對于不同體系的蛋白,I_sc沒有比較意義。
作者:丨o聽乄雨o丨
出處:http://www.cnblogs.com/wq242424/
本文版權歸作者和博客園共有,歡迎轉載,但未經作者同意必須保留此段聲明,且在文章頁面明顯位置給出原文連接,否則保留追究法律責任的權利。
總結
以上是生活随笔為你收集整理的ROSETTA使用技巧随笔--蛋白蛋白对接的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: R语言笔记完整版
- 下一篇: 如何讨富婆欢心核心指南