蛋白对接_JCIM | 金属蛋白分子对接程序哪家强?七种对接程序的基准测试
金屬蛋白復(fù)合物基準(zhǔn)測(cè)試數(shù)據(jù)集
在基于結(jié)構(gòu)的藥物設(shè)計(jì)研究領(lǐng)域,分子對(duì)接程序發(fā)揮了非常重要的作用。目前,已有超過(guò)70個(gè)對(duì)接程序可供使用。針對(duì)具體的研究體系,如何合理的選擇適合的對(duì)接程序是每個(gè)研究人員都要面臨的問(wèn)題。金屬蛋白幾乎占到了人類蛋白質(zhì)組的一半。Emel Timu?in課題組從PDBbind(2017)中獲得了含213個(gè)蛋白-配體復(fù)合物的非冗余金屬蛋白數(shù)據(jù)集(圖1)。然后針對(duì)7個(gè)可以免費(fèi)獲得的對(duì)接程序,在打分 (scoring)、排序(ranking),結(jié)合模式預(yù)測(cè)(posing)和篩選四方面對(duì)分子對(duì)接能力進(jìn)行了比較評(píng)估。
圖1. 金屬蛋白數(shù)據(jù)集構(gòu)建。(A)以蛋白只含有一個(gè)金屬,配體參與金屬配位(小于4?)來(lái)精制PDBbind(2017)數(shù)據(jù)集獲得了710個(gè)金屬蛋白-配體復(fù)合物(左),然后進(jìn)行聚類剔除冗余數(shù)據(jù)(右)。(B)非冗余的210個(gè)金屬蛋白根據(jù)分子功能進(jìn)行PANTHER分類的結(jié)果
圖片來(lái)源JCIM
七個(gè)對(duì)接程序的性能測(cè)試
研究人員首先對(duì)七個(gè)對(duì)接程序的打分和排序能力進(jìn)行了分析,如表1所示,這7種對(duì)接程序的打分和排序能力都很差。具體地,當(dāng)根據(jù)金屬類型分類分析時(shí)可發(fā)現(xiàn),Vina(r = 0.59),QVina(r = 0.57)和LeDock(r = 0.46)的對(duì)接打分與含Ca蛋白子集的親和力數(shù)據(jù)有較好的正相關(guān),而ADZn的打分對(duì)Zn蛋白子集的親和力數(shù)據(jù)有較好的相關(guān)性(表1),但沒(méi)有一個(gè)程序能夠成功地對(duì)Mg2+和Mn2+子集進(jìn)行打分或排序。緊接著,他們還專門(mén)針對(duì)同一蛋白與不同配體結(jié)合的情況進(jìn)行了打分和排序能力評(píng)估,測(cè)試用的數(shù)據(jù)集由217個(gè)碳酸酐酶組成。在這一數(shù)據(jù)集下,ADZn和LeDock,具有最好的打分能力(0.61和0.59),而AutoDock則是表現(xiàn)最差的程序。但這樣的測(cè)試數(shù)據(jù)集只含一種鋅蛋白,有明顯的偏向性,筆者認(rèn)為不具有太大參考價(jià)值。
圖2.?7個(gè)對(duì)接程序打分和排序性能比較
圖片來(lái)源JCIM
結(jié)合模式預(yù)測(cè)能力(即posing power)是指分子對(duì)接程序找到天然結(jié)合模式(即native state, 晶體結(jié)構(gòu)中的狀態(tài))的能力,一般用預(yù)測(cè)結(jié)構(gòu)與晶體結(jié)構(gòu)三維結(jié)構(gòu)重疊后計(jì)算RMSD值是否小于2?來(lái)判斷。如圖3所示,研究人員中從最佳打分(以打分排序)和最佳姿勢(shì)(以RMSD從小到大排序)兩個(gè)方面來(lái)評(píng)價(jià)該能力。基于最佳打分來(lái)評(píng)價(jià)時(shí)(圖3A),PLANTS和LeDock在所有對(duì)接程序中脫穎而出,對(duì)接結(jié)果中最低能(打分最高)構(gòu)象有51%能與晶體結(jié)構(gòu)吻合。其次是Vina和QVina,預(yù)測(cè)準(zhǔn)確度分別為43%和40%, AutoDock和ADzn則表現(xiàn)最差僅有20%左右正確玄。而基于最佳結(jié)合模式來(lái)評(píng)價(jià)時(shí)(圖3B),除Dock6外其它各類方法整體精度都或多或少有所提高。PLANTS(80%)和LeDock(77%)仍然是表現(xiàn)最好的兩個(gè)程序。而無(wú)論采用最低能量還是RMSD方法來(lái)評(píng)價(jià),AutoDock(48%)和ADZn(46%)的結(jié)合模式預(yù)測(cè)能力都是最差的。
圖3. 七個(gè)對(duì)接程序的結(jié)合模式預(yù)測(cè)能力。(A)最佳打分(最低能量)和(B)最佳結(jié)合模式(最低RMSD)的累積曲線。RMSD≤2?認(rèn)定為正確的預(yù)測(cè)
圖片來(lái)源JCIM
圖4.?7個(gè)對(duì)接程序篩選性能比較
圖片來(lái)源JCIM
隨后研究人員通過(guò)分析對(duì)于活性配體和非活性(誘餌,decoy)配體的各分子對(duì)接軟件的區(qū)分能力來(lái)評(píng)估篩選能力。如表4匯總了ROC曲線下面積(AUC)和富集因子(enrichment factors,?EF)的平均值,整體而言,針對(duì)每種金屬蛋白都是PLANTS的AUC值最高。
總結(jié)
Emel Timu?in課題組的研究人員選取了7個(gè)免費(fèi)學(xué)術(shù)分子對(duì)接軟件,針對(duì)一個(gè)非冗余金屬蛋白數(shù)據(jù)集(213個(gè)金屬蛋白),從打分、排序,結(jié)合模式預(yù)測(cè)和篩選能力四個(gè)方面進(jìn)行了全面的比較評(píng)估,研究人員最終提出了對(duì)于金屬蛋白分子對(duì)接軟件選用的一些見(jiàn)解。但是值得注意的是,配體參與金屬配位的對(duì)接是一個(gè)極為復(fù)雜的問(wèn)題。不同的金屬,配位情況又有很大差異,比如鋅離子存在4,5,6配位的可能,而大多金屬配位結(jié)構(gòu)都存在水分子參與配位的問(wèn)題。文章中配體原子與金屬例子以小于4?作為配位依據(jù)是很粗糙的,測(cè)試數(shù)據(jù)集中可能會(huì)引入根本不配位的情況。另一方面,僅從RMSD是否小于2來(lái)判斷預(yù)測(cè)的結(jié)合模式是否一致,通過(guò)距離金屬距離最近的三個(gè)原子是否和晶體中相同來(lái)判斷配位是否一致,這樣做法用于判斷金屬離子的配位其可行性是存在明顯不足的。所以筆者認(rèn)為,本文得到的結(jié)果有一定的參考價(jià)值,但是需要謹(jǐn)慎對(duì)待。不過(guò)考慮到目前對(duì)于小分子配體參與金屬配位的分子對(duì)接預(yù)測(cè)算法發(fā)展仍然處于初級(jí)階段,既沒(méi)有統(tǒng)一的測(cè)試集,又沒(méi)有成熟的評(píng)價(jià)方法,而原本針對(duì)非金屬蛋白的評(píng)價(jià)方法可供選擇但顯然是不夠的。相信,隨著廣大科研人員的不懈努力,未來(lái)該領(lǐng)域有更多新成果出來(lái)。
參考文獻(xiàn):
Süleyman Selim ??naro?lu and Emel Timu?in, Comparative Assessment of 7 Docking Programs on a Non-Redundant Metalloprotein Subset of the PDBbind Refined. 2019,?ASAP, https://doi.org/10.1021/acs.jcim.9b00346
往期文章精選
JMC | 200萬(wàn)化合物庫(kù)中虛擬篩選發(fā)現(xiàn)雙靶點(diǎn)高選擇性激酶抑制劑
JCIM | 虛擬篩選專刊約稿函 “New Trends in Virtual Screening”
Cell結(jié)構(gòu)生物學(xué)+計(jì)算模擬發(fā)現(xiàn)抗腫瘤靶點(diǎn)趨化因子受體-7別構(gòu)位點(diǎn)抑制劑
應(yīng)用高通量虛擬篩選加速先導(dǎo)化合物開(kāi)發(fā)(一):BTK研究案例
應(yīng)用高通量虛擬篩選加速先導(dǎo)化合物開(kāi)發(fā)(二):ROR γ t研究案例
應(yīng)用高通量虛擬篩選加速先導(dǎo)化合物開(kāi)發(fā)(三):HLA-DR研究案例
虛擬篩選研究案例-CCL18拮抗劑阻斷乳腺癌轉(zhuǎn)移
總結(jié)
以上是生活随笔為你收集整理的蛋白对接_JCIM | 金属蛋白分子对接程序哪家强?七种对接程序的基准测试的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Python学习笔记:安装python
- 下一篇: Python学习笔记:入门(2)