怎么测定该蛋白质的三维结构?
生活随笔
收集整理的這篇文章主要介紹了
怎么测定该蛋白质的三维结构?
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
預測得方法有:(1)從頭預測法(Ab initio):通過分子力學和分子動力學的方法,根據物理化學的基本原理,不依賴已知結構的同源類似物的信息,直接從理論上預測蛋白質分子的空間結構。(2)穿針引線法(threading):不需要預測蛋白質的二級結構,在沒有同源蛋白的情況下,把未知蛋白的序列和已知的結構進行匹配,通過研究同已知線段序列的吻合度得到結構信息,找出幾種匹配最好的結構作為未知蛋白的預測結構,既直接預測三級結構。(3)同源建模法(homology modeling):基于蛋白質三級結構的保守性超過蛋白質序列的理論。蛋白質經過百萬年的演變,形成了各種家族,每一家族都具有相似的序列/結構/以及相關功能,蛋白質的序列的微小改變,其三維結構的改變也很小。蛋白質序列的同源性決定其三維結構的同源性,一個未知結構的蛋白質(目標蛋白)的三維結構可以通過與其同源性較高且結構已知的蛋白質分子(參考蛋白)進行預測。過程為:1.數據庫搜尋及選擇模板:swiss-prot/PDB/SCOP/CATH2.二重及多重序列比對:此步驟主要目的是得到同源蛋白質的結構排列,它關系著最終的模擬結構的準確性。3.保守其主鏈骨架的構建,變異區或環狀結構模擬及側鏈模擬4.能量最小化(energy minimization)最初的結構必須采用分子力學的能量最小化來修正不利的非共價觸碰及達到理想的鍵結幾何和能量最低的狀態。5.結構合理性評估:PROCHECK/AQUA/SQUID等方法評估結構是否符合一般的常規。最后就可以分析新模型與模板的結構和參考文獻所得的信息,例如突變數據,生物活性數據等進一步修正新結構,來增加其合理性及可用度。
除了樓上的方法,還可以通過X射線晶體學的方法來測定,現在已知的蛋白質結構有90%都是用這種方法測定出來的。這種方法可以通過測定蛋白質分子在晶體中電子密度的空間分布來解析蛋白質中所有原子的三維坐標。利用這種方法來進行蛋白質分子結構解析時,主要有分子置換法、同晶置換法和反常散射法三種方法。
樓上的說了很多,我說一下相關的軟件吧。與蛋白質結構相關的軟件有很多,主要分為以下幾類:三維結構圖形化顯示。較為流行的有PyMOL、Rasmol、MolMol等。三維結構解析。包括晶體結構解析、NMR結構解析和電鏡結構解析。著名的軟件包有CCP4和CNS等。結構預測:二級結構預測,如JPred等。三級結構預測,如3D-PSSM等。結構分析。這一類軟件數量龐大,功能不同,各有特色,以下列出其中較為常用的一些功能和對應軟件:查找相似結構或進行結構比較,如DALI;根據蛋白質三維結構,對其物理化學性質進行分析,如用于靜電勢分布分析的APBS;對蛋白質三維結構的實驗或理論模型進行檢查以發現可能錯誤,如PROCHECK和WHAT_CHECK;分子動力學模擬,如GROMACS;蛋白質-蛋白質或蛋白質-配基之間相互作用分析,如InterPreTS。更多軟件可以在ExPASy Proteomics tools上查找。
蛋白質結構的理論預測方法都是建立在氨基酸的一級結構決定高級結構的理論基礎上,大致分為以下三類。一.比較建模法(comparative modeling method)比較建模法是基于知識的蛋白質結構預測方法,又稱為同源結構預測,是根據大量已知的蛋白質三維結構來預測序列已知而結構未知的蛋白質結構。 按照目前的定義,若待模型構建蛋白質的序列與模板序列經比對(alignment)后的序列同源性(sequence identity)在40%(也有人認為在35%)以上,則它們的結構可能屬于同一家族,它們是同源蛋白(homology),可以用同源蛋白模型構建的方法預測其三維結構。因為它們可能是由同一種蛋白質分化而來,它們具有相似的空間結構,相同或相近的功能。因此,若知道了同源蛋白家族中某些蛋白質的結構,就可以預測其它一些序列已知而結構未知的同源蛋白的結構,可以用同源模型構建的方法預測未知蛋白質的三維結構。同源蛋白模型構建(模建)的步驟:1. 目標蛋白序列與目標序列的匹配:應用FASTA或BLAST搜索軟件,在PIR、SWISSPROT或GENEBANK等序列庫中按序列同源性挑選出一些同源性比較高的序列,然后把挑選出的序列與目標序列基序多重匹配,得到模板結構等價位點套的初始集合。2. 根據模板結構構建目標蛋白結構模型:在已確定的模板結構等價位點套的初始集合的基礎上,旋轉每一個模板的結構,使它們相互間的位置盡可能多地重疊在一起。不同兩個模板在空間中若復合一定的重疊距離標準,那它們相互之間的關系就是等價位點。許多這樣的等價位點構成了等價位點套。疊合結束后,即得到了同源蛋白的結構保守區(SCRs),以及相應的基架結構(framework)。模板結構匹配后,一般還要用得到的同源體的SCRs的第一條序列與目標序列匹配,挑選出目標序列上的高相擬區,定義為目標蛋白的SCRs。Homology、UQANTA/CHARM、COMPOSER、CONSENSUS、MODELLER和Collar extension等軟件和方法可以用于目標蛋白結構模型的構建。3. 對模建結構基序優化和評估:同源結構模建(預測)得到的蛋白質結構模型,通常含有一些不合理的原子間接觸,需要對模型進行分子力學和分子動力學優化,消除模型中不合理的接觸。另外,模型中有些鍵長、鍵角和二面角也有可能不合理,也需要檢查評估。PROCHECK和PROSA II等軟件常用于完成這類工作。二.反向折疊法反向折疊法是近年來發展起來的一種比較新的方法。它可以應用到沒有同源結構的情況中,且不需要預測二級結構,即直接預測三級結構,從而可以繞過現階段二級結構預測準確性不超過65%的限度,是一種有潛力的預測方法。反向折疊法的主要原理是把未知蛋白的序列和已知的結構進行匹配,找出一種或幾種匹配最好的結構作為未知蛋白質的預測結構。它的實現過程是總結出已知的獨立的蛋白質結構模式做為未知結構進行匹配的模板,然后用經過對現有的數據庫的學習總結出的可以區分正誤結構的平均勢函數(Mean Force Field),做為判別標準來選擇出最佳的匹配方式。這種方法的局限性在于它假設蛋白質折疊類型是有限的,所以只有未知蛋白質和已知蛋白質結構相像的時候,才有可能預測出未知的蛋白質結構。如未知蛋白質結構是現在還沒有出現的結構類型時,這種方法將不能被應用。三.從頭預測法從理論上說,從頭預測法是最為理想的蛋白質結構預測方法。它要求方法本身可以只根據蛋白質的氨基酸序列來預測蛋白質的二級結構和高級結構,但現在還不能完全得到這個要求。從頭預測可以細分為:1. 二級結構預測:首先從一級結構預測出二級結構,然后再把二級結構堆積成三維結構。由于目前對二級結構中氨基酸的中遠程相互作用不完全清楚,因此預測準確率一般在65%以下。如果具有多種蛋白質同源序列的三維結構,在多重序列匹配比較的情況下,預測的準確性可以達到88%以上。Barton和Sander等人發現,在一個蛋白質序列中總有約40%序列的預測可以有很好的可信度,其預測的準確性都在80%以上。這些區域都是一些二級結構序列比較保守的部分。這些結果給如何將現有二級結構預測結果應用到三維結構預測提供了有益的啟示。2. 超二級結構預測:實際上是局域的空間結構預測,主要應用人工神經網絡方法和向量投影方法,從蛋白質序列出發,直接預測蛋白質的超二級結構,觀察此段氨基酸序列是否能形成某一種模式的超二級結構。其中人工神經網絡方法預測的準確率在75%~82%,向量投影方法預測的準確率達到85%以上。3 結構類型(structure class)預測:該方法是預測未知結構蛋白質屬于何種類型,如全α類蛋白質(主要由α-螺旋組成)、全β類蛋白質(主要由β-折疊組成)、α/β類蛋白質(由α-螺旋和β-折疊交替排列)或α+β類蛋白質(由分開的α-螺旋和β-折疊組成,其中β-折疊一般為平行結構)。結構類型預測除能了解大概的蛋白質結構折疊情況外,對二級結構的預測也有幫助。方法主要有光譜數據預測、神經網絡預測和Mahalanobis距離預測等,后者的準確率較前兩者為高,可達94.7%。4. 三維結構預測:是蛋白質結構預測的最終目標。主要有兩個反向:(1)根據二級結構、結構類型和折疊類型預測的結果,結合結構間的立體化學性質、親疏水性質、氫鍵以及靜電相互作用,把可信度較高的二級結構進一步組裝,搭建出最后的蛋白質結構。由于該方法主要依賴于前面的預測結果,所以受到的限制很多。(2)不依賴二級結構預測的結果,直接預測三維結構。主要方法是有效收集構象空間和區分天然結構和錯誤結構。根據對天然蛋白質結構與功能分析建立起來的數據庫里的數據,可以預測一定氨基酸序列肽鏈空間結構和生物功能;反之也可以根據特定的生物功能,設計蛋白質的氨基酸序列和空間結構。通過基因重組等實驗可以直接考察分析結構與功能之間的關系;也可以通過分子動力學、分子熱力學等,根據能量最低、同一位置不能同時存在兩個原子等基本原則分析計算蛋白質分子的立體結構和生物功能。雖然這方面的工作尚在起步階段,但可預見將來能建立一套完整的理論來解釋結構與功能之間的關系.用以設計、預測蛋白質的結構和功能。
DNA通過轉錄和翻譯合成氨基酸序列,從氨基酸序列出發,運用適當的算法就可以預測蛋白質的結構。肽鏈上的氨基酸可以形成各種的二級結構,二級結構再折疊成三級結構,氨基酸具有疏水性和非疏水性,從而表現出不同的特性。其實本質上來說,氨基酸序列到蛋白質的形成就是化學鍵之間的相互作用。
除了樓上的方法,還可以通過X射線晶體學的方法來測定,現在已知的蛋白質結構有90%都是用這種方法測定出來的。這種方法可以通過測定蛋白質分子在晶體中電子密度的空間分布來解析蛋白質中所有原子的三維坐標。利用這種方法來進行蛋白質分子結構解析時,主要有分子置換法、同晶置換法和反常散射法三種方法。
樓上的說了很多,我說一下相關的軟件吧。與蛋白質結構相關的軟件有很多,主要分為以下幾類:三維結構圖形化顯示。較為流行的有PyMOL、Rasmol、MolMol等。三維結構解析。包括晶體結構解析、NMR結構解析和電鏡結構解析。著名的軟件包有CCP4和CNS等。結構預測:二級結構預測,如JPred等。三級結構預測,如3D-PSSM等。結構分析。這一類軟件數量龐大,功能不同,各有特色,以下列出其中較為常用的一些功能和對應軟件:查找相似結構或進行結構比較,如DALI;根據蛋白質三維結構,對其物理化學性質進行分析,如用于靜電勢分布分析的APBS;對蛋白質三維結構的實驗或理論模型進行檢查以發現可能錯誤,如PROCHECK和WHAT_CHECK;分子動力學模擬,如GROMACS;蛋白質-蛋白質或蛋白質-配基之間相互作用分析,如InterPreTS。更多軟件可以在ExPASy Proteomics tools上查找。
蛋白質結構的理論預測方法都是建立在氨基酸的一級結構決定高級結構的理論基礎上,大致分為以下三類。一.比較建模法(comparative modeling method)比較建模法是基于知識的蛋白質結構預測方法,又稱為同源結構預測,是根據大量已知的蛋白質三維結構來預測序列已知而結構未知的蛋白質結構。 按照目前的定義,若待模型構建蛋白質的序列與模板序列經比對(alignment)后的序列同源性(sequence identity)在40%(也有人認為在35%)以上,則它們的結構可能屬于同一家族,它們是同源蛋白(homology),可以用同源蛋白模型構建的方法預測其三維結構。因為它們可能是由同一種蛋白質分化而來,它們具有相似的空間結構,相同或相近的功能。因此,若知道了同源蛋白家族中某些蛋白質的結構,就可以預測其它一些序列已知而結構未知的同源蛋白的結構,可以用同源模型構建的方法預測未知蛋白質的三維結構。同源蛋白模型構建(模建)的步驟:1. 目標蛋白序列與目標序列的匹配:應用FASTA或BLAST搜索軟件,在PIR、SWISSPROT或GENEBANK等序列庫中按序列同源性挑選出一些同源性比較高的序列,然后把挑選出的序列與目標序列基序多重匹配,得到模板結構等價位點套的初始集合。2. 根據模板結構構建目標蛋白結構模型:在已確定的模板結構等價位點套的初始集合的基礎上,旋轉每一個模板的結構,使它們相互間的位置盡可能多地重疊在一起。不同兩個模板在空間中若復合一定的重疊距離標準,那它們相互之間的關系就是等價位點。許多這樣的等價位點構成了等價位點套。疊合結束后,即得到了同源蛋白的結構保守區(SCRs),以及相應的基架結構(framework)。模板結構匹配后,一般還要用得到的同源體的SCRs的第一條序列與目標序列匹配,挑選出目標序列上的高相擬區,定義為目標蛋白的SCRs。Homology、UQANTA/CHARM、COMPOSER、CONSENSUS、MODELLER和Collar extension等軟件和方法可以用于目標蛋白結構模型的構建。3. 對模建結構基序優化和評估:同源結構模建(預測)得到的蛋白質結構模型,通常含有一些不合理的原子間接觸,需要對模型進行分子力學和分子動力學優化,消除模型中不合理的接觸。另外,模型中有些鍵長、鍵角和二面角也有可能不合理,也需要檢查評估。PROCHECK和PROSA II等軟件常用于完成這類工作。二.反向折疊法反向折疊法是近年來發展起來的一種比較新的方法。它可以應用到沒有同源結構的情況中,且不需要預測二級結構,即直接預測三級結構,從而可以繞過現階段二級結構預測準確性不超過65%的限度,是一種有潛力的預測方法。反向折疊法的主要原理是把未知蛋白的序列和已知的結構進行匹配,找出一種或幾種匹配最好的結構作為未知蛋白質的預測結構。它的實現過程是總結出已知的獨立的蛋白質結構模式做為未知結構進行匹配的模板,然后用經過對現有的數據庫的學習總結出的可以區分正誤結構的平均勢函數(Mean Force Field),做為判別標準來選擇出最佳的匹配方式。這種方法的局限性在于它假設蛋白質折疊類型是有限的,所以只有未知蛋白質和已知蛋白質結構相像的時候,才有可能預測出未知的蛋白質結構。如未知蛋白質結構是現在還沒有出現的結構類型時,這種方法將不能被應用。三.從頭預測法從理論上說,從頭預測法是最為理想的蛋白質結構預測方法。它要求方法本身可以只根據蛋白質的氨基酸序列來預測蛋白質的二級結構和高級結構,但現在還不能完全得到這個要求。從頭預測可以細分為:1. 二級結構預測:首先從一級結構預測出二級結構,然后再把二級結構堆積成三維結構。由于目前對二級結構中氨基酸的中遠程相互作用不完全清楚,因此預測準確率一般在65%以下。如果具有多種蛋白質同源序列的三維結構,在多重序列匹配比較的情況下,預測的準確性可以達到88%以上。Barton和Sander等人發現,在一個蛋白質序列中總有約40%序列的預測可以有很好的可信度,其預測的準確性都在80%以上。這些區域都是一些二級結構序列比較保守的部分。這些結果給如何將現有二級結構預測結果應用到三維結構預測提供了有益的啟示。2. 超二級結構預測:實際上是局域的空間結構預測,主要應用人工神經網絡方法和向量投影方法,從蛋白質序列出發,直接預測蛋白質的超二級結構,觀察此段氨基酸序列是否能形成某一種模式的超二級結構。其中人工神經網絡方法預測的準確率在75%~82%,向量投影方法預測的準確率達到85%以上。3 結構類型(structure class)預測:該方法是預測未知結構蛋白質屬于何種類型,如全α類蛋白質(主要由α-螺旋組成)、全β類蛋白質(主要由β-折疊組成)、α/β類蛋白質(由α-螺旋和β-折疊交替排列)或α+β類蛋白質(由分開的α-螺旋和β-折疊組成,其中β-折疊一般為平行結構)。結構類型預測除能了解大概的蛋白質結構折疊情況外,對二級結構的預測也有幫助。方法主要有光譜數據預測、神經網絡預測和Mahalanobis距離預測等,后者的準確率較前兩者為高,可達94.7%。4. 三維結構預測:是蛋白質結構預測的最終目標。主要有兩個反向:(1)根據二級結構、結構類型和折疊類型預測的結果,結合結構間的立體化學性質、親疏水性質、氫鍵以及靜電相互作用,把可信度較高的二級結構進一步組裝,搭建出最后的蛋白質結構。由于該方法主要依賴于前面的預測結果,所以受到的限制很多。(2)不依賴二級結構預測的結果,直接預測三維結構。主要方法是有效收集構象空間和區分天然結構和錯誤結構。根據對天然蛋白質結構與功能分析建立起來的數據庫里的數據,可以預測一定氨基酸序列肽鏈空間結構和生物功能;反之也可以根據特定的生物功能,設計蛋白質的氨基酸序列和空間結構。通過基因重組等實驗可以直接考察分析結構與功能之間的關系;也可以通過分子動力學、分子熱力學等,根據能量最低、同一位置不能同時存在兩個原子等基本原則分析計算蛋白質分子的立體結構和生物功能。雖然這方面的工作尚在起步階段,但可預見將來能建立一套完整的理論來解釋結構與功能之間的關系.用以設計、預測蛋白質的結構和功能。
DNA通過轉錄和翻譯合成氨基酸序列,從氨基酸序列出發,運用適當的算法就可以預測蛋白質的結構。肽鏈上的氨基酸可以形成各種的二級結構,二級結構再折疊成三級結構,氨基酸具有疏水性和非疏水性,從而表現出不同的特性。其實本質上來說,氨基酸序列到蛋白質的形成就是化學鍵之間的相互作用。
總結
以上是生活随笔為你收集整理的怎么测定该蛋白质的三维结构?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 这迪奥迪口红多少钱一支??
- 下一篇: 老玩家让iPhone 6S升级iOS 1