[量子计算]一种用于蛋白质计算的结构化学量子计算算法。(QUANTUM ALGORITHMS FOR STRUCTURAL MOLECULAR BIOLOGY)
摘要
RQuanTech開發(fā)了一種創(chuàng)新算法,可用于結(jié)構(gòu)分子生物學(xué)應(yīng)用。
介紹
數(shù)十億年來,進(jìn)化過程優(yōu)化了構(gòu)成天然蛋白質(zhì)的氨基酸序列,以滿足制造它們的生物體的需要。所以我們問:我們可以使用計(jì)算來設(shè)計(jì)適合我們生物醫(yī)學(xué)和工業(yè)需求的非天然蛋白質(zhì)嗎?
這個(gè)問題是組合優(yōu)化問題,因?yàn)榈鞍踪|(zhì)設(shè)計(jì)計(jì)算的輸出是一系列氨基酸。由于天然存在的蛋白質(zhì)的多樣性,用天然存在的蛋白質(zhì)開始蛋白質(zhì)設(shè)計(jì)計(jì)算然后對其進(jìn)行修飾以實(shí)現(xiàn)所需功能是可能且非常有用的。這些可以形式化為加權(quán)鏈中的問題。我們可以用不同的特征代表每個(gè)氨基酸,蛋白質(zhì)由構(gòu)成它的氨基酸字符串表示。代表蛋白質(zhì)的鏈被分成子鏈,確定每個(gè)子串的質(zhì)量,并將質(zhì)量列表與蛋白質(zhì)數(shù)據(jù)庫進(jìn)行比較。這種技術(shù)的挑戰(zhàn)之一是處理非常大的字符串,這些字符串可能有幾個(gè)可能的子串。選擇的子串?dāng)?shù)對于良好的結(jié)果至關(guān)重要。同樣重要的是用于比較這些字母的評分函數(shù),以找到最佳全局比對或兩個(gè)序列之間的最佳局部比對。不幸的是,要找到最能捕捉氨基酸類型之間相似性的評分函數(shù)的參數(shù)并不容易。這導(dǎo)致以取代矩陣的形式開發(fā)出許多類型的分?jǐn)?shù),以期產(chǎn)生具有生物學(xué)意義的序列比對。另外,當(dāng)要比較的兩種蛋白質(zhì)之間的相似性低時(shí),通常缺乏相應(yīng)序列比對的質(zhì)量。因此,序列比對技術(shù)通常是將蛋白質(zhì)分類為折疊或檢測同源性的差的方法,這兩者都是希望解決蛋白質(zhì)結(jié)構(gòu)預(yù)測問題的基本任務(wù)。已經(jīng)開發(fā)了許多方法來規(guī)避這些問題。
改進(jìn)這些方法的一種選擇涉及一次考慮多種氨基酸。這個(gè)想法導(dǎo)致了過去三十年來發(fā)展起來的“無對齊”方法的概念。序列比對方法以及最近的字符串內(nèi)核方法關(guān)鍵取決于評分或替換矩陣。那些取代矩陣基本上將氨基酸編碼為數(shù)值陣列,其中這些值來自參考比對(PAM和BLOSUM矩陣)的統(tǒng)計(jì)分析,或來自氨基酸的物理和化學(xué)性質(zhì)。雖然這些矩陣已經(jīng)用于折疊識別問題,但它們還沒有針對這樣的任務(wù)進(jìn)行優(yōu)化。已經(jīng)嘗試進(jìn)行這樣的優(yōu)化;然而,沒有一個(gè)超過了公認(rèn)的BLOSUM62矩陣。
在該領(lǐng)域可以實(shí)現(xiàn)的一個(gè)重要的潛在步驟是實(shí)現(xiàn)量子算法,其允許跳過上述生物計(jì)算方法中呈現(xiàn)的非多項(xiàng)式(NP)問題。
示例應(yīng)用
1在我們的提案(腳注)中,我們介紹了RQuanTech量子算法如何加速基于知識的統(tǒng)計(jì)力場的估計(jì)以及推導(dǎo)最終蛋白質(zhì)配置的成本函數(shù)。我們展示了幅度估計(jì)算法如何能夠大幅度減少高可信度估計(jì)結(jié)構(gòu)所需的步驟數(shù)。
對于蛋白質(zhì)結(jié)構(gòu)問題的建模,主要挑戰(zhàn)是樣本的潛在配置的指數(shù)數(shù)量。通常通過蒙特卡羅評估來搜索最佳配置。
量子計(jì)算承諾為各種任務(wù)提供算法加速,例如分解或優(yōu)化。
量子傅立葉算法與RQuanTech實(shí)現(xiàn)的Shor算法相結(jié)合,可以擴(kuò)展和推廣到函數(shù)優(yōu)化,幅度放大和估計(jì),積分,基于量子行走的元素清晰度方法,以及馬爾可夫鏈算法等。特別地,幅度估計(jì)算法可以提供接近二次加速度以估計(jì)期望值,并且因此提供對經(jīng)典地使用蒙特卡羅方法的問題的加速。
RQuanTech提出了如何將量子計(jì)算用于蛋白質(zhì)結(jié)構(gòu)問題建模的新視角。我們結(jié)合眾所周知的量子技術(shù),如振幅估計(jì)和蒙特卡羅量子算法與CABS粗粒蛋白模型。
蒙特卡羅方法論文的實(shí)施
正如我們在下圖中可以看到的那樣,本文提出了蒙特卡羅方法的實(shí)現(xiàn),如圖所示:
CABS模型的抽樣方案。藍(lán)色面板顯示蒙特卡羅(MC)迭代(循環(huán))的實(shí)現(xiàn)細(xì)節(jié)。橙色面板顯示可以在單個(gè)MC步驟中執(zhí)行的所有動(dòng)作。模擬被組織為一組嵌套循環(huán),其中s個(gè)MC步驟被組織成y個(gè)循環(huán),并且這些循環(huán)在退火循環(huán)中(a,y或s循環(huán)的數(shù)量可以由用戶控制) CABS-flex和CABS-dock獨(dú)立軟件包[72])。在橙色面板中,數(shù)字1到5表示可用的移動(dòng),與每個(gè)MC步驟中執(zhí)行移動(dòng)的嘗試次數(shù)一起顯示。得到的軌跡由在每個(gè)MC循環(huán)結(jié)束時(shí)保存的模擬快照組成。
RQUANTECH MONTECARLO實(shí)施
RQuanTech蒙特卡洛實(shí)施方式如下。
假設(shè)最優(yōu)結(jié)構(gòu)為P,P’是從k個(gè)樣本獲得的近似值。假設(shè)成本函數(shù)f(ST)的隨機(jī)變量以方差為界,即V [f(ST)] <λ2。那么估計(jì)P’是ε遠(yuǎn)離最優(yōu)的概率由切比雪夫的不等式確定
問題[| P’-P | ≥ε]≤λ2/kε2
因此,為了獲得恒定的成功概率,我們需要
k = O(λ2/ε2)
樣本估計(jì)加性誤差ε。量子算法的任務(wù)是改善從ε2到ε的ε依賴性,從而為給定誤差提供二次加速。
在我們提出量子算法之前,我們展示了如何將結(jié)構(gòu)值編碼為量子算法以及如何獲得與經(jīng)典算法相同的ε依賴性。然后,我們通過使用幅度估計(jì)的基本量子算法來顯示二次加速。
蒙特卡羅的量子算法
使用幅度估計(jì)量子蒙特卡羅。圖如下。 (算法方案)
(a)n + 1量子比特相位估計(jì)酉以F:= R(A?I2)表示,簡單旋轉(zhuǎn)酉,Z:= | I2n + 1> - 2 | 0 n + 1> <0 N + 1 |和V:= | I2n + 1> - 2I2n?| 1> <1 |。
(b)在任意狀態(tài)下可視化Q:= US,S = VUV和U = FZF?
| ψψ>在χ和V(χ)的范圍內(nèi)。首先, - S on |的動(dòng)作ψψ>沿V(χ)反射,得到中間-S | ψψ>。然后,-U作用于-S | ψψ>通過沿|χ>反射得到的狀態(tài)Q |χ>在| x>和|χ→超平面中逆時(shí)針旋轉(zhuǎn)了角度2θ。
(c)相位估計(jì)電路。這里,A通過在| x>中準(zhǔn)備疊加來編碼隨機(jī)性,而R將隨機(jī)變量編碼為ancilla量子比特的| 1>狀態(tài)。兩個(gè)步驟之后的輸出是多量子位狀態(tài)|χ>。然后通過調(diào)用相位估計(jì)來進(jìn)行幅度估計(jì),以在量子比特的寄存器中編碼旋轉(zhuǎn)角度θ,該量子比特的寄存器被測量以獲得估計(jì)^θ。
(d)由A(或等效G)制備的疊加是蛋白質(zhì)結(jié)構(gòu)變化的離散化。在這種情況下,R編碼成本函數(shù)。
在逆量子傅里葉變換之后,我們將獲得對蛋白質(zhì)結(jié)構(gòu)的最佳估計(jì)。
結(jié)論
我們已經(jīng)描述了用于蛋白質(zhì)結(jié)構(gòu)建模的量子算法。我們假設(shè)CABS的關(guān)鍵特征(其表示,力場和用于MC的運(yùn)動(dòng)的規(guī)模)是已知的,并且可以有效地準(zhǔn)備相應(yīng)的量子態(tài)。
此外,我們假設(shè)成本函數(shù)的有效可計(jì)算性。在這些假設(shè)下,我們展示了估計(jì)蛋白質(zhì)結(jié)構(gòu)所需樣本數(shù)量的二次加速,直到給定誤差:如果所需精度為ε,則經(jīng)典方法顯示樣本數(shù)量的1 /ε2依賴性,而RQuanTech量子算法顯示1 /ε依賴性。
進(jìn)一步的考慮因素
RQuanTech Quantum算法為與結(jié)構(gòu)生物學(xué)分子領(lǐng)域中經(jīng)常使用的組合算法相關(guān)的計(jì)算提供了顯著的加速。原則上,當(dāng)前的計(jì)算可以減少到更短的時(shí)間尺度,這將允許更多的結(jié)構(gòu)容量得到解決。
我們正在尋求與計(jì)算機(jī)輔助蛋白質(zhì)工程領(lǐng)域的最佳合作,以在實(shí)際環(huán)境中展示(試點(diǎn))方法學(xué)的相關(guān)性。
總結(jié)
以上是生活随笔為你收集整理的[量子计算]一种用于蛋白质计算的结构化学量子计算算法。(QUANTUM ALGORITHMS FOR STRUCTURAL MOLECULAR BIOLOGY)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 怎么留住好员工来实现企业优势
- 下一篇: 软件工程试题