AlphaFold2开源了,不是土豪也不会编程的你怎么蹭一波?
2020年,AlphaFold2在CASP14蛋白質結構預測關鍵評估大賽中奪得透明,其預測的大部分結構達到了空前的準確度,不僅與實驗方法不相上下,還遠超解析新蛋白質結構的其他方法。
經過2個月的審稿,AlphaFold論文發表于Nature雜志,詳述了其算法原理和訓練過程。
為了方便學術應用,AlphaFold代碼開源于Github:https://github.com/deepmind/alphafold 。每個人都可以下載安裝運行,目前已有1.7K STAR。
很貼心的是,AlphaFold提供了Docker版(用了Docker,媽媽再也不擔心我的軟件安裝了 - 基礎篇),直接就可以安裝運行。
安裝之前,我們先看看硬件需求。
硬盤 3T。Alpha fold訓練好的模型加數據庫下載下來是428 GB大小的文件,解壓后需要2.2T的空間。
CPU: 12個虛擬CPU (可理解為12個超線程)
內存:85 GB
GPU:1個Nvidia A100 GPU;NVIDIA A100 GPU擁有40gb的高速HBM2內存 ,6912個CUDA核心(大約7萬元)
倒也不是特別難配起來(尤其是跟這個比起來:50T內存?百萬機時?頭一次見這么耗費內存和機時的分析?),有需要的可以行動起來,虛擬篩選做起來。(當然如果要自己訓練模型,這計算能力估計是遠遠跟不上的)
如果這個配置目前也配不起來,怎么辦呢?
別著急。Science發表了一個性能接近AlphaFold2,但速度更快和所需計算資源更少的工具 RoseTTAFold,據說一臺游戲本就可以跑起來。
錢還是準確性的一個大問題
RoseTTAFold(名字有點長)可以在https://github.com/RosettaCommons/RoseTTAFold獲取,其安裝依賴于Conda環境。具體的硬件沒有說,只是提到一臺游戲本就可以跑起來。
一文掌握Conda軟件安裝:虛擬環境、軟件通道、加速solving、跨服務器遷移
那,不懂Docker,不懂Conda,沒錢買硬件,就干不了了嗎?
在線工具永遠是你的好朋友,就像推薦一款高顏值免費在線SCI繪圖工具~~~和這個在線Venn 網絡很漂亮!3分鐘帶你繪制!
RoseTTAFold作者也給我們提供了一個在線版,直接提交序列預測結構 (https://robetta.bakerlab.org/)。
注冊后,提交序列就可以分析了
很多人在排隊,過幾天再來吧!
?
參考資料:
https://science.sciencemag.org/content/early/2021/07/14/science.abj8754
https://science.sciencemag.org/content/373/6552/262
https://newsroom.uw.edu/news/accurate-protein-structure-prediction-now-accessible-all
往期精品(點擊圖片直達文字對應教程)
機器學習
后臺回復“生信寶典福利第一波”或點擊閱讀原文獲取教程合集
總結
以上是生活随笔為你收集整理的AlphaFold2开源了,不是土豪也不会编程的你怎么蹭一波?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【转】IAR与Keil两款开发工具区别
- 下一篇: NAR再版 | 人类长非编码RNA知识库