云计算能为生物信息做什么?
生活随笔
收集整理的這篇文章主要介紹了
云计算能为生物信息做什么?
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
生信數(shù)據(jù)處理的特點是,第一階段,在預(yù)處理階段,比如測序數(shù)據(jù)比對至基因組序列時,需要較大的內(nèi)存容量(以人為例,需要100~200G內(nèi)存),目前的云計算服務(wù),幾乎都沒有提供100G內(nèi)存以上的套餐。第二階段,在預(yù)處理以后(reads數(shù)已經(jīng)轉(zhuǎn)變?yōu)楸磉_值、peak區(qū)間之類了),絕大部分的分析需要的算力很小,目前絕大部分云平臺提供的服務(wù)都滿足條件,甚至個人筆記本都可以搞定。所以,目前比較尷尬,對硬件有門檻,需要云平臺解決的步驟,國內(nèi)沒有適合的云服務(wù)套餐。這部分目前做的比較好,甚至已有壟斷趨勢的,是illumina自身的BaseSpace云平臺(硬件綁定啊,window綁ie牛不牛),但BaseSpace國內(nèi)普及度不高。而后續(xù)的分析部分,則又對云沒太大剛性需求,比較雞肋。如果研究的方向是細菌或真菌的群落結(jié)構(gòu),測序的是某個biomarker,比如真菌的ITS,一臺筆記本完全可以解決所有的問題。因為不需要組裝基因組,所以不需要大量的計算力。之前OTU clustering可能需要用到大型計算機,現(xiàn)在算法改進了,也不需要了。目前需要的云計算的主要功能就是存儲了吧,測序中心把數(shù)據(jù)存在學校的超算上,我們登錄了去取回來。不過因為數(shù)據(jù)比較大(~10G),我還是習慣在服務(wù)器上做數(shù)據(jù)過濾(quality control)。但是所有的事情個人電腦目前都可以完成。
總結(jié)
以上是生活随笔為你收集整理的云计算能为生物信息做什么?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 《我期待》歌词完整版,《我期待》这首歌是
- 下一篇: 企查查回应仝卓工作室:感谢帮忙“骂”上热