NAR | IMG/VR v4:在广泛的功能、分类学和生态学元数据框架内的未培养病毒基因组扩展数据库...
在廣泛的功能、分類學(xué)和生態(tài)學(xué)元數(shù)據(jù)框架內(nèi)的未培養(yǎng)病毒基因組擴(kuò)展數(shù)據(jù)庫
IMG/VR v4: an expanded database of uncultivated virus genomes within a framework of extensive functional, taxonomic, and ecological metadata
Article,Nucleic Acids Research,2023-01-06, [IF 19.16]
DOI:10.1093/nar/gkac1037
第一作者:Antonio Pedro Camargo(共通訊)
通訊作者:Nikos C Kyrpides, Simon Roux
主要單位:聯(lián)合基因組研究所,勞倫斯伯克利國家實(shí)驗(yàn)室,伯克利(DOE Joint Genome Institute, Lawrence Berkeley National Laboratory, Berkeley, CA 94720, USA DOE)
翻譯:周之超@UW-Madison
- 背景 -
病毒被廣泛認(rèn)為是所有微生物組的重要成員。宏基因組學(xué)實(shí)現(xiàn)了對(duì)全球病毒圈的大規(guī)模探索,逐步揭示了地球上病毒的廣泛基因組多樣性,并強(qiáng)調(diào)了病毒影響生物過程的各種方式。IMG/VR提供了從(宏)基因組獲得的最大的病毒序列集合,以及功能注釋和豐富的元數(shù)據(jù)(metadata)。一個(gè)網(wǎng)絡(luò)界面使用戶能夠根據(jù)基因組特征和/或序列相似性有效地瀏覽和搜索病毒。在這里,我們提出了IMG/VR的第四個(gè)版本,由超過1500萬個(gè)病毒基因組和基因組片段組成,與前一個(gè)版本相比,規(guī)模增加了≈6倍。這些病毒聚類為870萬個(gè)病毒操作分類單位,包括231408個(gè)至少有一個(gè)高質(zhì)量的代表。IMG/VR中的病毒序列現(xiàn)在使用一種新的檢測(cè)方法(geNomad)從基因組、元基因組和元轉(zhuǎn)錄組中系統(tǒng)地識(shí)別出來,IMG標(biāo)準(zhǔn)注釋還輔以使用CheckV的基因組質(zhì)量評(píng)估、反映最新分類標(biāo)準(zhǔn)的分類法和微生物宿主分類法的預(yù)測(cè)。IMG/VR v4可在https://img.jgi.doe.gov/vr,基礎(chǔ)數(shù)據(jù)可在https://genome.jgi.doe.gov/portal/IMG_VR 下載。
相比于2022年年初發(fā)表的V3(https://mp.weixin.qq.com/s/kytq3Ec35EUO_RMOn24Hzg ),2023年年初發(fā)表的IMG/VR V4有如下方面的提升:
1.病毒基因組和片段的數(shù)量達(dá)到1500萬個(gè),是以前的6倍。231408個(gè)vOTU至少有一個(gè)高質(zhì)量代表序列,比之前的數(shù)字11577提升了近20倍。
2.添加了豐富的元數(shù)據(jù),在用戶界面和下載頁面可以方便獲取。
3.發(fā)明了新的檢測(cè)方法geNomad。
- 討論(需要注意的方面) -
1.雖然在過去的幾年里,病毒序列預(yù)測(cè)工具的性能和準(zhǔn)確性有了很大的提高,但這些預(yù)測(cè)仍然不完善,特別是對(duì)于短序列和與其他類型的移動(dòng)遺傳元素(如質(zhì)粒)密切相關(guān)的病毒。由于不同類型的UViG分析可以容納不同程度的非病毒序列,而且為了使用戶能夠應(yīng)用他們自己喜歡的嚴(yán)格程度,IMG/VR v4現(xiàn)在將最有把握的預(yù)測(cè)歸入 "高信心 "類別,并提供與每個(gè)UViG相關(guān)的原始geNomad分?jǐn)?shù),以便進(jìn)一步細(xì)化。
2.目前的預(yù)測(cè)方法通常存在召回率(recall)低或準(zhǔn)確性(accuracy)低的問題。對(duì)于IMG/VR v4,選擇了一套保守的方法和截止點(diǎn),這應(yīng)該產(chǎn)生準(zhǔn)確的預(yù)測(cè),但只對(duì)少數(shù)的UViG產(chǎn)生預(yù)測(cè)。盡管如此,對(duì)這些宿主的預(yù)測(cè)應(yīng)謹(jǐn)慎解釋,不能將其視為確定的病毒-宿主關(guān)聯(lián)。
3.自2016年以來,IMG/VR通過提供來自廣泛環(huán)境和病毒類型的大量病毒基因組,成為病毒生態(tài)學(xué)領(lǐng)域的旗艦數(shù)據(jù)庫。這里介紹的新的IMG/VR v4版本擁有迄今為止最大的UViGs集合。
參考文獻(xiàn)
Antonio Pedro Camargo, Stephen Nayfach, I-Min A Chen, Krishnaveni Palaniappan, Anna Ratner, Ken Chu, Stephan J Ritter, T B K Reddy, Supratim Mukherjee, Frederik Schulz, Lee Call, Russell Y Neches, Tanja Woyke, Natalia N Ivanova, Emiley A Eloe-Fadrosh, Nikos C Kyrpides, Simon Roux, IMG/VR v4: an expanded database of uncultivated virus genomes within a framework of extensive functional, taxonomic, and ecological metadata, Nucleic Acids Research, Volume 51, Issue D1, 6 January 2023, Pages D733–D743, https://doi.org/10.1093/nar/gkac1037
- 作者簡(jiǎn)介 -
微生物組數(shù)據(jù)科學(xué)組
Nikos C. Kyrpides?
Ph.D
Kyrpides博士于2004年加入能源部聯(lián)合基因組研究所,領(lǐng)導(dǎo)基因組生物學(xué)項(xiàng)目和微生物基因組和元基因組的比較分析平臺(tái)(IMG)的開發(fā)。他在2010年成為元基因組學(xué)項(xiàng)目負(fù)責(zé)人,并從2011年起負(fù)責(zé)微生物基因組和元基因組的合并項(xiàng)目。在加入能源部聯(lián)合基因組研究所之前,Kyrpides博士在伊利諾伊州芝加哥的Integrated Genomics Inc.領(lǐng)導(dǎo)基因組分析和生物信息學(xué)核心的發(fā)展。他在伊利諾伊大學(xué)厄巴納-香檳分校和阿貢國家實(shí)驗(yàn)室跟隨Carl Woese進(jìn)行了博士后研究。Kyrpides博士的研究重點(diǎn)是微生物組研究,重點(diǎn)是微生物組數(shù)據(jù)科學(xué)。他的小組正在開發(fā)新的方法,以實(shí)現(xiàn)大規(guī)模的比較分析,以及大數(shù)據(jù)的挖掘和可視化。
https://jgi.doe.gov/our-science/scientists-jgi/nikos-kyrpides/
美國能源部聯(lián)合基因組研究所
Simon Roux
組長,Ph.D
Roux博士于2017年加入JGI,作為元基因組計(jì)劃的一部分領(lǐng)導(dǎo)病毒基因組學(xué)研究。他的職責(zé)包括開發(fā)新的計(jì)算工具來識(shí)別病毒序列,設(shè)計(jì)新的實(shí)驗(yàn)方法將病毒與它們的宿主聯(lián)系起來,與JGI用戶合作分析病毒數(shù)據(jù)集,并組織病毒生態(tài)基因組學(xué)領(lǐng)域的社區(qū)建設(shè)工作。對(duì)于這個(gè)角色,Roux博士可以依靠他在病毒生態(tài)學(xué)和病毒基因組學(xué)領(lǐng)域超過10年的專業(yè)知識(shí),他在那里參與了跨學(xué)科的合作研究,重點(diǎn)是發(fā)展微生物系統(tǒng)中病毒多樣性和病毒-宿主互動(dòng)的基礎(chǔ)知識(shí)。通過2021年能源部早期職業(yè)研究計(jì)劃,Roux博士在JGI建立了病毒基因組學(xué)小組,目前正在領(lǐng)導(dǎo)該小組進(jìn)一步探索土壤微生物群落中病毒-宿主動(dòng)態(tài)的生態(tài)和進(jìn)化驅(qū)動(dòng)因素。
https://jgi.doe.gov/our-science/scientists-jgi/simon-roux/
猜你喜歡
iMeta簡(jiǎn)介?高引文章?高顏值繪圖imageGP?網(wǎng)絡(luò)分析iNAP
iMeta網(wǎng)頁工具?代謝組MetOrigin?美吉云乳酸化預(yù)測(cè)DeepKla
iMeta綜述?腸菌菌群?植物菌群?口腔菌群?蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)
10000+:菌群分析?寶寶與貓狗?梅毒狂想曲?提DNA發(fā)Nature
系列教程:微生物組入門?Biostar?微生物組??宏基因組
專業(yè)技能:學(xué)術(shù)圖表?高分文章?生信寶典?不可或缺的人
一文讀懂:宏基因組?寄生蟲益處?進(jìn)化樹?必備技能:提問?搜索??Endnote
擴(kuò)增子分析:圖表解讀?分析流程?統(tǒng)計(jì)繪圖
16S功能預(yù)測(cè)???PICRUSt??FAPROTAX??Bugbase?Tax4Fun
生物科普:??腸道細(xì)菌?人體上的生命?生命大躍進(jìn)??細(xì)胞暗戰(zhàn)?人體奧秘??
寫在后面
為鼓勵(lì)讀者交流快速解決科研困難,我們建立了“宏基因組”討論群,己有國內(nèi)外6000+ 科研人員加入。請(qǐng)?zhí)砑又骶幬⑿舖eta-genomics帶你入群,務(wù)必備注“姓名-單位-研究方向-職稱/年級(jí)”。高級(jí)職稱請(qǐng)注明身份,另有海內(nèi)外微生物PI群供大佬合作交流。技術(shù)問題尋求幫助,首先閱讀《如何優(yōu)雅的提問》學(xué)習(xí)解決問題思路,仍未解決群內(nèi)討論,問題不私聊,幫助同行。
點(diǎn)擊閱讀原文,跳轉(zhuǎn)最新文章目錄閱讀
總結(jié)
以上是生活随笔為你收集整理的NAR | IMG/VR v4:在广泛的功能、分类学和生态学元数据框架内的未培养病毒基因组扩展数据库...的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Make PGP messages an
- 下一篇: 四国军棋之故意式迟钝