内蒙古农大孙志宏教授证实超深度混合宏基因组测序能够对人类肠道微生物组中的低丰度物种进行基因组和功能表征...
導讀
人類腸道微生物群中已經發現了大量微生物基因組,但由于目前大多數研究中使用的測序深度相對較淺,在個體水平上了解低豐度物種的作用仍具有挑戰。為了提高基因組的組裝性能,本研究采用了Illumina HiSeq與Pacbio混合、超深度宏基因組測序的方法,從12份糞便樣品中重建了宏基因組組裝基因組。該方法結合了第二代測序以及第三代測序,提高了腸道中低豐度微生物的測序覆蓋率。我們共還原了44個Mb級別scaffolds以及4個完整的環狀基因組 (CMAG),代表了對應物種下的首個環狀基因組。此外,從所有樣品中共組裝出475個高質量的基因組,其中234個為未培養微生物的基因組,并且有24個不存在于任何一個公共數據庫中。值得注意的是,有287個和77個基因組分別為每個個體的低豐度和超低豐度的腸道物種。同時,我們的研究結果揭示了個體特異性的基因組特征,包括微生物基因組生長速率、選擇壓力以及染色體可移動遺傳元件的頻率。最終,從宏基因組數據中鑒定出數千個染色體外的可移動遺傳元件,包括5097個噬菌體和79個新的質粒基因組??偟膩碚f,本研究方法為從個體水平上對人類腸道微生物群進行更加全面的基因組分析和功能表征邁出了重要的一步。
論文ID
原名:Hybrid, ultra-deep metagenomic sequencing enables genomic and functional?characterization of low-abundance species in the human gut microbiome
譯名:超深度混合宏基因組測序能夠對人類腸道微生物組中的低豐度物種進行基因組和功能表征
期刊:Gut Microbes
IF:10.245
發表時間:2022.1.22
通訊作者:孫志宏
通訊作者單位:內蒙古農業大學乳品生物技術與工程教育部重點實驗室
DOI號:10.1080/19490976.2021.2021790
實驗設計
本實驗共收集了8名志愿者的12份糞便樣品,其中8份來源于4名志愿者間隔7天的兩次樣品。使用MagaZorb DNA迷你準備試劑盒進行糞樣的DNA提取,0.6% (w/v)瓊脂糖凝膠電泳檢測提取的DNA質量,Qubit2.0熒光儀測定DNA的數量。在12份糞便樣品中,8份采用高深度Illumina測序結合PacBio宏基因組測序,4份采用高深度Illumina測序,共產生了551 Gbp高質量Illumina HiSeq數據和70 Gbp PacBio宏基因組數據。然后對測序數據進行一系列的去宿主、質控、組裝、binning、聚類等還原基因組后,對基因組的相對豐度、質量、新型物種、SNP密度和pN/pS、基因組功能、染色體可移動遺傳元件以及染色體外的可移動遺傳元件進行了分析。
圖1?混合宏基因組組裝流程(原文中圖S4)。
前言
數以萬億計的微生物定植于人類結腸,代表著一個與人類共存的巨大有機體庫。在過去的20年里,大量研究揭示了腸道微生物群在宿主健康和疾病中的關鍵作用。種類繁多的腸道微生物存在對外源性和內源性基質的吸收和代謝至關重要,并可以通過多種方式塑造宿主的生理機能。在健康條件下,正常的微生物群分布在宿主可用的營養和宿主防御系統的不同生態位。因此,從個體的復雜微生物群落中探索其功能可以增強宿主與微生物之間相互作用的理解。
然而,我們發現人類腸道微生物受未培養物種比例高以及缺乏高質量參考基因組的限制,尤其是對于低豐度物種來說。宏基因組學提供了一種非培養的方式來探索這些未知的物種。大量新型宏基因組組裝基因組(MAGs)的發現不僅顯著提高了原始read的map可用率,而且有助于揭示功能宏基因組的潛能以及宏基因組特征與人類疾病之間的相關性。
先前的宏基因組測序研究表明,以前的宏基因組測序研究是基于大規模樣本進行的,但測序深度有限,大約每個樣本為5~10Gbp。這種測序深度對于低豐度物種來說是遠遠不夠的,并且會忽略許多重要的基因組信息。理論上來說,對于樣本中相對豐度為0.1%的物種,每個樣本5Gbp的測序深度只能提供有限的基因組覆蓋,這幾乎不可能進行精確和深入的比較宏基因組分析。事實上,一些對人類健康起著極其重要作用的腸道微生物可能只是以低豐度物種的形式存在。例如,乳酸菌在人類腸道中的含量還不足0.1%。因此,分析這些低豐度物種可以為理解腸道生態和腸道微生物群的功能提供新的見解。
長讀長測序的方法可以解決目前短讀長測序(如Illumina HiSeq)在宏基因組組裝方面面臨的許多問題。例如,長讀長測序可以覆蓋重復和低覆蓋度的區域,從而增加組裝的連續性。因此,長讀長的組裝已經引起人們極大的興趣,因為它能幫助我們更好地理解復雜的宏基因組群落(包括環境、瘤胃、皮膚和人類腸道中的微生物群落)。例如,使用納米孔(nanopore)測序平臺可以直接組裝出環狀,無間隙(gap)的基因組(CMAG)。單分子實時(SMRT)測序已被證明可以提高單基因組組裝的性能以及宏基因組組裝在宏基因組分析中識別宿主-質粒/病毒關聯的性能。長讀長測序促進了組裝高質量基因組的發展,但在個體水平上組裝所有微生物的基因組仍具有挑戰,這主要是因為目前大多數研究使用的測序深度相對較淺。這不僅限制了我們獲得腸道細致生態圖的能力,同時也阻礙了基于腸道微生物群的醫學發展。本研究采用了一種超深度混合測序的方法對8位成人的12份糞便樣本的基因組進行了重組,為了改善組裝質量,用不同宏基因組組裝方法對人類微生物組項目(HMP)模擬數據集進行組裝,并分別評估其組裝性能。研究結果表明,我們目前設計的混合測序組裝的方法在人類腸道微生物群中低豐度和超低豐度物種基因組和功能表征方面超過了現有的方法。
實驗結果
1?宏基因組測序與組裝方法
本研究對兩個數據集進行了深入分析,以表征采集的樣本中人類腸道微生物基因組的特征。第一個數據集包括了4名志愿者的8個樣本(每個人的兩個樣本之間間隔七天),對樣本進行HiSeq和PacBio測序(共生成274 Gbp數據;HiSeq 測序量為每個樣本34.2 ± 10.8 Gbp,PacBio測序量為每個樣本8.7 ± 3.7 Gbp;表S1a),第二個數據集包括了4名志愿者4個樣本的測序數據(共277 Gbp HiSeq測序數據,每個樣本69.3 ± 39.8 Gbp;表S1a)。
使用metaSPAdes組裝HiSeq數據,每個樣本的測序量為238 Mbp(表S1b),N50平均長度為38 Kbp。稀疏性分析表明,隨著測序深度的增加,組裝的scaffold總長和性能(N50和最大scaffold長度)也顯著升高。此外,組裝序列的大小也持續升高,直到其大小達到40 Gbp時(圖2a),N50和最大scaffold長度趨于平穩(圖2b,c)。對不同測序深度下scaffolds的占比進行了評估,發現測序深度達到10Gbp時,低豐度物種基因組片段的覆蓋率要高于5Gbp(圖2d),但并未顯著提高組裝性能(圖S1a-c)。
使用不同方法(metaSPAdes、Flye、hybrid-long)對測序數據進行組裝,相較于二代組裝(metaSPAdes),混合組裝的N50長度提升了2.5倍(平均長度2.0±0.4,范圍為1.2-2.5),且基因組總長增加了18.7%±18.9%,這表明基因組的捕獲能力顯著增強(表S1b-f,圖2e-g)。值得注意的是,僅通過混合組裝,scaffold的長度就可以達到1Mbp以上,其中有44個scaffolds達到了此長度,這是僅憑組裝二代測序數據無法實現的(圖2h)。此外,與僅基于HiSeq組裝的基因組相比,混合組裝方法揭示了更多低覆蓋的scaffolds(圖S1d)??偟膩碚f,深度Illumina測序數據與PacBio測序數據相結合的模式,不僅能夠改善基因的組裝質量和基因組覆蓋度,還能夠在挖掘更多低豐度物種的基礎上揭示被忽略的基因組特征。
圖2. 超深度混合測序的基因組組裝質量評估。稀疏性分析:(a)組裝總長,(b)N50長度,(c)最大scaffold長度與測序量之間的相關性。隨著測序深度的增加,組裝總長度增加,但其他組裝性能指標(如N50和最大scaffold長度)無明顯變化。圖(d)抽取5Gbp和10Gbp的數據量,對不同測序深度下scaffolds占比進行評估。(e-h)使用不同方法測試宏基因組的組裝性能,metaSPAdes(針對短讀長),Flye(針對長讀長)和hybrid-long (針對短讀和長讀長)。“hybrid-long”方法顯著提升了組裝的總長度(e)和組裝的連續性,表現在N50長度(f)和最大scaffold長度(g),產生了44個超過1Mbp的scaffolds(h)。數據以箱線圖表示(中線,中位數;框限,上和下四分位數;連接線,1.5×四分位數范圍;點,離群值;原文圖1)。
2 完整、環狀基因組(CMAG)
本研究中混合測序的一個重要成果就是得到了4個完整的(環狀、無gap)基因組(CMAG),分別為YA1_M7,YA2_M2,YA2_M3,以及YA2_M4,其中完整度最小為98.65%,污染率最大為1%。基于GC偏移和PacBio及Illumina?reads的測序深度對這些CMAGs進行了可視化(圖3)。短讀長無法跨越重復區域,而長讀長可以識別到這些區域并將鄰近基因片段之間的重疊部分連接起來,從單個scaffold中組裝出接近完整的基因組CMAG,基因組圖中展示了Illumina和PacBio的覆蓋度、GC偏移、編碼序列 (CDS) 以及tRNA和rRNA的分布。
將這些CMAG與最全面的人類腸道微生物基因組數據庫(UHGG)比較,共鑒定出4種同源物種(平均核苷酸相似度ANI: 97.3–98.4%),其中一種為分離株(例如,GUT_GENOME096210,?Faecalicatena gnavus),由數據集中的41個scaffolds組裝而成;其他三種完全是由平均49個scaffolds組裝而成。值得注意的是,這些CMAGs為UHGG中對應物種提供了第一個呈環狀、接近完整的基因組,并且包含了相應細菌最全面的基因組信息(rRNA、噬菌體;表S2)。相比之下,UHGG中的相應物種沒有完整的rRNA操縱子、噬菌體基因組以及重復區域的信息。CMAG不僅增加了基因組的完整性,并且揭示了先前未解決的基因組特征。
圖3. 4個完整的環狀基因組(CMAG)。這些 CMAGs分別為YA1_M7,YA2_M2,YA2_M3,YA2_M4,它們由PacBio和Illumina reads組裝而成,確保了高水平的堿基一致。長讀長(PacBio)的覆蓋度為757±792(范圍123-2106),短讀長(Illumina)的覆蓋度為3064±2960(范圍615-8098)。外環代表UHGG數據庫中對應物種的scaffold,基因組圖中展示了Illumina覆蓋度、PacBio覆蓋度、GC偏移、正(+)鏈和負(-)鏈的編碼序列(CDS)以及tRNA和rRNA的分布(原文圖2)。
3 微生物基因組組裝及其分類學地位
接著,對本數據集中的MAGs進行了組裝和物種注釋。使用MetaBAT2 binning后共得到了1,781個原始的bins(表S3)。我們共得到了475個完整度>80%,污染率<5%以及質量值>60的基因組草圖。這些基因組草圖包括了所有樣本中超過80%的Illumina reads;因此,它們能夠代表整體的宏基因組含量和腸道微生物群落。這些基因組草圖的平均大小為2.9 Mbp(范圍在1.3~7.4 Mbp之間),N50的平均長度為92 Kbp(范圍在5.4~3.7 Mbp之間;表S4),其中只有94個滿足MIMAG“高質量基因組”標準(完整度>90%,污染率<5%,有5S,16S和23S rRNA基因并且至少存在18個tRNAs;表S5)。絕大多數的高質量基因組(98%)都是通過混合組裝獲得的,由于無法解析rRNA操縱子區域,大多數僅由短讀長組裝的MAGs都沒有達到“高質量”水平。這些結果表明,混合宏基因組的方法可以顯著提高基因組的組裝質量以及有問題區域(如rRNA序列區域)的挖掘。
利用常規的宏基因組分析方法和混合超深測序宏基因組組裝的方法在當前數據集中恢復了整合腸道基因組數據庫(IGG)中不同相對豐度的基因組分布,基于二三代混合的組裝方法,基因組在個體間的相對豐度僅低于IGG數據庫約1%(圖4a)。IGG數據庫包括超過60,664個腸道基因組和其他環境中微生物基因組。一般宏基因組研究中MAGs的中等相對豐度約為1%,作為區分高豐度和低豐度類群的截斷水平。本研究共得到了111個高豐度(相對豐度>1%)和287個低豐度基因組(相對豐度0.1–1%),剩余77個基因組的相對豐度均小于0.1%,被認為是超低豐度的物種,在先前的研究中很少被發現。
為了進一步比較淺層測序中微生物物種挖掘的有效性,我們從5和10 Gbp樣本的數據集重建了MAGs,因為5和10 Gbp是大多數傳統宏基因組研究中使用的測序量(表S6)。對binning性能進行評估發現,相較于普通測序深度,深度混合測序極大提升了binning的效率,且普通測序產生的bins數量(bin大小>200 Kbp)明顯低于超深測序產生的bins數量(圖4b)。在測序量達到5Gbp或10Gbp時,超過98%的高豐度物種基因組被恢復,其完整度>80%(圖4c),并且大約23%為低豐度物種基因組,但未發現超低豐度物種的基因組(圖4d-e)。此外,淺層測序的基因組覆蓋度、功能基因的含量以及低豐度和超低豐度基因組的組裝性能都遠遠低于超深度測序(圖4f,表S7)。以上結果表明超深度測序相較于普通測序,能夠恢復更多低豐度物種的基因組。
通過物種注釋發現這些MAGs來源于7個門,16個綱,24個目,40個科,72個屬以及116個種。其中,來源最多的為厚壁菌門(74.7%),然后為擬桿菌門(9.5%),放線菌門(7.1%)以及變形菌門(6.5%)。此外,還包括了一些次要的門,脫硫菌門(4個種),梭桿菌門(3個種),疣微菌門(2個種)以及廣古菌門(1個種)。值得注意的是,幾乎一半的MAGs不能注釋到種水平(n=234),它們被認為是未培養物種。在門水平,51.0%的厚壁菌門,48.4%的變形菌門以及41.2%的放線菌門的物種都被鑒定為未培養物種(圖S2a)。在這些MAGs中,90.2%的放線菌門,86.1%的厚壁菌門,83.3%的變形菌門以及79.5%的擬桿菌門為低豐度及極低豐度物種(圖S2b)。然后,將我們的數據集與UHGG數據庫進行比較,以確定我們數據集中基因組的質量和新穎性。與現有物種相比,24個MAGs被鑒定為新種(ANI<95%;圖S3),并且209個MAGs與其同一物種的現有基因組相比,質量有所改善。在本研究中有167個MAGs為現有參考基因組缺失的16S?rRNA全長基因組(表S4)。此外,66.7%新的MAGs被鑒定為梭狀芽胞桿菌目。以上結果表明,盡管近期腸道微生物研究中新的基因組不斷增加,但某些進化分支中仍有大量未培養物種尚未探索。
圖4. (a)利用常規宏基因組分析方法和超深度混合測序的方法,在當前數據集中恢復IGG數據庫中不同相對豐度的宏基因組組裝基因組。(b-e)抽取5Gbp和10Gbp的數據量,完整數據集中>200Kbp的bins,高,低,超低豐度基因組反映了binning性能。(f)超深度測序在宏基因組組裝性能方面優于淺層測序。5Gbp和10Gbp重建的高、低、超低豐度的基因組數據集與超深度測序獲得的475個高質量的基因組進行比較。圖中展示了基因組的完整度,N50長度,基因組大小,已識別的編碼序列(蛋白)的數量,kegg數據庫和Cazy(碳水化合物)的注釋結果。色階代表重組基因組的比例(原文圖3)。
4 不同豐度物種的基因組特征
微生物的可培養性和豐度可能與其固有的基因組特征(比如GC含量、預估基因組大小、編碼序列密度)、生長速率以及生態系統中的選擇壓力有關。通常來看,低豐度和超低豐度物種的編碼密度、pN/pS率及SNP密度均高于高豐度物種(圖5a)。有趣的是,相對豐度與SNP密度(r = -0.25,?P?< .001)、pN/pS率(r = -0.12,?P?= .011)呈負相關,這表明在腸道環境中,低豐度物種受到更高的選擇壓力(圖5b)。生長速率與預估基因組大小(r = 0.19,?P?< .001)、SNP密度(r = 0.26,P?< .001)呈正相關;同時,SNP密度與預估基因組大小也呈正相關(r = 0.21,?P?< .001)。此外,編碼密度與預估基因組大小之間存在顯著的負相關(r = -0.18,?P?= .001)(圖5b)。以上這些相關性可能反映了腸道物種間的相互作用和生態位適應。
圖5. (a)高豐度、低豐度和特低豐度物種基因組的特征比較。(b)熱圖中星號具有統計學意義:*P<.05,**P<.01,***P<.001。散點圖中的藍色虛線表示斯皮爾曼相關性(原文圖4)。
5 染色體可移動遺傳元件(MGEs)以及染色體外的可移動遺傳元件
染色體可移動遺傳元件(cMGEs)的分布表明,不同豐度的物種/基因組之間存在顯著的基因組變異,我們共識別到38624個cMGEs,包括了9807個與轉座子相關、6513個與質粒相關、5473個與噬菌體相關以及16831個與其他機制相關的cMGEs(圖6a,表S8)。與低豐度和超低豐度物種相比,高豐度物種有著更多與質粒、轉座子以及其他機制相關的cMGEs(P?< .001;圖6b)。
此外,我們還識別到了染色體外的可移動遺傳元件,包括了281個未分類的質粒(>10 Kbp,表S9)以及5,097個未分類的噬菌體(>5 Kbp;表S10,圖6c)。噬菌體主要來源于三個病毒家族,分別為Siphoviridae (長尾噬菌體科;48.7%)、Myoviridae(肌病毒科;16.1%)以及 Podoviridae(短尾噬菌體科;5%;圖6d,表S10)。組裝出了4個常見的單個scaffold人類腸道相關噬菌體crAssphage,其中一個為98.0 kb的圓形基因組。大多數質粒(72%)在NCBI數據庫中都能找到高度同源的物質,但大多數假定噬菌體(80%)不能注釋到科水平,這表明了在人類腸道宏基因組中存在大量尚未探索的染色體外MGEs。
圖6. 組裝基因組的染色體可移動遺傳元件(MGEs)?。(a)染色體MGEs在所有宏基因組組裝基因組(MAGs)中所占的比例。(b)箱線圖展示了不同豐度基因組MGEs的分布。(c)按序列長度和覆蓋度分布的病毒家族。(d)12個個體科水平的腸道病毒;***P?< .001, ****P< .0001(原文圖5)。
6 不同豐度物種中多糖代謝和短鏈脂肪酸(SCFAs)生物合成的相關基因
為了研究腸道微生物在多糖降解和代謝方面的潛能,與KEGG數據庫進行注釋,重構了關鍵的預測腸道代謝通路和每個個體基因組網絡間的相互作用。使用Omixer-RPM(v.1.0)識別功能通路。不可消化淀粉顆粒的生物降解、植物和宿主來源(概括為C1-C6)的多糖可能是腸道降解微生物的主要能量和碳源。隨后,腸道厭氧菌在糖發酵后可能產生有機酸 (包括乳酸和琥珀酸) 和短鏈脂肪酸。
以超低豐度和低豐度基因組為代表的類群是大多數代謝相關通路的主要參與者,平均占代謝功能的16.3%和58.3%(圖7),尤其是低豐度物種富集了9種通路(與多糖降解和短鏈脂肪酸合成相關的通路,表S11),包括了一些多糖降解的途徑(如淀粉降解(C1)、纖維素降解(C2)、木葡聚糖和木聚糖降解(C4))、果聚糖的降解以及一些有機酸和短鏈脂肪酸的合成途徑(包括乳酸(S3)和丙酸鹽(S10))。這些結果表明低豐度物種也廣泛參與了多糖以及短鏈脂肪酸的代謝,同時也提示我們,在個性化的微生物組研究趨勢下,不可忽視低豐度物種。
圖7. 腸道宏基因組的預測代謝潛能。(a)在本研究數據集中發現的多糖代謝和短鏈脂肪酸(SCFA)生物合成相關的宏基因組組裝基因組(MAGs)示意圖。多糖代謝和短鏈脂肪酸生物合成相關通路分別以編碼C1-C7和S1-S15表示。根據KEGG數據庫中的關鍵反應進行功能基因的注釋,功能通路由Vieira-Silva等人發現的Omixer-RPM(v.1.0)進行識別。各模塊的反應詳細情況見表12。(b)堆積圖展示了高豐度、低豐度和超低豐度基因組相關通路(C1-C7、S1-S15)的總體分布。餅圖展示了這些通路在每個個體中的分布情況(原文圖6)。
討論
目前,大多數研究的宏基因組測序深度被限制在每個樣本5Gbp~10Gbp,然而,我們的結果表明,在短讀測序深度超過10 Gbp的情況下,可以獲得新的基因組特征。當測序深度不斷增加時,會發現更多的低豐度物種,這意味著傳統的宏基因組測序和組裝方法將會丟失大量微生物多樣性以及低豐度物種,而結合長讀長可以有效改善組裝性能,因此,本研究采用了短讀長與長讀長相結合的模式來進行組裝。
我們的方法確保了重復區域的正確組裝和組裝的連續性,不僅提高了組裝性能,也讓我們對復雜微生物組的組成有了更加全面的了解。尤其是在本研究中成功組裝出了高質量的單個scaffold基因組,使我們可以直接從復雜的宏基因組樣本中獲得高質量的參考基因組。此外,還獲得了高質量、完整的單scaffold細菌基因組的多個rRNA操縱子,這在先前的研究中是不可能實現的。例如,我們成功組裝出了4個完整的環狀基因組CMAG,代表了對應物種下的首個環狀基因組,并且這4個基因組中包含了完整的rRNA操縱子(5S,16S,23S)。相比之下,它們對應的參考基因組是具有多個片段的contigs,即使發現了類似rRNA操縱子的序列,也會缺失一個或多個5S/16S/23S基因特征。因此,這些具有代表性的基因組序列的可用性在很大程度上提高了分類注釋、基因組分析和基于16S rRNA基因豐度分析的準確性。
超深度混合基因組測序顯著提高了宏基因組的分析性能,特別是在數據提取與組裝方面。本研究共從12份糞便樣品中組裝出475個基因組草圖,其中有24個新型基因組,有47個基因組的組裝質量得到了顯著改善,并且有20%的基因組滿足MIMAG標準(完整度>90%并且包括23S,16S以及5S rRNA基因,并且至少存在18個tRNAs;2017年美國能源部聯合基因組研究所提出的一項更嚴格的高質量基因組標準),絕大多數(94%)是通過超深度混合測序方法組裝的,這表明我們的方法在獲得高質量基因組方面要有效得多。近期一項研究收集和分析了人類腸道微生物組數據集中的204938個基因組,聚類分析后共得到了4644個原核物種,其中只有573(12.3%)個滿足MIMAG標準。本研究結果表明,盡管數萬個宏基因組樣本重建了數十萬個基因組,但仍有極大程度的細菌多樣性尚未被探索,這也啟示我們為了實現對人類腸道微生物群功能及生態更全面的理解,我們應該盡可能提高基因組質量。
隨著測序量的增加,低豐度物種也被鑒定出來。Walsh等人指出宏基因組測序深度不會顯著影響低多樣性微生物群落的分類和功能分析結果。然而,我們的研究表明,深度測序顯著提高了復雜人類腸道微生物群中低豐度物種的宏基因組binning性能,尤其是對于相對豐度1%以下的物種。此外,我們發現大多數低豐度和超低豐度物種的基因組無法通過淺層測序鑒定出來。
同時,本研究還揭示了采樣環境的生態位,因為生態環境生態位被認為是細菌的微生物菌群組成和相對豐度的主要因素。我們發現與高豐度基因組相比,低豐度基因組的染色體可移動遺傳元件(MGEs)含量較少,基因組不完整是其主要原因,所以我們通過基因組大小對cMGEs的數量進行了標準化,以消除這種影響。在低豐度基因組中檢測到的與質粒相關的MGEs數量也較低,這可能不僅僅是由于宏基因組數據集中高豐度和低豐度基因組之間的讀取量不對等所造成的偏差,因為在一些個體中功能基因/途徑在低豐度基因組比高豐度基因組中更加豐富,例如與聚合碳水化合物相關的微生物降解基因/途徑。另一方面,我們發現低豐度物種有著較高含量的SNP密度,并且受到更高的選擇壓力。而MGEs的存在也被認為與腸道微生物群的進化性和適應性有關,但是,由于本研究樣本量較小,所以目前的數據還需進一步研究,在未來的研究中,樣本的數量和測序的深度都必須增加,以鞏固目前的發現。不論怎樣,我們發現研究這些低含量的腸道微生物對我們更好地理解腸道生態至關重要。
此外,低豐度物種廣泛參與了多糖,短鏈脂肪酸的代謝,這些結果表明,低豐度物種可能對腸道微生物的各種代謝和發酵都有很大的貢獻,而這種貢獻對宿主來說是至關重要的。因此,在個體水平上去研究這些物種可以幫助我們更好的了解它們在腸道環境中的活動以及它們對宿主的貢獻。目前為止,這只能通過目前開發的超深度混合宏基因組測序和組裝才能實現。
長讀長測序是一種識別人類腸道微生物中染色體外MGEs的有效方法,據報道,MGEs在微生物進化和適應中發揮著重要作用。我們發現了幾十種質粒和數千種噬菌體,其中大多數與已知物種不具有同源基因。因此,對人類腸道染色體外MGEs的認識也因缺乏參考基因組而受到阻礙。另一方面,這對我們來說是一個很好的機會,利用本研究中的方法去探索更多人類腸道微生物組中的新型MGEs。
總的來說,超深度混合測序的方法可以揭示更完整的宏基因組功能信息,并且突出了深度測序在揭示復雜微生物群中存在的稀有物種的基因組特征和宏基因組功能潛力方面的價值。然而,這種方法最大的缺點是成本高,大約比短讀測序貴15-20倍。因此為了獲得包括低豐度物種在內最全面的復雜微生物群,一種方法是對相對豐度較低但具有代表性的樣本進行測序,而不是僅僅采用低覆蓋度的傳統宏基因組測序方法。
結論
隨著測序量的不斷增加,產生了大量的宏基因組數據。然而,由于傳統測序方法的測序深度較淺,使得低豐度和超低豐度在復雜的微生物群中被忽略。本研究采用了一種超深度混合測序的方法,從人類腸道基因組中還原了一些高質量的低豐度和超低豐度物種的基因組。我們的研究結果表明,這些物種具有未知的和特定的基因組特征,特別是MGEs和代謝途徑的模式,這也表明它們可能在腸道微生物群中發揮著特定作用,并對宿主有積極作用。盡管目前的研究顯著提高了物種分類性能以及參考基因組數據集的質量,并還原了低豐度物種,但在個體水平上深入了解腸道微生物群及其相互作用仍然具有成本高以及一些其他的挑戰。
往期精品(點擊圖片直達文字對應教程)
機器學習
后臺回復“生信寶典福利第一波”或點擊閱讀原文獲取教程合集
總結
以上是生活随笔為你收集整理的内蒙古农大孙志宏教授证实超深度混合宏基因组测序能够对人类肠道微生物组中的低丰度物种进行基因组和功能表征...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 饶毅教授对非升即走的思考
- 下一篇: NewRandomAccessFile