PacBio三代全长转录组/Iso-Seq技术及案例分析
讀透一篇文章比粗讀100篇文章都要有用!!!
參考:產(chǎn)品手冊
PacBio三代全長轉錄組有什么優(yōu)勢?
近年來,隨著高通量測序技術的發(fā)展,轉錄組測序已經(jīng)成為研究基因表達調控的主要手段。但二代的轉錄本重構準確率很低,三代可以直接得到全長轉錄本,無需組裝。可改善基因表達定量結果,發(fā)現(xiàn)新的基因和轉錄異構體,鑒定可變剪切及基因融合現(xiàn)象。
Google第一個就是官網(wǎng)介紹,可以立馬理解Iso-Seq的字面意思了。
Iso-Seq 就是 isoform sequencing,中文就是同源異構體測序,其實也是一種 RNA 測序技術。
The challenge of isoform reconstruction(即二代的不足):
真核組織中,大多數(shù)gene是可變剪切的,產(chǎn)生多種transcript isoforms,大大增加了基因組蛋白編碼的潛能。
同一個gene產(chǎn)生的可變剪切是大大的不同的,有時甚至會起到相反的效應。
為了研究基因表達,學者們往往使用二代技術,測得的是一些片段,也是就RNA-seq技術。然而,短的RNA-seq 不能跨越全長的轉錄本,也就不能精準的描繪出 isoform 的不同特性。
三代的核心優(yōu)勢:
Produce full-length transcripts without assembly(不用組裝)
The isoform sequencing (Iso-Seq) application generates full-length cDNA sequences — from the 5’ end of transcripts to the poly-A tail — eliminating the need for transcriptome reconstruction using isoform-inference algorithms.
The Iso-Seq method generates accurate information about alternatively spliced exons and transcriptional start sites.
It also delivers information about poly-adenylation sites for transcripts up to 10 kb in length across the full complement of isoforms within targeted genes or the entire transcriptome.
實操:Iso-Seq學習
文章解讀:Pacbio Iso-Seq 助力玉米高粱轉錄組研究
案例:Full-length transcriptome sequences and splice variants obtained by a combination of sequencing platforms applied to different root tissues of Salvia miltiorrhiza and tanshinone biosynthesis
2015年發(fā)的The Plant Journal,IF=5.468,丹參不同根組織和丹參酮的生物合成(全長轉錄組測序和混合測序平臺來發(fā)現(xiàn)剪切變異體)
做了什么工作:
摘要:丹參是中國傳統(tǒng)藥材,它的根莖和根有很高的價值。它對應的生物活性成分是丹參酮,所以研究丹參酮的生物合成非常有價值,先前的轉錄組研究是基于NGS的,但是大部分的結果的 isotig 都不能代表全長的 cDNA 序列。而且這些研究都集中于整個植株和發(fā)狀根培養(yǎng)物。這里,我們證實了丹參酮色素是在根周皮中產(chǎn)生的,我們聯(lián)合應用了NGS和SMRT技術在不同的根組織中,特別是在根的周皮,來提供一個完整的丹參的轉錄組信息,而且進一步深入分析了丹參酮的生物合成。此外,使用SMRT測序,能夠檢測可變剪切,這里我們發(fā)現(xiàn)了檢測到的基因座中有40%的都發(fā)生了可變剪切,包括一些類異戊二烯和類萜代謝。
研究材料:丹參酮一般認為產(chǎn)生于丹參根部周皮部,研究分別取了根部的周皮(periderm)、韌皮(phloem)、木質(xylem)3種類型的根部組織進行了mRNA測序。(很常規(guī)的思路,分析重點落在特色作物的重要功能成分上,找到該功能成分的合成場所,對該部分組織進行轉錄組分析,通過分析就肯定能找到與該代謝物相關的差異表達基因,最后把其他代謝扯一扯就發(fā)了一篇文章)
研究方法:3種類型根部樣本各設置3個生物學重復,總共9個樣本,采用Hiseq2500 PE100進行測序,每個樣本產(chǎn)生~5G raw data 。9個樣本混合測序,采用PacBio進行測序,建<1kb、1-2kb、2-3kb、>3kb 四個SMRT bell文庫,總共產(chǎn)生~4.8G raw data(估計一下,這個項目花了多少錢呢?一個樣本Hiseq轉錄組多少錢?一個PacBio轉錄組多少錢?)
主要發(fā)現(xiàn)
1)采用Hiseq2500 數(shù)據(jù)對PacBio RSII平臺所產(chǎn)生的subreads進行了校正,最后得到了16,241個高質量非冗余isoform。
2)基于Hiseq2500產(chǎn)生的mRNA數(shù)據(jù)的差異表達分析,發(fā)現(xiàn)了在根部周皮部特異表達與者高表達丹參酮合成相關基因,SmCPS1、SmKSL1、GGPS、IPI、CYP等;
3) 最后研究者使用得到的16,241個高質量的Isoform進行了可變剪接分析,發(fā)現(xiàn)了大約有40%檢測基因位點發(fā)生了可變剪接現(xiàn)象,其中有些基因參與了萜類化合物代謝及類異戊二烯代謝。
文章邏輯:
全文都圍繞著一個話題:tanshinone biosynthesis(丹參酮的生物合成)
引言怎么寫:
作物特點、價值、功效,核心功能成分的代謝途徑,揭示其機制非常重要。
前人在該方向上(轉錄組)的研究方法及結果:inducible diterpene synthases(誘導二萜合成酶),SmCPS1 and SmKSL1;cytochrome P450 (CYP)。主要集中于 tanshinone biosynthesis 的前提和關鍵步驟,二萜烯烴前體,最初的羥基化,牽扯到一些生物化學代謝途徑的解析。
本文使用技術的優(yōu)勢,目的及意義:1.全長轉錄組;2.dissect the root finely enough to localize tanshinone production and accumulation。
分析邏輯(結果):
tanshinone積累的定位
這部分雖然簡單,但是可以顯著提升文章前后的邏輯性。 分離拍照,然后電鏡一張,UPLC成分含量分析。
Combined sequencing approach to the roots of danshen
這一步就是為了找出不同組織中的差異表達基因,使用NGS和SMRT混合測序手段,分析表達的基因。
Expression analysis indicates co-localization of tanshinone biosynthesis and accumulation
表達分析揭示tanshinone 生物合成和積累的協(xié)同定位
Co-expression analysis for the investigation of tanshinone biosynthesis
共表達分析
Alternatively spliced isoforms
可變剪切體
待續(xù)~
總結
以上是生活随笔為你收集整理的PacBio三代全长转录组/Iso-Seq技术及案例分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 怎么清理路由器缓存数据艾泰路由器如何清理
- 下一篇: 长江有多少千米(长江、黄河有多长?)