单细胞转录组基本概念(一)
普通轉(zhuǎn)錄組的思路也可以應(yīng)用到單細(xì)胞轉(zhuǎn)錄組。普通轉(zhuǎn)錄組相當(dāng)于把一群細(xì)胞或一個(gè)器官混合到一起去提取RNA,獲得的是每個(gè)細(xì)胞中RNA表達(dá)量的平均值。單細(xì)胞是把每個(gè)細(xì)胞單獨(dú)分出來(lái)去提取RNA,然后建庫(kù)測(cè)序,獲得是是單個(gè)細(xì)胞的表達(dá)值。在每個(gè)細(xì)胞里面基因的表達(dá)具有隨機(jī)性,且存在異質(zhì)性。而且這些細(xì)胞群中會(huì)存在不同類型的細(xì)胞,尤其是當(dāng)我們對(duì)整個(gè)組織或者器官進(jìn)行測(cè)序時(shí),它們本身就是由不同類型的細(xì)胞組成的,而我們用普通轉(zhuǎn)錄組來(lái)測(cè)序,相當(dāng)于掩蓋住了這些不同的細(xì)胞類型的差異,展示的是整個(gè)組織的平均的狀態(tài),所以說(shuō)單細(xì)胞從這個(gè)來(lái)看跟普通轉(zhuǎn)錄組就不同在是用一個(gè)細(xì)胞測(cè),不是用一堆細(xì)胞測(cè)。
既然是做單細(xì)胞,第一步就是把單個(gè)細(xì)胞分選出來(lái)。分選的方式也比較多,物理切割,酶消化,FACS分選等。假如已經(jīng)分到了一個(gè)單細(xì)胞,跟常規(guī)的轉(zhuǎn)錄組步驟上是一樣的。下一步就是把單細(xì)胞里的RNA提取出來(lái)去建庫(kù)測(cè)序。但是一個(gè)細(xì)胞里的RNA含量是比較少的,難建庫(kù)成功。這個(gè)里面“量”的概念很有意思。比如說(shuō)單細(xì)胞量少,需要特殊處理。到我們做計(jì)算的,量大需要特殊處理。比如微信這個(gè)工具,看上去誰(shuí)都可以做,就是一個(gè)信息發(fā)送和接收的工具,技術(shù)難度不大。但如果是做成承載8億用戶的平臺(tái),難度就大了很多了。后面講到的單細(xì)胞聚類也是,數(shù)量一大,就得先降維再聚類。建庫(kù)之前需要做一步擴(kuò)增,擴(kuò)增主要有2個(gè)方式,一個(gè)是體外轉(zhuǎn)錄,另一個(gè)是常規(guī)的PCR擴(kuò)增。因?yàn)閱渭?xì)胞的RNA量比較少,所以要擴(kuò)增的話循環(huán)數(shù)就會(huì)比較多,會(huì)引入一些PCR擴(kuò)增帶來(lái)的偏好性,為了解決這個(gè)問(wèn)題,就有了現(xiàn)在的第2個(gè)技術(shù)——體外轉(zhuǎn)錄。這個(gè)技術(shù)不通過(guò)擴(kuò)增,在RNA上加一個(gè)T7的啟動(dòng)子,讓它一輪一輪的轉(zhuǎn)錄出新的RNA,實(shí)現(xiàn)線性擴(kuò)增。
PCR也有對(duì)應(yīng)的線性擴(kuò)增的技術(shù),當(dāng)獲得了可以反轉(zhuǎn)錄成足夠量cDNA的RNA之后,就可以把它按照之前常規(guī)轉(zhuǎn)錄組的方式去建庫(kù)測(cè)序,后續(xù)的分析也是比較類似。
因?yàn)閱渭?xì)胞里面RNA的量少,所以說(shuō)整個(gè)富集的過(guò)程中會(huì)出現(xiàn)一部分基因在一個(gè)細(xì)胞里能檢測(cè)到,在另外一個(gè)細(xì)胞里面檢測(cè)不到,而每個(gè)細(xì)胞里面的檢測(cè)存在一個(gè)隨機(jī)性,同時(shí)單細(xì)胞測(cè)序深度比較低,所以說(shuō)分析時(shí)相比于普通轉(zhuǎn)錄組有一些是需要特別注意,但整體的分析思路是類似的。單細(xì)胞轉(zhuǎn)錄組的分析流程,主要還在在后期的聚類、發(fā)育軌跡、整合分析等。下圖是單細(xì)胞轉(zhuǎn)錄組測(cè)序技術(shù)的發(fā)展,橫軸是時(shí)間,縱軸是每一個(gè)技術(shù)所能檢測(cè)到的細(xì)胞的量的變化,基本服從指數(shù)的分布。
1992年Eberwine教授采用體內(nèi)反轉(zhuǎn)和體外轉(zhuǎn)錄技術(shù)測(cè)定了單個(gè)細(xì)胞里的數(shù)個(gè)基因的表達(dá)。后續(xù)非靶向的mRNA擴(kuò)增技術(shù)的發(fā)展為2009年湯富酬老師打響單細(xì)胞測(cè)序前兩槍提供了技術(shù)基礎(chǔ)。
湯富酬老師在國(guó)外做博后的時(shí)候,2009、2010年2篇文章拉開(kāi)了單細(xì)胞轉(zhuǎn)錄組測(cè)序的序幕,現(xiàn)在他也是單細(xì)胞領(lǐng)域特別高產(chǎn)的研究者。當(dāng)時(shí)單細(xì)胞轉(zhuǎn)錄組測(cè)序主要應(yīng)用于特別難獲取的細(xì)胞,比如說(shuō)胚胎發(fā)育早期,合子,二細(xì)胞,四細(xì)胞,八細(xì)胞期,這時(shí)候因?yàn)槊恳粋€(gè)階段細(xì)胞的數(shù)目都是很有限的,當(dāng)時(shí)就想著能夠開(kāi)發(fā)一個(gè)技術(shù)對(duì)這種含量特別少的細(xì)胞能夠提取建庫(kù)成功,然后獲得它們的表達(dá)量,從而來(lái)研究這些常規(guī)轉(zhuǎn)錄組所研究不了的生物過(guò)程,所以當(dāng)時(shí)的發(fā)展是盡量提高測(cè)序的深度。
到了后來(lái)也還是2010年,也是目前在單細(xì)胞領(lǐng)域比較火的一個(gè)老師,郭國(guó)驥老師,他在哈佛做博后時(shí)用fluidigm的一個(gè)設(shè)備檢測(cè)了500個(gè)細(xì)胞的48個(gè)基因的單細(xì)胞的RT-qPCR結(jié)果,發(fā)現(xiàn)用這48個(gè)基因可以對(duì)500個(gè)細(xì)胞進(jìn)行很好的細(xì)胞分型,定義每個(gè)細(xì)胞的類型。所以大家看到這篇文章開(kāi)始逐漸意識(shí)到,完全可以在單細(xì)胞分析上以量取勝,就是每個(gè)細(xì)胞可以測(cè)的比較淺,但是測(cè)很多細(xì)胞,這樣對(duì)鑒定細(xì)胞類型很有幫助,所以說(shuō)后續(xù)技術(shù)的大部分優(yōu)化點(diǎn)都在于如何提高檢測(cè)通量上,而現(xiàn)在我們已經(jīng)可以檢測(cè)幾千或者上萬(wàn)的細(xì)胞。
后續(xù)就由此發(fā)展出來(lái)很多技術(shù),比如drop-seq,indrop,10Xgenomics,這些都是基于droplets的技術(shù)。早期單細(xì)胞的分選主要靠人工,用移液管,移液槍或者顯微操作去把細(xì)胞單個(gè)單個(gè)的分出來(lái),再放到微孔里一個(gè)一個(gè)進(jìn)行反應(yīng),或者使用fluidigm的微流控設(shè)備或者操作機(jī)器人,之后就有了更自動(dòng)化的設(shè)備,使得我們用更低的成本,更少的時(shí)間來(lái)檢測(cè)出來(lái)更多的細(xì)胞。
這些技術(shù)都不能保留細(xì)胞原始的空間上的位置,而In situ barcoding或者Picowells可以讓我們得知這個(gè)細(xì)胞在原始空間上誰(shuí)跟誰(shuí)更近,同時(shí)可以檢測(cè)出來(lái)這些細(xì)胞里面基因的表達(dá)量,提供另外一個(gè)維度的信息。
郭國(guó)驥老師另外一篇cell中的Microwell-seq可以檢測(cè)數(shù)萬(wàn)個(gè)細(xì)胞,是屬于測(cè)序成本比較低的技術(shù),后面再講它的基本應(yīng)用。
原位序列條形碼標(biāo)記(例如單細(xì)胞組合索引RNA測(cè)序(sci-RNA-seq)和基于分池連接的轉(zhuǎn)錄組測(cè)序(split-poolligation-based transcriptomesequencing, SPLiT-seq)
在SpatialTranscriptomics(美國(guó)10XGenomics公司)和Slide-seq方法中,采用寡核苷酸芯片(oligo-arrayed microarray slides)和布滿寡核苷酸的凝珠 (denselypacked oligo-coatedbeads) 直接從冷凍組織切片中捕獲RNA進(jìn)行測(cè)序。寡核苷酸包含spatialbarcode,UMI和oligo-dT引物,可唯一識(shí)別每個(gè)轉(zhuǎn)錄本及其位置。測(cè)序reads比對(duì)回玻片坐標(biāo)獲得空間基因表達(dá)信息。
已經(jīng)證明,SpatialTranscriptomics可用于多種物種的組織,包括小鼠腦和人乳腺癌組織、人心臟組織和擬南芥花序組織。Slide-seq是一項(xiàng)最新開(kāi)發(fā)的技術(shù),已顯示可用于小鼠大腦的冷凍切片分析。這些直接的mRNA捕獲方法不需要專門(mén)的設(shè)備,具有相對(duì)簡(jiǎn)單的分析方法,并且可能大規(guī)模應(yīng)用于許多組織。
但是,有兩個(gè)重要的問(wèn)題有待解決。首先,該技術(shù)只能應(yīng)用于新鮮的冷凍組織。其次,分辨率受到芯片大小和寡核苷酸凝珠間距的限制;當(dāng)前應(yīng)用的芯片大小分別為6.5×7mm和3×3mm,限制了可以檢測(cè)的組織切片的大小。SpatialTranscriptomics的凝珠直徑為100μm,間隔為100μm,這意味著它們不夠小或不夠密,以致無(wú)法實(shí)現(xiàn)單細(xì)胞分辨率。Slide-seq的凝珠 (beads)小得多,直徑僅為10 μm,并且堆積致密,提供了十倍的空間分辨率,大約一半的beads可以獲得單個(gè)細(xì)胞數(shù)據(jù)。
真正想了解大腦,你還需要一個(gè)空間背景(spatial context),因?yàn)榇竽X細(xì)胞不像肝臟或其他器官那樣以對(duì)稱的方式組織,大腦的不同尋常之處在于它具有神經(jīng)元的拓?fù)浣Y(jié)構(gòu)。因此,我們希望能夠觀察大腦的一部分,看看那里有哪些細(xì)胞、它們?cè)谀睦?#xff0c;以及它們周?chē)心男╊愋偷募?xì)胞。
MERFISH的主要應(yīng)用之一是原位識(shí)別細(xì)胞類型。不同的細(xì)胞類型有不同的基因表達(dá)譜。因此,這些基因表達(dá)譜為細(xì)胞類型鑒定提供了定量和系統(tǒng)的方法。由于我們可以通過(guò)MERFISH成像在完整組織中做到這一點(diǎn),我們也可提供這些細(xì)胞類型的空間結(jié)構(gòu)(spatial organization)。
極限稀釋加移液槍分離單細(xì)胞;顯微操作分選單細(xì)胞;流式分選帶有表面Marker的單細(xì)胞;激光切割實(shí)體組織;微流控技術(shù);磁珠捕獲,主要用于CTC
它的一個(gè)優(yōu)點(diǎn)是可以結(jié)合流式細(xì)胞熒光分選(FACS, fluorescent activated cell sorting)根據(jù)表面Marker分選細(xì)胞。因此特別適合分選細(xì)胞子集用于測(cè)序。它的另一個(gè)優(yōu)點(diǎn)是可以獲得細(xì)胞形態(tài)全覽圖,提供另外一個(gè)維度的信息,可用于鑒定微孔中是否有損傷的細(xì)胞或雙份細(xì)胞,主要缺點(diǎn)是通量低且每個(gè)細(xì)胞所需的工作量相當(dāng)大。微流型平臺(tái),比如Fluidigm’s C1,提供了一個(gè)更加整合的系統(tǒng),同時(shí)可以捕獲細(xì)胞和完成文庫(kù)構(gòu)建的準(zhǔn)備過(guò)程。比微孔型平臺(tái)通量更高,但只能捕獲10%的細(xì)胞,不適合處理稀有細(xì)胞或細(xì)胞量量很少的情況。液滴型方法是將單獨(dú)的細(xì)胞和一個(gè)包含建庫(kù)所學(xué)酶的珠粒(bead)包裹在一個(gè)納米級(jí)液滴里面。特殊地,每個(gè)珠粒(bead)包含一段獨(dú)特的條形碼序列(barcode),會(huì)加到所有來(lái)自于液滴里面這個(gè)細(xì)胞的序列上,用于區(qū)分不同細(xì)胞的轉(zhuǎn)錄本。采用光刻技術(shù)制作微孔矩陣硅片(微孔直徑28 um,深度35 um,100,000個(gè)微孔),以此為模具制作PDMS微柱模具。這兩個(gè)模具可以反復(fù)使用。最終用于富集的微孔板是通過(guò)傾到5%的瓊脂糖凝膠到PDMS微柱模具上生成的。細(xì)胞懸液加到凝膠微孔模具上,利用重力使細(xì)胞落入微孔,通常一個(gè)微孔只能容納一個(gè)細(xì)胞,一塊板子可以同時(shí)捕獲約10000個(gè)單細(xì)胞。每一步操作都可視、可控制,doublets可以通過(guò)鏡檢洗除。隨后每個(gè)孔加入包含107-108特定探針集的與孔徑大小匹配的磁珠,標(biāo)記每個(gè)細(xì)胞中的mRNA(每個(gè)磁珠的寡核苷酸序列中都有一段特異的序列用于標(biāo)記細(xì)胞來(lái)源),然后使用Smart-seq2方法進(jìn)行后續(xù)的反轉(zhuǎn)錄、擴(kuò)增。擴(kuò)增后的cDNA片段使用轉(zhuǎn)座酶片段化(這步倒有些類似ATAC-seq),富集3’末端轉(zhuǎn)錄本序列測(cè)序。理論上,每個(gè)唯一的UMI-轉(zhuǎn)錄本對(duì)應(yīng)該對(duì)應(yīng)來(lái)源于一個(gè)RNA分子的所有reads。但是現(xiàn)實(shí)往往并非如此,最常見(jiàn)的原因是:
不同的UMI序列不一定表示它們是不同的UMI分子 由于PCR或測(cè)序錯(cuò)誤,堿基替換可能導(dǎo)致新的UMI序列。較長(zhǎng)的UMI出現(xiàn)堿基替換的機(jī)會(huì)更多。根據(jù)細(xì)胞條碼測(cè)序錯(cuò)誤估計(jì),7-10%的10 bp長(zhǎng)度的UMI中至少有一個(gè)堿基替換。如果錯(cuò)誤沒(méi)有糾正,將會(huì)過(guò)高估計(jì)轉(zhuǎn)錄本的數(shù)目。
不同的轉(zhuǎn)錄本不一定是不同的分子 比對(duì)錯(cuò)誤或多個(gè)比對(duì)位置可能導(dǎo)致某些UMI對(duì)應(yīng)到錯(cuò)誤的基因/轉(zhuǎn)錄本。這種類型的錯(cuò)誤也會(huì)導(dǎo)致過(guò)高估計(jì)轉(zhuǎn)錄本的數(shù)目。
相同的UMI不一定意味著相同的分子UMI頻次的不同和短UMI可導(dǎo)致同一UMI和相同基因的不同mRNA分子相連,進(jìn)而可能低估轉(zhuǎn)錄本數(shù)量。
后面再繼續(xù)不同技術(shù)之間的比較
往期精品(點(diǎn)擊圖片直達(dá)文字對(duì)應(yīng)教程)
機(jī)器學(xué)習(xí)
后臺(tái)回復(fù)“生信寶典福利第一波”或點(diǎn)擊閱讀原文獲取教程合集
總結(jié)
以上是生活随笔為你收集整理的单细胞转录组基本概念(一)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 数据中异常值的鉴定和处理(1)
- 下一篇: 当我们谈论生信的时候我们在谈什么