单细胞测序的知识
單細胞測序的知識
? 劉小澤?已關注 2018.07.20 21:33*?字數 1885?閱讀 675評論 0喜歡 7劉小澤寫于18.7.20
https://hemberg-lab.github.io/scRNA.seq.course/index.html
介紹
Bulk RNA-seq:
測量一個大的細胞群體中每一個基因的平均表達水平,對比較轉錄組學(例如比較 不同物種的相同組織) 是有幫助的,但對于研究異質性系統(例如,復雜的組織如腦)還是不夠的,對于基因表達的本質研究不夠深入
scRNA-seq:
2009年由Tang發表,但直到14年才降低測序費用,逐漸進入大家的視野。它測定的是細胞種群中每個基因的表達量分布,對于研究特定細胞轉錄組的變化是重要的。測定的細胞量也由最初的102?漲到了106?并且還在遞增,向著高通量的方向發展。現在有許多處理單細胞測序的流程,比如13年的SAMRT-seq2,12年的CELL-seq,15年的Drop-seq。有一些做單細胞的平臺,包括Fluidigm C1、Wafergen ICELL8、10X Genomics Chromium。
發展歷史單細胞測序的流程:
測序流程看著和普通的mRNA轉錄組差不多,取材要求更高了
分析流程黃色部分對于高通量數據的處理都是差不多的流程;橙色的部分需要整合多個轉錄組分析流程以及顯著性分析,來解決單細胞測序的技術誤差;最后是下游表達量、通路、互作網絡等生物類別的分析,需要使用針對單細胞研發的方法
可以借助許多工具:
-
Falco [云端處理流程]
-
SCONE(Single-Cell Overview of Normalized Expression)—一個質控和標準化的包
-
Seurat-- QC以及后續分析探索數據
-
ASAP(Automated Single-cell Analysis Pipeline) —交互式網頁分析
面臨挑戰:
單細胞轉錄組與群體轉錄組的最大不同之一就是:測序文庫是建立在單獨一個細胞上的,并非一群細胞。單細胞目前面臨的挑戰主要是:擴增量目前最多是一百萬個細胞;有可能一個基因在一個細胞中能檢測到中等表達量,但是在另一個細胞中卻檢測不到,這種現象叫做"gene dropouts"。下一步需要增加轉錄本捕獲效率,減少擴增誤差
分析方法:
近幾年,發展起來的方法很多,大體上(并不全面)包括:
-
CEL-seq (Hashimshony, 2012)
-
CEL-seq2(Hashimshony, 2016)
-
Drop-seq(Macosko, 2015)
-
InDrop-seq (Klein, 2015)
-
MARS-seq(Jaitin, 2014)
-
SCRB-seq(Soumillon, 2014)
-
Seq-well (Gierahn, 2017)
-
Smart-seq (Picelli, 2014)
-
Smart-seq2 (Picelli, 2014)
-
SMARTer
-
STRT-seq (Islam, 2013)
方法主要分為兩大部分:定量與捕獲。
-
定量包括兩種類型:全長以及基于標簽(tag)。前者對每個轉錄本都試圖獲得一致的read覆蓋度,后者只捕獲5‘或者3’端的RNA。定量方法的選擇也影響了后續分析的方法選擇。理論上,全長的方法應該得到轉錄本的平均覆蓋度,但是實際上,覆蓋度經常是有偏差的。基于標簽的方法能夠利用特異性分子標記(Unique Molecular Identifiers, UMIs)提高定量準確度,但是呢,這種限制了轉錄組一端的方法有降低了轉錄本的可拼接性,讓以后的isoform識別變得困難。
-
捕獲的技術決定了細胞如何被篩選、獲取怎樣的測序外的補充信息、數據產量,三種最常用的方法是基于微孔microwell-、微液流microfluidic-、微滴droplet-
基于微孔的捕獲技術可以使用細胞移液器或激光捕獲分離細胞,并將他們放置于微液流孔中。這樣的一個優勢就是:可以與熒光觸發細胞分離技術(FACS)結合,實現基于表面標記的細胞選擇。對于想要分離特定細胞群的研究很有效;另外一個優勢就是,可以對細胞進行拍照,幫助確定孔中是否存在損傷的或者重復的細胞。當然,他也有缺點,通量低,對每個細胞進行操作需要很大的工作量。
基于微液流的捕獲技術?例如Fluidigm's C1
Fluidigm's C1?
相對微孔,它的通量更高。但是他的弱點就是:只有10%的細胞能被捕獲到,加入處理的細胞類型比較稀少,那么能被芯片捕獲的就更少了,數據產出是不夠的。另外芯片相對較貴,但是試劑的價格再降低,日后可能總的價格也會下降。
微滴技術?是將單個細胞包裹在μl級別的液滴中,液滴被搭載到建庫所用的酶上,每個微滴包含一個獨特的條碼(barcode),由那個被包裝好的細胞產生的所有reads都被貼上了該條碼,也是為了之后對于不同細胞reads的分辨。一般微滴技術的通量最大,查資料得知一秒能包裝7萬個以上的液滴,并且建庫費用合適--0.05美元/細胞。但是高額測序費用又成了他的短板,鑒定出的一般只有一千多個差異轉錄本,覆蓋度還是比較低的
微滴技術?
如何根據實驗選擇測序平臺?
關于捕獲,比如:如果想要分析組織中的成分,那么微滴技術可以提供數量可觀的細胞;如果研究的細胞種群比較稀少,并且有已知的標記,那么最好用FACS,測少量細胞即可;關于定量,比如:如果想要研究不同的轉錄本,由于標簽是有限的,不可能全部標記完這些轉錄本,那么全長的轉錄本定量就更合適;UMIs只能用于使用標簽的方法,在基因水平做定量更有優勢。
2017年Ziegenhain所在的Enard團隊和Svensson所在的Teichmann團隊都比較了不同的方法組合:
- Ziegenhain使用同樣的小鼠胚胎干細胞(mouse embryonic stem cells,mESCs)分析了5種不同的方法,控制細胞數量、測序深度一致,比較了方法的檢測靈敏度、噪聲水平以及各個方法的費用。結果顯示了檢測到基因的數目(給定一個檢測閾值),結果顯示drop-seq檢測到的基因數目比Smart-seq2低了兩倍。因此,方法的選擇對于實驗結果很重要! Enard團隊
-
?
?
Svensson使用的是已知濃度的合成的轉錄本(加入了spike-in)來檢測不同方法的準確度和敏感度 Teichmann團隊
轉載于:https://www.cnblogs.com/wangprince2017/p/9818481.html
總結
- 上一篇: SAP不同的产品是如何支持用户创建自定义
- 下一篇: P4048 [JSOI2010]冷冻波