怎样使用monocle包进行pseudotime分析
怎樣使用monocle包進行pseudotime分析,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。
monocle是一個專門用于分析單細胞轉錄組數據的R包,提供了聚類,pseudotime, 差異分析等多種功能。
這里主要介紹使用該R包進行pseudotime分析的步驟,可以分為以下5步
1. 讀取數據
monocle包有很多種讀取數據的方式,這里只展示了讀取Seurat中的對象的方法,代碼如下
#加載需要的R包 library(Seurat) library(monocle) #設置cellranger輸出結果目錄 input_dir<-"/scRNA/outs/filtered_gene_bc_matrices/GRCh48/" #讀取數據 pbmc.data<-Read10X(data.dir=input_dir) #創建Seurat中的對象 pbmc<-CreateSeuratObject(raw.data=pbmc.data,project="10X") #將Seurat中的對象轉換為monocle識別的對象 cds<-importCDS(pbmc)
在monocle中,用CellDataSet這種class來存儲數據,示意如下
2. 預處理
代碼如下
cds<-estimateSizeFactors(cds) cds<-estimateDispersions(cds)
第一行代碼用于評估每個細胞的sizefactor, 用于后續歸一化;第二行代碼計算基因的方差。
通過pData和fData兩個函數,可以查看基因和細胞的相關信息,示意如下
3. 篩選基因
篩選基因沒有一個固定標準,可以根據自己的需要靈活選擇,這里只展示其中一種
disp_table<-dispersionTable(cds) unsup_clustering_genes<-subset(disp_table,mean_expression>=0.1) cds<-setOrderingFilter(cds,unsup_clustering_genes$gene_id)
4. 降維分析
使用DDRTree的方法進行降維分析,代碼如下
cds<-reduceDimension( cds, max_components=2, method='DDRTree')
5. psudotime分析
代碼如下
cds<-orderCells(cds)
運行之后,對于每個細胞,會給出一個pseudotime值,示意如下
可視化的代碼如下
plot_cell_trajectory(cds)
降維之后,在二維空間展示細胞pseudotime的分布,可以看到是一個樹狀結構,除了上述方法外,還可以根據pseudotime的值給細胞賦顏色,代碼如下
plot_cell_trajectory(cds,color_by="Pseudotime")
其實就是將fData中對應的列設置為顏色,如果想要觀察不同細胞亞型的分布,可以在fData中新增一列細胞對應的cluster ID, 然后用這一類來設置顏色。
對于pseudotime分析,我們需要明白它的基本輸入就是一張基因在細胞中表達量的表格,與細胞的聚類結果無關,只不過在可視化的時候根據聚類的結果填充了顏色而已。
總結
以上是生活随笔為你收集整理的怎样使用monocle包进行pseudotime分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 将图的广度优先遍历在邻接矩阵和邻接表存储
- 下一篇: 小区物业费信息管理系统设计c++_没有入