TCGA 亚型突变负荷代码
#1、準備文件/數據并加載相應的包
#1.1下載并加載相應的包,有就直接加載,沒有就下載后再加載。
install.packages("pacman")
library(pacman)
p_load(TCGAbiolinks,DT,tidyverse)
BiocManager::install("TCGAbiolinks")
library(tidyverse)
BiocManager::install("maftools")
library(maftools)
library(dplyr)
#1.2需要準備亞型文件
#用之前用來構建風險模型的時候生成的具有高低風險組分組的文件
#行是樣本名
#直接加載
load("F:/mypro/cancer-cuprosis/TCGA-STAD-cuprosis-lncrna/STAD-cuprosis-lncrna/mk-model/train_test_all_risk.RData")
View(all_surv_expr)
#就是上面截圖這個樣子。其實只需要有risk那一列就行了。
#1.3準備maf格式文件,并根據高低風險組將maf分為高低風險樣本的亞型
raw<-GDCquery(
? project= "TCGA-STAD",
? data.category = "Simple Nucleotide Variation",
? access = ?"open",
? legacy = FALSE,
? data.type= "Masked Somatic Mutation",
? workflow.type = "Aliquot Ensemble Somatic Variant Merging and Masking"
)
#下載數據
GDCdownload(raw)
#獲取數據
maf<- GDCprepare(raw)
#讀取數據
maf<-maf %>% maftools::read.maf()
?#一開始我以為把突變數據提取成表格就行了,后面發現不行。做瀑布圖的時候,那個代碼不能識別這樣的表達矩陣,需要時maf格式的。
#找到樣本所在的位置
maf@data$Tumor_Sample_Barcode?
#改樣本名
#樣本名需要和亞型文件的樣本名一致,好后面做提取處理。
mut$Tumor_Sample_Barcode<-substring(mut$Tumor_Sample_Barcode,1,12)
mut$Tumor_Sample_Barcode[1]
?mut$Tumor_Sample_Barcode<-substring(mut$Tumor_Sample_Barcode,1,12)
mut.High <- mut[(mut$Tumor_Sample_Barcode %in% rownames(all_surv_expr)[all_surv_expr$risk=="high"]),]
### ? %in% ? 判斷前面一個向量是否在后面一個向量中存在,返回布爾值
mut.Low <- mut[(mut$Tumor_Sample_Barcode %in% rownames(all_surv_expr)[all_surv_expr$risk=="low"]),]
maf.High <-read.maf(maf = mut.High,isTCGA = T)## 讀取高風險亞型的突變數據
maf.Low <- read.maf(maf = mut.Low,isTCGA = T)## 讀取低風險亞型的突變數據
maf.all <- read.maf(maf = mut,isTCGA = T)## 讀取總的樣本突變數據
?
# 下面設置顏色,人種等信息,這里的代碼不需要修改:
col = RColorBrewer::brewer.pal(n = 10, name = 'Paired')
names(col) = c('Frame_Shift_Del','Missense_Mutation', 'Nonsense_Mutation', 'Frame_Shift_Ins','In_Frame_Ins', 'Splice_Site', 'In_Frame_Del','Nonstop_Mutation','Translation_Start_Site','Multi_Hit')
#人種
racecolors = RColorBrewer::brewer.pal(n = 4,name = 'Spectral')
names(racecolors) = c("ASIAN", "WHITE", "BLACK_OR_AFRICAN_AMERICAN", ?"AMERICAN_INDIAN_OR_ALASKA_NATIVE")
# 下面開始繪制總的瀑布圖,代碼及圖片如下
oncoplot(maf = maf.all,
? ? ? ? ?colors = col,#給突變配色
? ? ? ? ?top = 20)
# 繪制高風險亞型瀑布圖,代碼及圖片如下:
oncoplot(maf = maf.High,
? ? ? ? ?colors = col,#給突變配色
? ? ? ? ?top = 20)
# 繪制低風險瀑布圖,代碼及圖片如下:
oncoplot(maf = maf.Low,
? ? ? ? ?colors = col,#給突變配色
? ? ? ? ?top = 20)
總結
以上是生活随笔為你收集整理的TCGA 亚型突变负荷代码的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 奥特曼系列ol如何进老服务器,《奥特曼系
- 下一篇: Ant Design Pro 菜单自定义