R 学习 - 功能富集泡泡图
功能富集泡泡圖
功能富集分析用來展示某一組基因(一般是單個樣品上調或下調的基因)傾向參與哪些功能調控通路,對從整體理解變化了的基因的功能和潛在的調控意義具有指導作用,也是文章發表中一個有意義的美圖。通常會用柱狀圖、泡泡圖和熱圖進行展示。熱圖的畫法之前已經介紹過,這次介紹下富集分析泡泡圖, 其展示的信息是最為全面的,也是比較抓人眼球的。
做基因功能富集分析、KEGG富集分析、GSEA分析首選clusterProfiler http://mp.weixin.qq.com/s/9M3lprc3rL6XII3ffpDHAw,Y叔的良心之作,數據集更新及時,結果準確,自帶語義分析合并相似條目、出圖漂亮。
但有時出來的結果還需要進行一些篩選處理然后重新繪圖,本文就介紹下如何根據clusterProfiler的輸出結果繪制富集分析圖。本文雖主推clusterProfiler, 但繪圖方法適用于所有富集分析的輸出結果。
一步繪制富集分析圖
假設有這么一個富集分析結果矩陣 (文件名為GOenrichement.xls) 存儲了EHBIO樣品和Baodian樣品中各自上調的基因富集的通路。
- Description 為GO通路的描述,也可以是KEGG通路。
- GeneRatio 為對應通路差異基因占總差異基因的比例,本列可以用分數或小數表示,都可以處理。
- qvalue 表示對應通路富集的顯著性程度,可以是log處理過的,也可以是原始的。
- Count 為對應通路差異基因數目。
- Type 這個矩陣合并了EHBIO樣品和Baodian樣品中各自上調的基因富集的通路,用Type列做區分。如果只有一個樣品可不要。
- 考慮到手機屏幕小能顯示的字符有限,只保留了輸出結果中用到的列,實際使用時,整個輸出結果文件可以作為輸入,不相關的列會忽略掉,不影響出圖。
繪圖用到的腳本名字為sp_enrichmentPlot.sh, 首先看看它的使用方法和出圖效果。
單樣品分開繪制
示例矩陣中包含兩個樣品上調基因的富集通路,現在先取出一個樣品繪制。
- Linux命令不熟悉的去生信寶典文章集錦中查看Linux學習指南
如果不想展示GeneRatio也可以。
# -o: 指定橫軸的變量,單個樣品一般選擇GeneRatio或樣品名字 # -T: 如果是樣品名字,指定為字符串 sp_enrichmentPlot.sh -f GOenrichement.ehbio.xls -o Type -T string -v Description -c qvalue -s Count -l qvalue -a 12 -x "Sample" -y "GO description"多樣品合并繪制
# 多出來的參數是-S用來指定樣品分組,不同類型的基因的富集分析用不同的形狀表示 sp_enrichmentPlot.sh -f GOenrichement.xls -o GeneRatio -T numeric -v Description -c qvalue -s Count -l qvalue -a 12 -x "GeneRatio" -y "GO description" -S Type通過這張圖解釋下,富集分析的結果怎么解讀。富集分析實際是查找哪些通路里面包含的差異基因占總差異基因的比例顯著高于通路中總基因占所有已經注釋的基因的比例。這一顯著性通常用多重假設檢驗矯正過的pvalue(又稱qvalue, FDR或p.adjust)來表示。在圖中體現為點的顏色。從綠到紅富集顯著性逐漸增高。點的大小表示對應通路中包含的差異基因的數目。點的形狀代表了不同類型的基因,如EHBIO中上調的基因和Baodian中上調的基因。橫軸表示對應通路包含的差異基因占總的差異基因的比例, 本圖中最高不過5%, 這個值越大說明通路被影響的越多。
如果不想展示GeneRatio也可以。
# 跟單個樣品不顯示GeneRatio的命令一樣,不同的樣品分列展示。 sp_enrichmentPlot.sh -f GOenrichement.xls -o GeneRatio -T numeric -v Description -c qvalue -s Count -l qvalue -a 12 -x "GeneRatio" -y "GO description" -S Type今天先到這,明天再對用到的R代碼進行解讀。需要繪圖腳本的,還是請幫助轉發下,謝謝。
有了clusterProfiler富集分析神器,又有了enrichmentPlot.sh一鍵繪圖工具,得到了好的結果,是不是就能發出好文章呢? 看上去差不多了,實際在有一個好的平臺,發大文章,拿千萬獎金的機會就來了。
有這么一個人,有著駱駝般的耐力,三觀端正 (五官不可描述),簡稱駱觀正。端正在以下三方面,
- 年少癡情,為了愛人,徒步南京
- 年青有為,一篇JBC解密體細胞重編程機理,一篇Cell開創甲基化修飾新領域
- 年富力強,曾經的控球后衛,猶如魔術師約翰遜,靈巧多姿;現在的中山大學博導,冉冉升起的表觀新星
還有兩觀令人發指
- 舍得給錢,博士后12-16萬,特聘副研19-25萬,而且還有數不清的績效
- 舍得給名,發表論文共通訊,并有教授直通車機會
駱教授畢業于中科院遺傳所王秀杰老師實驗室 (說到這兒,就知道我為啥推薦他了),后隨RNA表觀修飾開創者芝加哥大學何川教授進行博士后研究。2年內一作出品Cell, Nature Review, Nature Communications等多篇高水平論文,專注于RNA甲基化m6A和新型的DNA修飾6mA的研究。
回國后,居安思危,開拓進取
繼續DNA甲基化6mA的功能研究,已有數據支持其與核小體存在互作,輔之以6mA reader的發現,又是一個有深遠影響的科研成果和一篇領域的硬通貨。
研發低樣本量的單堿基RNA修飾識別技術,推動RNA修飾在早期胚胎和腫瘤中的研究,看看最近早期胚胎中DNA甲基化和組蛋白甲基化的CNS頻出,就知道這是一個人神向往的領域。RNA修飾的獨特性,使得只有部分實驗室有這個能力去做,你來,機會就是你的。
CAS9這幾年一直很火,應用CAS9改變DNA或RNA的m6A修飾對主動研究這些修飾的調控功能具有重要的科研意義和疾病的診治意義。之前有報道miRNA可以調控RNA上的m6A甲基化修飾,后續CAS9的跟進將會促進DNA/RNA修飾編輯的研究和拓展。
招兵選將,再創輝煌
- 分子生物學/生物化學方向博士后和特聘副研究員各一名
生物信息學方向博士后和特聘副研究員各一名
特聘副研究員:要求博士畢業3年以內,有兩項以上學術成果
- 博士后:要求應屆博士畢業,有至少一項學術成果
工資根據之前的研究基礎和經歷來定。合同為年薪制,博士后年薪12至16萬,特聘副研究員19-25萬。優秀者可有獨立辦公室,發表論文與合作導師共享通訊作者。
注:以上待遇為基本待遇,實驗室將根據情況提供績效獎勵等。專職科研人員無明確教學任務,可申請各類科研項目,優秀者在聘期結束后或聘期內可直接申報學校的教授/副教授位置。
請將詳細簡歷(包括學歷、工作經驗、發表文章等)通過電子郵件發至:luogzh5@mail.sysu.edu.cn請注明職位申請。
本招聘啟事長期有效。
Reference
- http://blog.genesino.com//2017/07/enrichmentPlot
關注生信寶典,一起學生信
http://mp.weixin.qq.com/s/i7GOr5UMRp6OYTO40lgR8g
總結
以上是生活随笔為你收集整理的R 学习 - 功能富集泡泡图的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 微信重大更新,mac版可刷朋友圈!可以看
- 下一篇: linux分区表导出与恢复,Linux下