geo数据差异分析_GeoDiver:GEO数据挖掘分析利器
生活随笔
收集整理的這篇文章主要介紹了
geo数据差异分析_GeoDiver:GEO数据挖掘分析利器
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 這才是GEO數據庫挖掘的正確姿勢
前陣子,酸談學社的大師兄Ewen給大家介紹了一個GEO數據集分析工具shinyGEO。本期小編就再來給大家介紹一個來自大英帝國的GEO數據分析神器-GeoDiver(https://www.geodiver.co.uk/ )。1
首先,官網的使用界面非常直觀簡單,不僅可以高質量的作圖,還可以做差異表達和基因富集分析。聽著就感覺非常666,而其用戶體驗也確實是更加nice,下面讓我們一起去探索學習吧。跟shinyGEO一樣,用戶只要輸入GEO dataset的編號運行即可。比如網站的舉例數據GDS724,輸入編號后,網站會自動識別分組因素,包括不同組織間比較或者individual間的比較。另外,ADVANCED PARAMETERS里還有更多可供選擇的參數,包括列表里展示的差異表達基因數目、P value的矯正方法、熱圖里展示的基因數目、熱圖聚類的方法,及樹狀圖的展示等等。2
接下來,我們以individual為例分析下數據挖掘結果:Overview Boxplot從此圖可以看到表達量的均值還是有波動的,沒有完全在一條直線上,說明數據沒有進行歸一化,而歸一化的目的是調整由于基因芯片技術引起的誤差。但在實際的數據分析過程中,數據均值的這條線,只要沒有太大的波動,像本例中的情況還是可以用的。如果要進行均一化,一般用平均數或者中位數進行標準化處理,那樣處理也更加科學嚴謹。主成分分析(Principal Component Analysis)我們可以看到PC1和PC2兩個主成分的解釋度超過了60%,按推斷應該可以通過主成分的的坐標圖將兩組分開,實際情況如下:1)2D圖2)3D圖用戶可以自行選擇主成分,觀察主成分是否能夠將兩組數據分開,以判斷兩組樣本是否存在差異,本例數據來看,兩組間的差異還是比較明顯的。熱圖(Heatmap)熱圖分為兩個模塊,一個模塊是差異表達的基因(很像是Pheatmap的作圖風格啊,應該就是它了),另外一個是gene set的富集分析圖。不管是差異表達的基因還是富集到的通路,網站都提供搜索功能,可在Table的右側進行搜索篩選。富集到的每個通路,用戶可以點擊如下圖所示的紅色箭頭,查看在KEGG中的通路情況,而且應該是實時的KEGG通路數據(筆者推測,因為加載通路數據時需要一些時間),所以功能還是比較強大的。火山圖網站作者煞費苦心,畫了兩個火山圖如下。筆者認為火山圖就只是一個粗略的展示,并沒有太多意義。當然,對于篩選差異表達基因時觀察某個基因在整體中的情況,還是有一定幫助意義的。這個網站能夠完成基本的GEO數據分析,就看各位能不能各顯神通,用好這個工具啦!—END—歡迎大家關注解螺旋生信頻道-挑圈聯靠公號~? ? ?? ?
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??????點下“在看”,多根頭發
總結
以上是生活随笔為你收集整理的geo数据差异分析_GeoDiver:GEO数据挖掘分析利器的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 本地maven仓库_Maven(四):仓
- 下一篇: 2兼容鼠标无法禁用一直乱动_雷柏rale