基因表达热图聚类并增加行列注释
聚個類,可能模式更清晰一些。聚類參數有很多,如下圖:按行聚類、按列聚類、行列聚類,聚類方法是什么,距離矩陣算法選哪個,我們提供了21種聚類算法,有通用的,有特異用于菌群數據的。
在我們打開聚類之前,這些參數都是禁用狀態。這是一個特有設計。在ImageGP中很多依賴性參數都是這么設置的,主要用途就是避免選錯、減少選擇的慌亂性。參數很多,如果不可選,說明你用不上,也就忽略就好。
我們選擇層級聚類Hierachical cluster行列聚類Column & Row,其它都默認。(選擇聚類后,參數不再是灰色蒙版,而是可調了)
提交后獲得結果
換一種距離計算算法,默認是Pearson,換成Spearman,換成歐式距離。
提交后獲得結果(會對聚類模式有一些影響)
設置不同的距離矩陣和聚類方式可以嘗試獲得不同的聚類圖。聚類熱圖怎么按自己的意愿調整分支的順序?也可以幫你更精確控制聚類順序(在不改變聚類層級結構的基礎上)
增加列注釋(也可同時或單獨增加行注釋)
數據格式和內容如下。
ID conditions individual sizeFactor SV1 SV2 SV3 untrt_N61311 untrt N61311 1.021132476 -0.101 -0.494 -0.316 untrt_N052611 untrt N052611 1.180398615 0.018 -0.170 0.588 untrt_N080611 untrt N080611 1.179608275 -0.429 0.376 -0.089 untrt_N061011 untrt N061011 0.923264178 0.535 0.241 -0.176 trt_N61311 trt N61311 0.893927524 -0.125 -0.496 -0.366 trt_N052611 trt N052611 0.670922884 0.036 -0.151 0.591 trt_N080611 trt N080611 1.396766501 -0.467 0.441 -0.070 trt_N061011 trt N061011 0.946230699 0.533 0.253 -0.162既然是列注釋,那么這個文件就得根表達矩陣的列名字有關系,不然怎么匹配起來呢?
先看一個錯誤的例子,我們把這個數據粘貼到行注釋處 Paste row annotation matrix,看看有什么問題?
給我們彈出了一個提示錯誤:Paste main heatmap data to text area的第一列不等于Paste row annotation matrix (first column must match first column of data matrix)的第一列。是說數據不匹配。如果您以后也遇到同樣問題,就要好好看下是不是粘貼錯位置了。
沒問題了,點擊提交去看看結果
結果出來了,列注釋加上了。不過圖例沒顯示全,目前的策略只能是加大圖片高度或下載PDF格式用Adobe Illustrator等軟件修改。后續我們修復下,看是否可以多列顯示圖例。
測試數據獲取:https://gitee.com/ct5869/bic
點擊閱讀原文訪問網站
往期精品(點擊圖片直達文字對應教程)
機器學習
后臺回復“生信寶典福利第一波”或點擊閱讀原文獲取教程合集
總結
以上是生活随笔為你收集整理的基因表达热图聚类并增加行列注释的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 这篇Cell里面的GSEA展示很不错!
- 下一篇: 那些文献阅读能力爆表的科研学子,都在偷偷