GEO2R/GEOquery的结果可能是错的!!!
前言
NGS系列文章包括NGS基礎(chǔ)、轉(zhuǎn)錄組分析 (Nature重磅綜述|關(guān)于RNA-seq你想知道的全在這)、ChIP-seq分析 (ChIP-seq基本分析流程)、單細(xì)胞測(cè)序分析 (重磅綜述:三萬(wàn)字長(zhǎng)文讀懂單細(xì)胞RNA測(cè)序分析的最佳實(shí)踐教程 (原理、代碼和評(píng)述))、DNA甲基化分析、重測(cè)序分析、GEO數(shù)據(jù)挖掘(典型醫(yī)學(xué)設(shè)計(jì)實(shí)驗(yàn)GEO數(shù)據(jù)分析 (step-by-step) - Limma差異分析、火山圖、功能富集)等內(nèi)容。
在準(zhǔn)備GEO/TCGA培訓(xùn)時(shí),因?yàn)椴糠謹(jǐn)?shù)據(jù)來自NCBI GEO數(shù)據(jù)庫(kù),就系統(tǒng)梳理了GEO數(shù)據(jù)庫(kù)的結(jié)構(gòu)和存儲(chǔ)方式,順便也看了GEO2R的使用。然后就發(fā)現(xiàn)了一個(gè)問題,可能直接使用GEO2R的分析結(jié)果是錯(cuò)誤的。
原因見下圖 (官網(wǎng)介紹截圖)
?
?
而GEO2R的R代碼使用的是GEOquery獲取GSEMatrix,所以如果我們自己寫代碼這樣獲取非原始數(shù)據(jù)時(shí),也有可能得到的數(shù)據(jù)是不可比的。
?
?
所以,還是建議使用工具或命令之前,好好讀一下幫助文檔,做到心中有數(shù),知其所以然。如果能基于原始數(shù)據(jù)進(jìn)行分析,可以做更多的質(zhì)控和更深入的比較。如果不能,分析之前看下數(shù)據(jù)的分布是否均一 (median-centered)。
所以生信寶典的原理類文章,值得好好閱讀。
-
典型醫(yī)學(xué)設(shè)計(jì)實(shí)驗(yàn)GEO數(shù)據(jù)分析 (step-by-step) - Limma差異分析、火山圖、功能富集
-
典型醫(yī)學(xué)設(shè)計(jì)實(shí)驗(yàn)GEO數(shù)據(jù)分析 (step-by-step) - 數(shù)據(jù)獲取到標(biāo)準(zhǔn)化
-
GO、GSEA富集分析一網(wǎng)打進(jìn)
-
GSEA富集分析 - 界面操作
-
WGCNA分析,簡(jiǎn)單全面的最新教程
-
PCA主成分分析實(shí)戰(zhàn)和可視化 附R代碼和測(cè)試數(shù)據(jù)
-
一文掌握GSEA,超詳細(xì)教程
從課件中截取GEO簡(jiǎn)介部分分享如下 :
?
總結(jié)
以上是生活随笔為你收集整理的GEO2R/GEOquery的结果可能是错的!!!的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 有了这些,文件批量重命名还需要求助其它工
- 下一篇: 科室鄙视链最低端,居然是这类人