MDR的进阶版本-GMDR
歡迎關注”生信修煉手冊”!
MDR多因子降維法作為邏輯回歸的一種補充,有效克服了邏輯回歸在處理高階稀疏數據時的局限性,廣泛應用于分析基因-基因,基因-環境之間的相互作用,但是該方法存在一些局限性
和邏輯回歸一樣,該方法僅適用于二分類因變量的分析,比如case/control的實驗設計,對于連續型因變量無法處理
和邏輯回歸不同,邏輯回歸可以進行協變量的校正,而該方法不可以
為了克服上述兩個問題,增加MDR方法的適用性,科學家們在MDR核心思想的基礎上進行了擴展,引入了score statistic的概念,提出了GMDR的方法,原理示意如下
MDR算法的核心是統計不同因子組合對應的頻數,對應第三步中的單元格內的頻數,然后用該頻數的比值進行降維,并進行分類準確性和預測錯誤率的分析,從而挑選佳的模型。
GMDR仍然沿用了相同的算法框架,只不過將頻數改為了打分,關于其打分系統的詳細介紹參見下面這篇文章
https://www.cell.com/action/showPdf?pii=S0002-9297(07)61030-161030-1)
然后根據該打分值來進行后續的降維,分類準確性,預測錯誤率等分析。在文章中也比較了MDR和GMDR的分析結果,結果如下
可以看到,MDR和GMDR結果的一致性非常高,而同樣的因子組合,GMDR的預測準確率和交叉驗證的一致率都比MDR方法好。GMDR支持廣義線性回歸等多種模型,圖示如下
可以用于處理各種類型的數據,軟件下載的網址如下
http://www.ssg.uab.edu/gmdr/
和MDR軟件的用法完全一致,導入文件即可。至少要求輸入SNP位點的分型結果文件,內容如下
如果需要進行協變量的校正,也可以輸入對應的文件,內容如下
每一行對應的都是一個樣本,分型結果和協變量兩個文件中每一行對應同一個樣本,最后一列為因變量y。導入文件后,點擊Run Analysis即可開始分析,分析結果如下所示
和MDR輸出結果類似,也是有兩個部分,第一部分顯示了不同數量的因子相互作用中最顯著的結果, Training Bal.Acc表示訓練集中的準確率,Testing Bal.Acc表示測試集中的準確率,數字越大,范圍為0-1,數值越大,準確率越高,CV Consistency表示交叉驗證的一致率,8/10表示10次交叉驗證中8次該結果都顯著。Sign Test(p)表示p值;第二部分則顯示了對應的score值等詳細信息。
該軟件也可以通過命令行運行,更多用法請參考官方文檔。
·end·
—如果喜歡,快分享給你的朋友們吧—
往期精彩
自己動手進行邏輯回歸,你也可以!
GWAS大家都知道,Gene-Based GWAS你了解嗎?
3步搞定GWAS中的Gene Set Analysis
你聽說過Epistasis嗎?
GWAS中的Gene-Gene Interactions如何分析?看這里
終于搞清楚了Lasso回歸和Ridge回歸的區別
odd ratio置信區間的計算,你學會了嗎?
多元回歸分析存在多重共線性了怎么辦?
基因型與表型的交互作用如何分析,多元回歸來搞定
曼哈頓圖就夠了嗎?你還需要LocusZoom
GWAS做完了,下一步做什么?
? GWAS meta分析
GWAS樣本量不夠怎么辦,meta分析了解一下
你沒看錯,搞定GWAS meta分析只需一行代碼!
meta分析的森林圖不會畫?看這里
GWAMA:GWAS meta-analysis的又一利器
點擊鼠標即可完成GWAS meta分析,任何人都可以!
用R進行gwas meta分析,原來如此簡單
??基因型填充
GWAS中的genotype imputation簡介
基因型填充中的phasing究竟是什么
基因型填充前的質控條件簡介
使用shapeit進行單倍型分析
gtool:操作genotype data的利器
使用IMPUTE2進行基因型填充
使用Beagle進行基因型填充
使用Minimac進行基因型填充
使用Eagle2進行單倍型分析
X染色體的基因型填充
文獻解讀|不同基因型填充軟件性能的比較
Haplotype Reference Consortium:最大規模的單倍型數據庫
Michigan Imputation Server:基因型填充的在線工具
??CNV分析
aCGH芯片簡介
aCGH芯片分析簡介
基于SNP芯片進行CNV分析中的基本知識點
PennCNV:利用SNP芯片檢測CNV
DGV:人類基因組結構變異數據庫
dbvar:染色體結構變異數據庫
DGVa:染色體結構變異數據庫
CNVD:疾病相關的CNV數據庫
DECIPHER:疾病相關的CNV數據庫
全基因組數據CNV分析簡介
使用CNVnator進行CNV檢測
使用lumpy進行CNV檢測
CNVnator原理簡介
WES的CNV分析簡介
XHMM分析原理簡介
使用conifer進行WES的CNV分析
使用EXCAVATOR2檢測WES的CNV
靶向測序的CNV分析簡介
使用CNVkit進行CNV分析
DECoN:最高分辨率的CNV檢測工具
? TCGA
TCGA數據庫簡介
使用GDC在線查看TCGA數據
使用gdc-client批量下載TCGA數據
一文搞懂TCGA中的分析結果如何來
通過GDC Legacy Archive下載TCGA原始數據
使用GDC API查看和下載TCGA的數據
使用GDC下載TCGA腫瘤患者的臨床信息
使用TCGAbiolinks下載TCGA的數據
使用TCGAbiolinks進行生存分析
使用TCGAbiolinks分析TCGA中的表達譜數據
使用TCGAbiolinks進行甲基化和轉錄組數據的聯合分析
Broad GDAC:TCGA數據分析中心
使用cBioPortal查看TCGA腫瘤數據
UCSC ?Xena:癌癥基因組學數據分析平臺
GEPIA:TCGA和GTEx表達譜數據分析平臺
TANRIC:腫瘤相關lncRNA數據庫
SurvNet:基于網絡的腫瘤biomarker基因查找算法
TCPA:腫瘤RPPA蛋白芯片數據中心
TCGA Copy Number Portal:腫瘤拷貝數變異數據中心
? 生存分析
生存分析詳細解讀
用R語言進行KM生存分析
使用OncoLnc進行TCGA生存分析
用R語言進行Cox回歸生存分析
使用kmplot在線進行生存分析
? 腫瘤數據庫
ICGC:國際腫瘤基因組協會簡介
HPA:人類蛋白圖譜數據庫
Oncomine:腫瘤芯片數據庫
ONGene:基于文獻檢索的腫瘤基因數據庫
oncomirdb:腫瘤相關的miRNA數據庫
TSGene:腫瘤抑癌基因數據庫
NCG:腫瘤驅動基因數據庫
mutagene:腫瘤突變頻譜數據庫
CCLE:腫瘤細胞系百科全書
mSignatureDB:腫瘤突變特征數據庫
GTEx:基因型和基因表達量關聯數據庫
? 腫瘤免疫和新抗原
Cancer-Immunity Cycle:腫瘤免疫循環簡介
TMB:腫瘤突變負荷簡介
腫瘤微環境:Tumor microenvironment (TME)簡介
腫瘤浸潤免疫細胞量化分析簡介
使用EPIC預測腫瘤微環境中免疫細胞構成
TIMER:腫瘤浸潤免疫細胞分析的綜合網站
quanTIseq:腫瘤浸潤免疫細胞定量分析
The Cancer Immunome Atlas:腫瘤免疫圖譜數據庫
腫瘤新抗原簡介
TSNAdb:腫瘤新抗原數據庫
使用NetMHCpan進行腫瘤新抗原預測分析
? Hi-C數據分析
chromosome-territories:染色質疆域簡介
chromosome conformation capture:染色質構象捕獲技術
3C的衍生技術簡介
解密Hi-C數據分析中的分辨率
A/B compartment:染色質區室簡介
TAD:拓撲關聯結構域簡介
chromatin loops:染色質環簡介
Promoter Capture Hi-C:研究啟動子區染色質互作的利器
使用HiCUP進行Hi-C數據預處理
Juicer:Hi-C數據處理分析的利器
Juicer軟件的安裝詳解
Juicebox:Hi-C數據可視化利器
Juicer實戰詳解
HiC-Pro:靈活的Hi-C數據處理軟件
HiC-Pro實戰詳解
3D Genome Browser:Hi-C數據可視化工具
HiCPlotter:Hi-C數據可視化工具
3CDB:基于3C技術的染色質互作信息數據庫
3DIV:染色質空間互作數據庫
4DGenome:染色質相互作用數據庫
4D nucleome project:染色質三維結構研究必不可少的參考項目
3dsnp:SNP在染色質環介導的調控網絡中的分布數據庫
iRegNet3D:疾病相關SNP位點在三維調控網絡中的作用
使用WashU Epigenome Browser可視化hi-c數據
HiGlass:高度定制的Hi-C數據可視化應用
Hi-C Data Browser:Hi-C數據瀏覽器
使用FitHiC評估染色質交互作用的顯著性
使用TADbit識別拓撲關聯結構域
使用pyGenomeTracks可視化hi-c數據
hi-c輔助基因組組裝簡介
文獻解讀|使用hi-C數據輔助埃及伊蚊基因組的組裝
? chip_seq數據分析
Chip-seq簡介
chip_seq質量評估之計算樣本間的相關性
chip_seq質量評估之查看抗體富集效果
chip_seq質量評估之PCA分析
chip_seq質量評估之coverage分析
chip_seq質量評估之FRiP Score
chip_seq質量評估之cross correlation
chip_seq質量評估之文庫復雜度
depth, bedgraph, bigwig之間的聯系與區別
bigwig歸一化方式詳解
使用igvtools可視化測序深度分布
使用UCSC基因組瀏覽器可視化測序深度分布數據
使用deeptools查看reads分布特征
使用phantompeakqualtools進行cross correlation分析
blacklist regions:NGS測序數據中的黑名單
MACS:使用最廣泛的peak calling軟件之一
MACS2 peak calling實戰
使用SICER進行peak calling
使用HOMER進行peak calling
peak注釋信息揭秘
PAVIS:對peak區域進行基因注釋的在線工具
使用UPORA對peak進行注釋
使用GREAT對peak進行功能注釋
annoPeakR:一個peak注釋的在線工具
使用ChIPpeakAnno進行peak注釋
使用ChIPseeker進行peak注釋
使用PeakAnalyzer進行peak注釋
使用homer進行peak注釋
利用bedtools預測chip_seq數據的靶基因
? motif
關于motif你需要知道的事
詳解motif的PFM矩陣
詳解motif的PWM矩陣
使用WebLogo可視化motif
使用seqLogo可視化motif
使用ggseqlogo可視化motif
MEME:motif分析的綜合性工具
使用MEME挖掘序列中的de novo motif
使用DREME挖掘序列中的de novo motif
使用MEME-ChIP挖掘序列中的de novo motif
? chip_seq數據庫
ENCODE project項目簡介
FactorBook:人和小鼠轉錄因子chip_seq數據庫
ReMap:人類Chip-seq數據大全
IHEC:國際人類表觀基因組學聯盟
Epifactors:表觀因子數據庫
GTRD:最全面的人和小鼠轉錄因子chip_seq數據庫
ChIP-Atlas:基于公共chip_seq數據進行分析挖掘
Cistrome DB:人和小鼠的chip_seq數據庫
chipBase:轉錄因子調控網絡數據
unibind:human轉錄因子結合位點數據庫
chip_seq在增強子研究中的應用
DENdb:human增強子數據庫
VISTA:人和小鼠的增強子數據庫
EnhancerAtlas:人和小鼠的增強子數據庫
FANTOM5:人類增強子數據庫
TiED:人類組織特異性增強子數據庫
HEDD:增強子疾病相關數據庫
HACER:human增強子數據庫
SEdb:超級增強子數據庫簡介
dbSUPER:人和小鼠中的超級增強子數據庫
dbCoRC:核心轉錄因子數據庫
使用ROSE鑒定超級增強子
??18年文章目錄
2018年推文合集
掃描下方二維碼,關注我們,解鎖更多精彩內容!
生物信息入門
只差這一個
公眾號
總結
以上是生活随笔為你收集整理的MDR的进阶版本-GMDR的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Java——》汉字转拼音
- 下一篇: 服务器的svnserver修改密码