如何使用plink进行连锁不平衡分析
本篇文章為大家展示了如何使用plink進行連鎖不平衡分析,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。
plink是進行連鎖不平衡分析的常用工具之一,需要兩個基本的輸入文件,后綴分別為ped和map。ped文件格式在之前的文章中已經詳細介紹過,這里只介紹map文件。
map文件主要保存SNP位點的名稱和位置信息,內容如下
1snp101 1snp202
共4列,每一行代表一個SNP位點,第一列代表SNP位點所在染色體的名字,第二列代表SNP位點的ID,通常是rs編號,也可以是自定義的ID;第三列代表SNP位點的遺傳距離,如果沒有實際數值可以用0填充;第四列代表SNP位點在染色體上的位置。
plink 進行LD分析有以下兩種方式:
1. 分析指定的兩個SNP位點
命令如下
plink--filetest--ldsnp1snp2
在log信息中,會輸出LD分析的結果
LDinformationforSNPpair[snp1snp2] R-sq=0.009D'=0.163 HaplotypeFrequencyExpectationunderLE -------------------------------------- AG0.1160.139 CG0.3000.278 AT0.2170.194 CT0.3660.389 InphaseallelesareAT/CG Analysisfinished:SatJun2311:48:352018
給出了R2和D’ 兩個值,同時還給出了不同單倍型的頻率。
2. 對所有的SNP位點進行分析
命令如下:
plink--filetest--r plink--filetest--r2
--r會直接輸出所有LD分析的結果,而--r2會根據R2值對結果進行過濾。在實際分析中,SNP位點個數是非常多的,如果不進行過濾,結果文件會非常的大。過濾的參數有以下幾種
- 
--ld-window
 默認值為10,這個參數限定了一個SNP位點最多和10個其他的SNP位點進行LD分析。
- 
--ld-window-kb
 默認值為1Mb, 只對距離在1Mb之內的SNP位點進行分析。
- 
--ld-window-r2
 這個參數只能和--r2參數搭配使用,默認值為0.2, 對輸出結果進行過濾,只輸出R2大于該參數值的LD分析結果。
輸出文件為plink.ld。這個文件給出了SNP位點間的R值或者R2值,示例如下
CHR_ABP_ASNP_ACHR_BBP_BSNP_BR 11snp112snp2-0.108465
通過指定--ld-snp參數,也可以只分析某個SNP位點與其他位點的連鎖關系,用法如下
plink--filetest--r2--ld-snpsnp1--ld-window-kb1000--ld-window99999--ld-window-r20
以上兩種方法更有優劣,第一種方法會給出D’和R2兩個值,第二種方法只會給出R值;第一種方法一次只能分析兩個SNP位點間的連鎖關系,而第二種方法一次可以分析多個SNP位點間的連鎖關系。
總結
以上是生活随笔為你收集整理的如何使用plink进行连锁不平衡分析的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: 电子徽章:融创意、疯狂与电子设计中
- 下一篇: sizeof你真的弄明白了吗?来看看这个
