Annovar 软件注释流程
第一步:下載Annovar
上Annovar官網(wǎng)下載(http://annovar.openbioinformatics.org/en/latest/user-guide/download/),現(xiàn)在要郵件注冊(cè)后才能下載。郵件注冊(cè)后會(huì)給你最新版軟件下載地址,
下載后文件為annovar.latest.tar.gz。
第二步:安裝Annovar
linux系統(tǒng)下用該命令解壓
tar zxvf annovar.latest.tar.gz
解壓后生成annovar文件夾,里面有6個(gè)perl腳本程序和兩個(gè)文件夾,其中一個(gè)是example文件夾,另一個(gè)是已經(jīng)建立好的hg19或者GRCh37的humandb的數(shù)據(jù)庫(kù)文件夾,可用于人的注釋。
第三步:使用Annovar
人的注釋方法,官網(wǎng)介紹的很詳細(xì),但僅僅有人的數(shù)據(jù)庫(kù)肯定是滿足不了大家的需求。
下面以小鼠mm9為例子,介紹如何自己構(gòu)建一個(gè)mousedb數(shù)據(jù)庫(kù)。
先在annovar文件夾里面創(chuàng)建mousedb文件夾(名字可自取),命令
mkdir mousedb
然后使用annovar文件夾下的perl程序annotate_variation.pl
perl annotate_variation.pl -downdb -buildver mm9 -webfrom annovar refGene mousedb/
這個(gè)命令能實(shí)現(xiàn)的是幫忙下載mm9的refGene的文件,保存在mousedb文件下,自動(dòng)解壓后文件名為mm9_refGene.txt。
然后程序會(huì)提示使用以下兩個(gè)命令繼續(xù)建庫(kù)
annotate_variation.pl --buildver mm9 --downdb seq mousedb/mm9_seq
retrieve_seq_from_fasta.pl mousedb/mm9_refGene.txt -seqdir mousedb/mm9_seq -format refGene -outfile mousedb/mm9_refGeneMrna.fa
同樣在annovar文件下運(yùn)行這兩個(gè)perl程序
perl annotate_variation.pl --buildver mm9 --downdb seq mousedb/mm9_seq
通過(guò)這個(gè)命令,會(huì)在mousedb下創(chuàng)建文件夾mm9_seq,并且在里面下載mm9的基因組文件chromFa.tar.gz,perl程序幫忙解壓后是按染色體分開(kāi)的fasta格式文件。
然后繼續(xù)運(yùn)行perl程序
perl retrieve_seq_from_fasta.pl mousedb/mm9_refGene.txt -seqdir mousedb/mm9_seq -format refGene -outfile mousedb/mm9_refGeneMrna.fa
該程序會(huì)會(huì)在mousedb下創(chuàng)建mm9_refGeneMrna.fa文件,是根據(jù)mm9_refGene.txt的信息,重新構(gòu)建成的老鼠轉(zhuǎn)錄表達(dá)基因fasta格式文件。
這樣老鼠mm9 annovar gene based注釋庫(kù)就弄好了
以文本文件test.input為案例進(jìn)行測(cè)試
生成test.input的txt格式文件,根據(jù)annovar官網(wǎng)介紹,只要這最基本的五列信息就可以進(jìn)行注釋,五列分別染色體名稱(chēng),染色體上的位置,染色體上的位置,參考基因組堿基,變異堿基。
1? ?? ? 19215217? ?? ???19215217? ?? ???T? ?? ? C
1? ?? ? 33803084? ?? ???33803084? ?? ???A? ?? ? G
1? ?? ? 33803198? ?? ???33803198? ?? ???A? ?? ? G
1? ?? ? 37499237? ?? ???37499237? ?? ???T? ?? ? C
1? ?? ? 37499238? ?? ???37499238? ?? ???T? ?? ? C
1? ?? ? 37500003? ?? ???37500003? ?? ???T? ?? ? C
1? ?? ? 43826936? ?? ???43826936? ?? ???T? ?? ? C
1? ?? ? 58853960? ?? ???58853960? ?? ???A? ?? ? G
1? ?? ? 58854487? ?? ???58854487? ?? ???A? ?? ? G
1? ?? ? 60436865? ?? ???60436865? ?? ???T? ?? ? C
然后使用perl程序進(jìn)行g(shù)ene based的注釋
perl annotate_variation.pl -out test -build mm9 test.input mousedb
注釋后會(huì)生成test.variant_function,test.exonic_variant_function和test.log文件,前兩個(gè)即為所需要的文件。用這個(gè)例子輸出test.exonic_variant_function文件輸出為空
文件,因?yàn)檫@些位點(diǎn)沒(méi)有在exonic區(qū)域的,所以沒(méi)有結(jié)果。如果有位點(diǎn)在exonic中,則在test.exonic_variant_function中會(huì)更具體的描述為同義突變還是非同義突變
intronic? ?? ???Tfap2b??1? ?? ? 19215217? ?? ???19215217? ?? ???T? ?? ? C
UTR3 ? ? ? ? ? ?Bag2? ? 1? ?? ? 33803084? ?? ???33803084? ?? ???A? ?? ? G
UTR3 ? ? ? ? ? ?Bag2? ? 1? ?? ? 33803198? ?? ???33803198? ?? ???A? ?? ? G
UTR3 ? ? ? ? ? Mgat4a??1? ?? ? 37499237? ?? ???37499237? ?? ???T? ?? ? C
UTR3 ? ? ? ? ? Mgat4a??1? ?? ? 37499238? ?? ???37499238? ?? ???T? ?? ? C
UTR3 ? ? ? ? ? Mgat4a??1? ?? ? 37500003? ?? ???37500003? ?? ???T? ?? ? C
intronic? ?? ???Uxs1? ? 1? ?? ? 43826936? ?? ???43826936? ?? ???T? ?? ? C
intronic? ?? ???Casp8? ?1? ?? ? 58853960? ?? ???58853960? ?? ???A? ?? ? G
intronic? ?? ???Casp8? ?1? ?? ? 58854487? ?? ???58854487? ?? ???A? ?? ? G
intronic? ?? ???Cyp20a1 1? ?? ? 60436865? ?? ???60436865? ?? ???T? ?? ? C
?
Annovar 軟件注釋流程介紹
http://www.omicshare.com/forum/thread-1782-1-180.html
(出處: OmicShare Forum)
總結(jié)
以上是生活随笔為你收集整理的Annovar 软件注释流程的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: python ts视频转mp4
- 下一篇: Linux执行curl报错:Protoc