CARD耐药数据库Linux使用
一、背景
關(guān)于耐藥性有很多數(shù)據(jù)庫可以使用,但是CARD的優(yōu)勢在于數(shù)據(jù)庫較為準(zhǔn)確,只有經(jīng)過文章進(jìn)行驗證后的基因才會被記錄
二、軟件鏈接
軟件github:
GitHub - arpcard/rgi: Resistance Gene Identifier (RGI). Software to predict resistomes from protein or nucleotide data, including metagenomics data, based on homology and SNP models.https://github.com/arpcard/rgi#check-database-version軟件文章:
CARD 2017: expansion and model-centric curation of the comprehensive antibiotic resistance database | Nucleic Acids Research | Oxford Academic (oup.com)https://academic.oup.com/nar/article/45/D1/D566/2333912軟件web版本:
The Comprehensive Antibiotic Resistance Database (mcmaster.ca)https://card.mcmaster.ca/home
?
三、下載安裝
在linux系統(tǒng)上安裝較為簡單,可以直接使用conda進(jìn)行安裝
conda create --name rgi conda install --channel conda-forge --channel bioconda --channel defaults rgi可以直接下載軟件后手動進(jìn)行安裝
########安裝 wget https://card.mcmaster.ca/latest/software tar -jxvf card-software.tar.bz2 tar -zxvf 5.2.1.tar.gz cd rgi-5.2.1/ conda env create -f conda_env.yml conda activate rgi pip install . -i https://pypi.tuna.tsinghua.edu.cn/simple四、具體使用
使用時需要先添加對應(yīng)的數(shù)據(jù)庫
wget https://card.mcmaster.ca/latest/data tar -xvf data ./card.json ######local版本 rgi load --card_json /path/to/card.json --local ######system版本 rgi load --card_json /path/to/card.json添加數(shù)據(jù)庫后rgi有三種使用方式,對應(yīng)不同的數(shù)據(jù)
RGI main (Genomes, Genome Assemblies, Metagenomic Contigs, or Proteomes)
RGI bwt (Metagenomic Short Reads, Genomic Short Reads)
RGI kmer_query (K-mer Taxonomic Classification)
后兩種目前暫未發(fā)表
rgi main -i test.fa -o test -t contig --include_loose --local --clean其中-t 為模式可選擇輸入contig或是蛋白序列,--include_loose輸出時會有l(wèi)oose的結(jié)果,--local是使用前面添加的local數(shù)據(jù)庫,--clean會將對應(yīng)的臨時文件刪除只留下結(jié)果文件
如果為contig軟件會自動進(jìn)行ORF的查找,使用Prodigal軟件進(jìn)行查找,如果無法找到對應(yīng)的ORF,則不會進(jìn)行后續(xù)的分析,所以可能會導(dǎo)致假陰性的結(jié)果,并且軟件默認(rèn)小于30bp的不會進(jìn)行分析,如果contig的質(zhì)量不好以及序列較短,需要加上--low_quality參數(shù),如果提交的是蛋白序列則會跳過ORF預(yù)測這一步,直接進(jìn)行數(shù)據(jù)庫的比對,使用的是blast和diamond,默認(rèn)是blast,查找對應(yīng)的同源基因,其中還有剩余的多個模式protein variant model、rRNA gene variant model、protein overexpression model
最終會生成兩個文件txt和json文件,文件結(jié)果在github上有具體說明
?
?其中Best_Hit_ARO對應(yīng)相關(guān)的耐藥基因
總結(jié)
以上是生活随笔為你收集整理的CARD耐药数据库Linux使用的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 系统宕机
- 下一篇: arm linux免驱usb声卡,arm