vbn中使用的3种流程控制结构是_细菌进化树构建:从模式种序列下载到构建系统发育树一键搞定...
細菌進化樹
?
構(gòu)
建
細菌進化樹構(gòu)建:從模式種序列下載到構(gòu)建系統(tǒng)發(fā)育樹一鍵搞定
對于細菌新種或者新屬的發(fā)現(xiàn),總是那么讓人期待,但是當我們批量獲得16S序列后,逐一對這些尚不知分類地位的序列進行比對并建樹驗證的過程,著實需要花費不少時間和精力,那么有沒有什么方法可以一鍵批量構(gòu)建系統(tǒng)發(fā)育樹幫助我們判斷細菌分類地位呢?答案是肯定的,今天就給大家分享一套一鍵化細菌建樹流程,同時流程可提示是否為新種或者新屬(提示:本文實操需要讀者有一定的linux基礎(chǔ))。
流程下載鏈接請于公眾號后臺回復(fù):細菌進化樹流程,以獲取下載鏈接~
流程思路
01
模塊介紹
02
溫馨提示:本段所有實例截圖將合并在本段末尾,可通讀后一并參考。
Step1序列拆分。流程允許一次提供多個16S序列,最終結(jié)果將展示在同一個進化樹中。為了準確判斷每個序列的分類地位,流程首先對多序列進行拆分。
Step2序列比對。對于拆分出的每一條序列,與本地EzBioCloud數(shù)據(jù)庫進行比對。
Step3判斷是否為新種(新屬),并獲取相關(guān)屬列表。該步同時判斷主干和外群屬信息。
Step4獲取模式種列表。流程將對主干屬查詢?nèi)恳呀?jīng)發(fā)表的模式種(基于EzBioCloud和LPSN),對外群屬查詢給定數(shù)量的模式種。
Step5獲取全部模式種的16S序列。流程將優(yōu)先從本地EzBioCloud數(shù)據(jù)中抓取,未能抓取到的模式種將嘗試下載。
Step6比對。基于megacc對獲取到的全部序列進行比對。
Step7構(gòu)建NJ樹。基于megacc構(gòu)建NJ樹。
Step8構(gòu)建ML樹。基于megacc計算最優(yōu)模型,并使用最優(yōu)模型構(gòu)建ML樹。
Step9整理結(jié)果。流程將對主要中間結(jié)果和最終結(jié)果進行整理,并打包。
滑動查看更多
流程目錄
03
流程使用
04
4.1?軟件依賴
(1)python3 流程腳本全部使用python3解釋,需要使用者自行安裝;
(2)blast、makeblastdb 比對過程使用,需要使用者自行安裝;
(3)mega 流程中自帶,在Software目錄中,若版本不合適,可自行更換。
4.2?配置文件
流程首次運行之前需要對默認配置進行更改,用以指定軟件路徑及相關(guān)配置文件的路徑。
(1)默認配置文件 Config/config.txt,需要更改的參數(shù)為zip、python3、blastn、makeblastdb、mega、clustal_align_nucleotide、infer_NJ_nucleotide、model_sel_ml_nucleotide、infer_ML_nucleotide;
(2)megacc軟件配置文件可以直接使用默認,如有閾值等參數(shù)的更改可以進行調(diào)整,涉及到的文件有clustal_align_nucleotide(比對配置)、infer_NJ_nucleotide(NJ建樹配置)、model_sel_ml_nucleotide(ML模型計算配置)、infer_ML_nucleotide(ML建樹配置)。
4.3?流程運行
主流程位于Bin目錄中,是一個makefile,需要用make進行解釋,命令示例如下:
make -f auto_tree.mk Outdir=./ Query=test.fa All
Outdir:結(jié)果輸出目錄,沒有會被創(chuàng)建,所有結(jié)果保存在 Outdir 中的 Result 文件夾內(nèi);
Query:待分析序列,可以同時提供多個,所有序列將一同建樹。
4.4?目錄結(jié)構(gòu)
4.5?結(jié)果解釋
(1)all_tree.fa 包含主干及外群在內(nèi)的所有模式種16S rDNA 序列,其中外群序列為該屬第一株模式種;
(2)all_tree.species建樹所用的所有模式種信息,與 all_tree.fa 對應(yīng);
(3)M10CC_algn.meg使用給定設(shè)置參數(shù)對all_tree.fa比對獲得的 alignment 文件;
(4)M10CC_ML.nwk使用給定設(shè)置參數(shù)得到的Maximum Likelihood 樹;
(5)M10CC_ML_consensus.nwk從所有的bootstrap、sample ML trees 中得到的 bootstrap consensus 樹;
(6)M10CC_NJ.nwk使用給定設(shè)置參數(shù)得到的neighbor-joining樹;
(7)M10CC_NJ_consensus.nwk從所有的bootstrap sample NJ trees 中得到的 bootstrap consensus 樹;
(8)SplitSeq_*_1Seq.blast拆分序列與數(shù)據(jù)庫的比對結(jié)果, blastn 的標準 m8 格式;
(9)SplitSeq_*_1Seq.class拆分序列的分類地位判斷結(jié)果文件,"#genus"表示可以確定到屬(是否可能為新種需要查看SplitSeq_*_1Seq.blast文件),"#family"表示可以確定到科(即可能為新屬)。
/ Last word /
BIOChrome致力于建立考研學(xué)子與調(diào)劑導(dǎo)師溝通橋梁,專注科研前沿和熱點,聊科研趣事,為科研工作者提供交流和學(xué)習(xí)的平臺,希望大家踴躍參與討論啊!~
--END--
排版 | A_X
圖片 |兔兔團子&江少
文字 | 江少
『BIOChrome』
總結(jié)
以上是生活随笔為你收集整理的vbn中使用的3种流程控制结构是_细菌进化树构建:从模式种序列下载到构建系统发育树一键搞定...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: openstack管理员手册下载_城市绿
- 下一篇: no.7_qzhai 开心版_传世霸业超