glean工具和maker工具
glean工具
當用各類工具完成了注釋后,一個問題是,每一個基因組區域,都會獲得大量redundant的基因結構注釋,到底哪一個注釋才是最可靠的?所以,我們需要一個整合工具。
有一種工具是通過統計打分,先手工注釋一些基因,然后把所有的自動注釋結果跟手工注釋比較,給各個工具打個分,最后用這個打分矩陣擴展到所有的基因上。常用的有glean,它不需要training。
GLEAN是一個無監督的學習系統,可以整合不同來源的基因結構證據(基因模型預測,EST /蛋白質基因組序列比對,SAGE /肽標簽等)以產生一致性的基因預測,而無需事先訓練。
我們使用GLEAN創建了蜜蜂(Apis mellifera)的共有基因集,這是一種新算法,該算法使用潛在類別分析來在不存在已知基因的情況下自動整合不同的基因預測證據。與任何一種輸入基因預測相比,共有基因模型在不犧牲質量的情況下增加了蜜蜂基因的代表性。當與手動注釋的金標準進行比較時,基因模型的共有集在質量上與每個輸入集相似或更高。
GLEAN是將基因列表組合到單個參考集中的有效方法。
evidence modeler是pasa的開發者做的另一個工具,文檔詳細,使用簡單,而且它自帶很多格式轉換代碼,雖然這個工具也需要training,但是它也可以人工打分,雖然人工給的不是最好 http://evidencemodeler.sourceforge.net/
參考來源:
https://genomebiology.biomedcentral.com/articles/10.1186/gb-2007-8-1-r13
maker工具
從頭構建一個物種的基因組,至少包含三個步驟:序列拼接、基因結構注釋和基因功能注釋。
其中,基因結構注釋原理上是最為復雜的,需要首先根據序列結構、已有的轉錄本序列、蛋白序列,尋找基因結構的證據,然后對這些證據進行整合,給出最終判斷。在注釋之前,還要考慮重復序列的影響。
MAKER 是一款強大的結構注釋流程,它整合了所有以上步驟涉及到的主流算法和軟件,使我們能夠快速完成基因結構注釋。
本課程介紹基因結構注釋的原理以及 MAKER 的用法。
MAKER官網:http://www.yandell-lab.org/software/maker.html
MAKER軟件使用說明
輸入文件,主要有三個(fasta格式):
基因組序列、RNA序列(ESTs/cDNA/mRNA transcripts)、相關或者近源物種的蛋白質序列
運行maker –CTL,生成如下三個文件:
?maker_exe.ctl- contains the path information for the underlying executables.
?maker_bopt.ctl- contains filtering statistics for BLAST and Exonerate
?maker_opt.ctl- contains all other information for MAKER, including the location of the input genome file.
修改中的maker_opts.ctl的參數。
運行maker
參考來源:
http://www.genek.tv/course/52
http://blog.sina.com.cn/s/blog_83f77c940102vzeo.html
總結
以上是生活随笔為你收集整理的glean工具和maker工具的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 教你win10系统显卡驱动安装失败的解决
- 下一篇: 电信光猫tewa-708e超级密码_天翼