GTRD:最全面的人和小鼠转录因子chip_seq数据库
歡迎關注”生信修煉手冊”!
GTRD從SRA, GEO, ENCODE等公共數據庫中收集轉錄因子相關的chip_seq數據,采用標準流程進行peak calling分析,并基于已有的轉錄因子motif數據,預測了轉錄因子結合位點TFBS, 數據庫網址如下
http://gtrd.biouml.org/
整個數據庫構建的pipeline示意如下
采用bowtie2將reads與基因組進行比對,并利用MACS,SISSRS等4款軟件進行peak calling, 得到轉錄因子的peak區域。
對于同一個轉錄因子,同一種peak caling軟件得到的peak區域,如果兩個peak區間的中心距離小于50bp的話,就合并為一個區間,此采用這種方式來對原始的peak進行聚類,即cluster。
對于同一個轉錄因子,多種peak calling軟件得到的所有peak區域,將peak中心小于50bp的peak區間歸類為一組,并從中根據軟件的優先級選取一個peak作為代表,各個軟件優先級從高到低為GEM, PICS, MACS, SISSRs,這種聚類方式稱之為MetaClusters, 構建出一個轉錄因子所有的非冗余peak區間。
該數據庫常用的使用場景如下
1. 查詢轉錄因子chip_seq原始數據
2. 查找基因上的轉錄因子結合位點
3. 查詢轉錄因子的靶基因
除了在線查詢外,該數據庫還開放下載功能, 鏈接如下
http://gtrd.biouml.org/downloads/19.04/chip-seq/
GTRD收錄的轉錄因子的數據最多最全面,其查詢轉錄因子靶基因的功能真的是非常實用。
·end·
—如果喜歡,快分享給你的朋友們吧—
掃描關注微信號,更多精彩內容等著你!
總結
以上是生活随笔為你收集整理的GTRD:最全面的人和小鼠转录因子chip_seq数据库的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 什么是NAS.什么是黑白群晖?(转)
- 下一篇: 贝壳如何docker安装openwrt_