Nat Methods | 王艇/李道丰实验室扩展WashU Epigenome Browser的3D基因组可视化功能
三維?(3D)?基因組結構對于基因調控和細胞功能至關重要。基于染色體構象捕獲(chromosome conformation capture)的高通量技術已被廣泛用于研究全基因組染色體的物理相互作用。這些交互作用一般用二維熱圖?(heatmap)或裝飾基因組特征的交互網絡來實現可視化。此外,一些使用基于模型的交互數據的計算方法已經開發出來,例如約束物理模型(constrained physical models)、聚合物模型(polymer models)和基于群體的分析(population-based analysis),用來預測染色體的物理三維結構。大型數據聯盟,例如 ENCODE、Roadmap 和 4D Nucleome,已經在眾多細胞類型和組織中生成了數以萬計的轉錄因子結合位點和表觀遺傳標記的全基因組數據集。生物學家希望直觀地探索這些全基因組圖譜和 3D 基因組結構之間的聯系,這將有助于產生和檢驗各種科學假設。這些需求對傳統的基因組瀏覽器提出了挑戰,因為大多數基因組數據在一維線性基因組坐標中進行可視化。王艇課題組在2011年開發了華大表觀基因組瀏覽器(WashU Epigenome Browser),作為一種交互式工具,用于在網絡瀏覽器中探索基因組數據。經過十余年的加工,拓展和創新,華大表觀基因組瀏覽器已成為基因組學研究的重要工具,和UCSC Genome Browser,Ensembl Genome Browser 并為行業標桿。WashU Browser 團隊近期擴展了WashU Browser的功能,可以讓研究人員在單個網頁上直觀地探索 1D、2D 和 3D 基因組數據。主要的創新是將線性基因組坐標關聯到多分辨率的 染色體3D 模型上。
2022年7月21日,圣路易斯華盛頓大學遺傳系王艇教授和李道豐教授團隊在Nature Methods發表了題為Exploring genomic data coupled with 3D chromatin structures using the WashU Epigenome Browser的文章,介紹了基于WashU Epigenome Browser擴展的3D基因組可視化功能(Nat Methods | 馬堅實驗室開發用于多模態三維基因組數據可視化平臺)。
WashU Browser團隊開發了一個新的文件格式叫做g3d,并且提供了一個基于Python的工具g3dtools(https://github.com/lidaof/g3d)用來生成這種新格式的數據。這個二進制的格式主要的優點是對于網絡請求十分友好,設計類似于UCSC的Bigwig格式,這個格式可以用于存儲多個分辨率或多個細胞的3D數據。
秉承WashU Browser一貫關注易用性和實用性的傳統,生成 的g3d文件可以放在網站上提供一個web URL給Browser或者直接從本地上傳到Browser進行可視化。提交g3d文件后,Browser會打開一個新的面板(panel)用來展示3D結構,同時主面板的常規基因組瀏覽器可以用來與3D顯示模塊進行交互(如圖1所示)。基因,Hi-C圖的loop都可用在3D結構中進行標記高亮。數值型數據例如bigwig可以用來給3D結構調色,根據數據值的高低3D結構會呈現不同的顏色梯度。注釋型數據例如chromHMM,compartment也可以將3D結構的不同區域調成相應的顏色。3D 模塊使查看染色質環(chromatin loop)和拓撲相關域?(Topologically associated domains, TADs)變得直觀。
WashU Browser團隊從發表的文獻中搜集了11045個3D模型,大多數模型都是從單細胞數據中研究得來。研究人員也可以上傳自己的3D結構與已有數據進行比較。基因組技術和計算算法的最新進展為探測染色質相互作用和生成 3D 模型提供了前所未有的機會。這些模型不僅有助于研究 3D 基因組的形成和功能,而且還提供了不同的范例來顯示基因組數據并與之交互。傳統的基因組瀏覽器將基因組數據錨定在一維線性軸上,模擬解開和拉直基因組 DNA 的過程。這個過程使覆蓋基因組數據變得方便和直接;然而它破壞了染色質的空間結構。研究人員通過將線性坐標關聯3D 模型來維持基因組 DNA 的 3D 結構。該方法將線性基因組與 3D 空間位置,以及相應的可視化工具進行無縫整合。這使研究人員可以直觀地探索 3D 特征,例如loop和 TADs; 在 3D 基因組坐標上可視化所有基因組數據;并探索 3D 基因組結構的動態性。
王艇教授是美國圣路易斯華盛頓大學遺傳系Sanford and Karen Loewentheil Distinguished Professor of Medicine,同時也是計算機科學與工程的教授,兼任McDonnell Genome Institute的科研主任。王艇教授長期領導大型國際項目例如ENCODE,Roadmap,4DN,TaRGET以及當前最新的人類泛基因組計劃(Human Pangenome Project)和IGVF(Impact of Genetics Variation on Function),funding多多。李道豐博士在王艇實驗室經過博士后深造后晉升教授,長期主持WashU Browser 項目。Browser團隊目前正在招人,歡迎感興趣的老師和同學聯系(http://wang.wustl.edu/)。
測試數據及快速指南:https://github.com/lidaof/eg-3d-demo
詳細文檔:https://eg.readthedocs.io/en/latest/3d.html
視頻教程(B站):https://www.bilibili.com/medialist/play/438038855?from=space&business=space_series&business_id=608067&desc=1&spm_id_from=333.999.0.0
原文鏈接:
https://www.nature.com/articles/s41592-022-01550-y
制版人:十一? 責編 | 兮? 來源:BioArt
IGV基因組瀏覽器可視化高通量測序數據
高通量數據分析必備-基因組瀏覽器使用介紹 - 1
高通量數據分析必備-基因組瀏覽器使用介紹 - 2
高通量數據分析必備-基因組瀏覽器使用介紹 - 3
往期精品(點擊圖片直達文字對應教程)
機器學習
后臺回復“生信寶典福利第一波”或點擊閱讀原文獲取教程合集
總結
以上是生活随笔為你收集整理的Nat Methods | 王艇/李道丰实验室扩展WashU Epigenome Browser的3D基因组可视化功能的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 海贼王结局
- 下一篇: java svg png_java ba