Nat Commun |完全开源!肿瘤基因组数据报告解读平台,可满足商业报告解决方案...
隨著精準醫療的不斷發展,科學研究和臨床應用中對癌癥基因組數據的解讀需求也在增加。雖然目前癌癥測序數據分析流程的自動化提高了報告的速度和結果的可重復性,通過使用交互而非靜態報告,臨床對復雜基因組數據的理解有所改善。但仍然有部分結果的解釋難以實現自動化。因此,基因組數據解讀仍然是推廣精準醫學最大的瓶頸之一。
目前,各機構的目標是標準化實驗室方法甚至生物信息工具的工作流程,但報告和注釋工作流程仍然各不相同,且尚沒有用于腫瘤學測序報告的開源網絡應用程序。
近日,加拿大Michael Smith基因組科學中心等單位的聯合研究團隊在Nature?Communications發表了題為“A platform for oncogenomic reporting and interpretation”的文章,報道了一個自主開發的完全開源的研究平臺——Platform for Oncogenomic Reporting and Interpretation (PORI)。該平臺可以通過知識庫匹配將不同的注釋集成到精確的腫瘤基因測序工作流程中,并為用戶提供一個報告界面,以管理、編輯和與結果數據交互。研究團隊表示,PORI可以替代商業報告解決方案,適用于精準腫瘤學的全面基因組數據解讀,有效促進精準醫學的普及和發展。
文章發表在Nature?Communications上
主要研究內容
PORI可進行靈活的開源報告
研究團隊表示,PORI是為了促進全基因組和轉錄組測序數據的自動化分析而開發的,通過提供一個開源報告平臺以實現報告的一致性,以支持精確的腫瘤學研究。PORI平臺由兩個主要組件組成:知識庫(GraphKB)和報告工具(Integrated Pipeline Reports, IPR)。
知識庫組件GraphKB主要將來自患者數據的變體與文獻中已知的注釋關聯起來,可以整合疾病、藥物和基因本體論、生物學證據和來自大量外部數據庫的治療意義。作為標準精準腫瘤學工作流程的一部分,GraphKB通過創建報告的Python模塊注釋患者突變體。因此,GraphKB既是一個獨立的知識庫,也是一個綜合的解決方案。
PORI的報告組件IPR是一個網絡應用程序,接收來自GraphKB集成提供的證據。IPR可用于基因組分析和相應圖形的可視化和傳遞,通過交互式網頁應用程序以及相應的文檔格式,例如PDF,生成適合為臨床人員提供的數據報告。GraphKB和IPR高度集成,這種設計旨在促進臨床相關內容的管理。
圖1. PORI分析框架示意圖,來源:Nature Communications
GraphKB提高了知識庫源的一致性
越來越多的癌癥知識庫已公開可用,為聚集和整合外部臨床和生物學知識到癌癥基因組分析提供了機會。GraphKB支持從多個外部知識庫加載內容,以及直接添加內容。每個知識庫包含獨特的信息,分別與疾病的治療、診斷、預后和癌癥相關變異等相關。通過比較這些內容,可以確定知識庫源之間的一致性。
圖2. GraphKB數據集成示意圖,來源:Nature Communications
例如,在規范化之前,有769個獨特的臨床資料結論,在使用本體關系對主題和相關術語進行規范化之后,共得到696個獨特的結論,表明雖然不同來源的資料最初看起來可能具有完全不同的內容,但其中部分內容實際上是共享的。因此,通過使用圖形模型對內容進行規范化,能夠更好地量化一致性。
圖3. 不同來源臨床信息資源整合前后的比較,來源:Nature Communications
GraphKB提高了整合外部臨床資源的能力
利用現有臨床資源(例如臨床試驗注冊)的能力是知識庫內容最吸引人的用處之一。但是,其中許多資源不使用標準詞匯。為了導入臨床資源并將其與患者數據相關聯,知識庫內的詞匯表要與所使用的術語相匹配,這個過程高度依賴于涵蓋臨床資源所使用術語知識庫中的標準詞匯表。
與其他知識庫相比,GraphKB并不強制使用單一的首選或標準詞匯,而是在導入期間對來自外部知識庫的條目結構進行標準化,以匹配原始術語和特性。因此,每個數據集定義的鏈接可以相互引用,以此減少了所需的詞匯數量。
圖4. GraphKB 網頁應用程序的內容和可視圖,來源:Nature Communications
使用外部數據檢驗PORI的實用性
為了證明PORI在使用外部數據和支持多種數據類型方面的靈活性,研究人員使用PORI分析了來自TCGA的隊列數據,在所有納入分析的基因數據中,有37916個表達異常值,28272個獨特的蛋白質編碼小突變,50124個拷貝變體和527個獨特的融合基因。
在這些樣本中,88.2%可匹配一種或多種治療方案,其中38.1%匹配一級美國分子病理學會 (Association for Molecular Pathology, AMP)證據水平。當考慮疾病類型時,62.4%有治療性資料陳述,其中34.8%符合一級AMP證據水平。
圖5. 利用PORI對TCGA樣本進行治療匹配,來源:Nature Communications
與此同時,大部分樣本的治療匹配來自單一的變異類型,說明了包含多種變體類型的重要性。如果在GraphKB集成和報告中只包含一種單一的變異類型,那么根據選擇的變異類型,無治療匹配的樣本數量將最少增加25.0%。由于所用公共知識庫資源中覆蓋面較大,PORI可以從與特定變異類型相關的信息中觀察到與治療匹配的關鍵突變,提高治療匹配的患者比例。
圖6. 根據每種變異類型組合中獲得的治療匹配樣本的比例,來源:Nature Communications
結 語
基因組技術和生物信息學研究的快速發展為腫瘤的精準治療提供了重要研究手段,同時也帶來了重大挑戰。因此必須開發簡單有效的平臺和分析流程,使其能夠輕松地整合各種數據資源。該研究報道的PORI通過模塊化報告解決了這一問題,在模塊化報告中,可以根據需要添加或刪除與特定專門分析相對應的部分。
雖然PORI邁出了為精確腫瘤基因組報告創建開源標準工具的重要第一步,但其發展仍有許多需要完善的部分。最令人興奮的領域也許是在分析過程中從用戶操作中捕獲數據的應用,以迭代地改進和進一步自動化未來的分析。
參考文獻:
1. Reisle, C., Williamson, L.M., Pleasance, E. et al. A platform for oncogenomic reporting and interpretation. Nat Commun 13, 756 (2022).
2. Tate, J. G. et al. COSMIC: the catalogue of somatic mutations in cancer. Nucleic Acids Res 47, D941–D947 (2019).
3. Wagner, A. H. et al. A harmonized meta-knowledgebase of clinical interpretations of somatic genomic variants in cancer. Nat. Genet. 52, 448–457 (2020).
·?END?·
往期精品(點擊圖片直達文字對應教程)
機器學習
后臺回復“生信寶典福利第一波”或點擊閱讀原文獲取教程合集
”吧
總結
以上是生活随笔為你收集整理的Nat Commun |完全开源!肿瘤基因组数据报告解读平台,可满足商业报告解决方案...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 编译Qt“NMAKE:fatal err
- 下一篇: 分子结构模拟工具UCSF Chimera