如何判断基因组的重复区域_Nat Comm. | 15万人类基因组中多核苷酸变异(MNV)的起源及功能研究...
生活随笔
收集整理的這篇文章主要介紹了
如何判断基因组的重复区域_Nat Comm. | 15万人类基因组中多核苷酸变异(MNV)的起源及功能研究...
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
前沿生物大數據分析(93)
撰文:存在一棵樹
IF=11.878
推薦度:?????
亮點:通過基因組聚合數據庫(gnomAD)對125,748個外顯子組數據和15,708個全基因組測序數據的MNV變異數據進行了變異發現,并研究了已知突變機制(CpG脫氨基、聚合酶zeta的復制錯誤和重復連接處的聚合酶滑移)對MNV產生的相對影響。
2020年5月27日麻省理工大學和哈佛大學博德研究所的基因組聚合數據庫(gnomAD)Daniel G. MacArthur團隊在《Nature Communications》雜志上領銜發表了一篇系列研究論文“Landscape of multi-nucleotide variants in 125,748 human exomes and 15,708 genomes”。該研究系統分析了來自基因組聚合數據庫(gnomAD)的125,748個完整外顯子組和15,708個完整基因組的MNV,并在整個基因組中鑒定出1,792,248個MNV,其中包括18,756個變體對蛋白質序列具有新型組合作用。除此之外該團隊還研究了已知突變機制對MNV產生的相對影響。
MNV(Multi-nucleotide variant)變異是指一定距離內(2bp)兩個或以上的變異在同一條染色體上出現,如下圖1a所示。在同一密碼子中發現MNV中的變體時,其總體影響可能與單個變體產生的功能后果不同,如下圖1b所示的兩個變體分別被預測為具有錯義后果,但是結合起來的MNV導致無意義的變體,MNV的變異組合作用可能會影響到生物學及臨床遺傳學的決策結果。在進行MNV識別鑒定過程中,不僅需要要準確地鑒定發生在同一染色體上(順式)的MNV,還需要鑒定發生在不同染色體上(反式)的MNV。現有的常見讀取策略分為三階段:基于相位讀取的階段,評估附近的變體是否在DNA測序數據的相同讀取中共同分離;基于家庭的階段,評估是否在家庭中共同繼承了成對的變體;基于人群的階段,利用大量基因型群體成員之間的單體型共享來進行階段的統計推斷。在此項目中,團隊采用此策略進行數據讀取并使用了基于相位的傳輸(PBT),基于家庭的相位調整方法,評估了數據讀取的階段特異性,并發現超過99.8%的MNV通過基于讀的階段確定與基于PBT三重奏的階段一致,如圖1c所示。從gnomAD 2.1數據集中的125,748個外顯子組測序個體中發現了在同一密碼子中存在31,575個MNV,其中約60%(18,756 MNV)對蛋白質產生的功能影響與單個變體的獨立影響不同。圖2是對MNV不同的功能性結果的注釋,其中407個是無意義化(Gained,即兩個SNV都不是無意義突變,但最終MNV為無意義突變),另有1821個屬于補救(Rescued,即兩個SNV中一個無意義,另一個會導致功能性突變,但最終MNV為無意義突變)。對MNV的功能性注釋可以有效的降低LoF注釋錯誤(即在已有突變情況下對其功能性變異的預測),但其在罕見病診斷中占比較低。如下圖3所示,MNV突變起源的主要有以下三個類別:1)不同單核苷酸突變事件(SNV)的組合;2)聚合酶zeta引起的復制錯誤;3)重復連接處的聚合酶滑移事件。且不同變異機制的變異規律不同,在SNV組合事件中一般兩次變異事件相互獨立,但在特殊情況下一個變異發生后導致序列環境由非CpG變成CpG序列則會引起MNV變異概率增加;在聚合酶zeta引起的復制錯誤中,90.8%的GA都會變異為TT,而80.5%的GC則會變異為AA,如圖3b-d。全部的MNV變異分布統計如圖4a所示,根據ENCODE數據庫中的注釋對基因組不同功能區域統計后發現在不同功能區域的MNV發生規律不同,如圖4b-d。如在內含子區域更容易發生CG->TA和CA->TG的變異,而在轉錄起始位點更容易發生AG->CC變異。當MNV中的變異不是獨立關系時,其功能注釋對于臨床分析的意義便非常重要。在進行臨床功能性變異預測判斷時需要注意MNV的聯合影響,特別是其中的Gained與Rescued無義變異。教授介紹Konrad J. Karczewski,Ben Neale小組Broad研究所的計算生物學家,致力于外顯子組測序數據的大規模分析。在普林斯頓大學攻讀了分子生物學的本科學位,接受Mike Snyder和Stephen Montgomery的推薦于斯坦福大學獲得生物醫學信息學博士學位,專門研究定量和計算生物學。后與丹尼爾·麥克阿瑟(Daniel MacArthur)合作后的工作重點是人類功能喪失的變異,專注于組裝和分析大規模的遺傳變異公共數據集,并開發新的策略來利用這些數據來輔助推定疾病變異,以便更好地區分因果變異并增進我們對人類生物學的理解。參考文獻1、Wang, Q., Pierce-Hoffman, E., Cummings, B.B. et al. Landscape of multi-nucleotide variants in 125,748 human exomes and 15,708 genomes. Nat Commun 11, 2539 (2020).>>>關于我們<<<
總結
以上是生活随笔為你收集整理的如何判断基因组的重复区域_Nat Comm. | 15万人类基因组中多核苷酸变异(MNV)的起源及功能研究...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 泽润取名和男孩兔宝宝搭配好吗?
- 下一篇: 撸字怎么读?