辽东楤木的高质量参考基因组组装和遗传转化体系开发
文章信息
題目:A High-Quality Reference Genome Sequence and Genetic Transformation System of Aralia elata
刊名:Frontiers in Plant Science
作者:Wenxuan Liu, Xiangling You et al.
單位:Northeast Forestry University
日期:2022 Mar 1?
01
摘要
?
遼東楤木是五加科楤木屬多年生木本植物。它含有豐富的皂苷,因此具有廣泛的藥理作用。在這里,我們報道了一個高質量的A. elata參考基因組,其基因組大小為 1.21 Gb,contig N50 為 51.34 Mb,由 PacBio HiFi 測序技術生產。這是龍牙屬的第一個基因組數據。通過基因組進化分析,我們探索了A. elata基因組中的系統發育和全基因組復制 (WGD) 事件。通過分析A. elata的基因組序列并結合三個組織的轉錄組數據,我們發現了與三萜皂苷生物合成相關的重要基因。此外,我們以本實驗室建立的黃曲霉胚胎愈傷組織誘導系統為基礎,建立了該植物的遺傳轉化系統。本研究獲得的基因組資源和遺傳轉化體系,為深入了解A. elata提供了新思路,為進一步探索A. elata調控機制奠定了基礎。
?
02
技術路線
?
03
主要結果
?
3.1?基因組測序、組裝和注釋
為了研究A. elata的基因組特征,進行了 17、21、25和 27的 K -mer 分布分析(圖 1A; 補充圖 1 ),分別使用 56.89 Gb 的 Illumina reads。基于 1.12 Gb 的基因組大小,Illumina reads代表 50.79 倍的覆蓋率。K -mer 分布遵循泊松分布,兩個峰分別對應于純合和雜合序列(補充圖 1)。根據K -mer 分布分析,A. elata的基因組大小估計為 1.08-1.14 Gb,基因組的雜合性比率估計為 1.60-1.69%(補充表 2)。結果表明,基因組A. elata具有高度雜合性和重復性。然后,我們使用 HiFi 技術對A. elata基因組進行測序。從兩個文庫中總共獲得了 51.14 Gb 的 HiFi 讀數用于基因組組裝。這兩個庫分別產生了總共 25.75 和 25.39 Gb 的數據(補充表 3)。使用 hifiasm 將 HiFi 讀取組裝成 contigs。最終組裝的基因組大小為 1.21 Gb,contig N50 長度為 51.34 Mb。基因組組裝包含 1,350 個 contig,最長 contig 為 100.88 Mb,平均 contig 長度為 0.89 Mb。A. elata基因組的GC含量為36.13%(表格1)。
為了評估基因組組裝的完整性,為基因組調查生成的短reads映射到基因組。總共有 99.95% 的短reads被映射到基因組,其中 99.48% 被正確配對(補充表 4)。通過BUSCO評估了基因組組裝的完整性。結果顯示,該基因組至少覆蓋了 98.8% 的 BUSCO 基因,其中 87.2% 被歸類為“完整和單拷貝”,11.6% 被歸類為“完整和重復”,0.6% 被歸類為“片段化”和 0.6%作為“缺失”(圖 1B; 補充表 5)。所有結果表明A. elata基因組組裝的質量很高。
重復序列包括串聯重復和散布重復,是基因組的重要組成部分。在這項研究中,使用從頭預測和基于同源性鑒定兩種策略來注釋A. elata基因組中的重復序列。得到的綜合結果:基因組中重復序列的比例為71.69%,高于胡蘿卜(45.95%)。最豐富的重復元件類型是長末端重復(LTR),占基因組的 49.15%,而 DNA 轉座子重復序列僅占基因組的 3.86%(補充表 6)。
?
為了注釋A. elata基因組中的蛋白質編碼基因,我們結合了從頭預測、基于同源性的搜索和來自 RNA-seq 數據的轉錄證據。最后,在基因組中注釋了總共 37,016 個基因。通過 BUSCO 評估了注釋蛋白質組的完整性和質量。結果表明,97.7%的保守基因在基因組中被注釋,其中包括93.7%和4.0%的完整BUSCO基因和4.0%片段化的BUSCO基因。BUSCO評估表明基因組注釋具有較高的準確性(圖 1B; 補充表 7)。
?
3.2?遼東楤木的基因組進化
為了揭示A. elata的進化位置,我們將基因組組裝與來自其他 11 種植物的基因組進行了比較。在這些物種中共鑒定出 250 個單拷貝基因家族。這些單拷貝基因用于使用最大似然法構建系統發育樹。與被子植物系統發育群相一致,A. elata與P. notoginseng 密切相關,P. notoginseng 是另一個五加科物種,這兩個物種被分類為一個進化枝。這個進化枝與 Apiales 家族的物種關系最密切(圖 2A)。然后根據系統發育樹估計這些物種的分歧時間。我們估計A. elata和P. notoginseng 在大約 8010 萬年前從傘形科分化出來。Aralia elata和P. notoginseng隨后在 24.2 萬年前分化為兩個物種。此外,我們對系統發育樹中的基因家族進化進行了比較分析。共有 1,925 個基因家族在A. elata譜系中擴張,而 1,832 個基因家族經歷了收縮(圖 2A)。
?
全基因組復制廣泛存在于開花植物中,并在基因組進化、新物種形成和基因新功能化中發揮重要作用。
先前的結果表明,五加科的兩個物種三七和人參最近分別經歷了一次和兩次WGD事件。為了進一步探索A. elata的進化軌跡,我們研究了其基因組中的 WGD 事件。來自A. elata的蛋白質序列使用 BLASTP (E < 1e-5) 對基因組進行自我搜索以識別同源基因對。我們計算了最佳基因對的 4DTv(第三個密碼子的 4 倍簡并同義位點)并繪制了 4DTv 值的分布(圖 2C)。分別在 0.12 和 0.50 處觀察到兩個峰。大約 0.50 的右峰揭示了雙子葉伽馬三倍體事件。大約 0.12 的左峰表明A. elata經歷了最近的 WGD 事件。然后,我們使用 McscanX 研究了V. vinifera和A. elata之間的共線性,以進一步確認A. elata中的 WGD 事件,因為V. vinifera沒有經歷任何最近的 WGD。觀察到A. elata和V. vinifera之間的 2:1 共線性關系(圖 2D) ,這證實了最近的 WGD 事件發生在A. elata基因組中。
?
3.3?三萜皂苷生物合成關鍵酶編碼基因分析
對植物中萜類化合物的生物合成途徑進行了全面的解釋,引起了研究人員的廣泛興趣。通過整合序列相似性、保守結構域和系統發育關系結果(圖 3; 補充圖2;補充表 8),我們鑒定了 22 個候選基因,這些基因編碼可能催化A. elata基因組中萜類生物合成過程的酶(圖 4)。
我們使用從公共數據庫下載的A. elata轉錄組測序數據來研究這些基因的表達譜。RNA-seq reads與基因組組裝比對,并獲得它們在根、莖和葉中的表達水平。圖 4說明了這些酶編碼基因在每個組織中的標準化表達水平。結果表明,許多基因似乎以組織特異性方式表達。例如,編碼 CYP450 的基因在莖和根中非常豐富。
以往研究表明,CYP72A和CYP716A亞家族成員是參與五環三萜皂苷生物合成的主要CYP450。因此,我們特別關注在A. elata基因組中鑒定的四個 CYP716a 和三個 CYP72a 編碼基因。同時鑒定了12個與萜烯骨架和三萜生物合成途徑相關的基因,包括MVA途徑和2,3-氧角鯊烯生物合成途徑。其中,六種酶(AACT、HMGS、HMGR、MK、PMK 和 MVD)與 MVA 途徑相關。
在 MVA 途徑中,乙酰輔酶 A 被合成為乙酰乙酰輔酶 A,后者由 AACT 酶(由Arel.002085編碼)催化。Arel.002085在葉和根中的表達水平略高于在莖中的表達水平。乙酰乙酰輔酶A被合成為3-羥基-3-甲基戊二酰輔酶A,由HMGS酶(編碼為Arel.020097)催化。HMGR酶(由Arel.004178編碼)隨后催化甲羥戊酸的合成,然后使用MK酶(由Arel.022041編碼)催化甲羥戊酸-5P的合成。Arel.020097、Arel.004178和Arel.022041的表達水平根中的含量高于莖和葉中的含量,表明生物合成反應主要發生在A. elata的根部。然后,在PMK酶(編碼為Arel.027136)的催化下,生成甲羥戊酸-5-焦磷酸,然后異戊烯焦磷酸被MVD酶(編碼為Arel.003662)催化,再由IPPI酶(編碼由Arel.030181)形成焦磷酸二甲基烯丙酯,焦磷酸異戊烯基和焦磷酸二甲基烯丙酯進一步縮合形成各種萜類化合物。除了Arel.003662在葉和根中的表達水平略高于在莖中的表達水平外,Arel.027136的表達水平莖中的Arel.030181略高于葉和根中的 Arel.030181。結果表明,這部分的這些生物合成反應可能發生在莖部。
?
基于這些基因的表達水平,我們在空間水平上探索了A. elata植物的次生代謝。我們比較了這些基因在不同組織中的表達模式。我們發現參與皂苷生物合成的基因大部分在根中特異性表達,少數在葉和莖中高表達(圖 5)。
3.4 遼東楤木農桿菌介導轉化體系的建立
?
生物技術是提高植物次級代謝產物含量的有效途徑。A. elata基因組的注釋將為轉基因A. elata植物的產生提供許多候選基因。然而, A. elata的遺傳轉化仍然很困難。以本實驗室建立的A. elata胚胎愈傷組織誘導系統為基礎,建立了該植物的遺傳轉化系統。生長良好的組織培養幼苗的根被用作農桿菌的外植體侵染,對根進行預培養、共培養和選擇培養(卡那霉素抗性)以獲得抗性愈傷組織。通過PCR檢查從抗性愈傷組織中提取的DNA。如圖所示圖 6,在陽性轉基因植物中成功檢測到目標片段,發現在感染時間10分鐘時轉化效果更好。我們將轉基因愈傷組織轉移到分化培養基中以獲得體細胞胚苗。接下來,將體細胞胚苗轉移到含有 20 g/L 蔗糖的 WPM 培養基中,在 16 h 光照和 8 h 黑暗條件下培養 4 周,然后將植物移入土壤并在溫室中培養 2 個月,如如圖所示圖 6,轉基因植物生長良好,最終我們獲得了轉基因植物。
04
結論
?
遼東楤木是五加科中使用最廣泛的中藥材之一,以其良好的功效享譽中外。三萜皂甙廣泛存在于五加科中,是研究最多的活性成分。迄今為止,已從A. elata中分離鑒定出100多種皂苷。然而,A. elata皂苷的完整生物合成途徑尚未確定,需要進一步研究。在此,我們簡要分析了A. elata的萜類生物合成途徑,為后續研究提供參考。通過對參與該途徑的候選基因進行基因改造,可以增加A. elata中三萜皂苷的含量。本研究中建立的注釋基因組和遺傳轉化系統將用于該物種的進一步功能基因組分析。
在五加科中,已經報道了一些物種的基因組,包括刺五加(Yang et al., 2021)、人參(Kim et al., 2018)和三七(Jiang et al., 2021)。A. elata的高質量基因組分析將為研究五加科其他物種的進化景觀提供有價值的廣泛信息。高質量基因組和轉錄組數據的基因挖掘可以為進一步探索植物生長和次生代謝機制提供資源。受益于HiFi reads的長讀長和高精度,本研究獲得的A. elata基因組的連續性和完整性處于高水平。我們的結果與已發表的基因組相結合,揭示了五加科的 WGD 軌跡。最近的 WGD 事件發生在五加科物種分化之前。
?
綜上所述,本文所報道的高品質A. elata基因組序列,結合比較基因組分析,對參與皂苷生物合成的推定基因進行鑒定和組織物種表達分析,并且建立了高效的A. elata遺傳轉化體系,這將有助于A. elata的繁殖和栽培。
?
05
獲取原文
?
原文鏈接:
https://www.frontiersin.org/articles/10.3389/fpls.2022.822942/full
補充材料:
https://www.frontiersin.org/articles/10.3389/fpls.2022.822942/full#supplementary-material
END
06
廣告
?
向上滑動閱讀正文
賽思基因科技(青島)有限公司致力于開發轉基因和基因編輯中的“硬核科技”,突破遺傳轉化中的基因型限制,輔助基因編輯育種。目前公司擁有國內數量最多的穩定遺傳轉化體系,包括但不限于花生、藜麥、大白菜、小白菜、辣椒、菜心、油菜、紫菜薹、櫻桃蘿卜、胡蘿卜、甘藍、抱子甘藍、寶塔菜、紫/黃/綠花椰菜、青花菜、西瓜、南瓜、甜瓜、茄子、梨樹、棗樹、大豆、棉花等遺傳轉化體系。
公司可為廣大科研和育種工作者提供穩定的,非嵌合的,多品種的過表達、基因沉默株系和基因編輯突變體。期待與您的深入合作,共同推動中國種業的進步。
賽思基因
專注于遺傳轉化、轉基因技術開發,以及后續的組學分析和生物學驗證實驗的團隊。期待與廣大科研工作者和育種公司合作。
141篇原創內容
公眾號
收錄于合集?#文獻解讀
?110個
上一篇【Sci Rep】唇形科植物Lallemantia iberica的體外再生和農桿菌介導的遺傳轉化體系研究下一篇【Sci Rep】落葉松LoHDZ2的遺傳轉化及其增強落葉松抗逆性的功能分析
總結
以上是生活随笔為你收集整理的辽东楤木的高质量参考基因组组装和遗传转化体系开发的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 大疆坐标系和高德地图坐标系之间转换的问题
- 下一篇: python实现证件照更换背景颜色