编码与DNA存储——DNA码的构造
DNA是自然界存儲生物基因信息的核心載體。基于DNA的數據存儲有非常高的存儲密度(10的9次方GB/mm的立方)、存儲容量、和持久性(半衰期500年)且能量消耗很低。
DNA鏈由4種不同的核苷酸組成,每個核苷酸攜帶腺嘧啶(A)、鳥嘧啶(G)、胸腺嘧啶(C)和胞嘧啶(G)四種堿基中的一種,代表其攜帶不同的信息,比如A→00, G→10, C→01, T→11。
在DNA合成和測序的過程中,可能發生許多錯誤,導致無法正確恢復存儲的信息,可借助編碼的手段,通過引入冗余使編碼具備糾錯的能力,即將原始信息序列(取自某個有限域)映射到(符號集{A, G, C, T}上的)DNA碼字空間里,并保證碼字之間的最小漢明距離超過一定的閾值,在解碼過程中利用合適的判別準則正確地恢復原始序列。
此外,DNA碼字還必須滿足如下四種重要約束:
此外,由于組成不同的DNA鏈形成二級結構的傾向不同,展開二級結構需要額外的能量,影響實際存儲效率。所以,設計具備特定結構的DNA碼以避免二級結構形成也是一項約束。
參考文獻
?1. On DNA Codes Over the Non-Chain Ring ?with ,?https://doi.org/10.48550/arXiv.2211.13925
2. Construction of Multiple Constrained DNA Codes, https://doi.org/10.48550/arXiv.2211.16096?
總結
以上是生活随笔為你收集整理的编码与DNA存储——DNA码的构造的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: web作业之期末工程 “耀炎食品网站”
- 下一篇: 大数据乘(tu)风(tou)破(bian