科學家如何將綠野仙踪編碼到DNA鏈
作為一種高密度數據儲存媒介,合成DNA 被寄予極大的希望。整個互聯網都可以編碼為能塞進一隻鞋盒的DNA 鏈,而且DNA 分子還非常穩定,能持續數万年甚至數十萬年。但問題是如何將大量的比特數據編碼進形似意大利麵條的DNA 鏈。將一種數據格式翻譯到另一種數據格式並我們想像的那麼簡單。
得州奧斯丁大學的William Press團隊創造出了一套DNA數據編碼和解碼算法,研究報告發表在PNAS期刊上。他們的工作可能為未來的基因數據存儲應用奠定基礎。論文合作者、博士後研究員Stephen Jones指出,對傳統的硬盤和閃存設備而言,位翻轉和消磁是0和1的敵人,而DNA的數據儲存錯誤從根本上存在差異。對於可工作的DNA數據儲存標準,你需要擔心的錯誤是替換、插入和刪除。其中替換類似位翻轉,比如T被替換為A (A、C、T和G是DNA信息的基礎語言)。問題就在於沒有可靠的方法能知道你所讀取的DNA鍊是否包含了任何替換、插入和刪除。研究人員提出的HEDGES協議(代表Hash Encoded, Decoded by Greedy Exhaustive Search)沒有讓單一的核甘酸基包含可用的數據,而是使用累積的核甘酸基序列。研究人員使用經典作品《綠野仙踪》演示了他們的方法。