DENSe:DNA數據存儲的新變化使用戶可以預覽存儲的文件
來自北卡羅來納州立大學的研究人員已經將DNA數據存儲的一個長期挑戰變成了一種工具,利用它為用戶提供存儲數據文件的預覽–比如圖像文件的縮略圖版本。DNA數據存儲是一項有吸引力的技術,因為它有可能在一個小包中存儲大量的數據,它可以長期存儲這些數據,並以一種節能的方式進行。
然而,直到現在,還不可能預覽存儲為DNA的文件中的數據–如果你想知道一個文件是什麼,你必須”打開”整個文件。
“我們的技術的優勢在於它在時間和金錢方面更有效率,”關於這項工作的論文的主要作者、北卡羅來納州的博士生Kyle Tomek說。”如果你不確定哪個文件有你想要的數據,你不必對所有潛在文件中的所有DNA進行測序。相反,你可以對DNA文件中更小的部分進行測序,作為預覽。”
以下是對這一工作方式的快速概述:
用戶通過將稱為引物結合序列的DNA序列附加到存儲信息的DNA鏈的末端來”命名”其數據文件。為了識別和提取一個特定的文件,大多數係統使用聚合酶鍊式反應(PCR)。具體來說,它們使用一個小的DNA引物,與相應的引物結合序列相匹配,以識別含有你想要的文件的DNA鏈。然後,系統使用PCR製作大量相關DNA鏈的副本,然後對整個樣本進行排序。由於該過程製作了許多目標DNA鏈的副本,目標鏈的信號比樣品的其他部分更強,因此有可能識別目標DNA序列並讀取文件。
然而,DNA數據存儲研究人員一直在努力解決的一個挑戰是,如果兩個或更多的文件有類似的文件名,PCR會無意中復制多個數據文件的片段。因此,用戶必須給文件起非常明顯的名字,以避免得到混亂的數據。
由此,研究人員開發了一種技術,利用類似的文件名,讓他們打開整個文件或該文件的特定子集。這通過在命名一個文件和該文件的特定子集時使用特定的命名規則來實現。他們可以通過操縱PCR過程的幾個參數來選擇是打開整個文件,還是只打開”預覽”版本:溫度、樣品中的DNA濃度,以及樣品中試劑的類型和濃度。研究人員通過在DNA數據存儲中保存四個大型JPEG圖像文件並檢索每個文件的縮略圖以及完整的高分辨率文件來證明他們的技術。
新的”文件預覽”技術也與DNA富集和嵌套分離(DENSe)系統兼容,研究人員創建該系統是為了使DNA數據存儲更加實用。DENSe通過引入改進的數據文件標籤和檢索技術,有效地使DNA存儲系統更具可擴展性。
該論文將於今天(2021年6月10日)發表在《自然通訊》上。這篇論文的共同作者是Elaine Indermaur,她曾是北卡羅來納州的本科生。