第一個DNA資料儲存規範發布邁向商業化的第一步
DNA 資料儲存聯盟本週推出了首個基於DNA 的資料儲存規格。該規範概述了一種在DNA 資料檔案中編碼基本資訊的方法,這對於開發和商業化可互通的儲存生態系統至關重要。
DNA 資料儲存使用稱為寡核苷酸(oligos) 的短脫氧核糖核酸(DNA) 串,它們通常混合在一起,沒有特定的物理排序方案。這種儲存媒體缺乏專用控制器和組織手段來了解一個媒體子組件與另一個媒體子組件的接近程度。DNA 儲存與磁帶、HDD 和SSD 等傳統媒體有很大不同,後者俱有固定的結構和控制器,可以從結構化媒體讀取和寫入資料。DNA 缺乏物理結構,需要採用獨特的方法來啟動資料檢索,這帶來了其標準化方面的特殊性。
為了解決這個問題,SNIA DNA Archive Rosetta Stone (DARS) 工作小組(DNA 資料儲存聯盟的一部分)制定了兩個規範:“零區”和“一區”,以促進啟動DNA 檔案的過程。
零扇區作為起點,為檔案閱讀器提供所需的最少詳細信息,以識別負責合成DNA 的實體(例如Dell、Microsoft、Twist Bioscience)以及用於編碼第一區的CODEC(例如Super Codec、Hyper編解碼器,Jimbob 的編解碼器)。零扇區由70 個鹼基組成:前35 個鹼基標識供應商,後35 個鹼基標識編解碼器。磁區零中的資訊使得能夠存取和解碼儲存在磁區一中的資料。SZ 中儲存的資料量很小,適合單一寡核苷酸。
第一扇區對此進行了擴展,包括內容描述、文件表以及將資料傳輸到定序器所需的參數。該規範確保檔案的主體是可存取和可讀的,為資料檢索鋪平了道路。第一區正好包含150 個鹼基,並將跨越多個寡核苷酸。
DNA 資料儲存聯盟董事會的Dave Landsman 表示:「DNA 資料儲存聯盟的一個主要目標是製定和發布規範和標準,以促進可互通的DNA 資料儲存生態系統的發展。隨著聯盟第一個規範的發布,我們在實現這一目標方面邁出了重要的一步。零區和一區現已公開,允許該領域的公司採用和實施。”
DNA 資料儲存聯盟由Catalog Technologies, Inc.、Quantum Corporation、Twist Bioscience Corporation 和Western Digital 領導(儘管我們不確定Western Digital 的NAND 還是HDD 部門負責制定該規格)。同時,包括微軟在內的許多產業巨頭也支持DNA資料儲存聯盟。