新技術可“預覽”DNA存儲數據文件

在DNA數據存儲這一領域研究一直強調其持久性和存儲海量信息能力,但對DNA文件中數據“預覽方面的研究尚待突破

圖片來源:視覺中國

科技日報北京6月10日電 (記者張夢然)據英國《自然・通訊雜誌10日發表的一項最新成果美國北卡羅來納州立大學研究人員將DNA數據存儲方面的長期挑戰轉化爲一種實用工具――爲用戶提供存儲數據文件的“預覽”,例如圖像文件縮略圖版本。這使得整個DNA存儲系統數據效率大爲提高,同時更具兼容性。

全球數據量不斷增加,傳統的存儲架構,如硬盤磁帶,越來越難以跟上數據存儲的需要。隨着這些裝置逐漸達到存儲極限,DNA被當作一種長期存儲方案提出來,這是一項非常有吸引力技術,因爲只需要一個小片段就可以存儲大量數據,信息可以長時間保持,又非常節能。

但是科學家們一直還無法實現對DNA文件中數據的“預覽”――如果你想知道文件是什麼,那你必須“打開”整個文件。

據研究人員介紹,爲了識別和提取指定文件,大多數系統使用聚合酶鏈反應(PCR)。具體來說,使用與相應引物結合序列匹配的小型DNA引物來識別包含所需文件的DNA鏈。然後系統使用PCR製作大量相關DNA鏈的副本,再對整個樣本進行測序。該過程會複製大量目標DNA鏈,但目標鏈的信號比樣本的其餘部分更強,從而可以識別目標DNA序列並讀取文件。然而,DNA數據存儲研究人員面臨的一個巨大挑戰就是,如果兩個或多個文件具有相似的文件名,PCR將無意中複製多個數據文件的片段。因此,用戶必須爲文件指定非常不同的名稱,以避免產生數據混亂。

此次,北卡羅來納州立大學研究團隊開發的這種技術,利用相似的文件名可以打開整個文件或該文件的特定子集。這是通過在命名文件和文件的給定子集時使用特定的命名約定來實現的,研究人員可以PCR過程的幾個參數溫度、樣本中DNA的濃度以及樣本中試劑類型和濃度,來選擇是“打開”整個文件還是隻“打開”其“預覽”版本。

這一新技術的優勢體現在效率和費用兩大方面,該論文的第一作者、研究人員凱爾・託梅克表示,“如果你不確定哪個文件包含你想要的數據,也不必對所有潛在文件中的所有DNA進行測序,相反,還可以對DNA文件的更小部分進行測序以作爲預覽”。

研究團隊成員表示,這一技術已展示了與其他文件類型廣泛兼容的能力,目前他們正在尋找行業合作伙伴來幫助探索該技術的商業可行性