跳到內容

長期使用合成DNA數據存儲

需要長期存儲的數據量增長和加速。目前長期數字存儲技術無法跟上。想象每天大約250億億字節的數據被創建在這個世界上1 - 2隨著越來越多的計算機和網絡基礎設施網絡。對於一般用戶來說,一個長期的存儲解決方案可能不是一個問題。然而,組織和企業需要存儲大量的數字交易數據,迫切需要找到新的數據存儲解決方案。

當前光盤和磁帶都是很棒的,但有一些明顯的缺點。例如,硬盤的平均壽命是3到5年,和光學cd在最好的十年。長期存儲解決方案,如磁帶驅動器或光學藍光光盤存儲大約10 TB (TB)的數據。當存儲在理想的溫度和濕度條件下他們可以持續幾十年。然而,存儲媒體格式都是笨重的,要求存儲物理空間。3

如果技術變得過時,我們能做什麼?

很自然地,我們把大自然的解決方案。答案是在我們的DNA。是的,你是正確的。想想自然進化的一個長期的存儲解決方案為我們傳遞遺傳信息。存儲數據使用DNA可能聽起來像科幻小說,但從概念上講並不是困難。你看,所有的數字信息是由0和1。在我們的遺傳密碼,有四種核苷酸堿基。所以如何分配每個基本為零或一個值?這正是喬治教會與合成DNA的團隊。5它是如此簡單而最優雅的。

從理論上講,存儲數字信息使用DNA合成有一定的優勢。首先,平均體重的能力比,隻是一個小切片的DNA提供了巨大的存儲容量。作為一個粗略的估計,大約1公斤的DNA可以存儲世界的數據今天。4第二次大的DNA是它可以相當穩定,因此,長久的。所以穩定獲得整個DNA基因組,科學家們正在談論從現已滅絕的長毛象。6

這是兩個團隊如何使用不同的方法向下流的DNA字母代碼的二進製數據。

在使用合成DNA進行存儲的步驟

  1. 二進製代碼轉換成核苷酸的代碼。
  2. 分開你的代碼並插入一個地址代碼為每個片段(包括間距器放大)。
  3. 合成寡核苷酸的DNA短片段。
  4. 儲存在冰箱裏。
  5. 當你需要存檔,PCR擴增和序列。
  6. 分析序列數據並重新組裝它。
  7. 最後,把它回到二進製代碼!

教堂的DNA代碼

教會的小組共有5.27 mb的數字數據編碼成DNA編碼。5在計算機術語中,有些是數據存儲的最基本的單位。基本上,包含一個0或1。數字DNA數據包含一個HTML-coded草案與53426字的書,11 JPEG圖像和一個JavaScript程序!他們做所有這些數字數據分解到54898的159個核苷酸片段(nt) -oligonuelcotides與一個96位的數據塊19-bit地址代碼,最後兩側22-nt常見序列擴增(96 + 19 + 2 (22)= 159)。

有趣的是,他們編碼一位基地(零或C, G和T),但編碼的理論最大值是2位/基地。此外,為了避免聚合酶在測序的讀數誤差,他們多次測序樣品,建立了一個共識在每個基地。這創造了高度重疊覆蓋,以確保最小的錯誤。

高盛的DNA代碼

高盛集團同樣的問題有不同的解決方案7。高盛的主要區別是,使用一種更複雜的編碼係統,以確保沒有重複序列,可以在測序和分析的一個大問題。而不是使用教會的簡單方法(為零或C、G和T),他們將所有的二進製代碼變成一係列的三聯體密碼(而不是0和1,他們使用0,1 & 2)。然後合成機創造了一個DNA編碼的三聯體密碼。三聯體密碼係統確保沒有重複的核苷酸序列。最後,他們用重疊- 100 bp序列,逐漸轉變了25個基地,以確保最小的錯誤分析。

他們能夠將五個文件編碼到一個長段DNA序列包括:

  • 154年,莎士比亞的十四行詩
  • 26第二音頻剪輯的馬丁•路德•金的著名“我有一個夢想”的演講,
  • 詹姆斯·沃森和弗朗西斯·克裏克的雙螺旋結構,
  • 他們研究所的照片
  • 最後一個文件的數字數據的編碼方法。這真的是太棒了!

未來的考慮

有利弊DNA數據存儲:

優點

高數據密度,在分子水平上,數字存儲密度至少是數百萬倍高於任何我們當前的技術

高穩定性,有很多從幾十年前對DNA證據的樣本可以提供一個人的身份的線索。例如,科學家獲得基因數據從一個長毛象埋在一個冰凍苔原之後數千年。

簡單的存儲,DNA分子風進入一個很小的包,為數字存儲提供巨大的節約空間。

缺點

試劑,聚合酶需要你破譯和解碼的DNA。這可能意味著時間和工時在專業實驗室。

合成成本-雖然DNA合成的價格下降,它仍然可以是昂貴的合成一個數字圖書館使用DNA。此外,所需的時間和過程合成每個片段和編碼可以耗時。

測序成本-的成本測序是直線下降,但它可能意味著數字信息不容易如果你沒有定序器或測序設施附近或足夠的錢完全解碼數據。

覆蓋問題,如我們已經討論過的,為了達到100%的準確率,多個覆蓋和測序讀是必需的。在未來,更聰明的方式壓縮和編碼數據將會用來使數字DNA存儲成為現實。

長期存儲格式,現在我們還不能確定如何最好地儲存DNA。我們應該將它存儲在潮濕或幹燥嗎?嵌入在一個矩陣或作為芯片的一部分嗎?

DNA是長期存儲會成為現實嗎?嗯,這取決於幾個因素。雖然這項技術存在,提供了更大的數字存儲密度比我們目前的存儲解決方案,這項技術還處於起步階段。

引用

  1. VCloudNews。每天大數據統計每天創建- 250億億字節的數據(在線)2月14日,2017。
  2. 數據,數據無處不在《經濟學人》。(在線)2月25日,2017年。
  3. Coughlin, T。保持很長一段時間的數據《福布斯》。【在線】1月24日,2017年。
  4. Extance, a (2016)。DNA如何存儲世界上所有的數據嗎自然新聞537年doi: 10.1038 / 537022 a。
  5. 教堂通用、高Y, Kosuri,美國(2012年)新一代數字信息存儲在DNA科學337年:1628 - 1628。doi: 10.1126 / science.1226355。
  6. 米勒,W。et al。(2008)。的核基因組測序已滅絕的猛獁象自然456年:387 - 390 (2008)。Doi: 10.1038 / nature07446
  7. 尼克高盛,N。et al。(2013)。對實用、高容量、低維護的信息存儲在DNA合成自然494年:77 - 80。doi: 10.1038 / nature11875。
分享你的網絡:
圖片來源:

留下你的評論

你必須登錄發布評論。

這個網站使用Akismet來減少垃圾郵件。學習如何處理你的評論數據

滾動到頂部
Baidu
map