倍可親

回復: 0
列印 上一主題 下一主題

詳解DNA儲存信息:一克DNA相當千億張DVD光碟

[複製鏈接]

7492

主題

1萬

帖子

2萬

積分

貝殼光明大使

Rank: 6Rank: 6

積分
23113
跳轉到指定樓層
樓主
大千世界 發表於 2012-9-8 03:29 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
  詳解DNA儲存信息:一克DNA相當千億張DVD光碟

  http://www.sina.com.cn  2012年09月07日 07:47  外灘畫報微博

  
-->

  

  哈佛大學研究人員將一本大約有5.34萬個單詞的書籍編碼進不到億萬分之一克的DNA微晶元,然後成功利用 DNA 測序來閱讀這本書。

  

  這是迄今為止人類使用DNA遺傳物質儲存數據量最大的一次實驗。

  

  「今後,拇指大小的設備就能存下整個互聯網的信息。」該項目的首席研究員、哈佛大學遺傳學家喬治·丘奇說。

  要說信息存儲,沒有一樣比得過DNA。人們很早就覬覦我們自身的基因代碼存儲數據的潛力,但如何將信息編碼進DNA遺傳物質再如何解讀出來,一直是個難題。

  要說信息存儲,沒有一樣比得過DNA。人們很早就覬覦我們自身的基因代碼存儲數據的潛力,但如何將信息編碼進DNA遺傳物質再如何解讀出來,一直是個難題。

  近日,哈佛大學維斯生物工程研究所的一群研究人員嘗試將一本大約有5.34萬個單詞的書籍編碼到不到一沙克(億萬分之一克)的DNA微晶元中,連同文字一起的還有11張圖片和一段Java程序。這是迄今為止人類使用DNA遺傳物質儲存數據量最大的一次實驗。「今後,拇指大小的設備就能存下整個互聯網的信息。」該項目首席研究員、哈佛大學遺傳學家喬治·丘奇(George Church)說,被編碼進DNA的書正是他的大作《再生:合成生物學將如何改變未來的自然和自己》。

  這項實驗被刊登在《科學》期刊上。但因編碼存儲和讀取過程太過昂貴,DNA存儲離商業化還有一段距離。「隨著DNA合成、測序價格的不斷下降,這或許將成為長期存儲數據的一種選擇。」哈佛大學生物學教授可蘇里(Sriram Kosuri)說。這一實驗,或許為解決未來社會爆炸性的大數據存儲指明了方向。

  從二進位到鹼基對編碼

  DNA是生物資料庫,它的主要功能就是存儲包含各種指令的生物信息。DNA有G(鳥嘌呤)、T(胸腺嘧啶)、A(腺嘌呤)、C(胞嘧啶)四種鹼基,共同構成了相互纏繞的雙鏈階梯狀的螺旋結構。通過這四種鹼基不同順序的編碼,存儲了生物所有的遺傳信息。

  現代計算機技術奠基者之一馮·諾依曼曾在 1948 年提出「自動複製機器」的設想:一個能夠自我繁殖的系統,不僅能夠構建某個組成元素,結構和自己一致的下一代,也能夠把對自身的描述傳遞給下一代,如此往複。後來隨著生物遺傳的奧妙被發現,人們意識到,DNA 雙螺旋結構正是馮·諾依曼描述的自動複製機器。

  DNA里的四種鹼基,兩兩互補成對。一個最短的DNA分子也有 4000個鹼基對,可能的排列方式就有44000種。鹼基對排列順序千變萬化,從而能夠存儲大量的遺傳信息。

  向活體DNA里寫入數據,有諸多困難,細胞會死亡、分裂、變異,數據內容就會發生改變。

  在本文開頭提到的那項實驗中,科學家們沒有採用活細胞的基因組,而是採用了人工合成的DNA片段。他們用很多短的DNA序列而非長DNA序列來編碼數據,這類似於硬碟寫入的原理,在硬碟中,數據是被寫入稱為扇區的小硬碟塊,這樣能夠降低寫入和讀取數據的困難和成本。科學家們將這種片段用噴墨印表機嵌入到微陣列晶元表面。接著,他們把計劃寫入 DNA的書里包含的信息:圖片、文字、程序轉化為HTML格式的文件,並將這些文件編譯為由 0和1組成的電腦能夠讀懂的2進位數據。然後,他們將2進位數據轉為四種鹼基,把0轉為A或 C,把1轉成G或者T,並建立DNA鏈來維繫這些編碼的順序和位置。每一個DNA片段還包含一個數字「條碼」,記錄它在原始文件中的位置,每個片段被合成多個拷貝以便有助於校正錯誤。編碼完成後,這些晶元會在4攝氏度下保持三個月。

  測序就是讀取數據的過程:啟用DNA測序裝置,將所有DNA片斷中的編碼按照標記順序排列,再還原成 2 進位格式的數據。每個 DNA 片斷的每一個拷貝被測序高達3000次以便校對。利用這種方式,他們將5.27兆數據中的錯誤降低到只有12個。這種尺寸微小的存儲設備,存儲密度遠遠高於DVD、硬碟等介質,效果也毫不遜色。

  丘奇認為,和其他生物存儲介質相比,DNA存儲比較可靠,在室溫下也是穩定的,你甚至可以將它放在任何地方,幾十萬年後,它還在那裡。現在的問題是,DNA 存儲設備的訪問速度很慢,存取和讀取都很花費時間,如何覆蓋和重寫數據也是個問題。好消息是,隨著測序技術的進展,DNA 編碼和測序的成本會逐年下降,離商業化應用也就不遠了。

  生物硬碟

  在人們把目光投向生物存儲之前,佔據存儲市場主流的就是現在的存儲介質,主要是磁碟、光碟。1949年,電腦的磁存儲設備問世,意味著信息可以隨時存取和控制,這個設備改變了整個行業。一塊鋁製圓片,塗上磁性介質,因為磁有正負級,在電磁效應作用下,可以方便地存儲和表達010101的二進位信息。無論磁碟還是硬碟,基本原理幾乎一樣。經過60 多年的發展,磁存儲行業已經可以在3.5英寸大小的驅動上存儲3TB數據。

  另一種主流的光存儲也在不斷挑戰存儲極限。光碟將數字編碼的視頻和音頻儲存在光碟表面的凹槽中。激光讀取這些凹槽的背面,就能播放儲存的電影節目。光碟包含的數據越多,凹槽就必須越小、越緊湊。與之相對,讀取激光的精度也必須越來越高。普通DVD使用的是紅色激光在凹槽里記錄信息,藍色激光波長比紅色激光長,較小的光束聚焦更準確。此外,藍光光碟將軌距從0.74微米縮小到0.32微米。更小的凹槽,更小的光束以及更短的軌距結合,藍光的問世正是順應了大數據存儲的潮流。現在單層藍光光碟能夠保存 25GB 以上的信息,是 DVD 可儲存信息量的5倍。還有人在研發用紫外線做激光,其波長比藍光更短,如果成功,一張光碟可以保存500GB的數據。

  這些存儲方式有一個共同的缺點,磁片表面也好,光碟表面也好,都是單層的平鋪式地記錄和保存信息,哪怕磁碟每一層可以疊加,也和DNA封閉的雙螺旋立體結構無法媲美,記錄的數據量相去甚遠。一克DNA即能儲存上千億個千兆位元組,相當於1000億張DVD光碟的內容。

  隨著摩爾定律的升級,人們已經逐步接近傳統電子製造的極限。人們早就開始在自然中尋找解決問題的靈感。早在2007年,就有日本科學家研究利用趨磁細菌製造出和傳統計算機原件類似的東西,代替磁碟存貯數據。今年初,又爆出德國和台灣的一個聯合科研團隊以三文魚的DNA作為基礎,製造出單次寫入多次讀取的存儲器。不過,那個DNA存儲裝置只能儲存數據至多30小時,且它並沒有利用DNA的結構進行編碼。

  這是個數據爆炸的時代,無處不在的攝像頭,互聯網上成倍增長的信息,大量手持設備的照片、視頻?如果生物存儲技術足夠成熟,人們可以記錄所有想記錄的一切,而不必擔心家裡沒有地方放硬碟。市政部門也不必每隔一段時間就清理街道攝像頭的視頻記錄,釋放存儲空間。

  微流體和晶元實驗室的發展,讓DNA合成和測序變成一項日常工作。以前,要解碼一個人類基因得花幾年,現在用微流體晶元技術只要不到一天。如果用於長期存儲,這樣的速度還是可以接受的。隨著DNA讀寫技術的商業化,未來的DNA硬碟,或許會和今天的硬碟、光碟一樣普遍。

一直被朋友稱為小博士。其實就是書讀得多一些而已。

您需要登錄后才可以回帖 登錄 | 註冊

本版積分規則

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2025-8-13 14:51

快速回復 返回頂部 返回列表