創(chuàng)新DNA存儲算法 讓敦煌壁畫再“活”兩萬年


中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)   時間:2022-09-20





  記者9月16日從天津大學獲悉,該校合成生物學團隊創(chuàng)新DNA存儲算法,將10幅精選敦煌壁畫存入DNA中,通過加速老化實驗驗證,壁畫信息在實驗室常溫下可保存千年,在9.4℃下可保存兩萬年。該算法支持DNA分子成為世界上最可靠的數(shù)據(jù)存儲介質(zhì)之一,可以讓面臨老化破損危機的人類文化遺產(chǎn)信息保存千年萬年。該成果近日發(fā)表于國際期刊《自然·通訊》上。

  人類文明的發(fā)展與存儲技術密切相關,隨著科學技術的進步,數(shù)據(jù)存儲方式不斷迭代創(chuàng)新。中國科學院院士、天津大學元英進教授團隊一直致力于下一代存儲技術——DNA存儲的研發(fā)。

  “據(jù)國際數(shù)據(jù)公司估計,到2025年全球數(shù)據(jù)總量將達到驚人的175ZB(1ZB約為1021字節(jié))。全世界都在建數(shù)據(jù)中心,數(shù)據(jù)中心的能耗是驚人的。DNA存儲由于其高存儲密度與低能耗處理等特點,被視為一種極具潛力的存儲技術,成為應對數(shù)據(jù)存儲增長挑戰(zhàn)的新機遇?!痹⑦M說。

  2021年8月,元英進團隊取得DNA存儲研究的重大突破。該團隊從頭編碼設計合成了一條長度為254886堿基對、專用于數(shù)據(jù)存儲的酵母人工染色體,將兩張經(jīng)典圖片和一段視頻存儲于人造染色體中,利用酵母繁殖實現(xiàn)了數(shù)據(jù)穩(wěn)定復制,并用納米孔測序器件實現(xiàn)了數(shù)據(jù)快速讀出與無錯恢復。

  DNA存儲高效低耗,但作為一種鏈式生物大分子,在體外常溫保存時會面臨DNA斷裂降解等風險,嚴重影響信息存儲的長期可靠性,是亟待解決的關鍵科學問題。對此,元英進團隊設計了基于德布萊英圖理論的序列重建算法來解決DNA斷裂等問題。該算法結(jié)合貪婪路徑搜索和循環(huán)冗余校驗碼來實現(xiàn)斷裂DNA片段的高效從頭組裝,從原理上支持了DNA存儲的長期可靠性。

  結(jié)合該序列重建算法(內(nèi)碼)與噴泉碼算法(外碼),團隊設計編碼了6.8MB(兆字節(jié))敦煌壁畫,合成了承載圖片信息的DNA片段21萬條。為保證數(shù)據(jù)的長期可靠性,團隊制備了一個沒有任何特殊保護的DNA水溶液樣本,并在70℃下加速樣本斷裂、降解長達10周。處理后的DNA片段80%以上都發(fā)生了斷裂錯誤,依靠設計的序列重建算法依然可以準確組裝并解碼96.4%以上的片段,再通過噴泉碼解決少量片段丟失的問題,原始的敦煌壁畫圖片依然能夠完美恢復。根據(jù)理論推算,這種程度的高溫破壞相當于實驗室常溫25℃一千年或者9.4℃兩萬年的自然保存。

  這是繼基于人工合成染色體的酵母體內(nèi)信息存儲模式取得突破后,天津大學合成生物學團隊在DNA信息體外存儲模式上取得的又一重要成果。(記者 陳曦 通訊員 趙暉)


  轉(zhuǎn)自:科技日報

  【版權(quán)及免責聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”,違者本網(wǎng)將保留追究其相關法律責任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網(wǎng)觀點和立場。版權(quán)事宜請聯(lián)系:010-65363056。

延伸閱讀

?

微信公眾號

版權(quán)所有:中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)京ICP備11041399號-2京公網(wǎng)安備11010502035964