在計算機技術(shù)飛速發(fā)展、數(shù)字生態(tài)日新月異的今天,數(shù)據(jù)存儲技術(shù)變得愈發(fā)重要。
然而當(dāng)前,用于數(shù)據(jù)存儲的設(shè)備,比如光學(xué)介質(zhì)、磁介質(zhì)和閃存,使用壽命通常不到 20 年,并且還需要消耗大量能量來維護。
一直以來,盡管科學(xué)家們始終在探索以高密度和無電的方式來存儲信息的其他方法,比如 DNA 分子或其他聚合物,但這些方法也會受到相對成本高和讀寫速度慢等因素的限制。
那么,有沒有一種更好的方法呢?近日,哈佛大學(xué)化學(xué)與化學(xué)生物系 George Whitesides 教授團隊及其合作者,就開發(fā)了一種全新且原理簡單的光學(xué)分子存儲方法。
他們使用熒光染料分子編碼二進制信息,成功將各類文字、圖像信息寫入并讀取出來,讀/寫速度分別可以達(dá)到 128 bits/s 和 469 bits/s,甚至可以讀寫視頻或其他任何可以數(shù)字存儲的信息。
同時,比起傳統(tǒng)存儲技術(shù),該方法還具有存儲密度高、存儲壽命長(理論上可達(dá)數(shù)千年或更久)、成本可接受等優(yōu)點。
相關(guān)研究論文以“Storing and Reading Information in Mixtures of Fluorescent Molecules ”為題,已發(fā)表在科學(xué)期刊 ACS Central Science 上。
研究人員表示,這種光學(xué)分子技術(shù)并不要求對分子內(nèi)部的結(jié)構(gòu)或序列進行復(fù)雜編碼,非常簡單易懂,也為存儲能耗、成本和抗消耗能力等新興分子信息存儲技術(shù)面臨的重要問題提供了解決方案。
當(dāng)前,用于存儲數(shù)字信息的技術(shù)多種多樣,包括光盤、閃存和驅(qū)動硬盤等,但其工作壽命大約只有幾十年。另一種可行的方法是將信息存儲在一些分子中,例如 DNA——受大自然將各種復(fù)雜的生物遺傳信息存儲在 DNA 中的啟發(fā),科學(xué)家嘗試人工創(chuàng)造類似的分子,以有目的地存儲數(shù)字信息。
這樣的方法在理論上具有非常高的存儲密度,而且無需能耗維護;更妙的是,根據(jù)科學(xué)家推斷,可以存儲信息數(shù)千年乃至更久。 然而,這些分子系統(tǒng)也存在劣勢:讀/寫速度不夠快,多次讀取容易造成信息損失,成本較高,以及尺寸縮小導(dǎo)致噪聲增加。
因此,為解決分子存儲技術(shù)存在的問題,Whitesides 等人開創(chuàng)性地使用熒光分子來將目標(biāo)信息編碼成二進制并存儲,并使用熒光顯微鏡來讀取信息。 使用這種方法,他們成功在一塊小至 7.2 mm^2 的基板上存儲了約 14KB 的數(shù)字信息,文本和圖像均可存入,空間信息密度高達(dá) 271.5 bytes/mm^2。
圖|團隊使用噴墨打印機成功將信息存儲在很小的樹脂基板上,而電腦程序能夠放大看到其上各染料的點狀分布(動圖素材來源:YouTube)
此外,通過重復(fù)讀取信息 1000 次以上,研究團隊發(fā)現(xiàn)熒光信號強度的損失較少(低于 20%),且每次都能成功讀取。
而在讀寫速度方面,研究團隊也取得了不菲的成績——在使用噴墨打印機將熒光分子寫入信息時,速度可以達(dá)到 16 bytes/s。同時,只需要簡單判別某處有無熒光染料分子,就可以讀取對應(yīng)的二進制信息。因此,該方法能夠并行多通道讀取信息,速度達(dá)到 58.6 bytes/s。
圖|用該技術(shù)將“電學(xué)之父”法拉第的圖像(3.95 KB)轉(zhuǎn)換成熒光染料圖案,并存儲在 4.2mm^2 大小的環(huán)氧樹脂基底上,打印錯誤率只有 0.4%(來源:該論文)
因此,這種方法能夠以可接受的成本實現(xiàn)高密度、快速讀/寫的信息存儲技術(shù),以及對單個分子集的多次讀取而不丟失信息,可以說很好地解決了一直以來分子存儲技術(shù)中存在的問題。
實際上,此次的技術(shù)是一種基于數(shù)據(jù)磁帶(Write Once Read Many,WORM)的分子信息存儲方法,不能重復(fù)寫入且不允許修改,但可以重復(fù)讀取。
首先,研究人員選擇了 7 種可在不同波長發(fā)光的熒光染料分子,這些染料都很容易買到。他們使用染料來分別標(biāo)記 ACSII 碼的每一位,如果染料存在則代表“1”,反之則代表“0”。
圖|熒光分子對文本信息“Arts”進行二進制編碼和打印成像示意圖(來源:該論文)
接下來,該團隊使用噴墨打印機將染料混合物根據(jù)信息編碼打印在環(huán)氧樹脂表面的小點中,環(huán)氧樹脂基底中含有活性氨基,會與染料發(fā)生反應(yīng)并形成穩(wěn)定的共價鍵,從而固定住染料分子并防止后續(xù)讀取時有過高損耗。
然后,他們使用配備有多通道熒光檢測器的熒光顯微鏡,讀取每個點上染料分子的發(fā)射光譜并解碼信息。這樣一來,該檢測器可以同時且互不干擾地分辨出基底上任意點的染料信息組合,計算機程序再將二進制碼還原為圖像/文本,讀取過程隨即完成。
圖 | 熒光顯微鏡讀取基板上某點的染料顏色,分析出對應(yīng)信息示意圖(來源:論文)
研究人員表示,以這種方式存儲的數(shù)據(jù)可以在數(shù)千年內(nèi)保持可讀。另外,它還不容易受到水的破壞、不能被遠(yuǎn)程黑客攻擊、不會受到現(xiàn)有存儲系統(tǒng)的尺寸限制,并且它的存儲不需要任何能源。
從古至今,信息存儲從最傳統(tǒng)原始的書籍文字演變至今天的數(shù)字信息,一路變遷,如今仍在廣泛應(yīng)用的數(shù)字信息存儲技術(shù)有哪些?
硬盤:采用磁介質(zhì)的數(shù)據(jù)存儲設(shè)備,希捷(Seagate)在 1980 年生產(chǎn)了第一款 5.25 英寸硬盤(HDD),同年 IBM 推出的第一款 1 GB 硬盤則是個龐然大物,重達(dá) 550 磅。到了今天,1T 硬盤都不再新鮮,科學(xué)家們一直在努力突破磁介質(zhì)技術(shù),以提高硬盤密度、擴充容量、降低能耗。
光盤:1960 年代,一位名叫 James T. Russel 的發(fā)明家致力于將光作為一種機制來記錄并重播音樂。直到 1975 年,索尼出資完成該項目,生產(chǎn)出 CD 和 DVD。
閃存:2000 年末問世,采用電子式可清除程序化只讀存儲器的形式,允許在操作中被多次擦或?qū)懙姆且资源鎯ζ鳌V饕糜谑殖质揭苿釉O(shè)備,例如存儲卡、U 盤等。
數(shù)據(jù)孤島與數(shù)據(jù)湖:大數(shù)據(jù)的有用來源,以原始格式存儲數(shù)據(jù),并允許處理這些數(shù)據(jù),其用戶可以通過互聯(lián)網(wǎng)訪問大部分信息。
云數(shù)據(jù)存儲:互聯(lián)網(wǎng)基于云服務(wù)器進行數(shù)據(jù)存儲與傳輸,云本質(zhì)上為用戶提供了無限量的存儲空間,同時需要加密和身份驗證。
分子存儲:利用 DNA、蛋白質(zhì)等分子內(nèi)部結(jié)構(gòu)原理對信息進行存儲。2019 年,同樣是來自哈佛大學(xué)的一個研究團隊開發(fā)出一種基于寡肽的分子存儲技術(shù),當(dāng)時的數(shù)據(jù)寫入和讀取的平均速率分別為 8 bit/s 和 20 bit/s。值得一提的是,該團隊正是來自 George Whitesides 實驗室。
參考資料:
https://news.harvard.edu/gazette/story/2021/10/harvard-researchers-use-dyes-to-store-data/
https://pubs.acs.org/doi/10.1021/acscentsci.1c00728
https://www.youtube.com/watch?v=EHg2Li52qUI
https://gmwgroup.harvard.edu/
本文來自微信公眾號“學(xué)術(shù)頭條”(ID:SciTouTiao),作者:吳婷婷,36氪經(jīng)授權(quán)發(fā)布。