我們的數字存儲空間會耗盡嗎?
據國外媒體報導,我們所生活的世界充滿了各種垃圾,不僅有橘子皮、快遞盒、舊家具和舊電視等生活垃圾,還有短信、電子郵件、視頻和電影等信息垃圾。對於很多數字信息,我們可能只會看上幾眼,就把它們丟到雲裡。
資料圖
對於生活垃圾,人類似乎還在尋找解決危機的方法,但對於信息垃圾,我們則極少關注。這在某種程度上有些不可思議。有朝一日,我們或許會迎來數字存儲空間的枯竭。這種假設合理嗎?數字空間真的會被用完嗎?
弗朗西斯卡·穆西亞尼(法國國家科學研究中心助理研究教授,互聯網與社會中心副主任,主要研究互聯網治理,特別是作為治理工具的基礎設施)
要想找到答案,可能需要明確這裡的“我們”是誰,或者是什麼。
如果“我們”指的是地球上的人口,那“我們”很可能不會耗盡數字存儲空間。到目前為止的歷史表明,隨著存儲數據量的增加(特別是過去十年中的數據量增長非常驚人),存儲系統的容量和效率也得到了提高和優化。在工程師和技術操作人員中似乎有一個總體共識,即對於實際應用而言,由於許多技術和經濟因素,在可預見的未來並不會耗盡存儲空間(我們現在就已經在討論原子和量子計算了)。
如果這個“我們”指的是某個特定的IT公司及其用戶群,那答案就有點微妙了。尋找和分配存儲空間是一個非常具體和現實的基礎設施問題,大型科技公司比其他公司更有可能通過“蠻力”來增加其存儲空間的數量和質量。這最終——事實上可能已經如此——將加劇數字生態系統中的不平等。然而,摩爾定律真的成立嗎?如果是的話,要等到什麼時候?甚至網絡巨頭有時也需要做出一些選擇。
去中心化的存儲解決方案怎麼樣?在一個存儲能力看似極大豐富的時代中,去中心化是否可以引導我們走上節制和可持續性的道路?與集中式存儲相比,區塊鏈有很多優點,但從節制的角度來看,這似乎並不是一條可取之路,因為其本身就具有內置的冗餘特性,即“區塊鏈膨脹”。不過,一些更“老式”的點對點(利用空閒存儲空間和CPU容量)解決方案已經出現,例如Wuala(不幸的是存在時間很短暫),其中一些有趣的實驗試圖避免“蠻力”擴展,並將建立全新的大規模數據中心作為規劃未來存儲的唯一方式。
最後,一個比“找到存儲數據的地方”更有實際意義的問題可能是“如何找到你想要的數據”。隨著數據量的增加和存儲能力的增加——這是個必然的趨勢——我們用來處理和檢索有用信息的工具能否保持同步,以便在我們需要的時候派上用場?
約翰·D·維拉森諾(美國加州大學洛杉磯分校電子與計算機工程教授)
簡短的回答是不會。當然,我並不是說磁盤、終端設備或云存儲帳戶永遠不會被填滿。我的意思是,對於大多數應用程序而言,存儲成本已經不再是一個障礙。如今,很少有人會說“這些數據很重要,但我們不能保留它們,因為那需要花很多錢在存儲上”。
十年前,我通過布魯金斯學會發表了一篇論文,研究了數十年來存儲成本呈指數級下降的趨勢所帶來的影響。論文中的許多觀點在今天仍然適用——考慮到持續的成本降低,可能還更適用。存儲變得如此廉價的事實帶來了很多積極的結果,比如存儲大量照片的能力。但它在隱私和威權政府的影響力方面也會帶來負面效應,威權政府可以利用監控數據創建龐大的數據庫。
如今,數據面臨的最大挑戰不是如何存儲數據,而是數據本身的質量問題。有大量的數據不夠完整,帶有偏見,也有的很嘈雜,或侵犯隱私,或是有其他問題。解決這些缺陷需要作為今後幾年的研究重點。
倫納德·克蘭羅克(加州大學洛杉磯分校計算機科學傑出教授,他提出了數據包網絡的數學理論,數據包網絡是互聯網的基礎技術)
我們是否會耗盡數字存儲空間?最有可能的答案是不會!
未來對數據存儲的需求是壓倒性的。我們生成數據的速度遠快於使用現有存儲技術來存儲數據的速度(據估計,到2025年,我們每年生成的字節數將超過可觀測宇宙中恆星的數量)。顯然,我們需要極大地改變存儲數據的方式。
然而,就在十年前甚至幾十年前,我們就遇見過這樣的挑戰,也沒有任何理由懷疑我們能夠繼續保持這樣的能力。過去幾十年來,基礎技術的發展不斷帶給我們驚喜,從處理速度到通信帶寬,以及我們這裡提到的數字存儲,皆是如此。科學家和工程師們通過發揮聰明才智和創造力,實現了這一場持續的魔術表演。因此,儘管數據存儲的需求增長巨大,但不要低估新的解決方案出現的潛力。
我們已經看到,許多技術為解決未來的數據存儲需求帶來了希望,但每一項技術也都面臨著有待解決的挑戰。除此之外,我們還可以期待即將出現的技術和解決方案,先進的數據壓縮技術也可能帶來意想不到的收穫。
一項有趣的技術是使用單分子磁鐵。當這些由新材料(一種過渡金屬)製成的磁鐵被磁場磁化後,如果把磁場移除,它們仍能保持磁化狀態。過渡金屬具有可切換的磁性,如自旋交叉(將一個或多個電子的自旋從上變為下,或反過來),並能在一段時間內保持這種變化。這意味著每個分子可以包含1比特的信息,從而提供巨大的存儲密度。當然,想要將這種巨大的存儲能力(如每平方英寸幾百兆兆字節)變為現實,研究人員還需要克服很多障礙,包括:製造分子所需的過冷條件;存儲時間過短,目前還只能以秒計;此外,還有相鄰磁體互斥的問題。
另一種技術是使用飛秒激光寫入,將數百兆兆字節的數據蝕刻到納米結構的石英玻璃盤上。這些盤可以保存數千年,甚至可能存在數十億年。儘管目前該技術的讀寫速度很慢,但不需要過冷條件,而且石英玻璃盤在非常高的溫度下依然可以安然無虞。
大自然在很久以前就提供了一種可能滿足我們未來數據存儲需求的方案——DNA存儲。自然母親知道如何以DNA的形式安全地存儲大量信息,而DNA正是生命的基石。現在,一些研究人員(生物學家、化學家和信息技術專家)正在嘗試將數據(如文字、圖像、音樂)通過DNA鹼基對——由腺嘌呤(A)、胞嘧啶(C)、鳥嘌呤(G)和胸腺嘧啶(T)4種鹼基組成——編碼成合成聚合物。DNA的可用存儲密度遠遠大於任何電子設備;事實上,1克DNA的數據密度可達1澤字節(zettabyte,即10^21字節)。要理解如此巨大的數據密度,我們可以想像將人類記錄的所有數據存儲到一個裝滿DNA的容器中,其體積只需要幾個鞋盒大小,而驅動這個DNA數據中心所需的能量將非常小。此外,DNA存儲可以保存數千年,同時可以有效地防禦黑客攻擊。因此,合成聚合物DNA的優點是:容量大;體積非常小;持久耐用;低能量需求;無需過冷條件;以及強大的安全性。伴隨這些優勢的是一些很難克服的障礙,我們發現,用化學方法寫或讀DNA的成本非常昂貴,而且這些操作的速度都太慢了。
綜上所述,我們確實有了一些令人興奮的候選方案,可以解決未來的數據存儲需求問題。而且,隨著我們一步步解決未來的挑戰,目前尚未發現的解決方案可能就會浮出水面。
肖恩·格林斯坦(美國哈佛商學院工商管理教授、哈佛商學院數字計劃聯席主席)
世界怎麼會耗盡存儲空間呢?這似乎是不可能的。一個超大規模的數據中心包含幾十萬台服務器,其存儲空間足以容納整個維基百科——人類有史以來第三大的文字收藏(僅次於美國國會圖書館和大英圖書館)。這表明存儲空間是取之不盡的,任何耗盡存儲空間的可能性都遙不可及,遠遠超出了社會永遠無法觸及的地平線。
但也不完全如此。對數據的新用途不斷出現,而這些需求會促使人們更多地利用現有的存儲資源。也許最有趣的問題是需求是否會停止增長。我認為至少在未來幾十年不會,有兩個基本原因。首先,這是互聯網的邊際要求的;其次,人類的創造力也遠未耗盡,會不斷推出富有想像力的新應用。
先來說說互聯網的邊際。任何瓶頸的存在都會將無限的資源變成有限的資源,而每個系統至少都包含一個瓶頸。互聯網上有很多這樣的瓶頸。一個網絡衝浪者搭上了曼哈頓第五大道下高速行駛的地鐵,同時想要毫不延遲地發表一篇文章。要做到這一點,就需要所有的組成部分——高速線路、多個天線、緩存內容和系統邊際的更多存儲空間——都以最好的狀態工作。隨著視頻做得越來越好、越來越大,其內容的數據強度也在增加,因此到達的速度會變慢,性能也會下降。維基百科需要你的捐助,才能使其運營不至於成為瓶頸。不太明顯的一點是,數據的運營商想要你的業務,而這份收入中有一部分將用於系統升級。當然,還有邊際的前沿存儲,存在於你的智能手機、服務器和內容傳遞網絡中。換句話說,現代互聯網包含了誘導使用更多存儲空間的市場機制。
隨著存儲成本的降低,人類找到了越來越聰明的方法來對數據資源加以利用。去年的前沿到了明年,可能就會變成日常。曾經有一段時間,人們對發送嬰兒和貓的視頻,或分享更多的時尚和八卦感到很新奇。未來幾年後,自動駕駛汽車的系統或許就能處理這一切。沒有人會相信這種獨創性會止步不前。去年,一組科學家發布了一個黑洞周圍碎片的可視化圖像。研究人員收集的數據如此之多,以至於無法通過互聯網傳輸。他們不得不把數據分成許多包裹,並通過郵寄的方式將磁盤郵寄出去。科學家們對黑洞的觀察還遠沒有到達盡頭,但更重要的是,這個先例將激勵某些聰明的發明家,在地球上尋找能夠超越視覺表現界限的東西;當他或她獲得這樣的圖像時,我們都會投以敬畏的目光。
克里斯蒂安·福克斯[英國威斯敏斯特大學媒體與傳播研究教授,《社交媒體:一個批判性的介紹》(Social Media: A Critical Introduction)一書作者]
我們並不是生活在一個“數據和數字社會”,而是生活在大數據資本主義和數字資本主義之下。在這種社會形態中,企業和政治權力的目標是盡可能多地存儲關於每個人的數據,以便從人們的生活中獲得利益,並將我們的公民身份證券化。如果數據和數字資本主義以一種無限的方式持續下去,並耗盡計算所需的不可再生資源,那麼在某個時候,構建計算和存儲設備所需的物理資源就可能耗盡。但摩爾定律也降低了數據存儲的成本,降低了對量子計算等新計算形式的探索,這緩解了這些限制,並可能導致克服了存儲限制的新數據形式和數字資本主義。
然而,關鍵並不在於技術問題,而是道德和政治問題:我們真的想要將生活的幾乎所有方面存儲起來嗎?如果一個社會將我們對人類生活的思想和活動越來越多地貨幣化和證券化,那將會有什麼樣的後果和影響?最大的危險是,數字資本主義將變成數字獨裁和數字法西斯主義。因此,解決方案是我們將存儲的數據最小化到運行計算機和社會所必需的最小值。為了避免數字法西斯主義的興起,我們需要數字民主而不是數字資本主義。
埃里克·奧斯特威爾(喬治梅森大學計算機科學助理教授)
我認為,以一種不可能被捕獲、存儲和/或保存所有數據的速率產生數據當然是有可能的,例如歐洲核子研究中心的大型強子對撞機在進行實驗時所丟失的所有數據。我認為我們應該關心的是,存儲那些可以用來幫助我們了解相關意義(對於我們的生活,對於研究,對於商業利益,等等)的數據。
我之所以這樣區分,是因為我認為我們實際上是在存儲讓我們獲得意義的數據,並且經常存儲處理過的數據(對數據進行匯總或陳述,或者壓縮數據,以及使數據具有更多語義,等等)。這往往意味著我們要猜測我們需要和/或想要的哪一部分的數據。
當我們努力增加存儲容量,並記錄(可能)更加精細的數據時,我們需要認識到,我們的數字足跡可能會成為一個不利因素。作為一名從事數據分析的網絡安全研究者,我越來越清楚地發現,我們在網上留下的足跡是不可磨滅的,是不會被時間沖走的。更重要的是,我們的社區數據分析技術(大數據、ML/AI等)正變得更加有洞察力,其數據集也變得更加互聯。我想把這個問題反過來問:我們是否會達到這樣一個地步,即人們希望數字存儲空間耗盡,這樣他們的數字足跡就會隨著年齡的增長而消失?問題在於,我們已經在網上分享了幾十年的信息,潘多拉的盒子很可能早已打開。
凱文·柯倫(英國阿爾斯特大學網絡安全教授兼法律創新中心聯席執行主任)
所有的數字數據都存儲在硬盤上。和其他技術一樣,硬盤容量已經取得了令人難以置信的進步。主要的變化是從旋轉硬盤驅動器發展為沒有移動部件的固態硬盤,磁盤容量也大幅增加。有趣的是,我們第一次看到因芯片短缺而導致的產品延遲生產,部分是由於新冠疫情。芯片也是硬盤驅動器的組成部分,如果未來出現這種硬盤驅動器核心組件的短缺,那數字存儲空間就可能會耗盡。不過,一個方法是回收現有的硬盤驅動器,並基本上覆蓋舊的文件。這可能會緩解一些問題,但當然,互聯網巨頭可能很難收回足夠的存儲空間。屆時,由於數字存儲價格的大幅上漲,將只有富人才能存儲他們的數據;經濟規律也可能在這方面發揮很大作用。