Google、微軟包下核電廠“囤電”,AI科技以外的困境被低估了
AI的發展為人們描繪了科技進步帶來的“詩和遠方”,但這背後卻有著巨大的能源、資源、勞動力消耗,這是AI發展的沉重現實。此外,AI作為一種新型「巨機器」對人和社會的影響也被低估了。 Google在本週一表示,與Kairos Power 公司簽署一份從多個小型模組化反應器購買電力的協議,以滿足發展人工智慧的用電需求。
Google計畫買六到七個小型模組化反應器的電力,總計500兆瓦,第一個小型模組化反應器在2030年之前投入使用。
而在上個月月底,微軟和星座能源公司簽署了一份為期20年的電力採購協議,計畫重啟曾因嚴重核事故而關閉的美國三哩島核電廠。
1979年3月28日,三哩島壓水器核電廠的二號反應器由於冷卻系統失靈,造成62噸的堆芯熔毀事故,這是人類核能發展史上發生的第一起堆芯熔毀事件。
國際上把核電廠事故分為7級,切爾諾貝利和福島的核事故是唯二的兩件7級事故,三哩島核外洩處於第5級。
星座能源在1999年買下了一號反應堆,就在發生事故的二號反應爐旁邊,後來因為經濟效益不好在2019年關閉了。
跟微軟簽署協議後,星座能源將投入16億美元對一號反應器進行翻新,預計到2028年才開始重新發電,時間表受到監管批准的影響。
Google、微軟搬離來核電廠,一下子囤這麼多電,主要用來驅動AI資料中心。而且不只這兩家,其他在AI領域佈局的科技大佬都在這麼幹。
今年3月,亞馬遜從塔倫能源公司購買了一個自帶核電供應的資料中心園區;甲骨文最近也表示,正在設計1處由3個小型核反應器供電的資料中心。
科技巨頭之所以搞得這麼大,是因為AI恐怖的耗電量。
AI究竟有多耗電?
史丹佛人工智慧研究所發布的《2023年人工智慧指數報告》顯示,OpenAI的GPT-3單次訓練耗電量高達128.7萬度,相當於3,000輛特斯拉Model Y跑滿32萬公里的耗電量。這也是120個美國家庭1年的用電量。
這還只是訓練用的電,相較於後面不斷使用的環節只是小頭。
在使用環節,AI每次回應也要大量耗電。像ChatGPT有2億多用戶,每天回應這些需求就要花費50萬度電。
大模型的參數量越大,需要處理的資料就越多,所需的運算量就越大,而算力背後是大量的伺服器、儲存設備和網路設備,它們日夜不停地工作,消耗大量電能。
曾有業內人士表示,國內一線大模型的營運成本中,電費佔了總成本的50%以上。
國際能源總署今年發布的報告中預測,未來三年全球對資料中心、加密貨幣和人工智慧的電力需求將增加一倍以上,相當於一個德國的全部電力需求。
「我在一年多前就預測過晶片短缺,下一個短缺的將是電力。我認為明年將沒有足夠的電力來運行所有的晶片。」前段時間馬斯克發出了這樣的預警。
OpenAI執行長山姆·奧特曼也表示,人工智慧將消耗比人們預期更多的電力。
如果說算力是大模型的底層支撐,那電力就是算力的底層支撐。能否獲得更清潔、穩定的能源,以及AI設備能否做到效率更高、更省電,影響AI發展的可持續性。
除了耗電,AI對資源也有大量消耗。
比如對水資源的消耗。 AI晶片製造過程涉及大量的清洗和化學處理步驟,生產一個智慧型手機晶片就需要大約消耗5噸以上的水。而AI超算資料中心也需要大量水來散熱,研究發現,光是使用GPT-4產生100字文字就需要消耗多達三瓶水。
有研究估算,到2027年,全球的AI需求可能需要消耗掉66億立方公尺的水資源,相當於杭州西湖水量的450倍以上。
還有礦產資源,任何高科技的起點都是能源和礦產。
從網路路由器到電池再到資料中心,AI系統擴展網路中的每一部分都需要礦產資源。
現代生活的許多方面都被轉移到了“雲端”,但人們很少考慮這些原材料的成本。我們的工作、生活、休閒娛樂大部分都發生在網路運算架構的世界,而由雲端運算聯通的我們拿在手中的設備,其核心為鋰。
可充電鋰離子電池是行動裝置、筆記型電腦、家用數位助理和資料中心備用電源的必需品。它們支援幾乎所有在互聯網和互聯網上運行的商業平台。
除此之外,還有很多不可再生的礦物質參與了AI和其他高科技發展中,包括用於iPhone揚聲器和電動汽車電機的稀土元素鏑和釹,用於士兵的紅外線軍事設備和無人機的鍺,可以提高鋰離子電池性能的鈷。
參與世界科技競爭的國家都會根據自身工業要求和對供應風險的策略評估,制定自己的關鍵礦物清單。
中國、美國、歐盟戰略性關鍵礦產(圖源:國際合作中心網站)
鋰、鍺、鈷、稀土、石墨等都名列其中,是發展新能源汽車、人工智慧、雲端運算、光伏、資訊通訊等高科技不可或缺的。
像稀土,裡麵包含17種金屬元素,16種被用在了智慧型手機裡,這些元素可以在彩色顯示器、揚聲器、相機鏡頭、可充電電池、硬碟和其他許多組件中找到。
如果無法保證這些礦物的供應,包括AI在內的科技業都將陷入停滯。這是技術發展最重要的約束條件。
許多礦產都分佈在世界上比較偏僻或經濟不發達地區,像玻利維亞西南部的烏尤尼鹽沼、剛果中部、蒙古國、印尼。而採礦歷來都是一件極易引發地緣政治衝突和戰爭的事。
但包括AI在內的高科技發展為我們帶來了“詩與遠方”,很容易讓我們忽略構成技術“肉身”的這些原材料,背後的稀缺,以及由此帶來的衝突、飢餓和貧窮。
正如“鋰電池之父”古迪納夫所擔憂的那樣:“鋰的重要性不亞於石油等戰略性資源,一旦開採出現瓶頸,可能會跟石油一樣成為戰爭的導火線。”
這樣看來,高科技幾乎也可以看作是一種資源密集的提取技術,把不可再生的礦產、水等轉化一些虛擬能力,期間還伴隨著環境破壞和地緣衝突。
而且,這種龐大的資源密集型基礎設施幾乎完全是私人的。
AI發展不僅存在能源和資源“飢渴”,還存在數據“飢渴”。
資料、演算法和算力是AI大模型的三大支柱,而資料是大模型進行訓練的根基。資料集塑造了AI的認知邊界,它們決定了AI「看」世界的界限。
例如,創建電腦視覺系統的第一步,通常是從網路上抓取成千上萬甚至數百萬張圖像,然後建立一系列分類體系來對它們進行排序,並以此作為系統感知可觀察事實的基礎。
如果想要建立一個可以偵測蘋果和橘子圖片之間差異的機器學習系統,首先開發人員必須收集和標記數以千計的蘋果和橘子的圖像,並基於此訓練神經網路。在軟體方面,演算法會對影像進行統計調查,並開發一個模型來識別兩個「類別」之間的差異。
如果一切按計劃進行,經過訓練的模型將能夠區分它以前從未遇到過的蘋果和橘子圖像之間的差異。
但如果所有蘋果的訓練圖像都是紅色的,而沒有一個是綠色的,那麼機器學習系統可能會推斷「所有蘋果都是紅色的」。青蘋果完全不會被辨識為蘋果。
因此,訓練資料集是大多數機器學習系統進行推理的核心。它們是AI系統用來產生預測基礎的主要原料。
現在網路上每天有不可勝數的文字、圖片、影音被上傳,AI參與者就開始了資料掠奪。
科技巨頭在其中佔據了優勢地位,像騰訊、字節、Meta等掌握著各自的資料管道,分享內容的人越多,他們能用來訓練大模型的力量就越大。人們很樂意免費為他們的照片貼上姓名和地點的標籤,而這種無償勞動為機器視覺和語言模型系統帶來了更準確的標記資料。
沒有這些數據管道的企業就要為此付一大筆費用或想其他辦法得到。
OpenAI就曾被通報其在未被創作者授權情況下,使用Whisper語音辨識工具,轉錄了超過一百萬小時的YouTube影片內容,並將這些資料用於訓練其GPT-4模型。
但數據,尤其是高品質的數據並非取之不盡的。根據去年Epoch AI人工智慧預測組織的一項研究,AI公司可能在2026年前耗盡高品質文字訓練數據,而低品質文字和圖像數據的枯竭時間可能介於2030年至2060年之間。
山姆·奧特曼曾認為AI最後應當可以產生高品質的“人造資料”,以便高效地進行自我培訓。
但很多研究者認為,AI產生的數據品質太差,再用這樣的數據「餵」自己就是「自我投毒」。
對高品質數據的飢渴催生了“AI錄音員”“大數據標註師”“AI編輯”等眾包工作。
之前就有媒體報道,在一些一、二線城市,網路大廠正以每次300元的價格,招募「AI錄音員」。他們的任務是為大模型提供客製化的語音數據,透過錄製長達3小時的對話,幫助AI更好地理解和學習人類語言。
這300元不是那麼好賺的,需要提供有充足劇情、嚴格符合規範的高品質內容,可能需要多次重複一些內容才能符合要求。
事實上,AI的一個常被忽視的重大事實就是需要數量龐大的低薪工人來幫助開發、維護和測試AI系統。例如AI錄音員,還有給數千小時的訓練資料做標記,審查可疑或有害的內容。但他們從未因為使這個AI系統正常運作而獲得認可。
此外,像亞馬遜的物流系統,即便配備了大量機器人來做諸如搬箱子這樣的重活,但也需要人來配合完成機器人做不了的特殊、精細的工作,比如機器人識別不了的奇形怪狀的東西。
人去配合機器人,就要不斷適應機器人,還要按照機器的節奏,很難運用自己已有的知識或形成工作慣性。
這顯示出了AI發展初期人的改造,把人的勞動和價值之間進行脫節,以便更好地配合機器,也更容易被取代。
而AI大多數訓練集是在人們不知情或未經當事人同意的情況下構建的,像家裡的智能音箱、口袋裡的手機、智能手錶、監控記錄下的面部表情等,會不會也被拿來作為資料訓練AI?
機器學習模型需要持續的資料流才能變得更加準確。但機器只能漸近,永遠不會達到完全精準,這進一步推動演算法從盡可能多的人身上提取信息,來為人工智慧提供「燃料」。人類主體性被進一步消解。
寫下這麼多並不是“反技術”,恰恰相反,技術給人類帶來了許多便利,創造了更多可能性,使人類擺脫了許多生存和發展難題。
但技術背後是一個涉及能源、資源、人、社會、歷史等各方面的系統性問題。
正如社會學家凱特·克勞福德在其所著《技術之外:社會連結中的人工智慧》中認為,人工智慧既是具身的,也是物質的,由自然資源、燃料、人力、基礎設施、物流、歷史和分類構成,這些都是需要付出代價的。
但很明顯,當下人們更追求科技的軍備競賽和科技狂歡,而忽略了科技以外的一系列問題。
尤瓦爾·赫拉利在《今日簡史》裡說,19世紀工業革命興起之後,當時的社會、經濟和政治模式都無法應對相關的新情況和新問題。封建主義、君主制和傳統宗教不適合管理工業大都市、數百萬離開家鄉的工人,並面對現代經濟不斷變化的本質。
狄更斯筆下的煤礦童工、第一次世界大戰和1932—1933年的烏克蘭大饑荒,都只是人類付出昂貴學費的一小部分。
現代文明有核武及各種更高級的技術,破壞力也更驚人,我們只能比面對工業革命時做得更好才行。
人類的行進既充滿智慧,又是盲目的。做任何事都有代價,或許最優的結果是效果和代價匹配,而非不計代價地奔向目標。