GoogleAI天氣「神算」登Nature:30秒模擬22天天氣效率暴漲10萬倍
今天一早,Google CEO在X上發布帖子,宣告NeuralGCM在氣候建模領域取得了重大突破! “NeuralGCM將基於物理的建模與人工智慧相結合,在模擬大氣方面的效率比其他模型高出10萬倍,為科學家提供了預測氣候變遷的新工具。”
這項研究成果也刊登在了Nature上,研究團隊大部分來自Google Research和DeepMind,還有MIT、哈佛和ECMWF的科學家。
論文網址:https://www.nature.com/articles/s41586-024-07744-y
Google開發的這個名為NeuralGCM的模型,能夠快速、有效率且精確地模擬地球大氣。
意義在於,在地球正以前所未有的速度暖化的當下,幫助科學家對地球氣候做出準確的預測——
全球氣溫升高會使哪些地區面臨長期乾旱?哪些地方會因大型熱帶風暴而使沿海洪水更頻繁?隨著氣溫上升,野火季節將如何改變?
面對這些亟待解決的問題,傳統的基於物理的大氣環流模型(General Circulation Model,GCM)顯得有些捉襟見肘,GCM在面對長期天氣和氣候模擬時,缺乏足夠的穩定性。
而NeuralGCM是一種基於機器學習的方法,結合了傳統的物理建模,大大提高了模擬的準確性和效率。
這種方法產生的2-15天的天氣預報比目前最先進的物理模型更準確,並且比傳統的大氣模型更準確地再現了過去40年的氣溫。
它標誌著在開發更強大、更容易使用的氣候模型方面邁出了重要一步。
NeuralGCM模擬了2019年12月26日至2020年1月8日期間的特定濕度(specific humidity)變化模式
NeuralGCM變革氣候建模
儘管傳統氣候模型在過去幾十年中有所改進,但由於科學家對地球氣候運作機制和模型建構方式的理解不完全,它們往往會產生誤差和偏差。
這些模型將地球從地表到大氣層的這部分空間,劃分成邊長為50-100公里的立方體,然後預測每個立方體在一段時間內的天氣變化。
然後,模型根據公認的物理定律計算空氣和水分的運動,這也就是天氣預報的基本原理。
但問題在於,50-100公里這個尺度實在太大了。
許多重要的氣候過程,包括雲和降水,在比目前模型使用的立方體尺寸更小的尺度上變化(毫米到公里)。
而且,科學家對某些過程(如雲的形成)的物理理解也不完整。
因此,這些傳統模型不僅依賴基本原理,還使用簡化模型產生稱為「參數化」的近似值來模擬小尺度和不太了解的過程。
這些簡化的近似值不可避免地降低了基於物理的氣候模型的準確性。
那麼,NeuralGCM是怎麼解決這一難題的呢?
像傳統模式一樣,NeuralGCM仍然將地球大氣劃分為立方體,並對大規模過程(如空氣和水分運動)的物理學進行計算。
不同的是,NeuralGCM不再依賴科學家製定的「參數化」近似值來模擬小尺度天氣變化,而是使用神經網路從現有天氣資料中學習這些事件的物理原理。
NeuralGCM的一個關鍵創新,是用JAX從頭重寫了大規模過程的數值解算器。
這使得研究人員能夠使用基於梯度的最佳化,來線上調整耦合系統在多個時間步長上的「線上」行為。
相較之下,先前嘗試使用機器學習增強氣候模型的努力在數值穩定性方面遇到了很大困難,因為它們使用「離線」訓練,忽略了隨著時間累積的小尺度和大尺度過程之間的重要反饋。
整個模型用JAX編寫的另一個好處是它可以在TPU和GPU上有效地運行,而傳統的氣候模型大多在CPU上運行。
NeuralGCM結合了傳統的流體動力學求解器和用於小尺度物理的神經網絡,這些組件透過一個微分方程求解器組合在一起,使系統按時間順序推進
Google團隊使用了1979年至2019年間ECMWF的天氣數據,在0.7°、1.4°和2.8°分辨率下訓練了一系列NeuralGCM模式。
雖然NeuralGCM是基於天氣預報資料訓練的,但團隊設計NeuralGCM為一個通用的大氣模式。
精準的天氣預報與氣候預測
最近的地球大氣機器學習(ML)模型,包括Google DeepMind的GraphCast,已經在天氣預測方面展示了革命性的準確性。
迄今為止,ML預測的研究主要集中在短期預測上,遠未達到氣候預測所需的數年到數十年。
由於數十年的氣候預測難以可靠驗證,Google團隊評估了NeuralGCM在氣候尺度預測方面的表現,並使用已建立的WeatherBench 2基準將其作為一個天氣模型進行了評估。
NeuralGCM在0.7°解析度下的確定性模式(deterministic model)在天氣預報準確度方面與目前最先進的模式相當,天氣預報準確度可達5 天。
然而,確定性模式缺乏所需的量化不確定性,無法在較長的準備時間內做出有用的預報。
預報集合從略微不同的起始條件生成,以產生一系列同樣可能的天氣狀況。這些集合產生的機率天氣預報通常比確定性預報更準確。
NeuralGCM在1.4°分辨率的整合模型(ensemble model),在5至15天的預測準確性方面優於先前的SOTA。
這種性能提升,得益於NeuralGCM生成的是集合天氣預測,後者能和ECMWF基於物理的SOTA模型ECMWF-ENS相媲美。
在已發布的ML模型中,NeuralGCM是第一個做到這一點的。
在2至15天的預測中,NeuralGCM的集合預測有95%的時間比ECMWF-ENS更準確。
NeuralGCM在氣候時間尺度預測方面,NeuralGCM也優於最先進的大氣模式。
由於NeuralGCM僅模擬地球氣候的大氣成分,Google團隊將其性能與基於物理的大氣模型進行了比較。
在預測1980年至2020年間的溫度時,NeuralGCM的2.8°確定性模型的平均誤差,是大氣模型(AMIP)誤差的三分之一,即0.25 vs. 0.75攝氏度。
比較NeuralGCM和AMIP在1980年至2020年間預測1000 hPa全球平均溫度的表現
由於傳統的大氣模型在模擬地球大氣的某些方面存在困難,氣候科學家有時會使用更高解析度的模型,如X-SHiELD,這些模型雖然更準確,但計算成本較高。
與X-SHiELD相比,NeuralGCM的1.4°確定性模型在預測2020年的濕度和溫度資料時誤差減少了15-50%,這些資料由美國國家海洋和大氣管理局(NOAA)提供。
在2020年的氣候模擬期間,NeuralGCM也預測了熱帶氣旋模式,這些模式與當年在相同區域觀察到的風暴數量和強度相符。
NeuralGCM是第一個能夠產生此類模式的基於機器學習的模型。
NeuralGCM預測了2020年全球範圍內的熱帶氣旋路徑(預測的風暴數量和強度與ECMWF再分析v5(ERA5)資料集中記錄的實際氣旋數量和強度相符)
開放、快速、高效
NeuralGCM在計算速度和成本上比傳統的基於物理的氣候模型快了幾個數量級。
其1.4°模型比X-SHiELD快3500多倍,這意味著如果研究人員用X-SHiELD模擬一年的大氣,需要20天,而用NeuralGCM只需8分鐘。
而且,科學家只需要一台有單一TPU(張量處理單元,Tensor Processing Unit)的電腦就能運行NeuralGCM,而運行X-SHiELD則需要請求使用擁有13000個CPU(中央處理單元,Central Processing Unit)的超級電腦。
整體而言,使用NeuralGCM進行氣候模擬的運算成本比X-SHiELD低10萬倍,相當於高效能運算領域25年的進步速度。
在此圖表中,NeuralGCM和兩個物理模型NCAR CAM、NOAA X-SHiELD同場競技,比較它們在30秒計算時間內產生的大氣模擬天數。
這三個模型分別以不同的分辨率運行,其中X-SHiELD的分辨率最高(0.03°),NCAR CAM6的分辨率為1.0°,NeuralGCM的分辨率最低(1.4°)。
值得一提的是,儘管NeuralGCM以低解析度運行,但其準確性與高解析度模型相當。
那麼,在準確度相當的情況下,可以看到,NeuralGCM在30s的時間內,就能夠產生22.8天的大氣模擬,而X-SHiELD作為一個必須在超級電腦上運行的高解析度物理模型,則只能生成9分鐘!
這也讓先前因計算成本較低而頗受研究人員青睞的NCAR CAM6的優勢蕩然無存。
Google團隊已在GitHub上公開了NeuralGCM的原始碼和模型權重,以供非商業用途。他們希望其他研究人員可以輕鬆添加新組件來測試假設並改進模型功能。
此外,由於NeuralGCM可以在筆記型電腦上運行,而不需要超級電腦的支持,因此更多的氣候研究人員能夠在他們的工作中使用這個最先進的模型。
結論與未來方向
NeuralGCM目前僅對地球大氣進行建模,但Google團隊希望最終將地球氣候系統的其他方面,例如海洋和碳循環,納入模型。
透過這種方式,NeuralGCM將能夠在更長的時間尺度上進行預測,不僅可以預測幾天和幾週的天氣,還能在氣候時間尺度上進行預測。
總而言之,NeuralGCM提出了一種建立氣候模型的新方法,這種方法可能比現有模型更快、計算成本更低且更準確。