DeepMind AI擊敗全球最先進天氣預報系統8分鐘預報15天全球天氣
來自世界氣象組織(WMO)的數據顯示,在過去50 年裡,平均每天都會發生一場與天氣、氣候或水患有關的災害,每天造成115 人死亡、2.02 億美元的經濟損失。因此,建立更準確的天氣預報系統,將有助於挽救數百萬人的生命,減少數兆美元的經濟損失,意義重大。
然而,傳統的天氣預報依賴數值天氣預報演算法(NWP),計算複雜度高、模型建構耗時,難以快速產生預報結果。基於機器學習的天氣預報(MLWP)在效率和單次預報準確性上雖有所突破,但在量化預報不確定性和處理複雜時空相關性方面表現不足,表現不及NWP 集成預報系統。
如今,由Google DeepMind 研究團隊開發的人工智慧(AI)模式GenCast,將天氣預報的精確度與效率帶入了一個嶄新的階段:
GenCast 能夠在8 分鐘內產生一組隨機的15 天全球預報,時間步長為12 小時,分辨率達0.25°,涵蓋超過80 種地表和大氣變量,在97.2% 的評估指標(共1320 個指標)上都優於當前全球最好的中期預報-歐洲中期天氣預報中心(ECMWF)的集合預報(ENS),而且具有更好的邊際和聯合預報分佈。
另外,GenCast 在預報極端天氣(如高溫、強風)、熱帶氣旋路線和風能產量時,也更有效。
相關研究論文以「Probabilistic weather forecasting with machine learning」為題,已發表在權威科學期刊Nature 上。

GenCast:更快、更準預報未來天氣
GenCast 是一個全新的機率天氣預報模型,透過條件擴散模型(conditional diffusion model)產生一系列可能的天氣場景。其核心能力在於建模未來天氣狀態的條件機率分佈,即基於當前和之前的天氣狀態來產生未來的預報。這一方式讓GenCast 以更快的速度和更高的精度提供全球範圍15 天機率性天氣預報。
具體而言,GenCast 的架構包括編碼器、處理器和解碼器三大模組。編碼器將初始天氣狀態映射到一個經過6 次精細劃分的球形網格上,處理器則透過圖transformer 在網格節點間捕捉複雜的時空相關性,而解碼器則將結果重新映射回全球緯經度網格,產生最終的天氣預報。

圖|GenCast 產生天氣預報的示意圖。
此外,研究團隊利用ERA5 再分析資料對GenCast 進行了訓練,這一資料集包含40 年間全球範圍內的最佳天氣估計分析結果,確保了模型的泛化能力和對歷史天氣模式的深度理解。
為評估GenCast 的實際性能,研究團隊對其進行了基準測試,並將其與目前最先進的系統和模型進行比較。為確保公平對比,所有模型均基於ERA5 資料進行初始化,並統一解析度至0.25°。
在與其他系統比較的實驗中,GenCast 產生的天氣樣本更接近實際觀察值,預報分佈涵蓋了可能的多種情景,為使用者提供了對潛在風險的更全面理解。例如,GenCast 在颱風海貝思登陸日本前不久的預報非常清晰,在1~15 天的預估時間內,其球諧功率譜與ERA5 地面真實值非常接近。
之後,研究團隊評估了GenCast 和ENS 在極端天氣預報方面的整體預報技能、校準和性能,即邊際預報表現。邊際預報作為某一時間和地點的天氣狀況的具體預報,是日常天氣服務的核心。
GenCast 在這領域展現了強大的效能優勢。其產生的預報分佈能夠更精確地反映可能的天氣預報情景,不僅在溫度、風速和氣壓等變數的預報上與真實數據高度吻合,還能透過改進的機率校準有效量化預報的不確定性。
具体研究显示,GenCast 在多个气象变量的边际分布预报中表现优于 ENS,在一个涵盖 1320 个评估目标的测试中,GenCast 在 97.2% 的情况下取得更高的技能得分(CRPS),特别是在短期预报(1 至 5 天)中效果显著。
同时,GenCast 在预报高温、强风等极端天气时同样表现卓越。研究采用 Brier 技能得分和相对经济价值(REV)曲线衡量模型性能。结果显示,在预报高温(99.99% 分位点)和极端低温(0.01% 分位点)事件时,GenCast 的表现显著优于 ENS。
此外,GenCast 的邊際分佈預報展現了良好的校準能力,這意味著它能夠準確地識別預報中可能存在的錯誤或偏差,為用戶提供更可靠的天氣決策支援。

圖|GenCast 的邊際預報分佈熟練且校準良好。
除了邊際預報,GenCast 在聯合預報方面也展現了令人矚目的表現。聯合預報關注天氣變數間的空間和時間相關性,對於捕捉全域天氣系統的動態特性至關重要。
例如,在熱帶氣旋軌跡預報方面,對熱帶氣旋的路徑預報不僅依賴單一變量,還需考慮多層次的大氣交互作用。而GenCast 能夠產生具有時空一致性的天氣樣本,精準地捕捉這些複雜的相關性,從而產生精確預報。
研究特别分析了 GenCast 在台风“海贝思”案例中的表现。台风轨迹预报显示,GenCast 的不确定性评估范围覆盖了更多可能的情景,其在轨迹位置预报上的误差显著低于 ENS。更重要的是,随着预报时间的缩短,GenCast 的不确定性范围逐步收敛,为决策者提供了更精确的着陆时间和地点信息。
除此之外,在區域風能預報中,GenCast 將10 公尺風速資料轉化為風能輸出,其預報精度較ENS 提高了20%,尤其在短時間尺度上,為再生能源調度提供了新的可能性。

圖|GenCast 在區域風力和熱帶氣旋預報方面優於ENS。
尽管 GenCast 在精度与效率上实现了双重突破,但仍有进一步优化空间。例如,提高分辨率以匹配未来升级的 ENS 系统,或者通过蒸馏技术降低计算成本。此外,结合操作性数据进行微调或融入更多传统 NWP 的初始条件处理方法,亦可显著提升其实用性。
AI 如何重塑氣候預報未來?
AI 作為“一個改善極端天氣預報的更快、更便宜的替代方案”,一向在天氣預報領域被寄予厚望,除了Google,包括華為、清華大學等在內的科技公司和高校在這一方向均取得了重大進展。
2023 年7 月,由華為雲開發的盤古氣象(Pangu-Weather)模型登上了Nature,其使用39 年的全球再分析天氣數據作為訓練數據,預報準確率與全球最好的數值天氣預報系統IFS相當,且在相同的空間解析度下比IFS 快10000 倍以上。
同期發表在Nature 上的另一篇論文則介紹了NowcastNet,其出自機器學習領域泰斗、加州大學柏克萊分校教授Michael Jordan 和清華大學教授王建民領導的研究團隊,該模型可以結合物理規律和深度學習,進行實時預報降水。 NowcastNet 在臨近預報方面表現出色,基於雷達觀測數據,可以做到提前3 小時對2048 km × 2048 km 的區域進行高分辨降水預報。
2023 年 11 月,Google DeepMind 推出了一款基于机器学习的天气预报模型——GraphCast,在全球 0.25° 的分辨率下,该模型可以在一分钟内预报未来 10 天的数百个天气变量,显著优于传统气象预报方法,同时在预报极端事件方面表现良好。相关研究论文已发表在权威科学期刊 Science 上。
2024 年3 月,Google Research 洪水預報團隊開發了AI 模型,其利用5,680 個測量儀資料訓練,可在7 天內預報未測量流域的日徑流。該模型在同日預報和5 年一遇極端天氣事件的預報中,表現優於當時領先的全球洪水預警系統GloFAS。相關研究論文已發表在權威科學期刊Nature 上。
2024 年7 月,Google Research 團隊及其合作者推出了一款天氣預報和氣候模擬模型NeuralGCM,在1-15 天短期天氣預報中的準確率媲美ECMWF 模型,並在氣旋預報和軌跡模擬上表現優於現有模型。加入海平面溫度後,此模型的40 年氣候預報結果與全球暖化趨勢高度一致。且NeuralGCM 可以在30 秒計算時間內產生22.8 天大氣模擬。相關研究論文已發表在權威科學期刊Nature 上。
相信在不久的將來,AI 驅動的天氣預報將以更快的速度與更高的準確率在災害預警、能源規劃和氣候適應等方面發揮更大的作用,為人類應對日益複雜的氣候挑戰提供更強大的工具。