AI模型可以提供一小時、一周甚至下個世紀的天氣預報但它並不比我們更了解氣象
機器學習模型正在接管天氣預報領域,從快速的”這場雨會持續多久”到10 天的展望,一直到世紀級別的預測。這項技術對氣候科學家、應用程式和地方新聞台越來越重要,但實際上它並不比你我更”了解”天氣。
幾十年來,氣象學和天氣預報在很大程度上都是透過將觀測數據與精心調整的物理模型和方程式相匹配來定義的。現在依然如此–沒有觀測就沒有科學–但龐大的資料檔案已經讓強大的人工智慧模式能夠涵蓋你所關心的任何時間尺度。Google希望從現在到永遠主宰這一領域。
在較短的時間尺度上,我們有即時預報,通常是在”我需要帶雨傘嗎?”這個問題上進行諮詢。DeepMind的”即時預報”模型可以解決這個問題,它基本上是把降水地圖看成是一連串的圖像,並試圖預測這些圖像中的形狀將如何演變和變化。
透過研究無數小時的多普勒雷達,該模型可以非常準確地預測接下來會發生什麼,即使在冷鋒帶來降雪或凍雨等相當複雜的情況下也是如此(正如中國研究人員在Google研究成果的基礎上所展示的:https://www.nature.com/articles/s41586-023-06184-4#Abs1)。
這個模型就是一個例子,說明當一個系統對天氣如何發生並不了解時,它能做出多麼準確的天氣預測。氣象學家可以告訴你,當這種氣候現象與另一種氣候現象發生衝突時,你會遇到大霧、冰雹或濕熱天氣,因為這是物理學告訴他們的。人工智慧模型對物理學一無所知——純粹基於數據,它只是對接下來會發生什麼做出統計猜測。就像ChatGPT 其實並不”知道”自己在說什麼一樣,天氣模型也不”知道”自己在預測什麼。
圖片來源:Google DeepMind
對於那些認為必須要有強大的理論框架才能做出準確預測的人來說,這可能會讓他們感到驚訝,事實上,科學家們對於盲目採用一個連一滴雨和一縷陽光都不知道的系統仍心存疑慮。儘管如此,這些結果還是令人印象深刻的,而且在”我去商店的路上會不會下雨”這樣的低風險問題上,它已經足夠出色了。
Google的研究人員最近也展示了一個新的、時間稍長的模型,名為MetNet-3,可以預測未來24 小時內的天氣。正如你可能猜到的那樣,這個模型引入了更大範圍的數據,例如全縣或全州的氣象站,並在更大範圍內進行預測。這適用於”暴風雨是會越過山脈還是會消散”之類的情況。了解明早的風速或熱量是否可能進入危險區域,對於規劃緊急服務和部署其他資源至關重要。
今天,”中程”尺度(即未來7-10 天)天氣預測領域又有了新進展。Google DeepMind 的研究人員在《科學》雜誌上發表了一篇文章,介紹了GraphCast,”它能比行業黃金標準天氣模擬系統更準確、更快速地提前10 天預測天氣狀況”。
GraphCast 不僅在時間上,而且在尺寸上都進行了放大,以0.25 度的經/緯度分辨率覆蓋整個地球,或在赤道上約為28×28 千米。這意味著要預測地球周圍100 多萬個點的天氣狀況,當然,其中有些點比其他點更引人關注,但關鍵是要建立一個全球系統,準確預測未來一周左右的主要天氣模式。
作者寫道:「我們的方法不應被視為傳統天氣預報方法的替代品,而是證明MLWP 能夠應對現實世界預報問題的挑戰,並有潛力補充和改進當前的最佳方法」。
它不會告訴你你家附近會下雨還是只在隔壁鎮子下雨,但它對更大規模的天氣事件非常有用,例如大風暴和其他危險的異常現象。這些事件發生在數千公里範圍內的系統中,這意味著GraphCast 可以相當詳細地模擬它們,並能預測它們的運動和質量,而且只需使用一個Google計算單元,耗時不到一分鐘。
效率是一個重要面向。”數值天氣預報”,即傳統的基於物理學的模型,計算成本高昂。當然,它們的預測速度可以超過天氣發生的速度,否則它們就毫無價值–但你必須讓超級電腦來做這項工作,即便如此,要做出有細微變化的預測也需要一段時間。
比如說,不確定在氣旋來襲之前,大氣中的河流強度會增加還是減少。你可能想做幾個不同強度的預報,幾個不同強度的預報,一個不變的預報。同樣,在遇到風暴、洪水和野火等情況時,這一點也非常重要。提前一天知道必須撤離某個地區,可以挽救生命。
當需要考慮大量不同的變數時,這些工作可能會變得非常複雜,有時必須運行模型幾十次,甚至數百次,才能真正了解事情會如何發展。如果這些預測在超級電腦叢集上每次都要花一個小時,那就有問題了;如果在擁有數千台電腦的桌上型電腦上每次只需一分鐘,那就完全沒有問題了–事實上,你可能會開始考慮預測更多更精細的變化!
這就是艾倫人工智慧研究所(AI2)的氣候模擬計畫背後的理念。如果你想預測的不僅是下周可能出現的10 個不同選項,而是下個世紀可能出現的上千個選項,你會怎麼做?
這種氣候科學對各種長期規劃都很重要,但由於需要操作的變數數量龐大,預測的時間跨度長達數十年,可以肯定所需的運算能力也同樣龐大。因此,AI2 的團隊正在與世界各地的科學家合作,利用機器學習來加速和改進這些預測,從而改進世紀尺度的”預測”。
ClimSim 模型的工作原理與上文討論的模型類似:它們不是將數位輸入基於物理的人工調整模型,而是將所有資料視為一個相互關聯的向量場。當一個數字上升時,另一個數字也會可靠地上升一半,而第三個數字則會下降四分之一,即使機器學習模式不知道這些關係與(例如)大氣中的二氧化碳、地表溫度和海洋生物量有關,這些關係也會被嵌入機器學習模型的記憶中。
專案負責人說,他們建立的模型非常精確,而計算成本卻低得多。但他也承認,科學家雖然保持著開放的心態,但在工作中(這也是很自然的)也會持懷疑態度。如果你想親自看看,程式碼就在這裡:https://github.com/leap-stc/ClimSim/tree/main
由於時間尺度如此之長,氣候變遷如此之快,很難為長期預測找到合適的基本事實,但這些預測的價值卻與日俱增。正如GraphCast 的研究人員所指出的,這並不是其他方法的替代,而是一種補充。毫無疑問,氣候科學家會希望得到他們所能得到的一切工具。