科學人工智慧能夠辨識複雜資料集中的模式並將其表述為物理理論
新理論的發展通常與物理學大師有關。例如,你可能會想到艾薩克-牛頓或阿爾伯特-愛因斯坦。許多諾貝爾獎都是為新理論而頒發的。現在,Forschungszentrum Jülich(尤利希研究中心)的研究人員編寫了一個人工智慧程序,它也掌握了這一創舉。他們的人工智慧能夠辨識複雜資料集中的模式,並將其表述為物理理論。
從資料中學習行動觀察一個由相互作用的自由度組成的物理系統(灰點),其精確的相互作用是未知的(陰影區域)。透過系統的測量來訓練神經網路。此網路以無監督的方式學習訓練資料分佈的估計。使用圖解語言逐層從網路參數中提取動作。最終的動作係數A (�)代表學習到的交互作用(粉紅色節點)。
在下面的訪談中,來自尤利希研究中心高級模擬研究所(IAS-6)的莫里茨-海利亞斯(Moritz Helias)教授解釋了”人工智慧物理學”的內涵,以及它與傳統方法的不同之處。
物理學家如何提出新理論?
通常情況下,首先要對系統進行觀察,然後再嘗試提出不同系統組件之間如何相互作用,以解釋觀察到的行為。然後從中得出新的預測,並付諸實行。一個著名的例子是艾薩克-牛頓的萬有引力定律。它不僅描述了地球上的引力,還可以用來相當準確地預測行星、衛星和彗星的運動,以及現代衛星的軌道。
然而,得出這些假設的方式總是不同的。我們可以從物理學的一般原理和基本方程式入手,從中推導出假設;也可以選擇現象學方法,僅限於盡可能準確地描述觀察結果,而不解釋其原因。困難在於從眾多可能的方法中選擇一種好的方法,必要時對其進行調整和簡化。
研究人員採取了什麼方法?
一般來說,這涉及一種被稱為”機器學習物理學”的方法。工作小組中使用物理學方法來分析和理解人工智慧的複雜功能。
研究小組的克勞蒂亞-梅爾格(Claudia Merger)提出的重要新想法是,首先使用一個神經網絡,學會將觀察到的複雜行為準確地映射到一個更簡單的系統中。換句話說,人工智慧旨在簡化我們觀察到的系統組件之間的所有複雜互動。然後,使用簡化後的系統,用訓練有素的人工智慧創建反映射。從簡化的系統回到複雜的系統再發展新的理論。在返回的過程中,複雜的交互作用是由簡化的交互作用逐一建立起來的。因此,這種方法最終與物理學家的方法並無太大區別,不同之處在於,現在是從人工智慧的參數中讀取相互作用的組合方式。這種看待世界的視角–從遵循一定規律的各部分之間的相互作用來解釋世界–是物理學的基礎,因此被稱為”人工智慧物理學”。
在哪些應用中使用了人工智慧?
例如,開發過程中使用了一個黑白手寫數位影像資料集,這是研究神經網路時經常使用的資料集。作為博士論文的一部分,克勞蒂亞-梅爾格研究了影像中的小型子結構(如數字的邊緣)是如何由像素之間的相互作用構成的。研究發現,一組像素往往一起變亮,從而形成了數位邊緣的形狀。
運算工作量有多大?
人工智慧的使用首先是一種使計算成為可能的技巧。很快就可以計算出大量可能的相互作用。如果不使用這個技巧的話,只能研究非常小的系統。儘管如此,所需的計算量仍然很大,這是因為即使在有許多組件的系統中,也存在許多可能的相互作用。不過,我們可以有效地對這些相互作用進行參數化,因此我們現在可以查看大約有1000 個相互作用成分的系統,即最多有1000 個像素的圖像區域。未來,透過進一步的優化後還可以看到更大的系統。
這種方法與ChatGPT 等其他人工智慧有何不同?
許多人工智慧旨在學習用於訓練人工智慧的資料理論。然而,人工智慧學習的理論通常無法解釋。相反,它們隱含在訓練好的人工智慧參數中。與此相反,新的方法提取了所學理論,並用系統組件之間的交互語言將其表述出來,而這正是物理學的基礎。因此,它屬於可解釋的人工智慧領域,特別是”人工智慧物理學”,因為我們使用物理學語言來解釋人工智慧所學到的知識。我們可以使用互動語言在人工智慧複雜的內部運作與人類可以理解的理論之間架起一座橋樑。
參考文獻:《從資料中學習互動理論》,作者:Claudia Merger、Alexandre René、Kirsten Fischer、Peter Bouss、Sandra Nestler、David Dahmen、Carsten Honerkamp 和Moritz Helias,2023 年11 月20 日,《物理評論X 》。
DOI: 10.1103/PhysRevX.13.041033
編譯自: ScitechDaily