DeepMind 的最新人工智慧可以解決幾何問題
Google人工智慧研發實驗室DeepMind認為,提升人工智慧系統能力的關鍵可能在於發現解決具有挑戰性的幾何問題的新方法。為此,DeepMind 今天發布了AlphaGeometry–該實驗室聲稱該系統能夠解決的幾何問題與國際數學奧運金牌得主的平均水平相當。
AlphaGeometry 的程式碼已於今天早上開源,它能在標準時限內解決25 個奧數幾何問題,超過了之前最先進系統的10 個。
Google人工智慧研究科學家Trieu Trinh和Thang Luong在今天早上發表的一篇部落格文章中寫道:「解決奧林匹克級的幾何問題是開發深度數學推理的一個重要里程碑,是邁向更先進、更通用的人工智慧系統的必經之路。[我們]希望……AlphaGeometry 能夠幫助我們在數學、科學和人工智慧領域開闢新的可能性」。
為什麼關注幾何?DeepMind 斷言,證明數學定理,或從邏輯上解釋為什麼一個定理(如勾股定理)是真的,既需要推理,也需要從一系列可能的步驟中選擇解決方案的能力。如果DeepMind 的想法是正確的,那麼這種解決問題的方法有朝一日會在通用人工智慧系統中大顯身手。
DeepMind在新聞稿資料中寫道:「證明某個猜想的真假,即使是當今最先進的人工智慧系統也力不從心。朝著這個目標,能夠證明數學定理……是一個重要的里程碑,因為它展示了對邏輯推理的掌握和發現新知識的能力。”
但是,訓練人工智慧系統解決幾何問題帶來了獨特的挑戰。
由於將證明轉化為機器能夠理解的格式非常複雜,因此可用的幾何訓練資料非常匱乏。而當今許多尖端的生成式人工智慧模型雖然在識別資料中的模式和關係方面表現出色,但卻缺乏透過定理進行邏輯推理的能力。
在設計AlphaGeometry 的過程中,實驗室將”神經語言”模型(一種在架構上與ChatGPT 類似的模型)與”符號推導引擎”(一種利用規則- 如數學規則來推斷問題解決方案的引擎)配對使用。符號引擎可能不夠靈活且速度較慢,尤其是在處理大型或複雜的資料集時。但DeepMind 透過讓神經模型”引導”推理引擎找出給定幾何問題的可能答案,緩解了這些問題。
為了取代訓練數據,DeepMind 創建了自己的合成數據,產生了1 億個”合成定理”和不同複雜程度的證明。然後,實驗室在合成資料上從頭開始訓練AlphaGeometry,並在奧林匹克幾何問題上進行評估。
奧林匹克幾何問題以圖表為基礎,在解題前需要添加”構造”,如點、線或圓。當應用於這些問題時,AlphaGeometry 的神經模型會預測哪些構造可能需要添加–AlphaGeometry 的符號引擎會利用這些預測對圖表進行推理,找出類似的解決方案。
Trinh和Luong寫道:”有了這麼多這些構造如何導致證明的例子,AlphaGeometry的語言模型就能在遇到奧林匹克幾何問題時為新的構造提出好的建議。一個系統提供快速、’直觀’的想法,而另一個系統則提供更深思熟慮、理性的決策。”
AlphaGeometry的解題結果發表在本週的《自然》(Nature)雜誌上,它很可能會引發一場曠日持久的爭論:人工智慧系統應該建立在符號操作(即使用規則操作代表知識的符號)的基礎上,還是建立在表面看來更像大腦的神經網路的基礎上。
神經網路方法的支持者認為,智慧行為–從語音辨識到影像生成時可以從大量資料和計算產生。與符號系統相比,神經網路試圖透過統計近似和從實例中學習來解決任務,而符號系統則是透過定義專門用於特定工作的符號操縱規則集來解決任務(如在文字處理軟體中編輯一行)。
神經網路是OpenAI 的DALL-E 3 和GPT-4 等強大人工智慧系統的基石。但是,符號人工智慧的支持者認為,神經網路並不是萬能的;這些支持者認為,符號人工智慧可能更適合高效地編碼世界上的知識,在複雜的場景中進行推理,並”解釋”它們是如何得出答案的。
作為一個類似DeepMind 的AlphaFold 2 和AlphaGo 的符號-神經網路混合系統,AlphaGeometry 或許證明,將符號操作和神經網路這兩種方法結合起來,是尋找可通用人工智慧的最佳途徑。
“我們的長期目標仍然是建立能夠在數學領域通用的人工智慧系統,開發通用人工智慧系統所依賴的複雜問題解決和推理能力,同時拓展人類知識的前沿,”Trinh 和Luong 寫道。”這種方法可以塑造未來的人工智慧系統如何發現數學及其他領域的新知識”。