Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

Nature:DeepMind大模型突破60年數學難題 解法超越人類已有認知

Nature:DeepMind大模型突破60年數學難題 解法超越人類已有認知

2023-12-16 Comments 0 Comment

用大模型解決困擾數學家60多年的問題,GoogleDeepMind最新成果再登Nature。 作者之一、GoogleDeepMind研究副總裁Pushmeet Kohli表示:訓練資料中不會有這個方案,它之前甚至根本不為人類所知。

這項技術名為FunSearch,其中的Fun是函數(Function)一詞的簡寫。

利用大模型解決長期存在的科學難題,產生以前不存在的可驗證且有價值*的新資訊。

在Nature論文配套的新聞解讀中,DeepMind負責人稱「我們使用大模型的方式是當創意引擎」。

這是第一次有人證明基於大模型的系統可以超越數學家和電腦科學家的認知。

它不僅新穎,而且比當今存在的任何其他東西都更有效。

針對這項成果,有網友感慨:

如果這是真的,那可是人類自火之後最重要的發現了。

那麼,FunSearch都解決了哪些問題呢?

求NP-hard問題更優解法

DeepMind具體展示了兩類問題,它們都屬於NP-hard問題。

在學界看來,沒有而且可能永遠也不會有一種演算法能在所有情況下都在多項式時間內找到NP-hard問題的精確解。

面對這樣的問題,研究者通常會尋找近似解或適用於特定情況的有效演算法。

具體到FunSearch,它解決的第一類NP-hard問題是Cap set問題,是上限集問題的一種,它的描述是這樣的:

在一個n維空間中的每個維度上都有等距的n個點(共n^n個,例如3維就是3*3*3),從中找出盡可能多的點構成一個集合,要求集合中任選3個點均不共線,這樣的集合中最多有幾個點?

如果看起來有些難以理解,不妨再了解一下Cap set問題的前身——上世紀70年代遺傳學家Marsha Falco發明的一套卡牌遊戲。

這套卡牌遊戲中一共有81張牌,每張牌中都有1至3個顏色圖案,同一張牌中的圖案顏色、形狀和陰影完都全相同。

這套牌一共有3種顏色、3種形狀和3種陰影,加上圖案數量的不同,一共有3*3*3*3=81張,玩家需要翻開一些紙牌,找到3張牌的特殊組合。

如果把這種「特殊組合」的具體方式用離散幾何形式來表達,就得到了Cap set問題。

Cap set問題同樣誕生於70年代,由牛津大學數學家Ron Graham提出,而第一個重要結果直到90年代才出現。

2007年,陶哲軒在一篇部落格文章中提到,這是他最喜歡的開放式數學問題。

在FunSearch出現之前,Cap set問題最重大的突破是美國數學家Jordan Ellenberg和荷蘭數學家Dion Gijswijt於2016年提出的。

透過多項式方法,Ellenberg和Gijswijt將n>6時(n≤6時可精確找到最大集合)此類問題解的上確界縮小到了2.756^n。

同樣在n>6時,下確界的較新數字則是2.218^n,由布里斯託大學博士生Fred Tyrrell在2022年提出。

但這個下確界僅僅存在於理論上──當n=8時,人類能建構出的最大集合中只有496個點,而依照Tyrrell的結論,點的數量應不少於585.7個。

FunSearch則將集合規模擴大到了512個點——雖然和理論值依舊存在差距,但仍被視為20年來在此問題上最重大的突破。

同時,Cap set集合大小的下確界也被FunSearch提高到了2.2202^n。

第二類是線上裝箱問題:

假設有一組容量為C的標準貨櫃和n個物品序列(物品大小不超過C),這些物品以一定順序到達。

「線上」是指操作者無法事先看到所有的物品,但必須在物品到達時立刻決定將物品裝入哪個貨櫃。

最終的目標,是使所用貨櫃數量盡可能小。

線上裝箱問題引起廣泛研究是從上世紀70年代開始的,最早更是可以追溯到1831年高斯所研究的佈局問題。

經過近200年的研究,仍然沒有成熟的理論和有效的數值計算方法。

傳統上常用的貪心演算法包括First Fit和Best Fit兩種:

First Fit是指將每個物品放入第一個能容納它的箱子中。 Best Fit則是將每個物品放入能容納它的且箱子中剩餘空間最小的箱子。

而FunSearch則提出了新的演算法,該演算法在OR和Weibull兩個測試資料集中,所用貨櫃的數量均大幅下降。

特別是當測試集物品數目達到10萬時,FunSearch找到的方案,消耗貨櫃數量只比理論下界多出了0.03%。

(下表的數據表示與理論下界的差異,數字越小表現越好)

那麼,FunSearch是如何實現的呢?

搜尋“程序”而不是“答案”

整體來看,FunSearch的工作流程是一個迭代過程,核心是搜尋能解決問題的程序,而不是問題答案本身。

搜索,正是DeepMind自AlphaGo以來一直堅持探索的路線。

共同創辦人Shane Legg曾在訪談中解釋:

AlphaGo擊敗李世石的關鍵「第37步」從何而來?不是來自人類對弈數據,而是來自對機率空間的搜尋。

目前大模型只是模仿、混合不同的訓練數據,要產生真正的創造力並超越目前的架構,就需要結合搜尋。

回到最新成果FunSearch,系統當中有一個程式庫,每次迭代時,系統會從中搜尋初始程式並輸入大模型(實驗用PaLM2,其他只要支援程式碼也相容)。

大模型在此基礎上建立產生新的程序,並交給自動評估系統,得分最高的程序會被加入程式庫,從而實現自我循環。

其中,評估系統會根據使用者的問題產生測試案例,然後判斷候選程式的輸出是否正確。

根據複雜程度不同,判斷正誤的方法既包括直接檢查輸出值,也包括對相關函數進行呼叫。

同時評估系統也設定有容錯邏輯,避免逾時等問題影響整體流程。

最終,系統會根據備選程序在這些測試案例上的行為給予整體評分,為結果產生和後續程式庫更新提供依據。

論文合著者威斯康辛大學麥迪遜分校的Jordan Ellenberg認為,FunSearch的一個重要特點是,人們可以看到AI產生的成功解決方案並從中學習,與先前AI的黑箱模式完全不同。

對我來說最令人興奮的是建立人機協作的新模式,我不希望用它們來取代人類數學家,而是作為力量倍增器。

來源:量子位

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
GPT-4.5疑遭大外洩:支援影片3D、價格要狂漲6倍
NEXT
一份新報告稱微軟Copilot經常為選舉問題提供虛假信息

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2023 年 12 月
一 二 三 四 五 六 日
 123
45678910
11121314151617
18192021222324
25262728293031
« 11 月   1 月 »

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • 中國新創公司曾淡化出身如今一些新創公司卻開始自豪於這一點 2025-05-18
  • 《生化危機9》為何遲遲不公佈?可能是優化問題 2025-05-18
  • 任天堂解釋《瑪利歐賽車:世界》成為首發遊戲的原因 2025-05-18
  • 墨西哥海軍大型帆船撞布魯克林大橋造成55人受傷 2025-05-18
  • 新型火山預警系統在爆發前就能聽到地球的聲音 2025-05-18
  • 洋紅色極光和陷入錯亂的衛星:接管了美國宇航局演習的甘農太陽風暴 2025-05-18
  • 新研究顯示瓦薩奇斷層比之前認為的更危險下一次強震遲早會發生 2025-05-18
  • iPhone 17 Air 電池容量和重量資訊外洩 2025-05-18
  • 華為nova 14系列明天發布:三款機型樣機到店提前拆罰20萬起 2025-05-18
  • 中國電信5G-A套餐正式商用:比5G快10倍更穩定 2025-05-18

熱門文章與頁面︰

  • 「多喝水」真的有用研究顯示有助於減肥、治療腎結石
  • 美國議員稱TP-Link超低價助長中國網路攻擊支持銷售禁令
  • 《不可能的任務8:最終清算》定檔5月30日阿湯哥最後一搏震撼打響
  • 北京地鐵扶梯上多了兩隻黃色腳印不必“左行右立”
  • CentOS7.2 调整mysql数据库最大连接数
  • "91大神"偷拍百名女性獲刑:曾任外企高管年薪百萬
  • 中國電信5G-A套餐正式商用:比5G快10倍更穩定
  • 華為nova 14系列明天發布:三款機型樣機到店提前拆罰20萬起
  • 新研究顯示瓦薩奇斷層比之前認為的更危險下一次強震遲早會發生
  • 三星Galaxy S25 系列官方桌布下載

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.