谷歌DeepMind創辦人提出通用人工智慧分級ChatGPT只是初級
GoogleDeepMind共同創辦人謝恩·萊格(Shane Legg)帶領的DeepMind研究團隊發布論文。當地時間11月4日,GoogleDeepMind聯合創始人謝恩·萊格(Shane Legg)帶領的DeepMind研究團隊發布論文(Levels of AGI: Operationalizing Progress on the Path to AGI),提出了對通用人工智慧(AGI)的更清楚定義,制定了類似自動駕駛L1-L5等級的AGI分級分類架構。
長期以來,AGI都是一個含義模糊的概念,粗略可以將其理解為「和人類差不多聰明」。研究團隊在論文中寫道,“我們希望提供一個共通的語言,用於比較模型、評估風險,以及衡量我們在通往AGI的道路上行進到了什麼階段。”
AGI六大定義原則
研究團隊沒有用一句話概括AGI,而是提出,任何對AGI的定義都應滿足六個原則:
關注能力,而非過程。也就是說專注於AGI可以完成什麼,而不是完成任務的機制。這種將焦點放在能力上的方式,使我們能夠將一些內容排除在對AGI的要求之外,例如實現AGI並不意味著智能體以類似人類的方式思考或理解,或實現AGI並不意味著智能體具備意識或感知(具有情感的能力),因為這些特質不僅著重於過程,而且目前無法透過公認的科學方法來衡量。
關注通用性和性能。研究團隊認為,通用性和效能是AGI的關鍵組成部分。
關注認知和後設認知任務。大多數對AGI的定義側重於認知任務,可以理解為非物理任務。儘管目前機器人技術取得了一些進展,但與非物理能力相比,AI系統的物理能力似乎落後了。執行實體任務的能力確實增加了智能體的通用性,但我們認為這不應被視為實現AGI必要的先決條件。另一方面,後設認知能力(例如學習新任務的能力或知道何時向人類請求澄清或協助的能力)是智能體實現通用性的關鍵先決條件。
關注潛力,而非部署。證明系統能夠以一定性能等級執行一組必要任務,應該足以宣布該系統為AGI,在現實世界部署這樣的系統,不應該成為AGI定義的固有要求。
關註生態效度(Ecological Validity)。我們希望強調,選擇與人們在現實世界(即生態有效)所重視的任務一致的任務非常重要。
專注於通往AGI的路徑,而不是單一的終點。研究團隊提出AGI的五級分類,每個AGI級別都與一組明確的度量/基準相關聯,以及每個級別都引入已識別的風險和人機交互範式的變化,例如OpenAI提出的勞動替代定義就更符合「大師AGI」。
AGI五級分類
基於能力深度(表現)和廣度(通用性)將AGI分類為:非AI、初級、中級、專家、大師、超級智慧。
基於能力深度(表現)和廣度(通用性),研究將AGI分類為:非AI、初級、中級、專家、大師、超級智慧。單一系統可能橫跨分類法中的不同級別,截至2023年9月,前沿語言模型如OpenAI的ChatGPT、Google的Bard、Meta的Llama 2在某些任務上(如短篇論文寫作、簡單編碼)表現出能力嫻熟的「中級」表現水平,但在大多數任務上(如數學能力、涉及事實性的任務)仍處於「初級」表現水平。
研究團隊認為,總的來說,目前的前沿語言模型會被視為第1級通用AI,即“初級AGI”,直到其性能水平在更廣泛的任務集上提高,滿足第2級通用AI( 「能力嫻熟AGI」)的標準。
同時,研究團隊提醒道,獲得特定認知領域的更強技能,可能對AI安全產生嚴重影響,如在掌握強大的倫理推理技能之前獲得強大的化學工程知識可能是一種危險的組合。還要注意,性能或通用性等級之間的進展速度可能是非線性的。獲得學習新技能的能力可能會加速通往下一個等級的進程。
在效能和通用性的綜合方面,分級中的最高等級是ASI(人工超級智慧)。研究團隊將「超級智慧」效能定義為超過100%的人類。例如,研究團隊假定AlphaFold是分類法中的第5級“限定領域超人AI”,因為它在一個任務(從氨基酸序列預測蛋白質的三維結構)上的表現高於全球頂級科學家的水平。這個定義意味著第5級通用AI(ASI)系統將能夠以沒有人類能夠匹敵的水平執行各種任務。
此外,這個框架也意味著這樣的「超人系統」可能能夠執行比AGI低階更廣泛的任務,可以理解為其能夠實現原本人類完全不可能執行的任務。ASI可能具有的非人類技能可能包括神經介面(透過分析大腦訊號來解碼思想的機制)、神諭能力(透過分析大量數據來做出高品質預測的機制),以及與動物交流的能力(透過分析它們的聲音、腦波或肢體語言的模式等機制)。
10月底,萊格在接受科技播客採訪時表示,他仍然堅持2011年就曾公開發表的觀點——研究人員有50%的可能在2028年實現AGI。那麼這具體指的是哪一個等級呢?目前他還沒有明確的詮釋。