OpenAI科學家震撼TED大會:讓AI模型思考20秒提升效能10萬倍
知名科技媒體Venturebeat消息,OpenAI高級研究科學家、德撲AI之父Noam Brown,在美國舊金山舉辦的TED AI大會上提出了一個震驚的理論——讓AI模型思考20 秒所帶來的性能提升,相當於將模型擴大100,000倍並訓練100,000倍的時間。
最初,Brown也被這個結果嚇到了,也寫了多篇論文來驗證其真實性。他發現「系統二思維」( System 2 thinking)才是讓AI模型效能大幅提升的關鍵所在。而OpenAI最新發布的o1模型同樣引入了這個技術概念,並且獲得了非常出色的性能提升。
Brown在演講中表示,過去5年AI能獲得巨大提升可以用一個字來概括——規模。但如今的前沿AI模型仍基於2017年推出的Transformer架構,主要差異在於資料規模與運算能力。
現在是時候進行訓練、推理範式轉變了,AI模型需要超越單純的資料預處理,進入「系統二思維」模式,以一種更慢、更審慎的擬人化推理形式來解決超複雜的難題。
系統二思維介紹
「系統二思維」是一個心理學概念,描述了人類在處理複雜問題時所採用的深度思考方式。這個概念最初由心理學家Daniel Kahneman在他的著作《思考,快與慢》中提出,用來解釋人類大腦的兩種不同的思考模式。
在Kahneman的理論中,系統一思維是快速、直覺、自動的,它處理日常的、熟悉的任務,例如辨識熟悉的臉孔或理解簡單的句子。
這種思考方式不需要我們有意識地思考,它依賴我們的直覺和經驗,但有時也可能導致錯誤,因為它不涉及深入的邏輯推理。
而係統二思維則是緩慢、邏輯、努力的,它涉及深思熟慮、計算和推理。當我們面對複雜的、新穎的或需要深入分析的問題時,就會啟動系統二思維。這種思考方式需要我們集中註意力,消耗更多的認知資源,但它可以幫助我們做出更準確和深思熟慮的決策。
Brown直接将这个概念应用到AI领域,提出了一个革命性的想法:通过模拟人类的系统二思维,AI模型可以在不增加大量数据或计算资源的情况下显著提升性能。
以他開發的戰勝人類的德撲AI Libratus為例,僅讓AI在每手牌中思考20秒,就能獲得與將模型擴大100,000倍相同的性能提升。這種方法的核心在於讓AI模型在做出決策前進行更深入的分析和推理,而不是只依賴大規模資料和計算。
而OpenAI最新發表的o1模型同樣引進了系統二思維,能夠進行深度推理,模仿人類逐步解決問題的過程,透過自我對弈等強化學習訓練方式提升推理能力。
例如,在國際數學奧林匹克資格考試中,o1 模型憑藉系統二思維準確推理複雜數學公式取得83%的準確率,遠高於GPT – 4o的13%。這對於金融、醫療、科學研究、編碼等對資料要求嚴謹的行業來說非常重要。
所以,系統二思維對於增強大模型的能力有許多好處,使其能夠更好地適應新的、未見過的任務和環境。在面對錯誤、不確定性和異常情況時,系統二思維還可以幫助大模型變得更加穩健,因為它鼓勵模型採取更謹慎和保守的策略。而在人機互動方面,模擬系統二思維能幫助大模型可以更好地理解和預測人類使用者的需求和意圖,進而改善互動體驗。