OpenAI大重啟:新模型想讓你相信ChatGPT像人思考
經過數週的猜測與期待,OpenAI終於推出了其首個「推理模型」o1。這款產品被認為是該公司迄今最強大的人工智慧產品之一,其解決問題的能力表現出前所未有的類人思維特質。至少,這是該公司對外的宣傳。
不過,和OpenAI以往的研究和產品發表一樣,o1目前仍有一些「吊胃口」。 OpenAI聲稱,這個模型在處理複雜任務時表現得更加出色,但卻幾乎未透露模型訓練的細節。目前,o1僅向付費ChatGPT用戶和特定程式設計師提供有限預覽。
OpenAI信心滿滿地表示,o1在物理、化學和生物等領域已經展現出類似博士生的思考深度。這項進展被認為如此重要,以至於OpenAI決定從現有的GPT-4重新開始,將模型的編號重置為“1”,甚至考慮捨棄已被廣泛認可的“GPT”品牌。這一品牌不僅定義了其聊天機器人,也標誌著整個生成式人工智慧領域的起飛。
OpenAI今天發布的研究報告和部落格文章,展示了許多o1在應對複雜推理任務上的驚人能力。這些任務涵蓋高等數學、程式設計難題、密碼解密,甚至包括來自遺傳學、經濟學和量子物理學領域的專業問題。大量圖表顯示,o1在公司內部評估中,已顯著超越了其頂尖的語言模型GPT-4o,在程式設計、數學及科學領域表現尤為突出。
這些進步的關鍵源自於對兒童教育的深刻洞察——「三思而後行」。 OpenAI稱,OpenAI o1在作答前會花更多時間進行“深思熟慮”,類似於人類的思考過程。公司將這個過程稱為“思維鏈”,這是一個AI研究中的術語,指將問題分解為多個中間步驟的解決策略。這個「思維鏈」機制使模型能夠逐步解決小任務、自我修正並優化解決方案。當使用者向o1提出問題時,模型會顯示“思考中”,隨後展示其推理過程中的一些步驟,例如“追溯歷史演變”或“整合證據片段”。最終,它會標註思考的時長,例如“思考9秒”,然後給出答案。
儘管o1在產生答案時的完整「思維鏈」對使用者不可見,以簡化使用者體驗,但這也犧牲了部分透明度,使得使用者難以了解模型如何得出最終的結論。這同時也是為了保護模型的核心技術不被競爭對手掌握。關於o1的建構細節,OpenAI透露甚少,僅表示其訓練是基於「全新的最佳化演算法和訓練資料集」。
儘管OpenAI的營銷力度空前,但o1是否會為ChatGPT帶來革命性體驗,或僅是對現有模型的漸進式改進,仍不確定。不過,從公司展示的研究成果和我的初步測試來看,o1的產出結果確實更為全面且富有邏輯。這反映了OpenAI對規模經濟的信心:更大的AI模型、更多的數據以及更強大的運算能力,將推動AI效能的飛躍。訓練時間越長,o1的表現越出色。
然而,長時間的思考也伴隨著更高的成本。 OpenAI允許程式設計師支付使用其技術,而o1的每個字輸出費用大約是GPT-4o的四倍。生成式AI所需的高性能晶片、電力及冷卻系統都極為昂貴。為了滿足這些龐大的運算需求,科技公司、能源企業和其他產業預計將投入數兆美元。這引發了人們的擔憂:AI是否會像加密貨幣或網路泡沫時代一樣,成為新的泡沫。由於o1響應問題所需的時間更長,其消耗的資源也隨之增加,這進一步加劇了AI技術何時能獲利的不確定性。
這延長的處理時間,最顯著的影響或許不是技術或財務上的負擔,而是品牌的重塑。相較於過去AI模型中那些晦澀的術語如“轉換器”和“擴散”,OpenAI的“推理模型”以及“思維鏈”聽起來更貼近日常語言,帶有一種“人類化”的色彩。
這種語言策略並非OpenAI獨有。新創公司Anthropic將其主打模型Claude形容為擁有“性格”和“頭腦”,谷歌大肆宣傳其AI的“推理”能力,AI搜尋新創公司Perplexity則宣稱其產品“理解你”。 OpenAI的部落格直接指出,o1“像人類一樣思考”,“如同真正的軟體工程師一般工作”,並且“具備類似人類的推理能力”。儘管研究負責人強調,OpenAI並不認為其產品等同於人類大腦,但他也承認,o1在某些方面確實比之前的模型顯得更「人性化」。
對於一個產品定位尚不清楚的產業來說,「人性化」的表達方式無疑是一種強大的行銷手段。智能的定義本來就模糊不清,而語言模型的實際價值也難以確切評估。 「GPT」這個名稱看似簡單,卻難以傳達任何實際意義。儘管OpenAI的首席研究官鮑勃·麥克格羅(Bob McGrew)認為,OpenAI o1是邁向「更合理命名」的第一步,旨在更清晰地表達其產品,但這些字母和數字組合的微妙差異對一般人來說往往無關緊要。
然而,推銷一種能夠「像你一樣思考」的工具,與科學實驗室的術語完全不同,它更像是文學中的概念。這樣的描述固然不比其他AI術語更精確,甚至可能更模糊,但也因此賦予了其獨特的魅力。一個聲稱「像人類思考」的AI模型,為人們留下了想像的空間,讓每個使用者都能填補其中的空白,構思出一台「像我一樣運作」的機器。或許,銷售生成式AI的關鍵就在於此——讓客戶自己去構築、填補這其中的「魔法」。