傳專注於推理的OpenAI“草莓”模型兩週內發布有望成為AI下一重大突破
據知名科技商業類媒體The Information援引多位測試過該模型的人士透露,站在時代風口浪尖的“AI寵兒”OpenAI計劃在未來兩週內發布名為“草莓”的最新人工智慧產品,作為ChatGPT所提供服務的一部分。這比兩週前傳聞的「秋季發布」(9月至11月)更早。
上述報導稱,專注於推理能力的人工智慧「草莓」發布前後還有一些亟待解決的問題,但看似「倉促上馬」似乎說明OpenAI感受到了大語言模型驅動產品領域的激烈競爭壓力,希望透過近幾個月被市場期待已久的草莓項目,來恢復ChatGPT首發以來兩年大部分時間的勢頭。
何為「草莓」模型?專注於推理能力,是人工智慧下一個重大突破
兩週前曾有消息稱,OpenAI加速推出「草莓」推理人工智慧模型,以推動聊天機器人業務。四周前的消息稱,著名AI搜尋公司perplexity CEO暗示已經提前用上了OpenAI的最新模型「草莓」。
華爾街見聞曾提到,早在5月就有傳聞指出OpenAI正在神秘開發代號為「草莓」的計畫。兩個月前的7月13日,又有消息確認「草莓」是OpenAI正在開發新的人工智慧模型,希望提供更高級推理能力以形成邁向通用人工智慧(AGI)的重大突破。
具體來說,「草莓」模型憑藉著增強的推理能力,能夠更好地處理令以往AI模型「撓頭」的複雜科學和數學問題,不僅能讓大語言模型(LLM)根據用戶的複雜查詢生成答案,甚至還能提前規劃,以便自主、可靠地瀏覽互聯網,進行OpenAI 定義的「深度研究」(deep research)。
評論普遍認為,OpenAI的「草莓計畫」有望成為人工智慧下一個重大突破。更先進的推理能力意味著該技術可以「自主」執行更複雜任務,而不僅僅是依靠使用者的逐步提示行事。推理一直是AI在類人智能追求中最棘手的問題之一,而具有推理能力的人工智慧模型不僅能改善數學和程式設計能力,還可以徹底改變科學研究,增強醫療保健和金融等複雜領域的決策力,並加速技術創新。
會顯著更貴嗎? 「草莓」模型具體的提供形式和定價模式尚不確定
據悉,「草莓」發布後雖然整體作為ChatGPT的一部分,但也是一項獨立產品,可能會納入客戶選擇以支持ChatGPT運行的AI模型下拉菜單中,但具體的提供形式和定價模式都尚不確定。
與常規的對話式人工智慧不同,「草莓」在回應使用者的提示語之前會「思考」10到20秒,而不是立即給出答案。對於複雜或包含多個執行步驟要求的查詢語,「草莓」將比現有的GPT-4o版本更易於使用,不需要用戶明確告知ChatGPT「完成中間推理步驟以得出最終答案」等額外舉動。
有分析稱,這意味著「草莓」將成為更聰明的助手,不僅在解決數學問題和編碼方面表現更佳,在更「主觀」的商業任務方面也更優秀,比如集思廣益制定產品營銷策略等。而且在這類偏創意的任務中,模型將提供更針對使用者公司需求、更詳細的建議,例如產生每週執行計畫。
不過,假設發布一切順利,在初始版本「草莓」只能接收和產生文字訊息,而不能接收和產生圖像,這代表不像其他OpenAI模型那樣具備「多模態」功能,算是「缺點」之一。
同時,儘管「思考」階段有助於避免AI犯錯、且能預測如何全面回答用戶問題,但有測試過該模型的人士稱,一些簡單問題也會令草莓「思考」而無法迅速給出答案;答案品質僅略佳,不值得額外等待;而且有時無法在回答新問題之前記住並整合與用戶的先前聊天記錄。
在定價方面,上週曾有消息稱,ChatGPT Plus目前付費價格是每月20美元,但OpenAI考慮將「草莓」和被外界譽為「ChatGPT 5」的「獵戶座」(Orion)等全新大模型擬定在月付2000美元,等於定價提升100倍。分析認為,OpenAI能考慮如此高的價格跨度,主要是因為缺錢、新產品夠強以及手握數億用戶。
「草莓」模型為何重要?或重新定義AI能力邊界,為GPT 5提供高品質合成訓練數據
OpenAI執行長奧特曼(Sam Altman)曾在今年稍早表示,人工智慧領域「最重要的進步方向將是推理能力」。
而「草莓」計畫被認為是去年披露的OpenAI「Q*」計劃,該計畫在公司內部已被視為一項突破。觀看過簡報的人稱能夠回答目前商用AI模型無法解決的棘手科學和數學問題。
奧特曼8月初發文被外界認為給「草莓」計畫預熱
OpenAI曾在8月11日給出了未來AI發展的五個階段路線圖,第一階段便是現在具有對話語言的AI聊天機器人,第二階段是具有人類水平問題解決能力的“推理者”,第三階段是可以採取自主行動的「代理人」(AI agent),接著是可協助發明的「創新者」和可完成組織工作的「組織者」。
而「草莓」極可能是幫助OpenAI實現第二級AI的關鍵,一旦成功將重新定義AI的能力邊界,自主執行複雜任務、獨立解決複雜問題並驗證輸出內容,代表人類離通用人工智能AGI又進一步。專注於推理的「草莓」可能也是為下一代AI模型「獵戶座」或說ChatGPT 5奠基的必經之路。
軟體開發機構Technology Rivers創辦人兼CEO Ghazenfer Mansoor指出,借助「草莓」項目,OpenAI對人類推理水平的追求不僅是技術奇蹟,更能突破界限、激發每個領域新的可能性。例如在商業領域,人工智慧將能大幅改變供應鏈的管理方式,非常準確地預測市場趨勢,並在很大程度上使客戶體驗非常個人化。
而在一般使用者的層面,其使用體驗也會有所改進,例如具有推理能力的AI模型不僅能提供更優化的旅遊計畫和健康建議,甚至可以分析使用者的消費習慣並創建完全客製化的預算方案,做更智能的助理。
總而言之,在理想化的情況下,“草莓”將能夠解決超出當前人工智慧模型能力範圍的問題和任務,並進行“深入研究”,“比任何現有的聊天機器人都更勝一籌”。
還有分析指出,「草莓」計畫旨在籌集更多資金,OpenAI需要這筆錢來支持代號為「獵戶座」的下一代前沿模型開發。而且,為「獵戶座」模型產生高品質的合成訓練資料被認為是「草莓」的關鍵應用之一,「這一點意義重大,因為網路上的大部分訓練資料都已被使用殆盡」:
人工智慧模型所依賴的大型資料集可能容易出現偏差和錯誤,或包含不完整或不準確的資訊。草莓計畫產生的高品質合成數據可以填補現實世界數據集的空白,並提供更全面、更包容、更平衡的訓練集。許多人認為,使用合成資料可以幫助未來的人工智慧模型更加中立和公平,並減少噪音、幻覺和不相關的訊息,從而提高訓練的效率和模型的準確性。根據已知的信息,草莓計劃改進了推理、邏輯以及規劃和進行研究的能力,可以讓模型自主進行實驗、分析數據並提出新的假設。這可能會帶來科學突破,包括發現新藥。這些模型還可以提供個人化教育,創建教育內容和互動課程。
知情人士透露,「草莓」計畫包括一種專門的「後訓練」方法,即生成式AI模型已經過大量資料集上進行預訓練後,進一步調整模型以提高其在特定任務上的表現。這類似於史丹佛大學在2022年發展的「自學推理者」(Self-Taught Reasoner,簡稱STaR)方法。
STaR創造者之一、史丹佛大學教授Noah Goodman曾表示,STaR可以讓AI模型透過迭代創建自有訓練數據,「引導」自己進入更高的智能水平,理論上可用來讓語言模型實現超越人類的智能。但他也承認,“這既令人興奮又令人恐懼,人類(應就自身處境)需要認真思考一些問題了。”