OpenAI正打造「最強」開源模型最早夏初發布
今年3月下旬,OpenAI宣布將在年內推出自GPT-2以來的首個”開源”語言模型。隨著該公司與AI開發者社群的交流持續推進,關於這款模型的更多細節也逐漸浮出水面。據知情人士透露,OpenAI研究副總裁艾丹·克拉克(Aidan Clark)正主導這項開發工作,目前仍處於初期階段。

OpenAI計劃在今年初夏發布該模型,目標是打造一個在開源推理模型中達到頂尖水平的產品。這款模型定位為推理能力模型,類似OpenAI現有的o系列產品。
知情人士稱,OpenAI正考慮為該模型採用一種高度寬鬆的開源許可協議,幾乎不設使用或商業限制。這與Meta的Llama、Google的Gemma等開源模型形成對比,後者因使用條款過於繁瑣而受到批評。 OpenAI顯然希望避免步上後塵。
目前,OpenAI面臨來自包括中國AI實驗室DeepSeek在內的開源策略競爭者的挑戰。這些”開源”競爭者將模型提供給AI社區用於實驗,在某些情況下還允許商業化使用,與OpenAI此前更為封閉的做法形成鮮明對照。
這種開放策略已被證明對部分企業極為成功。 Meta在3月初宣布,Llama系列車型的累積下載量已突破10億次。而DeepSeek也迅速累積了大量用戶,並獲得本土投資者的關注。
據悉,OpenAI此次推出的開源模型將支援純文字輸入輸出,可在高階消費級硬體上運作。開發者也可能可以選擇是否啟用「推理模式」——推理功能雖能提升準確性,但會以增加延遲為代價,這與Anthropic等公司近期發布的推理模型相似。
如果此次發布反應積極,OpenAI還計劃後續推出更多開源模型,可能包括更小規模的模型版本。
OpenAI首席執行官山姆·奧特曼(Sam Altman)此前曾公開表示,公司在技術開源方面“站在了歷史的錯誤面”,並呼籲重新審視開源戰略。
奧特曼在今年1月參加問答活動時指出:「我個人認為,我們需要製定一種新的開源策略。儘管並非所有OpenAI員工都認同這一觀點,目前這也不是我們的首要任務,但今後我們會推出更好的模型,不過領先優勢可能不像以往那樣顯著。」
他還表示,這款即將發布的模型將經歷嚴格的「紅隊測試」和安全評估流程。知情人士透露,OpenAI將為該模型發布「模型卡片」(Model Card),即一份全面的技術文檔,詳盡展示模型在內部與外部基準測試、安全性評估等方面的結果。
奧特曼上月發文稱:“我們會在發布前,依據’模型準備度框架’對其進行全面評估,並在已知該模型發布後可能被修改的前提下,做更多的安全準備工作。”
儘管如此,OpenAI近年來也因對部分新模型倉促推進安全測試、未及時發布模型卡等議題,受到人工智慧倫理學者的批評。奧特曼本人也曾在2023年11月被短暫罷免前,在模型安全審查上誤導高階主管。