OpenAI內部模型曝光程式設計能力躋身全球Top50程式設計師年底不再有人類對手
除了o1/o3,OpenAI另一個尚未公開的內部推理模型曝光了。爆料者正是CEO奧特曼本人。據他透露,與全球頂尖程式設計師相比,目前這內部模型的程式設計能力已達Top50,甚至今年底將排名第一。

而且針對大家近來尤為關注的算力問題,他更是直言:
在內部,我們已經達到了GPT 4.5,而達到GPT 5.5並不需要100倍以上的運算能力。

除此之外,也是在東京大學的這場對話活動中,奧特曼由AI對教育的影響引出了更多話題,包括AI時代需要何種人才,以及一系列對內部模型進展的爆料。
這場對談由東京大學的校長(Teruo Fujii)和執行副校長(Kaori Hayashi,女)主持,OpenAI首席產品長Kevin Weil陪同奧特曼參加。
期間,他們暢談了AI的應用和未來,並和學生進行了面對面問答。
以下為重點內容整理&摘錄。
01 內部模型已達GPT 4.5,升級成5.5不再需要100倍算力升級
主持人簡短開場後,活動由學生提問開啟。
談到AI對教育的影響以及未來這一領域的發展,奧特曼直言教育是OpenAI最關注的幾個領域之一。
目前已經能看到ChatGPT如何提供學生各種輔助,未來類似AI工具只是改變了環境和部分人類習慣,對人類來說可能是一種解放,不用過於擔心AI會改變一切。
另外,由於科學發現可能呈現10~100倍增速,由AI推動的生產力進步可能極大促進社會發展。

接下來副校長也提了一個問題,AI時代需要怎樣的人才和技能?
對此奧特曼回應稱,顯然人類現在已經很難在數學、程式設計等具體任務中優於AI,因此圍繞著弄清楚人們需要什麼,去培養個人的開創性視野、快速適應能力等也就更加重要。
Kevin總結了一個更簡單的方法,從現在開始將AI用起來,將之融入工作生活。一旦遇到新問題,試著用AI解決,以逐漸跟上AI發展的腳步。

隨後,有學生提到了算力進化問題,如果擁有100倍運算能力,可以預期GPT具有哪些新特性?
奧特曼稱,GPT系列代表了曾經的一個範式,專注預訓練部分,GPT 1,2,3,4的每一次升級都大致意味著100倍算力升級,隨之也產生了更強的能力。
目前內部模型已達到GPT 4.5水平,照舊範式推測,達到GPT 5.5也需要100倍算力升級。然而,隨著o1系列推理模型取得新突破,一種令人難以置信的新運算效率誕生了。
這也意味著類似升級不再需要100倍算力,透過強化學習等技術我們也能得到更強的模型能力。

之後奧特曼梳理了OpenAI在推理模型上取得的一系列進展,按網友總結下來就是:
在程式能力上,o1排名為9800;僅過去幾個月,o3將排名拉到第175位;如今一個內部模型在基準測試中排名約為TOP50,而且年底就能直接登頂。

02 “我們希望朝著開源前進”
接下來,奧特曼談到了更多未來計畫。
o3的發布已經為未來6~12個月的研究點明了方向,OpenAI將盡可能推動小型、功能強大且速度極快的推理模型,同時也會繼續推進GPT 6/7等。
過程中,他著重cue到了OpenAI最近向Pro用戶推出的「深度研究」(Deep Research)功能,這是一個使用推理來綜合大量在線信息並為用戶完成多步驟研究任務的智能體,能幫助用戶進行深入、複雜的信息查詢與分析。
在他看來,OpenAI一大重點也是發布更多這類智能體,而夢想之一就是搞一個程式智能體。
總之,今年的主線任務是,到年底能夠有一個模型,即便用戶問出非常困難的問題,它也能在運行並思考幾小時後準確作答。

然後看點來了,基於中國DeepSeek選擇開源後廣受好評這一事實,有學生當面提問:
是否有計劃重新考慮開源?
奧特曼這次倒是很乾脆,直接承認“我們將這樣做”,“我們希望朝著開源前進”。

但是(沒錯有一個但是),目前不知道開源什麼,也不知道該選擇什麼時候開源。

在這之後,奧特曼又回答了對腦機介面、太空工程和AI機器人等前沿科技的看法。
雖然眾所周知他和馬斯克不對付,但他這次竟然直言:
(像Neuralink這樣的)腦機介面公司是自己過去6個月見過的最有趣的
