傅盛:OpenAI o3已有能力擊敗99.9%的程式設計師
經歷了拖拖拉拉的12天技術分享直播活動,OPenAI終於在最後一天放出了大招。當地時間上週五,OpenAI發布了下一代的推理模型o3,這是今年稍早發布的o1推理模型的升級版本。 ps.那為什麼不叫o2呢,該公司發言人表示,「是出於對同名英國電信營運商o2的尊重」。
更準確地說,o3是一個模型系列——就像o1一樣,同時有o3和o3-mini兩個版本,後者是一款更小的精簡版模型,針對特定任務進行了微調。
OpenAI聲稱,至少在某些條件下,o3模型可以接近實現AGI。
所謂AGI,即「通用人工智慧」(artificial general intelligence)的縮寫,泛指能完成人類所能完成的任何任務的人工智慧。 OpenAI對此有著自己的定義:「在最具經濟價值的工作上勝過人類的高度自主系統」。
那o3有多強大呢?根據OpenAI的說法,o3模型在ARC-AGI圖形邏輯推理基準上獲得了破紀錄的分數,低計算場景中,o3得分為75.7%,而在高計算測試中,它達到了87.5%——超過了標誌著達到人類水準的門檻85%。
作為對比,o1模型的得分僅在25%到32%之間。 o3的表現幾乎是o1三倍。
最值得關注的是,在全球著名的編碼競賽平台odeforces評分中,o3取得了2727的評分,而o1評分僅為1891。
獵豹移動&獵戶星空董事長傅盛表示,伴隨著OpenAI o3的發布,人人都是程式設計師的時代馬上就要帶來了,你再也不要因為不會Python、不會C++就不敢寫程式,只要說出你的需求,大預言模型幫你寫程式。
“看完o3的發布,我的一個感慨就是程式設計師可能不存在了”,傅盛認為,這次o3的發布,標誌著大語言模型的程式設計能力超越了99.9%的程式設計師。
在Codeforces世界級程式設計比賽中,OpenAI o3取得了175名的頂尖成績,要知道這是17萬程式設計師裡的排名。 o1大概也只戰勝90%多的程式設計師,之前GPT-4o只戰勝11%的程式設計師。
據悉,OpenAI o3明年1月底就會正式發表。傅盛稱,可以負責任的說,人類程式設計師這次真的危險了,說不存在了可能稍微有點誇張,程式設計師會存在,但更多的是比拼對使用者需求的理解、大邏輯的構建,而真正把它變成程式碼的工作應該是大幅度的讓AI去完成。