GPT-4.5發布：比GPT-4提升10倍但＂並非前沿模型＂

2025-02-28 Comments 0 Comment

美國時間週四，OpenAI宣布推出GPT-4.5，這是其最新、最強大的大語言模型（LLM）的研究預覽版，專為聊天應用設計。不過，這也是OpenAI迄今最昂貴的模型。

不過，GPT-4.5仍是一款傳統的大型語言模型，而非「推理模型」。先前，OpenAI、DeepSeek、Anthropic等公司都推出了推理模型，這些模型能夠產生「思維鏈」或類似意識流的文本，透過反思自身的假設和結論，嘗試在向用戶提供回應或輸出之前捕捉錯誤。

儘管如此，OpenAI聯合創始人兼首席執行官山姆·奧特曼（Sam Altman）在社交平台上表示，GPT-4.5是“第一個讓我感覺像是在與一個有思想的人交談的模型。我曾多次靠在椅背上，驚訝於AI能給出真正有用的建議。”

奧特曼也提醒道，由於GPU供應緊張，OpenAI不得不限制對GPT-4.5的存取。他指出：「壞消息是：這是一個龐大且昂貴的模型。我們本來打算同時向Plus和Pro用戶推出，但用戶量大幅增長導致GPU資源不足。我們計劃下週增加數萬顆GPU，並隨後向Plus訂閱用戶開放。（很快還會有數十萬顆GPU到位，我相信我們會充分利用我們部署的每一顆GPU。

從美國時間週四開始，GPT-4.5將向OpenAI的最昂貴訂閱服務ChatGPT Pro（每月200美元）的用戶開放，並向所有付費API層級的開發者提供存取權。 OpenAI還計劃在下週將其擴展至價格相對較低的Plus和Team層級（每月20/30美元）。

GPT-4.5支援搜尋功能和畫布模式，用戶還可以上傳檔案和圖像，但目前還不支援其他多模態功能，如語音模式、視訊和螢幕共享——至少暫時不支援。

透過無監督學習推動AI進步

GPT-4.5代表了人工智慧訓練領域的顯著進步，尤其是在無監督學習方面，這大大提升了模型識別模式、建立聯繫以及產生創造性見解的能力。

OpenAI的研究人員提到，GPT-4.5透過基於較小人工智慧模型產生的資料進行訓練，這有助於提升其「世界模型」。他們還表示，該模型同時利用多個資料中心進行預訓練，這意味著它採用了一種類似競爭對手Nous Research的去中心化方法。

這種訓練方式顯然幫助GPT-4.5學會了產生更自然、更直觀的交互，同時更準確地遵循使用者意圖，並展現出更高的情緒智商。該模型在OpenAI先前關於人工智慧擴展的工作基礎上取得了突破，進一步驗證了「增加數據和運算能力有助於提升人工智慧效能」的理念。

與前代模型及其他同類產品相比，GPT-4.5預計能夠顯著減少幻覺現象（幻覺率為37.1%，相較之下GPT-4為61.8%），使其在處理廣泛話題時更加可靠。

GPT-4.5的突出特點

根據OpenAI的說法，GPT-4.5旨在創造親切自然、直觀流暢的對話。它對語義細微差異和上下文有更強的把握能力，能夠實現更像人類之間的互動，並更有效地與使用者合作。

GPT-4.5透過擴展的知識庫和敏銳的細微線索解讀能力，在多個領域展現出色表現，包括：

——寫作輔助：優化內容、提升清晰度、激發創意

——程式支援：調試、提出程式碼改進建議、自動化工作流程

——問題解決：提供詳細解釋，並協助實際決策

此外，GPT-4.5也採用了新的對齊技術，增強了其對人類偏好和意圖的理解能力，進一步提升了使用者體驗。

如何存取GPT-4.5？

從美國當地時間週四開始，ChatGPT Pro用戶可以在網頁、行動和桌面的模型選擇選單中選擇GPT-4.5。 OpenAI計劃在下週將模型擴展到Plus和Team用戶。

對於開發者，GPT-4.5將透過OpenAI的API提供，包括Chat Completions API、Assistants API和Batch API。它支援函數呼叫、結構化輸出、串流、系統訊息和影像輸入等關鍵功能，使其成為多種人工智慧驅動應用的通用工具。不過，GPT-4.5目前尚不支援語音模式、視訊或螢幕分享等多模態功能。

定價及對企業決策者的影響

企業和團隊領導者可以充分利用GPT-4.5帶來的各種功能。憑藉較低的幻覺率、增強的可靠性和自然流暢的對話能力，GPT-4.5能夠支援廣泛的業務功能：

——改善客戶互動：企業可以將GPT-4.5整合到支援系統中，以實現更快、更自然的互動，同時減少錯誤

——增強內容生成：行銷與傳播團隊可以有效率地製作高品質、符合品牌的內容

——精簡營運：人工智慧驅動的自動化可以幫助調試、優化工作流程並支援策略決策

——可擴展性和客製化：API允許企業進行量身定制，建立符合其特定需求的人工智慧解決方案

然而，對於希望透過GPT-4.5建立應用的第三方開發者來說，GPT-4.5的API定價高得驚人，每百萬輸入/輸出token的價格為75美元/180美元，而GPT-4o的定價僅為2.50美元/10美元。

隨著其他競爭對手模型的發布——如Anthropic的Claude 3.7、Google的Gemini 2 Pro，以及OpenAI自家的推理“o”系列（o1、o3-mini High、o3）——GPT-4.5的性能提升是否足以抵消其高昂成本，特別是在通過API使用時，將成為一個值得關注的問題。

AI研究人員與資深用戶的早期反應兩極化

GPT-4.5的發佈在社交平台上引發了人工智慧研究人員和技術愛好者的廣泛討論，尤其是在該模型的「系統卡」（即概述其訓練和評估的技術文件）提前洩露後，文件中包含了一系列官方公告前的基準測試結果。

OpenAI在洩漏後發布的最終版系統卡與洩漏版本存在顯著差異，刪除了洩漏版中「GPT-4.5並非前沿模型，但它是OpenAI最大的LLM，比GPT-4的計算效率提高了10倍以上」的表述。 OpenAI的發言人表示，這項說法並不準確。

人工智慧模型供應商Nous Research的共同創辦人Teknium（化名）對OpenAI的新模型表示失望，指出在多語言理解（MMLU）和實際編碼基準測試中，GPT-4.5相比其他領先的大語言模型（LLM）的改進微乎其微。 Teknium質疑：“距離GPT-4發布已經過去2年多，OpenAI投入的資金投入規模擴大上千倍……究竟發生了什麼？”

此外，有人認為，GPT-4.5在軟體工程基準測試中表現遜於o3-mini，這讓人質疑此次發布是否代表了真正的技術進步。

然而，也有部分用戶為GPT-4.5的潛力辯護，認為其價值不應僅依賴基準測試的結果。

軟體開發人員Haider（@slow_developer）強調，GPT-4.5相比GPT-4在運算效率上提升了10倍，且在綜合任務處理能力上優於OpenAI專注於STEM領域的o系列模型。

AI新聞發布者Andrew Curran（@AndrewCurran_）則從定性角度出發，預測GPT-4.5將在寫作和創造性思維領域樹立新標準，並稱其為OpenAI的「傑作」。

這些討論凸顯了人工智慧領域一個更廣泛的爭論：技術進步是否應單純地透過基準測試來衡量，還是應更著重於推理能力、創造力和擬人化互動等定性方面的改進？

仍處於研究預覽階段

OpenAI將GPT-4.5定位為研究預覽版，以深入了解其優點與限制。該公司表示，將繼續探索用戶與模型的互動方式，並挖掘非常規應用場景。

OpenAI表示：“我們發布GPT-4.5作為研究預覽版，以更好地了解其優勢與局限性。擴展無監督學習將繼續推動人工智慧的進步，提升準確性、流暢性和可靠性。”

隨著OpenAI不斷改進其模型，GPT-4.5為未來的人工智慧進步奠定了基礎，尤其是在推理和工具使用代理方面。儘管GPT-4.5已經展示了令人印象深刻的能力，OpenAI仍在積極評估其在生態系統中的長期作用。

憑藉更廣泛的知識庫、更高的情緒智商和更自然的對話能力，GPT-4.5將為各領域的使用者帶來顯著改進。 OpenAI期待看到開發者、企業和團隊如何將該模型整合到他們的工作流程和應用中。

隨著人工智慧技術的不斷進步，GPT-4.5標誌著OpenAI在追求更強大、更可靠、更符合使用者需求的語言模式道路上邁出了重要的一步，為企業領域的創新帶來了新的機會。（小小）

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28

WONGCW 網誌

記錄生活經驗與點滴

GPT-4.5發布：比GPT-4提升10倍但＂並非前沿模型＂

2025-02-28 Comments 0 Comment

相關

發表迴響取消回覆

分享此文：

相關

發表迴響取消回覆