OpenAI發布GPT-4o mini 奧特曼稱兩年時間模型成本下降了99%

2024-07-19 Comments 0 Comment

相較於2022年的text-davinci-003型號，GPT-4o mini的成本下降了99%。雖然OpenAI遲遲未發布下一代模型GPT-5，但在現有能力基礎上，仍在更新模型，繼續推動大模型成本下降。

當地時間7月18日，OpenAI發布了新款輕量級的大模型GPT-4o mini。據介紹，GPT-4o mini即日起將在問答機器人ChatGPT中取代GPT-3.5 Turbo，企業用戶則能從下週起造訪GPT-4o mini。

「我們預計GPT-4o mini將擴大人工智慧的應用，讓人工智慧變得更實惠。」OpenAI官網文章稱，GPT-4o mini的輸入價格為15美分（0.15美元）/百萬tokens（詞元），輸出價格為60美分（0.6美元）/百萬tokens（約等於一本2500頁的書），比GPT-3.5 Turbo便宜60%。

從模型能力來看，OpenAI稱，GPT-4o mini在行業基準測試MMLU（評估大規模多任務語言理解）中獲得82%的分數，低於GPT-4o的88.7%，高於77.9%的Genmini Flash、 73.8%的Claude 3 Haiku和69.8%的GPT-3.5 Turbo。 GPT-4o mini在MGSM測驗（評估數學推理）和MMMU測驗（評估多模態推理）中，分別得分87%和59.4%，均超過Gemini Flash和Claude 3 Haiku，但低於GPT-4o。

此外，GPT-4o mini上下文視窗為128K tokens，支援輸出16K tokens，知識更新至2023年10月。 OpenAI介紹，GPT-4o mini也改進了處理非英語文本時的成本效益。 GPT-4o mini能以較低成本和延遲執行廣泛任務，如連結或並行多個模型呼叫（呼叫API介面）、將大量情境輸入給模型、透過快速的即時文字回應與人互動。

目前，GPT-4o mini可以生成文字和圖像，未來將支援視訊和音訊。 OpenAI計劃也在未來幾天推出GPT-4o的微調。

目前來看，GPT-4o mini的主要作用可能是取代GPT-3.5 Turbo，並透過降低價格吸引用戶。

OpenAI稱，公司也將在提高模型效能的同時繼續降低成本。相較於2022年的text-davinci-003型號，GPT-4o mini的成本下降了99%。

「2022年全世界最先進的模型還是text-davinci-003，這個模型比現在的新模型差了很多，卻貴了100倍。」OpenAI CEO薩姆·奧爾特曼（Sam Altman）在社交平台上表示。

其他大模型廠商今年也在推動模型輕量化，追求「小而美」。先前有大模型業內人士告訴記者，參數較小的大模型今年來展現了頗高的潛力，透過加大數據量而不是加大參數量的方式訓練，模型性能還有很大提升空間，好處則在於輕量大模型的使用成本低，可以擴大使用。

谷歌今年5月也發表了輕量級模式Gemini 1.5 Flash。 Anthropic 3月發布的Claude 3系列中，則包括輕量級的Claude 3 Haiku，在多項基準測試中Claude 3 Haiku的得分高於GPT-3.5、低於GPT-4。微軟今年也正在推動部署輕量級AI模式系列Phi。微軟此前稱，今年4月推出的Phi-3系列是市面上性能最強、最具性價比的“小語言模型”，最小版本的Phi-3-mini性能可超過參數規模高出一倍多的模型，成本可能只有類似功能的模型的十分之一。

從價格來看，Gemini 1.5 Flash每百萬tokens起始價格為0.35美元，輸出為1.05美元，Claude3 Haiku每百萬tokens價格0.25美元，輸出為1.25美元。 GPT-4o mini的價格相對較便宜。

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

WONGCW 網誌

記錄生活經驗與點滴

OpenAI發布GPT-4o mini 奧特曼稱兩年時間模型成本下降了99%

2024-07-19 Comments 0 Comment

相關

發表迴響取消回覆

分享此文：

相關

發表迴響取消回覆