OpenAI發布GPT-4o mini 奧特曼稱兩年時間模型成本下降了99%
相較於2022年的text-davinci-003型號,GPT-4o mini的成本下降了99%。雖然OpenAI遲遲未發布下一代模型GPT-5,但在現有能力基礎上,仍在更新模型,繼續推動大模型成本下降。
當地時間7月18日,OpenAI發布了新款輕量級的大模型GPT-4o mini。據介紹,GPT-4o mini即日起將在問答機器人ChatGPT中取代GPT-3.5 Turbo,企業用戶則能從下週起造訪GPT-4o mini。
「我們預計GPT-4o mini將擴大人工智慧的應用,讓人工智慧變得更實惠。」OpenAI官網文章稱,GPT-4o mini的輸入價格為15美分(0.15美元)/百萬tokens(詞元),輸出價格為60美分(0.6美元)/百萬tokens(約等於一本2500頁的書),比GPT-3.5 Turbo便宜60%。
從模型能力來看,OpenAI稱,GPT-4o mini在行業基準測試MMLU(評估大規模多任務語言理解)中獲得82%的分數,低於GPT-4o的88.7%,高於77.9%的Genmini Flash、 73.8%的Claude 3 Haiku和69.8%的GPT-3.5 Turbo。 GPT-4o mini在MGSM測驗(評估數學推理)和MMMU測驗(評估多模態推理)中,分別得分87%和59.4%,均超過Gemini Flash和Claude 3 Haiku,但低於GPT-4o。
此外,GPT-4o mini上下文視窗為128K tokens,支援輸出16K tokens,知識更新至2023年10月。 OpenAI介紹,GPT-4o mini也改進了處理非英語文本時的成本效益。 GPT-4o mini能以較低成本和延遲執行廣泛任務,如連結或並行多個模型呼叫(呼叫API介面)、將大量情境輸入給模型、透過快速的即時文字回應與人互動。
目前,GPT-4o mini可以生成文字和圖像,未來將支援視訊和音訊。 OpenAI計劃也在未來幾天推出GPT-4o的微調。
目前來看,GPT-4o mini的主要作用可能是取代GPT-3.5 Turbo,並透過降低價格吸引用戶。
OpenAI稱,公司也將在提高模型效能的同時繼續降低成本。相較於2022年的text-davinci-003型號,GPT-4o mini的成本下降了99%。
「2022年全世界最先進的模型還是text-davinci-003,這個模型比現在的新模型差了很多,卻貴了100倍。」OpenAI CEO薩姆·奧爾特曼(Sam Altman)在社交平台上表示。
其他大模型廠商今年也在推動模型輕量化,追求「小而美」。先前有大模型業內人士告訴記者,參數較小的大模型今年來展現了頗高的潛力,透過加大數據量而不是加大參數量的方式訓練,模型性能還有很大提升空間,好處則在於輕量大模型的使用成本低,可以擴大使用。
谷歌今年5月也發表了輕量級模式Gemini 1.5 Flash。 Anthropic 3月發布的Claude 3系列中,則包括輕量級的Claude 3 Haiku,在多項基準測試中Claude 3 Haiku的得分高於GPT-3.5、低於GPT-4。微軟今年也正在推動部署輕量級AI模式系列Phi。微軟此前稱,今年4月推出的Phi-3系列是市面上性能最強、最具性價比的“小語言模型”,最小版本的Phi-3-mini性能可超過參數規模高出一倍多的模型,成本可能只有類似功能的模型的十分之一。
從價格來看,Gemini 1.5 Flash每百萬tokens起始價格為0.35美元,輸出為1.05美元,Claude3 Haiku每百萬tokens價格0.25美元,輸出為1.25美元。 GPT-4o mini的價格相對較便宜。