Google發布Gemini 2.5 Flash預覽版首個完全混合推理模型
在上週的Cloud Next 大會上,Google宣布Gemini 2.5 Flash 模型即將推出,並帶來重大改進。今天,Google宣布透過Google AI Studio 和Vertex AI 在Gemini API 中推出Gemini 2.5 Flash 預覽版。 Gemini 使用者也可以透過模型選擇器使用此新模型,並可與Canvas 搭配使用,輕鬆最佳化文件和程式碼。

繼上一代Gemini 2.0 Flash 之後,Gemini 2.5 Flash 在推理能力方面進行了顯著提升,且成本和延遲均有所降低。 Google聲稱這款新機型擁有卓越的性價比。具體價格如下:
每100 萬輸入詞元0.15 美元
每100 萬個輸出詞元收費0.60 美元(無需推理)
每100 萬個輸出詞元(含推理)收費3.50 美元
這是Flash 2.5 的早期版本,但相比Flash 2.0 版本,它已展現出巨大的效能提升。
如有需要,您可以完全關閉思考功能,並使用此模型作為Flash 2.0 的直接替代品。
它可在Gemini API、AI Studio、Vertex 和Gemini 應用程式中使用!
— Logan Kilpatrick (@OfficialLoganK)
Gemini 2.5 Flash 是Google 首款完全混合推理模型,讓開發者可以選擇開啟或關閉推理功能。據稱,這可以幫助開發者根據目標品質、成本和延遲來優化回應。請查看下方此新模型的基準測試。

如上表所示,儘管成本低廉,但與Anthropic 和Grok 的前沿模型相比,Gemini 2.5 Flash 似乎仍不失優勢。 OpenAI 最近發布的o4-mini似乎表現優於Gemini 2.5 Flash 預覽版,但價格卻高得多。