Google發布改進型Gemini 1.5 系列AI模型並將API價格降低50%
Google今天發表了兩款可投入生產環境的更新版Gemini 1.5 型號:Gemini-1.5-Pro-002 和Gemini-1.5-Flash-002。與五月發布的原版Gemini 1.5 型號相比,這兩款新產品略有改進。
更新後的Gemini 1.5 系列模型在MMLU-Pro 基準成績提高了約7%,在MATH 和HiddenMath 基準中提高了約20%,在視覺和程式碼用例中提高了約2-7%。此外,Google也改進了模型響應的整體可用性。現在,兩個模型的回應風格都更加簡潔。據Google 稱,更新後模型的預設輸出長度比以前的模型縮短了約5-20%。
除了模型的改進,Google還將做出重大改變:他們正在降低Gemini 1.5 系列模型API 的價格:輸入詞元降價64%,產出詞元降價52%。
自2024 年10 月1 日起,對Gemini 1.5 Pro 的增量緩存詞元降價64%,提示詞元少於128K 枚。
Google正在提高速率限制,允許開發人員建立複雜的人工智慧應用。 1.5 Flash 的付費級速率限制從原來的1000 RPM 提高到2000 RPM,1.5 Pro 從原來的360 RPM 提高到1000 RPM,。 Google也降低了新機型的延遲,開發人員可以期待輸出速度提高2 倍,延遲降低3 倍。
在更新後的Gemini 1.5(-002 型號)中,Google改進了該模型遵循使用者指令的能力,同時兼顧了安全性。此外,預設情況下,Google不會對這些新模型套用人工智慧內容安全過濾器。相反,開發人員可以根據自己的需求使用過濾器。
最後,Google發布了名為”Gemini-1.5-Flash-8B-Exp-0924″的改良版Gemini 1.5 模型。這個改進的實驗版本在文字和多模態用例方面都有顯著的效能提升。開發人員現在可以透過Google AI Studio 和Gemini API 使用所有這些更新的Gemini 1.5 模型。對於大型企業和Google雲端客戶,這些新更新的Gemini 1.5 模型可在Vertex AI 上使用。
了解更多: