Google發布Gemini 2.0 向所有人開放有史以來最強AI模型
美東時間週三,Google宣布,其最新AI模型套件Gemini 2.0正式向所有用戶開放使用。根據Google表示,這是該公司迄今為止「最強大」的AI模型套件。先前在去年12月,Google僅向開發者和受信任的測試者開放了部分功能,並將一些功能整合進Google的核心產品。如今全面開放後,所有新模型都可透過GoogleAI Studio和Gemini API供開發者使用。

Gemini 2.0套件包含三款針對不同應用情境的子模型:
2.0 Flash:被稱為“主力模型”,適用於高容量、高頻率任務。
2.0 Pro Experimental:專注提升程式設計效能,是迄今為止最出色的程式支援工具,支援200萬tokens的輸入容量,能夠一次分析和處理大量資訊。
2.0 Flash-Lite:Google稱其為“迄今為止最具成本效益的模型”,其成本和速度均優於1.5 Flash,具有100萬個tokens上下文視窗和多模式輸入。

在定價方面,2.0 Flash每處理百萬個tokens收費10美分,支援文字、圖像和視訊輸入。而更便宜的Flash-Lite版本,同樣的處理量僅需0.75美分。
有網友在社群媒體X上表示:
“這個定價確實太瘋狂了!幹得太棒了。”
“確實,這是迄今為止我用過的最好的模型之一,甚至在編碼方面比OpenAI的o1更好!”

AI代理競賽升溫,巨頭爭相推出新功能
Gemini 2.0的全面發布是Google推動“AI代理” 發展的最新舉措,AI代理就像一個超級智能的“任務管家”,不用用戶逐步操作提示,即可自動搞定複雜多步驟任務,可大幅提高工作效率,告別重複機械勞動。近年來,包括Meta、亞馬遜、微軟、OpenAI和Anthropic在內的科技巨頭都在這領域加速版面。
Google在去年底的部落格文章中提到:
“在過去的一年裡,我們一直在投資開發更多的代理AI模型。這些模型能更好地理解用戶周圍的世界,進行多步思考,並在用戶監督下代表用戶採取行動。”
“Gemini 2.0在多模態能力方面(支援文字、圖像、音訊等多種資料類型)取得了新進展。這一系列模型讓我們更接近通用助手的願景。”
不只是Google在努力,當前科技業AI軍備競賽進入白熱化階段。例如,亞馬遜支援的AI新創公司Anthropic在去年10月推出了可模擬人類使用電腦的AI代理,能完成數十到上百步驟的複雜任務。
同時,微軟支援的OpenAI最近推出了名為Operator的功能,可自動執行諸如規劃度假、預訂餐廳、訂購雜貨等任務。此外,OpenAI本週也推出Deep Research工具,支援AI代理產生複雜研究報告,並分析使用者選擇的問題和主題。
值得注意的是,Google在去年12月也推出了同名工具Deep Research,旨在幫助用戶的“研究助理”,探索複雜主題並編寫報告。
綜合媒體消息,Google計劃在2025年初推出更多AI功能。 GoogleCEO Sundar Pichai在一次策略會議上強調:
“從歷史上看,你不一定總是第一,但你必須執行力強,真正成為同類產品中最好的。我認為這就是2025年的全部意義所在。”