Google發布Gemini 2.0 Flash Thinking實驗版擁有推理能力
Google發布了一種新的”推理”人工智慧模型–但它還處於實驗階段,新模型名為Gemini 2.0 Flash Thinking Experimental(一個拗口的名字),可在AI Studio 中使用,這是Google 的人工智慧原型開發平台。 模型卡將其描述為”最適合多模態理解、推理和編碼”,能夠在程式設計、數學和物理等領域”推理最複雜的問題”。
在X 上的一篇文章中,負責AI Studio 產品的Logan Kilpatrick 稱Gemini 2.0 Flash Thinking Experimental 是”(Google)推理之旅的第一步”。 Google人工智慧研究部門Google DeepMind 的首席科學家傑夫-迪恩(Jeff Dean)在自己的帖子中說,Gemini 2.0 Flash Thinking Experimental”訓練使用思想來加強推理”。

迪恩說:”當我們增加推理時間的計算量時,我們看到了可喜的成果。”推理時間指的是模型在考慮問題時”運行”所使用的計算量。
Gemini 2.0 Flash Thinking Experimental 是基於Google最近發布的Gemini 2.0 Flash 模型而構建,在設計上似乎與OpenAI 的o1 和其他所謂的推理模型相似。 與大多數人工智慧不同的是,推理模型可以有效地自我檢查事實,這有助於它們避免一些通常會絆倒人工智慧模型的陷阱。
缺點是,推理模型通常需要更長的時間(通常是幾秒鐘到幾分鐘)才能得出解決方案。
給定一個提示後,雙子座2.0 快速思維實驗系統會暫停一下再做出反應,同時考慮一些相關的提示,並沿途”解釋”其推理過程。 一段時間後,模型會總結出它認為最準確的答案。

Google的推理模型有時會在計算字母上遇到困難。圖片來源: Google
在OpenAI o1 發布之後,不僅是Google,其他競爭對手的人工智慧實驗室也紛紛推出了推理模型。 11 月初,由量化交易員資助的人工智慧研究公司DeepSeek 推出了其首個推理模型的預覽版DeepSeek-R1。 同月,阿里巴巴的Qwen 團隊 發布了 它聲稱這是o1 的第一個”開放”挑戰者。
彭博社在10 月報道,Google有幾個團隊正在開發推理模型。 隨後,The Information在11 月的報告顯示,該公司至少有200 名研究人員專注於這項技術。
並不是每個人都相信推理模型是最好的發展方向。 首先,由於運行推理模型需要大量的計算能力,因此推理模型往往很昂貴。 雖然到目前為止推理模型在基準測試中表現出色,但推理模型能否維持目前的發展速度仍很不確定。