Google正在創建自己的推理模型原理類似於OpenAI 的o1
自從OpenAI 揭示了其具有高級推理能力的最新模型o1 以來,人工智慧領域發生了重大變化。 o1 模型旨在處理科學、編碼和數學領域的複雜任務,在各種推理能力較強的基準測試中,其表現明顯優於前代產品GPT 4o。 根據彭博社的報道,Google似乎也正在開發類似的高階推理模式。
報道稱,Google內部的多個團隊在開發這種人工智慧推理模型方面取得了重大進展。 早在今年七月,Google就推出了兩個模型: AlphaProof 專注於數學推理,而AlphaGeometry 2 則針對與幾何相關的任務而開發。 這兩個模型都成功解決了國際數學奧林匹克(IMO)中的多個問題。 這是我們第一次在Google的人工智慧模型中看到其擁有如此程度的推理能力。
首先,具備推理能力的模式會利用強化學習來提升推理能力。 與以往不經過廣泛的內部思考就提供答案的模型不同,像OpenAI 的o1 這樣的模型在做出反應之前都要經過”思考”訓練。
這個內部過程包括創造一個長長的思考鏈,使模型能夠更有效地解決難題。 例如,在IMO 的資格考試中,o1 的準確率達到了83%,而GPT-4o 的準確率只有13%。
儘管是最早從事人工智慧研究的公司之一,Google在發佈人工智慧產品方面卻比競爭對手更保守。 Google DeepMind 的一些員工擔心落後於競爭對手,尤其是在9 月中旬OpenAI 的o1 車型推出後。
據報道,Google的推理模型旨在解決數學和電腦科學等不同領域的複雜、多步驟問題。
有關Google何時向公眾公開這項模型還沒有具體時間表。