Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

Google的秘密AI模型未來很可能在難題數學領域中打敗人類

Google的秘密AI模型未來很可能在難題數學領域中打敗人類

2024-05-21 Comments 0 Comment

在矽谷正在進行的開發具有類似人類反應的人工智慧模型的競賽中,Google分享了其Gemini 1.5 Pro 模型的最新數據。與ChatGPT 一樣,Gemini 也使用人工智慧來解決問題,而這一次,Google吹捧的是其產品的數學能力。人工智慧模型因其解決大學層級任務的能力而成為衡量其”智力”的標準,Google的研究論文顯示該模型提高了數學成績,並成功解決了國際數學奧林匹克競賽的部分問題。

上週,雙子座人工智慧模型的最新技術報告公佈了其最新數學成績的詳細資訊。這份相當厚重的文件顯示,Google打算模仿數學家接受的訓練來解決複雜的問題,為了實現這一目標,該公司對其雙子座人工智慧模型進行了專門的變體訓練。

Gemini 1.5 Pro 的數學變體似乎經過了多項基準測試。根據其文件,Google依靠各種基準來評估其最新人工智慧數學模型的輸出。這些基準包括MATH 基準、美國數學邀請考試(American Invitational Mathematics Examination, AIME) 和Google內部的HiddenMath 基準。

根據Google的數據,數學型Gemini 1.5 Pro 在數學基準測試中的表現”與人類專家的表現相當”,與標準的非數學型Gemini 1.5 Pro 相比,數學型Gemini 1.5 Pro 在AIME 基準測試中解決的問題明顯增多,在其他基準測試的得分也有所提高。

GOOGLE-GEMINI-MATH-1.5-PRO-1456x592.png
GOOGLE-GEMINI-MATH-1.5-PRO-1-1456x608.png

Google也舉例說明了Gemini 1.5 Pro 所解決的問題。根據文件,這些問題是”Gemini 1.5 Pro、GPT-4 Turbo 和以前所有Gemini 型號都沒有正確解決的問題”,最終提高了Google產品的性能標準。

在它分享的三個範例中,兩個是由數學專用的Gemini 1.5 Pro 解決的,而一個是由標準的Gemini 1.5 Pro 變體錯誤解決的。這些問題通常要求解題者回憶代數中的基本數學公式,並依靠它們的分段和其他數學規則來得出正確答案。

除了問題之外,Google也分享了Gemini 1.5 Pro 基準測試的重要細節。這些數據表明,在所有五個基準測試成績中,Gemini 1.5 Pro 都領先GPT-4 Turbo 和亞馬遜的Claude。

據Google公司稱,其數學專用變體能夠”從單一樣本中獲得80.6% 的MATH 基準準確率,在對256 個解決方案進行採樣並選擇一個候選答案時(rm@256),準確率達到91.1% “,這項成就使其與人類專家處於同等水平。事實上,根據Google深度思維首席科學家傑夫-迪恩(Jeff Dean)的說法,數學模型91.1%的得分大大高於三年前僅為6.9%的”SOTA”(最先進水平)得分。

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
超微獲得NVIDIA Blackwell AI伺服器巨額訂單佔總供應量的25%
NEXT
HBM3e產量激增機構預計到2024年底將佔先進製程晶圓產量的35%

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2024 年 5 月
一 二 三 四 五 六 日
 12345
6789101112
13141516171819
20212223242526
2728293031  
« 4 月   6 月 »

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • 《我的世界:追逐天空》更新與Vibrant Visuals 圖形大修將於下週推出 2025-06-13
  • iPadOS 26 為數學筆記帶來新的3D 圖形功能 2025-06-13
  • iOS 26 為CarPlay 增加了新的縮放功能 2025-06-13
  • 最新洩漏的渲染圖顯示三星將推出三款圓盤Galaxy手錶 2025-06-13
  • 波音CEO回應印度墜機事故:願全力配合調查團隊隨時待命 2025-06-13
  • 有部落客的iPhone升級iOS 26時發熱嚴重機身邊緣溢膠 2025-06-13
  • 賈伯斯的名言「求知若渴虛心若愚」廣泛流傳庫克:20年過去至今振聾發軒 2025-06-13
  • 傳微軟取消第一方Xbox掌機計劃 2025-06-13
  • 截至2024年底華為出貨約1.03億台搭鴻蒙系統的手機超iOS成中國第二 2025-06-13
  • 聯發科史上最強SoC天璣9500跑分曝光單核成績逼近4000大關 2025-06-13

熱門文章與頁面︰

  • 您可以在Windows 11 24H2 中找回WordPad
  • 華為12000mAh 40W超級快充移動電源CP12S拆解
  • 一汽豐田開卷電動車全新bZ5開啟預售:入門版價格不超13萬
  • 華為麒麟9600 CPU現真身神秘數字「2035」再次出現
  • CentOS 搭建 YGOPro 服务端 SRVPro
  • Mondoze : 馬來西亞伺服器/ AS152742/純淨 IP/雙ISP住宅伺服器/$8.33/月/2C/2G記憶體/60G/100M
  • 韓國遊戲公司Nexon出售價格或可高達150億美元
  • Office Tab Enterprise 13.10 x86/x64(含:註冊機序列號)
  • Windows 11 KB5055523更新導致部分使用者無法透過PIN或臉部辨識登入
  • 上海兩大機場直通地鐵虹橋到浦東只要40分鐘全程26元

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.