Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

OpenAI把微軟電網搞崩GPT-6被曝25年發布訓練刷爆10萬張H100

OpenAI把微軟電網搞崩GPT-6被曝25年發布訓練刷爆10萬張H100

2024-03-27 Comments 0 Comment

GPT-5還沒發布,GPT-6已經在路上了?微軟工程師曝出,為GPT-6搭建10萬個H100訓練集群,整個電網卻被搞崩。通往AGI大關,還需要破解電力難題。GPT-6也被電力卡脖子了-部署十萬個H100時,整個電網發生了崩潰!

就在剛剛,微軟工程師爆料,10萬個H100基建正在緊鑼密鼓地建設中,目的就是訓練GPT-6。

微軟工程師吐槽說,團隊在部署跨區域GPU間的infiniband等級連結時遇到了困難。

Corbitt:為何不考慮直接將所有設備部署在同一個地區呢?

微軟工程師:這確實是我們最初的方案。但問題是,一旦我們在同一個州部署超過100,000個H100 GPU,電網就會因為無法負載而崩潰。

這是創業者Kyle Corbitt在社群媒體上,分享自己與一位微軟工程師關於GPT-6訓練集群專案的對話

沒想到,GPT-5還沒發,微軟就已悄悄為OpenAI開始訓練GPT-6了。

同在今天,一張「OpenAI內部時間軸」圖片在網路上瘋轉。

圖中清楚標示:OpenAI早在2022年8月-10月之間開始了GPT-5(代號Arrakis)的訓練,2023年4月GPT-4.5(代號Gobi)在訓練中。

且圖中顯示,GPT-6的測試,預計早在去年9月就開始了!

同時,關於GPT-5(Arrakis)的一個爆料帖,也隨之浮出水面。

太長不看版

貼文中爆出許多內幕消息。

例如,GPT-4.5因為能力不夠,乾脆被跳過,所以今年OpenAI會直接發GPT-5。

另外還有若干未經證實的消息(從上圖也可以看出),關於OpenAI手中握著的一大把模型——

例如,Arrakis/GPT-5在GPT-4不久後訓練了3個月,於22年10月結束;在GPT-5之後,GPT-4.5於23年4月完成訓練。

最勁爆的消息當然就是,現在GPT-6或許已經在訓練中了。

但是,GPT-5並不是AGI,因為無法解決「量子重力」問題。同理,GPT-6也不是AGI。

接下來,讓我們一一盤點下,貼文中都有哪些資訊點。

最接近AGI的模型,與人類專家不相上下

去年8月,FeltSteam最先曝出OpenAI內部正在進行一個Arrakis多模態模型的項目,遠超GPT-4,非常接近AGI。

Arrakis計畫被首次提及,是名叫FeltSteam的網友最早在Reddit一個評論區中爆料稱,「Arrakis和Gobi都很酷」。

並且,他在r/singularity板塊中另一個問題下, 介紹了Arrakis的一些能力。

他提到,「這是一個無所不能的模型,可以輸入文字、圖像、音訊和視訊的任何組合」。

具體來說,Arrakis更多的細節包括:

– 多模態模型

– 性能遠超GPT-4

– 接近AGI

– 幻覺發生率明顯低於GPT-4

– Altman正試圖將Arrakis作為一種工具來推銷,儘管它是有感情的

– 推理成本略低於GPT-4

– 非常優秀的自主智能體

– 訓練一般資料是合成的

同時,Jimmy Apples在社群媒體上曝光了OpenAI內部代號Gobi的計畫——大規模多模態模型。

除了以上兩個項目,一個代號名為「Sunshine」的項目逐漸浮現。

OpenAI這些秘密進行的項目,一時間引來許多網友的猜測與討論。

隨後,FeltSteam又爆出了更多的細節,Arrakis據稱有125兆參數,大約是GPT-4的100倍,並在2022年10月完成訓練。

值得一提的是,Arrakis不是透過運算資源實現的,而是透過提高運算效率來實現的。

目前,OpenAI內部也在使用Arrakis進行研究,不過整體員工水準肯定優於Arrakis。另外,與GPT-5相比,Gobi更接近GPT-4.5。

到了10月,FeltSteam再一次表示,一個比GPT-4大100倍的模型即將問世。

GPT-5將在2024年中,或在2024年第三季發布。

最近BussinessInsider的報導稱,知情人士透露,GPT-5或將在今年夏天發布。與FeltSteam預測的時間幾乎吻合。

而Arrakis是GPT-5一個更強大的候選者,在多個領域中具備人類層級的專業知識能力​​。

GPT-5不是AGI

不過,Arrakis並不符合Altman對AGI的定義,也就是解決「量子重力」的問題。

量子引力,又稱量子重力,是描述重力場量子化的理論,屬於萬有理論之一隅;主要嘗試結合廣義相對論與量子力學,為當前物理學尚未解決的問題

但如同之前所說,Arrakis模型還是能夠達到人類專家水準。

GPT-5和GPT-6都不是AGI

FeltSteam表示,傳說中的AGI,是Arrakis以外的東西。

但是,為什麼我們能在這麼短的時間裡,訓練出一個125兆參數的模型呢?

理論上來說,如果訓一個1.75兆參數模型需要4-5個月,那麼如果訓練一個大百倍的模型,應該需要幾十年。

(目前已知,GPT-4在A100集群上訓了100天,但在訓練後,OpenAI又花了幾個月時間對它微調和對齊。)

顯然,要訓125兆參數的模型,不僅要投入原始運算資源,還要顯著提高運算效率。

用90%合成資料訓練

另一個比較值得關注的資訊是,據稱Arrakis去年訓練的資料集中約90%是合成資料。

此前,外媒報道稱:

Ilya Sutskever的突破讓OpenAI克服了在獲取高品質資料以訓練新模型方面的限制,而這正是開發下一代模型的主要障礙。這項研究涉及使用電腦生成的數據,而不是真實世界的數據,例如從互聯網上提取的文字或圖像來訓練新模型。

FeltSteam認為,OpenAI正遇到了擴展(scaling)的難題,因為僅僅擴展注意力和模型參數是遠遠不夠的。

目前,GPT-4的訓練已經窮盡了整個網路的數據,還需要進行強化學習,甚至更多的數據。

另外,Arrakis還是一個非常優秀的自主智能體。

所有關於OpenAI專案資訊總結目錄一覽表。

十萬個H100訓GPT-6,被電力卡脖子

就在以上的爆料帖中,有一種說法是,GPT-6將於2025年發布。

而就在爆料微軟工程師對話的貼文中,也再次證實:微軟正用10萬個H100來幫OpenAI訓練GPT-6!

有網友算了一下,如果十萬個H100同時開啟,功耗將達到70兆瓦,電網一定撐不住。

而熟悉電力業的網友說,一般大型電廠的輸出功率將達到2000兆瓦,100兆瓦的負載其實並不大。但突然在電網中增加100兆瓦的負載肯定會讓電網系統出問題。

核能也許是唯一的辦法了,電力短缺將直接限制未來GPU的發展。

此前,ChatGPT每天耗電已超50萬千瓦時,登上了熱搜,足見AI「吃電」非常兇猛。

根據波士頓顧問公司的分析,到2030年,資料中心的用電量預計將增加兩倍,相當於為約4,000萬美國家庭供電所需的電力力量

沒想到,馬斯克預言的由AI導致的電力短缺,這麼快就卡住AGI的脖子了。

馬斯克:「現在AI對算力的需求差不多每半年就會增加10倍,馬上會超過宇宙的質量。晶片短缺緩解後,馬上就會出現電力短缺。如果電網輸出100-300千伏特的電壓,然後必須一路降壓至6伏,未來將出現變壓器短缺」。

包括Sam Altman在內的越來越多的AI產業大佬表示,AI的第一原理,最重要的部分就是能源和智慧的轉換率的問題。

而人工智慧是能源的無底洞,AI未來將會被能源卡脖子。

因為Transformer本質上不是一個能效很高的演算法,所以在未來,能源將會是困擾AI發展的一大問題。

對此,網友表示,長期看好中國基建。

而在Altman看來,滿足AI飆升能源需求最有效的方法,就是核融合。

為此,他本人就在核融合上投資了真金白銀的數億美元。

沒有突破,就沒有辦法到達那裡,我們需要核融合。

然而,真要達成核融合,卻沒那麼快。

英國曼徹斯特大學核融合研究員Aneeqa Khan表示,“在地球上重建太陽中心的條件是一個巨大的挑戰”,可能要到本世紀下半葉才能準備就緒。

「核融合已經為時已晚,無法應對氣候危機。在短期內,我們可利用的是現有的低碳技術,例如裂變和再生能源」。

國際能源總署(IEA)最近的一項分析計算出,資料中心、某貨和人工智慧的電力消耗在未來兩年內可能會翻倍。2022年,它們約佔全球電力需求的2%。同時AI的需求將呈指數級增長,在2023年至2026年間至少增加10倍

此外,除了電力的限制之外,網友仍繼續腦洞大開,認為散熱也將成為一個問題。

10萬塊H100還會帶來散熱和空間堆疊的問題,其實最近3年這些問題一直都存在,未來還會越來越嚴重。

網友進一步調侃到,未來加拿大會成為AI大國,因為他們有取之不盡的寒冷且乾燥的空氣!這些在AI時代將會是寶貴的自然資源。

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
英國智庫警告:人工智慧或取代800萬個工作崗位
NEXT
《寶可夢Go》開發商「正確」更新遊戲內人物想像玩家不滿

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2024 年 3 月
一 二 三 四 五 六 日
 123
45678910
11121314151617
18192021222324
25262728293031
« 2 月   4 月 »

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • 中國新創公司曾淡化出身如今一些新創公司卻開始自豪於這一點 2025-05-18
  • 《生化危機9》為何遲遲不公佈?可能是優化問題 2025-05-18
  • 任天堂解釋《瑪利歐賽車:世界》成為首發遊戲的原因 2025-05-18
  • 墨西哥海軍大型帆船撞布魯克林大橋造成55人受傷 2025-05-18
  • 新型火山預警系統在爆發前就能聽到地球的聲音 2025-05-18
  • 洋紅色極光和陷入錯亂的衛星:接管了美國宇航局演習的甘農太陽風暴 2025-05-18
  • 新研究顯示瓦薩奇斷層比之前認為的更危險下一次強震遲早會發生 2025-05-18
  • iPhone 17 Air 電池容量和重量資訊外洩 2025-05-18
  • 華為nova 14系列明天發布:三款機型樣機到店提前拆罰20萬起 2025-05-18
  • 中國電信5G-A套餐正式商用:比5G快10倍更穩定 2025-05-18

熱門文章與頁面︰

  • 三星20000尼特微型OLED推動VR頭顯亮度達到日光級別
  • 您可以在Windows 11 24H2 中找回WordPad
  • 鳥寶寶有多內捲?為了讓父母投餵自己長出恐怖的嘴巴
  • 「多喝水」真的有用研究顯示有助於減肥、治療腎結石
  • 南極冰蓋數十年來首次成長
  • 打車叫到特斯拉不會開門很尷尬?官方介紹開關門方法
  • z-sms – 在線免費云短信臨時手機號接碼平台網頁版
  • A24新片《遺軍之戰》 取自門多薩的戰爭回憶
  • OpenAI的GPT-4可透過閱讀安全公告自主利用真實漏洞
  • "91大神"偷拍百名女性獲刑:曾任外企高管年薪百萬

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.