黃仁勳劇透下一代GPU晶片新演講又把摩爾定律壓在地上摩擦
台灣大學體育場,歡呼陣陣如同演唱會,但這次“搖滾巨星”,其實是英偉達創始人黃仁勳,再次回到學校,帶來Computex重磅演講,以及英偉達的新一代GPU。是的,英偉達新架構Blackwell宣布不過3個月,老黃就把後三代路線圖全公開了:2025年Blackwell Ultra,2026年新架構Rubin,2027年Rubin Ultra。
![](https://i0.wp.com/x0.ifengimg.com/res/2024/A4B174A6BA19A94E74B38A0E549EF4BF8FC0E186_size7697_w700_h393.gif?w=640&ssl=1)
![](https://i0.wp.com/static.cnbetacdn.com/article/2024/0603/e4f0a8de0b1a453.webp?w=640&ssl=1)
好好好,像做iPhone一樣造晶片。
![](https://i0.wp.com/static.cnbetacdn.com/article/2024/0603/5691d412ba46ab5.webp?w=640&ssl=1)
到這一代Blackwell為止,英偉達已經把AI模型有效擴展到兆參數。 (也為token定了個譯名:詞元)。
1.8兆參數GPT4的訓練能耗,8年降至原來的1/350。
推理能耗,8年降至原來的1/45000。
![](https://i0.wp.com/static.cnbetacdn.com/article/2024/0603/9f3ff7b78ecad73.webp?w=640&ssl=1)
看著這一波亮相和劇透,網友真相了:英偉達沒有競爭對手,而是選擇將摩爾定律放在地上摩擦…
![](https://i0.wp.com/static.cnbetacdn.com/article/2024/0603/9f4f2046556cfda.webp?w=640&ssl=1)
老黃是在書寫自己的定律。
![](https://i0.wp.com/static.cnbetacdn.com/article/2024/0603/a42ed89559a0ebd.webp?w=640&ssl=1)
所以應該叫老黃定律?還是英偉達定律?
ComputeX前夕,老黃一開場就展開了一波隱形賣貨,他自稱不太準確的「CEO數學」:
買得越多,省得越多…
The more you buy, the more you save.
![](https://i0.wp.com/static.cnbetacdn.com/article/2024/0603/64be2f2496cf3ab.webp?w=640&ssl=1)
經典語錄依然引發現場歡呼大笑:雖然不太準確,但好像有些道理…
除此之外,還有一些新產品亮相,包括能夠模擬氣沖的天氣預測模型CorriDiff、數位人微服務、BlackWell系統、Spectrum-X、機器人平台Isaac…
![](https://i0.wp.com/static.cnbetacdn.com/article/2024/0603/da412ae519ab6ee.webp?w=640&ssl=1)
好了話不多說,這就來看看老黃這次到底搞了哪些事情
“AI Factory Is generating”
談到當前新的產業革命,老黃表示:新的運算時代正在開始;而AI Factory正在誕生。
![](https://i0.wp.com/static.cnbetacdn.com/article/2024/0603/b7af37c7553d7ed.webp?w=640&ssl=1)
他在現場展示了BlackWell系統。
3月份GTC大會上還遮遮掩掩地說是GPT-MoE-1.8T模型,這下徹底攤牌了:GPT-4參數就是1.8T。
![](https://i0.wp.com/static.cnbetacdn.com/article/2024/0603/3e59a9677c6fc1d.webp?w=640&ssl=1)
跟DGX Hopper相比。
![](https://i0.wp.com/static.cnbetacdn.com/article/2024/0603/c5ab5de92990948.webp?w=640&ssl=1)
現場還看到了它的真身,大概有兩公尺高吧…
![](https://i0.wp.com/static.cnbetacdn.com/article/2024/0603/74890c059110788.webp?w=640&ssl=1)
而真正的AI Factory大概會長這樣,大概有32000GPU。
![](https://i0.wp.com/static.cnbetacdn.com/article/2024/0603/c15e73766e2a038.gif?w=640&ssl=1)
AI加速每個應用程式
AI對於企業的影響,老黃認為AI加速每一個應用程式。他首先談到了NIM推理微服務,這是一個幫助開發者或企業輕鬆建立AI應用,簡化大模型部署程式。
不管是聊天機器人、還是生活/駕駛助理等,部署時間都能從幾週縮短到幾分鐘。
![](https://i0.wp.com/static.cnbetacdn.com/article/2024/0603/8930d90e4386d88.webp?w=640&ssl=1)
運行Meta Llama 3-8B的NIM可以產生比不使用NIM多3倍的tokens。
![](https://i0.wp.com/static.cnbetacdn.com/article/2024/0603/fa4e9476e834820.webp?w=640&ssl=1)
企業和開發者可以使用NIM運行生成文字、圖像、視訊、語音和數位人類的應用程式。
![](https://i0.wp.com/static.cnbetacdn.com/article/2024/0603/8c27b9b9a28f720.webp?w=640&ssl=1)
而背後源自於豐富的技術合作生態——
近200家技術合作夥伴,包括Cadence、Cloudera、Cohesity、DataStax、NetApp、Scale AI和Synopsys等,正在將NIM整合到他們的平台中。
![](https://i0.wp.com/static.cnbetacdn.com/article/2024/0603/ca3370e32de86ae.webp?w=640&ssl=1)
這次在這個NIM還有上新,也就是ACE 生成式AI微服務,數位人AI技術套件。
除了原有自動語音辨識、文字轉語音的轉換和翻譯、Nemotron語言模型、 Audio2Face等套件,還增加了兩種技術:
一個是可以基於音軌生成身體姿勢Audio2Gesture;
一個Nemotron-3 4.5B,這是英偉達首款SLM(小愛語言模型),專為低延遲端側設備而生。
∂接下來,這項數位人微服務將部署在一億台RTX AI PC上面。
目前英偉達在新的合作夥伴,例如華碩、MSI的加入下,已經擁有超過200種RTX AI PC型號。
![](https://i0.wp.com/d.ifengimg.com/w1080_h435_q90_webp/x0.ifengimg.com/res/2024/DF80D113396DE7B62C90188BDB27703AB62135F6_size386_w1080_h435.png?w=640&ssl=1)
也推出了RTX AI Toolkit,一個工具和SDK集合,幫助Windows開發者客製化優化本機部署模型。
與Mac相比,部署了RTX的Windows的Stable Diffusion推理速度是Mac的7倍。
![](https://i0.wp.com/d.ifengimg.com/w1080_h566_q90_webp/x0.ifengimg.com/res/2024/46578005498D01562C4C3DBCA37F5D72CD9054A3_size126_w1080_h566.png?w=640&ssl=1)
每一台有RTX的PC,都是一台RTX AIPC。
用於機器人開發的技術平台Isaac
這次一同亮相的,還有機器人開發的技術平台,NVIDIA Isaac。
為啥搞這玩意兒呢,老黃給的理由是這樣的:
機器人時代已經來臨。
有朝一日,所有會移動的東西,都將實現自主化。
![](https://i0.wp.com/d.ifengimg.com/w1080_h597_q90_webp/x0.ifengimg.com/res/2024/5AAF3F077C54A756C47998647477815CB18D8764_size592_w1080_h597.png?w=640&ssl=1)
這個Isaac平台具體長啥樣呢?
Isaac平台提供一系列英偉達加速庫、AI基礎模型和模擬技術,供機器人製造商整合到自己的技術堆疊中。
![](https://i0.wp.com/x0.ifengimg.com/res/2024/672F00CF6BBA4482F08090E3A504D5D04541A29D_size6298_w746_h418.gif?w=640&ssl=1)
注意,平台是模組化的,允許公司單獨或一起採用多種技術。
具體而言,其中包括:
NVIDIA Isaac ROS:一系列模組化的ROS 2包,為ROS社群開發者帶來NVIDIA加速和AI模型
NVIDIA Isaac Perceptor:一個參考工作流程,提供基於AI的自主移動機器人的多攝影機3D環景能力
NVIDIA Isaac Manipulator:一個簡化AI啟用機械手臂開發的參考工作流程
NVIDIA Isaac Sim:一個參考應用程序,用於在基於NVIDIA Omniverse平台的物理環境中模擬、測試和驗證機器人,並產生合成數據
NVIDIA Isaac Lab:Isaac Sim中的參考應用程序,針對AI機器人基礎模型訓練的強化、模仿和遷移學習進行了優化
根據介紹,目前,包括比亞迪電子、西門子、泰瑞達機器人和Intrinsic(Alphabet的子公司)在內,全球超多名列前茅的機器人開發團隊,都在採用Isaac平台。
![](https://i0.wp.com/d.ifengimg.com/w1080_h632_q90_webp/x0.ifengimg.com/res/2024/B0EB933798B786D49DB13536B95D04E74E06C2C3_size444_w1080_h632.png?w=640&ssl=1)
這些團隊用上Isaac,一邊提高製造工廠、倉庫和配送中心的效率,同時確保人類同事的安全;一邊也能充當重複勞動和超精確任務的執行者。
現場放了許多demo,許多工廠在英偉達Omniverse裡建造了一個完全模擬現實的自助工廠,以及基於Isaac平台開發的AI機器人。
![](https://i0.wp.com/x0.ifengimg.com/res/2024/210742EF7A130BCF50D9CF2AC2AC5F64DA1C3C4B_size3007_w640_h359.gif?w=640&ssl=1)
官網悄悄推出遊戲Agent助手
除了現場老黃親自發布的上述內容外,我們在英偉達官網還找到了一個彩蛋,一個巨久遠的call back。
Project G-Assist。
時間回到2017年愚人節,英偉達官網開了個大玩笑:
宣稱自家發布了一款支援10080款遊戲的USB人工智慧超算卡GeForce GTX G-Assist。
重點在於它很AI。
GeForce GTX G-Assist像是個AI遊戲助手,可以幫助玩家自動完成遊戲操作,甚至代打擊敗Boss。
![](https://i0.wp.com/d.ifengimg.com/w636_h532_q90_webp/x0.ifengimg.com/res/2024/7BCA2D709DA0D6DA86DF424B6710E31005913F2C_size258_w636_h532.png?w=640&ssl=1)
今天,英偉達真的將這個愚人節玩笑變成現實——
英偉達官網路上線Project G-Assist,一套工具和模型的集合而成的AI Agent系統,供遊戲和應用程式開發者使用。
![](https://i0.wp.com/d.ifengimg.com/w1080_h606_q90_webp/x0.ifengimg.com/res/2024/22EC8752FF66D4E81032C654FBA6C3A148C44442_size1017_w1080_h606.png?w=640&ssl=1)
透過前後劇情,Project G-Assist利用大模型對遊戲輸出響應,能夠檢查遊戲性能和系統設置,建議用戶優化以充分利用可用硬件,或適當升級角色。
玩家這邊呢,還可以透過Project G-Assist找到最好的武器,也可以查詢到最牛的攻略,然後就可以或製作武器材料,或一路殺怪通關。
![](https://i0.wp.com/d.ifengimg.com/w858_h936_ablur_q90_webp/x0.ifengimg.com/res/2024/30DE3D8F87E9BB7BD82E8F65B25ACB278C1FD0C3_size448_w858_h936.png?w=640&ssl=1)
總而言之,Project G-Assist可以讓人有個Agent外掛,但不會讓你完全掛機,
官網也貼心表示:
G-Assist 專案不會像我們在2017年愚人節預言影片中那樣完全替代您玩遊戲,但它可以幫助您從您最喜歡的遊戲中獲得更多收益。
遊戲體驗再上大分!
據介紹,Project G-Assist支援各種模態的輸入。
可以是來自玩家的文字提示,或聲音指令;可以是螢幕上顯示框架的上下文;可以是來自應用程式或系統本身的API。
![](https://i0.wp.com/d.ifengimg.com/w1080_h607_q90_webp/x0.ifengimg.com/res/2024/0F1EB32DA61DE1D08DF3B3FE2CD63BA1398CAE88_size820_w1080_h607.png?w=640&ssl=1)
△演示人員語音輸入中
這些數據都透過連接了遊戲知識資料庫的大模型處理,然後使用RAG(檢索增強生成)生成和用戶相關的查詢結果——沒錯,Project G-Assist允許玩家使用PC或雲端RTX AI驅動的知識庫。
![](https://i0.wp.com/d.ifengimg.com/w1080_h602_q90_webp/x0.ifengimg.com/res/2024/187C56D0B219CCDEF34831347FCB39546E17AEAF_size118_w1080_h602.png?w=640&ssl=1)
Project G-Assist開發工具將出現在即將推出的RTX AI開發套件中,具體會用在哪些遊戲上,還需要遊戲開發人員來決定並提供支援。
為了讓大家更能使用Project G-Assist,英偉達貼心地附上影片教學大禮包,需要可自取。
One More Thing
整場記者會,老黃還整了不少活兒。
例如AI老黃似乎已經成了發表會常客。
在介紹天氣預測模型時,他坦白承認在影片中那麼流利講普通話的那位是AI生成的,因為自己中文不太好。
而本場重磅的BlackWell系統、AI Factory的核心構成,也被他各種搬來搬去…
![](https://i0.wp.com/x0.ifengimg.com/res/2024/49DB066C1B93A6FE9E30FB58679F9AF22D8FCEA4_size1082_w640_h378.gif?w=640&ssl=1)
除了下一代GPU取名為Rubin,我們也看到Vera CPU,他們共同出現在新的Vera Rubin加速器上。而這個名稱來源,其實是來自美國一位女性天文學家Vera Rubin,她是研究暗物質先驅。
![](https://i0.wp.com/d.ifengimg.com/w1080_h750_q90_webp/x0.ifengimg.com/res/2024/9DCFC08935868316F839D65A154AFBA6DC4CCB4C_size92_w1080_h750.jpg?w=640&ssl=1)
以及,COMPUTEX 2024不愧是6月一開始就爆炸的AI終端大戲。
除了黃院士外,英特爾、AMD、高通等老闆都悉數到場,接下來幾天會挨個演講。
這些主題演講,絕大部分都跟AIPC有關。
大家一起蹲一蹲吧~