黃仁勳劇透下一代GPU晶片新演講又把摩爾定律壓在地上摩擦

2024-06-03 Comments 0 Comment

台灣大學體育場，歡呼陣陣如同演唱會，但這次“搖滾巨星”，其實是英偉達創始人黃仁勳，再次回到學校，帶來Computex重磅演講，以及英偉達的新一代GPU。是的，英偉達新架構Blackwell宣布不過3個月，老黃就把後三代路線圖全公開了：2025年Blackwell Ultra，2026年新架構Rubin，2027年Rubin Ultra。

好好好，像做iPhone一樣造晶片。

到這一代Blackwell為止，英偉達已經把AI模型有效擴展到兆參數。（也為token定了個譯名：詞元）。

1.8兆參數GPT4的訓練能耗，8年降至原來的1/350。

推理能耗，8年降至原來的1/45000。

看著這一波亮相和劇透，網友真相了：英偉達沒有競爭對手，而是選擇將摩爾定律放在地上摩擦…

老黃是在書寫自己的定律。

所以應該叫老黃定律？還是英偉達定律？

ComputeX前夕，老黃一開場就展開了一波隱形賣貨，他自稱不太準確的「CEO數學」：

買得越多，省得越多…

The more you buy, the more you save.

經典語錄依然引發現場歡呼大笑：雖然不太準確，但好像有些道理…

除此之外，還有一些新產品亮相，包括能夠模擬氣沖的天氣預測模型CorriDiff、數位人微服務、BlackWell系統、Spectrum-X、機器人平台Isaac…

好了話不多說，這就來看看老黃這次到底搞了哪些事情

“AI Factory Is generating”

談到當前新的產業革命，老黃表示：新的運算時代正在開始；而AI Factory正在誕生。

他在現場展示了BlackWell系統。

3月份GTC大會上還遮遮掩掩地說是GPT-MoE-1.8T模型，這下徹底攤牌了：GPT-4參數就是1.8T。

跟DGX Hopper相比。

現場還看到了它的真身，大概有兩公尺高吧…

而真正的AI Factory大概會長這樣，大概有32000GPU。

AI加速每個應用程式

AI對於企業的影響，老黃認為AI加速每一個應用程式。他首先談到了NIM推理微服務，這是一個幫助開發者或企業輕鬆建立AI應用，簡化大模型部署程式。

不管是聊天機器人、還是生活/駕駛助理等，部署時間都能從幾週縮短到幾分鐘。

運行Meta Llama 3-8B的NIM可以產生比不使用NIM多3倍的tokens。

企業和開發者可以使用NIM運行生成文字、圖像、視訊、語音和數位人類的應用程式。

而背後源自於豐富的技術合作生態——

近200家技術合作夥伴，包括Cadence、Cloudera、Cohesity、DataStax、NetApp、Scale AI和Synopsys等，正在將NIM整合到他們的平台中。

這次在這個NIM還有上新，也就是ACE 生成式AI微服務，數位人AI技術套件。

除了原有自動語音辨識、文字轉語音的轉換和翻譯、Nemotron語言模型、 Audio2Face等套件，還增加了兩種技術：

一個是可以基於音軌生成身體姿勢Audio2Gesture；

一個Nemotron-3 4.5B，這是英偉達首款SLM（小愛語言模型），專為低延遲端側設備而生。

∂接下來，這項數位人微服務將部署在一億台RTX AI PC上面。

目前英偉達在新的合作夥伴，例如華碩、MSI的加入下，已經擁有超過200種RTX AI PC型號。

也推出了RTX AI Toolkit，一個工具和SDK集合，幫助Windows開發者客製化優化本機部署模型。

與Mac相比，部署了RTX的Windows的Stable Diffusion推理速度是Mac的7倍。

每一台有RTX的PC，都是一台RTX AIPC。

用於機器人開發的技術平台Isaac

這次一同亮相的，還有機器人開發的技術平台，NVIDIA Isaac。

為啥搞這玩意兒呢，老黃給的理由是這樣的：

機器人時代已經來臨。

有朝一日，所有會移動的東西，都將實現自主化。

這個Isaac平台具體長啥樣呢？

Isaac平台提供一系列英偉達加速庫、AI基礎模型和模擬技術，供機器人製造商整合到自己的技術堆疊中。

注意，平台是模組化的，允許公司單獨或一起採用多種技術。

具體而言，其中包括：

NVIDIA Isaac ROS：一系列模組化的ROS 2包，為ROS社群開發者帶來NVIDIA加速和AI模型

NVIDIA Isaac Perceptor：一個參考工作流程，提供基於AI的自主移動機器人的多攝影機3D環景能力

NVIDIA Isaac Manipulator：一個簡化AI啟用機械手臂開發的參考工作流程

NVIDIA Isaac Sim：一個參考應用程序，用於在基於NVIDIA Omniverse平台的物理環境中模擬、測試和驗證機器人，並產生合成數據

NVIDIA Isaac Lab：Isaac Sim中的參考應用程序，針對AI機器人基礎模型訓練的強化、模仿和遷移學習進行了優化

根據介紹，目前，包括比亞迪電子、西門子、泰瑞達機器人和Intrinsic（Alphabet的子公司）在內，全球超多名列前茅的機器人開發團隊，都在採用Isaac平台。

這些團隊用上Isaac，一邊提高製造工廠、倉庫和配送中心的效率，同時確保人類同事的安全；一邊也能充當重複勞動和超精確任務的執行者。

現場放了許多demo，許多工廠在英偉達Omniverse裡建造了一個完全模擬現實的自助工廠，以及基於Isaac平台開發的AI機器人。

官網悄悄推出遊戲Agent助手

除了現場老黃親自發布的上述內容外，我們在英偉達官網還找到了一個彩蛋，一個巨久遠的call back。

Project G-Assist。

時間回到2017年愚人節，英偉達官網開了個大玩笑：

宣稱自家發布了一款支援10080款遊戲的USB人工智慧超算卡GeForce GTX G-Assist。

重點在於它很AI。

GeForce GTX G-Assist像是個AI遊戲助手，可以幫助玩家自動完成遊戲操作，甚至代打擊敗Boss。

今天，英偉達真的將這個愚人節玩笑變成現實——

英偉達官網路上線Project G-Assist，一套工具和模型的集合而成的AI Agent系統，供遊戲和應用程式開發者使用。

透過前後劇情，Project G-Assist利用大模型對遊戲輸出響應，能夠檢查遊戲性能和系統設置，建議用戶優化以充分利用可用硬件，或適當升級角色。

玩家這邊呢，還可以透過Project G-Assist找到最好的武器，也可以查詢到最牛的攻略，然後就可以或製作武器材料，或一路殺怪通關。

總而言之，Project G-Assist可以讓人有個Agent外掛，但不會讓你完全掛機，

官網也貼心表示：

G-Assist 專案不會像我們在2017年愚人節預言影片中那樣完全替代您玩遊戲，但它可以幫助您從您最喜歡的遊戲中獲得更多收益。

遊戲體驗再上大分！

據介紹，Project G-Assist支援各種模態的輸入。

可以是來自玩家的文字提示，或聲音指令；可以是螢幕上顯示框架的上下文；可以是來自應用程式或系統本身的API。

△演示人員語音輸入中

這些數據都透過連接了遊戲知識資料庫的大模型處理，然後使用RAG（檢索增強生成）生成和用戶相關的查詢結果——沒錯，Project G-Assist允許玩家使用PC或雲端RTX AI驅動的知識庫。

Project G-Assist開發工具將出現在即將推出的RTX AI開發套件中，具體會用在哪些遊戲上，還需要遊戲開發人員來決定並提供支援。

為了讓大家更能使用Project G-Assist，英偉達貼心地附上影片教學大禮包，需要可自取。

One More Thing

整場記者會，老黃還整了不少活兒。

例如AI老黃似乎已經成了發表會常客。

在介紹天氣預測模型時，他坦白承認在影片中那麼流利講普通話的那位是AI生成的，因為自己中文不太好。

而本場重磅的BlackWell系統、AI Factory的核心構成，也被他各種搬來搬去…

除了下一代GPU取名為Rubin，我們也看到Vera CPU，他們共同出現在新的Vera Rubin加速器上。而這個名稱來源，其實是來自美國一位女性天文學家Vera Rubin，她是研究暗物質先驅。

以及，COMPUTEX 2024不愧是6月一開始就爆炸的AI終端大戲。

除了黃院士外，英特爾、AMD、高通等老闆都悉數到場，接下來幾天會挨個演講。

這些主題演講，絕大部分都跟AIPC有關。

大家一起蹲一蹲吧～

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

WONGCW 網誌

記錄生活經驗與點滴

黃仁勳劇透下一代GPU晶片新演講又把摩爾定律壓在地上摩擦

2024-06-03 Comments 0 Comment

相關

發表迴響取消回覆

分享此文：

相關

發表迴響取消回覆