黃仁勳劇透下一代GPU晶片新演講又把摩爾定律壓在地上摩擦
台灣大學體育場,歡呼陣陣如同演唱會,但這次“搖滾巨星”,其實是英偉達創始人黃仁勳,再次回到學校,帶來Computex重磅演講,以及英偉達的新一代GPU。是的,英偉達新架構Blackwell宣布不過3個月,老黃就把後三代路線圖全公開了:2025年Blackwell Ultra,2026年新架構Rubin,2027年Rubin Ultra。
好好好,像做iPhone一樣造晶片。
到這一代Blackwell為止,英偉達已經把AI模型有效擴展到兆參數。 (也為token定了個譯名:詞元)。
1.8兆參數GPT4的訓練能耗,8年降至原來的1/350。
推理能耗,8年降至原來的1/45000。
看著這一波亮相和劇透,網友真相了:英偉達沒有競爭對手,而是選擇將摩爾定律放在地上摩擦…
老黃是在書寫自己的定律。
所以應該叫老黃定律?還是英偉達定律?
ComputeX前夕,老黃一開場就展開了一波隱形賣貨,他自稱不太準確的「CEO數學」:
買得越多,省得越多…
The more you buy, the more you save.
經典語錄依然引發現場歡呼大笑:雖然不太準確,但好像有些道理…
除此之外,還有一些新產品亮相,包括能夠模擬氣沖的天氣預測模型CorriDiff、數位人微服務、BlackWell系統、Spectrum-X、機器人平台Isaac…
好了話不多說,這就來看看老黃這次到底搞了哪些事情
“AI Factory Is generating”
談到當前新的產業革命,老黃表示:新的運算時代正在開始;而AI Factory正在誕生。
他在現場展示了BlackWell系統。
3月份GTC大會上還遮遮掩掩地說是GPT-MoE-1.8T模型,這下徹底攤牌了:GPT-4參數就是1.8T。
跟DGX Hopper相比。
現場還看到了它的真身,大概有兩公尺高吧…
而真正的AI Factory大概會長這樣,大概有32000GPU。
AI加速每個應用程式
AI對於企業的影響,老黃認為AI加速每一個應用程式。他首先談到了NIM推理微服務,這是一個幫助開發者或企業輕鬆建立AI應用,簡化大模型部署程式。
不管是聊天機器人、還是生活/駕駛助理等,部署時間都能從幾週縮短到幾分鐘。
運行Meta Llama 3-8B的NIM可以產生比不使用NIM多3倍的tokens。
企業和開發者可以使用NIM運行生成文字、圖像、視訊、語音和數位人類的應用程式。
而背後源自於豐富的技術合作生態——
近200家技術合作夥伴,包括Cadence、Cloudera、Cohesity、DataStax、NetApp、Scale AI和Synopsys等,正在將NIM整合到他們的平台中。
這次在這個NIM還有上新,也就是ACE 生成式AI微服務,數位人AI技術套件。
除了原有自動語音辨識、文字轉語音的轉換和翻譯、Nemotron語言模型、 Audio2Face等套件,還增加了兩種技術:
一個是可以基於音軌生成身體姿勢Audio2Gesture;
一個Nemotron-3 4.5B,這是英偉達首款SLM(小愛語言模型),專為低延遲端側設備而生。
∂接下來,這項數位人微服務將部署在一億台RTX AI PC上面。
目前英偉達在新的合作夥伴,例如華碩、MSI的加入下,已經擁有超過200種RTX AI PC型號。
也推出了RTX AI Toolkit,一個工具和SDK集合,幫助Windows開發者客製化優化本機部署模型。
與Mac相比,部署了RTX的Windows的Stable Diffusion推理速度是Mac的7倍。
每一台有RTX的PC,都是一台RTX AIPC。
用於機器人開發的技術平台Isaac
這次一同亮相的,還有機器人開發的技術平台,NVIDIA Isaac。
為啥搞這玩意兒呢,老黃給的理由是這樣的:
機器人時代已經來臨。
有朝一日,所有會移動的東西,都將實現自主化。
這個Isaac平台具體長啥樣呢?
Isaac平台提供一系列英偉達加速庫、AI基礎模型和模擬技術,供機器人製造商整合到自己的技術堆疊中。
注意,平台是模組化的,允許公司單獨或一起採用多種技術。
具體而言,其中包括:
NVIDIA Isaac ROS:一系列模組化的ROS 2包,為ROS社群開發者帶來NVIDIA加速和AI模型
NVIDIA Isaac Perceptor:一個參考工作流程,提供基於AI的自主移動機器人的多攝影機3D環景能力
NVIDIA Isaac Manipulator:一個簡化AI啟用機械手臂開發的參考工作流程
NVIDIA Isaac Sim:一個參考應用程序,用於在基於NVIDIA Omniverse平台的物理環境中模擬、測試和驗證機器人,並產生合成數據
NVIDIA Isaac Lab:Isaac Sim中的參考應用程序,針對AI機器人基礎模型訓練的強化、模仿和遷移學習進行了優化
根據介紹,目前,包括比亞迪電子、西門子、泰瑞達機器人和Intrinsic(Alphabet的子公司)在內,全球超多名列前茅的機器人開發團隊,都在採用Isaac平台。
這些團隊用上Isaac,一邊提高製造工廠、倉庫和配送中心的效率,同時確保人類同事的安全;一邊也能充當重複勞動和超精確任務的執行者。
現場放了許多demo,許多工廠在英偉達Omniverse裡建造了一個完全模擬現實的自助工廠,以及基於Isaac平台開發的AI機器人。
官網悄悄推出遊戲Agent助手
除了現場老黃親自發布的上述內容外,我們在英偉達官網還找到了一個彩蛋,一個巨久遠的call back。
Project G-Assist。
時間回到2017年愚人節,英偉達官網開了個大玩笑:
宣稱自家發布了一款支援10080款遊戲的USB人工智慧超算卡GeForce GTX G-Assist。
重點在於它很AI。
GeForce GTX G-Assist像是個AI遊戲助手,可以幫助玩家自動完成遊戲操作,甚至代打擊敗Boss。
今天,英偉達真的將這個愚人節玩笑變成現實——
英偉達官網路上線Project G-Assist,一套工具和模型的集合而成的AI Agent系統,供遊戲和應用程式開發者使用。
透過前後劇情,Project G-Assist利用大模型對遊戲輸出響應,能夠檢查遊戲性能和系統設置,建議用戶優化以充分利用可用硬件,或適當升級角色。
玩家這邊呢,還可以透過Project G-Assist找到最好的武器,也可以查詢到最牛的攻略,然後就可以或製作武器材料,或一路殺怪通關。
總而言之,Project G-Assist可以讓人有個Agent外掛,但不會讓你完全掛機,
官網也貼心表示:
G-Assist 專案不會像我們在2017年愚人節預言影片中那樣完全替代您玩遊戲,但它可以幫助您從您最喜歡的遊戲中獲得更多收益。
遊戲體驗再上大分!
據介紹,Project G-Assist支援各種模態的輸入。
可以是來自玩家的文字提示,或聲音指令;可以是螢幕上顯示框架的上下文;可以是來自應用程式或系統本身的API。
△演示人員語音輸入中
這些數據都透過連接了遊戲知識資料庫的大模型處理,然後使用RAG(檢索增強生成)生成和用戶相關的查詢結果——沒錯,Project G-Assist允許玩家使用PC或雲端RTX AI驅動的知識庫。
Project G-Assist開發工具將出現在即將推出的RTX AI開發套件中,具體會用在哪些遊戲上,還需要遊戲開發人員來決定並提供支援。
為了讓大家更能使用Project G-Assist,英偉達貼心地附上影片教學大禮包,需要可自取。
One More Thing
整場記者會,老黃還整了不少活兒。
例如AI老黃似乎已經成了發表會常客。
在介紹天氣預測模型時,他坦白承認在影片中那麼流利講普通話的那位是AI生成的,因為自己中文不太好。
而本場重磅的BlackWell系統、AI Factory的核心構成,也被他各種搬來搬去…
除了下一代GPU取名為Rubin,我們也看到Vera CPU,他們共同出現在新的Vera Rubin加速器上。而這個名稱來源,其實是來自美國一位女性天文學家Vera Rubin,她是研究暗物質先驅。
以及,COMPUTEX 2024不愧是6月一開始就爆炸的AI終端大戲。
除了黃院士外,英特爾、AMD、高通等老闆都悉數到場,接下來幾天會挨個演講。
這些主題演講,絕大部分都跟AIPC有關。
大家一起蹲一蹲吧~