現場直擊黃仁勳CES 2025演講:瘋狂的觀眾與超級晶片隊長
《Without Your Shotgun》復古又動感的旋律戛然而止,穿著閃亮的新夾克,英偉達CEO黃仁勳走向CES的舞台中央。 “Are you excited in Las Vegas(你們喜歡拉斯維加斯嗎)?”“Do you like my jacket(你們喜歡我的夾克嗎)?”
作者|王藝蘇霍伊
編輯|王博
發自美國拉斯維加斯CES 2025現場
而在此之前,整個拉斯維加斯都在屏息以待,直到黃仁勳掏出了RTX 50系列消費級顯示卡(GPU),會場才被掌聲與歡呼聲淹沒。
這是黃仁勳時隔多年再次來到CES(Consumer Electronics Show,國際消費性電子產品展覽會)發表主題演講,上一次還是在2019年,他在CES上發布了RTX 20系列顯示卡。
當地時間下午2點,距離活動開始還有4個小時,就有與會者來到了演講會場Mandalay Bay Arena。演講開始前,會場門口已經排起了看不到頭的隊伍,在人群中,一位觀眾對「甲子光年」調侃:「這幾個小時我已和旁邊人嘮成朋友,再等下去就快成兄弟了。
黃仁勳演講會場門口的“長龍”,圖片來源:UASC Semi
全世界的媒體也將目光聚焦在英偉達。
「我主要期待英偉達在晶片、機器人和在汽車方面的新動作。」一位來自日本的電視記者對「甲子光年」說道。而來自印度報業托拉斯的記者Yashita則表示,去年10月英偉達推出印地語AI模型,所以她更關注這次新發表會對印度AI產業帶來的促進與影響。
這次,黃仁勳的主題演講有以下重點內容:
發表史上最快的消費級顯示卡RTX 5090;
提出Scaling Law仍在繼續,並表示要創建一個名為Grace Blackwell NVLink72的巨型晶片;
在NIM微服務中新增Nemotron系列模型和用於影片搜尋和摘要的AI代理,入局Agentic AI;
發布Nvidia Cosmos世界基礎模型平台,以協助Physical AI的發展;
發佈人形機器人合成資料藍圖Isaac GR00T Blueprint與新一代智駕晶片Thor;
發布全球最小的個人AI超級電腦Project DIGITS。
FPSolution VC創始合夥人、SpaceX前華裔高管Lewis Hong在聽了黃仁勳的演講後做了一個大膽的推斷:“英偉達接下來也許會直接吃掉所有’ M agnificent 7’的’餅’,或許唯一可以跟他們抗衡的只有Elon Musk (埃隆·馬斯克)了。
「Magnificent 7」 指的是目前科技領域最具影響力的七家公司:微軟(MSFT)、亞馬遜(AMZN)、Meta Platforms(META)、Alphabet(GOOGL)、蘋果(AAPL)、特斯拉(TSLA )、英偉達(NVDA)。
1小時35分鐘的演講,黃仁勳的每一句都像是一枚精準投射的晶片,深深嵌入了觀眾的腦中,而這些「晶片」包括了英偉達的陽謀與野心。
1.史上最快的消費級顯示卡
黃仁勳在這次演講中發布的產品,最受關注的莫過於RTX 5090。
RTX 5090是迄今為止最快的GeForce RTX GPU,在Blackwell架構創新和DLSS 4的加持下,RTX 5090的效能是RTX 4090的2倍。
它在多款熱門遊戲中都表現優異,這些遊戲包括《Cyberpunk2077》《黑神話:悟空》等,同時在D5 Render渲染器上也有不錯的表現。
RTX 5090和RTX 4090性能對比
但也有現場觀眾對「甲子光年」表示,這些遊戲的測試結果參考價值有待商榷。例如,《瘟疫傳說:安魂曲》這款遊戲在使用了DLSS 3(NVIDIA的深度學習超級採樣技術第三代)和光追技術(RT)的情況下,RTX 5090性能提升也不到50%,其相對於RTX 4090的性能提升低於預期,特別是光柵化性能增長幅度較小,光追性能也沒有充分驗證。
從參數上來說,RTX 5090擁有920億個晶體管,具備4000 AI TOPS(每秒萬億次操作)的性能,能夠實現380 RT TFLOPS(每秒萬億次浮點運算)的光線追蹤性能,具備1.8 TB/s的記憶體頻寬,能夠快速地讀取和寫入數據,具有125 Shader TFLOPS的著色器效能。
與RTX 5090 GPU一同發表的是RTX 50全系列產品,包括RTX 5080、RTX 5070 Ti、RTX 5070等。值得注意的是,與4090發佈時的1599美元相比,售價為1999美元的5090還是漲價了。
同時,搭載了RTX 5070的AI PC也在CES上發表。這台5070筆記型電腦具有與4090相當的性能,但能耗只有4090的一半。
「難以置信對吧,我們把一個4090顯示卡縮小並塞到了這台筆記電腦裡!」黃仁勳有些得意地說。
黃仁勳表示,之所以能實現這項技術,是因為英偉達使用Tensor Core(張量運算核心)產生了大部分像素,先回溯需要的像素,然後再用AI生成其他像素,「能源效率已經超出預期,電腦圖形學的未來是神經渲染,它是人工智慧和電腦圖形學的融合。
RTX 50系列AI PC的價格也隨之公佈,其中搭載了RTX 5090顯示卡的AI PC售價為2899美元。
2.超級晶片隊長
發布完RTX 50系列顯示卡後,黃仁勳話鋒一轉,開始大談AI。
在關於Scaling Law是否「撞牆」的討論絡繹不絕的當下,黃仁勳堅信Scaling Law仍在繼續,而且除了Pre-Training Scaling Law(預訓練縮放定律)之外,還出現了後兩個階段的Scaling Law ,分別是Post-training Scaling law(後訓練縮放定律)和Test-Time Scaling Law(測試時間縮放定律)。
這個表態並不讓人意外,畢竟Scaling Law與英偉達的生意息息相關。
黃仁勳表示,從ChatGPT到OpenAI o1、OpenAI o3、再到Genimi 1.5 Pro,這些新模型的強大能力都印證了Scaling Law的延續。
在演講現場,黃仁勳也向大家展示了包括液冷、風冷、x86伺服器等在內的Blackwell全系列產品。
「當然,我們需要的運算量是驚人的,我們希望社會有能力擴展計算量,以生產越來越多更新、更好的產品。Scaling Law正在推動對Nvidia計算的巨大需求,也推動了對Blackwell架構晶片的巨大需求。
介紹完Blackwell全系列產品後,黃仁勳拿出了一個巨大的晶片,並擺出了一個驚訝全場的造型,儼然成為了漫威電影中的「美國隊長」。
他手上拿的是GB200 NVLink 72的展示樣品。這個巨大的晶圓上有72個Blackwell GPU和144個晶片,擁有14TB的內存,和1.2PB/s的頻寬,AI 浮點性能達到了1.4 ExaFLOPS,與上一代相比每瓦性能提高了4倍。
「基本上全世界的網路流量都能在這個晶片上處理。」儘管聽起來有些誇張,但「超級晶片隊長」黃仁勳就是這麼說的。
3.代理型AI輔助企業工作流程自動化
基座模型是生成式AI的基石。
在演講現場,黃仁勳推出了基於Llama的一系列模型,包括Llama Nemotron Nano、Super和Ultra。它們涵蓋從PC和邊緣設備到大型資料中心等所有領域。
英偉達也發布了運行在NVIDIA RTX AI PC上的基礎模型,可增強數位人、內容創作、生產力和開發能力。
這些模型都以NIM微服務的形式提供。 NIM微服務是由Black Forest Labs、Meta、Mistral 和Stability AI等頂級模型開發人員為RTX AI PC開發的關鍵組件,可部署在RTX PC、工作站和雲端。其用例涵蓋大型語言模型(LLM)、視覺語言模型、圖像生成、語音、用於檢索增強生成(RAG) 的嵌入模型、PDF 提取和電腦視覺等。
同時,NIM微服務也將與頂級AI開發和代理框架相容,包括AI Toolkit for VSCode、AnythingLLM、ComfyUI、CrewAI、Flowise AI、LangChain、Langflow和LM Studio。
總結來看,英偉達為幫助生態系建構代理型AI做了三件事:
Nvidia Nims,它基本上是一個打包好的人工智慧微服務;
Nvidia Nemo,本質上是一個數位員工入職和培訓評估系統,英偉達可以幫助客戶的數位員工(人工智慧代理)做培訓、以適應客戶公司的具體業務;
Nvidia AI Blueprints,它提供了一整套藍圖,用於將PDF轉換為播客,以及另一個用於建立視訊搜尋和摘要的AI代理。此外,還有四個額外的NVIDIA Omniverse藍圖,使開發人員能夠更輕鬆地為實體AI建立可用於模擬的數位孿生。
在發表會現場, 黃仁勳也展示了Project R2X。這是一個支援視覺的PC化身,可以將資訊放在使用者的指尖,協助桌面應用程式和視訊會議通話,閱讀和總結文件等。
4.AI的下一個前沿是物理AI
演講過半,黃仁勳突然向現場觀眾提出了一個問題。
「想像一下,你正在給大模型做上下文提示,按照我的習慣,我可能會在問問題之前上傳幾個PDF檔案。這些PDF被大模型轉換成tokens,因此這些PDF檔案可能會被轉換成數十萬個tokens,並且透過Transformer的每一層進行處理。去某地拿起一個盒子並且把它帶回來怎麼辦?
黃仁勳其實是想引出AI與物理世界的關係。
「甲子光年」去年5月就曾提出,能源、資訊和行為是現代社會和自然界中三個基本而相互關聯的概念——科技的進步,就是三者之間轉化能力加強的反映。隨著AI對物理世界映射能力的不斷優化,將在實踐中建構一條AI影響世界發展的動態平衡線。
圖片來源:《張一甲:AI創生時代,2024中國AI新風向30條判斷》
2024年,讓AI理解物理世界,成為了AI產業界的新浪潮。
曾在英偉達工作的群核科技董事長黃曉煌告訴「甲子光年」:「這幾年隨著深度神經網路的發展,用機器模擬人腦已經獲得了巨大突破,標誌性事件就是ChatGPT的誕生。但我們也意識到,我們發展AI本來是希望AI能取代人類打掃、做家務,現在卻是人類在打掃衛生、做家務,而AI在寫詩作畫。世界的任務,是科技發展的必經之路。」
這次CES上,黃仁勳揭幕了英偉達的下一代重磅產品-Nvidia Cosmos世界基礎模型平台。
世界基礎模型(WFM) ,指的是透過輸入多種模態的資料(包括文字、圖像、視訊和動作)來產生和模擬虛擬世界,從而準確地模擬場景中物體的空間關係及其物理互動的模型。
Nvidia Cosmos是一個用來加速物理AI(能夠讓機器人和自動駕駛汽車等自主機器感知、理解和執行物理世界中的複雜動作的AI)開發的平台,它由一套開源的擴散(Diffusion)和( Auto-regressive)模型組成,用於產生物理感知影片。這些模型在2000萬小時的現實世界人際互動、環境、工業、機器人和駕駛資料之上訓練而成,包含9,000兆個tokens。
該平台將模型分為了三類:
Nano,針對即時、低延遲推理和邊緣部署進行了最佳化的模型;
Super,針對高性能基準模型;
Ultra,針對最高品質和保真度,最適合用於提煉自訂模型。
具身智慧創業家Edward告訴「甲子光年」,他這次最關注的是開源的世界模型,Cosmos World Foundation Model開源模型讓訓練的門檻變低了,對數據的需求減少了,這對於機器人開發非常重要。
「透過『Sim-to-Real』的方式,我們可以更快地實現像自動駕駛領域那樣的突破。特別是英偉達在這方面的優化,讓『Sim-to-Real』的品質更高了,這對整個行業的進展幫助很大。
除了幫助產生大型資料集外,Nvidia Cosmos還能透過將影像從3D擴展到真實場景,縮小模擬與現實之間的差距。將Omniverse(一個用於構建3D應用程式和服務的應用程式介面和微服務開發平台)與Cosmos結合至關重要,透過其高度可控、物理精確的模擬提供關鍵保障,有助於最大限度地減少世界模型常見的幻覺問題。
目前Nvidia Cosmos已在Github上開源。開發人員可以根據自己的需求,直接使用Cosmos平台上的模型來產生基於物理的合成數據,也可以用NVIDIA NeMo框架透過自己的視訊對模型進行微調,以適應特定的實體AI設定。
Nvidia Cosmos主要用於機器人和自動駕駛場景,目前,1X、Agility Robotics等機器人公司和XPENG、Uber和Waabi等自動駕駛公司都已經與Cosmos合作開發模型。
「 The next frontier of AI i s Physical AI 。(AI的下一個前沿是物理AI ) 」這句話,去年年中黃仁勳就說過,這一次在CES 2025,他又一次面向世界強調了一遍。
5.合成數據與新一代智駕晶片
人形機器人是一個380億美元的超級市場,英偉達自然不會放過這個超級風口,很早就發布了一系列機器人基礎模型、數據管線和模擬框架,以加速下一代人形機器人的開發進程。
「通用機器人的ChatGPT時刻即將到來。」黃仁勳在演講中下了判斷。
他宣布英偉達正式推出用於合成運動生成的NVIDIA Isaac GR00T Blueprint,該Blueprint可幫助開發者產生大量的合成運動數據,以便透過模仿學習來訓練人形機器人。
模仿學習是機器人學習的一個子集,它能讓人形機器人透過觀察和模仿人類專家的示範來獲得新技能。在真實世界中收集這些廣泛、高品質的資料集既繁瑣又耗時, 而且成本往往高得令人卻步。透過用於合成運動生成的Isaac GR00T Blueprint,開發者只需少量人類示範,就能輕鬆產生海量的合成資料集。
自動駕駛汽車同樣是英偉達的焦點。在演講中,黃仁勳宣布英偉達推出下一代智駕晶片「Thor」。此前,英偉達Thor晶片原本計劃於2024年年中量產,但後來進度大幅延後。
1月7日,極氪汽車宣布,未來新車型將搭載NVIDIA Thor智駕晶片。此外,極氪與自動駕駛公司Waymo基於SEA-M架構共同開發的全球首款量產原生無人駕駛汽車-ZEEKR RT將在2025年開啟大規模交付。
值得注意的是,在現場公佈的將搭載Thor智駕晶片的車企中沒有蔚來,這或許與蔚來去年7月宣布其自研的智駕晶片「神璣NX9031」正式流片有關。
英偉達也展示了最新的自動駕駛平台-Hyperion 9以及DriveOS系統。 Hyperion 9平台基於英偉達最新的Blackwell架構打造,它配備了12個攝影機、9個雷達、1個雷射雷達、12個超音波感測器,在感測器配置和處理能力上都有顯著提升。
6.全球最小的個人AI超級計算機
在演講的最後,黃仁勳發布了一款令人眼前一亮的產品-AI超級電腦Project DIGITS。
就像變魔術一樣,黃仁勳把一個超級電腦“變小”,然後拿了出來。
該計算機是基於先前的AI超級電腦DGX-1升級而成,但體積更小,功能更強。透過Project DIGITS,使用者可以使用自己的桌面系統開發和運行模型推理,然後在加速雲端或資料中心基礎架構上無縫部署模型。
Project DIGITS搭載了全新的Grace Blackwell超級晶片(GB10),在FP4精度下可以提供高達1千萬億次浮點運算的AI性能。 GB10 採用NVIDIA Blackwell GPU,配備最新一代CUDA核心和第五代Tensor核心,透過NVLink-C2C晶片到晶片互連連接到高效能NVIDIA GraceCPU,其中包括20個採用Arm架構建構的節能核心。
GB10超級晶片讓Project DIGITS僅使用標準電源插座即可提供強大的效能。每台Project DIGITS都具有128GB的統一、一致記憶體和高達4TB的NVMe儲存。借助這台超級計算機,開發人員可以運行多達2000億個參數的大型語言模型,從而增強AI 創新。此外,使用NVIDIA ConnectX網絡,兩台Project DIGITS AI超級電腦可以連接起來,運行多達4050億參數的模型。
正如前文所說,1小時35分鐘的演講,黃仁勳的每一句都像是一枚精準投射的晶片,深深嵌入了觀眾的腦海中。
而這一枚晶片又如同種子一樣在觀眾腦海中快速生根發芽,並開出了未來之花。
這是一種很難用語言形容這樣的感受,直到會場裡的標語提醒了我們--「Step Into Tomorrow」(走向明天)。