黃仁勳SIGGRAPH演講:GH200、L40S顯卡、ChatUSD輪番登場
英偉達聯合創始人兼CEO黃仁勳時隔5年再度登上SIGGRAPH的舞台發表主旨演講,期間提及一系列與生成式AI浪潮息息相關的硬件和軟件服務。SIGGRAPH由ACM SIGGRAPH(計算機協會計算機圖形圖像特別興趣小組)舉辦,是計算機圖形學的年度頂級會議。
對於再度登上SIGGRAPH的舞台,黃仁勳也是頗為感慨。他回憶稱,2018年正是在SIGGRAPH的舞台上,他發布了能夠在實時渲染中完成光線追踪的RTX平台,那也是英偉達的“賭命時刻”。時過境遷,當年發布顯卡時他可以把顯卡拿在手上展示,現在由Grace Hopper芯片組成的產品只能放在台子上展示了。
(來源:直播視頻)
“買得越多、賺得越多”的GH200
黃仁勳也再度提到今年5月台北電腦展上發布的GH200系統,同時通過動畫展示瞭如何使用NVLink等技術,將Grace Hopper超級芯片與HBM3e高速連接,並構建出一整套為生成式人工智能打造的超級計算機。
順便一提,最後的圖片是按照實物大小展示,中間那個影子就是黃仁勳。這套系統能夠無縫連接256個Grace Hopper超級芯片——對應的是1 EFLOPS的AI算力和144TB的高速存儲。
黃仁勳還順便解釋了一下GH200“買得越多、賺得越多”這件事情。作為比較,同樣使用1億美元打造數據中心,可以買下8800個x86的CPU或2500套GH200,但後者的AI算力是前者的12倍,同時能耗也更低。
反過來算,只需要花800萬美元採購210套GH200,就能達到與1億美元CPU數據中心同等的AI算力。
Omniverse
Omniverse是Nvidia創建的實時3D圖形協作平台,主要的功能就是創建“數字孿生”,在虛擬世界中模擬現實。
在周二的演講中,黃仁勳也拿世界最大廣告公司WPP和比亞迪(騰勢汽車),作為Omniverse雲和生成式AI的使用案例。WPP通過Omniverse為騰勢N7打造了一個實時、囊括各種外觀配置的汽車“數字孿生”,並能夠通過Adobe等提供的AIGC功能修改宣傳材料的圖像背景。
Hugging Face
在這一輪AI浪潮中脫穎而出的共享機器學習模型和數據集平台Hugging Face(俗稱“抱抱臉”)也出現在周二的舞台上。黃仁勳宣布,英偉達已經與Hugging Face達成合作協議,幫助該社區推出一項AI模型訓練服務,背後自然有英偉達DGX雲的支持。
AI 工作台
隨著各種模型的開髮變得日常工作,開發者也有在不同設備間同時開發大模型的需求。一個統一,且能調用不同算力、同步微調結果的“AI工作台”應運而生。通過AI工作台,開發人員能夠在PC或工作站上快速創建、測試和自定義預訓練的生成式AI模型,然後將其擴展到幾乎任何數據中心或者公共雲上。
另外,英偉達也發布了最新版本的企業軟件平台NVIDIA AI Enterprise 4.0,為企業用戶提供生成式人工智能所需的工具。
L40S顯卡、新工作站和服務器
對於那些想要配置本地算力資源的個人和創業公司而言,英偉達也在周二發布了新的工作站產品,每個工作站最多可以塞進去四張NVIDIA RTX 6000顯卡,對應的參數為5,828 TFLOPS AI算力和192GB顯存。黃仁勳介紹稱,用這台機器,微調400億參數的GPT-3大概只需要15個小時。
在這裡,黃仁勳再一次強調“買得越多、賺得越多”,直言像這樣的工作站,用來開發大模型,幾個月就能把本金賺回來了。
英偉達也在周二發布了基於Ada Lovelace架構的新顯卡L40S。官方數據介紹稱,與A100相比,L40S的生成式AI推理性能提高最多1.2倍,訓練性能提高最多1.7倍。L40S 包含18,176 個CUDA內核,單精度浮點(FP32) 性能是A100的近5倍。
隨後,黃仁勳也把遮在台上的黑布揭開,展示了一系列新的OVX服務器產品。新的OVX系統最多可以裝8張L40S顯卡,每張顯卡擁有48GB的顯存。黃仁勳也強調,這些服務器設計時的用途,並不是用來訓練最尖端的大模型(例如GPT-4),而是用來運行從“抱抱臉”上下載的主流大模型。
與前面提到的工作站相比,這些服務器微調400億參數的GPT-3大概只需要7個小時。
通用場景描述
通用場景描述(OpenUSD)是一種高性能3D場景描述技術,對於3D交互而言,類似於超文本標記語言(HTML)與2D網頁之間的關係。這項技術最早在2015年由皮克斯動畫工作室創造,並在2016年開源。英偉達的Omniverse也正是以OpenUSD作為基礎,以成為連接各類3D製作工具的平台為願景來開發。
黃仁勳在周二宣布,英偉達將為開發者和公司提供廣泛的框架、資源和API服務,以加速OpenUSD的採用,並推出ChatUSD來幫助開發者利用自然語言實現一系列場景的調整。