NVIDIA Blackwell GPU首次實測跑分提升多達2.2倍
NVIDIA Blackwell GPU相當強悍,大家都知道,但到底有多強呢?除了官方宣傳數據,現在終於第一次看到了實測數據,來自MLCommons MLPerf v4.1,考察AI訓練推理表現的最佳平台。比較對象為兩代伺服器HGX B200、HGX H200,前者包含多達八顆Blackwell GPU B200,單顆功耗高達1000W。
GPT-3預訓練項目中,Blackwell的表現相比上代Hopper翻了一番。
Llama 2 700億參數微調專案中,Blackwell的性能更是提升了多達2.2倍。
值得一提的是,Blackwell平台具備ConnectX-7 SuperNICs網路卡、Quantum-2 InfiniBand交換機,再加上第五代NVLink互連總線,可以充分保障節點間的通信,可以平衡分配AI訓練負載,整體效率更高。
例如同樣的GPT-3 1750億參數效能,Hopper需要多達256顆GPU,Blackwell就只需要64顆。