NVIDIA液冷技術革新:GB200 的挑戰與機會
英偉達(Nvidia) 最近的一個創新與位元和位元組無關。這是一項液冷技術創新。英偉達即將推出的GB200 伺服器機架將主要透過在硬體管道循環的液體、而不是空氣來冷卻,該機架包含英偉達下一代Blackwell 晶片。
英偉達發言人表示,該公司還在與供應商合作開發其他冷卻技術,包括將抽屜大小的整台電腦浸入可吸收和散發熱量的不導電液體中。
液冷已成為高階遊戲電腦的常見配置,但在更大規模應用方面,傳統上液冷僅用於解決最大的問題,例如核電廠。
冷卻系統洩漏是最大的風險。 “但凡有一滴水滴到伺服器上,例如價值數百萬美元的GB200,就可能造成災難性的破壞”,力致科技股份有限公司(Forcecon Technology) 總經理連春源表示,該公司與半導體製造商合作開發冷卻系統。
摩根士丹利最近的一份報告顯示,目前超過95% 的資料中心使用氣冷技術,因其設計成熟、可靠性高。
Super Micro Computer 執行長梁見後說,Super Micro 將在明年交付的約30% 的機架中使用液體冷卻技術。他說,6 月和7 月該公司交付了1,000 多個液冷AI 機架,佔全球新資料中心部署的15% 以上。 Super Micro 表示,其液體冷卻系統使資料中心的功耗降低了30% 至40%。英偉達表示,液冷資料中心可以在相同的空間內容納兩倍的運算硬件,因為氣冷晶片在伺服器上需要更大的空間。
英偉達既製造自己的伺服器,也向其他伺服器製造商供應晶片,這些製造商為開發AI 應用的科技巨頭製造設備。有關冷卻技術的決策往往由這些公司共同做出。
據參與相關計畫的人士透露,總部位於台灣的代工製造商富士康在台灣和墨西哥生產英偉達GB200 系列方面發揮著主導作用。
冷卻問題的敏感度在7 月底凸顯出來,當時社群媒體發文表示GB200 的冷卻系統有洩漏,隨後富士康和兩家冷卻零件供應商的股價下跌了5% 以上。
根據摩根士丹利估計,英偉達GB200 的高階機架的液體冷卻系統成本超過8 萬美元,約為現有搭載英偉達H100 晶片的機架氣冷系統成本的15 到20 倍。