NVIDIA首批Blackwell GB200 NVL72伺服器機架頂著散熱問題報告出貨
據報道,英偉達公司的Blackwell NVL72 伺服器機架正面臨散熱問題,而該公司已開始向市場供應主流產品。繼架構缺陷之後,NVIDIA的Blackwell現在又面臨伺服器機架設計問題,但首批採用液冷技術的NVL72 AI伺服器機架已開始出貨。
NVIDIA的Blackwell架構儘管被寄予厚望,但從一開始就成為了開發障礙的受害者。 最初,有消息指出Blackwell晶片面臨板載互連技術的問題,最終促使台積電等供應鏈公司修改了生產方法。 這個問題不僅限制了Blackwell 的供應,而且現在,根據The Information的報導,NVIDIA 似乎再次面臨另一個障礙。
報告稱,Blackwell 的伺服器機架是一個平台,多個Blackwell 介面相互堆疊,組合成”GB200″AI 伺服器。 據說,問題明顯出現在更高階的NVL72 配置的Blackwell 伺服器上,據說從創造收入和客戶利益的角度來看,這對英偉達來說是更”重要”的配置。 如果問題持續存在,鑑於NVL72 伺服器的需求量很大,我們可能會對英偉達的伺服器營收前景持看淡態度。
英偉達對此回應,公司正在與領先的雲端服務供應商合作,” 這是我們工程團隊和流程不可分割的一部分。工程迭代是正常的,也是意料之中的。”
目前還沒有具體說明是哪方面的原因導致了這一問題,但據稱這一問題可能源於所使用的冷卻方法,英偉達已經敦促其供應商立即解決這一問題,因為它已經嚴重擾亂了供應鏈。
鑑於NVIDIA擁有龐大的資源和廣泛的供應鏈結構,我們懷疑這個問題不會持續太久,因為製造商很可能正在修改伺服器機架的設計。
有趣的是,英偉達公司的核心合作夥伴戴爾公司已經開始出貨Blackwell 伺服器機架,特別是PowerEdge XE9712 伺服器,這是業界首批企業級英偉達GB200 NVL72 伺服器。 因此,除非伺服器機架問題解決,否則英偉達最有可能採取的措施就是在初期限制供應。
儘管存在暫時的障礙,英偉達的Blackwell產品線仍將成為公司歷史上”最成功”的產品,預計將創造數十億美元的收入。 隨著市場傾向於建立”人工智慧叢集”,這推動了對該架構的巨大需求,並最終轉化為更高的營業額。