HBM4最終可將內存帶寬再提高一倍達到2048 位
高帶寬內存(HBM)的首次迭代受到一定限制,每個堆棧的速度最高只能達到128 GB/s。但有一個主要的注意事項:由於物理限制,使用HBM1 的顯卡內存上限為4 GB。 隨著時間的推移,SK Hynix 和三星等HBM 製造商改進了HBM 的缺點。第一次更新,即HBM2,將潛在速度提高了一倍,達到每堆棧256 GB/s,最大容量達到8 GB。2018 年,HBM2 又進行了小幅更新(HBM2E),容量限制進一步提高到24 GB,速度也再次提升,最終達到每芯片460 GB/s 的峰值。HBM3 推出後,速度再次翻倍,每個堆棧的最高速度可達819 GB/s。更令人印象深刻的是,容量增加了近三倍,從24 GB 增加到64 GB。與HBM2E 一樣,HBM3 也迎來了另一次中期升級,即HBM3E,將每個堆棧的理論速度提高到1.2 TB/s。隨著時間的推移,消費級顯卡中的HBM 逐漸被價格更有競爭力的GDDR 內存所取代。高帶寬內存成為數據中心的標準配置,工作場所顯卡製造商選擇使用速度更快的接口。在各種更新和改進中,HBM 在所有迭代中都保留了相同的1024 位(每個堆棧)接口。根據來自韓國的一份報告,當HBM4 進入市場時,這種情況可能最終會改變。如果報導屬實,內存接口將從1024 位翻番至2048 位。理論上,跳轉到2048 位接口可以使傳輸速度再次翻番。遺憾的是,與HBM3E 相比,內存製造商可能無法使用HBM4 保持相同的傳輸速率。不過,更高的內存接口可以讓製造商在顯卡中使用更少的堆棧。例如,NVIDIA 的旗艦AI 顯卡H100 目前使用6 個1024 位的已知良好堆疊裸片,從而實現了6144 位的接口。如果內存接口翻倍至2048 位,理論上NVIDIA 可以將芯片數量減半至三個,並獲得相同的性能。當然,目前還不清楚製造商們會採取哪種方式,因為HBM4 幾乎肯定要在數年後才能投入生產。目前,SK 海力士和三星都認為,當他們開始生產HBM4 時,將能實現”100% 的良品率”。只有時間才能證明這些報導是否站得住腳,因此請謹慎對待這些消息。