JEDEC發布GDDR7圖形記憶體標準更多技術細節曝光
根據BusinessWire 報導,JEDEC 已發布GDDR7 記憶體標準規格。下一代記憶體將用於顯示卡,AMD、美光、NVIDIA、三星和SK海力士都參與了此事。我們預計GDDR7 將成為高階RDNA 4 和Blackwell GPU 的首選內存,據傳它們將於明年推出,並在我們的最佳顯卡排行榜上爭奪一席之地。
自從第一款顯示卡開始支援GDDR6 記憶體以來,已經過了近六年的時間。這就是NVIDIA 於2018 年9 月推出的RTX 20 系列圖靈架構。首款採用GDDR6 的RTX 2080和RTX 2080 Ti GPU 的記憶體時脈頻率為14 Gbps (14 GT/s),每台裝置可提供56 GB/s 的速度。後來的解決方案(例如AMD 的RX 7900 XTX)的時脈速度高達20 Gbps,速度為80 GB/s。
NVIDIA 協助創建了更快的GDDR6X 替代方案,在RTX 3080中的速度為19 Gbps,最終在最新的RTX 4080 Super中高達23 Gbps 。根據官方說法,美光GDDR6X 晶片的速率高達24 Gbps,每台裝置的速率可達96 GB/s。
GDDR7 將大幅增加頻寬。JEDEC 的規格最終將達到每台設備192 GB/s。計算得出,記憶體速度為48 Gbps,是最快GDDR6X 的兩倍。然而,它達到該速度的方式與先前的記憶體解決方案不同。
GDDR7 將使用三個等級的訊號(-1、0、+1)每兩個週期傳輸三位資料。這是GDDR6 中使用的NRZ(不歸零)訊號的變化,GDDR6 在兩個週期內傳輸兩位。光是這項變更就使資料傳輸效率提高了50%,這意味著基礎時脈不必是GDDR6 的兩倍。
其他變化包括使用獨立於核心的線性回饋移位暫存器訓練模式來提高準確性並減少訓練時間。GDDR7 的獨立通道數量將增加一倍(GDDR6 為4 個,而GDDR6 為2 個),並且將使用PAM3 訊號。
這些都不是新訊息,三星去年7 月透露了許多關鍵的GDDR7 細節。然而,JEDEC 標準的發布標誌著一個重要的里程碑,並表明GDDR7 解決方案的公開可用性和使用迫在眉睫(相對而言)。
NVIDIA 的下一代Blackwell 架構預計在推出時將使用GDDR7。我們可能會在2024 年底推出Blackwell 的資料中心版本,但它將使用HBM3E 記憶體而不是GDDR7。消費級產品很可能會在2025 年初上市,並且像往常一樣,這些零件將會有專業版和資料中心版。AMD 也在開發RDNA 4,我們預計它也將使用GDDR7——不過,如果兩家公司的低端零件出於成本原因仍然選擇堅持使用GDDR6,也不要感到驚訝。
無論哪種情況,AMD 或NVIDIA 在最高速度下使用GDDR7 都可能使用當今最寬的384 位元介面提供高達2,304 GB/s 的頻寬。我們真的會看到這樣的頻寬嗎?也許不是,例如NVIDIA 的RTX 40 系列GPU(配備GDDR6X)都使用略低於最大時鐘的時鐘。儘管如此,我們仍然可以輕鬆地看到即將推出的架構的頻寬翻倍。
這些什麼時候才能真正到達?我們不排除在2024 年底推出的可能性。NVIDIA 的RTX 30 系列於2020 年秋季推出,RTX 40 系列於2022 年秋季推出。AMD 的RX 6000 系列同樣於2020 年底推出,RX 7000 系列於2022 年底推出。如果保持同樣的兩年節奏,我們可以在年底前看到GDDR7 顯示卡。但不要抱太大希望,因為我們仍然認為2025 年初的可能性更大。
JEDEC 發布GDDR7 圖形記憶體標準
微電子產業標準制定的全球領導者JEDEC固態技術協會很高興地宣布發布JESD239圖形雙倍資料速率(GDDR7) SGRAM。JESD239 GDDR7 提供的頻寬是GDDR6 的兩倍,每台裝置的頻寬高達192 GB/s,可滿足圖形、遊戲、運算、網路和AI 應用中對更多記憶體頻寬不斷增長的需求。
JESD239 GDDR7 是首款使用脈衝幅度調變(PAM) 介面進行高頻操作的JEDEC 標準DRAM。其PAM3 介面提高了高頻操作的信噪比(SNR),同時提高了能源效率。透過使用3 個等級(+1、0、-1)在2 個週期內傳輸3 位,而不是傳統的NRZ(不歸零)介面在2 個週期內傳輸2 位,PAM3 提供了更高的數據傳輸速率。循環,從而提高性能。
其他進階功能包括:
具有眼圖掩蔽和錯誤計數器的核心獨立LFSR(線性回饋移位暫存器)訓練模式可提高訓練準確性,同時減少訓練時間;
獨立通道數量增加一倍,從GDDR6 中的2 個增加到GDDR7 中的4 個;
支援16 Gbit 至32 Gbit 密度,包括支援2 通道模式以使系統容量加倍;
透過整合最新的資料完整性功能,包括具有即時報告的片上ECC (ODECC)、資料中毒、錯誤檢查和清理以及帶有命令阻塞的命令地址奇偶校驗(CAPARBLK),滿足RAS(可靠性、可用性、可維護性)的市場需求;
JEDEC 董事會主席Mian Quddus 表示:「JESD239 GDDR7 標誌著高速記憶體設計的重大進步。「隨著向PAM3 訊號的轉變,記憶體產業有了一條新的途徑來擴展GDDR 設備的性能並推動圖形和各種高效能應用的不斷發展。」
「GDDR7 是首款不僅專注於頻寬,而且透過整合最新的資料完整性功能來滿足RAS 市場需求的GDDR,這些功能使GDDR 設備能夠更好地服務雲端遊戲和運算等現有市場,並擴展到AI 、 JEDEC GDDR 小組委員會主席Michael Litt 說。
AMD 運算與圖形技術長兼企業研究員Joe Macri 表示:「今天推出的突破性GDDR7 記憶體標準代表著釋放下一代消費、遊戲、商業和企業設備潛力的關鍵一步。」 「透過利用GDDR7 的變革力量,我們可以共同開啟變革計算和圖形可能性的新時代,為創新和發現塑造的未來鋪平道路。”
「美光在透過JEDEC 定義圖形DRAM 標準方面有著悠久的歷史,並且在與我們的合作夥伴和客戶一起推動GDDR7 標準化活動方面發揮了關鍵作用,」美光運算和網路部門的首席架構師兼傑出技術人員Frank Ross 說。業務單位。“利用多級信令的GDDR 產品的開發有助於確定滿足未來不斷增長的系統頻寬需求的途徑。通過添加領先的RAS 功能,GDDR7 標準可滿足遠遠超出傳統圖形市場的工作負載要求。”
NVIDIA GPU 產品管理副總裁Kaustubh Sanghani 表示:“ NVIDIA很高興我們與JEDEC 的合作幫助PAM 訊號成為GDDR7 的基礎技術,幫助客戶充分發揮GPU 的效能。”
三星執行副總裁兼記憶體產品規劃主管YongCheol Bae 表示:「人工智慧、高效能運算和高階遊戲需要高效能記憶體來以前所未有的速度處理資料。」「GDDR7 32Gbps 將實現1.6 倍的效能提升,同時具有最高的可靠性和成本效益。”
「隨著每一代圖形記憶體的出現,業界始終致力於實現同時確保最高速度和提高能源效率的宏偉目標。SK海力士很榮幸能夠作為JEDEC成員參與GDDR7標準工作,並很高興能夠為客戶提供最高速度和出色功效的記憶體。再次實現標準工作將成為業界擴展記憶體生態系統的新機會。」SK海力士產品規劃副總裁Sang Kwon Lee表示。
GDDR7 更多技術細節曝光:
36Gbps與PAM 3編碼
當三星前年10月嘲笑GDDR7 記憶體的持續開發時, Cadence 並未透露即將推出的規範的任何其他技術細節。但他們最近透露了有關該技術的一些額外細節。事實證明,GDDR7 記憶體將使用PAM3 和NRZ 訊號,並將支援許多其他功能,目標是達到每個引腳高達36 Gbps 的資料速率。
簡短的GDDR 歷史課
在較高的層面上,近年來GDDR 記憶體的發展相當簡單:更新的記憶體迭代提高了訊號速率,增加了突發大小(burst size)以跟上這些訊號速率,並提高了通道利用率。但是這些都沒有顯著增加儲存單元的內部時鐘。例如,GDDR5X 和後來的GDDR6 將其突發大小增加到16 位元組,然後切換到雙通道32 位元組存取粒度。雖然每一代技術都面臨挑戰,但最終行業參與者已經能夠透過每個版本的GDDR 提高記憶體匯流排的頻率,以保持效能的提升。
但即使是「簡單」的頻率增加也越來越變得不那麼簡單了。這促使該行業尋找除了加快時鐘之外的解決方案。
借助GDDR6X,美光和NVIDIA 將傳統的不歸零(NRZ/PAM2) 編碼替換為四級脈衝幅度調變(PAM4) 編碼。PAM4 使用四個訊號電平將有效資料傳輸速率提高到每個週期兩個資料位,從而實現更高的資料傳輸速率。實際上,由於GDDR6X 在PAM4 模式下運行時具有8 個位元組(BL8) 的突發長度(burst length),因此在相同資料速率(或更確切地說,訊號速率)下它並不比GDDR6 快,而是設計為能夠達到比GDDR6 可以輕鬆實現的更高的資料速率。
四級脈衝幅度調變在訊號遺失方面優於NRZ。對於給定的資料速率,由於PAM4 需要NRZ 訊號傳輸波特率的一半,因此產生的訊號損失顯著減少。隨著更高頻率的訊號在通過導線/走線時衰減得更快——而且按照數位邏輯標準,記憶體走線的距離相對較長——能夠在本質上是較低頻率的總線上運行,最終使一些工程和走線更容易實現更高的資料速率。
權衡(trade-off )是PAM4 訊號通常對隨機和感應雜訊更敏感;為了換取較低頻率的訊號,您必須能夠正確識別兩倍的狀態。實際上,這會導致給定頻率下的誤碼率更高。為了降低BER,需要在Rx端進行均衡,在Tx端進行預先補償,這會增加功耗。雖然它未用於GDDR6X 內存,但在更高頻率(例如PCIe 6.0)下,前向糾錯(FEC) 也是一項實際要求。
當然,GDDR6X 記憶體子系統需要全新的記憶體控制器,以及用於處理器和記憶體晶片的全新實體介面(PHY)。這些複雜的實現在很大程度上是四級編碼直到最近才幾乎完全用於高端資料中心網路的主要原因,在這些網路中有支援使用這種尖端技術的利潤。
GDDR7:PAM3 編碼高達36 Gbps/pin
考慮到上述在使用PAM4 訊號或NRZ 訊號時的權衡,事實證明支援GDDR7 記憶體標準的JEDEC 成員反而採取了一些折衷的立場。GDDR7 記憶體設定為使用PAM3 編碼進行高速傳輸,而不是使用PAM4。
顧名思義,PAM3 介於NRZ/PAM2 和PAM4 之間,使用三級脈衝幅度調製(-1、0、+1)訊號,允許它每個週期傳輸1.5 位元(或更確切地說是3 位元以上)兩個週期)。PAM3 提供比NRZ 更高的每週期資料傳輸速率——減少了遷移到更高記憶體匯流排頻率的需要以及由此帶來的訊號遺失挑戰——同時需要比PAM4 更寬鬆的訊號雜訊比。總的來說,GDDR7 承諾比GDDR6 具有更高的效能,同時比GDDR6X 具有更低的耗電量和實施成本。
對於那些記分的人來說,這實際上是我們看到的第二個使用PAM3 的主要消費技術。出於類似的技術原因,USB4 v2(又稱80Gbps USB)也在使用PAM3。那麼PAM3 到底是什麼呢?
PAM3 是一種資料線可以承載-1、0 或+1 的技術。系統所做的實際上是將兩個PAM3 傳輸組合成一個3 位元資料訊號,例如000 是一個-1 後跟一個-1。這變得很複雜,所以這裡有一個表格:
當我們將NRZ 與PAM3 和PAM4 進行比較時,我們可以看到PAM3 的資料傳輸速率處於NRZ 和PAM4 的中間。在這種情況下使用PAM3 的原因是為了在沒有PAM4 需要啟用的額外限制的情況下實現更高的頻寬。
話雖如此,三星承諾的具有36 Gbps 資料傳輸速率的256 位元記憶體子系統將使用多少功率還有待觀察。GDDR7 規範本身尚未獲得批准,硬體本身仍在建置中(這正是Cadence 等工具發揮作用的地方)。但請記住,AI、HPC 和圖形的頻寬需求量很大,頻寬將永遠受到歡迎。
優化效率和功耗
除了提高吞吐量外,GDDR7 有望採用多種方式來優化記憶體效率和耗電量。特別是,GDDR7 將支援四種不同的讀取時鐘(RCK) 模式,以便僅在需要時啟用它:
始終運行:始終運行並在睡眠模式下停止;
禁用:停止運轉;
Start with RCK Start command:主機可以在讀出資料之前透過發出RCK Start指令來啟動RCK,並在需要時使用RCK Stop指令停止。
Start with Read:當DRAM 收到任何涉及讀出資料的命令時,RCK 會自動開始運作。它可以使用RCK Stop 指令停止。
此外,GDDR7 記憶體子系統將能夠並行發出兩個獨立的命令。例如,Bank X 可以透過在CA[2:0] 上發出Refresh per bank 指令來刷新,而Bank Y 可以透過同時在CA[4:3] 上發出讀取指令來讀取。此外,GDDR7 將支援線性回授移位暫存器(LFSR) 資料訓練模式,以確定適當的電壓位準和時序,以確保一致的資料傳輸。在這種模式下,主機將追蹤每個單獨的眼睛(連接),這將允許它應用適當的電壓以更好地優化功耗。
最後,GDDR7 將能夠根據頻寬需求在PAM3 編碼和NRZ 編碼之間切換。在高頻寬場景中,將使用PAM3,而在低頻寬場景中,記憶體和記憶體控制器可以切換到更節能的NRZ。
雖然GDDR7 承諾在不大幅增加功耗的情況下顯著提高效能,但技術觀眾最大的問題可能是新型記憶體何時可用。由於沒有來自JEDEC 的硬性承諾,因此沒有預計GDDR7 發布的具體時間表。但考慮到所涉及的工作和Cadence 驗證系統的發布,預計GDDR7 將與AMD 和NVIDIA 的下一代GPU 一起進入現場並不是沒有道理的。請記住,這兩家公司傾向於以大約兩年的節奏推出新的GPU 架構,這意味著我們將在2024 年稍後開始看到GDDR7 出現在設備上。
當然,鑑於如今有如此多的AI 和HPC 公司致力於頻寬需求高的產品,其中一兩家可能會更快發布依賴GDDR7 顯存的解決方案。但GDDR7 的大規模採用幾乎肯定會與AMD 和NVIDIA 的下一代圖形卡的量產同時發生。