Ampere架構和RDNA 2架構顯存延遲測試Infinity Cache顯示優勢

2021-04-21 Comments 0 Comment

經過了多年的發展，GPU也具備了多層緩存的結構。這些精心設計的緩存架構，可以填補顯存和計算單元之間讀寫速度不匹配的矛盾，與CPU的緩存有類似的作用。由於GPU架構的不同，不同芯片設計廠商對其緩存的設計也不一樣。在Ampere架構上，英偉達仍然堅持使用相對傳統的L1和L2緩存兩級結構。

AMD在RDNA 2架構上，則採用了L0、L1、L2和Infinity Cache，事實上Infinity Cache是充當了L3緩存的角色。近期Chips and Cheese發布了一項新研究，比較了英偉達與AMD最新顯卡的顯存延遲情況。

Chips and Cheese採用了OpenCL編寫的指針追踪基準，用於評估GPU顯存緩存中的延遲。在測試裡，使用的是Radeon RX 6800 XT和GeForce RTX 3090顯卡。測試結果表明，RDNA 2架構比Ampere架構具有更低的顯存延遲。

在測試中，英偉達GA102的L1和L2緩存之間的延遲超過了100ns，而AMD Navi 21的L0至L2緩存之間的延遲為66ns，加上Infinity Cache僅增加了20ns的額外延遲。這可能可以解釋為什麼RDNA 2架構在較低分辨率的時候會有更出色的性能表現，而Ampere架構需要更多並行運算才能有更好的發揮。

無論英偉達還是AMD，都注意到了大型高效緩存的重要性。英偉達GA100（Ampere）的L2緩存已經增加到了40MB，是GV100（Volta）的七倍。AMD則率先使用了高帶寬的設計，類似的結構也有用於CDNA架構的Instinct系列，在Radeon RX系列中（RDNA）為遊戲開發了Infinity Cache。

Chips and Cheese還比較了英偉達和AMD較老的一些架構，總體而言都在不斷改善。不過AMD每一代架構都隨有一定程度的降低，相對來說更明顯。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

WONGCW 網誌

記錄生活經驗與點滴

Ampere架構和RDNA 2架構顯存延遲測試Infinity Cache顯示優勢

2021-04-21 Comments 0 Comment

相關

發表迴響取消回覆

分享此文：

相關

發表迴響取消回覆