2倍RTX 2080 Ti性能RTX 3090 1萬多個核心怎麼來的？

2020-09-03 Comments 0 Comment

NVIDIA的RTX 30系列顯卡今天凌晨發布了，旗艦RTX 3090顯卡雖然價格漲到了1.2萬元，但是性能比RTX 2080 Ti翻倍，簡直是開掛一樣。就跟2018年圖靈GPU發佈時一樣，老黃這次在發布會上再次強調安培GPU是有史以來性能提升最大的一次，這點上也沒錯，畢竟顯卡性能翻倍是這10年來都少見的。

RTX 3090顯卡是怎樣做到性能翻倍的？除了第二代RT單元、第三代Tensor單元之外，CUDA核心數也猛增到了10496個，要知道RTX 2080 Ti也不過4352個。

CUDA核心數一下子從4000+翻倍到了10000+，這規模提升也太恐怖了，NVIDIA到底是怎麼做到的？

特別是在發布之前，連AIC顯卡廠商拿到的數據都顯示RTX 3090是5248個CUDA核心而已，怎麼就一下子翻倍了？

現在NVIDIA還沒公佈安培GPU的架構，具體如何還不好說，不過我們可以分析下幾種可能。

上面是7nm安培GA100的架構圖，每組SM單元中有64個INT32單元、64個FP32單元及32個FP64單元。

8nm安培遊戲GPU跟A100主要架構應該差不多，但是不需要多少FP64單元，多了RT Core光追單元。

所以第一種FP32單元翻倍的可能就是——A100中的FP64單元被遊戲GPU中的FP32取代了，這樣帶來額外一倍的FP32單元。

不過算起來簡單，實際上就不好說了，因為A100是7nm工藝，核心面積依然有826mm，安培遊戲GPU才8nm工藝，晶體管密度更低，280億隻有A100的540億的一半，核心面積會小很多，還要加上RT Core單元，所以這種可能性非常小。

第二種可能在推上有人分析過，那就是遊戲GPU不僅砍掉了FP64單元，同時還做到了INT32單元跟FP32一樣的功能—— 可以同時計算整數或者浮點，這樣一來64個INT32搖身一變也是FP32單元了，直接數量翻倍。

這個可能性比較大，也是NVIDIA之前稱CUDA核心數是5248個，臨到頭改成10496個的合理解釋了。

當然，最後一種可能就是陰謀論了，老黃並沒有做到1萬多個FP32，就是馬甲忽悠——不過真要是這麼做，以後會有法律麻煩，老黃不會這麼輕易讓人抓到把柄的。

總之，在沒有官方公佈的細節之前，1萬多個CUDA核心的由來比較迷，但不論那種解釋，NVIDIA肯定是技術上可以做到，否認也不會有如此大的性能提升了。

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

WONGCW 網誌

記錄生活經驗與點滴

2倍RTX 2080 Ti性能RTX 3090 1萬多個核心怎麼來的？

2020-09-03 Comments 0 Comment

相關

發表迴響取消回覆

分享此文：

相關

發表迴響取消回覆