AMD 7nm Radeon Instinct計算卡解析：遊戲卡明年見

2018-11-07 Comments 0 Comment

AMD遊戲顯卡這幾年被嚴重壓制，不過新的大招正在醞釀之中。現在，AMD顯卡率先進入了7nm工藝世代，首先用於Radeon Instinct專業計算卡，新的遊戲卡也將在明年和我們見面。7nm Radeon Instinct系列首發兩款產品，型號分別是MI60、MI50，主打機器學習訓練、高性能領域，也可用於虛擬化、機器學習推理，將在今年底出貨，相關係統和應用明年問世，2020年還有下一代產品。

Radeon Instinct MI60、MI50仍舊基於Vega GPU核心架構，但是一方面升級新工藝，另一方面也針對數據中心應用做了調整優化，包括計算單元、顯存、PCI-E 4.0等等。

14nm Vega 10核心擁有125億個晶體管，核心面積484平方毫米，7nm Vega則增至132億個晶體管(增幅6.4％)，面積卻縮小到331平方毫米(幅度31.6％)，同時只相當於對手( 815平方米的12nm GV100)的大約40％。

新核心對基礎的計算單元進行了針對性的調整增強，比如矢量ALU單元支持16/32/64位操作，同時所有模塊都支持ECC。

它還是世界上第一個顯存帶寬達到1TB/s的GPU，最多32GB HBM2。

架構優化加上頻率提升(具體未公開)，MI60相比於MI25在流處理器相同的情況下，性能提升幅度十分驚人，比如FP16浮點性能快了20％，INT8、INT4整數性能分別快了140％、380％，還有新的指令集，更適合執行機器學習應用。

如果只是進行矩陣乘法運算，MI60只會提升25％以上，但對於Resnet-50這樣的特定應用，提升幅度最高可達2.8倍，非常驚人。

TensorFlow FP32提升幅度在25-50％之間，而且憑藉Infinity Fabric，MI60還支持近乎線性提升的多路擴展，比如四路性能就幾乎是單路的整整4倍。

Vega、EPYC現在都支持PCI-E 4.0，但是平台尚未構建完成，所以八路並行在PCI-E 3.0下性能提升會受到一定的限制，未來都換到PCI-E 4.0還有望更猛。

PCI-E 4.0，7nm Vega是第一個支持的GPU，Rome EPYC則是第一個支持的CPU，二者互相配合，雙向帶寬可達64GB/s，最多可以四塊並行。

Infinity Fabric總線則可以在不同顯卡之間提供200GB/s的帶寬，是PCI-E 3.0的足足6倍，不過注意這裡用了硬件橋接方式互連，目的是更方便地處理超大傳輸數據量。

而得益於對硬件虛擬化的支持(唯一哦)，MI60/56還可以最多八塊卡並行，但實現方式略有不同，每四塊通過Infinity Fabric高速互聯，然後兩組四塊卡再通過PCI-E總線互連。

如果不需要這麼多卡，也可以一塊、兩塊、四塊各自組成虛擬機再並聯於同一個系統內，但注意必須是完全同一型號的卡，不能混用。

MI60是個完全體，集成64個計算單元、4096個流處理器，峰值整數性能INT4 118Tops、INT8 59Tops，峰值浮點性能FP16 29.5TFlops、FP32 14.7TFlops、FP64 7.4TFlops，技術特性支持全芯片ECC錯誤校驗、RAS、PCI-E 4.0、雙鏈路Infinity Fabric，顯存搭配4096-bit 32GB HBM2，帶寬1TB/s，熱設計功耗300W。

MI50精簡到60個計算單元、3840個流處理器，性能降低約9.5％，顯存容量減半至16GB，其他完全同上。

WONGCW 網誌

記錄生活經驗與點滴

AMD 7nm Radeon Instinct計算卡解析：遊戲卡明年見

2018-11-07 Comments 0 Comment

相關

發表迴響取消回覆

2018 年 11 月
一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

分享此文：

相關

發表迴響取消回覆