Intel Xe獨立顯卡揭秘：一個架構通吃、最多1000個單元

Intel今天正式公佈了正在研發中的通用型GPU Ponte Vecchio，7nm工藝製造，Foveros 3D、EMIB封裝，Xe全新架構，支持HBM顯存、CXL高速互連等技術，面向HPC高性能計算、AI人工智能等領域。

事實上，Intel Xe GPU架構是一個非常靈活、擴展性極強的統一架構，並針對性地劃分成多個微架構，從而可用於幾乎所有計算、圖形領域，包括百億億次高性能計算、深度學習與訓練、雲服務、多媒體編輯、工作站、遊戲、輕薄筆記本、便攜設備等等。

Intel還將Xe GPU劃分成了三個檔次：

1、Xe LP(低功耗)：用於集成核顯、入門級獨顯，典型功耗5-20W，最高可擴展到50W。

2、Xe HP(高性能)：用於主流和發燒消費市場、數據中心和AI領域，典型功耗75-250W。

3、Xe HPC(高性能計算)：用於超級計算機等，功耗暫無具體數值但基本不會有什麼限制。

Intel首席架構師Raja Koduri透露，Xe GPU最初只設計了LP、HP兩個微架構，後來發現HPC領域也有很大的機遇，就增加了一個，也是這次介紹的重點，可以打造百億億次超算平台，比如美國能源部旗下的“極光”(Aurora)就用了它和未來的10nm可擴展至強。

Raja還聲稱，Xe HPC可以擴展到多達1000個EU執行單元，而且每個單元都是全新設計的，FP64雙精度浮點計算能力是現在的40倍。

Xe HPC架構中，EU單元對外通過XEMF(Xe Memory Fabric)總線連接HBM高帶寬顯存，同時集成大容量的一致性緩存“Rambo”，CPU和GPU均可訪問，並藉此將多個GPU連接在一起，提供極致的顯存帶寬和FP64浮點性能，且支持顯存/緩存ECC糾錯、至強級RAS。

封裝方面，EMIB用於連接GPU與HBM，Foveros則用於互連Rambo緩存，由多個GPU在同一中介層上共享。二者都會大大提升帶寬效率和密度。

Xe HPC將採用Intel 7nm工藝製造，官方稱新工藝會加入EUV極紫外光刻技術，相比於10nm晶體管密度翻番，同時設計規則復雜度只有四分之一，而且規劃了跨節點工藝優化，也就是會有更好的7nm+、7nm++。

當然，Intel早就說了第一款Xe顯卡會是10nm工藝，只是這次沒有給出更具體的消息，估計會在明年先推出10nm工藝、面向主流和發燒遊戲市場的產品，後年再拿出7nm工藝、面向數據中心和高性能計算的版本。

WONGCW 網誌