Intel Xe獨立顯卡揭秘:一個架構通吃、最多1000個單元
Intel今天正式公佈了正在研發中的通用型GPU Ponte Vecchio,7nm工藝製造,Foveros 3D、EMIB封裝,Xe全新架構,支持HBM顯存、CXL高速互連等技術,面向HPC高性能計算、AI人工智能等領域。
事實上,Intel Xe GPU架構是一個非常靈活、擴展性極強的統一架構,並針對性地劃分成多個微架構,從而可用於幾乎所有計算、圖形領域,包括百億億次高性能計算、深度學習與訓練、雲服務、多媒體編輯、工作站、遊戲、輕薄筆記本、便攜設備等等。
Intel還將Xe GPU劃分成了三個檔次:
1、Xe LP(低功耗):用於集成核顯、入門級獨顯,典型功耗5-20W,最高可擴展到50W。
2、Xe HP(高性能):用於主流和發燒消費市場、數據中心和AI領域,典型功耗75-250W。
3、Xe HPC(高性能計算):用於超級計算機等,功耗暫無具體數值但基本不會有什麼限制。
Intel首席架構師Raja Koduri透露,Xe GPU最初只設計了LP、HP兩個微架構,後來發現HPC領域也有很大的機遇,就增加了一個,也是這次介紹的重點,可以打造百億億次超算平台,比如美國能源部旗下的“極光”(Aurora)就用了它和未來的10nm可擴展至強。
Raja還聲稱,Xe HPC可以擴展到多達1000個EU執行單元,而且每個單元都是全新設計的,FP64雙精度浮點計算能力是現在的40倍。
Xe HPC架構中,EU單元對外通過XEMF(Xe Memory Fabric)總線連接HBM高帶寬顯存,同時集成大容量的一致性緩存“Rambo”,CPU和GPU均可訪問,並藉此將多個GPU連接在一起,提供極致的顯存帶寬和FP64浮點性能,且支持顯存/緩存ECC糾錯、至強級RAS。
封裝方面,EMIB用於連接GPU與HBM,Foveros則用於互連Rambo緩存,由多個GPU在同一中介層上共享。二者都會大大提升帶寬效率和密度。
Xe HPC將採用Intel 7nm工藝製造,官方稱新工藝會加入EUV極紫外光刻技術,相比於10nm晶體管密度翻番,同時設計規則復雜度只有四分之一,而且規劃了跨節點工藝優化,也就是會有更好的7nm+、7nm++。
當然,Intel早就說了第一款Xe顯卡會是10nm工藝,只是這次沒有給出更具體的消息,估計會在明年先推出10nm工藝、面向主流和發燒遊戲市場的產品,後年再拿出7nm工藝、面向數據中心和高性能計算的版本。