Intel預告未來三大至強:144個純小核功耗只需200W
今年3月底的一次研討會上,Intel公佈了2023-2025年至強平台路線圖,首次公佈了未來四款重磅新品的代號、工藝和初步設計。Hot Chips 2023大會上,Intel詳細介紹了其中的三款新至強,包括諸多技術細節,以及性能水平。首先是Emerald Rapids,現有第四代可擴展至強(Sapphire Rapids)的繼任者,命名為第五代可擴展至強。
它在工藝、架構、接口等各方面都保持不變,相當於一個升級增強版,比如頻率更高之類的,但細節暫未公開,預計最多增加到64個核心。
Emerald Rapids目前已經向客戶送樣,將在第四季度按期發布上市。
Emerald Rapids晶圓
Emerald Rapids樣品
明年才是重頭戲,並且首次分兩步走,一個是上半年的純小核Sierra Forest,一個是稍後跟進的純大核Granite Rapids。
之所以會分兩條腿走路,Intel表示,原因主要是市場和客戶需求的變化。
一方面,HPC高性能計算、AI人工智能都屬於計算敏感型應用,依然需要強大的單核、多核性能。
另一方面,更高的核心密度、更高的能效的需求越來越高,傳統的高性能核心難以滿足,而且容易造成浪費。
事實上,AMD這一代霄龍處理器,就是走的這種路線,既有高性能的Zen4架構(最多96核心),也有高密度高能效的Zen4c架構(最多128核心)。
Sierra Forest、Granite Rapids新至強都採用了模塊化SoC設計,一是包含處理器核心、內存的計算模塊,二是負責輸入輸出的IO模塊,彼此分離,再結合EMiB封裝、網格互連接口(mesh fabric interface),可以靈活組合、擴展。
基本單元是核心模塊(Core Tile),包括核心、二級緩存、三級緩存、網格互連接口等部分。
值得一提的是,E核、P核之間共享IP、固件、操作系統、軟件堆棧,開發利用更為簡潔高效。
新至強支持最多12通道的DDR5內存,包括新的MCR DIMM規格,通過多路合併獲得更高帶寬,還有新的Intel Flat Memory技術,可在DDR5、CXL之間實現硬件管理數據轉移,使得內存總容量對軟件可見。
同時支持最多136條PCIe 5.0/CXL 2.0通道,最多6條UPI總線。
E核是全新設計的架構,前端、亂序引擎、標量引擎、矢量引擎、內存子系統等規格模塊都針對能效進行特別優化,同時與P核共享硬件平台、軟件堆棧,還會用上先進的Intel 3製造工藝。
每個E核具備6 4K B一級指令緩存,每2個或4個E核組成一個模塊(Tile),共享最多4MB二級緩存,共享頻率和電壓域,共享網格互連接口,然後所有E核共享三級緩存,平均每4個分配到3MB。
軟件功能支持BF16、FP16數據格式與轉換,支持AVX AI加速等各種現代指令集,以及RAS可靠性、安全特性、虛擬化。
Sierra Forest最多144核心,支持單路、雙路,也就是單系統最多288核心288線程,功耗則低至200W。
對比現有四代至強,它的核心密度增加最多2.5倍,能效則提升最多2.4倍。
P核則是基於成熟架構,針對單核性能優化並提升能效,具備單獨的電源管理控制器,重點改進分支預測、未命中恢復,同樣是Intel 3製造工藝。
每個P核具備64KB 16路一級指令緩存,支持增強型AMX指令、新的FP16浮點指令,號稱混合AI負載性能提升2-3倍。
Granite Rapids則支持單路、雙路、四路、八路,但核心數量暫未公開。
未來,P核、E核至強將分別繼續演化,其中E核的下一代代號Clearwater Forest,有望用上Intel 18A工藝,預計最早2025年面世。