Intel 12代酷睿細節公開:功耗低至9W、大小核必須配Windows 11才可用
這兩年,Intel越來越「超前」,以往新一代產品發佈才會公佈的諸多技術細節,都會提前幾個月公諸於世。 在今天的年度架構日活動上,Intel就公佈了Alder Lake 12代酷睿的架構、技術細節。 第一篇先來看12代酷睿的整體設計、技術特性、大小核調度,之後我們會單獨分析大核心、小核心的架構設計。
Intel此前的Lakefield處理器第一次採用了大小核混合架構設計(Intel Hybrid Technology),但只是一次試水之作,12代酷睿才是真正的起點。
其中,大核心叫做「性能核心」(Performance Cores),或者「P核心」(P-Cores),Golden Cove架構,最多8核心16線程,AVX-512指令集、DLBoost深度學習加速也只有大核心才支援。
小核心則叫做“能效核心”(Efficiency Ccores),或者”E核心”(E-Cores),Gracemont架構,最多8核心8線程,對不支持超線程。
為了解決大小核調度問題,Intel發明瞭新的「Thread Director」(線程控制器),並與微軟全力合作,搭配Windows 11的任務調度器,將合適的負載分配給不同核心、線程。
12代酷睿都嵌入了一個微控制器,負責監視每個線程的性質和性能需求,衡量其載入、存儲、分支、記憶體訪問延遲、指令類型等,然後報告給Windows 11系統調度器,由後者結合運行環境,將此線程分配到最合適的核心。
Intel宣稱,該技術可以在最短30微秒的時間里確定一個線程的性質、歸屬,而傳統的系統調度器需要上百甚至幾百微秒,還可能分配錯誤。
另外,Thread Director還會針對性地優化頻率,尤其是在移動端,保證效率的同時還能提高能效,而且可以在微秒級別調整頻率。
Windows 10呢? 自然不會有Thread Director,只有一個基礎版的Intel HGS(硬體指引調度),具體細節不詳,但效率肯定不會高到哪裡去。
Linux呢? Intel說目前的優化重點是Windows 11,也會和業界合作對Linux內核進行優化,但需要時間。
12代酷睿將有三種封裝版本:
一是桌面高性能版的LGA1700獨立封裝,也就是S系列,最多8大8小16核心24線程,核顯最對32EU單元,功耗最高125W;
二是移動低功耗版的BGA Type3整合封裝,也就是UP3系列,尺寸50×25×1.3毫米,最多6大8小14核心20線程,核顯最多96EU單元,功耗12-35W(此前曝料還有45/55W);
三是超低功耗版的BGA Type4整合封裝,也就是UP4系列,尺寸28.5×19×1.1毫米,最多2大8小10核心12線程,核顯最多96EU單元,功耗可以低至9W。
三種版本除了核心規模不同,本質上相同的,多個IP模組也是通用的,比如都集成新一代GNA 3.0高斯神經加速器,執行AI加速。
不過,IPU(圖像處理器單元)、雷電4、Wi-Fi 6E都是移動端才有,其中UP3系列支援四個雷電4埠,UP4系列則是兩個。
三級緩存增至最大30MB,而現在的11代移動版最多24MB,桌面版則是只有16MB。
記憶體方面,桌面版同時支援DDR5-4800、DDR4-3200、LPDDR5-5200、LPDDR4X-4266,而且所有版本都是同時支援四種記憶體,硬體層面沒有區別,因此在一些迷你機平臺上,應該會看到直接搭配LPDDR5/4X。
此外,還會支援記憶體的動態電壓頻率縮放,並強化超頻。
但是,移動端的記憶體支援規格沒有公開,估計和桌面版差不多。
PCIe連接方面,桌面版處理器會支援16條PCIe 5.0、4條PCIe 4.0,配套的晶元組(Z690)則最多支援12條PCIe 4.0、16條PCIe 3.0。
這一次Intel可是極為慷慨了,尤其是在PCIe 4.0上被對手搶先,終於扳回了一局,即便是PCIe 5.0全部給顯卡,也可以同時搭配最多四塊頂級SSD。
內部互連方面,12代提供了三種高速通道。
一是Compute Fabric,主要連接CPU核心、高速緩存,頻寬可達驚人的1TB/s,並支援動態緩存優化。
二是Memory Fabric,連接記憶體和其他模組,頻寬最高204GB/s,支援動態位寬和頻率。
三是I/O Fabric,使用者輸入輸出,最高頻寬64GB/s,正好對應PCIe 5.0 x16,支援基於需求的即時帶寬控制。
不過,記憶體頻寬有點疑問:12代酷睿支援128-bit記憶體位寬,可以做到四個32-bit DDR5通道,而要想達到204GB/s的頻寬,必須支援到DDR5-12750的高頻率,但實際只有DDR5-4800,一半都沒有。 暫時還不知道Intel是如何算出這個頻寬數位的。