Intel Lunar Lake架構全公開:功耗大降40%、E核心效能飆漲4倍
日前,Intel官方宣布了下一代低功耗移動平台Lunar Lake,也就是第二代酷睿Ultra的一部分(還有高性能的Arrow Lake),現已量產,將在第三季度正式發布上市,20多家廠商的80多款筆記本新品蓄勢待發。
現在,Intel完全公開了Lunar Lake的架構設計細節,涵蓋模組化結構、封裝製程、P性能核、E能源效率核、混合架構與執行緒調度、GPU核顯、NPU AI引擎、平台連接等部分。
我們逐一來看。
【模組化與封裝】
首先說一句,Intel尚未明確公佈Lunar Lake的製造工藝,目前第三方說法是主要採用台積電N3B,也就是台積電第二代3nm。
不過Intel強調,如今的處理器設計理念是架構、製程彼此99%的解耦分離,不再互相依賴,可以各自獨立推進路線圖。
Lunar Lake延續了Meteor Lake的分離式模組化設計,但又截然不同,首先是簡化為計算模組(Compute Tile)、平台控制器模組(Platform Controller Tile)兩大部分,角落裡還有個填料模組( Filler Tile),沒有實際電路和功能,只是將整體湊成一個方形以確保結構強度。
它們透過底部的基礎模組,結合Foveros封裝工藝,組合在一起。
其次,Lunar Lake也整合封裝了兩顆記憶體。
計算模組內包含最多四個P核心、最多四個E核心、GPU核顯、媒體引擎、顯示引擎、IPU影像處理單元、NPU AI單元、NOC、MSC(記憶體側快取)等。
其中,MSC緩存最大容量8MB,獨立於二三級緩存,主要用於IO引擎的快取配合,可減少對系統記憶體的依賴,提升延遲與頻寬。
平台運算模組則包含PCIe 5.0/4.0控制器、雷電4控制器(無雷電5)、USB控制器、Wi-Fi與藍牙控制器、安全引擎等。
注意,Meteor Lake上的超低功耗E核取消了,因為它改變了模組組合,並且引入了新的「低功耗島」(Low Power Island),不再是單一物理模組管理節能,而是將是所有可節能的模組納入統一管理,整體按需開關,效率更高。
運算模組內部透過Home Agent、Coherency Agent等連接主要單元,平台控制器模組內部也有IO Coherency,確保彼此一致性地高效通訊。
而在兩大模組之間,透過可擴展的第二代交叉總線,以及D2D介面進行彼此互連,這相比Lunar Lake的四大模組更加簡單高效。
這是Intel第一次在處理器內部封裝整合內存,稱為“Memory on Package”,也就是“封裝級內存”(MOP)。
它採用的是LPDDR5X規格,最高頻率8500MHz,每顆晶片四個16-bit通道,總容量最高32GB。
官方表示這種設計可以節省40%的功耗,並節省多達250平方毫米的主機板面積,從而可以顯著提升電池續航,並留出空間給筆記本的其他設計。
但要注意,Lunar Lake筆記本不再支援獨立的SO-DIMM內存,不能擴展和升級。
值得一提的是,Lunar Lake也設計了全新的獨立電源管理單元,總共四組,可以提供更多供電電路,動態調節電壓。
【P性能核與E能效核】
這是P核結構簡圖,代號Lion Cove,在微架構上進行了全面的徹底改進,大幅提升IPC並增強可擴展性,優化了每瓦性能(尤其是單線程),以及單位面積的性能。
它共有多達18個執行端口,吞吐量和效率更高,預測寬度也提升了8倍。
快取系統大為增強,每核心一級資料快取48KB,一級指令快取192KB,二級快取最多達2.5MB(Arrow Lake上最多3MB),同時所有核心共享最多12MB三級快取。
頻率控制也更加精細,間隔從100MHz大幅縮小到16.7MHz,效果自然是能源效率更高。
官方宣稱,新性能核的IPC性能比上代有著平均14%的提升,而且功耗越低,提升越明顯,超低功耗下可達18%。
如果頻率也能進一步提升,性能自然會更好,這一點要到後續公佈具體型號規格的時候才知道了。
E能源效率核代號Skymont,也是全新設計的,號稱Intel最節能的架構。
它重點擴展了工作範圍、提升了多線程效能,也提高了整體的擴展性,以及加強預測以快速尋找指令、調度端口增至26個、隊列加深以更快並行處理、分配和回退加快等等,
透過四個128位元FP浮點單元和SIMD向量單元,帶來了兩倍的向量效能和AI吞吐量,可以更好地執行VNNI,對於AI PC的整體表現提升有很大裨益。
快取機制與P核心截然不同,每個核心有32KB一級資料緩存,所有核心共享最多4MB二級緩存,沒有自己的三級快取。
單執行緒效能可以在1/3的功耗下,平均提升多達68%,最高可接近翻倍。
多執行緒效能方面,四個E核心組成一個集群,相較於Meteor Lake上的雙核心集群,只需要1/3的功耗,就能帶來2.9倍的效能,單純比較效能更是最高可以帶來驚人的4倍提升。
P、E核組合,前者峰值性能提升超過50%,後者能源效率提升20-80%,可以更靈活地適應對高性能、低功耗等不同應用場景的需求,覆蓋各種能源效率範圍。
針對混合架構的調度,Intel 12代酷睿就引入了硬體執行緒調度器(Thread Director),Lunar Lake上進行了全新升級,結合作業系統的調度器,帶來了動態的調度策略、增強的演算法、更精細的控制等。
還設置了作業系統隔離區,加強了電源管理,可以將應用程式能效降低多達35%。
P核和E核之間,只要工作負載合適,就會首選分配給單一P核,多執行緒負載時擴展到其他能源效率核,並按需導向性能核。上圖就是Office辦公室下的核心調度實例。
此外,Intel也給予了OEM廠商更大的彈性,可以選擇設定效能模式、能源效率模式。
【GPU核顯】
Lunar Lake的核顯升級為第二代Xe2微架構,也就是和即將發布的Battlemage獨立顯示卡是同宗同源的,只是針對低功耗、高能效進行了最佳化。
Xe2 GPU架構引進了8個第二代Xe2核心、全新的XMX引擎(INT8整數操作每秒4096和FP16浮點操作每秒2048)、最多8個更強的光追單元、更大的XeSS核心、 Xe2向量引擎(優化能效和AI性能)、8MB二級快取、eDP 1.5視訊輸出等等。
官方稱其性能提升了多達50%,AI算力也高達67TOPS。
全新的媒體引擎支援AV1硬體編解碼、H.266/VVC視訊硬解碼。
其中VVC,一如之前從H.264到H.265/HEVC,可以在保持同等畫質的前提下繼續降低碼率、文件體積,並支持自適應分辨率碼率,更加靈活,還支持屏幕內容編碼流(SCC)、360度全景碼流。
顯示引擎支援HDMI 2.1、DP 2.1、eDP 1.5,最多三個螢幕,其中eDP 1.5自然是配合筆記本自帶螢幕,可以更好地適應螢幕自刷新以進一步節能,使用提前傳輸進行選擇性的顯示內容更新。
【NPU AI引擎】
NPU AI單元別看是第二次獨立提出,但是按照Intel的技術演進,號稱已經是4.0版本(背刺隔壁第三代),在設計理念上增加大小以適應下一代AI負載,提升頻率和能效,並針對現代AI進行最佳化以高效地運行新的大語言模型和Transformer。
NPU 4配備了6個神經運算引擎、12個增強的SHAVE DSP、能源效率優化的MAC陣列,帶來了2倍的頻寬和48TOPS的算力,峰值效能提升可多達4倍。
相較於AMD Strix Point也就是銳龍AI 300系列的第三代NPU,算力略遜了一籌,後者達到了50TOPS。
Lunar Lake處理器的整體算力將達到120TOPS,其中NPU適用於持續性的AI負載,能源效率非常高,GPU適合高效能的遊戲和創作AI應用,CPU算力只有5TOPS,適合輕型、通用型AI負載。
AMD尚未公佈銳龍AI 300系列中CPU、GPU的算力,整體孰強孰弱還有待觀察。
【平台連接】
IO與連接方面,Lunar Lake提供最多四個PCIe 5.0、四個PCIe 4.0匯流排通道,可連接兩塊SSD,或一塊SSD和其他擴充。
無線升級到了Wi-Fi 7(5G Gig),最高速率達5.8Gbps,還有藍牙5.4。
當然更少不了Intel獨家的雷電4,頻寬40Gbps,最多三個連接,而且支援新的雷電共享技術,可以在不同PC之間快速分享、傳輸、控制。
【產品上市】
這就是Lunar Lake在架構設計上的主要情況了,可以說進步是方方面面的,就看最終的實際效能表現了。
Intel已經向廠商和開發者提供一個迷你機形式的開發套件,但沒有公佈具體情況,而且Intel也不再做NUC迷你機了,殊為可惜。
今年第三季開始,我們將看到超過20家廠商的超過80款Lunar Lake筆電陸續上市。
AI PC應用也快速豐富起立,Intel平台上已有100多家廠商的300多個AI軟體功能,優化的大模型也已超過500個。
Intel預計到2027年,將近60%的新PC,都會是AI PC。
M eteor Lake第一代酷睿已出貨800多萬顆,產品設計超過230款,遍布48個國家和地區。
Lunar Lake之後,今年晚些時候,我們將看到高性能的Arrow Lake,同樣基於Lion Cove、Skymont混合架構,但更加強大,並首次採用Intel 20A製造工藝。
明年,我們還會看到下一代Panther Lake,再往後則是Nova Lake…