英特爾解釋Lunar Lake如何在放棄超線程的情況下獲得最佳性能
今年2 月早些時候,一張洩漏的任務管理器截圖顯示,英特爾正在尋求在Lunar Lake 處理器上取消超線程(HT),即該公司對同時多線程(SMT)的稱呼。今天,在Computex 2024 大會上,隨著Lunar Lake 的發布,英特爾證實了它確實在這樣做,並解釋了原因。
如果你還記得,英特爾在第12 代Alder Lake 處理器上推出了性能混合或”大-大”架構,將”大”性能核心或P 核心與”大”效率核心或E 核心相結合,這樣,較重的任務將由P 核心處理,而較輕的工作負載將由E 核心處理。
不過,儘管引入了線程指令硬體調度程序監,英特爾還是注意到了改進的機會,因為作業系統調度程序通常會將任務最後發送給超線程,因為物理內核總是優先處理。
英特爾稱,在Lunar Lake 行動CPU 上,其全新優化的P 核心(不含HT)在單執行緒效能和效率方面有了顯著提升。英特爾表示,超線程技術更適用於多執行緒效能更為重要的應用場景。
下面的幻燈片詳細介紹了英特爾透過禁用HT 在Lunar Lake P 核心上觀察到的性能和能源效率改進:
英特爾補充說,這是其精簡Lunar Lake 架構的更廣泛努力的一部分,即砍掉對所需性能或能源效率無益的部分。英特爾在下面的幻燈片中解釋了這些架構的目標。如果你想知道,Lion Cove 是Lunar Lake P 核架構,而Skymont 是E 核心架構。
Lunar Lake 的另一個變化是引入了新的L0 D 級快取(0 級資料快取)。 Lunar Lake P 核心(Lion Cove)每個核心有2.5MB 的二級快取和多達12MB 的共享三級快取。同時,E 核心(Skymont)擁有4MB 共享二級快取。
它們由四個P 核和四個E 核組成集群,這種8 核混合設計構成了一個Lunar Lake 計算磁碟。它還擁有高達32GB 的內建內存,有助於加快數據存取速度並減少延遲。
英特爾也對英特爾線程指令(ITD)進行了修改。與前幾代產品不同的是,現在只要工作負載可以由E 核處理,ITD 就會將任務優先安排給E 核。據該公司稱,採用這種方法後,Microsoft Teams 的功耗降低了35%。
微軟Windows 核心作業系統資深軟體工程師Tapan Ansel 與Windows 核心作業系統首席軟體工程主管(能源效率)Bret Barkelew 表示:
英特爾執行緒指導技術可識別Lunar Lake 平台上最節能的CPU,Windows 作業系統可利用該技術建立一個”控制區”,將工作限制在這些CPU 上,並保持其他效能優越的CPU 處於停機/閒置狀態,僅在需要時使用。這為團隊視訊會議場景節省了大量功耗,而這些場景都非常適合在Lunar Lake 上的”控制區”內運行。
與流星湖P 核(Redwood Cove)相比,Lunar Lake P 核(Lion Cove)的IPC 提高了14%(AMD 聲稱其新Zen 5 的IPC 提高了16%):
在E 核心方面,英特爾稱Lunar Lake 的Skymont 甚至比Raptor Lake(第13 代)上的P 核還要快;與Meteor Lake 的LP E 核相比,Skymont 快68%,浮點(FP)吞吐量比整數吞吐量有更大的提升。
最後是NPU 或神經處理單元。英特爾公司聲稱,其新的NPU 4 設計有了巨大的改進。我們已經知道,英特爾公司在早些時候發布的一項聲明中已經成功地達到了Copilot+ PC 所需的40 TOPS。
如上圖所示,48 高峰TOPS(pTOPS)比必要的40 TOPS 高出20%,略低於AMD 昨天發布的新Ryzen AI 300 系列的50 TOPS。不過,英特爾宣稱平台總效能(CPU + GPU + NPU)為120 TOPS。而AMD 的”處理器總效能”為80 TOPS。
英特爾表示,由於Lunar Lake 的人工智慧處理能力比Meteor Lake 有了大幅提升,因此Stable Diffusion 在前者上的能源效率也大幅提高。