蘋果M1用著舒服的原因找到了,英特爾:學到了,下次我也用
蘋果M1又快又省電,除了跑分很高之外,實際體驗上也有一種流暢感。原來除了硬件性能強大以外,軟件層面也有優化技巧。一位名叫Hoakley的程序員偶然發現了其中的秘密。這老哥總之是有錢,M1和英特爾版的iMac都買了。業餘時間他喜歡自己開發點實用小工具,比如壓縮軟件。
老哥在後台測試自己的壓縮程序時發現,M1上只有4個核心在跑,還有4個閒著。
換到英特爾上試試,因為還沒用到虛擬核心,是由8個真實核心共同承擔了工作。
回到M1裡仔細一看,使用率高的還不是性能高的那4個,而是“效率核心”。
△4核有難,4核圍觀
在M1芯片的8個CPU核心裡,有4個被稱作“Firestorm”的性能核心,另外4個是“Icestorm”效率核心,性能弱一些,不過功耗更低。
研究了一下,老哥發現是自己把任務優先級設低了,提高以後,就能讓4個性能核心參與進來。
老哥恍然大悟,原來這就是蘋果的策略。
讓優先度低的任務只佔用效率核心,慢點就慢點吧,誰讓你優先度低呢。
性能核心保持空閒狀態,隨時應對突發的高優先度任務。
App啟動速度快,切換流暢的原因找到了:4個高性能的核心一直候著呢。
非對稱核心
MacOS給開發者提供了4種優先級,分別是後台 (background)、實用 (utility)、用戶發起的 (userInitiated)、用戶交互的 (userInteractive)。
如果不指定的話就歸為默認,由操作系統自己安排。
Hoakley老哥把自己的壓縮軟件改造成可以隨時調整優先級的,然後準備了一個10GB的文件開始測試。
在英特爾CPU上,最高優先級完成壓縮需要23.3秒,調成最低優先級需要26秒。
在M1上,最高優先級運行只要14.1秒,調成後台優先級直接漲到101秒。
老哥認為,犧牲一些不重要任務的運行速度,換來的使用體驗上的流暢,太值了。
比如備份文件就不用著急,即使慢到用15分鐘備份不到1G也無所謂。
歷史上也有這樣一個反面教材。
2006年的時候Linux內核引入了一種叫完全公平隊列 (Completely Fair Queuing)的I/O調度機制。
雖然在理論上能提升總體的運行效率,但用戶正需要完成的任務總是有一些延遲才能執行。
因為用戶體驗太差,最終完全公平隊列被大多數Linux發行版放棄了。
不過也有人不喜歡M1的這種機制,他認為在筆記本上這樣做可以延長續航。但台式的iMac上真的要犧牲運行速度嗎?反正都是插電源的。
英特爾:在學了在學了
其實CPU內核分性能核心和效率核心這件事,手機上的Arm芯片早就在做了。
甚至高通還在研發中的驍龍875,被曝光在這種架構基礎上還增加了一個“超大核心”Cortex X1。總共1+3+4構成8個核心。
蘋果M1將Arm平台帶到了PC市場,讓英特爾開了眼。
在CES2021上曝光的12代酷睿Alder Lake,英特爾也宣布要區分兩種核心了。
AMD知道了這個消息後,直接把擠牙膏的Zen3+項目給取消了,轉而全力研發下一代Zen4架構處理器,代號Raphael,預計2022年發布。
不知道AMD會不會選擇跟上這個潮流。