Intel 10nm至強隆重登場:性能飆升46%、40核心碾壓64核心
說到處理器,對於大眾用戶而言,關注最多的自然是距離最近的桌面、筆記本消費級產品,而作為廠商最新技術的最強代表,服務器、數據中心才是真正的殺場。3月16日,AMD發布了第三代霄龍7003系列(代號Milan),擁有7nm工藝、Zen3架構、64核心128線程等傲人規格。近幾年,AMD在數據中心領域也是不斷取得突破,市場份額已經從當初的0.7%,來到了7%之上。
但在這個龐大的市場上,Intel依然是王者一般的存在。雖然單看產品性能參數可能有些不敵,但無論是多達13倍的市場份額領先,還是全面豐富的技術特性,抑或更廣闊的生態應用系統,都不是一個數量級。
事實上,這麼多年來,Intel至強幾乎已經等於服務器、數據中心的代名詞,2013年至今累計雲端部署超過10億個核心,雲服務商超過800家,發展了三代的可擴展至強累計出貨也已超過5000萬顆。
現在,Intel終於帶來了第三代至強可擴展平台Ice Lake-SP,再次將自己的優勢展現得淋漓盡致,尤其是豐富的產品矩陣。
本次中國區發布會選在了首鋼園三高爐,頗有賽博朋克氣息,也是冬奧會場地,往昔與未來在這裡交織
Intel副總裁兼中國區總經理王銳發表主題演講
新至強擁有全新的10nm製造工藝、最多40核心80線程、全新Sunny Cove CPU架構、20% IPC性能提升、46%平均性能提升、74% AI推理性能提升,堪稱Intel至強近年來最大的一次飛躍。
但是,新至強不是單打獨鬥,周邊圍繞著Intel GPU、XPU、FPGA、內存、存儲、連接、安全等等各條產品線和技術,從而構成一個軟硬結合的完整解決方案。
此前已經陸續發布的傲騰持久內存Pm200系列、傲騰SSD P5800X、閃存SSD D5-P5316/D7-P5510、20萬兆以太網卡E810、Agilex FPGA等等,這些都是新至強的得力助手,互相結合大大拓展了整體平台的實力。
按照Intel的說法:“我們沒有把至強稱作一個服務器產品,它是一個數據中心產品。”
需要指出的是,去年6月19日發布的Cooper Lake,也是屬於第三代至強可擴展家族,區別在於Cooper Lake只用於四路、八路市場,而新的Ice Lake-SP則是針對單路、雙路市場。
說起來,Ice Lake-SP可謂命運多舛,發佈時間一再延遲,主要是和新上的10nm工藝有關,而且引入了全新架構(Cooper Lake還是14nm和老架構),導致同一家族的兩個系列產品間隔了將近10個月。
當然了,對於數據中心平台而言,正式發布並不是開始,事實上在發布之前,Ice Lake-SP已經出貨了20多萬顆,擁有了極為豐盛的產品、方案。
王銳也表示:“至強處理器的出貨有保證,特別是數據中心。我們在全力提升產能,實際的提升比計劃更高。”
另外在新的CEO帕特·基因格上任後,Intel已經在大刀闊斧地變革自己,包括加速推進新架構新工藝新產品,強化製造和產能,開放代工和外包。
接下來,我們就從架構技術、性能、生態三個方面,深入了解一下Ice Lake-SP。
Intel市場營銷集團副總裁兼中國區數據中心銷售總經理陳葆立展示Ice Lake-SP
一、架構技術:全面翻新、延遲優秀
Intel提出,新至強最值得關注的變化,主要有三個方面,一是目前唯一內建AI加速的x86數據中心處理器,二是高級先進的安全解決方案,三是可擴展性、靈活性、可定制性。
接下來的解讀中,我們也會逐一涉及這三個方面。
架構方面,新至強引入了Sunny Cove,也就是輕薄筆記本上Ice Lake-U 10代低功耗酷睿平台的同款(事實上二者處理器代號都是相通的),都是首次結緣10nm,當然這次針對數據中心應用做了調整優化。
至於為何二者發時間錯開了一年半,筆記本端去年都已經進化到第二代10nm Tiger Lake,架構也已升級為Willow Cove,你應該懂的。
簡單來說,Sunny Cove架構改進了前端部分,容量更大,分支預測更精準,加寬加深了流水線,結構和執行資源上規模更大,同時增強了TLB、單線程執行、預取等環節,還針對數據中心重點優化了緩存、矢量吞吐等部分。
對比二代可擴展至強Cascade Lake,新至強的最大核心數從28個增加到40個。
對於為何選擇40核心這個節點,陳葆立表示,這是根據整個產品迭代所做的一個比較好的平衡,無論是核心數,還是不同工作負載的加速指令、配套的產品,設計芯片需要做很多事情,尤其是把功能做好是最優先的,能夠更好地滿足客戶需要,而不是純粹選一個核心數。
當然,不同的設計策略也決定了核心數量。AMD霄龍是多個小芯片組成,雖然每個小芯片最多也才8個核心,但可以通過“並聯”輕鬆堆砌更多核心。
Intel則依然堅持單芯片設計,再加上製造工藝、內部架構,天然決定了不容易擴展太多核心,不過Intel也在不斷推進各種先進封裝技術,未來的芯片規模有望實現突飛猛進。
每核心緩存一級從32KB增大一半來到48KB,二級從1MB增大四分之一來到1.25MB,三級而從1.375MB小幅增大1.5MB,並支持Hemisphere高性能交錯模式。
內存支持從六通道DDR4-2933擴展到了八通道DDR4-3200,並改進內存調度器實現更低的延遲、更高的帶寬,而且還有傲騰持久內存200系列這個殺手鐧。
處理器間互連通道還是兩條或三條UPI總線,但是帶寬從10.4GT/s擴大到11.2GT/s,同時首次原生支持PCIe 4.0,通道數也從48條增加到64條。
獨家的AVX-512指令集這次增加了大量的新指令,涉及到加解密、壓縮解壓、安全等各個方面,可擴大應用範圍、提升性能,這也是Intel一貫的長項。
Intel還和新發布的AMD三代霄龍做了正面對比,強調了自己在緩存延遲、內存延遲方面的優勢。
緩存延遲方面,新至強的一二級其實比三代霄龍還稍微高一些,但三級就完全不一樣了,畢竟一個是單Die,一個是多芯片,不再同一個數量級,尤其是霄龍涉及到跨Die通信、跨處理器的時候,延遲可以達到新至強的兩倍甚至五倍。
內存方面,新至強的通道數、頻率算是追平對手,但是延遲低得多,而且有獨家的傲騰持久內存加持,單顆處理器支持最多4TB DDR4內存,或者4TB DDR4+2TB傲騰內存。
三代霄龍最多支持3TB DDR4,其實也可以搭配傲騰內存,但最大容量僅為1.5TB,而且關乎運行模式、平台聯動、指令和應用優化,估計幾乎不會有客戶會去這麼搭配,AMD也坦承一切取決於客戶自己的部署。——有點像Thunderbolt雷電技術。
指令集這個東西,一直都是Intel佔據領導地位,這次也新增了大量新指令,包括大數算數(AVX-512整數IFMA)、矢量AES、Caryy-less乘法指令、伽羅華域新指令、SHA-NI、VBMI等等,就不展開講了,大家只要看看後邊的性能提升就明白它們的威力了。
很多時候,一條指令的加入,很容易就可以在特定負載中帶來數倍乃至數十倍的性能提升,遠不是單純改進硬件就能媲美的。
Intel技術專家表示:“工作負載加速器指令就好比性能倍增器,它提供的增益要比僅向處理器添加核心所能帶來的增益高很多。”
Intel副總裁兼至強處理器與存儲事業部總經理Lisa Spelman也強調說:“幾年前開始我們就開始早早投資指令集和軟件,這個戰略正在產生巨大的回報。”
安全也是數據中心必不可少的關鍵一環,新至強的一大重點就是支持SGX軟件防護擴展技術,它面世已經好幾年,這是第一次登陸至強可擴展平台,用於雙路系統。
它具備持續增強的安全能力,並通過了數百次的調研和生產部署,可大大縮小系統內的攻擊層面,抵禦各種攻擊途徑,保護敏感代碼和數據,而且指定位址空間可隔離並處理最多達1TB的代碼與數據,滿足主流工作負載的需求。
尤為值得一提的是,SGX安全技術是獨立於操作系統、硬件配置的,不受軟硬件變動的影響和約束,部署更方便,效果也更明顯,即便是操作系統、BIOS、驅動、虛擬機都被攻擊了,它依然能保護數據。
再結合全內存機密技術、平台固件彈性技術,新至強可以真正解決敏感的數據保護問題。
說了半天,大家可能會問,這次到底發布了什麼產品?真的是相當相當豐盛。
如上圖,最左側一列是此前發布的四路、八路Cooper Lake,中間和右側是新發布的單路、雙路Ice Lake-SP,按照產品線分為鉑金、金牌、銀牌三個序列(沒有了最低端的銅牌)。
按照應用方向,則分別注重單核性能、擴展性能、SGX安全性能、網絡優化、雲優化、媒體處理優化、長壽命、單路型、液冷散熱等等,劃分得非常細緻,當然不同類型有所交錯,有的型號可適用於多個方面。
Intel還為不同版本加上了不同的字母后綴,包括V(SaaS雲)、P(IaaS雲)、S(512GB SGX)、Q(液冷散熱)、Y(SST-PP 2.0)、N(網絡/網絡虛擬優化)、M(媒體處理優化)、T(長壽命與擴展溫度範圍)、U(單路)等等,著實有點眼花繚亂。
頂級旗艦是至強鉑金8380,40核心80線程,基準頻率2.3GHz,全核加速3.0GHz、單核加速3.4GHz,二級緩存50MB,三級緩存60MB,熱設計功耗270W,批發價8099美元。
相比之下,上代旗艦至強鉑金8280 28核心56線程,頻率2.7-4.0GHz,二級緩存28MB,三級緩存38.5MB,熱設計功耗205W,批發價100009美元。
這代最強的28核心是至強金牌6348,頻率2.6-3.5GHz,二級緩存35MB,三級緩存42MB,熱設計功耗235W,價格3072美元。
兩相對比,同樣核心的時候,新一代頻率低了不少,熱設計功耗反而高了,這也是這代的普遍趨勢,10nm對比爐火純青的14nm還是差點勁,不過價格降到了只要三成!40核心也比上代28核心便宜了兩成!
4/6核心型號取消,改為直接8核心起步,而基準頻率最高3.6GHz的至強金牌6334,就是一款8核心,但這已經是極限了,最高加速此時也只有3.7GHz,而熱設計功耗達到了165W,上代可是還有多款型號加速到了4.5GHz。
熱設計功耗最低的也有105W,包括8核心的至強銀牌4309Y、10核心的至強銀牌4310T,頻率分別為2.8-3.6GHz、2.3-3.4GHz。
另外注意有個特殊的液冷散熱型至強鉑金8368Q,38核心,頻率2.6-3.7GHz,熱設計功耗270W,可能是偏向OEM定制。
其他型號就不一一解讀了,感興趣的可以自己慢慢對比。
二、性能對比:花式吊打競品
無論技術如何,最終還是要落地到實際性能上,不過Intel也一再強調,性能不是唯一,跑分更不是唯一。
Lisa Spelman表示:“CPU是客戶購買決策的關鍵部分,但是這不是唯一的因素,其中最酷的因素之一就是讓客戶看到我們提供的整個產品組合。通過使用整個產品組合,客戶能完成複雜而重要的購買決策。”
Intel市場營銷集團副總裁、中國區數據中心銷售總經理陳葆立也說:“我們之前做過一些調查,企業購買一個服務器最關心的是可靠性、穩定性、大規模部署的實力。至強已經有5000萬顆的出貨量,非常多軟件開發商已經有很多版本的優化軟件,這對客戶來而言是非常大的一個吸引力。對於至強或者是x86的競爭力,我們都非常有信心。 ”
這也是剛才我們反复提到Intel同步在FPGA、內存、硬盤、網絡等產品上更新換代的一個註腳,此外也少不了製造、產能、供應方面的優勢。如今的Intel,打的是一套組合拳。
當然,性能是不能迴避的,Intel也展示了一系列數據,突出了對比上代的巨大提升,以及對比競品的優勢。
根據Intel給出的數字,Ice Lake-SP三代可擴展至強相比於Cascade Lake二代產品,性能提升的幾何平均值是46%,這已經是飛躍一般的數字了,而且部分特定負載的提升幅度還更高,尤其是在AI人工智能、ML機器學習加速的情況下。
比如雲負載提升最多達50%,5G網絡提升最多62%,IoT物聯網提升最多56%,HPC高性能計算提升最多57%,AI提升最多74%(但後邊你會發現這個數字其實是很保守的),整數性能提升最多50%,浮點性能提升最多52%,內存帶寬提升最多47%,LinPack計算性能提升最多38%,
Intel甚至還對比了Skylake(六代酷睿)架構的一代可擴展至強,以及Broadwell(代酷睿)至強E5 v4系列、Haswell(四代酷睿)至強E5 v3系列的提升幅度,自然是兩三倍的變化。
你可能會覺得這樣太欺負老平台了,只是為了彰顯提升幅度巨大,其實非也。
即便在消費平台,絕大多數人都不會每代跟著升級,間隔一兩代甚至三代換新的大有人在,用著五年前老機器的不在少數,追求穩定可靠、在意成本的服務器、數據中心領域就更是如此了,必須有足夠讓客戶心動的變化才會促使更新換代。
前文說到,Ice Lake-SP是目前唯一內建AI加速的x86數據中心處理器,這方面在特定負載上的提升是極為明顯的,比如加密加速開啟後可驟升4.2倍,VNNI深度學習學習指令集也能猛漲4.3倍。
機器學習和深度學習這塊,也是效果斐然,包括圖像識別、圖像分類、語言處理,這種在我們日常應用背後默默工作的負載,都能輕鬆獲得40-60%的大幅度提升。
對比競品,這種獨有的優勢更是碾壓一般的存在,20項流行AI、ML負載負載相比於AMD頂級的霄龍7763、NVIDIA A100加速卡分別領先多達50%、30%,其中圖像識別更是25倍於64核心的霄龍7763。
還有軟件方面的廣泛合作、深度優化,10倍、100倍的性能變化都不難。
Lisa Spelma直言:“在某些情況下,通過軟件優化,我們的處理器的性能會比發布的時候有所提升。對我們來說,關鍵的改變重點和戰略是在我們交付的產品性能基礎之上進行部署優化,而不是讓我們的客戶或者是解決方案團隊直接轉移到下一代產品的開發上去。”
雙路至強鉑金8380對比雙路霄龍7763,雖然核心數是80個對128個少了三分之一,但性能依然很秀,尤其是AI推理,最高的達到了恐怖的25倍。
生態方面更不用說了,幾乎沒有不臣服於Intel平台的,新至強在全球已有超過5000個合作夥伴方案,從雲端到邊緣端全覆蓋。
同時,50多家OEM/ODM夥伴已經準備好了超過250項設計、所有的頂級雲服務商都正在或計劃部署新至強、超過15家大型網絡廠商已經初步或即將部署新至強、超過20家高性能計算廠商已經部署新至強、200多家獨立軟件供應商和夥伴已經支持SGX安全技術……
本次中國區發布會,就有多達42家中國合作夥伴雲集,而在發布會上,阿里雲、移動雲、騰訊雲、百度雲等國內巨頭,也紛紛介紹了自己的新至強平台方案,以及新平台帶來的改進和提升。
最後,一圖看懂Ice Lake-SP三代可擴展至強的主要亮點: