CPU與GPU、VCU的關係愈加“微妙”
一個GPU總需要一個CPU,但CPU的選擇已經不再單一,GPU的功能也不再“簡單”,曾經穩固的關係,不再是單純的合作。四月份,英偉達發布了採用Arm架構的首款數據中心CPU Grace引發廣泛關注。本月,外媒Tomshardware報導,像CPU一樣總需要一個CPU的谷歌自研視頻編解碼處理單元Argos VCU,預計可以替換3000-4000萬個英特爾CPU。
依賴CPU的GPU和VCU為什麼會有替代CPU的勢頭?芯片巨頭與互聯網巨頭間的競合關係,是如何加深的?
CPU市場的雙重變化
回答CPU與其它依賴CPU處理器關係變化之前,不妨先了解CPU市場本身的變化。在很長一段時間,由於CPU的性能已經足夠滿足包括PC在內的各種應用需求,再加上內存和帶寬成為CPU性能提升的瓶頸。CPU王者英特爾在提升CPU性能動力不足,以及先進製程工藝進展不如預期的情況下,連續多代CPU性能提升幅度不大,被稱作“擠牙膏”。
英特爾在領先位置緩慢前進的幾年間,AMD憑藉Zen架構的迅速迭代以及台積電先進製造工藝的加持,性能迅速接近甚至超越英特爾酷睿和至強CPU的性能。“AMD Yes”表達了消費者對於AMD產品迅速提升的認可。
英特爾和AMD的x86 CPU是PC時代的標誌,然而在性能提升陷入瓶頸,以及先進半導體製程提升難度越來越大的背景下,兩家最具代表性的CPU公司表現相差甚遠,並且開始在市場份額上有所體現。
依舊有領先優勢的英特爾感受到了老對手帶來的競爭壓力,因此無論是產品性能提升還是市場策略都更加積極。然而,英特爾在服務器CPU市場除了要面臨同為x86陣營AMD的競爭,Arm陣營的公司也來勢洶洶。
Ampere董事長兼首席執行官Renee James說:“我們知道未來將與過去不同,因為軟件環境變了,不再是關於PC和PC服務器的業務,而是圍繞雲和雲邊緣。現在,需要另一種不同的微處理器。”
Ampere基於Arm Neoverse N1內核,推出了80核的Altra CPU和128核Altra Max CPU,持續刷新服務器CPU核心數的紀錄,突出與x86 CPU相比更高的核數以及在雲原生市場的優勢。
同樣是強調差異化優勢,英偉達的Grace主要是面向數據密集型HPC和AI應用。英偉達首席執行官黃仁勳稱基於Grace的系統與英偉達GPU緊密結合,性能將比目前最先進的NVIDIA DGX系統(在x86 CPU上運行)高出10倍。
無論是Ampere還是英偉達,其差異化高性能CPU的基礎都是Arm。而Arm也在今年三月推出了面向未來十年的新一代架構Armv9,Arm希望將其架構在智能終端的成功擴展到高性能計算市場,包括邊緣、雲端及5G等。基於Armv9架構的Neoverse N2正是Arm向高性能市場拓展的關鍵產品。
整體看來,已經在PC和服務器CPU市場大獲成功的x86陣營正開始一場激烈的競爭。此時,面向雲計算、AI的Arm架構CPU迅速發展,要在新興市場分一杯羹。未來,RISC-V CPU會以怎樣的方式參與到CPU市場的競爭,也讓人充滿期待。
異構時代,定制CPU優勢突顯
CPU市場發生雙重變化的一個關鍵因素是市場需求,在市場的驅動下,CPU的價值也更多體現在異構系統中。英偉達在今年四月發布Grace CPU的時候,也同時將其數據中心產品路線圖升級為GPU+CPU+DPU的三類芯片,逐年飛躍,一個架構的策略。在這個新的策略中,GPU和DPU性能的充分發揮依舊需要有CPU強大的性能,也就是說,CPU計算和控制的基礎和核心作用沒有改變。
變的是新興應用對於算力的大幅快速增長,異構系統的性能是更重要的關注點。“目前市場上每年交付的3000萬台數據中心服務器中,有1/3用於運行軟件定義的數據中心堆棧,其負載的增長速度遠遠快於摩爾定律。除非我們找到加速的辦法,否則用於運行應用的算力將會越來越少。”黃仁勳說,“新時代的計算機需要新的芯片、新的系統架構、新的網絡、新的軟件和工具。”
這也是英偉達推出DPU,並且將DPU歸入其數據中心產品路線圖的原因。“現代超大規模雲技術推動數據中心從基礎上走向了新的架構, 利用一種專門針對數據中心基礎架構軟件而設計的新型處理器, 來卸載和加速由虛擬化、網絡、存儲、安全和其它雲原生AI服務產生的巨大計算負荷。BlueField DPU正是為此而生。”黃仁勳此前表示。
異構組合才能更好滿足未來市場的需求,這也已經是業界共識,從英特爾擁有CPU+GPU+FPGA+AI加速器的完整芯片組合,到英偉達宣布收購Arm,再到AMD宣布收購賽靈思,芯片巨頭們都希望通過不同類型的芯片組合滿足雲計算、AI等計算更加密集應用的需求。
在這種變化中,CPU的選擇也會更加多樣。Computex 21上,黃仁勳在回答雷鋒網等提問時表示:“未來的世界非常多樣,當然也會有不同的CPU,包括x86架構和Arm架構,大型CPU和小型CPU,面向邊緣、數據中心、超算等CPU,我們的策略是在我們服務的市場,選擇最合適的CPU,我們會繼續支持x86 CPU。”
面向特定的市場,並非所有CPU都合適。因此在不同的市場需要不同的CPU,比如在筆記本電腦市場,英特爾的x86 CPU是不錯的選擇,在DGX系統中,AMD的CPU表現非常好。在5G基站中,基於Arm的Marvell CPU是一個理想選擇。在雲計算市場,Ampere的CPU性能出色。英偉達的CPU為的是解決AI推薦系統和自然語言理解這樣大型AI模型的計算挑戰。
“我相信未來既需要通用CPU,也需要定制CPU。支持Arm和x86對我們來說都是很好的戰略。”黃仁勳表示。
CPU與GPU、VCU更加微妙的競合關係
既有自研的Arm CPU,也支持x86 CPU,讓英偉達與CPU巨頭間的競合關係中競爭的成分更高。在PC時代,芯片巨頭間的競爭,是CPU公司或者GPU公司之間的競爭,CPU與GPU公司以合作為主旋律。
邁入AI時代,英偉達憑藉其GPU硬件加上通用的軟件,成為了AI芯片公司的代表,在AI市場成為了英特爾強大的競爭對手。面向市場空間巨大的雲計算和5G市場,英偉達的GPU依舊離不開英特爾和AMD的CPU,但同時英偉達會更加註重Arm架構CPU的開發,芯片巨頭間的競合關係進一步加深。
這種關係變化更明顯的轉變在芯片巨頭與互聯網巨頭之間。比如文章開頭提到的谷歌Argos VCU,多年來谷歌都使用英特爾CPU中的視頻編解碼引擎,但隨著視頻內容越來越多,以及分辨率越來越高,谷歌需要性能更強但是功耗和成本更低的芯片。
定制的專用芯片性能往往會比通用芯片更強,通過自研核心功能加上集成第三方IP,能在規模應用中實現優勢。谷歌表示,與英特爾Skylake驅動的服務器系統相比,其基於VCU的設備在性能、TCO(總體擁有成本)、計算效率方面實現了7倍(H.264)和高達33倍(VP9)的提升。
CPU、GPU 和配備VCU 的系統離線雙通道單輸出(SOT) 吞吐量
除了VPU,谷歌也已經通過自研的TPU減少了購買CPU和GPU。谷歌與芯片巨頭們的關係,不再單純是緊密的合作夥伴,在特定市場也成為了競爭對手。
對於這種轉變,英特爾公司副總裁兼中國區總經理王銳此前對雷鋒網(公眾號:雷鋒網)表示,“競爭對手可以在某一參數或者是在製程上縮短與我們的差距。但要打造整個架構,在計算和AI的各個方面都要能夠赶超英特爾,不是那麼容易的事情。”
這是芯片巨頭應對技術、市場變化的自信和底氣,當然,芯片巨頭們也需要更多地考慮與自研芯片的互聯網巨頭們的關係。
不要忽略,無論是芯片巨頭們之間的競爭,還是芯片巨頭與互聯網巨頭們之間關係的變化,本質上除了市場和應用變化的驅動,還有成熟的芯片產業鏈,包括成熟的設計工具、 IP、代工廠和封裝,很大程度降低了GPU公司設計CPU,以及互聯網巨頭設計定制芯片的門檻。
芯片行業的門檻還在進一步降低,這還會帶來怎樣的變化?