中國何時誕生「英偉達」?
作為全球晶元銷量大國,但大市場並沒有產生與之匹配的大公司,凸顯了”國產替代”正成為中國半導體行業發展的最大驅動力。 “我即將展示的產品,融合了新的GPU加速計算能力,擁有Mellanox高性能網路,補足我們最後一塊拼圖的產品是——全球首款專為TB級數據中心加速計算而設計的CPU處理器,它的秘密代號是Grace。 ”
英偉達CEO黃仁勳
這是2021年4月英偉達(NVIDIA)CEO黃仁勳在GTC峰會演講中的一段話。 然而,讓人意想不到的是,直到8月12日英偉達自曝後人們才知道,這段不足100字、14秒的演講內容竟然不是黃仁勳本人出鏡,而是使用了合成的”數位替身”,即利用英偉達GPU處理器與Omniverse軟體平臺共同形成的”虛擬黃仁勳”形象。
這一事件引發了人們對虛擬實境、元宇宙、AI換臉等技術和概念的激烈討論,同時也讓「英偉達」這家美國晶元霸主從半導體行業”出圈”,走入了大眾視野。
自1993年成立至今,在黃仁勳的帶領下,英偉達成功創造且引領了GPU晶元這一類別,產品覆蓋整個PC設備GPU至伺服器GPU市場。 過去五年內,英偉達市值從310億美元增長到5050億美元,躋身成為全球第七大半導體供應商,是人工智慧(AI)晶元領域炙手可熱的明星企業。
與此同時,在英偉達市值超過英特爾之後,國內半導體市場看到了GPU、AI晶元賽道更大的市場機會,景嘉微、天數智芯、登臨科技、壁仞科技、燧原科技、寒武紀、沐曦積體電路等企業均在通用處理器這一賽道中集聚。
但作為全球晶元銷量大國,中國卻沒有出現一家「英偉達」這樣的晶元巨頭,大市場並沒有產生與之匹配的大公司。 根據IC Insight的統計顯示,2020年全球半導體市場規模為3957億美元,其中,中國大陸市場規模是434億美元,為全球最大市場,佔全球比例達到36.24%。 然而,總部位於中國大陸的半導體公司2020年總產值僅為83億美元,僅佔市場規模的5.9%。
偌大的蛋糕,究竟誰能切下一角? 半導體產業何時才能造出「中國英偉達」?
錯失黃金時代
GPU圖形處理器又被稱為顯示晶片、視覺處理器,最初於1999年由英偉達提出,是個人電腦、工作站、遊戲主機以及行動裝置(智慧手機、平板電腦、VR設備)上專門運行繪圖運算的微處理器。
隨著GPU的並行計算優勢被逐步挖掘,GPU的應用領域從圖形處理擴展到高性能計算,逐步成為Al計算最成熟、應用最廣泛的通用型晶元。 2020年6月,英偉達推出基於安培(Ampere)架構的A100 Tensor Core GPU,成為全球性能最強的AI晶元。
以應用終端角度分類,GPU可分為PC端GPU、伺服器GPU和移動端GPU,對應三種架構,即與專用電路板及元件組成的獨立顯卡,共用集成顯卡,以及移動端GPU與其他晶元或模組一起封裝成高集成度的SoC——應用於手機、汽車電子、AI在內的多個應用場景。
自從AMD在 2006 年收購加拿大 GPU 廠商 ATI 之後,目前,在 PC 及伺服器 GPU 領域,全球 GPU 市場呈現”美國晶片三巨頭”——英特爾、AMD 和英偉達壟斷的局面。 集成GPU市場英特爾優勢明顯,獨立GPU市場英偉達和AMD兩強割據。
根據研究機構Jon Peddie Research的數據顯示,2021年第一季度,全球PC端GPU市場中,英特爾(Intel)以68%市場份額位居榜首,AMD和英偉達分別為17%和14%,三家共計份額接近100%;全球獨立GPU領域中,英偉達是數據中心GPU市場領導者,佔據81%的市場份額,擁有領先優勢,AMD則以佔比19%位居第二。
僅2019年,英偉達憑藉V100系列等產品,佔據了中國AI訓練晶元市場90%份額,牢牢掌握著中國這一龐大的AI晶元銷售市場。
英偉達能持續作為「晶元霸主」地位的核心原因之一在於其「輕設計模式」。。 英偉達不做晶元製造和封裝,交由台積電代工完成,自身享受7nm等先進製程工藝技術紅利。 根據財報顯示,2016年至2021年期間,英偉達收入增長了233%,營業利潤翻了一番,達到45億美元。 在截至今年5月的三個月內,銷售額同比猛增84%,毛利率則達到了64%。
事實上,中國很早就進入了GPU晶元設計領域,但結果並不如意。
從20世紀70年代開始,中國開始引進半導體與積體電路技術和生產線。 但結果卻是陷入了「代代引進、代代落後」的惡性循環,加上「漢芯一號」假晶元事件給社會帶來的不良影響,讓中國的「自主處理器」遭受嚴重挫敗,以及中國積極推動WTO全球化等因素,從而錯失了全球半導體產業發展的黃金時期,下游企業只能「造不如買」。。
到2000年,以國家”18號檔”出臺為標誌,中國半導體才逐漸形成設計、製造、封裝測試”三業分離”的產業組織形態,引進以”中芯國際”為代表的一批晶元製造(Foundry)企業在華建設、投產,技術水準也因此得到快速提升。
目前,景嘉微、天數智芯、登臨科技、壁仞科技、燧原科技、寒武紀、沐曦積體電路等企業均在通用處理器這一賽道中集聚。
2014年,以軍機圖形顯示控制模組起家的「景嘉微」(300474. SH)成功研製出軍用GPU晶片JM5400,隨後在2018年成功研發出28nm製程工藝的第二代GPU晶元JM7200。 景嘉微從軍用定製走向通用GPU,成為全球少數、國內唯一實現獨立GPU商用量產的公司。
除景嘉微外,2021年3月天數智芯發佈了國內首顆7納米工藝製造的GPGPU(通用圖形處理器),即去掉了傳統GPU 30%的圖形渲染部分,只為處理人工智慧(AI)應用而生;燧原科技則在今年6月發佈了迄今中國最大的AI計算晶元”邃思2.0″AI晶片、基於邃思2.0的”雲燧T20″訓練加速卡和”雲燧T21″訓練OAM模組。
但值得注意的是,景嘉微研發的JM7200晶元,性能只相當於2012年英偉達GTX 640水準,難以滿足企業客戶的應用需求。 即便燧原科技的”邃思2.0″AI晶片,也僅和英偉達的A100達成平手,Benchmark測試的6個專案中有2項大幅超越了英偉達A100的性能表現。 (詳見鈦媒體App前文:《燧原科技發佈中國最大的AI計算晶元,加速推進三大業務方向落地》)
背後的原因,主要由於中國半導體產業起步晚,晶元的技術門檻高、成本彈性大、產業高度集中,使得中國GPU晶元企業的整體研發投入、技術、人才都滯後於國外,從而在產品性能和技術上依然和晶元巨頭有差距,下游企業依然難以脫離”美國晶元三巨頭”的境地。
以研發投入為例,2011年至2020年的十年間,景嘉微的研發投入費用總額為人民幣6.27億元,而英偉達2020年這一年的研發投入就達到39.24億美元,約合人民幣253.23億元,十年間英偉達總計投入超過1200億元人民幣,兩者相差超190倍。
在人才方面,截至2021年上半年,英偉達員工人數高達18975人,景嘉微總員工人數為1174人,遠低於AMD在上海研發中心的2000名員工。
“AI晶片、GPU晶片市場比較特殊,跟傳統的專用處理器不一樣,技術十分複雜。 它需要大量的數據,需要和特定的演算法結合,才能夠付諸市場運用。 “新思科技中國副總經理謝仲輝在今年4月接受鈦媒體App獨家專訪時表示,如果企業想把首顆AI晶元做紮實,通常需要兩三年以上。
在他看來,晶元半導體本身是一個投入大、週期長、見效慢的行業,技術完全國產化需要長期持續的資金、人才和技術積累,很難用”砸金錢見回報”這種互聯網思維來處理。
此外,結合CUDA技術的軟硬體生態,也是國內晶元企業與英偉達形成較大差距的另一重要原因。
2006年,英偉達就發佈了並行計算平臺CUDA,其中包含一系列開發工具,只有安裝使用這個平臺才能夠進行複雜的並行計算,任何人只要擁有一台配有英偉達GPU的筆記型電腦,就可以利用CUDA可以進行科學、便捷程式設計計算,比如深度學習、AI演算法等,開發相關軟體。 過去十多年,英偉達堅持不懈地推廣CUDA,使更多政企級類型軟體都基於該平台開發,將英偉達自研GPU硬體與CUDA軟體相結合,高效實現應用落地。
相比之下,目前國內卻沒有一個類似CUDA和英偉達硬體深度綁定的系列平臺,技術壁壘差距十分明顯。 大部分國產GPU廠商均採取相容CUDA開源框架的策略,如天數智芯、登臨等,準備在此基礎上培育自己的軟體生態。
“短期來看,國產GPU兼容CUDA更容易發展,畢竟寫算子是人力密集型行業,使用者遷移的話是需要100%遷移、整套代碼都要在你的片上跑,如果代碼量很小,需要的算子不那麼多,難度就比較低。 但是長期來看,還是要擺脫相容思路,發展自有的核心技術。 “芯片行業內人士表示,選擇兼容主要是確保已有軟體依然可用,未來會不斷改進自家平臺,使其更加匹配自己的晶元,從而吸引開發者遷移。
但也有企業選擇不相容CUDA生態,比如同時做AI訓練和推理晶元的燧原科技,今年全面升級了其”馭算TopsRider”軟體平臺以及全新的”雲燧集群”,希望能擁有生態主導權。
總結來看,對標英偉達的這些國內晶元企業依然處在發展的初級階段,AI晶元技術的產業化、市場化能力較弱,沒有產生實際的大規模使用,距離超越或取代”中國英偉達”仍然有很長的路要走。
中科馭數CEO鄢貴海在接受鈦媒體App採訪時表示,雖然目前中國需求側雖然還是全球最大的單一市場,增速也名列前茅,”需求側”還是很強勁的,但在高端晶元方面無論是設計還是製造還有不小差距,”供給側”不夠強大。 他指出,供給側的優劣不僅取決於一家企業,而是全產業鏈能力。 短期內要想打造出這樣大體量和全面引領性的企業還是不太現實的。
中科馭數成立於2018年,是一家專用計算架構研發商,孵化自中科院計算所的計算機體系結構國家重點實驗室,如今公司估值已超10億元。 今年7月27日,中科馭數完成數億元A輪融資,由華泰創新領投,靈均投資以及老股東國新思創跟投。
高瓴合夥人、高瓴創投軟體與硬科技負責人黃立明在接受鈦媒體App的獨家專訪時表示,雖然GPU市場前景廣闊,但中國創業公司很難直接做成”英偉達”。 除了技術難度外,還要結合很強的應用來做——涉及到軟體系統軟體生態,這對創業公司來說要求是極高的。
高瓴於2020年2月推出獨立VC品牌高瓴創投,此後其對晶元半導體領域進行投資入局,其中包括半導體IP企業芯耀輝、EDA廠商芯華章,GPU平臺壁仞科技、DPU公司星雲智聯,加上碳化矽方面的天科合達、光晶元領域的敏芯半導體、以及手機基帶星思半導體等。
黃立明強調,能在這個方向跑出來的公司,無論海外還是國內,高瓴判斷最終都不會有很多。
風口已至
“我們現在先不糾結於怎麼去取代英偉達,路都是一步一步走的。 我覺得首先中國得有國產AI晶元、通用GPU、FPGA等底層算力。 只要國內有市場需求,我們一定有很多機會。 “華映資本主管合夥人章高男對鈦媒體App表示,國內半導體產業風口已至,中國現在切入GPU市場是”天時、地利、人和”皆備,尤其半導體和下一代AI技術都是中國必須突圍的領域。
章高男舉了一個例子,金山辦公產品雖然遜於微軟Office套件,但市場給出1100多億元市值,背後重要原因之一是,中國必須得有國產office,同樣道理也適用於國產的GPU市場。
華映資本是國內最早佈局移動互聯網和文化產業的私募股權基金之一,近幾年To B領域也成為華映資本重點關注的投資領域。 目前華映資本在To B領域投資的30餘個專案,投資總額超7億元生態,由技術型投資人章高男負責搭建。 在數據中台及底層算力相關領域,華映資本投資佈局了壁仞科技、天雲大數據,中科海微等專案。
實際上,作為橫跨視覺計算和AI計算的通用平臺,GPU擁有巨大的市場空間。 據東吳證券測算,預計到2027年,GPU領域國產替代的市場空間規模超過341億美元。 除了既有的遊戲市場,在工業、醫療、軍事航太等方向都有進一步的發揮空間。
今年3月,原商湯科技總裁張文聯合創立的通用智慧晶元設計商「壁仞科技」完成了B輪融資。 2019年9月成立以來,公司總融資額超47億元人民幣,投資方包括高瓴創投、華映資本、中國平安、招商局資本、BAI資本、國盛集團國改基金等,估值已超過100億元,成長半導體行業勢頭最為迅猛的”獨角獸”企業之一。
除壁仞外,沐曦積體電路、摩爾線程等入局GPU領域的企業也都完成了融資。
8月25日,GPU廠商沐曦積體電路宣佈完成10億元人民幣的A輪融資,創始人陳維良、楊建等均來自美國晶元巨頭AMD,投資方包括中國國有企業結構調整基金股份有限公司、中國互聯網投資基金、經緯中國、和利資本、紅杉中國、光速中國、國創中鼎、智慧互聯產業基金、上海科創基金、聯想創投等;而2020年成立的摩爾線程, 宣稱100天內就完成了兩輪數十億元融資,團隊成員主要來自英偉達,投資方包括深創投、紅杉資本中國基金、招商局創投、位元組跳動、小馬智行、五源資本等。
不過,一個有趣的現像是,壁仞、沐曦、摩爾線程上述三家初創企業是名副其實的”PPT融資造芯”,融資時無一家完成首顆晶元的流片(流水線試生產)。
為何市場投資人願意對此敞開錢包? 數位投資人在接受鈦媒體App採訪時表示,這些專案能夠獲得大量資本支援,原因都為投資早期,主要看的還是團隊、賽道兩部分:AI晶元賽道風口已至,高管團隊也均出自”美國晶元三巨頭”。
“我覺得需要給這些企業機會和耐心,不可能500個人都在寫PPT。 製造晶元是一個5年到10年的事情,我們願意去投的原因,並非是投機或者是忽悠。 我認為,投半導體賽道本身風險就高,需要做好長週期的打算,需要有足夠強的風險承擔能力,這和投資互聯網的模式創新完全不一樣。 “上述投資人對鈦媒體App表示。
但也有半導體行業投資人指出,上述投資專案本質上還是希望市值撐高,有更高的回報率,尤其”晶元熱”環境下,風投機構需要不斷在中早期尋找這些GPU、AI晶元企業標的,希望從中賭得一份更高的回報。
此外,在這一波GPU創業浪潮中,創始團隊師出”美國晶元三巨頭”。 例如,天數智芯首席科學家鄭金山曾任AMD首席技術專家;沐曦的創始團隊主要來自AMD,CEO陳維良曾在AMD擔任圖形研發高級總監,CTO楊建曾任AMD Fellow(院士);壁仞科技最新上任的聯席CEO李新榮,曾任AMD全球副總裁,壁仞科技高級副總裁陳文中也曾在AMD任職。
對此,章高男表示,AMD是GPU領域排名前二的晶元巨頭,關於GPU核心研發都在上海,而圖形渲染的研發是在美國,企業可以去找AMD和英偉達兩家公司高管去溝通,而最終選擇的人肯定是半導體行業內的佼佼者。
鄢貴海認為,在細分新興賽道,憑藉需求側的應用”勢能”,中國晶元企業集中優勢兵力,立足服務本土企業,突出開發的敏捷性,是有機會在產品定義、方案反覆運算週期上超越”英偉達”這些晶元巨頭。 他預計,10年內會出現一批技術領先的國產GPU、DPU企業。
“芯片產業五個環節:設計、製造、封測、材料、EDA五個環節中,與應用最相關的是設計,我們最大的優勢又在於應用,所以非常有機會在”設計”這一環節取得突破,然後以點帶面,逐步擴大勝利版圖。 所謂「彎道超車」還是追趕策略,切入面向未來的新賽道並且全力加速才更有可能佔據新的戰略制高點。 希望能在10年內能出現一批技術領先、產品紮實而且富有戰略意識的企業。 “鄢貴海對鈦媒體App表示。
壁仞科技創始人張文表示,對晶元公司的能力要求從產品級提升到系統級和生態級。 時間上不超過5年,中國在AI晶元設計領域趕上甚至領先國際水準。 他強調,超越英偉達,需要重新定義一個產品,以及重新定義一個市場。
百億DPU晶元市場「爆火”
在黃仁勳看來,負責在數據中心傳輸和處理數據的數據處理單元(DPU),正與CPU、GPU共同組成”未來計算的三大支柱”。 當中國晶元企業發力GPU時,英偉達則把目光放在了CPU、DPU這兩個新市場中。
2020年9月,英偉達宣佈擬以400億美元,從日本軟體集團處收購英國晶元設計商Arm,預計寫下半導體行業最大的併購案。 但這筆交易存有爭議,目前還等待歐盟、英國、美國和中國等政府的批准。 但2021年4月,英偉達則宣佈進軍數據中心CPU市場,發佈Grace CPU處理器,也就是本文開頭黃仁勳所講的那一段話。 (詳見鈦媒體App前文:《英國政府出手干預,英偉達400億美元併購Arm交易生變》)
CPU和GPU之外,英偉達還在佈局DPU。 2019年,英偉達宣佈以69億美元全現金的形式收購以色列網路晶元商邁絡思(Mellanox),並最終將其拿下。 而這筆英偉達有史以來規模最大的收購,黃仁勳最看重的就是邁絡思在數據中心技術等方面獨步天下的能力。 2020年10月,英偉達首次推出了DPU — NVIDIA BlueField系列數據處理器。
究其根本,一方面DPU更靈活安全,更重要的是,DPU可以解放CPU的算力,釋放伺服器的負載,並憑藉低功耗顯著降低綜合成本,甚至還可以改善AI和機器學習應用的性能。
據IDC統計,全球算力的需求每3.5個月就會翻一倍,遠遠超過了當前算力的增長速度。 在此驅動下,全球計算、存儲和網路基礎設施也在發生根本轉變:一些數據量過大的工作負載,過多佔用CPU資源,與之協同作戰的各種”X”PU晶片便應運而生,GPU、FPGA等晶元之外,DPU就是下一個”X”PU。
業內人士就此做了一個形象的比喻,網路就像造馬路,以前1G 10G時代馬路已經不夠寬了,車子越來越多,為了平衡壓力,通過增加紅綠燈和投入更多的交警來更高的協調資源,這樣已經讓原來的效率提高很多,但是仍然不夠。 必須第一擴大馬路,這就是頻寬增加,但是馬路從2道變為4道,僅僅依靠紅綠燈和有限的交警還是會堵塞,但是我們不能無限增加交警,這就需要馬路能更加智慧,幫助解決擁堵。
章高男指出,大量的網路管理在CPU裡面,佔據了容器能力,而DPU則是將伺服器智慧提供空間能力,大量虛擬化空間可以提高算力需求。
隨著2020年,DPU的名聲超出了競爭對手英特爾所推出的基礎設施處理器(IPU)和SmartNIC,也讓每個對數據中心業務虎視眈眈的企業都要在這個領域分一杯羹。 DPU成為了各大晶元巨頭、初創公司爭相研發的新賽道,國產DPU現在幾乎處在百花齊放的狀態,紅杉、高瓴創投、鼎暉、軟銀中國都開始入場。
今年4月,天眼查數據顯示,國產DPU晶元供應商「雲豹智慧」完成騰訊投資、紅杉資本、耀途資本等聯合的天使輪融資;5月末,芯啟源完成數億元Pre-A輪融資,投資方包括軟銀中國、浦東科創集團等;7月27日,DPU晶元研發商「中科馭數」完成華泰創新領投的數億元A輪融資;8月30日,DPU晶元研發商星雲智聯宣佈完成了數億元天使輪融資, 由高瓴創投領投,鼎暉VGC、華登國際中國基金參與跟投;9月初,IDG資本豪擲”雲脈芯聯”天使輪融資專案。
“DPU有可能成為繼CPU和GPU之後的第三顆算力晶片,但從結構上來看,DPU會更異構、也更專用。” 鄢貴海在接受鈦媒體App等採訪時表示,DPU產生的背景是智慧時代數據爆發導致的端-邊-雲一體化趨勢帶來的對計算延遲、數據安全、資源虛擬化需求。 CPU對這些非業務性負載已不堪重負,迫切需要一個理想的對象來分擔這些計算負載。
頭豹研究院則預測,中國DPU市場規模預計將在2025年達到37.4億美元。 全球DPU市場規模2025年預計將達到135.7億美元。 同時報告也指出,數據流通是DPU最大的應用市場,其中裸金屬服務其對DPU存在剛需。 DPU在電信市場的應用主要為邊緣計算場景,滲透率不足5%。 針對智能駕駛領域的DPU仍在探索階段,預計在2023年DPU才有望佈局在智慧駕駛領域。
中國DPU市場規模,2020-2025年預測,來源:頭豹研究院
鄢貴海指出,CPU的性能從5-10年前每年30%的增幅,到三年前大概只有每年不到3%的性能增幅。 而網路頻寬每年依舊還有35%左右的增長。
以中泰證券為例,當時該公司遇到的挑戰是,交易報單合規檢查太慢,需要提高交易效率。 於是,中科馭數與中泰證券、上交所技術有限責任公司聯合研發了一套極速風控系統解決方案,來加速這一流程。 中科馭數相繼研發了超低時延智慧網卡、數據計算加速卡等多套產品和解決方案,主要面向高頻寬、低時延、數據密集型等場景。 該公司今年已經實現千萬級別的季度營收。 中科馭數的下一代DPU晶片預計將於2021年底完成設計,預計可處理高達200G網路頻寬數據。
不過,DPU市場雖然火爆,但概念較新,未知更多,投資風險也會更大。
芯啟源CEO盧笙指出,目前DPU細分賽道的壁壘還是相對較高的,除了技術壁壘之外,還有市場的壁壘,需要客戶不斷反覆運算,尤其是配合開源軟體不斷升級去適配客戶快速變化的軟硬體環境。 因此VC(風險投資)在投資之前,一定要先認可賽道,且有足夠的耐心。 他強調,投資人需要對市場進行不斷地觀察並調整判斷,現在誰也無法預料未來DPU發展前景。
也有媒體認為,當英偉達進入新開闢的CPU和DPU戰場,對中國的GPU廠商或許是個利好,尤其英偉達依然花大量精力放在400億美元收購英國晶元設計商Arm公司的併購交易上,這對新創GPU企業而言,可能是個追趕的時機。
正如章高男對鈦媒體App所說,”從邏輯上講,門檻不高的事情通常稀缺性都不高。 (晶元半導體賽道)有些事情是很難的,需要長時間投入,雖然是高風險,但總歸得有人去做。 這是真正對國家有利的長遠投入,其實應該鼓勵投資。 否則的話,這些需要長時間投入的難事,誰都不去做,你永遠上不了台階。 ”
章高男強調,雖然風險投資肯定要追求回報,但他認為,在整個資金分配合理情況下,拿出一部分投資半導體賽道的初創企業,不僅有極強的社會意義,更是某種長期價值投資的重要體現。