寒武紀是如何與英偉達和華為海思較勁的?
2015左右,全球開啟了AI芯片的創業熱潮。AI的這一次浪潮不僅吸引了眾多頂級芯片人才選擇創業,也讓多家科技巨頭進入了芯片行業。不過,AI技術仍在快速發展,AI芯片的評價體係也還在完善,AI芯片領域也還沒有公認的領導者。
此時一個很關鍵的問題是,如何衡量一款AI芯片的好壞?藉著寒武紀科技回复上海證券交易所的問詢函(以下簡稱問詢函)報告,去找到如何從多個角度多層次全面衡量一款AI芯片競爭力的答案。當然,這個答案當中也包含著寒武紀科技的許多關鍵信息以及它是如何與英偉達和華為海思較勁。
先發優勢
在問詢函回复報告中,寒武紀表示與華為海思相比,公司的競爭優勢體現在:
公司專注於人工智能芯片進入該領域的時間更早,具備先發優勢。芯片架構針對人工智能應用及各類算法進行了優化,積累了一批核心技術與關鍵專利,技術創新能力得到業界廣泛認可。
在新技術的研究中,先發的優勢在於,當業界對新技術的關注度還不是很高的時候就開始研究,雖然面臨的挑戰更大,但可以更早把“坑”踩了,更早積累更多的經驗,當產業對新技術的關注度大增的時候,可以將新技術更快地產業化。
但技術的實現有很多種方式,先發優勢並不一定就是最終的技術優勢,技術的選擇也非常關鍵。
架構選擇
在與英偉達等老牌芯片巨頭的競爭中,寒武紀在問詢函回复函中表示其優勢在於:
在研發人工智能芯片時,英偉達更多基於公司原有的技術儲備和設計理念去適配人工智能的應用和算法,但GPU、CPU本身並非專門為人工智能相關運算進行開發的芯片產品。而公司的芯片架構針對人工智能應用及各類算法進行了優化,有效提升了產品的性能功耗比和性能價格比。
目前,AI芯片的定義還沒有一個嚴格和公認的標準。比較寬泛的看法是,面向人工智能應用的芯片都可以稱為AI 芯片。因此,CPU、GPU、DSP、FPGA、ASIC都屬於AI芯片的範疇。
這裡需要單獨介紹的是專為AI而設計的芯片。這類芯片經常會統稱為AI專用芯片,要進一步細分的話還可以分為通用型和專用型。兩者的差別在於,通用型是通過對各類智能應用和算法的計算和訪存特點進行抽取和抽象,定義出一套適用於智能算法且相對靈活的指令級和處理器架構,廣泛支持多樣化AI算法和應用。當然,通用型AI芯片是專為AI算法設計,其通用性也不能與CPU和GPU進行比較。
專用型AI芯片(ASIC)則是針對特定的、具體地、相對單一的AI應用專門設計的芯片。
關於CPU、GPU、FPGA、DSP、ASIC的特點以及進行AI計算時的優劣勢,可以參考問詢函中的表格。
市場定位
AI芯片的架構各有特色,不同架構的芯片既可以應用於對性能要求很高的雲端訓練和推理市場,也可以應用於對功耗和成本更敏感的邊緣和終端市場,因此在對比AI芯片的時候,首先要明確是否是同級別競品以及市場定位是否相似。
寒武紀在選取同類競爭對手時候的標準有兩個:
1、面向終端、雲端、邊緣端等智能計算市場有一種或多種芯片產品發布上市的芯片公司;
2、相關芯片產品有顯著銷售規模且公開披露該類產品的業務、財務資料相對較多。
基於上述原則,在智能計算市場中,行業內主要企業的具體情況如下所示:
寒武紀科技得出的結論是,綜合來看,公司在業務與技術部分介紹時綜合考慮了主要產品或主營業務相似度、行業知名度及行業地位、產品銷售情況、信息披露透明度等因素,選取英偉達、英特爾、AMD、Arm、華為海思等五家企業作為同行業可比公司。
AMD雖然同時擁有高性能CPU和GPU產品,但並未針對AI算法做特別優化,AMD也未在對外的宣傳中提及其AI性能,所以在做AI芯片產品的對比時,AMD經常不會放在對比列表中。
選定具備可比性的同類競品之後,接下來需要對比的就是產品的技術,包括直接影響芯片最終性能的硬件技術和軟件技術。
芯片關鍵技術指標
在問詢函回復中,寒武紀用英偉達和華為海思的產品進行了詳細的比較,在芯片的物理技術層面從底層的處理器微架構、指令集、SoC芯片設計、芯片功能驗證到先進工藝物理設計、芯片封裝設計與量產測試、硬件系統設計選取衡量標準,進行了詳細對比。
軟件層面從編程框架適配與優化、編程語言、編譯器、高性能數學庫、虛擬化軟件、核心驅動、雲邊端一體化開發環境7個方面選取衡量標准進行一一對比。
7個硬件關鍵技術對比:
7個基礎系統軟件技術對比:
軟硬件的關鍵技術的特性以及軟硬件融合的程度直接決定了AI芯片的單核、多核性能以及對不同數據精度和算法支持的表現。也是影響業界評判一款芯片PPA(Power、Performance、Area)的關鍵。根據AI芯片發展的應用範疇,在性能功耗比、製造工藝、軟件成熟度以及未來發展趨勢上,AI芯片也分主流技術水平以及未來技術發展趨勢。
注1:性能功耗比按理論峰值性能和芯片整體功耗進行估計。
注2: INT2/4/8/16 分別代表進行2 位、 4 位、 8 位、 16 位定點運算, FP16/32 分別代表進行16 位、 32 位浮點運算, BF 16 代表進行16 位腦浮點運算。
注3:表中所述終端芯片都指具備專門化、本地化人工智能處理能力的SoC 芯片。
注4:上表中沒有針對專用型智能芯片(ASIC)進行比較,因該類芯片功能相對單一,通常無須使用Fin Fet 等先進製造工藝,與通用型智能芯片的行業特點顯著不同,且不是公司主營業務所關注的重點。
注5:訓練和推理的性能功耗比均以理論峰值性能計算。
資金實力與人才實力
無論是傳統芯片還是AI芯片,能夠持續投入研發進行產品迭代才是保持芯片競爭力的關鍵。特別是,芯片行業是一個長周期,高投入的行業。因此,資金實力與人才也是影響AI芯片競爭力的關鍵。
相比英偉達和華為海思,寒武紀有著顯著的資金實力差距,這也是寒武紀要在科創板上市的重要原因。根據英偉達2020財年財務報告,截至2020財年末,英偉達的現金及現金等價物為108.96億美元,2020財年英偉達的研發費用為28.29億美元。華為海思未上市,據公開報導2019年研發投入約為24.39億美元。
除了資金實力與巨頭相差懸殊,人才方面也是寒武紀努力在加強的,所以寒武紀的人員支出在持續增加。寒武紀員工人數從2017年末的80人增長到2019年末的868人。2017年2019年,公司支付給職工以及為職工支付的現金分別為1,512.7萬元、9,300.64萬元和29,818.82 萬元,增長速度較快。
截至2019年末,寒武紀研發人員人數達到680人,碩士及以上學歷人員546人。
單位:人,萬元
市場地位與銷售網絡
產品、技術、人才之後,AI芯片的市場前景,AI芯片公司的市場地位與銷售網絡,很大程度影響著其芯片產品能否落地以及獲得市場的認可。市場方面,根據IDC 報告顯示,雲端推理和訓練所產生的雲端智能芯片市場需求,預計將從2017 年的26 億美元增長到2022 年的136 億美元,年均複合增長率39.22% 。
數據來源:IDC
在一個具備前景的市場裡,已有的市場地位和銷售網絡的影響力非常關鍵,不過這是初創公司需要從零開始構建的,難度巨大。
英偉達2020財年營業收入為109.18億美元,華為海思2018 年營業收入為75.73億美元(根據DIGITIMES 報導),均遠遠超過寒武紀的銷售規模。就人工智能芯片產品來看,英偉達2020財年數據中心業務銷售收入超過30億美元,在全球市場份額中佔有絕對優勢地位。
華為海思云端和邊緣智能芯片產品推出時間不長,2019年該等業務總體銷售規模推測可能與寒武紀銷售規模相差不大,但在國內的終端智能SoC芯片領域具有顯著的優勢。
銷售網絡方面,英偉達、華為海思均有成熟完善的銷售網絡,客戶對產品的認知程度、市場知名度等方面均優於公司。
因此無論是在寒武紀的招股說明書(申報稿)還是上市問詢函回復中,寒武紀失去大客戶華為海思的訂單以及是否對中科曙光有較強的依賴,還有2019年從珠海市橫琴新區管理委員會商務局、西安灃東儀享科技服務有限公司獲得的收入大幅提升都是關注的焦點。
寒武紀回復稱,其與華為海思的4個技術許可合同有3個已經履行完畢,還有一個正在履行。另外,對中科曙光的訂單不存在依賴,從珠海市橫琴新區管理委員會商務局、西安灃東儀享科技服務有限公司獲得的訂單也合理。
產品定價策略
最後,還有非常關鍵的定價。寒武紀稱,其加速卡產品的定價差異主要由公司向客戶交付的硬件產品所配套的系統軟件複雜度、公司向客戶提供的技術服務工作量、估計的同時期競品的定價區間以及市場銷售折扣等因素綜合決定。
另外,寒武紀云端智能芯片及加速卡產品定價、銷售政策由公司自主決定,產品定價在目錄價格的基礎上與配套軟件的複雜程度、向客戶提供的技術服務工作量、估計的同時期競品的定價區間相關,同時根據客戶性質、訂單數量等給予一定的銷售折扣。
寒武紀也列出了與英偉達Telsa P4和T4加速卡的差別。
單位:萬元/塊
注1:由於無法從公開渠道獲取英偉達相同或類似產品的官方銷售價格,英偉達相關產品的售價區間為基於市場信息的推測或估計。
寒武紀認為,其加速卡銷售價格與同行業可比公司英偉達相關產品的估計售價接近,不存在重大差異。
資料來源:各公司官網、年報及其他公開披露資料
小結
寒武紀科技科創板上市申請書(申報稿)以及上市問詢函回复讓寒武紀科技揭開了神秘面紗,寒武紀科技也不得不回复上交所的犀利而關鍵的提問,這是平時寒武紀不太可能、也是盡量會避免回答的問題。
兩份總計五百多頁的資料中除了包含寒武紀自身的關鍵信息,也有大量的基礎信息以及行業信息。比如本文中從問詢函回復中梳理出來的AI芯片公司及產品競爭的關鍵,包含技術、產品、市場、渠道、定價。透過寒武紀的回复,我們不僅能了解寒武紀的技術實力,也能以此類推去判斷一款AI芯片到底如何。