英偉達算力降維打擊,中國汽車芯片出路在哪?
能打敗黃大仙的或許只有他自己。“今天,我們宣布Atlan不再是第一了……”皮衣教父黃仁勳在9月20日晚的GTC 2022上平靜的宣布這個消息,他還有一個身份是英偉達創始人兼首席執行官。黃仁勳的下半句是,“取代Atlan的將是Thor”,並表示其性能將是Atlan的兩倍。
英偉達SOC算力示意圖
Atlan是英偉達去年推出的一款5nm製程的1000TFLOPS算力的自動駕駛SOC芯片,原本計劃2024年上市,隨著Thor的面世,Atlan還沒出生就成為歷史。
1TFLOPS代表處理器一秒進行1萬億次浮點運算,這意味著Thor每秒將進行2000萬億次的運算。要知道,目前特斯拉的FSD(完全自動駕駛)自研芯片的算力為144 TOPS,Thor的算力約為前者的14倍。
GPU霸主英偉達,攜算力優勢殺入汽車芯片市場,正在對全行業降維打擊。
面對英偉達的發起的算力軍備競賽,其它芯片廠商還有沒有還手之力?
作為中國芯片產業與世界差距相對較小的領域,地平線、華為、黑芝麻等國產汽車芯片在大變局下又將何去何從?
汽車算力革命進行時
英偉達大搞算力競賽的背後,是汽車芯片領域的一場巨大變革。
在傳統汽車上,需要計算機自動控制的功能並不多。但是隨著新能源時代開啟,汽車對電子化的要求正在突飛猛進,從自動和輔助駕駛,到智能座艙,都需要強大的芯片控制。
可是芯片變多了,需要的電線也變多了,汽車變得像我們的電腦桌一樣,亂糟糟的電源線看著都糟心。
車輛線束複雜度增加,還不只是糟心的問題,更是直接導致了更高的成本和更複雜的設計。特別是車輛智能化時代,各項功能的增加直接導致電子控制單元(ECU)數量的激增。
按照《自動駕駛車輛工程》雜誌統計顯示,高檔轎車和全尺寸卡車可能使用了40種不同的線束,搭載了超過700個連接器和3000條電線。如果把汽車上的電線全部連起來,其長度可以超過4公里,重量將達到60公斤。
化繁為簡、降低整車線束複雜度成為新需求。而減少線束最有效的方式,就是減少芯片數量。
在此背景下,零部件Tier1企業博世2016年最早提出域控制器的概念,將整車ECU整合為駕駛輔助、安全、車輛運動、娛樂信息、車身電子5個域,各自只需要一個域控制器,就可以替代過去大量的獨立ECU。
特斯拉的做法更激進,直接按照車身域劃分成前車身域、左車身域、右車身域三部分,實現整車控制。
根據中信證券近期拆解特斯拉model3的信息顯示,前車身控制器包括ESP 車身穩定係統等安全相關、冷卻液泵熱管理相關、車頭燈和雨刮等其他功能;左車身域控制的核心芯片控制和配電,包括左車身的燈具以及電機;右車身域負責空調、雷達、高位剎車燈和後機油泵等控制。
特斯拉域控制器示意圖
汽車行業普遍認為,域控制器是汽車電子行業未來競爭門檻最高、利潤最高的部分。想用一個域控制器,實現多個ECU的功能,最大的門檻當然是算力提升。
提到算力,英偉達可就不困了。
博世和特斯拉的域控制器模式也帶動汽車產業迎來一次革新,黃仁勳想接過接力棒。對於自動駕駛而言,2000TFLOPS浮點算力已溢出,他的野心是將域控制器再集成。
黃仁勳在演講中明確表示,Thor這顆SoC芯片就是為汽車的中央計算架構而生,用這一顆芯片打造一個控制器,即可同時為自動泊車、智能駕駛、車機、儀錶盤、駕駛員監測等多個系統提供算力。“Thor支持計算域分隔開發,既能將2000TOPS全部用於自動駕駛工作流,也可以分配使用,將一部分用於智能座艙、AI娛樂,一部分用於輔助駕駛。”
言下之意,Thor不僅僅是Orin X自動駕駛芯片的升級版,同時還可以替代高通8155、8295等座艙芯片的工作。不只是要攪局智能駕駛芯片的市場,黃仁勳還要和競爭對手高通搶占座艙、娛樂芯片的份額。
汽車產業有一個共識,傳統燃油車時代低算力MCU無法適應車輛智能化發展,汽車架構已由傳統分佈式架構轉向域控制器,數量更少的大算力ECU替代龐雜的MCU,下一步是由域控制器轉向中央式電子電氣架構。英偉達正在引領汽車芯片的第二次革命。
據悉,Thor芯片將最先在極氪車型上量產交付,第一站就選擇中國市場。
不只是黃仁勳,想引領第二次芯片革命的廠商並不少。德國零部件安波福今年9月表示,已推出全球首款整車中央計算平台CVC,將率先在中國市場運用,集成ADAS、車身功能、網關及VCU功能,可處理汽車中數百個組件的通信信號。新勢力小鵬則是表示,新旗艦G9將採用“中央超算+區域控制”的融合硬件架構。
算力很好,但不是全部
英偉達算力霸權難以撼動,其它芯片廠商的出路在哪?
首先,儘管中央式電子電氣架構是所有人的理想,但是現行的多個域控制器方案並非不可接受。通過多個低算力芯片的堆疊,來獲得跟高算力類似的效果,是當下車企通行的做法。
目前,很多主機廠已經通過多芯片堆疊,將算力堆到1000TOPS級別。例如,今年陸續上市的新車蔚來ET7、ES7和威馬M7,均搭載4顆7nm製程的英偉達orin芯片,算力達到1016TOPS。魏牌摩卡則是採用高通Snapdragon Ride自動駕駛平台推出的5nm製程的SA8540P+SA9000P芯片組合,算力達到1440TOPS。
更重要的是,絕對算力並不等價於最終的實車應用效果,很多低算力芯片的實際表現,未必輸給高算力。
換句話說,高算力的確在面對更複雜的場景時響應速度。例如在車機系統領域,避免黑屏、宕機的窘境。但英偉達、高通、Mobileye提供的是通用智能駕駛平台,主機廠或者自動駕駛公司能否將芯片的算力發揮到100%?
美國輔助駕駛巨頭Mobileye首席執行官Amnon Shashua就指出,TOPS是一個非常不充分的計算能力指標,效率比算力更重要。
國產芯片廠商地平線CEO余凱在反駁英偉達CEO的“TOPS就是新的馬力”時直言,“百公里加速比馬力更真實反映動力性能,每秒準確識別幀率MAPS比算力更能反映芯片的AI性能”。
對於英偉達亮相的Thor系統芯片,地平線相關人士告訴觀察者網,“落地到量產應用層面,還是要關注車企的實際需求,車企的成本以及消費者的購買成本。我們還是更加強調效率,強調軟硬結合。”
究其原因,決定芯片性能的並不只有硬件,還有軟件,以及軟硬件對具體需求的適配。汽車芯片並不是一個完全標準化的行業,不同的主機廠、不同的功能設計,對芯片都會提出不同的個性化需求。
其實,這可以類比手機市場。蘋果堅持自研芯片,而非採購高通芯片,更好適配IOS系統,實現軟硬件匹配。
在芯片與整車的適配方面,目前的優等生是特斯拉。
特斯拉沒有一味強調算力,其FSD自研芯片的算力為144TPOS,但在點到點的駕駛輔助方面,比算力更強大競爭對手反而做得更好。
余凱也在第十四屆汽車藍皮書論壇上展現過一組數據,在國際權威的深度學習圖像數據集MS CoCo上的物體檢測跑分中,地平線的征程5芯片每秒準確識別幀率(MAPS)高達1283FPS,而英偉達Orin為1001FPS。
每秒準確識別幀率對比
而在典型Backbone1080P模型上,征程5的AI性能和Orin-X不相伯仲,但能效是Orin-X的330%;在優選高效模型下,軟硬結合後征程5性能超過Orin-X,能效高達Orin-X的870%。
“我們只有orin芯片售價的一半。”余凱如是說。
國產芯片的獨特優勢
不拼算力拼性能,國產芯片企業還有一層獨特的優勢,那就是算力不夠,服務來湊。
英偉達Thor的算力固然強大,但從目前的表態來看,它只打算做一個開放式的通用平台,允許主機廠在平台上自行研發適配,而不會親自下場提供個性化服務。
而國產芯片企業一貫的優勢,就是對主機廠服務更加細緻。主機廠不擅長軟硬件研發,芯片企業可以直接為它們提供個性化開發服務。
理想汽車CEO李想曾感慨,“感謝地平線,中國有這樣的芯片企業,未來充滿希望。”
相比於理想此前合作廠商Mobileye,地平線顯然更打動李想。李想表示,地平線直接派團隊入駐理想協作優化智能輔助駕駛功能,經常一起加班到12點解決智能駕駛問題。
不同於地平線開放性工具鏈算法,Mobileye上一代芯片EyeQ4不支持車企進行本地優化。Mobileye的封閉性造成理想在面對中國道路問題時,只能自行在Mobileye前視攝像頭旁增設一個攝像頭,用於道路數據採集,對輔助駕駛系統的算法訓練。
憑藉性價比、本土化服務,地平線、黑芝麻、華為贏得主機廠的訂單。比亞迪、一汽紅旗征程5前裝車型明年面市。華為則是推出車規級智能駕駛計算平台MDC,阿維塔11、阿爾法S搭載MDC810智能駕駛計算平台,長城沙龍機甲龍、廣汽Aion LX Plus、哪吒S等搭載的MDC610平台。
不過,國際芯片巨頭並不願意丟失中國市場。Mobileye推出的EyeQ5已開發軟件棧算法,支持第三方代碼。同時在中國設立技術團隊,協助主機廠解決自動駕駛方案。此外,Amnon Shashua在今年的CES2022亮相的第七代車規級芯片EyeQ Ultra,預計2023年量產的支持L4級別自動駕駛。
中國作為全球最大的新能源汽車市場,已經是兵家必爭之地。國內廠商加速下一代芯片研發,地平線方面表示,基於全新BPU納什架構打造的征程6芯片正在研發中,AI算力可實現數倍提升。而國際芯片廠商已開始發力,彌補服務方面的缺陷,國內芯片廠商能否應對?
一場苦戰在所難免,但中國芯片並未失去希望。