理想自研晶片進展:在新加坡設立辦公室,團隊規模已超160人
與蔚來、小鵬相比,理想的車上市時間最晚,但銷量最高。理想預測今年的銷量可望達到38 萬輛。今年前10 個月,理想的銷售量已經超過蔚來、小鵬的總和。在軟體自研方面,理想的起步也較晚,但目標最高。今年1 月,理想汽車CEO 李想在公司開年內部信中說,理想汽車的願景是在2030 年成為「全球領先的人工智慧企業」。
「具備自動駕駛(能力)的智慧電動車將成為最早的人工智慧機器人,以及創造出物理世界人工智慧的母生態:從AI 的演算法到改變生活的AI 產品,從AI 作業系統到AI 推理晶片,從AI 訓練平台再到AI 訓練晶片等。 」李想表示。
理想正在加大投入力度,補齊智能化方面的短板。在今年三季業績電話會上,理想汽車總裁兼總工程師馬東輝表示,理想將把「智慧駕駛領先」 作為核心策略目標,到2025 年,理想智慧駕駛研發團隊規模預計由目前的約900 人擴張至超過2500 人。
在晶片自研方面,理想也在加大投入。理想同時在研發用於智慧駕駛場景的AI 推理晶片,和用於驅動馬達控制器的SiC 功率晶片。
知情人士對《晚點Auto》表示,理想目前正在新加坡組建團隊,從事SiC 功率晶片的研發。在職場應用LinkedIn 上,已經可以看到理想近期發布的五個新加坡招聘職位,包括:總經理、SiC 功率模組故障分析/ 物理分析專家、SiC 功率模組設計專家、SiC 功率模組製程專家和SiC 功率模組電氣設計專家。
用於智慧駕駛的AI 推理晶片是理想目前的研發重點。《晚點Auto》了解到,理想研發整個SoC(System on a Chip,系統級晶片),其中最關鍵的環節是推理模型加速單元NPU 的前端設計。理想計畫把後端設計部分外包給台灣世芯電子,然後再交由台積電完成製造。
《晚點Auto》了解到,今年10 月下旬,理想智慧駕駛晶片研發團隊已在上海完成集結並封閉,準備突擊流片。在晶片產業,「流片」 即試生產,意思是在研發團隊設計完電路以後,先生產少量供測試用的晶片。
目前理想晶片部門的整體人員規模在160 人以上,分佈在北京、上海,美國矽谷和新加坡。一些部門已經開始執行「大小週」(單雙休循環)機制。
理想晶片團隊屬於“系統與運算群組”,該群組負責人為理想CTO 謝炎。晶片團隊下設NPU 架構、SoC、後端設計、驗證等部門,晶片研發負責人為羅旻,職級為高級總監,向謝炎報告。
凡專家級以上的職位招聘,均需謝炎面試,高級專家級以上的職位需經過李想親自面試。
《晚點Auto》將上述資訊向理想汽車官方求證,截至發稿,未獲回覆。
先做智慧駕駛晶片,雲端晶片也討論過
業界目前研發的智慧駕駛晶片,通常指的是高度整合的系統級晶片,由多種晶片模組組成,包括推理模型加速單元(NPU)、中央處理單元(CPU)、影像訊號處理器(ISP) 、動態隨機存取記憶體(DRAM)等。
理想自研的晶片,正是用於智慧駕駛場景的系統級晶片,以推理模型加速單元NPU (Neural Processing Unit,神經處理單元)為研發重點。
NPU 是一種主要用來加速神經網路的推理運算,也是智慧駕駛晶片中最能做出差異化的核心模組。
通用晶片著重於彈性,具備處理多種指令要求的能力。而專門用途晶片可針對AI 演算法採取特殊設計,具備體積更小、功耗更低、可靠性更高等優點,但研發週期往往更長、研發費用也會更高。
根據《晚點Auto》了解,理想晶片部門NPU 架構的研發負責人陳飛於2022 年4 月加入理想,目前的職級為資深專家。陳飛本科畢業於清華大學工程物理系,博士畢業於美國特拉華大學電子與電腦工程系,曾在英特爾、ARM、蘋果和Google從事CPU 和其他晶片的設計開發工作。
理想汽車官網顯示,其正在透過社會招募管道招募NPU 相關技術人才,列出的全職職位包括NPU 運行時軟體工程師、NPU IP 設計、NPU 調度器技術專家、NPU 架構師和NPU 驗證工程師,工作地點均位於上海浦東新區。
《晚點Auto》了解到,在智慧駕駛晶片自研過程中,理想內部團隊主要做含金量較大的前端設計,目前把後端的實體設計部分外包出去。同時,理想也在自建後端設計團隊。
後端是把前端的邏輯設計轉換成物理設計,相當於把電路原理圖轉成線路圖。國產車載晶片廠商芯礪智慧首席策略長陳超卓表示,由於業界已經具有成熟的製程和流程管控標準,把後端外包出去可以節省時間和成本,是業界的習慣做法。
今年7 月,《台灣時報》曾引述摩根士丹利研報報道稱,理想計劃把智慧駕駛晶片的後端設計部分外包給台灣世芯電子。據了解,晶片的後端設計定型後,將交由台積電完成製造。
世芯電子官網資訊顯示,其目前主要向客戶提供ASIC 專業使用晶片設計、系統級晶片SoC 設計等服務。世芯電子成立於2003 年2 月,2009 年通過台積電認證,2014 年10 月上市,2021 年1 月在北京設立辦公室。在成立之初,世芯電子曾獲得台積電、思科和軟銀等科技公司的投資。
一位接近理想汽車的人士對《晚點Auto》強調,理想車端推理晶片的研發工作較為複雜,在NPU 、SoC 等硬體以外,還包括軟體的開發與適配等,「這實際上是一個好多層的解決方案」。
除車端推理晶片外,理想也曾討論過自研用於資料中心的雲端訓練晶片。一位知情人士認為,在雲端訓練晶片的技術路線選擇上,理想可能不會採用目前應用廣泛的GPU 架構,而是採用與特斯拉AI 超級電腦Dojo 或AI 晶片新創公司Tenstorrent 類似的架構。上述人士表示,“謝炎是做編譯器出身,希望能夠用軟體調度實現降維打擊,提高利用率。”
特斯拉曾在2021 年AI DAY 活動上宣稱,其超算Dojo 採用的D1 晶片基於ASIC 專業使用晶片的思路打造,兼具性能與成本優勢。
在理想汽車2023 年春季媒體溝通會上,李想曾表示:“像特斯拉做自己的AI 訓練芯片D1,它整個體系構建起來以後,大概能做到英偉達A100 六分之一的成本。”
截至今年8 月中旬,根據《晚點Auto》了解,理想管理層仍未對雲端訓練晶片的自研作出詳細規劃。
跟著特斯拉做晶片
2022 年6 月,陳飛曾在一場理想汽車舉辦的校園招募活動上提出,未來智慧駕駛晶片應該具備七大特徵:算力大、可擴展性高、軟體程式容易、彈性高、功耗低、可靠性高、成本低。
在智慧駕駛晶片領域,業界可望實現較現有已量產晶片5-10 倍的效能提升。
他認為目前的晶片並不能把效能做到極致,一個重要的原因是,晶片廠商要考慮通用化,面向整個產業設計製造晶片,而每一家主機廠用的模型可能都不一樣,這就會造成一些浪費,很難達到「量身定制」 的效果。「沒辦法,市面上能夠買到的性能最好的晶片,也就只有英偉達的這種晶片。」陳飛說。
此外,伺服器或手機晶片領域頭部廠商的策略,都是在自己原有優勢架構的基礎上加上AI 推理加速的能力,希望做出一款產品,讓汽車廠商都能夠高效運用。但是,傳統CPU 和GPU 架構的設計初衷並非針對智慧駕駛這個應用場景,如果用來跑智慧駕駛推理應用,晶片的功耗會很大,進而影響在高溫狀態下的整體效能。
「GPU 原來主要是為圖形渲染、3D 加速而設計的,其計算能力比CPU 會好一些,但是具體到智能駕駛的應用上面,也已經顯得有些力不從心。」陳飛表示。
特斯拉是全世界第一個自研智慧駕駛晶片的車企。早在2016 年,特斯拉與Mobileye 合作期間,就從AMD 挖角了晶片產業傳奇人物Jim Keller。當時特斯拉Model S、Model X 上的自動駕駛硬體系統是2014 年發布的Hardware 1.0,搭載Mobileye EyeQ3 晶片,軟體演算法主要由Mobileye 提供。
不過,雙方的合作並不順暢:Mobileye 認為,特斯拉釋放給用戶的功能過於激進;特斯拉則認為,Mobileye 對於研發需求的回應程度不足。2016 年5 月,在美國佛羅裡達高速公路上發生的交通事故加劇了雙方合作的嫌隙。
2016 年10 月,特斯拉推出了以定製版的英偉達Drive PX2 自動駕駛運算平台(由1 顆Tegra Parker 晶片和1 顆Pascal 架構GPU 晶片組成)打造的Hardware 2.0 ,與Mobileye 徹底分手。2017 年8 月,特斯拉又增加了一顆英偉達Tegra Parker 晶片,將Hardware 2.0 升級為Hardware 2.5。
與英偉達合作期間,特斯拉的智慧駕駛軟體能力不斷進化,對晶片的理解也不斷加深。2019 年3 月,特斯拉量產了以2 顆FSD 晶片為基礎的Hardware 3.0,FSD 晶片由特斯拉自研,採用14nm 製程,單顆算力72 TOPS。
根據特斯拉公佈的數據,與採用英偉達晶片的Hardware 2.5 相比,Hardware 3.0 的影像處理速度提升約21 倍(每秒處理幀數由110 幀提升至2300 幀),單體成本降低20%,功耗僅為原來的1.26 倍(從57W 增加到72W)。
特斯拉FSD 晶片,來源:特斯拉2019 年Autonomy Day。
目前,FSD 晶片已在特斯拉全系車型上大規模搭載,累計出貨量超過800 萬顆。多位業內人士對《晚點Auto》表示,從應用角度來說,特斯拉FSD 晶片是目前最先進的智慧駕駛車端推理晶片。
除了車端推理晶片,特斯拉還自研了雲端訓練晶片。2021 年8 月,特斯拉在AI DAY 正式發表Dojo 超算,以及自研的雲端訓練晶片D1 。至此,特斯拉將應用於資料中心場景的晶片研發主動權也拿到自己手中。
根據特斯拉官方先前發布的消息,特斯拉Dojo 超算已從今年7 月開始量產,到2024 年2 月,總算力將達到等效約10 萬張英偉達A100 晶片,進入全球前五名;到2024 年12 月,Dojo 的總算力將達到100 EFLOPS,等效約30 萬張英偉達A100 晶片。
性能方面,相較於採用GPU 路線的英偉達A100 ,在熱設計功耗TDP(Max Thermal Design Power)相同的情況下,特斯拉D1 以更小的晶片面積和更少的晶體管數量,實現了更高的峰值算力。
自研與否,最終要回歸商業模式
特斯拉把FSD 晶片量產之後,中國新勢力理想、蔚來、小鵬都組建了自己的晶片團隊。
李想曾在理想汽車2023 年春季媒體溝通會上解釋稱,在系統的研發方面,車企需要關注平台的成本如何繼續下降。在智慧駕駛的硬體(包括雷達、攝影機等感測器和運算平台)成本上,特斯拉是1500 美元,理想是4000 美元。
「如果理想自己做推理晶片,可以做到像特斯拉一樣的成本,因為演算法掌握在自己的手裡,也包括後面整個的訓練平台、訓練晶片自己做。」李想當時表示。
複雜多變的國際環境,也讓晶片自研更具合理性。
一位接近理想的人士對《晚點Auto》分析稱,「如果理想短時間內不推動智慧駕駛晶片自研,而是一直使用英偉達的晶片,並不會很快出現性能瓶頸,但是英偉達的晶片價格高,而且存在斷供風險。”
目前,智慧駕駛雲端訓練晶片斷供已成為中國多家車企和自動駕駛研發商面臨的真實風險。
10 月18 日,美國商務部下屬工業安全局發佈公告稱,將擴大對華出口先進晶片的管制範圍,受限晶片產品包括但不限於A100、A800、H100、H800、L40、L40S 和RTX4090 。其中,A100、A800、H100、H800 等晶片可用於智慧駕駛的雲端訓練。
10 月24 日,英偉達發佈公告稱,美國政府已通知英偉達,上述晶片出口禁令立即生效,撤回30 天豁免期安排。
智慧駕駛雲端算力競賽是頭部廠商的另一個角力場。6 月17 日,在理想汽車舉辦的「家庭科技日」 活動上,理想智慧駕駛副總裁郎咸朋曾表示,理想智慧駕駛資料中心的雲端算力規模已達1,200 PFLOPS。
11 月10 日,在阿維塔12 的新車上市發表會上,華為車BU 董事長餘承東表示,華為智慧駕駛雲端算力規模已達2800 PFLOPS。
自研晶片的好處很多,風險也不小。
首先,智慧駕駛晶片的技術路線仍未收斂,廠商研發出的產品有可能在量產後很快就被淘汰。
陳飛曾表示,現階段的智慧駕駛模型,主要是基於卷積神經網路(CNN, Convolutional Neural Networks)設計。但是,隨著學術界、工業界的發展,模型的推理方式可能會改變,如果硬體設計只對當前專精於某一類型的模型服務,那麼當更優秀的模型出現時,這個花費大量資源開發出來的晶片可能就會過時。
因此,在設計智慧駕駛晶片時,廠商必須考慮到模型發展的趨勢,讓整個系統保持一定的靈活性和可擴展性。這樣,當新模型出來時,晶片也能夠在現有架構上完成適配,讓新模型高效運作。
其次,智慧駕駛等高算力晶片的研發週期長、資金投入大,不確定性高,若盲目推進晶片自研,也會對企業造成很大負擔。
陳超卓表示,研發晶片特別“燒錢”,一顆高算力晶片的研發和量產需要花費十數億元甚至更高。從商業模式的角度講,晶片廠商的毛利率必須超過50% 才能生存。而車企自研的晶片一般只能自用,由於產業發展速度快,可能一顆晶片只能搭載在一兩代車型上,如果銷量不夠大,商業模式很難撐得住。
再者,車企自研智慧駕駛晶片的最終目的,是實現商業利益最大化,但在晶片出貨量上,多數車企比不過為產業提供通用方案的頭部晶片廠商。
在2023 年中國電動汽車百人會論壇上,地平線創辦人兼CEO 餘凱曾表示,車商應該慎重考慮自研智慧駕駛晶片問題。“自研和他山之石本身是戰略選擇,如果車廠的年銷量預期不到100 萬輛,資金的整個效率其實是算不過賬的。”
陳超卓認為,特斯拉從使用供應商的方案轉為自研,是因為供應商的方案滿足不了特斯拉的要求。透過自研晶片,特斯拉確實已經形成一定的成本和技術優勢。但如果將來有一天,智慧駕駛晶片產業變得更加成熟,產業通用方案能夠滿足車企的要求,車企自研晶片就不具備優勢了。
產業研究機構IDC 中國研究經理王博對《晚點Auto》表示,智慧駕駛涉及複雜的產業生態,對於車企而言,不論以自研路線為主,還是與科技公司尋求合作,在晶片領域的技術累積都有利於其在未來的競爭中爭取更大的主動權。