馬斯克劇透新FSD計算硬體:直接冠名AI5 4nm製程算力10倍提升
在放核彈之前,馬斯克搞了一次小小的「試爆」。剛剛透露了特斯拉新一代車載運算平台的資訊:不叫HW5.0,直接改名叫AI5。能耗提升5倍,算力提升10倍。
為啥不叫HW5.0?有啥提升
HW其實就是Hardware的縮寫,字面上自動駕駛系統硬體的意思。
這應該是早期馬斯克直接把內部工程專案的代號拿來當產品名稱了。
創業階段初出茅廬,這樣搞挺好,凸顯特斯拉技術宅、工程師基因。
但現在特斯拉家大業大,全球智慧車產業都在模仿、試圖超越,再這麼隨意,好像也不太合適。
於是馬斯克宣布,我們改名啦,新一代自動駕駛硬體平台,名字就叫——AI5。
這屬於是自動駕駛第一原理命名法了。
老馬透露的相關資訊還有這些:
首先是算力比現款HW4.0提升10倍。
其次是耗電量整體提高4-5倍。
2025年下半年推出。
有這麼幾個點值得留意。算力方面,馬斯克特別提到整個平台的算力大概是HW4.0的10倍。
其實特斯拉從未明確公佈HW4.0的具體數據,只是說是HW3.0的5倍(國內三方資料中的750TOPS數據無官方證實),所以根據已知資訊和國外發燒友的實機拆解測試,大概可以推測HW4.0的算力在300TOPS-500TOPS之間。
也就是單顆FSD晶片200多TOPS算力。
這樣計算,AI5整個平台算力可能達到3000-5000TOPS。
這個數據是十分恐怖的。
目前國內的TOP玩家,如華為、小鵬等等,支撐無圖、輕圖城市NOA功能的算力平台,不過就在400-500TOPS左右。
「芯皇」英偉達Thor,頂配才2000多TOPS,而且業界已經有很多意見認為量產車並不需要如此過剩的算力。
馬斯克到底是在「放衛星」提振外界對特斯拉的信心,還是真的對自動駕駛技術範式做出了革命性變革,是個很大的懸念和看點。
第二個值得留意的是能耗方面。馬斯克提到五代硬體平台,整體能耗比HW4.0提升4-5倍,相較於10倍的效能提升,其實證明特斯拉自動駕駛軟硬結合能力更進一步,能耗控制更合理了。
還要補充一點,車載運算晶片和手機運算晶片的不同之一,就是可以無後顧之憂的打“富裕仗”,不必過於把能耗、尺寸作為衡量優劣的指標。車載運算平台的散熱條件,天然也比PC、手機優良許多。
畢竟電動車的電池容量遠大於手機,就算晶片能耗再高,比起馬達、空調等等,也只能算零頭。
還有一點容易被忽略,馬斯克說AI5是“特斯拉最新一代計算平台”,但是嚴謹地說,特斯拉的業務就只有汽車嗎?
所以這也是大部分網友推測的依據:AI5很可能並不是專門為FSD準備,如此高的算力,匹配的可能是今年8月即將發布的特斯拉Robotaxi、人形機器人Optimus,以及未來支援L4、 L5的特斯拉車型。
也許那時候的特斯拉產品,真的會取消駕駛艙。
不過也有用戶提了一個很尖銳的問題:
之前HW3.0面世時,馬斯克就拍胸脯保證可以實現無監督的FSD功能,但顯然是鴿了。直到今天的HW4.0仍然不行。
AI5一定可以嗎?
AI5會帶來什麼樣的改變?
現在已知的資訊不多,只有一點是較確定的,AI5由三星代工,4nm製程。
最早特斯拉曾表示100%給台積電代工,不過後來馬斯克和三星高層見了一面後,又改了最初的決定。
據說是三星給馬斯克開了一個「沒辦法拒絕」的優惠價格,而且先進製程的良品率提升到70%多,和台積電相差不多了。
所以可以基本肯定,AI5還是會採用基於Exynos-IP的核心。 Exynos-IP是三星基於ARM架構設計的自有IP,Google的手機也用過。
2019三星因為和高通合作,就停止了相關工作,不過Exynos-IP設計非常超前,基本上近似於目前ARM Cortex X系列的旗艦X3的設計,所以2020年後才開始設計的HW4.0,經國外特斯拉爆料大神Greentheonly拆解發現,仍然採用了Exynos-IP。
AI5很可能延續這條路線。
當然,今時不同往日,自動駕駛演算法的技術範式已經發生了深刻變革,從最初的CNN為為主的模組化網路結構,轉變為以Transformer為主的端到端一體化網路。
外界通常更關心自動駕駛晶片的NPU算力,這本身沒錯,大模型時代,當然需要更強的AI運算能力。
但對於自動駕駛任務來說,光NPU變強還不夠,AI處理器的速度再快,算力再高,如果90%的時間都是在等內存搬運數據,那也是白搭。
CNN時代外接CPU足以配合好AI處理器,但到了Transformer,CPU反而成了瓶頸,內建成了最佳選擇。
實際上,HW4.0就是增加了一個CPU以應對Transformer,剛好和特斯拉超算晶片Dojo的D1架構原理相同。
這也解釋了馬斯克在劇透AI5的同時,還特意強調了HW4.0不是直接退役,而是拿去構建訓練集群(和英偉達A100同時服役)。
所以特斯拉對於下一代運算平台AI5的安排和帶來的影響,大概也能推測一二了。
AI5的超大算力,極大可能不是單一晶片或雙晶片實現,而是多個下一代4nm FSD晶片組合的結果。
如果真是單顆/雙顆晶片數千TOPS算力,成本就會到幾乎無法量產,不是汽車工業也不是科技業的玩法。
這也就說明,AI5很有可能是個平台方案,根據任務、場景、產品成本要求不同,「豐儉由馬斯克」。
最複雜的人形機器人,可能會用到數千TOPS算力,Robotaxi可能就會低一點。相應的,特斯拉量產車可能會更低。
至於完全無監督的FSD在車端到底需要多大算力支持,可能馬斯克自己現在也不清楚,仍在摸索中。
「端到端」最合理最高效的模式,到底是全部AI模型化,做成一個大黑盒,還是有條件的、逐步一體化,業內也沒有定論。
AI5最終體現在特斯拉量產車的算力有多大,不好判斷,但肯定大於現在的四、五百TOPS。
所以AI5帶來的衝擊和影響,最直接的是開啟智慧汽車、自動駕駛的算力軍備競賽。
全產業玩家在這樣的競賽過程中,逐漸就會明確端到端自動駕駛的實現基本前提與門檻。
L4也是同樣,AI5在特斯拉的Robotaxi上的探索與試錯,作用也相當於量產車,那就是給Robotaxi的落地打造出一個樣板:多大算力、什麼樣的方案配置、多少成本。
更重要的,是特斯拉身體力行為所有「AGI」玩家打樣:需要什麼樣的技術體系,底層通用平台如何打造,雲端終端的架構分別如何選擇…
來源:量子位