谷歌芯片,正在經歷蘋果時刻?
一場秋季發布會上,搭載谷歌首款自研芯片Tensor 的旗艦手機Pixel 6 系列首次亮相,揭下了面紗的它不再神秘,卻留下了更多讓人遐想的空間。谷歌高級副總裁Rick Osterloh 在發布會上表示,這款芯片是“公司歷史上最大的移動硬件創新”,而谷歌CEO Sundar Pichai更是早早地在推特上曬出了Tensor芯片的照片,對於自研項目的自豪感溢於言表。
從開始著手研發,到最終落地量產,Google走了整整四年,當我們翻開Google的發展史,就會發現,Tensor的發展軌跡,總是圍繞著Pixel手機展開,用一體兩面來形容它們再恰當不過。
回過頭來仔細一想,世界範圍內還在堅持自研芯片的手機廠商屈指可數,只有Google和蘋果還一往無前地走在這條路上,蘋果自不用多說,Google呢,又是什麼支撐著它在芯片上不斷燒錢呢?
Pixel意為像素,Tensor代表張量,這兩個單詞,勾勒出了Google自研移動芯片之夢。
一機多芯
說來奇怪,在2017年之前,Google還未擁有真正意義上的手機團隊。
雖然早在2010年1月,Google就攜手HTC推出了自有品牌的首部手機Nexus One,但在長達7年的時間裡,和LG勾肩搭背,和三星眉來眼去,和摩托羅拉稱兄道弟,也和華為牽過小手的Google,並沒有一支完整的手機研發團隊,
所有Nexux手機的後蓋上,不止印有Google的字母,也銘刻著其他品牌的logo,與其說這是Google自研手機,倒不如說是Google版的ODM手機,Google負責印字適配系統,順便提出一堆外觀設計上的需求,而其他廠商就專心負責生產手機。
至於Google曾經豪擲125億美元買下的摩托羅拉移動,完全沒成為業務核心,收購完成後,Google立刻對它揮起了砍刀,全球裁員、精簡產品線、關停辦事處跟研發中心、退出未能盈利的市場、出售工廠和非核心業務……別的公司收購完成後是修建枝蔓,而Google卻是開始挖根。
吸收消化完1.7萬項專利後,Google在2014年又轉手把摩托羅拉移動賣給了聯想,生產了第一部手機的公司卻沒有給Google帶來什麼手機硬件上的遺產,此時的Google頗有些遺世而獨立的味道,笑看眾多廠商在手機市場中廝殺來廝殺去,自己專注於軟件領域,時不時內部還能孵化出一兩個驚世駭俗的新項目,例如曾引起世界矚目的模塊化手機等。
不過當時間往後推移,來到2016年時,情況又不一樣了,Google看到手機市場節節攀升且利潤豐厚時,也不免有了些心動,尤其是在北美市場中,高端Android旗艦三星一家獨大,其他廠商的份額快速縮小,這種送上門來的機會,讓Google重新思考起了整合軟硬件的可能性。
2016年4月,Google挖來了摩托羅拉全球總裁Rick Osterloh來擔任硬件主管一職,正式啟動了自研手機的項目,這次目標直指高端手機市場,尤其是蘋果的iPhone,Osterloh在採訪中絲毫不掩飾Google在這方面的野心:“我們的重點是努力推動用戶進入Android 生態系統,尤其是在高端市場。”
2016年10月,Google Pixel手機登場,Pixel即為像素,代表了這部手機具備的強大影像功能,Google在發布會上強調,DxOMark 將Pixel 評為了當年的最佳智能手機相機,其中歸功於Google改進的HDR+ 技術,在Google Pixel 上,相機應用會在用戶打開時立即捕獲照片緩衝區,以顯著減少快門延遲,大幅改善了用戶拍攝的體驗。
由於Pixel初代推出的稍有匆忙,銷量也不盡如人意,但一時的失敗並沒有讓Google感到氣餒,從這款手機上收穫的反饋,反而堅定了它繼續走全新硬件戰略的信心,2017年9月,Google以11億美元的價格,收購了代工Pixel的HTC移動設備部門,全力押注即將推出的Pixel新款手機。
2017年10月,Pixel 2系列正式發布,搭載高通驍龍835的它與上一代Pixel相比,硬件上升級的地方並不多,但在Google官方的新聞稿中,著重強調了一件事,Pixel 2和Pixel 2 XL上不僅有一塊三星代工的SoC,還有一塊由Google自研的協處理器——PVC(Pixel Visual Core)。
Google表示,Pixel 2的攝像頭配備了出色的硬件、軟件和機器學習,用戶只需對準攝像頭拍攝,就能拍出令人驚嘆的照片和視頻。其中HDR+是幫助拍攝出色照片的技術之一,它能讓用戶在從光線昏暗的風景到陽光明媚的天空等亮度範圍較大的場景中拍攝出出色的照片,而為了擴大HDR+ 的應用範圍,處理最具挑戰性的成像和機器學習應用,並提供更低延遲和更省電的HDR+ 處理,PVC應運而生。
具體硬件方面,PVC的核心是Google 設計的圖像處理單元(IPU),其擁有8 個Google設計的定制內核,每個內核都有512 個算術邏輯單元(ALU),在手機上使用時,可提供每秒超過3 萬億次運算的原始性能。
對於拍照的提升更是巨大,Google官方的數據顯示,通過PVC,HDR+的運行速度能比在應用處理器(AP) 上運行快5 倍,而能耗卻不到十分之一。
這塊處理器在當時引起了不小的轟動,此前大家的思路都局限在了給手機處理器的ISP做優化上了,如果能用一塊算力更強勁,能耗更低的芯片來替代自帶的ISP,移動影像的提升還不是手到擒來嗎?
這種思路很大程度上影響了國產手機廠商,例如OPPO的馬里亞納X,小米的澎湃C1、vivo的V1……廠商們陸續開啟了對自研ISP的探索,Google引一時潮流,也在接下來幾年時間中多次奪得移動影像比拼的桂冠, Pixel 2 和Pixel 3 獲得了98和101的DxOMark移動影像分數,且後者在單鏡頭移動影像中與iPhone XR 並列第一,證明了自研芯片的可行性。
一機多芯就此成為了GooglePixel手機的標誌之一,所有人包括手機廠商都在好奇,之前極少參與硬件研發的Google,怎麼突然拿出了PVC這樣的大殺招?難不成是有高人在背後指點?
自研道阻且長
Google的Pixel Visual Core並未站在巨人肩膀上,因為它自己就已經是小巨人。
Google的自研始於2013年,當時的Google AI負責人Jeff Dean經過計算後發現,如果有1億Android用戶每天使用手機語音轉文字服務3分鐘,其中消耗的算力就是Google所有數據中心總算力的兩倍,而全球Android用戶遠不止1億。
數據中心的規模不可能無限制地擴張下去,Google也不可能限制用戶使用服務的時間,這時候就得尋找另外一條出路,但無論是是CPU還是GPU,都難以滿足Google的需求:CPU一次只能處理相對來說很少量的任務,GPU在執行單個任務時效率較低,而且所能處理的任務範圍更小。
Google最終選擇了另闢蹊徑,並立下了一個不低的目標:針對機器學習這一目的來構建特定領域計算架構(Domain-specific Architecture),還要將深度神經網絡推理的總體擁有成本(TCO)降低至原來的十分之一。
2014年,GoogleTPU(Tensor Processing Unit)開始正式研發,得益於Google本身既有的強大科研實力,以及從各個公司招募而來的優秀芯片人才,TPU的開發異常順利,僅在15個月後就開始在數據中心部署應用,且每瓦性能達到了GPU的30倍,CPU的80倍。
Google在這件事上表現得還非常低調,直到2016年的Google I/O開發者大會上,首席執行官Sundar Pichai才正式向世界展示了TPU這一自研成果。
Pichai非常自豪地表示,DeepMind研發的AlphaGo能夠擊敗韓國棋手李世石,底層硬件裡的TPU功不可沒, TPU就像希臘神話中引發特洛伊戰爭的女人——海倫,它的出現引起了“成千芯片與之競逐”。
五年後,Sundar Pichai又在2021年Google I/O開發者大會公佈了TPU v4:
“AI技術的進步有賴於計算基礎設施的支持,而TPU正是Google計算基礎設施的重要部分。新一代TPU v4芯片的速度是v3的兩倍多。Google用TPU集群構建出Pod超級計算機,單台TPU v4 Pod包含4096塊v4芯片,每台Pod的芯片間互連帶寬是其他互連技術的10倍,因此,TPU v4 Pod的算力可達1 ExaFLOP,即每秒執行10的18次方浮點運算,相當於1000萬台筆記本電腦的總算力。”
時至今日,TPU已經成為Google自研技術的代表之一,數以千計的它部署在數據中心當中,執行著數以億計的AI計算任務。
從某種意義上來說,TPU想要取代的是像英偉達A100和H100這樣的加速卡,而針對英特爾應用於服務器的至強CPU,Google又自研了另一塊芯片——Argos VCU。
2021年3月,Google在ASPLOS 會議上首次詳細介紹了一塊應用於YouTube服務器的自研芯片,即Argos VCU,它的任務很簡單,就是對用戶上傳的視頻進行轉碼。
但也別小瞧了這項任務,用戶每分鐘會向YouTube上傳超過500小時的各種格式的視頻內容,而Google則需要將這些內容快速轉換成多種分辨率(包括144p、240p、360p、480p、720p、1080p、1440p、2160p和4320p)和各種格式(例如,H.264、VP9或AV1),沒有一塊具備強大的編碼能力的芯片,想要快速轉碼就是一件不可能的事情。
Google試過兩種第三方解決方案,第一種是英特爾的視覺計算加速器(VCA),包含三個Xeon E3 CPU,內置Iris Pro P6300/P580GT4e 集成圖形內核和先進的硬件編碼器,第二種則是利用英特爾至強處理器外加軟件編碼來完成任務。
但不論是前者還是後者,都需要龐大的服務器規模和巨額的電力損耗,都是Google所不能承受之重。
於是,Google在TPU之後,開啟了VCU的研發。負責監督YouTube 龐大基礎設施的Google 工程副總裁斯科特·西爾弗(Scott Silver) 表示,從2015年開始,大約有100 名Google 工程師組成的團隊投身設計第一代Argos 芯片,在此後幾年當中,這支團隊不僅完成了研發,還讓芯片應用在Google的數據中心當中,而Argos的實力也得以展現——它處理視頻的效率比傳統服務器高20 到33 倍,處理高分辨率4K視頻的時間由幾天縮短為數小時。
而下一代Argos或許早已悄悄在服務器中上線了,根據報導,Google自研的第二代VCU將支持AV1、H.264 和VP9 編解碼器,可以進一步提高其編碼技術的效率,也將會是YouTube內容創作生態的最有力支撐。
最讓人感到驚訝的是,Google對自研芯片有一張非常清晰明確的藍圖,往往是從實際應用的角度出發,針對自身的需求而開發,自研不是目的,而是一種實力允許下的高明手段,利用它來完成別家芯片乾不了的事情才是最終目的。
也正是基於這種思路,2017年的Google Cloud Next ’17 大會上,Google順勢推出了名為Titan的定制安全芯片,它專為硬件級別的雲安全而設計,通過為特定硬件建立加密身份,實現更安全的識別和身份驗證,從而防範日益猖獗的BIOS攻擊。
與前面兩塊芯片都有所不同,Titan芯片面向的並不全是Google自己,它的出現是為了說服企業,數據存在Google雲中比企業的本地數據中心更安全,
Google表示,自研的Titan芯片通過建立強大的基於硬件的系統身份,來驗證系統固件和軟件組件,保護啟動的過程,這一切得益於Google自己創建的硬件邏輯,從根本上減少了硬件後門的可能性,基於Titan的生態系統也確保了設施僅使用授權且可驗證的代碼,最終讓Google雲擁有了比本地數據中心更安全的可靠性。
從TPU到VCU,再到Titan,Google逐步構建出了自己未來的護城河,還成功帶起了一股大企業自研芯片的風潮,Meta、特斯拉、微軟、騰訊、阿里巴巴、字節跳動……無數企業跟隨Google而揚帆,在芯片之海中競逐。
而Google自研芯片的三板斧,從2013年開始,到2023年,走過了十年的旅程,也恰好是一個懵懵懂懂的學徒,變為授人以漁的師傅的成長過程。
處處不如意的移動芯片
回到Pixel 2系列上的PVC,Google能在2017年拿出這樣的芯片,實際上已經不會讓人感到意外了,畢竟不論是TPU還是VCU,本身就與圖像有著千絲萬縷的關係,在它們的基礎上研發一塊專為手機影像而生的芯片,當然能有事半功倍的效果。
但PVC卻沒能帶動Pixel系列的銷量,根據彭博社發布的IDC數據,Pixel初代的總銷量為330萬台,Pixel 2系列總銷量為400萬台,僅僅增長了70餘萬台,約等於當年北美市場中三星和蘋果高端旗艦銷量的零頭。
而Google卻沒把銷量放在心上,還源源不斷地把服務器領域積攢的自研經驗轉換到智能手機上,2018年10月,Pixel 3系列正式發布,除了繼承了Pixel 2的PVC外,它還用上了另一塊Google自研芯片——Titan M。
沒錯,前文中提到的Titan芯片在一年後就應用於Google最新旗艦之上,這也是自研所帶來的優勢之一,曾經為企業用戶專有的安全芯片,如今散佈在每一台手機終端之上。
發布會上,Google表示Pixel 3已經成為了迄今為止最安全的手機,原因就來自於它搭載的企業級安全芯片Titan M,在Google雲數據中心採用的Titan芯片的基礎上,Google針對移動設備進行了深度的定制,從而保護了用戶的安全和隱私。
事實上,Pixel 2系列就已經內置了一個獨立於處理器之外的硬件結構,名為Security Modeule的它還擁有了自己的Flash/RAM/處理單元等組件,而Titan M就是在它的基礎上,融入了Titan芯片的成果。
Titan M對智能手機的保護從Boot 層面開始,與Verified Boot 進行了深度整合,還可以幫助Pixel 3/XL 來驗證鎖屏密碼,限制不良程序試圖解鎖手機的次數,同時也可以保護第三方應用和涉及到安全敏感性的交易,算是安全領域當中不折不扣的多面手。
為了證明Titan M沒吹牛,一年後,Google直接推出了一項專門的Android安全獎勵計劃:如果安全研究人員發現並且證明Google自研的Titan M安全芯片中存在缺陷,就可以獲得最高100萬美元的賞金。
有沒有人獲得這筆賞金還不清楚,但Google敢開出100萬美元的價碼,就足以證明Titan M的可靠性,此後接連數代Pixel手機,都搭載了這一塊安全芯片,算是為Pixel用戶的隱私安全立下了不小的功勞。
只可惜,不論是PVC還是Titan M,對於Pixel手機的銷量都沒有太多幫助,Pixel 3系列總銷量900萬台,其中主要是定位中端的Pixel 3a系列立下的功勞,沒有搭載PVC的它反而幫Google隱隱摸到了千萬銷量的門檻。
但之後兩代Pixel手機的銷量就可以用慘淡來形容了,2019年10月,Pixel 4系列正式發布,把PVC升級到了全新的PNC(Pixel Neural Core),相較於PVC,PNC讓手機可以實時預覽雙重曝光和HDR+,讓用戶在按下快門之前就看到最終成像,圖像計算能力有了進一步的提升,但包括Pixel 4a系列在內,這一代總銷量為550萬台左右,對比上一代反而大幅倒退
而Pixel 5直接破罐子破摔,原本應是旗艦的它,用的只是高通驍龍765G,不僅沒有最新的PNC,也沒有PVC,包括Pixe 5a在內,最終銷量只有可憐的200萬台,比初代的銷量還要低,甚至有了Google要關停Pixel產線的傳言。
這也讓大家對手機上的自研芯片產生了懷疑,Google在服務器自研芯片上混得風生水起,到了移動市場卻是水土不服,幸幸苦苦五六年,加起來還沒蘋果iPhone單機型一年的銷量高,到底是誰出了問題?Googleor自研?
回頭來看,不論是PVC還是PNC,它們本身是作為一種協處理器而存在的,額外的成本注定讓它們無緣於中端手機,但銷量最高的又恰恰是中低端手機,最大的自研賣點只能留給旗艦,如何做取捨就是一件非常痛苦的事情。
磕磕絆絆的GooglePixel,命途多舛的自研芯片,Google陷入了漫長的迷茫當中。
Google的蘋果時刻
消沉之後,Google的選擇是繼續燒錢。
2021年10月,Google如期舉辦Pixel秋季發布會,自研的Tensor芯片瞬間引起了全球的關注,繼蘋果A系列、三星exynos、華為麒麟之後,又一家手機廠商下場造芯,性能如何,體驗怎樣,前景又如何,都是大家關心的問題。
雖然Google再三強調Tensor的自研屬性,但這顆芯片並不是Google一手創造。
通過TechInsights的拆解可以看到,Tensor的封裝尺寸為10.38mm x 10.43mm = 108.26mm 2,內部芯片標識為“S5P9845”,符合傳統三星Exynos處理器命名規則,如Exynos 990的芯片標識為S5E9830,Exynos 2100 5G SoC芯片標識為S5E9840,這個相似程度,已經不能用三星代工的原因搪塞過去了。
事實上,三星在2020年左右時,正式開放了半定制芯片設計的服務,韓媒ETNews的報導中提到,三星電子將為思科系統和Google製造半導體芯片,並負責從設計到生產的整個半導體製造流程,其戰略是從設計階段就提供客戶所需的定制技術和功能,而Google的Tensor芯片,就是三星半定制設計的最終產物。
具體到硬件上,Tensor和Exynos 2100也是大同小異,只是Google在CPU的頻率與二級緩存上略有增減,在GPU的規模和頻率上更為激進,此外Tensor還集成了Google自研的ISP和TPU,外掛了三星的基帶,Google的自研芯片看上去像是一個完全版的Exynos 2100,即使是去年剛發布的Tensor G2,整體也是在Tensor的基礎上修修改改,沒有太大的變化。
這時候就有一個問題了,在別人的基礎上完成產品設計,到底算不算自研呢?
這個問題如果討論下去,那真是三天三夜都不會有什麼結果的,有人認為,只有全流程的自研才配叫自研芯片,也有人認為,只要根據需求定義了芯片,有創新性的可以叫做自研。
Google發布的Tensor明顯更接近於後者而非前者,事實上,國內幾家手機廠商所謂的自研ISP,大部分也是這種形式,對芯片設計公司提出需求,兩家聯合定義一塊全新的芯片,並買斷之後的知識產權,官方的新聞稿裡也大多標著自研。
這時候倒也不必對Google和國產廠商有多少苛責,因為在手機芯片尤其是SoC上,沒有任何廠商能夠拍著胸口說自己做到了全流程的自研,大家都要乖乖地從Arm那裡購買指令集和新IP的授權。
更何況,這條路上早就有了蘋果的腳印。
iPhone 2G、iPod Touch 2、iPhone 3GS和iPod Touch 3上分別搭載的是APL0098、APL0278、APL0298和APL2298這四款SoC,雖然有蘋果的絲印,代號也是APL,但設計代工的全是三星操刀,它們真實的代號其實是S5L8900、S5L8720、S5L8920和S5L8922。
2010年1月,蘋果推出iPad 1時,裡面的芯片不再沿用APL的代號,而是名為蘋果A4的嶄新自研芯片,但在當時就有人對這塊芯片提出了質疑,原因很簡單,和同時期的三星S5PC110在硬件架構上過於相像,前者只是在後者的基礎上做了一部分調整。
有媒體更是用上了抓眼的標題:蘋果iPad 和三星Wave (搭載S5PC110的手機)共享大腦。
但今天已經不會有人質疑A4是否真的是蘋果自研了,原因不僅是蘋果早在2008年就開始了自研的佈局,包括收購PASemi和Intrinsity,還有蘋果之後性能日益強大,遠超同時代芯片性能的A系列芯片,以及2020年末絲毫不遜色於英特爾的M系列芯片。
而用更通俗的話來說,三十年河東,三十年河西,莫欺少年窮,當年的蘋果勢弱,只能依靠別人的芯片來構築自己的產品,而在全球暢銷億部iPhone後,蘋果也終於得以完成自己理想中的芯片,且是業界首屈一指的自研芯片。
巧的是,不論是GoogleTensor還是蘋果的A4,都和三星有著莫大的關係,從設計到代工,兩款相隔十餘年的芯片竟也能找到許多相似之處。
今日GoogleTensor,昔日蘋果A4,都是兩家公司在自研的路上邁出的艱難一步。
但Google的Pixel,遠不能與iPhone比擬,而此時前文中的問題的答案終於浮出水面,手機的銷量不行,毛病不是出在自研芯片上,而是Google對於整個Pixel產品力的把握出了差錯。
Pixel初代定位即是影像,Pixel 2加入的PVC就是Google為了影像所做的努力,但在之後的三到四年當中,Pixel的影像卻彷彿停滯了,與此同時中國手機廠商也開始捲起了影像,逆水行舟,不進則退,Google在自研芯片上表現出來的先進,根本無法彌補傳感器攝像頭硬件上的落後,Google本意是對標蘋果iPhone,但iPhone此時早已不是拍照方面的標杆。
Google在服務器自研芯片上快速迭代,而在Pixel自研芯片上卻拖拖拉拉,PVC花了三年迭代到了PNC,Tensor G2性能原地踏步,兩相對比之下,實在有些諷刺,背後除了手機部門的本身判斷失誤外,和Google對業務比重的權衡也有莫大的聯繫。
Google正在經歷蘋果發布A4芯片的那個時刻,但它卻沒有蘋果的魄力,根據The Information的報導,Google已將其首款完全定制芯片的發布推遲到2025年,也就是說,Google還要接著繼續用三星的半定制化設計,也意味著未來兩年的Tensor芯片牢牢綁定在了三星工藝之上。
手機市場瞬息萬變,兩到三年就又是一輪洗牌,Google原意是想把Pixel打造成Android領域當中的iPhone,如今七八年時間過去了還沒起色,縱然它財大氣粗,真的還能允許手機部門繼續在燒錢的路上義無反顧嗎?
自研本來是Google的底氣之所在,如今看來,倒像是成了Pixel手機的最後一塊遮羞布。
不難發現,不少國產手機廠商都如Google一般,在經歷著這樣的蘋果時刻,倒推一步是技術依賴,前進一步是真正自研,前面是碧海藍天,後面是萬丈懸崖,每一個小小的決定,都會影響到未來五六年的發展。
誰能完成蘋果般的轉身呢?