投身硬科技:騰訊阿里踩過的坑字節又跳了進去
精簡互聯網,投身硬科技,這還是那個我們熟悉的字節嗎?7月21日,據界面新聞從字節跳動內部人士獲悉,CEO梁汝波將個人OKR中的一項更新為“大幅降低2022—2023年招聘計劃,降低組織規模增速,並提升組織效率。”儘管字節跳動今年一再縮招,但其芯片團隊卻仍維持擴張之勢。
自7月以來,字節跳動在招聘網站上發布多個芯片職位,包括SoC和Core的前端設計,模型性能分析,驗證,底層軟件和驅動開發等。
在資質方面,字節對上述崗位提出熟悉RISC-V和ARM系統架構的要求,而在系統開發、驗證兩個崗位上,還有熟悉X86架構的要求。
多條線索都在表明字節跳動正加速推動自研AI芯片與服務器芯片的落地。7月20日,針對自研芯片一事,字節跳動副總裁楊震原回應稱,目前公司無通用芯片商業計劃,也沒有涉足CPU、GPU等通用芯片業務。除了主要採購X86 芯片,字節也和芯片供應商探索RISC 架構芯片在雲端的使用。
“雖然火山引擎目前市場比較小,但還是有這方面的需求。”一位業內人士向虎嗅表示,字節自研芯片將主要用於火山引擎的雲業務上。
論自研芯片,字節跳動算是後知後覺的那一個。早在2010年,百度就率先邁出了第一步,組建團隊開始嘗試研發雲端芯片,並於8年後發布了第一款AI芯片“崑崙”。同一年,阿里達摩院發布神經網絡芯片Ali—NPU,騰訊領投AI芯片公司燧原科技的3.4億元Pre-A輪融資。
但值得一提的是,在造芯這件事上,互聯網大廠們保持了相當程度上的克制。一方面,國內高製程Foundary產能十分有限,如果一股腦地“All in”芯片設計,也存在著“圖紙積壓成山,市場一片難求”的風險。
另一方面,雖然專用芯片不像通用芯片那樣需要繁瑣的配套軟件生態開發,但動輒十幾億的項目投入和兩至三年的研發週期,即使強如BAT,也不得不在這一問題上慎之又慎。
只不過,當下圍繞雲計算的市場競爭,正在迫使大廠們放棄恪守的商業模式,走上自研芯片的道路。
大廠造芯,不得已為之
紙面上說得天花亂墜,不如“降價”二字來得實在。
圍繞雲計算市場的價格戰,已經把大廠們折騰的筋疲力盡,但字節旗下的火山引擎作為2020年才上線的公司,想要從“三朵雲”的口中搶食,還是需要扯起“性價比”的大旗。
國內“大廠雲”的營收大頭仍在IaaS層,作為一項“互聯網基礎設施”,IaaS雲服務算是不折不扣的重資產運營模式,其本質還是服務器資源的租賃,如何降低服務器的成本也就自然而然地成為這場價格戰中參與者最關心的問題。
“行業內造芯的出發點都差不多,就是為了降本增效,儘管自研芯片的前期研發投入比較高,但在規模化投產後,單片成本一定比集中採購低。”一位同屬互聯網大廠芯片從業者向虎嗅做出這樣的解釋。
這其中的量價關係並不難理解,問題是前期投入要高多少?
我們可以算這樣一筆賬,首先說流片,根據業內目前的行情,14nm工藝芯片,流片一次需要300萬美元左右,7nm工藝芯片,流片一次的價格直接飆升到3000萬美元。這還是小版圖的終端芯片價格,雲端芯片的流片價格通常還要高出50%左右。
需要說明的是,即使是高通、AMD這樣的老牌設計廠商也不敢保證第一次流片就成功。此前業內就有小米的澎湃S2芯片連續5次流片失敗,最終設計團隊直接重組的先例。
對於不熟悉Foundary體系的互聯網廠商而言,所需要面臨的不僅僅是成本問題,還有產能與交期問題。
這還只是流片一個環節,在正式流片之前還需完成產品定義、設計、驗證模擬等一系列工作,從事芯片設計的李亞林告訴虎嗅,“以字節的體量來說,後續他們至少要維持一支千人以上的芯片團隊,才能保證項目組的正常運轉。”
另據“投資界”的報導,為了從海思、高通挖走骨幹,字節跳動近期開啟了“三倍薪酬”的挖人模式,而此前,字節已經挖走了高通的資深芯片人士盧山。字節在芯片團隊上付出的工資成本可想而知。
“短期來看,這是一筆怎麼算都會賠本的帳。”上述業內人士對字節造芯做出了這樣的判斷。
儘管資金投入巨大,但眼下的字節跳動,或者說互聯網大廠們的“造芯運動”其實是一件“不得不做”的事情。
“大家用的都是通用型處理器,過去可以藉助芯片製程和軟件優化實現最終效能的提升,但現在硬件廠靠摩爾定律升級這條路被嚴重放緩,軟件又在開源浪潮的下被高度開發,要想繼續提升效能就只能從最底層的專用芯片入手。”虎嗅資深分析師李賡解釋道。
他所提到的專用芯片也可以泛指AI芯片,從技術路線上,FPGA、ASIC和ASSP甚至傳統的GPU,都可以被歸到此列當中。與通用處理器CPU相比,專用芯片具備更多的ALU(邏輯運算單元),雖然不能像CPU那樣執行複雜的指令,但在簡單指令上,算力要比CPU高得多。
因此,在定制處理器的態度上,雲服務廠商也大多秉承著“趕早不趕晚”的原則。
何況在這個行業中,已經有亞馬遜、谷歌等公司作為先行者,且收效頗豐。自2015年亞馬遜收購Annapurna開啟芯片自研之路以來,AWS已經先後歷經百餘次降價,成為業內不折不扣的“價格殺手”。
誠然,這與IaaS行業產品高度同質化下的競爭壓力有關,但能打得起價格戰的前提是,自研芯片對採購成本的大幅度降低。
回到字節造芯這件事上,火山引擎自2020年6月上市後,就打出了“極致性價比”的招牌,在去年的一次採訪中,火山引擎總經理譚待就曾表示,實現極致性價比的方式就是“全棧自研、軟硬一體”。
即使不考慮商用化的問題,就字節自身業務需求來看,由於頭條、抖音等龐大業務也在火山引擎上,支撐這些業務的超過百萬台服務器同樣面臨著巨大的成本壓力,自研專用芯片可能不是一個最優方案,但至少是現階段最可行的方案。
落地場景?我們自帶
除了雲業務的降本問題外,字節造芯可能還有基於應用場景的考量。
“過去行業內關注的重點都落在算力上,但現在基本沒人在乎這個問題,因為算力普遍虛標,投資人更關注芯片有沒有經過落地場景的評估。”一位資深業內人士向虎嗅表示。
楊震原在採訪中也提到,“字節的自研芯片探索主要圍繞自身視頻推薦業務展開,研發團隊將為字節大規模視頻推薦服務專用場景定制硬件優化如視頻編解碼、雲端推理加速等。”
具體來看,視頻編解碼很好理解,對數字視頻進行壓縮或者解壓縮的過程。根據字節2020年披露的數據,在這一年抖音用戶每天上傳的短視頻數量多達6000萬條以及附帶的PB級別的數據量,這對字節服務器的傳輸能力是個不小的考驗。
傳統的編解碼技術大致分為兩種,第一種是英特爾的VAC視覺計算加速卡,它的處理器內置了圖形內核和硬件編碼器,第二種是選擇通用處理器和軟件編碼技術。
這兩種編輯碼技術用於處理一般數據量尚可,但面對海量數據時效費比並不樂觀。谷歌對此的解決方案是,直接設計一個專門用於視頻編解碼的芯片Argos,據谷歌統計,搭載該芯片的VCU(video coding units)將會替換下數千萬個英特爾至強處理器,字節未來規劃的視頻編解碼芯片可能與之類似。
而“雲端推理加速”更像是字節為深化“精準推薦”提前做出的準備。
這裡我們以抖音為例,相信大多數從業者都能認同,抖音的推薦質量代表著字節系,乃至國內互聯網推薦算法能力的最高水平。
但這套推薦算法在抖音日漸臃腫的業務線下已開始“力不從心”。比如僅在抖音的“同城”入口下,就進一步細化為美食、休閒、遊玩等等多個二級入口,如何維持短視頻與本地生活、直播帶貨的高效聯動,成為抖音當下需要面對的問題。
AI推理芯片的應用場景則很適用於抖音複雜的視頻推薦機制。“AI推理芯片可以針對算法進行特殊優化,比如加強視頻結構化分析。”一位智能雲服務器從業人士告訴虎嗅,AI推理芯片的應用可以極大提升結構化數據庫的響應能力。
當然,依靠視頻解碼算力配合AI推理算力實現計算加速,並非是抖音一家的專利。早在2018年,快手就領投了專注AI視覺芯片研發的博瀚半導體,這家公司在去年也不負快手所望,拿出了雲端推理AI芯片。
相較於手機公司在ISP、電源管理芯片、NPU等相對“邊緣化”芯片徘徊的現狀不同,互聯網大廠擁有著複雜的、且需要深度定制的場景需求,這些需求也促使大廠們不得不走出舒適圈,親自下場造芯。
“硬件門外漢”的挑戰
對於自研芯片這件事,字節似乎有著更大的野心,但在執行中卻謹小慎微。
自去年9月開始,字節接連投資了睿思芯科、希姆計算、摩爾線程、雲脈芯聯、潤石科技、光舟半導體等一眾芯片廠商。
有些投資能夠直接反映出字節在造芯上的佈局,比如睿思芯科,這家公司本身就是研發基於RISC-V指令集芯片的獨角獸。還有一些公司與字節的主業無關,比如開發衍射光學芯片的光舟半導體,這類芯片目前最主流的應用場景就是VR頭顯設備,這顯然是字節在為Pico規劃未來。
但截至目前,字節尚未收購任何一家芯片公司。
其中的原因不難猜測,在字節上市之前,他們有充足的理由去縮減風險較高的擴張項目,而長久以來,字節也禁止那些被投資企業打著“字節系”的名號進入市場,以規避“尾大不掉”的帽子。
可問題是,在沒有任何相關從業經驗,東拼西湊地組建一支團隊去造芯,而且還是最底層的雲端AI芯片做起,這事能成嗎?
亞馬遜的大神工程師James Hamilton在提出“做基於ARM架構的數據中心芯片後”的想法後,亞馬遜隨即收購了以色列的初創公司Annapurna Labs,並在兩年後推出了第一顆自研芯片。
無獨有偶,在阿里巴巴芯片項目上馬之初,也是先全資收購了CPU IP Core公司中天微,後來才有了“平頭哥”的成立。
亞馬遜和阿里大費周章地“先收購,後立項”是多此一舉嗎?顯然不是。雖然芯片設計在工藝上沒有Foundary那樣繁瑣,但在產品開發流程的複雜程度上完全不輸於後者。
在一個完整芯片設計團隊中,至少要包含四個二級團隊,市場團隊進行前期需求分析、架構團隊負責架構設計、設計團隊負責邏輯設計、實現團隊完成物理實現,這還不包括驗證仿真和原型驗證等眾多子項目。
“在物理實現階段,如果有一步不能滿足之前的要求,都要重複之前的過程,因此一般公司在操作大項目時,往往都會有多個版本的項目組同步進行,但對於沒有長時間磨合的團隊而言,設計、修改、論證反复循環的過程,會消耗掉大量的資金和時間成本。”在資深從業者李亞林看來,臨時搭建“草台班子”的辦法在芯片行業內絕非長久之計。
更重要的是,字節跳動這家公司此前幾乎沒有任何硬件開發經驗,為數不多的如兩年前面向教輔市場推出的“大力神燈”,其技術和供應鏈管理難度相較於芯片設計有著雲泥之別。
而如今大步邁入芯片行業的字節跳動,在沒有芯片公司班底且缺乏硬件開發經驗的背景下,可能將面對前所未有的挑戰。