Meta為何拒絕使用高通AI芯片?
據報導,高通是全球最大的智能手機處理器供應商,在芯片的計算能力和能效方面都非常完善。2019年高通宣布,基於在智能手機芯片領域的技術和經驗,將進軍數據中心人工智能芯片這個快速增長的市場。
兩名知情人士透露,高通曾向Facebook的母公司Meta Platforms示好,希望Meta能成為高通首款數據中心AI芯片AI 100的標杆客戶。在高通2020年秋季發布這款芯片之後,Meta將這款芯片與一系列其他選擇,包括該公司此前一直使用的芯片,以及Meta自主開發的用於處理AI計算的專用芯片,進行了對比測試。根據知情人士的說法,高通的芯片在測試中表現良好,單位能耗性能最優異。對於Meta這樣的公司來說,由於其數據中心服務數十億用戶,因此能效的提升可以給運營成本帶來巨大的優化。
然而知情人士表示,到2021年春季,Meta表示拒絕使用高通的芯片。具體原因在於,Meta質疑高通芯片的配套軟件不夠成熟,無法在未來的具體計算任務中發揮出芯片的最佳性能。一名知情人士透露,在評估各種選擇之後,Meta決定繼續使用現有芯片。
這一事件此前從未被媒體報導過,但也表明,軟件已成為AI芯片爭取客戶的核心因素之一。IDC分析師肖恩·拉烏(Shane Rau)表示,AI芯片的銷售額預計今年將達到135億美元,到2026年還將增長至413億美元。他說:“至少在未來15到20年內,市場對AI芯片的需求幾乎是無限的。”
高通芯片是全球數十億部智能手機的核心,同時也支撐了智能手機拍照優化等AI功能,但AI 100是該公司在與英偉達競爭中的第一次嘗試。在數據中心AI芯片領域,英偉達目前佔據了壓倒性的優勢。該公司的主導地位不僅來自於芯片,也來自於配套軟件。英偉達的軟件是人工智能行業目前的黃金標準。
風險投資公司Playround Global的一般合夥人皮特·巴雷特(Peter Barrett)表示:“不僅僅是高通,每個人都在與英偉達CEO黃仁勳進行軍備競賽。他關注深度學習領域的發展,並註意到技術的發展速度。他在軟件方面的努力有助於維持公司的領先地位。”Playground也投資了MosaicML等公司,這些公司幫助人工智能客戶將他們的模型匹配至合適的硬件。
可以肯定,Meta的拒絕很可能只是高通在AI芯片領域暫時遇到的挫折。就在2021年9月,在Meta的測試之後,AI 100芯片在MLPerf基礎測試中取得了多項第一。MLPerf基準測試是一套用於衡量AI芯片性能的行業標準。行業觀察人士預計,在今年春季再次進行的測試中,高通的芯片也將表現良好。高通已經宣布了AI 100的首家客戶:富士康工業互聯網。該公司正在一台用於分析安防和交通攝像頭視頻的服務器中使用這款芯片。
與此同時,高通也在繼續爭取微軟等其他潛在客戶。微軟發言人拒絕對這方面的動態置評。
高通計劃將AI 100芯片用於推理計算,推理計算使用基於海量數據訓練的AI模型來做出實時決策。在Meta的場景中,這通常意味著基於推薦模型,在毫秒時間段內決定向用戶展示哪些內容。
為了取得更好的性能,經過訓練的模型還必須針對運行模型的硬件進行優化。如果優化效果不佳,那麼模型很可能只能用到硬件的一小部分可用性能,導致浪費電力。然而,模型的優化會耗費開發者的大量時間。
通常情況下,如果一種軟件能優化用各種語言編寫的代碼,並自動匹配底層的硬件,那麼就更容易得到開發者的青睞。英偉達的軟件在這方面表現突出。創業公司Ceremorphic開發AI處理,該公司首席執行官文卡特·馬特拉(Venkat Mattela)表示,如果直接將芯片提供給開發者,而不附帶優化軟件,那麼就像是給用戶一輛100個檔位的自行車,然後指望他自己探索如何在未知的地形上,具體用哪個檔位騎行。
他說:“你不可能給開發者提供100個檔位,而是必須讓配置看起來就是3個檔位。但目前,大部分芯片公司都沒有做到這點。”
有能力編寫芯片配套軟件的工程師非常稀缺。對於高通這樣的大公司,以及其他數十家瞄準同個市場的創業公司而言,這都是個挑戰。這類軟件的開發需要開發者在編譯器方面有專門的經驗。編譯器將開發者編寫的代碼翻譯成芯片使用的機器語言。
Lux Capital合夥人沙辛·法西奇(Shahin Farshichi)表示:“這類人才受到追捧,並且非常欠缺。這已經成為主要的瓶頸。”Lux Capital投資了AI芯片創業公司Mythic和Flex Logix。