Meta首次披露自研AI芯片:專供內部使用
據報導,Meta公司開發了一些定制電腦芯片來幫助其執行人工智能和電子遊戲任務,該公司本週首次與外界溝通了這些產品。這家社交媒體巨頭在本週早些時候首次披露了該公司的內部芯片項目,此後又在周四晚間的虛擬活動上探討了他們對人工智能技術基礎架構的投資。
Meta此前宣布今年為“效率之年”,不僅裁員至少2.1萬人,還大幅壓縮各種成本。在此之後,投資者一直在密切關注Meta對人工智能及相關數據中心硬件的投資。
儘管對一家公司而言,自主設計和開發電腦芯片的成本十分高昂,但Meta基礎架構副總裁亞歷克西斯·博喬林(Alexis Bjorlin)表示,Meta相信,只要能提高公司業績,便可證明這筆投資的意義。該公司還一直在調整其數據中心的設計,以便將更多精力集中在具有能耗效率的技術上,比如液冷技術和減少過熱。
其中一款名為Meta可擴展視頻處理器(MSVP)的電腦芯片可以處理視頻,並將其傳輸給用戶,同時減少能耗。博喬林表示,“沒有任何商用產品”可以像Meta渴望的那樣高效地處理和傳輸每天40億段視頻。
另外一款處理器則是該公司的Meta訓練和推理加速器(MTIA)家族中的首款芯片,其目的是幫助Meta處理各種專門的人工智能任務。新的MTIA芯片專門處理“推理”,也就是利用已經訓練好的人工智能模型做出預測或採取行動。
博喬林表示,新的人工智能推理芯片有助於加強Meta的推薦算法,這種算法可以決定用戶的信息流中顯示哪些內容和廣告。她拒絕回答這款芯片的製造商,但一篇博文透露,該處理器“採用台積電的7納米工藝製造”,表明這款處理器由台積電代工。
博喬林還表示,Meta為其人工智能芯片家族制定了“好幾代路線圖”,包括用於訓練人工智能模型的任務,但她拒絕提供除新款推理芯片之外的更多細節。之前有報導稱,Meta取消了一個人工智能推理芯片項目,並啟動了另外一個項目,但卻要到2025年才能推出具體的產品。博喬林拒絕對此置評。
由於Meta並未像Alphabet和微軟一樣出售雲計算服務,所以該公司沒有太大動力公開討論其內部數據中心芯片項目。
“看看我們分享的內容,這是我們首批開發的兩款芯片,肯定能夠藉此一窺我們在內部從事的項目。”她說,“我們沒有宣傳這些事情,也不需要宣傳,但你知道,全世界都很感興趣。”
Meta工程副總裁阿帕納·拉馬尼(Aparna Ramani)表示,該公司的新硬件是為了與其自主開發的PyTorch軟件高效配合,後者已經成為第三方開發者開發人工智能應用時最常用的工具之一。
這款新硬件最終可以用於執行與元宇宙相關的任務,比如虛擬現實和增強現實,還能用於新興的生成式人工智能技術。生成式人工智能是一種統稱,指的是能夠創造有吸引力的文本、圖像和視頻的人工智能軟件。
拉馬尼還表示,Meta為該公司的程序員開發了生成式人工智能編程助手,幫助其簡化軟件開發和運營過程。這款新的助手類似於微軟2021年在人工智能創業公司OpenAI的幫助下推出的GitHub Copilot工具。
除此之外,Meta還宣布,該公司的超級計算機Research SuperCluster(簡稱“RSC”)已經進入到第二階段,也就是最後一個階段。這台超級計算機包含1.6萬個英偉達A100 GPU,Meta使用這台超級計算機訓練其LLaMA大語言模型及其他技術。
拉馬尼表示,Meta依然堅持自己的信念,希望通過為開源技術和人工智能研究做出貢獻來推動科技領域的發展。該公司透露,其最大的LLaMA大語言模型LLaMA 65B包含650億個參數,使用1.4萬億個令牌訓練。令牌指的是用於訓練人工智能的數據。
OpenAI和谷歌等公司均未公開披露各自大語言模型的相似指標,但本周有媒體披露,谷歌的PaLM 2模型使用3.6萬億個令牌,包含3400億個參數。
與其他科技公司不同,Meta將其LLaMA大語言模型發布給研究人員,使之可以研究這項技術。但LLaMA大語言模型隨後被洩露給了更多人,使得許多開發者在自己的應用中整合了這項技術。
拉馬尼表示,Meta“仍在考慮我們所有的開源合作,當然,我想重申,我們的理念仍是開放科學和交叉合作。”