Meta確認其Llama 3開源大語言模式將於下個月推出
在本週二於倫敦舉行的活動上,Meta 公司證實,它計劃在下個月內首次發布Llama 3(用於支援生成式人工智慧助理的下一代大型語言模型)。這證實了The Information 週一發表的一篇報導。
Meta 公司全球事務總裁尼克-克萊格(Nick Clegg)說:”我們希望在下個月內,甚至在更短的時間內,開始推出我們新的下一代基礎模型套件Llama 3。”他的描述聽起來像是要發布該產品的幾個不同迭代或版本。 “今年內,我們將發布一系列具有不同功能、不同通用性的模型,很快就會開始發布。”
Meta 首席產品長Chris Cox 補充說,計劃用Llama 3 支援Meta 的多個產品。
一年多前,OpenAI 推出了ChatGPT,並將人工智慧生成式問答變成了日常的主流體驗,這讓Meta 和Google等其他大型科技公司措手不及。
Meta 公司在人工智慧方面基本上採取了非常謹慎的態度,但這並沒有得到公眾的認可,以前版本的Llama 被批評為能力過於有限。 (Llama 2於2023 年7 月公開發布)。第一版Llama 並未對外發布,但仍在網路上洩漏)。
與前幾代產品相比,Llama 3 的功能更強大,不僅能更準確地回答問題,還能回答更廣泛的問題,其中可能包括更具爭議性的話題。該公司希望這將使產品受到用戶的歡迎。
“隨著時間的推移,我們的目標是讓Llama 驅動的Meta AI 成為世界上最有用的助手,”人工智慧研究副總裁Joelle Pineau 說。 “要達到這個目標,還有相當多的工作要做。”
該公司沒有談到《Llama 3》中使用的參數的大小,也沒有提供任何它將如何運作的演示。預計它將擁有約1400 億個參數,而最大的Llama 2 型號只有700 億個參數。
最值得注意的是,Meta 的Llama 系列是作為開源產品構建的,代表了一種不同的哲學方法,即人工智慧作為一種更廣泛的技術應該如何發展。與專有模式相比,Meta 希望透過這種方式獲得更多開發者的青睞。
但Meta 似乎也在謹慎行事,尤其是在文字生成以外的其他生成式人工智慧方面。皮諾說,該公司尚未發布圖像生成工具Emu。
考克斯說:”延遲、安全性和易用性都非常重要,只有這樣才能產生令你自豪的圖像,並代表你的創意背景。”
諷刺的是,或者可以說是意料之中的,即使在Meta 公司努力推出Llama 3 的同時,公司內部也有一些對生成式人工智慧持懷疑態度的重要人士。兼任Meta 首席人工智慧科學家的著名人工智慧學者Yann LeCun 對生成式人工智慧的整體局限性進行了抨擊,並表示他將賭注押在生成式人工智慧之後。他預測這將是聯合嵌入式預測架構(JEPA),這是一種訓練模型和產生結果的不同方法,Meta 公司一直在使用這種方法在影像生成領域建立更準確的預測性人工智慧。
“人工智慧的未來是JEPA。它不是生成式人工智慧,”他說。 “我們得給克里斯的產品部門改個名字”。