Meta發布功能更強大的Code Llama 70B程式設計模型可與GitHub Copilot相媲美
2023 年8 月,Meta 公司在先前的Llama 2 模型基礎上發布了專為程式設計任務設計的大規模語言模型Code Llama。今天,該公司發布了”功能更強大的新版本”--Code Llama 70B。
Code Llama 70B 已在5000 億個位元組的程式碼和相關資料基礎上進行了訓練。它可以處理和產生較長的程式碼序列,這要歸功於10 萬個詞組的上下文視窗。
根據Meta 公司介紹,Code Llama 70B 使用一種稱為自我關注的技術來理解程式碼結構。它可以根據文字或片段提示實現演算法、排序、搜尋等功能,適用於Python、C++、Javascript 和Java 等多種語言。
這款人工智慧驅動的工具包括針對特定任務進行微調的變體。其中一個變體是CodeLlama-70B-Instruct,它經過訓練後可以理解自然語言指令。還有一個以Python 為主的版本,名為CodeLlama-70B-Python。根據Meta 的說法,透過對1000 億個Python 程式碼標記的額外訓練,它產生Python 程式碼的”流暢性和準確性無與倫比”。
“編寫和編輯程式碼已成為當今人工智慧模型最重要的用途之一,”Meta 公司執行長馬克-祖克柏在Facebook 上的一篇文章中寫道。”事實證明,程式碼能力對於人工智慧模型更嚴謹、更合乎邏輯地處理其他領域的資訊也非常重要。”
Code Llama 70B可以在與早期Code Llama 模型相同的開放許可下免費下載:
https://ai.meta.com/resources/models-and-libraries/llama-downloads/
Meta 公司稱,這種許可允許學術和商業用戶修改模型。
微軟旗下的GitHub於2023 年7 月推出了Copilot Chat。開發人員可以就自己的程式碼向Copilot 提問,取得程式碼特定部分的解釋,甚至讓Copilot 修復程式碼中的錯誤。最近,Google也推出了Duet AI 和Gemini Pro,這是由人工智慧驅動的程式碼完成和產生工具。