Mistral發布首個程式碼產生人工智慧模型Codestral 但不可用於商業活動
由微軟支援、估值高達60 億美元的法國人工智慧新創公司Mistral發布了首個用於編碼的生成式人工智慧模型,名為Codestral。 Codestral 與其他程式碼產生模型一樣,旨在幫助開發人員編寫程式碼並與之互動。
Mistral 在一篇部落格文章中解釋說,它接受過80 多種程式語言的訓練,包括Python、Java、C++ 和JavaScript。 Codestral 可以完成編碼功能、編寫測試和”填充”部分程式碼,還能用英語回答有關程式碼庫的問題。
Mistral 將這種模式描述為”開放”,但這還有待商榷,因為這家新創公司的許可證禁止將Codestral 及其產出用於任何商業活動。雖然有”開發”的例外,但即使是”開發”也有註意事項:許可證明確禁止”員工在公司業務活動中的任何內部使用”,究其原因可能是Codestral 部分訓練內容受版權保護。 Mistral 在部落格文章中沒有證實或否認這一點,但這並不奇怪;有證據表明,這家新創公司先前的訓練資料集包含版權資料。
無論如何,Codestral 可能不值得這麼麻煩。該模型有220 億個參數,需要一台強大的電腦才能運作。 (參數基本上決定了人工智慧模型處理問題的能力,例如分析和生成文字)。雖然根據一些基準測試(我們都知道,這些基準測試並不可靠),該模型擊敗了競爭對手,但這並不能說明它有多厲害。
雖然Codestral 對大多數開發人員來說並不實用,而且在效能提升方面也是漸進式的,但它肯定會引發關於依賴程式碼產生模型作為程式設計助理是否明智的爭論。
至少在某些編碼任務中,開發人員肯定會使用生成式人工智慧工具。在2023 年6 月的Stack Overflow民意調查中,44% 的開發人員表示,他們現在在開發過程中使用人工智慧工具,26% 的開發人員計劃不久後使用。然而,這些工具有明顯的缺陷。
GitClear 對過去幾年提交到專案倉庫的超過1.5 億行程式碼進行了分析,發現生成式人工智慧開發工具正在導致更多錯誤程式碼被推送到程式碼庫中。普渡大學的一項研究顯示,OpenAI 的ChatGPT對程式設計問題給出的答案有一半以上是錯誤的。
但這並不能阻止Mistral 等公司試圖將其模式貨幣化(並獲得心智份額)。今天上午,Mistral在其Le Chat對話式人工智慧平台上推出了託管版Codestral以及付費API。 Mistral表示,它也致力於將Codestral納入LlamaIndex、LangChain、Continue.dev和Tabnine等應用框架和開發環境。