JetBrains開源發布Mellum 一種開放的AI程式設計模型
JetBrains 是一家開發一系列流行應用程式開發工具的公司,它發布了其首個用於編碼的「開放式」 AI 模型。週三,JetBrains 將Mellum公開發佈在AI 開發平台Hugging Face 上。 Mellum 是該公司去年為其各種軟體開發套件發布的程式碼生成模型。
Mellum 經過超過4 兆個標記的訓練,包含40 億個參數,專為程式碼補全(即根據周圍環境補全程式碼片段)而設計。參數大致對應於模型解決問題的能力,而標記則是模型處理的原始資料。一百萬個標記相當於約3 萬行程式碼。

JetBrains 在一份技術報告中解釋道:“Mellum 專為集成到專業開發人員工具(例如,集成開發人員環境中的智能代碼建議)、人工智能編碼助手以及代碼理解和生成研究而設計,也非常適合教育應用和微調實驗。 ”
JetBrains 表示,他們使用一系列資料集對Mellum 進行了訓練,該模型獲得了Apache 2.0 許可,其中包括來自GitHub 和英文維基百科文章的許可程式碼。在256 塊H200 NVIDIA GPU 叢集上,訓練耗時約20 天。
Mellum 的啟動和運作需要一些工作。基礎模型無法開箱即用,必須先微調。雖然JetBrians 提供了一些針對Python 微調的Mellum 模型,但該公司提醒稱,這些模型旨在“評估潛在能力”,而不是部署到生產環境中。

人工智慧生成的程式碼無疑正在改變軟體的建構方式,但它也帶來了新的安全挑戰。根據開發者安全平台Snyk 在2023 年末進行的一項調查,超過50% 的組織有時或經常遇到人工智慧產生的程式碼的安全問題。
事實上,JetBrains 指出,Mellum 可能「反映公共程式碼庫中存在的偏見」(例如,產生與開源儲存庫風格相似的程式碼),並且其程式碼建議不一定「安全或沒有漏洞」。
JetBrains 在一篇部落格文章中寫道:“這只是個開始。我們不追求通用性——我們只是在建立焦點。如果Mellum 能夠激發哪怕一次有意義的實驗、貢獻或合作,我們都會認為這是一次勝利。”