應對侵權問題GitHub推出了”Copilot for Business “計劃
微軟的GitHub現在把Copilot帶到了企業場景。本週,這家基於雲的Git存儲庫公司推出了一個名為”Copilot for Business”的新計劃,每個用戶每月花費19美元。GitHub希望通過提供Copilot for Business計劃將其影響力擴展到其他用戶。新的優惠預計將繼續促進該人工智能工具的40萬用戶體量繼續成長,該工具通過提供基於當前項目工作的建議來幫助開發者編寫代碼。
該工具由OpenAI開發的名為Codex的人工智能模型提供支持,”在數以千萬計的公共資源庫中進行訓練”。它是對Visual Studio、Neovim和JetBrains集成開發環境的補充,使開發人員的代碼編寫更容易、更快速。
該商業計劃包括單許可證Copilot層級所提供的功能,並增加了許可證管理和整個組織的策略管理功能。GitHub進一步補充說,該產品具有行業領先的隱私性,”不會保留代碼片段,不會存儲或分享你的代碼,無論數據是來自公共倉庫、私人倉庫、非GitHub倉庫還是本地文件。”
GitHub的產品管理高級總監Shuyin Zhao說,在聽到”企業希望有一個簡單的方法為他們的團隊購買GitHub Copilot”後,他們推動了新的優惠的推出。然而,說企業會熱烈歡迎這項優惠幾乎是不可能的,因為Copilot仍然處於有關侵權的未解決的問題中。
幾個月前,有程序員注意到Copilot產生了有問題的代碼。10月,德克薩斯A&M大學計算機科學教授蒂姆-戴維斯(Tim Davis)在發現GitHub在公共代碼被屏蔽時產生了”大塊來源自於我編寫的代碼,沒有歸屬,沒有LGPL許可”後,向GitHub發起了投訴。
Copilot自帶的過濾器旨在提供一個解決方案,以防止與GitHub上的公共代碼相匹配(或接近)的代碼的建議。根據GitHub的一份文件,它”根據GitHub上的公共代碼檢查代碼建議及其周圍約150個字符的代碼”。然而,該功能似乎沒有效果,特別是在戴維斯披露了他發現的案例之後。
GitHub警告說,大約1%的時間,建議的代碼當中可能包含一些長於150個字符的代碼片段,與訓練集相匹配。此外,GitHub說該工具可能產生具有”不良模式”的代碼,這可能意味著用戶包括法律侵權在內的風險,在其文件中GitHub這樣解釋說。
GitHub Copilot提供的建議來自OpenAI從數十億行的開放源代碼中建立的模型。因此,GitHub Copilot的訓練集可能包含不安全的編碼模式、錯誤或對過時的API或習慣用語的引用。當GitHub Copilot基於這些訓練數據產生建議時,這些建議也可能包含不良的模式。
你有責任確保你的代碼的安全和質量。我們建議你在使用由GitHub Copilot生成的代碼時,採取與使用任何非自己編寫的代碼時相同的預防措施。這些預防措施包括嚴格的測試、IP掃描和跟踪安全漏洞。
該警告將責任甩給了用戶,如果在他們項目的最終生產中包含了被忽視的受版權保護的建議,他們將面臨訴訟的可能性。
11月,程序員和律師Matthew Butterick與集體訴訟公司Joseph Saveri Law Firm合作,對微軟、GitHub和OpenAI提出了集體訴訟。
“作為一個長期的開源程序員,從我第一次嘗試Copilot時就可以看出,它引起了嚴重的法律問題,自2021年Copilot首次公開預覽以來,許多人都注意到了這一點,”Butterick說。”因為我也是一名律師,我覺得必須為開源社區站出來。自從Joe創辦Joseph Saveri律師事務所以來,我就認識他。他已經把它建成了全國最好的集體訴訟公司之一。我很高興能與喬和他的公司合作,代表那些權利被Copilot侵犯的開源程序員。”
儘管存在這些問題,GitHub決心向更多用戶,特別是企業提供其Copilot。然而,時間將證明企業是否願意承擔風險。