版權倡導者炮轟GitHub Copilot AI編程輔助工具
6月下旬,微軟旗下代碼託管平台GitHub推出了能夠對整行或全部代碼給出AI分析建議的Copilot編程輔助工具。然而這個支持多種語言和框架、能夠直接以擴展程序的形式在Visual Studio Code中調用的功能,也遭到了一些版權倡導者的猛烈批評。據悉,GitHub Copilot由OpenAI Codex項目提供支撐,並接受了數十億行的開源代碼訓練。
(來自:GitHub Blog)
以Brian P. Hogan 為例,他認為GitHub Copilot 會“剽竊”你的代碼。而且在幫助AI 完成了訓練之後,它甚至會反過來向你收費。對於那些為此感到歡呼的人,@bphogan 感到很是失望。
至於GitHub Copilot 是否直接從訓練數據集中默背代碼,Mark O.Riedl 的觀點是—— Copilot 使用了某個版本的GPT3,並在基於GPL 授權的代碼上展開了訓練。
但在某些情況下,@mark_riedl 指出GitHub Copilot 會有直接從記憶中復誦代碼片段的情況。
Armin Ronacher 則對GitHub 持更加鮮明的反對態度,理由是平台拿竟然他的開源代碼來訓練這麼個鬼東西。更讓人無力吐槽的是,美國法律竟然允許任何人這麼胡搞,儘管他非常確定不該進一步增強版權法。
對此,外媒MSPU 的@Pradeepviswav 表示,自己不理解GitHub Copilot 怎麼就侵犯了GPL 代碼版權的整個論點。
首先,機器生成的代碼,不該被視作衍生作品。否則我們就無法用AI 來創建音樂識別應用,因為您的AI 模型將基於受版權保護的音樂內容。
(Copilot傳送門)
其次,即使Copilot 從訓練數據集中生成了準確的短代碼片段,也不應被視為侵犯版權。比如下面這段:
if(i<=0)
i=i+1;
你不該就此聲明版權,因為該片段構不成所謂的原始代碼。而且GitHub Copilot 應該能夠在不違反任何版權的情況下,向開發者推薦此類短代碼片段。
至於微軟和GitHub將在未來幾天內給出怎樣的回應,還請拭目以待。