AI產業公開的秘密:都在抄作業
多位開發者和創辦人透露,許多新創公司的AI聊天機器人,極可能是採用OpenAI和其他公司的資料開發的。這些機器人在某些特定領域可以媲美GPT-4,但收費只是OpenAI的一小部分。
新創公司抄襲OpenAI的具體做法是,先開通GPT-4的會員,然後向它提出一系列問題,然後使用這些問題和答案來訓練自己的模型,並且採取這一策略的初創公司不在少數。
而這些公司並未公開揭露它們使用了OpenAI的技術,雖然OpenAI的CEO奧特曼曾表示,規模較小的企業可以適度利用該公司的技術。
但這種做法實質上損害了OpenAI的成長,奧特曼隨時都有可能改變主意。
Unsloth AI聯合創始人Daniel Han估計,他大約一半的客戶從GPT-4或Anthropic的Claude模型中獲取數據,並用它來改進自己的模型。
不僅如此,新創公司利用OpenAI資料訓練模型的做法,與OpenAI等巨頭的做法並無二致。
有媒體報道稱,Google曾轉錄YouTube視頻,Meta僱用承包商總結受版權保護的書籍,Adobe使用Midjourney的AI生成照片,均是為了訓練自家AI模型。