OpenAI 發布第三版DALL-E 人工智慧視覺模型
OpenAI 發布了其生成式人工智慧視覺藝術平台DALL-E 的第三個版本,現在用戶可以使用ChatGPT 創建提示,並包含更多安全選項。DALL-E 將文字提示轉換成圖像。但即使是DALL-E 2 也會出錯,經常忽略特定的措詞。OpenAI 的研究人員說,最新版本更能理解上下文。 DALL-E 3 的一個新功能是與ChatGPT 整合。透過使用ChatGPT,使用者不必自己編寫詳細的提示來引導DALL-E 3;他們只需讓ChatGPT 想出一個提示,聊天機器人就會寫出一段話(DALL-E 更擅長使用長句),讓DALL- E 3 跟著說。如果其他使用者對DALL-E 有特別的想法,也可以使用自己的提示。 DALL-E 於2021 年1 月首次發布,發佈時間早於Stability AI 和Midjourney 的其他文字到圖像生成AI 藝術平台。到2022 年DALL-E 2 發佈時,OpenAI 開設了一個等待名單,以控制誰能使用該平台,因為有批評稱DALL-E 可以生成逼真的露骨圖像,並且在生成照片時表現出偏見。去年9 月,公司取消了等待名單,並向公眾開放了DALL-E 2。新版DALL-E 將於10 月首先向ChatGPT Plus 和ChatGPT Enterprise 用戶發布,隨後在秋季向研究實驗室及其API 服務發布。OpenAI 計劃錯開DALL-E 3 的發佈時間,但沒有承諾何時發布免費的公開版本。OpenAI 聲稱,它在DALL-E 3 上做了大量工作,重點是創建強大的安全措施,以防止創建淫穢或潛在的仇恨圖像。OpenAI表示,它與外部紅隊(red teamers)合作–紅隊是一個故意試圖破壞系統以測試其安全性的組織–並依靠輸入分類器(input classifiers),這是一種教語言模型忽略某些單字以避免明確或暴力提示的方法。DALL-E 3 也無法再現公眾人物的形象–前提是提示中明確提到了名字。該公司的政策研究員桑迪尼-阿加瓦爾(Sandhini Agarwal)說,她對該公司的安全措施”非常有信心”,但她澄清說,該模型正在不斷改進,並不完美。OpenAI 的代表在一封電子郵件中說,DALL-E 3 已被訓練成不會按照在世藝術家的風格生成圖像。與DALL-E 2 不同的是,DALL-E 2 在受到提示時可以模仿某些藝術家的藝術風格。可能是為了避免潛在的訴訟,OpenAI 還將允許藝術家選擇將他們的藝術作品排除在未來版本的文字到圖像人工智慧模型之外。創作者可以提交自己擁有版權的圖片,並在網站上填寫表格要求移除。這樣,未來版本的DALL-E 就可以屏蔽與藝術家的圖像和風格相似的結果。藝術家們起訴了DALL-E 的競爭對手Stability AI 公司和Midjourney 公司,以及藝術網站DeviantArt,指控它們使用他們擁有版權的作品來訓練文字圖像模型。