當AI開始畫畫和“攝影”:不僅娛樂人,還會愚弄人
人工智能勢不可擋。本週,包括微軟、Google、英偉達、Adobe在內的全球多家科技巨頭公司都不約而同地發布或開放生成式AI新技術,其中微軟和Adobe發布了與圖像生成相關的新應用。然而,AI不僅可以幫助人類,也會被利用來戲弄人類。
例如,近日互聯網上流傳著美國前總統特朗普被捕的照片,實際上這些照片都是由人工智能生成,並不是真實發生的事件。
3月18日,特朗普曾在社交媒體上表示,他將在當地時間21日被逮捕,並多次呼籲支持者舉行大規模抗議。但是由於法律程序問題,特朗普並未如期“被捕”,但從當天開始,互聯網上就出現了各種使用人工智能合成的特朗普被捕畫面,“以假亂真”。
微軟、Adobe推出AI畫筆
以ChatGPT為代表的“高智商”AI,正在掀起新一輪的AI革新。英偉達創始人CEO黃仁勳將這一輪技術革新稱為“AI的iPhone時刻”。他認為,AI可以幫助人類創建初稿、建立初步的設計,幫助人類打開“腦洞”,激發人類的創造力,提升生產效率。
Google當地時間21日也正式在英國和美國開放對其AI聊天機器人Bard的訪問權限,用戶可以加入等候名單以訪問Bard。Bard稱將能幫助用戶概述和撰寫論文草稿,以及根據冰箱裡的食材製作創意午餐等。
Google、微軟、Facebook母公司Meta和其他科技公司正在競相開發和部署人工智能工具。上週,在Google宣布將人工智能引入包括Gmail、表格和文檔等生產工具之後,微軟也加強了人工智能輔助搜索功能,並宣布將其生成式人工智能技術添加到辦公自動化應用程序中,包括Word、PowerPoint和Excel。
微軟21日發布的最新工具命名為“Bing Image Creator”,將允許必應(Bing)和Microsoft Edge瀏覽器的用戶使用OpenAI的DALL-E創建文本提示圖像,用戶可以通過語言文字生成圖像,例如要求畫一張“宇航員穿過向日葵星系”的圖片。
微軟的這一新功能將以預覽版的形式提供給用戶。微軟表示,將首先在Bing搜索引擎的“創意模式”中推出,並最終完全集成到Bing的聊天體驗中;在MicrosoftEdge上,圖像生成器將在瀏覽器的搜索欄中可用。
另一家最新進軍生成式AI領域的科技公司是Adobe。同樣在21日,該公司推出了一個名為Firefly(“螢火蟲”)的應用,專注於創建圖像和文本效果,用戶可以通過輸入命令快速修改圖像,該應用將被整合至現有的產品套件中。
在一個示例中,Adobe展示瞭如何將一張夏日場景的照片更改為冬日場景,用戶只需要輸入“將場景更改為冬日”,無需進行任何編輯就可以將圖片完成更改。
去年Adobe斥資200億美元收購了設計工具Figma,未來將會向更廣泛的AI進行轉型。
上週,百度在發布類ChatGPT的AI聊天機器人文心一言時,現場演示了AI作畫功能,不過此後網友測試文心一言的圖像生成功能後發現AI對於一些特定名詞的理解還不准確,這導致千奇百怪的圖片在網上廣泛流傳。
所有畫師都會被AI替代?
但AI的能力已經讓人類驚嘆。最近有一張情侶照在網上引起了軒然大波。一對穿著90年代服裝的年輕人坐在屋頂上,背景是北京的老舊樓房,這張看起來與真人沒有任何差異的圖片,竟然是由AI一鍵生成!讓網友大呼“人類畫師要失業”了。
這張圖片在網上迅速走紅後,背後的AI繪畫工具Midjourney V5也引起巨大關注。該軟件不僅可以生成現代風格的圖像,還可以模擬不同年代和地域的場景。比如,“一個穿著漢服、手持扇子、坐在亭子裡看書的女子”,或者“一個穿著牛仔褲、背著吉他、走在紐約街頭的男孩”;它還可以根據用戶指定的風格參數來調整圖像效果。
“我們覺得結合語言的生成模型代替的是傳統的各類資產庫,就好像大語言模型(LLM)之於搜索引擎、文本轉圖片(texttoimage)之於’視覺中國’。”影眸科技首席技術官張啟煊對第一財經記者表示,“ChatGPT已經把搜索攪了個底朝天,Stable Diffusion之類的技術也在衝擊傳統圖庫;接下來就是3D資產庫,從傳統的關鍵詞匹配的’搜索’,轉換為’生成’。”
Stable Diffusion和OpenAI的DALL-E一樣,都提供生成式AI圖像產品,Midjourney就是基於Diffusion技術。
張啟煊表示,他們正在進行文本轉3D的下一代技術研發,現在已經可以實現直接將文本生成3D數字人資產,預計於本月底上線,可以用於影視遊戲當中。
他認為,儘管最近一波生成式AI的發展都具有顛覆性,但Adobe這類工具仍然有存在的必要性,因為純文本的隱式控制的可控性不足;但是需要結合生成模型進行革新。
資深遊戲行業人士、豐厚資本創始合夥人譚群釗對第一財經記者表示:“產業正在發生劇變。我們認為生成式AI的出現一定會全面改變創意文化產業,美術製作的工具鏈、工作流程、人員配置都會發生變化。我們投資的公司也在研發AI作畫的平台。”
不過譚群釗認為,雖然生成式AI將極大地提升作畫的效率,但是並不意味著未來所有的畫師都會被AI替代。“首先需要高級的畫師做出更有風格的作品,其次是需要普通畫師去使用AI工具,得到更實用的作品。”他對第一財經記者表示,“甚至還需要初級畫師去修改AI作品,讓它看起來更接近於人的作品。”
歐盟AI立法難度陡增
和ChatGPT一樣,生成式AI圖像背後也一直存在倫理方面的隱憂,這些擔憂涉及模型傾向於“產生幻覺”的看似合理但不准確的信息;此外,人們還擔心大模型會竊取藝術家內容、重新生成並在未經創作者授權或許可的情況下進行展示。
生成式AI的突然火爆也令歐盟正在草擬的人工智能法案難度陡增。雖然行業預計年底前歐盟有望就人工智能法案達成協議,但有人擔心該立法可能因其複雜性和意見不統一延遲到明年推出。
據透露,為了解決像ChatGPT這樣無窮無盡的應用程序的監管問題,預計歐盟立法者將會引入一個新的類別,即“通用人工智能係統”(GPAIS),以描述可以適應執行多種功能的AI工具。但目前尚不清楚是否所有的GPAIS工具都將被視為“高風險”。
技術的發展與監管始終是一對矛盾體,歐盟立法討論也引起了從小型初創公司到大型科技公司的擔憂。他們認為,監管在立法的同時也應避免對技術發展的束縛。行業機構appliedAI最近的一項調查顯示,51%的受訪者預計人工智能法案一旦推出,將導致AI開發活動放緩。
音頻流媒體平台Spotify(聲田)的首席執行官丹尼爾·艾克(DanielEk)認為,生成式AI的技術是一把雙刃劍。Spotify最近推出了自己的AIDJ,能夠管理個性化音樂播放列表。“我們必須考慮很多事情。”艾克說道,“我們的團隊正在與監管機構積極合作,努力確保這項技術盡可能多地受益,並儘可能安全。”
在中國,今年1月10日起,首次針對深度合成技術的監管規定——《互聯網信息服務深度合成管理規定》已正式實施。清華大學國強教授、智能產業研究院首席研究員聶再清對第一財經記者表示:“如果相關法規針對生成式AI在文字內容生成方面沒有明確的規定,那麼隨著ChatGPT這類技術的應用更加廣泛,未來可能需要重新審視在包括文章、論文、廣告等生成內容方面的審核。”
小米前副總裁、安全與隱私委員會主席崔寶秋也對第一財經記者表示:“技術監管是一場永恆的攻防對抗博弈。深度合成技術的服務方在提供服務的同時,會產生多方面的風險,除了深度偽造的風險外,還包括自動生成內容文本、圖像或者視頻帶來的版權和著作權的侵權風險,信息安全和隱私洩露風險以及敏感內容的風險。”
崔寶秋建議,未來出台的相關法規中,應該強制要求服務提供方對於哪些內容是深度合成的進行標註;對於技術提供方而言,則應從底層技術開始推進相關標準的建立,在算法上保證計算模型的公平性。