當AI開始畫畫和“攝影”：不僅娛樂人，還會愚弄人

2023-03-23 Comments 0 Comment

人工智能勢不可擋。本週，包括微軟、Google、英偉達、Adobe在內的全球多家科技巨頭公司都不約而同地發布或開放生成式AI新技術，其中微軟和Adobe發布了與圖像生成相關的新應用。然而，AI不僅可以幫助人類，也會被利用來戲弄人類。

例如，近日互聯網上流傳著美國前總統特朗普被捕的照片，實際上這些照片都是由人工智能生成，並不是真實發生的事件。

3月18日，特朗普曾在社交媒體上表示，他將在當地時間21日被逮捕，並多次呼籲支持者舉行大規模抗議。但是由於法律程序問題，特朗普並未如期“被捕”，但從當天開始，互聯網上就出現了各種使用人工智能合成的特朗普被捕畫面，“以假亂真”。

微軟、Adobe推出AI畫筆

以ChatGPT為代表的“高智商”AI，正在掀起新一輪的AI革新。英偉達創始人CEO黃仁勳將這一輪技術革新稱為“AI的iPhone時刻”。他認為，AI可以幫助人類創建初稿、建立初步的設計，幫助人類打開“腦洞”，激發人類的創造力，提升生產效率。

Google當地時間21日也正式在英國和美國開放對其AI聊天機器人Bard的訪問權限，用戶可以加入等候名單以訪問Bard。Bard稱將能幫助用戶概述和撰寫論文草稿，以及根據冰箱裡的食材製作創意午餐等。

Google、微軟、Facebook母公司Meta和其他科技公司正在競相開發和部署人工智能工具。上週，在Google宣布將人工智能引入包括Gmail、表格和文檔等生產工具之後，微軟也加強了人工智能輔助搜索功能，並宣布將其生成式人工智能技術添加到辦公自動化應用程序中，包括Word、PowerPoint和Excel。

微軟21日發布的最新工具命名為“Bing Image Creator”，將允許必應（Bing）和Microsoft Edge瀏覽器的用戶使用OpenAI的DALL-E創建文本提示圖像，用戶可以通過語言文字生成圖像，例如要求畫一張“宇航員穿過向日葵星系”的圖片。

微軟的這一新功能將以預覽版的形式提供給用戶。微軟表示，將首先在Bing搜索引擎的“創意模式”中推出，並最終完全集成到Bing的聊天體驗中；在MicrosoftEdge上，圖像生成器將在瀏覽器的搜索欄中可用。

另一家最新進軍生成式AI領域的科技公司是Adobe。同樣在21日，該公司推出了一個名為Firefly（“螢火蟲”）的應用，專注於創建圖像和文本效果，用戶可以通過輸入命令快速修改圖像，該應用將被整合至現有的產品套件中。

在一個示例中，Adobe展示瞭如何將一張夏日場景的照片更改為冬日場景，用戶只需要輸入“將場景更改為冬日”，無需進行任何編輯就可以將圖片完成更改。

去年Adobe斥資200億美元收購了設計工具Figma，未來將會向更廣泛的AI進行轉型。

上週，百度在發布類ChatGPT的AI聊天機器人文心一言時，現場演示了AI作畫功能，不過此後網友測試文心一言的圖像生成功能後發現AI對於一些特定名詞的理解還不准確，這導致千奇百怪的圖片在網上廣泛流傳。

所有畫師都會被AI替代？

但AI的能力已經讓人類驚嘆。最近有一張情侶照在網上引起了軒然大波。一對穿著90年代服裝的年輕人坐在屋頂上，背景是北京的老舊樓房，這張看起來與真人沒有任何差異的圖片，竟然是由AI一鍵生成！讓網友大呼“人類畫師要失業”了。

這張圖片在網上迅速走紅後，背後的AI繪畫工具Midjourney V5也引起巨大關注。該軟件不僅可以生成現代風格的圖像，還可以模擬不同年代和地域的場景。比如，“一個穿著漢服、手持扇子、坐在亭子裡看書的女子”，或者“一個穿著牛仔褲、背著吉他、走在紐約街頭的男孩”；它還可以根據用戶指定的風格參數來調整圖像效果。

“我們覺得結合語言的生成模型代替的是傳統的各類資產庫，就好像大語言模型（LLM）之於搜索引擎、文本轉圖片（texttoimage）之於’視覺中國’。”影眸科技首席技術官張啟煊對第一財經記者表示，“ChatGPT已經把搜索攪了個底朝天，Stable Diffusion之類的技術也在衝擊傳統圖庫；接下來就是3D資產庫，從傳統的關鍵詞匹配的’搜索’，轉換為’生成’。”

Stable Diffusion和OpenAI的DALL-E一樣，都提供生成式AI圖像產品，Midjourney就是基於Diffusion技術。

張啟煊表示，他們正在進行文本轉3D的下一代技術研發，現在已經可以實現直接將文本生成3D數字人資產，預計於本月底上線，可以用於影視遊戲當中。

他認為，儘管最近一波生成式AI的發展都具有顛覆性，但Adobe這類工具仍然有存在的必要性，因為純文本的隱式控制的可控性不足；但是需要結合生成模型進行革新。

資深遊戲行業人士、豐厚資本創始合夥人譚群釗對第一財經記者表示：“產業正在發生劇變。我們認為生成式AI的出現一定會全面改變創意文化產業，美術製作的工具鏈、工作流程、人員配置都會發生變化。我們投資的公司也在研發AI作畫的平台。”

不過譚群釗認為，雖然生成式AI將極大地提升作畫的效率，但是並不意味著未來所有的畫師都會被AI替代。“首先需要高級的畫師做出更有風格的作品，其次是需要普通畫師去使用AI工具，得到更實用的作品。”他對第一財經記者表示，“甚至還需要初級畫師去修改AI作品，讓它看起來更接近於人的作品。”

歐盟AI立法難度陡增

和ChatGPT一樣，生成式AI圖像背後也一直存在倫理方面的隱憂，這些擔憂涉及模型傾向於“產生幻覺”的看似合理但不准確的信息；此外，人們還擔心大模型會竊取藝術家內容、重新生成並在未經創作者授權或許可的情況下進行展示。

生成式AI的突然火爆也令歐盟正在草擬的人工智能法案難度陡增。雖然行業預計年底前歐盟有望就人工智能法案達成協議，但有人擔心該立法可能因其複雜性和意見不統一延遲到明年推出。

據透露，為了解決像ChatGPT這樣無窮無盡的應用程序的監管問題，預計歐盟立法者將會引入一個新的類別，即“通用人工智能係統”(GPAIS)，以描述可以適應執行多種功能的AI工具。但目前尚不清楚是否所有的GPAIS工具都將被視為“高風險”。

技術的發展與監管始終是一對矛盾體，歐盟立法討論也引起了從小型初創公司到大型科技公司的擔憂。他們認為，監管在立法的同時也應避免對技術發展的束縛。行業機構appliedAI最近的一項調查顯示，51%的受訪者預計人工智能法案一旦推出，將導致AI開發活動放緩。

音頻流媒體平台Spotify（聲田）的首席執行官丹尼爾·艾克（DanielEk）認為，生成式AI的技術是一把雙刃劍。Spotify最近推出了自己的AIDJ，能夠管理個性化音樂播放列表。“我們必須考慮很多事情。”艾克說道，“我們的團隊正在與監管機構積極合作，努力確保這項技術盡可能多地受益，並儘可能安全。”

在中國，今年1月10日起，首次針對深度合成技術的監管規定——《互聯網信息服務深度合成管理規定》已正式實施。清華大學國強教授、智能產業研究院首席研究員聶再清對第一財經記者表示：“如果相關法規針對生成式AI在文字內容生成方面沒有明確的規定，那麼隨著ChatGPT這類技術的應用更加廣泛，未來可能需要重新審視在包括文章、論文、廣告等生成內容方面的審核。”

小米前副總裁、安全與隱私委員會主席崔寶秋也對第一財經記者表示：“技術監管是一場永恆的攻防對抗博弈。深度合成技術的服務方在提供服務的同時，會產生多方面的風險，除了深度偽造的風險外，還包括自動生成內容文本、圖像或者視頻帶來的版權和著作權的侵權風險，信息安全和隱私洩露風險以及敏感內容的風險。”

崔寶秋建議，未來出台的相關法規中，應該強制要求服務提供方對於哪些內容是深度合成的進行標註；對於技術提供方而言，則應從底層技術開始推進相關標準的建立，在算法上保證計算模型的公平性。

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

WONGCW 網誌

記錄生活經驗與點滴

當AI開始畫畫和“攝影”：不僅娛樂人，還會愚弄人

2023-03-23 Comments 0 Comment

相關

發表迴響取消回覆

分享此文：

相關

發表迴響取消回覆