Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

AI靠語意理解把照片變抽像畫:無需相應數據集只畫4筆也保留神韻

AI靠語意理解把照片變抽像畫:無需相應數據集只畫4筆也保留神韻

2022-03-20 Comments 0 Comment

只用幾筆,如何勾勒一隻動物的簡筆劃,很多人從小都沒整明白的問題—— 如今AI 也能實現了。下面圖中,左邊是三張不同的動物照片,右邊是AI 僅用線條來描出它們的外形和神態。從32筆到4筆,即使大量信息都抽象略去了,但我們還是能辨識出對應動物,尤其是最下面的貓貓,只需4筆曲線也能展示出貓的神韻:

再看這匹馬,抽像到最後只保留了馬頭、馬鬃和揚蹄飛奔的動作,真有點畢加索那幅公牛那味兒了。

更神奇的是,其背後的模型CLIPasso 並沒有在速寫畫數據集上訓練—— 等於說,沒“學”過怎麼畫抽像畫,按照文字描述就能完成簡筆速寫。

要知道,日常速寫都比較抽象,即使是人來畫,要想抓住物體的“靈魂”,也需要經過很久的訓練。那為什麼這個CLIPasso 甚至連速寫畫數據集訓練都沒做,就能get 到抽像簡筆劃的“靈魂”呢?

CLIPasso 如何畫抽像畫

其實AI 畫抽像簡筆劃比人更難。既要準確地理解語義,又要在幾何上相似,才能讓抽像畫看起來有“像”的感覺。

具體實現上,模型會根據圖像的特徵圖先生成初始線條的位置,然後靠CLIP 構建兩個損失函數,來控制抽像畫幾何相似、語義理解準確。

其中CLIP 就是OpenAI 發布的一個重排序的模型,它會通過打分排名來篩選出和文字匹配度最高的圖片。這樣一來,CLIPasso 的整體結構就比較清晰了:

例如我們要畫一匹馬,首先通過特徵圖(saliency)標記一些初始線條(S1,S2…Sn)的位置。然後通過光柵化(Rasterizer)把線條投影到成像平面:

接下來就是優化線條參數了。把初始圖像導入CLIP 模型,計算幾何損失(Lg)和語義損失(Ls)。其中語義損失通過餘弦相似度來判斷兩圖的差異,而幾何損失通過中間層來控制。

這樣就能保證在準確理解語義的情況下保持幾何準確,再通過反向傳播不斷調整線條參數,直到損失收斂。那速寫的抽象程度是怎麼控制的呢?

就是靠設置線條的數量。同樣畫一匹馬,用32 筆去畫和只用4 筆去畫,抽象效果肯定是不一樣的:

最後,我們來看一下CLIPasso 畫出的畫辨識度怎麼樣。下圖中這個柱形圖代表的是五類動物的辨識準確度。不過在猜測的時候還有第六個選項:這五種動物都不是。

從圖中可以看出,無論什麼動物,在高度抽象的時候(4 筆劃),辨識度都很低,隨著筆劃越來越多,辨識度也會逐漸提高。畢竟這麼抽象的畫,看不出來是啥也很正常。

但是,模型團隊在第二輪測試辨識度時刪除了第六個選項,也就是必須從這五個動物類型中選一個歸類。這時,我們從下面的柱形圖中可以看到,即使是高度抽象的4 筆劃,辨識度也提高了不少,從36% 提到了76%。

這就說明了之前辨認不出是太抽象導致的,AI 畢加索的畫仍然抓住了動物的核心特徵。目前這個模型已經出了colab 版本,只需在左側文件夾中添加你想要抽象化的圖片,然後運行三個部分即可得到輸出照片。

作者簡介

CLIPasso 團隊成員主要來自洛桑聯邦理工學院、特拉維夫大學等。其中Jessica 是蘇黎世聯邦理工學院機器人方向的碩士研究生,目前在洛桑聯邦理工學院的計算機視覺實驗室VILAB 實習。

而Yale Vinker 是特拉維夫大學計算機科學的博士研究生,對藝術和技術的交叉領域非常感興趣,也難怪CLIPasso 有這麼豐富的藝術細胞。

來源:量子位

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
從分銷商的角度看芯片缺貨和假芯片現象
NEXT
《自然》:對社會等級的認知是刻在大腦裡的

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2022 年 3 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 2 月   4 月 »

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • 大眾電動車改名計畫曝光2026年起取消’ID’前綴 2025-05-19
  • 黃仁勳價值千萬RM手錶首曝全球限量80隻 2025-05-19
  • 印度地球觀測衛星發射任務宣告失敗火箭升空6分鐘後墜毀 2025-05-19
  • Switch 2首發遊戲《Fast Fusion》將採用全新渲染技術 2025-05-19
  • 深藍CEO回應員工買車可離職兩個月:為員工考慮不是想藉機裁員 2025-05-19
  • 微軟稱Windows PC快58% 遭網友無情嘲諷 2025-05-19
  • 中國首款蜂群母艦無人機「九天」即將首飛機腹可藏上百小型無人機 2025-05-19
  • 墨西哥海軍回應撞擊紐約大橋事件:正在核查人員和設備狀況並提供支援 2025-05-19
  • AMD伺服器市場營收份額狂飆近40%、桌面端也達34.4% 2025-05-19
  • 報告稱華為昇騰910系列年銷售量將達70萬顆 2025-05-19

熱門文章與頁面︰

  • 美國議員稱TP-Link超低價助長中國網路攻擊支持銷售禁令
  • 「多喝水」真的有用研究顯示有助於減肥、治療腎結石
  • 北京地鐵扶梯上多了兩隻黃色腳印不必“左行右立”
  • Windows及OFFICE激活密鑰+電話激活教程–自用
  • 您可以在Windows 11 24H2 中找回WordPad
  • 《不可能的任務8:最終清算》定檔5月30日阿湯哥最後一搏震撼打響
  • 《劍星》PC配置公佈:GTX 1060就能玩國區268元
  • 網站未在Google上顯示(未編入索引)的可能原因及解決方案
  • CentOS7.2 调整mysql数据库最大连接数
  • "91大神"偷拍百名女性獲刑:曾任外企高管年薪百萬

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.