人人都能用的“AI 作畫”，要成為英偉達的殺手鐧？

2022-10-16 Comments 0 Comment

如果說2021年是“元宇宙”的元年，那麼2022年或許就是“AI作畫”的元年。稍微對互聯網熱點有所關注的人都不難發現，最近，“AI作畫”產出的作品似乎已經成了一股互聯網風潮。這些看起來完成度頗高、畫風又有幾分名家韻味的畫作往往能給人留下深刻印象，而當人們得知這些畫作完全由AI繪製，不存在任何“門檻”，更是又多了一份驚異與好奇心。

在此之前，我們想要收穫一張符合自己審美需求的圖片，要不就在茫茫大海般的同人網站中進行撒網篩選，要不就得花點小錢找中小畫師定制一張。如今，我們可以在平台上輸入各種與風格、主題、氛圍有關的關鍵詞，然後AI就會根據算法生成符合要求的畫作，藝術似乎在突然之間成為了一件觸手可及的事情。

AI名畫，《空間歌劇院（Théâtre D’opéra Spatial）》

當然，上文所說的“門檻”之所以打上引號也是有原因的。因為“AI作畫”的出現，雖然在一定程度上降低了用戶在美術造詣上的門檻，但是卻在其他方面為用戶增加了新的門檻，不論是花大價錢去用別人已經訓練好的AI模型作畫，還是利用顯卡的本地算力來進行AI作畫，都不是一件簡單的事情。

果不其然，顯卡廠商們早早洞察到這個趨勢。近日，外媒VideoCardz 消息，英偉達已經在最新的522.25驅動中取消了RTX 30系列顯卡的算力限制，似乎是想用算力全開帶來的AI創作體驗挽回客戶。唯一的問題是，在礦潮褪去、遊戲旺季未至之時，“AI作畫”真的能夠成為刺激顯卡需求的關鍵嗎？

突然爆火的AI作畫

事實上，“AI作畫”是一個存在了接近半個世紀的概念。根據WikiPedia介紹，早在上世紀70年代，英國畫家哈羅德·科恩便已經開始了AI作畫的嘗試，當時他用自己研發的電腦程序“AARON”去控制一個機械臂進行繪畫創作，而這個算法也只能產生色彩艷麗的抽象派風格畫作。

(圖源：WikiPedia，哈羅德和他的畫作)

在隨後的五十年時間裡，AI作畫其實一直都是這個趨勢——即可以生成色彩艷麗的抽象派風格畫作，但卻不能生成寫實或者俱象的繪畫作品。直到2021年初，OpenAI發布了廣受關注的DALL-E系統，AI才開始獲得了按照文字輸入提示來進行創作的能力，而AI作畫的發展更是進入了突飛猛進的階段。

在隨後的一年時間裡，隨著Disco Diffusion、DALL-E 2、Imagen、Midjourney和Stable Diffusion等作畫工具先後出現，AI作畫的風格開始變得越來越多變，生成的圖片不再局限於抽象，而是能夠產出具體的人物/事件，畫出的作品也越來越符合邏輯。

然而，要說“AI作畫”這個概念真正火起來，那還得是2022年的下半年。因為在這段時間裡，出現了兩個專攻二次元作畫的網站，其中一個是8月底上線的AI作畫網站mimic，該網站主攻日系二次元畫風頭像，要求用戶上傳15至100張圖像讓AI進行學習，然後輸出相同畫風的AI畫作。

所謂mimic，就是模仿者、擬態物的意思，這個命名非常好地展現出該網站的核心賣點及爭議要點。模仿原作者畫風生成的AI畫作，雖然很接近用戶喜好的作畫風格，但明顯會給原作者帶來困擾，隨後畫師們掀起的一系列“拒絕畫作被mimic使用”的浪潮，更是讓這個網站的經營者做出了緊急下線的決定。

（圖源：mimic）

儘管mimic涼了，但是利用二次元AI作畫來盈利的網站顯然不會只有這麼一個。10月上旬，一家名為NovelAI的網站悄然上線了AI作畫功能，該網站採用了開元的Stable Diffusion作為基礎，搭配上採集自P站熱門作品的NovelAI Diffusion模型，可以讓用戶輕鬆創作出完成度頗高的二次元畫作。

和過往的AI作畫不同，NovelAI的入門方式簡單（註冊會員）、創作方式多樣（文本生成、原畫改寫、簡筆劃生成）、出圖素質較高（有充分訓練的多個模型打底），最重要的是，符合二次元愛好者的取向，這也使得“AI作畫”這個概念在本月迅速爆火。至於NovelAI非法爬蟲P站稿件訓練模型，或是網友利用草稿生成畫作反訴作者這些爭議事件，則都是後話了。

與日俱增的顯卡需求

那麼有人就會問了，既然這些“AI作畫”都是跑在服務器上的，那又怎麼會對顯卡市場的供需關係帶來影響呢？

答案非常簡單，那是因為目前市面上存在著兩種AI繪畫的方法。其一是在線法，用戶只要花錢就能在NovelAI上面無限生成畫作，這樣的優點是沒有顯卡算力的限制；其二是本地法，通過在本地加載AI算法和模型來生成畫作，這種做法的優點是生成作品沒有限制，而且不用花錢，但是所有運算過程都得靠自己的電腦來跑。

（圖源：知乎）

為了測試本地AI作畫對性能的要求，小雷昨晚特地用一晚上時間完成了本地版NovelAI的部署。經過實測，在加載洩露壓縮版模型（4GB）的情況下，移動版RTX 3060顯卡最多只能生成360*512尺寸的圖片，而且生成一張圖片的時間長達5-10分鐘，體驗非常拖沓。

值得關注的是，本地版NovelAI已經是目前佔用資源最少的一種架設方式了，StableDiffusionWebUI的佔用更高，而且這加載的還是壓縮版模型，因為內存限制的緣故，移動版RTX 3060顯卡無法成功加載目前洩露出來的完整版模型（7GB），在作畫質量上會有些許差距。

（圖源：twitter，採用IMG2IMG算法做出來的圖，理論顯卡運存不低於16GB）

總的來看，擁有6G運存的獨立顯卡算是目前運行本地版AI作畫的一個基礎配置，而且越新的顯卡體驗就越好。目前RTX計算卡是運行效果最理想的顯卡，其次則是30系顯卡，20系、10系及以下老顯卡的支持都不太好，至於AMD顯卡則是完全沒有進行過優化。

對於可以妥協的用戶來說，個人建議通過採用低分辨率生成畫作，然後Upscale至高分辨率的方式來生成畫作。這種做法可以有效降低顯卡佔用，讓只有基礎配置的用戶也能藉此進行畫風/人物學習，但是這樣生成的圖片在整體畫面細節上肯定會有所缺失。

至於追求畫作質量的用戶，那自然就要更換顯卡了。正好，9月23日，英偉達在GTC大會上發布了新品顯卡RTX40系列，其中RTX 4090採用台積電“4N”製程工藝和高達24GB GDDR6X顯存，相比上一代RTX3090Ti性能提升可達2~4倍，可謂是完美的AI作畫工具。

不得不說，這波浪潮的到來，和RTX 40系顯卡的發佈時間可謂完美契合，再加上老黃近日及時解鎖的RTX 30系算力限制，難怪NGA論壇的用戶都在討論：“怎麼感覺礦潮之後，AI作畫要成為新的顯卡需求啊？難道這波作畫模型洩露的受益者，真的是剛剛發布新顯卡的老黃？”

對於這個觀點，個人覺得應該分開來看。對創作者而言，在虛擬貨幣的風波過去後，顯卡在AI算力方面的提升才真正被釋放了出來。AI作圖工具在二次元的產業應用上肯定是非常強的一個存在，畫師可以用其輔助作畫、輕小說家可以用其繪製人設，至於獨立的遊戲製作人更是可以大幅降低成本。

但是對普通人而言，AI作圖工具本質上只是風靡一時的新玩具罷了。儘管不用親手繪製，但是想從AI繪製出來的大量作品中找出高質量作品也是一件非常需要耐心的活。在這一波熱潮過後，大部分人還是會回到收集畫師作品的軌道上，想要藉此拉動大量顯卡需求確實有些不太現實。

在顯卡需求下滑的當下，強如英偉達也需盡快尋找顯卡之外的新業務，為下一階段業績增長提供更多想像空間。有趣的是，從NVIDIA Canvas的推出來看，英偉達確實有考慮過發展“AI作畫”這方面的業務。AI作畫或許不能成為刺激顯卡業務增長的動力，但是其能否成為英偉達未來所倚重的優勢業務，還有待進一步觀察。

WONGCW 網誌

記錄生活經驗與點滴

人人都能用的“AI 作畫”，要成為英偉達的殺手鐧？

2022-10-16 Comments 0 Comment

相關

發表迴響取消回覆

2022 年 10 月
一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

分享此文：

相關

發表迴響取消回覆