Google宣布Imagen Video：根據簡短文本內容生成短視頻

2022-10-06 Comments 0 Comment

繼日前Meta 宣布Make-A-Video 之後，Google 今天宣布了Imagen Video人工智能係統，可以根據簡短文本內容（例如泰迪熊洗碗）生成視頻片段。雖然目前生成的短視頻清晰度不夠，但Google 聲稱Imagen Video 是朝著具有“高度可控性”和世界知識的系統邁出的一步，包括生成鏡頭的能力在一系列藝術風格中。

事實上通過文本生成短視頻並不是什麼新鮮事情，今年早些時候，清華大學和北京人工智能研究院的一組研究人員發布了CogVideo，它可以將文本翻譯成相當高保真的短片。但Imagen Video 似乎是對先前最先進技術的重大飛躍，顯示了現有系統難以理解的動畫字幕的能力。

馬修·古茲迪亞（Matthew Guzdial）通過郵件表示：“這顯然是重大改進。正如您從視頻示例中看到的那樣，即使通信團隊選擇了最佳輸出，仍然存在奇怪的模糊和人為因素。所以這絕對不會很快直接用於動畫或電視中。但它或類似的東西肯定可以嵌入工具中，以幫助加快某些事情的速度”。

Imagen Video 建立在Google 的Imagen 之上，這是一個可與OpenAI 的DALL-E 2 和Stable Diffusion 相媲美的圖像生成系統。Imagen 是所謂的“擴散”模型，通過學習如何“破壞”和“恢復”許多現有數據樣本來生成新數據（例如視頻）。當它輸入現有樣本時，該模型可以更好地恢復之前破壞的數據以創建新作品。

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

WONGCW 網誌

記錄生活經驗與點滴

Google宣布Imagen Video：根據簡短文本內容生成短視頻

2022-10-06 Comments 0 Comment

相關

發表迴響取消回覆

分享此文：

相關

發表迴響取消回覆