輸入文字指令可產生視訊文生視訊工具Pika將攪拌全球視訊產業鏈?
在對話框中輸入文字“馬斯克穿著太空服,3D動畫”,一個3D動畫版的“宇航員”馬斯克就惟妙惟肖地出現在屏幕上,他身後噴著火焰的SpaceX火箭正騰空而起。這是突然走紅的文生影片工具Pika發布的Pika1.0版本的宣傳影片中所展示的場景。不僅如此,Pika1.0還允許用戶修改已有的視頻,例如讓一隻瞪大眼睛的大猩猩戴上墨鏡,或是更換正在行走的女孩的衣服。
這些都只需要輸入文字命令就可以完成。這樣的功能讓Pika迅速吸引了全球科技圈的關注,有人認為Pika或將影響未來的視訊產業鏈,也有人對這家剛成立半年、團隊只有4人的公司提出質疑。那麼Pika能否帶來一場影音產業的技術變革呢?
Pika走紅,創辦人受關注
美國AI新創公司Pika Labs日前發布了其首款影片生成產品Pika1.0。根據其介紹,Pika1.0能夠產生和編輯3D動畫、動畫、卡通和電影。《環球時報》記者發現,在官網發布的宣傳片中,Pika1.0生成的影片效果非常驚艷,讓人稱奇。
Pika迅速走紅,除了產品本身效果外,創辦人兼執行長郭文景的「女學霸」「史丹佛退學創業」「上市公司創辦人女兒」等個人標籤也進一步助長了Pika1.0的爆火。除了使用者紛至沓來,不少國內媒體和主流券商分析師紛紛進行了報告和研究。
Pika1.0產生的影片截圖(Pika官網)
根據Pika官網的介紹,Pika Labs成立於今年4月,整個團隊目前只有4個人。郭文景與聯合創辦人兼技術長Chenlin Meng均為史丹佛高材生。尤其是95後的郭文景一晚成為輿論的焦點。
媒體通報顯示,郭文景曾就讀於杭州二中,她曾在2014年、2015年連續兩年參加美國資訊學奧林匹克競賽,且都奪冠。2015年,她還在國際資訊學奧林匹克競賽中獲得銀牌。高中畢業後郭文景被哈佛大學錄取。2018-2019年,郭文景在「間隔年」期間加入了Facebook的AI研究團隊。從哈佛大學畢業後,她進入了史丹佛大學攻讀人工智慧專業博士,今年4月退學創辦了Pika。
在接受美國《富比士》雜誌採訪時,郭文景說,人工智慧前景廣闊,但將其應用到影片製作中卻極其麻煩。於是她選擇退學推出了更容易操作的人工智慧影片產生器Pika。
11月28日,Pika Labs在正式發布Pika1.0的同時也宣布,該公司已經完成了三輪融資,總金額達5,500萬美元。
Pika Labs的投資人陣容不容小覷,OpenAI兩位創始成員亞當·迪安傑羅、安德烈·卡帕西都在其中。Github前CEO納特·弗里德曼、HuggingFace創始人克萊門特·德朗格、Giphy聯合創始人Alex Chung、YC合夥人丹尼爾·格羅斯、矽谷著名投資人埃拉德·吉爾等也出現在投資人陣營中,幾乎是矽谷AI產業的半壁江山。
Pika1.0目前正在內測中,還未正式上線。《環球時報》記者在官方網站註冊後發現,目前還需要等待才能獲得體驗機會。根據介紹,作為一款文生視頻工具,Pika1.0的主要功能包括:輸入文字即可快速生成時長3秒的視頻,對現有視頻的背景、其中的道具進行局部修改以及改變視頻的尺寸等功能。
截至12月5日,Pika官網顯示用戶數已超過58萬人,線上活躍用戶達4萬人以上,每週產生影片數量達數百萬個。
艾媒諮詢CEO兼首席分析師張毅接受《環球時報》記者採訪時表示:「年初AIGC(生成式人工智慧)火起來後,整個業界都在思考AI可以往哪裡走、可以做什麼、可以替代人類解決什麼問題?文生影片這個賽道其實是一個非常有前景的領域,Pika應運而生,正碰在風口上。」另外,張毅認為,創辦人郭文景的個人背景與矽谷創業的傳統結合在一起,助推了Pika的走紅。
能否帶來一場產業變革?
Pika11月28日透過官網表示:「6個月前我們創建Pika時,就希望能夠突破技術的邊界,讓每個人都能輕鬆地進行視頻創作。」Pika的願景就是讓每個人都能成為自己故事的導演,激發出每個人內心的創作熱情。作為當前科技領域最熱門的話題之一,AI被認為將在影片領域發揮重要作用,那麼以Pika為代表的應用有可能顛覆整個產業的運作方式嗎?
張毅認為,文生影片的前景毋庸置疑,影視、遊戲以及廣告等領域都是其落地的重要場景。張毅說:“個性化的視頻製作更麻煩、成本更高,甚至超出了僱用程式設計師編程。不少行業都渴望有一款簡單的視頻生成工具。”
長期關注文生視訊產業發展的AI工程師逸陽告訴《環球時報》記者,在他眼中,Pika有著廣闊的應用前景,首先可以在廣告、媒體、影視等創意產業中大顯身手,透過快速生成各種風格的影片內容,幫助創作者實現更多的創意和想法;在教育領域,教師可以利用Pika製作生動有趣的教學視頻,提高學生的學習興趣和效果;在社交媒體上,博主可以使用Pika製作精美的視頻,吸引更多的關注和粉絲;普通網友也可以用Pika生成視頻作品,記錄生活、分享經驗或表達觀點。
資深網路分析師丁道師告訴《環球時報》記者,Pika的影片產生能力正以肉眼可見的速度進步,很可能在未來一兩年內,就超過90%以上的影視公司。他說:“Pika的技術可以大大提高視頻製作的效率和質量,降低製作成本,使得更多的創意和故事能夠被呈現出來。如果積極選擇新技術,影視行業可能會開啟一個新的紀元。”
現有影視產業的改變或顛覆,只是其能力的冰山一角。丁道師認為,展望未來,Pika還有望在遊戲開發、文化旅遊甚至心理健康和療癒中大展拳腳。
Pika的橫空出世也吸引了國內許多主流券商分析師的注意。國泰君安分析師秦和平認為,Pika聚焦低門檻消費級應用,AI視訊生成領域迎來全面迸發。西部證券分析師李艷麗認為,從Runway到Pika,AI視訊技術持續革新,繼MidJourney等AI繪圖工具實現企業級應用後,影片製作有望在AI工具支援下迎來效率、成本的大幅優化。目前Pika的產品還是免費的,但最終可能會推出分層訂閱模式,付費用戶能享受更多功能。
中泰證券分析師聞學臣認為,視訊生成作為多模態生成中難度最大的領域,依舊存在許多應用的問題,更大的技術突破才是產業現階段的核心推動因素,但這個過程或許不會太久。正如Pika聯合創辦人Chenlin Meng所言,目前的視訊生成產業可能處於GPT-2時期,技術突破可能遠比想像中更快。
走紅之後質疑聲不斷
Pika橫空出世,並沒有給業界足夠的時間去了解。《環球時報》記者也發現,除《富比士》外,美國主流媒體基本上沒有對其進行報導。Pika1.0酷炫的宣傳效果與目前還未放開使用所帶來的落差,也讓許多網友產生疑惑。
有AI創業家在短視頻平台上表達了對Pika技術能力的懷疑。他認為目前關於Pika的各種酷炫影片基本上都來自宣傳片,幾乎看不到Pika1.0實測者的評價。他認為「靠簡單幾個指令,就可以進行複雜的視訊處理,給猩猩戴上墨鏡,感覺好萊塢視覺團隊分分鐘就要下崗了。」這位AI創業家認為,按Pika的宣傳,這確實是AI影片領域一個重大的突破,但是否屬實,要經過普遍使用後才能確認。
Pika使用者世超發現,對於一些小幅度動作或簡單動作的要求,Pika生成效果還不錯。但只要涉及四肢協調運動,或手部細節時,效果就差強人意了。他舉了一個例子:讓一個3D版的馬裡奧跑步,生成的視訊手腳頻率明顯不同步,而且兩條腿出現不可思議的錯換。世超又去翻了翻社區里大家生成的視頻,還跑到官方給出的優秀案例庫看了看,“結果發現,沒啥好效果,還真不是我個人的原因。”
針對用戶提出的一些問題,該公司表示,正在努力修改演算法,進一步改進模型,並開發用於過濾受版權保護材料的模型。
有Pika的使用者認為,杭州天才女學霸、哈佛提前錄取、史丹佛退學創業、上市公司實控人女兒,這些關鍵字為Pika大火鋪了輿論基礎。這名使用者認為,Pika1.0大火本身是中性的,如果實際效果不錯,那就是非常成功的行銷。如果效果不好,那麼公司的口碑也將毀於這次行銷。
光大證券分析師付天姿在最新的研報中指出了Pika1.0面臨的技術難題,她認為Pika或難以解決AIGC視頻的核心難題:視頻質量的穩定性,以及視頻畫面運動的核心邏輯理解。她認為,影片的生成需要對運動物體的結構有清晰的理解和認知,才能在運動過程中準確刻畫透視關係,避免畫面走形和失真。
付天姿認為,相比一步到位的文生視頻,以3D模型和物理引擎為中介的AIGC工具或更具發展前景,有望達到更高的視頻質量上限。
中泰證券分析師聞學臣也認為,Pika目前免費版本的效果尚處於早期階段,影片產生的效果還不夠成熟,存在畫面模糊、不流暢等問題。但從發布的宣傳影片來看,新版1.0效果值得期待。
張毅告訴《環球時報》記者,4個人的Pika Labs還處於創業的初始階段,雖然AI訓練模型的核心人員不需要太多,但未來Pika Labs想發展壯大,4個人、40個人,恐怕400個人都不夠。
值得關注的是,Pika並不是AI影片生成領域的唯一參與者。Pika的重要競爭對手Runway是最早使用人工智慧進行影片編輯的新創公司之一。Stable Diffusion背後的公司Stability AI最近也發布了其首個生成視訊模型。在一項使用者偏好研究中,Stable Video Diffusion的表現優於商業競爭對手。
張毅認為,在網路時代,創業成功機率較低,競爭也非常慘烈。他說,有些新創企業能不能走到最後,還有很多未知數。現在對Pika進行任何斷言都太早。
不過張毅也表示,許多很棒的網路公司在發展過程中都會錯失一些技術方向,後期付出高昂的代價來進行彌補。張毅說,Pika抓住文生影片這個前景廣闊的方向,持之以恆不斷推進,是非常有價值的。