OpenAI的Sora會砸掉誰的飯碗?
不約而同,同日出招。兩個AI巨頭在同一天各自放出了自己的AI新核武器,OpenAI的文生視頻模型Sora又一次贏得了滿堂彩。 Sora的驚艷亮相,不僅碾壓了許多AGI視訊同行,更有可能改變電影電視廣告遊戲產業的未來遊戲規則。
Google新模式效能完勝
週四,Google突然發布了新一代多模態大模型Gemini 1.5 Pro,在與OpenAI的大模型之戰中加速超越。這是業界迄今最強的大語言模型,最高可支援10,000K Token上下文,直接將效能提升到了百萬級別,在效能上完全秒殺了OpenAI的GPT-4 Turbo。
百萬級別Token意味著什麼? GoogleAI專案負責人傑夫·迪恩(Jeff Dean)解釋說,在Gemini 1.5 Pro百萬級別上下文視窗支援能力下,用戶可以完成複雜的內容交互,輕鬆解析整本圖書、電影、播客,理解非常長的文檔,甚至是數百個文件數十萬行的程式碼庫。
Gemini 1.5 Pro的發布,意味著Google在和OpenAI的軍備競賽中佔據了強大的性能優勢。相較之下,OpenAI的GPT-4 Turbo只能處理128k Token,而且近期更是出現了效能下滑的不利狀況,直到上個月發布更新才有所改善。
然而,OpenAI並沒有讓Google獨美。就在同一天,他們發布了文字產生影片的AI模型Sora,只要文字就能自動產生影片;繼文字模型ChatGPT和圖片模型Dall-E之後,OpenAI又開始顛覆影片領域。
相較於GoogleGemini 1.5 Pro基於數據效能的硬實力優勢,Sora基於視覺美學的驚艷表現,顯然更容易讓人印象深刻,迅速成為了社群網站上的熱點。
以假亂真細節驚艷
Sora到底驚艷在哪裡? OpenAI展示了多段Sora製作的影片內容,光是這些片段,就已經足夠讓人大跌眼鏡。 OpenAI在官方部落格中寫道,Sora不僅可以理解用戶的需求,還知道這些事物在現實世界中如何存在。
只需要輸入一段文本,Sora就能自動產生最長一分鐘的高清影片。令人難以置信的是,Sora不僅可以準確掌握用戶文本中的複雜意思,並且還能分拆出不同的元素,將其轉換為有具體創意構思的視頻內容,看起來就像是專業導演、攝像和剪輯的作品。
一位戴著墨鏡、穿著皮衣的時尚女子走在雨後夜晚的東京市區街道上,抹了鮮豔唇彩的唇角微微翹起,即便帶著墨鏡也能看到她的微笑,地面的積水映出了她的身影和燈紅酒綠的霓虹燈;熱鬧非凡的唐人街正在進行舞龍表演,熙熙攘攘的人群目光都聚焦在躍動的彩龍身上,整個環境的喜慶氛圍彷彿令人身臨其境。
與先前的AI影片存在明顯塑膠感不同,這次Sora製作的影片在逼真度和藝術感方面有著顯著差別:微微捲曲的人物頭髮,女人臉上的黑痣粉刺,地面積水倒映的霓虹光影,街頭商販擺賣的許多食品,天空飄落的櫻花細雪,細節的精細度幾乎已經做到了以假亂真。
更令人驚訝的是,Sora影片在構圖、色彩、創意和運鏡方面,都呈現出明顯的電影風格,無論是一鏡到底還是多機位都可以無縫切換,甚至還有「演員」的表情神態,這是先前的文生視訊產品所不具備的。 OpenAI一出手就將整個AI影片產業提升了一個等級。
雖然Sora製作的影片還沒到完美的地步,仔細看還能看出「穿幫」之處,人物吃過的餅乾甚至會完好無損,但在影像畫質上已經較此前的AI影片有了質的飛躍,甚至有了電影的質感。而且,僅僅根據一段抽象的文字就能製作類電影的多鏡頭視頻,這種語義理解和鏡頭運用能力更是接近了人類導演、攝像與剪輯的水平。顯然,視訊領域的ChatGPT時刻已經到來。
AI進化速度令人震驚
Sora發售後,網路一片驚嘆,幾乎搶盡了Gemini的風頭。 AI的進化速度實在令人震驚。要知道,此時距離OpenAI推出ChatGPT,開啟生成式AI時代,只過了14個月。直到去年,我們才剛熟悉文字生成圖片的產品,而僅僅半年前,MidJourney創作的AI圖片裡還會出現六指人物。而現在,Sora的影片就已經讓所有人開始感受到現實和虛擬的界線模糊。
雖然OpenAI的GPT-4 Turbo先前出現了效能下滑和速度變慢的狀況,令人擔心生成式AI的成長遭遇了瓶頸;但Sora的發布無疑打消了所有人的擔憂。雲端運算公司Box創辦人兼CEO列維(Aaron Levie)在Sora發布之後感慨說,“如果有人還擔心AI進化速度會變慢的話,我們又一次看到了完全相反的典範。”
目前Sora只對邀請的製作者和安全專家開放測試,發現和解決可能的安全問題,還沒有宣布正式的公測時間表。畢竟在假訊息充斥的互聯網,DeepFake的道德問題也已經成為了關注焦點,像Sora這樣以假亂真的視頻一旦被濫用,可能會引發災難性後果。
在發布Sora的幾乎同一時間,OpenAI還完成了一項要約售股交易,並不是融資用於公司用途,而是允許員工向以Thrive Capital牽頭的風投機構出售現有股份套現。值得一提的是,身為OpenAI董事會成員,奧特曼自己並不持有公司股票,估值飆升並不能為他帶來巨額財富。
這項交易對OpenAI的整體估值達到了800億美元,較之去年年初的300億美元飆升了兩倍多。根據投融資市場研究公司CB Insights統計,OpenAI已成為全球估值最高的新創公司之一,僅次於位元組跳動和SpaceX。
實際上,這筆交易本應在去年11月完成,只是因為奧特曼與董事會的衝突風波才被迫擱置。隨著奧特曼重新回到OpenAI CEO職位,投資人再次給這家AI巨頭投出了信任票。顯然,在Sora正式發布之後,OpenAI的估值還會進一步飆升。
巨頭出手碾壓AGI同行
那麼,令人驚豔的文本生影片Sora究竟會帶來哪些衝擊呢?
AGI視訊同行無疑是遭受最直接衝擊的。 Sora發布之後,AI視頻新創公司Runway CEO瓦倫祖拉(Cristóbal Valenzuela)在X平台(先前的Twitter)上簡單發布了兩個字,「Game On.」(競爭開始了)。幾個月前,Runway剛發布了Gen-2視訊模型。而另一家AI視頻公司Stability的CEO莫斯塔克(Emad Mostaque)則直接感慨,“奧特曼真是個魔術師。”
Runway創辦已有五年時間,在AI影片領域佔據先發優勢,已經得到了好萊塢主流片場的使用。去年拿到七項奧斯卡大獎的年度電影《瞬息全宇宙》就使用了Runway來製作AI影片。在《瞬息全宇宙》大獲成功之後,Runway新一輪融資估值也水漲船高,達到了15億美元,是一年之前估值的三倍。
文生影片領域是目前最熱的創業領域。過去幾個月時間,隨著生成式AI熱潮湧動,也湧現了不少文字生影片和圖片生影片的新創公司。 A16z的AI投資合夥人摩爾(Justin Moore)列出了他所跟踪的20多家文生視頻創業團隊,其中不乏Pika、Zeroscope這樣一度引發網絡驚嘆的創業新貴。
去年年底,史丹佛華人畢業生創辦的Pika影片一度引發了中美網路的驚嘆。由於AI影片的驚艷表現,這家僅有四人的創業公司,在不到半年就完成了超過5,500萬美元的三輪融資,估值飆升到了2.5億美元。
但現在,AI巨頭OpenAI直接拋出了Sora。無論是影片時長,還是畫面精細度,還是細節完整性,或是多鏡頭拍攝,Sora都遠遠超越了這些小創業公司的視頻,用碾壓來形容也並不為過。雖然AI影片領域還有巨大的提升與成長空間,但這些小公司的未來是否有能力與OpenAI競爭依然是個巨大的疑問。
左右好萊塢勞資談判
不過,Sora影響的不僅是其他AGI影音創業公司的生存空間,還會改變整個好萊塢以及電影、電視、廣告、遊戲產業的未來遊戲規則。
好萊塢使用AI製作圖片和視頻,並不是什麼新鮮事,從CG(電腦動畫)、VR到AI,影視娛樂產業一直是高新技術的最早採用者。然而,與其他技術不同,AI工具始終是紮在好萊塢從業人員心中的刺。
除了《瞬息全宇宙》使用了Runway的AI視頻工具,去年21世紀福斯已經與IBM沃森合作,用AI工具為關於AI主題的恐怖片《摩根》製作預告片;迪士尼旗下的漫威更完全用AI製作了《秘密入侵》的開頭動畫。
當時正值好萊塢演員和編劇工會大罷工期間。而生成式AI在影視產業的應用也是雙方的爭議焦點之一。就在雙方談判的過程中,演員編劇們得知迪士尼漫威新一季的《秘密入侵》已經完全使用AI技術打造開場場景。這項消息讓雙方的談判再次擱淺。
為什麼影視產業要用AI工具引發這麼多的爭議?業內人士主要是擔心製片方使用現有素材進行AI訓練,未來頻繁使用AI工俱生成內容,這不僅侵犯到了創作者已有作品的版權,沒有給他們足夠的回報,更會影響到創作者未來的工作機會和空間。
雖然去年編劇和演員們不惜讓行業停擺和自己失業,換來了製片方們的暫時讓步,對AI工具的使用制定更多的規範。但三年後的下一次勞資談判,面對性能必然大升級的AI,演員編劇們的處境可能會更加艱難。
電影電視TikTok化
隨著文生視頻模型Sora的驚艷亮相,或許整個好萊塢從業人員都會面臨著一個巨大的疑問:按照AI的指數級進化速度,或許不需要再等待多久,AI就可以生成一部完整劇情的短片甚至電影,從劇本到拍攝到表演到後期都可以完全搞定,那麼好萊塢的未來會變成什麼樣子?
拍攝《當她醒來》恐怖電影的好萊塢導演戴夫克拉克(Dave Clark)已經在使用AI工具製作電影。在他看來,Sora等AI技術帶來的並不是威脅,創作者需要擁抱AI技術,打造出先前無法實現或想像的內容。 “這是改變遊戲規則的技術。你不應該去擔心自己的工作,而應該擔心是誰在使用這些工具。”
產業調查公司CVL Economics上個月發布的一項針對300位好萊塢產業領袖的調查顯示,擔憂情緒瀰漫在好萊塢各地。 36%的受訪者表示生成式AI已經減少了他們公司的日常工作技能需求,72%的受訪公司都是生成式AI工具的最早採用者。
更殘酷的現實是,75%的受訪者承認,生成式AI(工具、軟體、模型)已經促使他們業務部門削減與合併工作。這些掌控著好萊塢產業秩序的人們預計,未來三年好萊塢總計會有超過20萬人的工作會遭受AI衝擊,尤其是視覺特效、音效師、畫圖師等後期工作。
電影《Shovel Buddies》的編劇海勒曼(Jason Hellerman)認為,隨著AI工具的逐漸完善,未來製片方當然可能會通過Sora這樣的工俱生成視頻,而不再需要給一個製作團隊支付薪酬。 AI生成的內容也可能創造一個全新的類型,但如果任何人都可以用AI製作視頻和電影,成為“內容創作者”,這也不可避免會帶來專業水準的降低。
他預測,未來每個人都可以生成自己視頻,就像現在每個人都在手機上拍攝和觀看TikTok短視頻。習慣了短片的Z世代年輕人未來會逐漸拋棄像電影和電視這樣的長內容。也許在AI生成影片的未來,電影和電視也會變成類似TikTok短片這樣的形式。