Meta發布類Sora影片生成模型後股價再創新高
在9月底的開發者大會上,Meta剛剛炸場,發布了十年磨一劍的產品——全息AR眼鏡Orion,號稱“至今為止最先進的眼鏡”,拉動股價至歷史新高。北京時間10月4日晚,Meta再次投下重磅炸彈,發布類Sora的視頻生成模型Movie Gen,官方稱這是「迄今為止最先進的媒體基礎模型」。
截至10月5日收盤,Meta漲2.26%,股價達到595.94美元的歷史新高。自今年年初以來,Meta股價已上漲超過70%,目前最新總市值來到了1.51兆美元。隨著Meta股價的持續攀升,其CEO馬克·祖克柏(Mark Zuckerberg)首次超越亞馬遜創辦人貝佐斯,成為全球第二大富豪,僅次於馬斯克。
在官方部落格中,Meta表示,全新發布的Meta Movie Gen是先進的沉浸式敘事模型系列,擁有影片生成、個人化影片生成、精確影片編輯和音訊生成四大功能。從Meta演示的影片來看,其在畫面美感、細節、人物動作流暢度、物理規律等方面都做到了不錯的效果。
在具體功能方面,使用者可以透過上傳圖片,利用Meta Movie Gen 產生既個性化但又保持人物特徵和動作的影片。用戶也可以透過提供視訊檔案或文字內容,讓Meta Movie Gen 產生相對應的音訊。 Movie Gen支援生成1080P、16 秒、每秒16 幀的高清長視頻,以及能夠產生最長45 秒的高品質音訊。
不過,如同Sora一樣,Movie Gen也是「期貨」產品,目前尚未對外開放,也沒有明確的時間表。官方聲稱正在積極地與娛樂業的專業人士和創作者進行溝通和合作,預計將在明年某個時候將其整合到Meta 自己的產品和服務中。
根據外媒,Meta 副總裁Connor Hayes 透露了延遲推出的重要原因,他表示Meta Movie Gen 目前使用文字提示詞產生一個影片往往需要等待數十分鐘,這極大影響了用戶的體驗。 Meta 希望進一步提高視訊產生的效率,以及實現盡快在行動端上推出此視訊服務,以便能更好地滿足消費者的需求。
Meta稱Movie Gen是在授權和公開資料集的組合上訓練。對於背後的技術細節,Meta AI 研究團隊也在社群媒體上公開了一份長達92 頁的論文。根據介紹,Meta 的AI 研究團隊主要使用兩個基礎模型來實現這些廣泛的功能,包括Movie Gen Video 以及Movie Gen Audio 模型。
Movie Gen Video 是一個30B 參數的基礎模型,用於文字到視頻的生成,能夠生成高品質的高清視頻,最長可達16 秒。而Movie Gen Audio 模型則是一個13B 參數的模型,用於視頻和文本到音頻的生成,能夠生成長達45 秒的高質量和高保真的音頻,包括聲音效果和音樂,並與視頻同步。
據悉,模型預訓練階段使用了大量的影像和視訊數據,能夠理解視覺世界的各種概念,包括物件運動、互動、幾何、相機運動和物理規律。為了提高視訊生成的質量,模型還進行了監督微調(SFT),使用了一小部分精心挑選的高品質視訊和文字標題。報告顯示,後訓練(Post-training)流程則是Movie Gen Video 模型訓練的重要階段,能夠進一步提升影片產生的質量,尤其是針對影像和影片的個人化和編輯功能。
在技術論文中,研究團隊公佈了Movie Gen Video 模型與主流影片生成模型的比較數據。由於Sora 目前尚未開放,研究人員只能使用其公開發布的影片和提示來進行比較。對於其他模型,如Runway Gen3、LumaLabs 和可靈1.5,研究人員選擇透過API 介面來自行產生視訊。
透過進行勝率比較,Movie Gen Video 在整體品質上顯著優於Runway Gen3和LumaLabs,對OpenAI Sora有輕微的優勢,與國內的可靈1.5 相當。
曾經在元宇宙領域遭遇困境的Meta,在2024年以生成式AI成功逆轉命運。在8月初,摩根大通發表報告將Meta目標價由480美元升至610美元,報告指出,Meta近期表現良好,相信已在關鍵的長遠計劃上適當投資,尤其是AI。 9月底,摩根大通再次宣布看好Meta,目標價從610美元上調至640美元。
今年8月,Meta發布的2024年Q2財報顯示,公司營收為390.71億美元,年增22%,淨利為134.65億美元,年增73%,均超出華爾街分析師預期。 Meta表示,該公司在人工智慧方面的巨額投資有助於提高其線上廣告平台的表現,這是營收成長的一大原因。
目前Meta已連續四個季度營收成長超過20%。 Meta預計,2024年第三季該公司的總營收將達到385億美元至410億美元之間,這項展望同樣超出分析師預期。