商湯用AI復活了湯曉鷗老師
在商湯2024年年會上,湯曉鷗數字人現身,來了一場跨時空的重逢。按照以往習慣,每年湯老師都會說上一段脫口秀,已經成為商湯年會保留節目。熟悉湯老師演講都知道,他是被人工智慧事業耽誤的“脫口秀大師”,如今以數字人的形象,再度用幽默的方式與我們相見。
除了被他的幽默感染,不少人還被逼真的效果所驚艷,堪稱“年會最佳彩蛋”。
並由此引發大家對湯教授的懷念。
湯曉鷗數位人現身商湯年會
不講企業經營,也不講公司管理。還是老規矩,嘮兩句嗑。
每年湯曉鷗演講的開場都是“我們先來複習去年的演講”,今年數位人也不例外。
照商湯CEO徐立的話說,這是特有的湯氏娃娃演講風格。
複習之前,他被cue到“彈鋼琴”,結果他說:今年沒接到通知啊。
到了正兒八經的複習環節,結果已經有人會搶答了。(Doge)
首先他說:自己的推薦是有一點前瞻性的。嗯,確實是這樣的。
例如《波西米亞狂想曲》第二年就斬獲奧斯卡;還有「人類文明的起點是一根癒合的大腿骨」結果被引用到《流浪地球2》中李雪健老師拯救地球去了;最後還是聊到了他多次提及的「大兄弟」-宮崎駿,重出江湖拍了部《蒼鷺與少年》…
他感嘆像宮崎駿這樣的大師創作並不容易,“人生中最重要的事就是很麻煩的”,對此他也深有體會。
例如徐立每次深夜找他要聊聊的時候,他都有這樣的感覺。對此他的解決方案是:
既然解決不了麻煩的問題,那就要解決麻煩的人。所以索性不接他的電話。
後來麻煩的人越來越多,他就直接選擇關機。
之後,他提及了最近上映的《熱辣滾燙》、東北取材電視劇《漫長的季節》,並藉著《漫長的季節》結尾橋段“火車在天地裡往前開”,談到商湯也坐著新洲樓下小火車,在AI這條路上往前開。
你看要不說咱們有前瞻性呢,小火車在2021年就準備好了,就等著《漫長的季節》火一把呢。
談到今年春晚最幽默的新疆人小尼,他身為東北人不服氣,於是推薦了一部小品《吃麵》。並介紹了背後的花絮,正是因為編導最後開播前確定讓演員上場,才有了春節第一部小品。
藉此就來到了他以往多次提及「原創」這件事。不得不說,這很湯式風格。
堅持原創這件事,是留給有勇氣的人做的;而真正支持創新的人,是有勇氣擔責的。
也因為這樣的堅持,才有了喜劇事業蓬勃發展,才有了很多優秀的喜劇工作者。
趙本山、趙麗蓉、馮鞏和我。
(傳下去,這是四大喜劇天王)
最後他談到以前的喜劇之所以那麼好看,是因為時間的沉澱才成為經典。也許前路一片迷霧,而他們只是一群選擇出發,堅信趕路的人。
還是一樣的引經據典,還是一樣的湯式風格,這樣一段不到十分鐘的數位人演講已經讓人感懷。
AI的高級意義。
動容的同時,也著實被技術細節驚艷到了。例如中場湯老師還喝了一次水。
效果這麼逆天嗎?其他家都是正臉,這個低頭和手部動作都挺自然的。
打破次元的如影數字人技術
真實世界的湯曉鷗老師已經與我們告別。這次特別演講的開篇,就提到讓湯老師「跨越次元」的,是商湯如影數字人技術。
最早在去年四月,商湯發表「日日新」大模型體系,如影(SenseAvatar)首度登場。
據了解,只需5分鐘真人影片素材,如影就可以產生動作聲音自然、口型準確、多語種精通的數位人分身。
3個月後,商湯「日日新」大模型體系全面升級,如影也進化了2.0版本。
語言方面,如影2.0打造的數位人將英語、日語、西班牙、阿拉伯語等多語種的精準度提升30%以上,而且口型和語音匹配得更加自然。
生成效果方面,如影2.0支援實現影級4K高畫質視訊的輸出,成片質感再度提升。
同時也帶來了新玩法,使用者可透過輸入提示詞自動產生與描述相符的專屬數位人形象,還是可以實現數位人歌唱功能的那種。
當湯曉鷗數位人現身為大家表演脫口秀的那一刻,其自然逼真的表現效果讓不少網友為之震驚,直呼這就是《流浪地球2》照進現實。
這一幕,就如電影中,科學家圖恆宇透過量子電腦「復活」了因車禍過世的女兒:
其實,類似案例如今正更為頻繁地照進現實。
例如,音樂人包小柏同樣依靠AI技術,「復活」了女兒。
2021年包小柏的女兒因罕見疾病去世,享年22歲。在經歷失去愛女的悲痛後,包小柏決心攻讀博士開始鑽研AI技術,期望能在虛擬世界中保存女兒的存在。
經過反覆探索,包小柏如願復刻出了“數字女兒”,在包小柏妻子生日當天,“女兒”還為媽媽唱了一首生日歌,為這個家庭帶來了些許慰藉。
B站up主吳伍六,前段時間用AI工具產生了奶奶的虛擬數位人,也引起了不小關注。
只見影片中,數位人「奶奶」講著流利的湖北的方言與up主對話。
如奶奶生前一樣,囑咐其父親「別喝酒,要節約,別打牌」:
事實上,自從生成式AI技術興起以來,一直有人在探索用AI「復活」親人這種方式來寄託思念。
例如在三年前,當時最先進的對話系統,還是由GPT-3驅動。因未婚妻離世而備受折磨的青年約書亞,就決定用科技「復活」亡妻。
根據程序設定, 「她」和人類一樣有著生老病死,每說一句話,壽命就減少一點。
當「她」只剩20%壽命後,會開始胡言亂語。當系統壽命耗盡到0%,虛擬人的生命也走向終點。
如今,隨著科技發展逐漸成熟,遠去之人的身影已經可以做到具象化。說話風格、語音語調、還有外在形像也都能完整地保留。
這段時間,影片產生的進展如火如荼。像阿里就發布了個由音訊驅動的肖像視訊生成框架——EMO。
輸入單張參考影像,以及一段音訊(說話、唱歌、rap均可),就能產生表情鮮明的AI影片。
於是有人生成哥哥張國榮,為大家帶來一首陳奕迅粵語版的《無條件》。
或許之後隨著科技逐漸進化,人類的思念也將有實實在在的歸處。
最後,沒想到還能再以這種方式見到湯曉鷗教授。感念!