Google承認剛推出的Gemini AI至少有一段效能示範是經過剪輯的
Google剛剛發布了迄今為止最強大的人工智慧模型套件”雙子座”(Gemini),但該公司已被指責在性能方面撒謊。彭博社的一篇專欄文章稱,Google在最近的一段影片中歪曲了”雙子座”的性能。專欄作家帕米-奧爾森(Parmy Olson)說,Google在本週早些時候的發布會上播放了一段令人印象深刻的”What the AI quack”的上手視頻,在視頻中,Gemini 看起來能力非凡–也許能力太強了。
這段六分鐘的影片展示了Gemini 的多模態功能(例如,口語對話提示與影像辨識結合)。雙子座似乎能快速辨識影像(甚至是連線圖片),在幾秒鐘內做出反應,並即時追蹤杯球遊戲中的紙團。當然,人類可以做到所有這些,但這是一個能夠識別並預測接下來會發生什麼的人工智慧。
不過,點擊YouTube 上的影片描述,Google有一個重要的免責聲明:「為了演示的目的,延遲已經減少,雙子座的輸出已經縮短,以求簡潔」。
這正是奧森不滿意的地方。根據她在彭博社發表的文章,Google在被要求發表評論時承認,視頻演示並不是通過語音提示實時進行的,而是使用了原始鏡頭中的靜止圖像幀,然後寫出文字提示,讓雙子座做出回應。奧爾森寫道:”這與谷歌似乎在暗示的內容大相徑庭:人可以與雙子座進行流暢的語音對話,同時雙子座會實時觀察並回應周圍的世界。公平地說,Google公司經常編輯演示視頻,尤其是許多公司希望避免現場演示帶來的任何技術故障。稍作調整是常有的事。但是,Google在視頻演示方面一直存在問題。人們曾懷疑Google的Duplex 演示(還記得Duplex 嗎?Duplex 是一款人工智慧語音助手,可以打電話給髮廊和餐廳預訂房間。而預先錄製的人工智慧模型影片往往會讓人更加懷疑。”
在這種情況下,奧爾森認為Google是在”作秀”,目的是誤導人們,讓他們不知道Gemini 仍然落後於OpenAI 的GPT。
Google對此並不認同。當被問及演示的真實性時,Google指出了Google DeepMind 研究副總裁兼深度學習負責人Oriol Vinyals(也是Gemini 的聯合負責人)的一篇文章,其中解釋了團隊是如何製作影片的。
Vinyals 說:”影片中的所有用戶提示和輸出都是真實的,為了簡潔起見進行了縮短。影片展示了使用Gemini 構建的多模式用戶體驗。我們製作它是為了激勵開發人員。”
他補充說,團隊給了雙子座圖片和文本,並要求它預測接下來會發生什麼。
這當然是處理這種情況的一種方法,但對Google來說可能並不合適——至少在公眾看來,Google已經被OpenAI 今年的巨大成功嚇了一跳。如果Google想激勵開發者,就不能透過精心剪輯的宣傳片,這些宣傳片可能會扭曲人工智慧的能力。而是透過讓記者和開發人員實際體驗產品。讓人們在小型公開測試版中用雙子座做蠢事。讓我們看看它到底有多強大。