實測微軟Edge Copilot AI無法真正總結每段YouTube視頻
本週,微軟Edge 瀏覽器中的AI Copilot 增加了一項功能,即產生影片文字摘要。但正如微軟廣告和網路服務執行長米哈伊爾-帕拉欣(Mikhail Parakhin)所解釋的那樣,Edge Copilot 的省時功能仍然相當有限,而且只適用於預處理過的影片或帶字幕的影片.
Parakhin 寫道:「為了讓它發揮作用,我們需要對影片進行預處理。如果影片有字幕,我們可以隨時恢復;如果沒有字幕,而且我們還沒有預處理,那麼它就不能工作。”
換句話說,Edge Copilot 本身與其說是總結視頻,不如說是總結視頻的文字稿。Copilot 也可以在整個Microsoft 365 中執行類似的功能,包括總結Teams 視訊會議和客戶服務代理的通話內容–在這兩種情況下,音訊都需要先由微軟進行轉錄。Microsoft Stream 上的Copilot 也可以總結任何視頻,但同樣需要使用者產生書面文字記錄。
在設計師Pietro Schirano 發布了Edge Copilot 總結YouTube 影片《GTA VI》預告片的螢幕錄影後,話題開始了。在這種情況下,Copilot 似乎完美地完成了任務。錄音中的使用者按下Copilot 側邊欄上的”生成影片摘要”按鈕,僅幾秒鐘後,Copilot 就產生了一份影片摘要,並標註了要點和時間戳記。
當然,包括YouTube 和Vimeo 在內的許多平台都能自動產生文字稿和字幕,前提是用戶啟用了該功能。The Verge 在X 上詢問Parakhin,我們是否可以認為大多數公開影片(如YouTube)都沒有經過預處理,他回答說:”應該對大多數影片都有效」。
Copilot 只是微軟與Google(及其他公司)展開生成式人工智慧競賽的最新例子。上個月,Google為其Bard 聊天機器人升級了YouTube 擴展,使其能夠總結影片內容,並從中浮現出特定訊息。就在本週,Google宣布對”雙子座”(Gemini)進行重大更新,但更新本身也存在問題–在一次演示中,該公司的編輯可能歪曲了人工智慧的某些功能,而且Google並不總是能把事實說清楚。
帕拉欣在社群媒體上坦率地講述了Copilot 的各個發展階段。