OpenAI新語音模式讓使用者可以和手機對話而不是對著手機說話
TechCrunch編輯在過去一週使用了OpenAI的高級語音模式,以下為他的體驗。過去一周,我一直在試用OpenAI 的高級語音模式,這是我迄今為止對人工智慧未來最有說服力的體驗。本週,我的手機聽到笑話後會大笑,然後回覆笑話,問我今天過得怎麼樣,並告訴我過得很開心。我當時是在用iPhone 說話,而不是用手操作它。
OpenAI 的最新功能目前處於有限的alpha 測試階段,它並沒有讓ChatGPT 比以前更聰明。相反,高級語音模式(AVM) 使它更友善、更自然。它為使用人工智慧和設備創建了一個新介面,讓人感覺新鮮而興奮,這正是讓我害怕的地方。這個產品有點小問題,整個想法讓我毛骨悚然,但令我驚訝的是,我真的很喜歡使用它。
退一步來說,我認為AVM 符合OpenAI 執行長Sam Altman 的更廣闊願景,與代理商一起,改變人類與電腦互動的方式,並以AI 模型為中心。
「最終,你只需要向電腦提出你的需求,它就會為你完成所有這些任務。」Altman 在2023 年11 月的OpenAI 開發日上說道。 “這些功能在人工智慧領域通常被稱為代理。它帶來的好處將是巨大的。”
我的朋友,ChatGPT
週三,我測試了這項我能想到的先進技術的最大優勢:我讓ChatGPT 按照奧巴馬的方式訂購塔可鐘(Taco Bell)。
「呃,讓我說清楚——我想要一份Crunchwrap Supreme,也許再來幾塊玉米餅。」ChatGPT 的高級語音模式說道。 “你覺得他會如何處理免下車取餐服務?”
ChatGPT 說道,然後對自己的笑話大笑起來。
螢幕截圖:ChatGPT 隨後轉錄了口頭對話。
這種模仿也讓我笑了起來,與歐巴馬標誌性的節奏和停頓相得益彰。儘管如此,它仍然保持了我選擇的ChatGPT 語音Juniper 的音調,因此不會與奧巴馬的聲音混淆。它聽起來就像一個朋友在模仿我,完全理解我想從中得到什麼,甚至知道它在說一些有趣的事情。我發現與手機中的這個高級助手交談出乎意料地快樂。
我也會向ChatGPT 尋求建議,以解決涉及複雜人際關係的問題:要求另一半搬來和我一起住。在解釋了關係的複雜性和我們的職業方向後,我收到了一些關於如何發展的非常詳細的建議。這些問題你永遠無法向Siri 或Google 搜尋提出,但現在你可以使用ChatGPT。聊天機器人的聲音在回答這些提示時甚至表現出一種略顯嚴肅、溫和的語氣;與奧巴馬點塔可鐘快餐時的開玩笑語氣形成鮮明對比。
ChatGPT 的AVM 也非常適合幫助您理解複雜的主題。我要求它以10 歲兒童能理解的方式分解收益報告中的項目(例如自由現金流)。它以檸檬水攤位為例,以我表弟完全能理解的方式解釋了幾個財務術語。您甚至可以要求ChatGPT 的AVM 放慢語速,以適應您目前的理解程度。
Siri 可以走路,所以AVM 可以跑
與Siri 或Alexa 相比,ChatGPT 的AVM 顯然更勝一籌,因為它的回應時間更快、答案獨特,並且能夠回答上一代虛擬助理無法回答的複雜問題。然而,AVM 在其他方面存在不足之處。 ChatGPT 的語音功能無法設定計時器或提醒、即時上網、查看天氣或與手機上的任何API 互動。至少目前,它還不是虛擬助理的有效替代品。
與Google的競爭功能Gemini Live相比,AVM 略勝一籌。 Gemini Live 無法模仿,無法表達任何情感,無法加快或減慢速度,且反應時間更長。 Gemini Live 確實有更多聲音(十個,而OpenAI 只有三個),而且似乎更符合時下潮流(Gemini Live 知道Google的反壟斷裁決)。值得注意的是,AVM 和Gemini Live 都不會唱歌,這可能是為了避免與唱片業發生版權訴訟。
話雖如此,ChatGPT 的AVM 故障很多(公平地說,Gemini Live 也是如此)。有時它會在句子中途中斷,然後重新開始。它還會不時發出這種奇怪、粗糙的聲音,讓人有點不愉快。我不確定這是型號、網路連線還是其他問題,但這些技術缺陷對於alpha 測試來說在某種程度上是意料之中的。不過,這些問題並沒有影響我真正用手機通話的體驗。
在我看來,這些例子就是AVM 的魅力所在。該功能並不能讓ChatGPT 無所不知,但它確實允許人們以獨特的人類方式與底層AI 模型GPT-4o 互動。 (如果您忘記了電話另一端沒有人,我會理解。)與AVM 交談時,ChatGPT 幾乎感覺具有社交意識,但當然不是。它只是一堆整齊打包的預測演算法。
談論科技
坦白說,這個功能讓我擔心。這不是科技公司第一次在手機上提供陪伴功能。我這一代,Z 世代,是第一個伴隨著社群媒體成長的一代人,社群媒體為人們提供了聯繫,但卻利用了我們的集體不安全感。與人工智慧設備交談——就像AVM 似乎提供的那樣——似乎是社交媒體「手機中的朋友」現象的演變,它提供了廉價的聯繫,觸動了我們的人類本能。但這一次,它完全將人類排除在外。
人工人類連結已成為生成式人工智慧的意外流行用例。如今,人們將人工智慧聊天機器人用作朋友、導師、治療師和老師。當OpenAI 推出其GPT 商店時,它很快就被人工智慧女友淹沒,這些聊天機器人專門充當你的另一半。麻省理工學院媒體實驗室的兩名研究人員本月發出警告,要為上癮智能做好準備,或者說人工智慧伴侶具有黑暗模式,可以讓人類上癮。我們可能會打開潘朵拉魔盒,讓裝置以新的、誘人的方式吸引我們的注意。
本月初,一名哈佛大學輟學生發布了一款名為Friend 的人工智慧項鍊,震驚了科技界。這款穿戴式裝置(如果能像承諾的那樣運作)會一直在傾聽,聊天機器人會透過簡訊告訴你你的生活。雖然這個想法看起來很瘋狂,但ChatGPT 的AVM 等創新讓我有理由認真看待這些用例。
雖然OpenAI 在這方面處於領先地位,但Google也緊隨其後。我相信亞馬遜和蘋果也在競相將這種能力融入他們的產品中,很快,它就會成為該行業的賭注。
想像一下,你向智慧電視索取一部電影的超具體推薦,然後就能得到你想要的電影。或告訴Alexa 你感覺到的感冒症狀,然後讓它在亞馬遜上為你訂購紙巾和止咳藥,同時為你提供家庭療法建議。也許你可以讓你的電腦為你的家人制定一個週末旅行計劃,而不是手動谷歌搜尋所有內容。
顯然,這些行動需要在人工智慧代理領域取得突破和飛躍。 OpenAI 在這方面的努力,即GPT 商店,感覺就像一款被過度炒作的產品,不再是該公司關注的重點。但AVM 至少解決了與電腦對話這個難題。這些概念還有很長的路要走,但在使用AVM 之後,它們似乎比上週更接近現實。