OpenAI推出進階語音模式提供更多語音和全新外觀
OpenAI宣布將於本週二向更多的ChatGPT 付費用戶推出高級語音模式(AVM)。這項音訊功能使ChatGPT 的語音更自然,將首先向ChatGPT 的Plus 和Teams 套餐客戶推出。企業和Edu 客戶將於下週開始使用。
作為推廣工作的一部分,AVM 的設計也進行了改進。該功能現在由一個藍色的動畫球體來表示,而不是OpenAI 在5 月展示該技術時的動畫黑點。
當AVM 可用時,用戶將在ChatGPT 應用程式的語音圖示旁收到一個彈出視窗。 ChatGPT 也將推出五種新語音:Arbor、Maple、Sol、Spruce 和Vale。這使得ChatGPT 的語音總數達到了九種(幾乎與Google的Gemini Live 一樣多),此外還有Breeze、Juniper、Cove 和Ember。您可能會注意到,所有這些名稱的靈感都來自大自然,這可能是因為AVM 的全部意義在於讓使用ChatGPT 感覺更自然。
OpenAI 在春季更新中展示了Sky 的聲音,但在這一陣容中缺少了Sky 的聲音,這導致斯嘉麗-約翰遜(Scarlett Johansson)發出了法律威脅。這位在劇情片《她》中扮演人工智慧系統的女演員聲稱,Sky 的聲音聽起來與她自己的聲音有點過於相似。 OpenAI 立即撤下了Sky 的聲音,表示從未想過要與約翰遜的聲音相似,儘管當時有幾位員工在推文中提到了這部電影。
這次推出的另一項功能缺失了:ChatGPT 的影片和螢幕分享功能是OpenAI 在四個月前的春季更新中首次推出的。此功能可讓GPT-4o 同時處理視覺和聽覺訊息。在示範過程中,OpenAI 的一位工作人員向大家展示如何向ChatGPT 提出即時問題,例如眼前紙張上的數學問題,或是電腦螢幕上的程式碼問題。目前,OpenAI 還沒有提供何時推出這些多模態功能的時間表。
OpenAI 表示,自從發布AVM 的有限Alpha 測試以來,它已經取得了一些改進。據稱,ChatGPT 的語音功能現在能更好地理解口音,該公司稱其對話也更加流暢和快速。在我們對AVM 的測試過程中,我們發現故障並不罕見,但該公司稱現在已經有所改善。
OpenAI 也將把ChatGPT 的一些自訂功能擴展到AVM:自訂指令允許使用者個人化設定ChatGPT 的回覆方式,而記憶功能則讓ChatGPT 可以記住對話內容,以便日後參考。
OpenAI 發言人表示,AVM 尚未在多個地區上市,包括歐盟、英國、瑞士、冰島、挪威和列支敦士登。