Krisp正在利用AI幫助印度人在通話中聽起來像美國人
音頻新創公司Krisp 週三表示,它正在推出一項新功能,利用人工智慧在通話過程中即時改變用戶的口音。該公司最初推出的功能是將印度英語口音改為美國英語。

該新創公司表示,口音轉換過程會保留說話者的聲音,只切換音素以配合美國口音。該功能顯然已在企業環境中進行了測試,測試版現已在Krisp 桌面應用程式中推出。用戶可以在通話期間或通話前隨時啟用此功能。
該公司聯合創始人阿托·米納斯揚(Arto Minasyan) 表示,該功能的想法源於他在交談中遇到的一個問題。 「儘管我的英語說得很好,但很多人聽不懂我的口音。我們認為改變口音可能會幫助人們更好地理解對方。我們兩年前就開始著手解決這個問題,現在我們正在發布測試版,」米納斯揚說。
然而,記者在測試該功能時發現,處理後的語音聽起來不太自然,有時甚至會漏掉一些單字。該公司將這些缺陷歸咎於這是測試版,並表示模型會隨著時間的推移而改進。
Krisp 聲稱,當它與企業測試該功能時,銷售轉換率上升了26.1%,客單價增加了14.8%。
該公司表示,之所以決定先研究印度口音,是因為印度人在STEM 領域佔全球勞動力的很大一部分。他們計劃增加對更多口音的支持,包括菲律賓口音。
其他新創公司,如GV 支援的Sanas,已經在呼叫中心大規模部署了類似的技術。
該公司表示,它利用涵蓋不同口音和方言的數千個語音樣本對該模型進行了訓練,並在徵得用戶同意後使用了會議助理的數據。該功能的另一個優點是它不需要對使用者的聲音進行任何預先訓練,因為它可以即時為說話者建立個人資料。
Krisp 上一次融資是在2021 年,該公司計劃今年發布iOS 和Android 應用程序,以支援面對面會議。此外,該公司還在開發一款新的Chrome 擴充程序,以便更好地與Google Meet 整合。