NVIDIA Jarvis對話式AI框架開始提供對手機和消息應用的普遍適用性
在今天上午的GTC 2021上,NVIDIA宣布了其Jarvis框架的普遍可用性,該框架為開發人員提供預先訓練的AI模型和軟件工具,以創建交互式對話體驗。NVIDIA表示,Jarvis模型於2020年5月首次在預覽版中推出,為對話代理提供自動語音識別,以及語言理解、實時語言翻譯和文本到語音功能。
智能手機和消息應用程序的普遍性–在流行病的刺激下–促進了對話技術的應用增加。56%的公司在一項調查中告訴埃森哲,對話式機器人和其他體驗正在推動其行業的顛覆。而Twilio的一項研究顯示,每10個消費者中就有9個希望能選擇使用信息傳遞來聯繫企業。
利用GPU加速,Jarvis的管道可以在100毫秒內運行,並在雲端、數據中心或邊緣部署。該框架包括在超過10億頁的文本和超過6萬小時的語音中訓練出來的模型,這些模型可以通過自定義數據進行調整、優化、微調,並根據不同的任務、行業和系統進行定制。
T-Mobile是Jarvis的早期用戶之一,Jarvis–支持包括英語、中文和日語在內的五種語言,自去年年初上市以來,已經積累了超過4.5萬次下載。根據NVIDIA的說法,這家電信巨頭正在使用該框架來幫助實時解決客戶服務問題。
即使在大流行之前,自主代理也在成為規則而不是例外的路上,部分原因是消費者更喜歡這種方式。根據Vonage子公司NewVoiceMedia去年發布的研究報告,25%的人更願意由聊天機器人或其他自助服務替代方式來處理他們的疑問。而Salesforce表示,大約有69%的消費者選擇聊天機器人與品牌進行快速溝通。
NVIDIA還宣布與Mozilla Common Voice合作,Mozilla Common Voice是一個開源的語音數據集合,供初創企業、研究人員和開發人員訓練語音功能的應用、服務和設備。作為世界上最大的多語言公共領域語音數據集,Common Voice包含了60種不同語言的超過9000小時的貢獻語音數據。Nvidia表示,它正在使用Jarvis利用該數據集開發預訓練模型,然後免費提供給社區。
Jarvis中新透露的功能將在2021年第二季度發布,作為NVIDIA持續開放測試計劃的一部分。開發者今天就可以從NVIDIA的NGC目錄中下載該框架。