未來的Siri 或許可以讀懂你的表情
智能語音助手技術發展至今,大部分功能還是依託於“理解”以語音為基礎的語義上。例如我對Siri 說:“今天天氣怎麼樣?”為了解答這個問題,Siri 分別要做以下兩個動作,先將語音文字轉化為文字信息(顯示在屏幕上),然後運用自然語言處理技術對句子中的關鍵信息進行“理解”,最後才能做出解答。
而如果這兩個動作的任何一個出現差錯,都會影響最終的結果輸出。我想大家在使用Siri 時都有過這樣的體驗,當你給出一句意義糊不清的語音指令時,Siri 由於不確定自己“理解”得對不對,一般會反問你該輸出結果的正確性,這時你可能需要多點擊一次屏幕或者多進行一次回答才能獲得自己想要的最終結果。
蘋果在最新的專利中,打算通過引入“面部分析”的功能來幫助Siri 更好地理解用戶的請求。
據美國商標專利局的文件顯示,蘋果最近申請了一項名為“智能軟件代理”的專利,能讓智能助手根據用戶的面部表情或情緒來完成不同的操作。
為了實現這樣的功能,當用戶使用Siri 時,前置攝像頭將自動激活來充當“眼睛”的作用,並將獲取的表情動作與FACS(面部行為編碼系統)進行配對,幫助Siri 讀懂用戶的表情和情緒,並最終給出更加準確的回答。
FACS(面部行為編碼系統)根據人臉的解剖學特點,將其劃分成若干既相互獨立又相互聯繫的運動單元,並分析這些運動單元的運動特徵及其所控制的主要區域以及與之相關的表情,形成大量照片說明。面部行為編碼系統將許多現實生活中人類的表情進行了分類,它是如今面部表情的肌肉運動的權威參照標準,也被心理學家和動畫片繪畫者使用。
蘋果近兩年來一直都在大力推動Siri 的發展,從先前洩露的Siri 文件來看,蘋果計劃在2021 年秋季為Siri 帶來多個新功能。根據該報告,蘋果正在研究未來的Siri 更新,首先,Siri 在兩年後將配合一款尚未命名的新設備,實現“有關於健康問題的諮詢問答”,並提供機器翻譯功能。
而更早之前,有報告暗示蘋果或許將在明年的WWDC上推出SiriOS系統,這將是一個獨立開發的項目,相當於Amazon Alexa的Alexa Skills Kit或者Google Assistant使用的Action開發環境,而非成為現有操作系統(iOS、macOS、iPad OS)的一部分。基於此,報告預測SiriOS將允許開發者將其編寫進應用程序,提供更強的自定義體驗。