微软研究院正在开发一种识别静音语音命令的技术
微软一直致力于开发一种新的语音输入接口,允许用户在没有语音泄漏的情况下进行说话和录音。该研究由微软研究院进行,并在UIST 2018中进行了介绍。该模块名为SilentVoice,可以捕捉来自口腔的空气并记录声音而不会打扰周围的人。此外,该模块还将过滤周围的语音,因此即使有外界干扰,用户也可以捕获清晰的语音。
SilentVoice是一种新的语音输入接口设备,所提出的“渐进式语音”方法使得能够将麦克风放置在非常靠近嘴的前部而不受环境噪声的影响,捕获具有良好信噪比非常柔和的语音。它实现了超小(低于39dB)的语音泄漏,允许用户使用语音输入,而不会在公共和移动情况下以及在办公室和家庭中烦扰周围的人。
通过测量气流方向,SilentVoice可以很容易地与正常话语分离,准确率为98.8%,它可以用于带有经过专门训练的语音识别器的语音激活系统,微软评估其单词错误率(WERs)为1.8%,(依赖说话者的条件),7.0%(和说话者无关的条件)。
该技术仍处于研究阶段,但肯定会帮助人们在不打扰周围人的情况下工作并且录制语音。