波士顿大学计算机科学教授获得9.8万美元资助以改进语音识别技术

波士顿大学大都会学院计算机科学系的助理教授Shengzhi Zhang获得了思科98,197美元的资助,该项目将通过改进处理错误识别输入的方式来帮助构建更好的语音识别系统。

波士顿大学计算机科学教授获得9.8万美元资助以改进语音识别技术

Zhang的项目题为“重新思考针对语音识别系统的对抗性攻击”。目前,语音识别系统可能并不可靠,因为它们的机器学习基础在遇到声音缺陷时很容易受到损坏。这些“对抗性例子”会误导系统并导致错误。

在他的研究中,Zhang专注于人工智能安全,调查人工智能系统中的风险(例如为Amazon Echo、Google Assistant、Home、Apple的Siri和Microsoft Cortana背后的语音识别系统提供动力的风险),并设计防御解决方案以减轻风险那些风险。

虽然语音识别模型是为了模仿人类听力而构建的,但人类听力的一些元素尚未整合,这些元素与频率有关。这项研究工作的假设是,刺激或语音频率是解释现象的关键,现象是人类用来分解单词的可感知的声音。

Zhang说:“我们正在尝试识别生成的对抗性示例中导致语音识别系统误识别的关键特征。”他解释说,这些人类无法察觉的特征是故障的根本原因。这会产生一个可能被不良行为者利用的漏洞。

“攻击者可以制作一段扰动片段,将其注入一段轻柔的音乐中,”他解释道,“并且当使用扬声器播放时,它将被语音识别系统识别为短语或命令,以执行以下操作:操作,喜欢打开灯。但对于人来说,它仍然被解释为轻柔的音乐,并带有某种噪声。”

Zhang表示,本项目所体现的解决问题的综合性是计算机科学研究的共同特点。“实际上,语音识别本身就是计算机科学和计算语言学的一个跨学科子领域。”

信息源于:波士顿大学

版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。

(0)

相关推荐

发表回复

登录后才能评论