快捷搜索:

口音已成为语音识别技术发展的一大难题

(文章滥觞:品途商业评论)

语音对付人机交互的紧张性毋庸置疑,无论是国内外企业,都在语音识别的速率、准确度以及多语种方面持续立异,然则当机械面对那些有口音的人来说,彷佛就没有那么灵敏了:不仅留意力会不集中,反映痴钝,以致还会成为一个自力的个体,不予任何回应。若何办理口音识别问题,已成为智能语音下一阶段的竞争焦点,但这不仅仅是纯真的增添语料库就能提升的,好在已经有少数公司,开始经由过程构建新的语音模型,来办理口音问题。

自IBM的Shoebox与Worlds of Wonders的Julie Doll问世以来,语音识别技巧已经取得了长足进步。以致有报道称,到2018岁尾,谷歌Google Assistant将支持跨越30种说话。除此以外,高通已经开拓出了一款能够识别单词和短语的语音识别设备,准确率高达95%。而微软也不甘示弱,其呼叫中间办理规划(智能语音客服)比人工展开的呼叫办事更准确,更高效。

但必要留意的是,只管在机械进修的加持下,语音识别技巧取得了伟大年夜的进步,但现在的语音识别系统照样不完美的。比如,不合地区的口音,让这项技巧拥有了很强的“地域轻蔑性”。平日环境下,口音对人类来说不是什么大年夜问题,无意偶尔还会让人感到到一种异国风情的魅力,然则对机械而言,这是一条难以超过的鸿沟,可能是其成长历程中面临的最大年夜寻衅。

近来,华盛顿邮报与Globalme和Pulse Labs两家说话钻研公司相助,对搭载了语音识别技巧的智能音箱设备的口音问题进行了钻研,钻研范围来自美国近20个城市、跨越100名介入者发出的数千条语音敕令,结果显示,这些系统在理解来自不合地区的人的说话时存在显明差异。

举个例子,谷歌智能音箱Google Home识别西岸口音的准确率比识别南方口音高3%;而亚马逊语音助手Alexa识别中西部的口音的准确率要比东岸口音低2%。但面临最大年夜问题的是持非本土口音的人:在一项钻研中,经由过程比较Alexa识别的内容与测试组的实际话语,结果显示不准确率可达30%。此外,面对以西班牙语和汉语作为第一说话的人所说的英文,不管是Google Home照样Amazon Echo,其识别率都是最低的,要知道,拉丁裔和华裔是美国的两大年夜移夷易近族群。

虽然这项钻研长短正式的,也存在必然的限定,但其结果照样注解口音仍是语音识别技巧面临的主要寻衅之一。对此,亚马逊在一份声明中称,“跟着越来越多的拥有不合口音的人与Alexa进行交流,Alexa的理解能力也会获得改良。”同时,谷歌也表示,“在扩大年夜数据集的同时,我们也将继承前进Google Home的语音识别能力。”

事实上,不光是Amazon Echo和Google Home,采纳率更低一些的微软Cortana和苹果Siri也是如斯,它们都必要及时前进自家的语音识别技巧,以便让用户认为知足的同时,又能在举世范围内扩大年夜自己的影响力。

您可能还会对下面的文章感兴趣: