首页 |  资讯中心 |  城市交通 |  车联网 |  卫星导航 |  高速公路 |  行业观察 |  交警之窗 |  专题 |  会议展览 |  招投标

你的位置:首页 > 卫星导航 > GPS > 正文

Nuance:汽车导航迎来个性化语音时代

2013-08-05 09:58:26 来源:慧聪汽车电子网责任编辑: admin
摘要: 随着汽车导航迎来语音时代,人们从繁琐的手动操作中解放出来,出行更为舒心、便捷。目前,各大汽车厂商纷纷表示要将语音识别放入汽车里改变人们的驾驶操作习惯,作为全球领先的语音技术提供商——Nuance在语音识别技术上的突破和发展,有力的推动个性化语音时代的到来。

 

    随着汽车导航迎来语音时代,人们从繁琐的手动操作中解放出来,出行更为舒心、便捷。目前,各大汽车厂商纷纷表示要将语音识别放入汽车里改变人们的驾驶操作习惯,作为全球领先的语音技术提供商——Nuance在语音识别技术上的突破和发展,有力的推动个性化语音时代的到来。

 

\

张亚昕博士(左2 )与Nuance汽车业务部各地代表合影

 

    Nuance语音识别及其技术原理

 

    Nuance中国区研发总监张亚昕博士告诉笔者:“目前在嵌入式系统中,Nuance语音识别能处理的数量是全球最多的。Nuance的技术特点不仅仅是最多,而且它在较少条数和大量条数之间的识别率变化十分稳定。在一些演示系统中,普通识别器经常会放上几个人或者十来个人名字做普通识别,但是当数目条数上到一万甚至是十万基础时候,基本上识别率下降就会很快。当然,Nuance的客户拿Nuance做对比测试的时候,比如地理地名识别,31个省市的地区名称的识别点在90%以上,深入到31个省市增加到十万条的兴趣点,它的识别率仍然保持在90%以上,识别率下降不多。目前来讲,Nuance嵌入式系统的处理条数已经超过百万,识别率稳定地保持在90%以上的水准。”

 

    Nuance错误率减少的标准是以百分比来体现。比如Nuance在汽车应用的嵌入式引擎叫做VoCon。VoCon 3到最新推出的VoCon 4,VoCon 4会比VoCon3针对不同的语音在错误率减少会有15%—25%的提升,也就是说如果在VoCon 3中有100个识别错误,在VoCon 4中会减少到75到85个错误。

 

    对于每一个语言,我们都有一个标准的测试板。每一个测试板上的数据是由各种实际环境采集的数据组合而来的,如相对安静环境下的数据,相对噪声下的数据等等。在相对噪声下的数据中,比如在运行的汽车中的数据,Nuance将其分为发动机开着车辆静止的环境、在高速公路上行驶的环境、低速行驶的环境等等,基本上可以这么理解。将来这项语音识别器要应用在哪个领域,Nuance就会在相应领域的环境下进行采集录音。这些音的录制有若干人完成,通常测试数据库的人数不低于百余人。性别年龄等分布均匀,年龄分布在18-60岁之间。在实际应用环境中,每一个人的应用环境中至少要说几句,要说一些句子、歌名、或者是命令、名字等等进行分布,总体而讲,每一个人录下来的句子应该是到100-200句之间,句子根据不同的应用来定句子的内容,尽可能考虑把实际应用中会牵扯的句子先录下来测试。

 

    Nuance的嵌入式引擎每一年或者半年发布一款新的版本,每一个新版本在推出之前都会通过Nuance的数据库进行测试,衡量错误率的减少会达到什么样的程度。继而才会推出新版本的嵌入式引擎。

 

    Nuance语音技术在中国市场的应用

 

      针对中国区域的语音识别,Nuance主要支持普通话和广东话,而广东话是我们做的唯一一个方言,因为它在澳门、香港以及华南地区日常使用的语言。虽然我们不支持其他中国的方言,但Nuance在口音处理方面下了很大的功夫。Nuance的普通话口音识别覆盖从北方到南方,以及大部分汉语地区各地不同的口音。但是,对于合格和不合格的口音没有一个明显的界限,Nuance针对中国普通话的算法上主要是区别什么地方的口音较重和什么地方是普通话相对标准这两个方面进行处理。Nuance没有特意针对某一类的方言口音做特殊的处理,而是尽可能覆盖某个区域更大面积的口音。

 

    可以这么说,Nuance在中文语音识别上面充分考虑南北方口音的不同,尽可能消除口音对普通话语音识别率的影响。

 

    语音技术在欧美应用面更大。在中国,目前是呼叫中心中会有一些应用,因为用语音识别可以过滤掉大部分的问题,能够大幅度减少坐席数,而且语音识别系统永远不会“烦躁”,这样会更大幅度地提高服务满意度。

 

    在语音技术嵌入式应用里面,包括手机和汽车。比如在欧美市场,福特汽车在语音汽车方面应用是最激进的,全线汽车采用了Nuance的语音识别技术。在中国市场,新福克斯采用的第一代SYNC系统也是采用了Nuance的语音识别技术。当然,第一代SYNC已经不能代表语音识别技术的最新发展前沿,而在北美的第二代SYNC亦采用了Nuance前沿的技术,得到的市场反馈也是非常好的。另外,奥迪、宝马、奔驰、丰田等都是Nuance的客户,在不远的将来也会有配备语音识别的新车型上市。

 

    其实语音技术与汽车应用本身存在矛盾。按照理想状态,汽车应用应该是语音识别应用的最佳环境,因为语音识别能够降低越来越多的车内车载电子设备操作时带来的驾驶风险,所以从理想状态而言,用语音识别与汽车互动是最理想的。而恰恰是这个最理想的应用环境,汽车的声学环境又阻碍了语音识别技术的应用。在汽车内应用时,噪声高、识别率低导致使用率不高。

 

    Nuance在与汽车结合时注意到这一点,已经研发出一整套的解决方案。比如,我们在抗噪性处理方面,初级方案里在算法中会增加一些抗噪模块,再进一步比如增加定向性好的麦克风进行处理,再进一步我们就有比较完整的解决方案配备Micro phone array and beam-forming,一些在欧洲的高端车比如戴姆勒奔驰中已经有所应用。其应用原理是,在语音识别系统中装若干个麦克风,通过配套的数字信号处理模块,来进行定向的交叉,从而更好地将声源控制在驾驶员脑袋周围附近,这样会非常大幅度地抑制周围噪音带来的干扰。Nuance在数字电视处理方面也会应用这项原理,可以不用拿遥控器甚至在开着电视声音的情况下直接就可以对电视发出语音命令。这其中起到关键因素还有一个SSE技术,配备Microphone array软硬件共同处理,极大提高抗噪性,而且能够屏蔽掉声源里的噪音干扰。

 

    SSE技术部分解决了相对远距离(只要麦克风超过30厘米)的问题,实际上在汽车中目前也存在这个距离,一般汽车的语音识别器安装在倒视镜位置,距离驾驶员也有30-50厘米。SSE技术相应地能够更好地降低这部分距离的干扰。

 

    Nuance语音技术的研发重心

 

    张亚昕博士:SSE是Nuance语音技术的研发重心之一。从准确性角度而

分享到:

声明:

凡文章来源标明“中国智能交通网”的文章版权均为本站所有,请不要一声不吭地来拿走,转载请注明出处,违者本网保留追究相关法律责任的权利;所有未标明来源为“中国智能交通网”的转载文章均不代表本网立场及观点,“中国智能交通网”不对这些第三方内容或链接做出任何保证或承担任何责任。

相关阅读

征稿:

为了更好的发挥中国智能交通网资讯平台价值,促进诸位自身发展以及业务拓展,更好地为企业及个人提供服务,中国智能交通网诚征各类稿件,欢迎有实力的企业、机构、研究员、行业分析师投稿。投稿邮箱: zw.ding@cps.com.cn(查看征稿详细)

热门文章