语音识别装置和语音识别方法制造方法及图纸

技术编号：12243752 阅读：72 留言：0更新日期：2015-10-28 10:25

语音识别装置(1)在内部识别部(7)中，对输入语音(2)的语音数据(4)进行使用了声学模型(9)的识别处理，求出内部识别结果(10)和声学似然度。读音赋予部(12)取得由外部识别部(19)对输入语音(2)的语音数据(4)进行识别处理后的外部识别结果(11)，对该语音数据(4)赋予读音，重新对照部(15)使用声学模型(9)，求出外部识别结果(11)的声学似然度，作为重新对照结果(16)。结果确定部(17)对内部识别结果(10)的声学似然度、和重新对照结果(16)所包含的外部识别结果(11)的声学似然度进行比较，确定最终识别结果(18)。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及，从外部的语音识别部和内部的语音识别部分别得到识别结果，从而确定最终的识别结果。
技术介绍
在利用汽车导航装置和智能手机等设备进行语音识别的情况下，这些设备的硬件资源未必充分，因此存在如下这样的客户端/服务器型的语音识别系统:不在设备内执行所有发声的语音识别，而将语音数据发送到外部的服务器，并接收利用该服务器进行语音识别后的结果。另外，这里的客户端是指汽车导航装置和智能手机等位于使用者手中的设备。由此，即使在客户端也能够利用大量词汇的语音识别。但是，客户端所特有的识别词汇、以及仅存在于使用者的地址簿中的固有名词等未必能够由服务器进行识别。作为其对策，在专利文献I中公开了如下技术:不仅仅是由服务器进行语音识别、由客户端接收结果，根据发声的不同，由客户端和服务器两者进行语音识别，一并记述两者的结果，或者选择任意一个的识别结果。具体而言，在专利文献I中记述了在选择客户端和服务器的识别结果中的任意一个的情况下，选择声学似然度较高的识别结果。现有技术文献专利文献专利文献1:日本特开2010-85536号公报
技术实现思路
专利技术要解决的课题在以往的客户端/服务器型的语音识别方法的情况下，在选择客户端和服务器的识别结果中的任意一个时，需要比较表示两者的识别结果的准确性的数值即识别分数、似然度等，但有时无法从服务器侧得到这些信息。此外，即使能得到，也不保证是按照与客户端侧的语音识别相同的基准计算出的。因此，在选择客户端和服务器的识别结果中的任意一个的情况下，存在有时无法进行准确的比较从而不能得到足够的语音识别精度的课题。本专利技术正是为了解决上...
<a href="http://www.xjishu.com/zhuanli/21/CN105009206.html" title="语音识别装置和语音识别方法原文来自X技术">语音识别装置和语音识别方法</a>

【技术保护点】
一种语音识别装置，其得到对输入语音数据进行识别处理后的内部识别结果、和通过存在于外部的1个以上的外部识别部对该输入语音数据进行识别处理后的外部识别结果，确定最终的识别结果，其特征在于，所述语音识别装置具有：声学模型，其是对语音的特征量进行模型化而得到的；语言模型，其储存有作为语音识别装置的识别对象的1个以上的词汇的标写和读音；读音词典，其储存有所述识别对象和所述识别对象外的词汇的标写与其读音的对；分析部，其分析所述输入语音数据来计算特征向量；内部识别部，其使用所述声学模型，进行所述分析部计算出的所述特征向量和所述语言模型所储存的各词汇之间的模式对照，计算声学似然度，将该声学似然度高的上位的1个以上的词汇的标写、读音和声学似然度作为内部识别结果输出；读音赋予部，其取得通过所述外部识别部对所述输入语音数据进行识别处理后的外部识别结果，使用所述读音词典，赋予针对该外部识别结果的读音，输出由该外部识别结果及其读音构成的读音赋予结果；重新对照部，其使用所述声学模型，进行所述分析部计算出的所述特征向量和所述读音赋予部输出的所述读音赋予结果之间的模式对照，计算针对所述外部识别结果的声学似然度；以及结...

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员：花泽利行，
申请(专利权)人：三菱电机株式会社，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人