语音识别词典制作支持系统、语音识别词典制作支持方法以及语音识别词典制作支持用程序技术方案

技术编号：3048254 阅读：331 留言：0更新日期：2012-04-11 18:40

提供一种语音识别词典制作支持系统，其利用可低成本获得的文本数据，能够有效地制作、更新可降低语音识别错误的语音识别用词典、语言模型。语音识别词典制作支持系统包括识别词典存储部（１０５）、语言模型存储部（１０６）和声音模型存储部（１０７）。虚拟语音识别处理部（１０２）针对由文本解析部（１０１）生成的解析完毕文本数据，参照识别词典、语言模型及声音模型，生成虚拟语音识别结果文本数据，并与最初的解析完毕文本数据进行比较。更新处理部（１０３）能够以降低两文本数据不同之处的方式更新识别词典、语言模型。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及语音识别词典制作支持系统、语音识别词典制作支持方法及语音识别词典制作支持用程序，特别地，涉及用于制作存储语音识别处理的构成要素即词汇的语音识别词典、和对字词的排列进行规则化后的语言模型的语音识别词典制作支持系统、语音识别词典制作支持方法以及语音识别词典制作支持用程序。
技术介绍
下面对现有技术的语音识别词典制作支持系统的概要进行说明。如图6所示，由文本解析机构201、出现频率计数机构202、更新机构203、背景词典存储机构204、识别词典存储机构205、及语言模型存储机构206 构成。具有这种结构的现有技术的语音识别词典制作支持系统按照如下方式工作。即，文本解析机构201从外部接收包含语音识别对象词汇的文本数据，利用存储于背景词典存储机构204中的单词词典进行语素(morpheme)解析处理，从而，将文本数据分割成一个一个的单词的系列，赋予其读音文字列，另外根据需要而赋予其词类标签，将其结果送至出现频率计数机构 202中。出现频率计数机构202从文本解析机构201接收单词系列，针对各单词对出现频率进行计数，将结果送至更新机构203。更新机构203根据由出现频率计数机构202接收的单词出现频率，计算出各单词的出现概率，与存储于该语言模型存储机构206中的单词的出现概率进行对照，修正存储于后者即语言模型存储机构206中的出现概率，以便接近由前者即文本数据计算出的出现概率。另外，在出现于文本数据中的单词中，针对具有一定以上的出现概率值的单词，确认其是否被登录在识别词典存储机构205中存储的识别词典中，未登录时认定该单...

【技术保护点】
一种语音识别词典制作支持系统，具有：　存储部，存储词典、语言模型及声音模型；　文本解析部，针对文本数据进行语素解析处理；　虚拟语音识别处理部，针对由上述文本解析部所解析的解析完毕文本数据，利用上述词典、语言模型及声音模型生成虚拟语音识别结果文本数据，并且提取上述解析完毕文本数据和上述虚拟语音识别结果文本数据之间的不同之处；以及　更新处理部，基于上述不同之处，对上述词典或者上述语言模型的至少其中一方进行修正。

【技术特征摘要】
【国外来华专利技术】JP 2006-2-23 046812/20061. 一种语音识别词典制作支持系统，具有存储部，存储词典、语言模型及声音模型；文本解析部，针对文本数据进行语素解析处理；虚拟语音识别处理部，针对由上述文本解析部所解析的解析完毕文本数据，利用上述词典、语言模型及声音模型生成虚拟语音识别结果文本数据，并且提取上述解析完毕文本数据和上述虚拟语音识别结果文本数据之间的不同之处；以及更新处理部，基于上述不同之处，对上述词典或者上述语言模型的至少其中一方进行修正。2. 根据权利要求l所述的语音识别词典制作支持系统，其特征在于，上述虚拟语音识别处理部从上述解析完毕文本数据中生成以声音参数为要素的特征向量系列，通过虚拟地执行语音识别处理来生成语音识别结果文本数据。3. 根据权利要求1或2所述的语音识别词典制作支持系统，其特征在于，上述存储部存储构成识别单位的状态等要素间的距离或类似度表，上述虚拟语音识别处理部由上述解析完毕文本数据生成上述识别单位的系列，从上述词典和语言模型中，通过搜索距离总和最小或类似度总和最大的单词列，生成上述虚拟语音识别结果文本数据。4. 根据权利要求1或2所述的语音识别词典制作支持系统，其特征在于，上述存储部存储构成识别单位的状态等要素间的距离或类似度表，上述虚拟语音识别处理部由上述解析完毕文本数据生成上述要素的系列，从上述词典和语言模型中，通过搜索距离总和最小或类似度总和最大的单词列，生成上述虚拟语音识别结果文本数据。5. 根据权利要求1至4中任一项所述的语音识别词典制作支持系统，其特征在于，上述更新处理部基于上述解析完毕文本数据和上述虚拟语音识别结果文本数据之间的不同之处，在上述词典中追加出现于上述解析完毕文本数据侧的词句。6....

【专利技术属性】
技术研发人员：越仲孝文，
申请(专利权)人：日本电气株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人