语音检索装置和语音检索方法制造方法及图纸

技术编号：13772864 阅读：92 留言：0更新日期：2016-09-29 21:21

具有：识别部(2)，其参照声学模型和学习数据不同的多个语言模型来进行输入语音的语音识别，针对多个语言模型取得识别文字串；文字串对照部(6)，其对照多个语言模型的各个语言模型的识别文字串与蓄积在文字串词典存储部(7)所存储的文字串词典中的检索对象词汇的文字串，计算表示识别文字串相对于检索对象词汇的文字串的一致度的文字串对照分数，针对识别文字串分别取得文字串对照分数最高的检索对象词汇的文字串和该文字串对照分数；以及检索结果确定部(8)，其参照所取得的所述文字串对照分数，按照该文字串对照分数从高到低的顺序将1个以上的检索对象词汇作为检索结果而输出。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及针对根据被赋予了语言似然度的多个语言模型得到的识别结果在文字串上与检索对象词汇进行对照处理来取得检索结果的语音检索装置和语音检索方法。
技术介绍
以往，作为被赋予了语言似然度的语言模型，几乎都是使用根据后述的学习数据的统计量来计算语言似然度的统计语言模型。在使用统计语言模型的语音识别中，在以对各种词汇和表达方式的发声进行识别为目的的情况下，需要将各种文章用作语言模型的学习数据来构建统计语言模型。但是，如果利用大范围的学习数据来构建单一的统计语言模型，则存在不一定成为最适于识别某一特定话题、例如天气话题的发声的统计语言模型的问题。作为解决该问题的方法，在非专利文献1中，公开了这样一种技术：将语言模型的学习数据分类成几个话题，使用按照各个话题分类的学习数据来学习统计语言模型，在识别时，使用所有的各个统计语言模型进行识别对照，将识别分数最高的候选作为识别结果。根据该技术，报告了下述情况：在特定话题的发声中，基于所对应的话题的语言模型的识别候选的识别分数变高，识别精度比使用单一的统计语言模型的情况提高。现有技术文献非专利文献非专利文献1:中岛及其他人，“大語彙連続音声認識のための複数言語モデルの並列同時単語列探索法”，情報処理学会論文誌，2004年，Vol.45，No.12
技术实现思路
专利技术要解决的课题可是，在上述的非专利文献1中公开的技术中，存在下述这样的课题：由于使用学习数据不同的多个统计语言模型进行识别处理，因此，无法在学习数据不同的统计语言模型彼此之间严格地对识别分数的计算中所使用的语言似然度进行比较。这是因为，如果统计语言模型例如为单词...

【技术保护点】
一种语音检索装置，其中，所述语音检索装置具有：识别部，其参照声学模型以及学习数据不同的多个语言模型进行输入语音的语音识别，按照所述多个语言模型中的每个语言模型取得识别文字串；文字串词典存储部，其存储文字串词典，该文字串词典蓄积有表示成为语音检索对象的检索对象词汇的文字串的信息；文字串对照部，其对所述识别部所取得的所述多个语言模型中的每个语言模型的识别文字串与蓄积在所述文字串词典中的检索对象词汇的文字串进行对照，计算表示所述识别文字串相对于所述检索对象词汇的文字串的一致度的文字串对照分数，针对所述识别文字串分别取得文字串对照分数最高的检索对象词汇的文字串和该文字串对照分数；以及检索结果确定部，其参照所述文字串对照部所取得的所述文字串对照分数，按照该文字串对照分数从高到低的顺序将1个以上的检索对象词汇作为检索结果而输出。

【技术特征摘要】
【国外来华专利技术】1.一种语音检索装置，其中，所述语音检索装置具有：识别部，其参照声学模型以及学习数据不同的多个语言模型进行输入语音的语音识别，按照所述多个语言模型中的每个语言模型取得识别文字串；文字串词典存储部，其存储文字串词典，该文字串词典蓄积有表示成为语音检索对象的检索对象词汇的文字串的信息；文字串对照部，其对所述识别部所取得的所述多个语言模型中的每个语言模型的识别文字串与蓄积在所述文字串词典中的检索对象词汇的文字串进行对照，计算表示所述识别文字串相对于所述检索对象词汇的文字串的一致度的文字串对照分数，针对所述识别文字串分别取得文字串对照分数最高的检索对象词汇的文字串和该文字串对照分数；以及检索结果确定部，其参照所述文字串对照部所取得的所述文字串对照分数，按照该文字串对照分数从高到低的顺序将1个以上的检索对象词汇作为检索结果而输出。2.根据权利要求1所述的语音检索装置，其特征在于，所述识别部取得所述识别文字串的声学似然度和语言似然度，所述检索结果确定部计算综合分数，按照计算出的综合分数从高到低的顺序将1个以上的检索对象词汇作为检索结果而输出，其中，所述综合分数是所述文字串对照部所取得的文字串对照分数、所述识别部所取得的声学似然度、语言似然度中的2个以上的值的加权和。3.根据权利要求1所述的语音检索装置，其特征在于，所述语音检索装置具有声学似然度计算部，该声学似然度计算部参照识别精度比所述识别部所参照的所述声学模型高的高精度声学模型，进行所述识别部所取得的所述多个语言模型中的每个语言模型的识别文字串与所述输入语音之间的声学模式对照，计算对照声学似然度，所述识别部取得所述识别文字串的语言似然度，所述检索结果确定部计算综合分数作为所述文字串对照部所取得的文字串对照分数、所述声学似然度计算部所计算出的对照声学似然度、所述识别部所取得的语言似然度中的2个以上的值的加权和，按照计算出的综合分数从高到低的顺序将1个以
\t上的检索对象词汇作为检索结果而输出。4.根据权利要求1所述的语音检索装置，其特征在于，所述语音检索装置将所述多个语言模型分成2个以上的组，对所述2个以上组分别分配所述识别部的识别处理。5.一种语音检索装置，其中，所述语音检索装置具有：识别部，其参照声学模型和至少1个以上的语言模型，进行输入语音的语音识别，按照每个所述语言模型取得识别文字串；文字串词典存储部，其存储文字串词典，该文字串词典蓄积有表示成为语音检索对象的检索对象词汇的文字串的信息；文字串对照部，其取得外部识别文字串，对所取得的外部识别文字串以及所述识别部所取得的识别文字串与蓄积在所述文字串词典中的检索...

【专利技术属性】
技术研发人员：花泽利行，
申请(专利权)人：三菱电机株式会社，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人