用于优化语音识别结果的方法和装置制造方法及图纸

技术编号：14932163 阅读：48 留言：0更新日期：2017-03-31 14:03

本发明专利技术提供用于优化语音识别结果的方法和装置。根据一个实施方式，用于优化语音识别结果的装置包括：接收单元，其接收语音识别结果；计算单元，其计算上述语音识别结果中的片段和关键词列表中的关键词之间的发音相似度；以及替换单元，其在上述发音相似度高于第1阈值的情况下，将上述片段替换为上述关键词。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音识别技术，具体地，涉及用于优化语音识别结果的方法和装置。
技术介绍
在语音识别的一些应用场景中，说话内容往往包含一些关键词，这些关键词能否被正确识别出来密切影响着语音识别系统的用户体验。例如，在会议支援应用中，语音识别系统把发言人说话的内容识别出来，而会议中所涉及的重要人名、地名、技术术语等词汇就是关键词，其识别率是此类应用最主要的性能指标。关键词可以分为两类，如果关键词不在语音识别的系统词典里，可称之为新词，如果在词典内，则可称之为核心词。由于新词未在系统词典里注册，而语音识别系统只能输出系统词典里存在的词条，所以新词完全无法被直接识别出来。虽然大部分新词可以由系统词典里的词条拼接后间接输出，但由于这种拼接的情况在训练语料里很少见，导致其语言模型得分很低，因此被成功识别出来的概率依然很小。对已在系统词典里注册过的核心词而言，如果系统词典里存在其他发音相同或相似但语言模型得分更高的非核心词，则语音识别系统会错误的选择该非核心词作为输出结果。因此，普通的语音识别系统对关键词的识别率都很低，而错误的识别结果一般都是读音相同或相似的其他词汇。提高关键词的识别率的关键是提升关键词的语言模型得分。通常，使用基于类的语音模型来提升关键词的语言模型得分。在该方法中，可以创建一些类来对应各种关键词，如人名类、地名类、技术术语类等，并在系统词表里挑选一定数目...

【技术保护点】
一种用于优化语音识别结果的装置，包括：接收单元，其接收语音识别结果；计算单元，其计算上述语音识别结果中的片段和关键词列表中的关键词之间的发音相似度；以及替换单元，其在上述发音相似度高于第1阈值的情况下，将上述片段替换为上述关键词。

【技术特征摘要】
1.一种用于优化语音识别结果的装置，包括：
接收单元，其接收语音识别结果；
计算单元，其计算上述语音识别结果中的片段和关键词列表中的关键
词之间的发音相似度；以及
替换单元，其在上述发音相似度高于第1阈值的情况下，将上述片段
替换为上述关键词。
2.根据权利要求1所述的装置，其中，
上述替换单元，在上述发音相似度高于上述第1阈值且上述片段的语
言模型得分低于第2阈值的情况下，将上述片段替换为上述关键词。
3.根据权利要求2所述的装置，其中，
上述计算单元，计算上述语音识别结果中的语言模型得分低于上述第
2阈值的片段和上述关键词列表中的关键词之间的发音相似度。
4.根据权利要求1所述的装置，其中，
上述计算单元，计算上述语音识别结果中的片段和关键词列表中的关
键词之间的声学距离，并基于上述声学距离除以上述关键词的字数、音节
数或音素数的平均声学距离，计算上述发音相似度。
5.根据权利要求4所述的装置，其中，
上述计算单元，计算上述片段的音素序列和上述关键词的音素序列之
...

【专利技术属性】
技术研发人员：雍坤，丁沛，朱会峰，
申请(专利权)人：株式会社东芝，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人