语音识别装置及语音识别方法制造方法及图纸

技术编号:13553986 阅读:108 留言:0更新日期:2016-08-18 21:11
本发明专利技术公开了语音识别装置及语音识别方法。所述语音识别装置包括:被构造为获得由当前用户输入的语音的单元;被构造为分割所获得的语音并输出至少两个声音命令段的单元;被构造为通过使用与说话者无关的声学模型、来从声音命令段中识别预定义的第一声音命令的单元;被构造为基于被识别为所述预定义的第一声音命令的声音命令段、来计算针对所述当前用户的变换矩阵的单元;被构造为基于所计算出的变换矩阵、来从注册在所述语音识别装置中的声学模型中选择针对所述当前用户的声学模型的单元;以及被构造为通过使用所选择的声学模型、来从声音命令段中识别第二声音命令的单元。根据本发明专利技术,通过使用所选择的AM能够提高语音识别性能。

【技术实现步骤摘要】
201510032839

【技术保护点】
一种语音识别装置,该语音识别装置包括:语音输入单元,其被构造为获得由当前用户输入的语音;语音分割单元,其被构造为分割所获得的语音并输出至少两个声音命令段;预定义第一声音命令识别单元,其被构造为通过使用与说话者无关的声学模型,来从声音命令段中识别预定义的第一声音命令;变换矩阵计算单元,其被构造为基于被识别为所述预定义的第一声音命令的声音命令段,来计算针对所述当前用户的变换矩阵,其中,所计算出的变换矩阵能够使所述与说话者无关的声学模型与被识别为所述预定义的第一声音命令的声音命令段匹配;模型选择单元,其被构造为基于所计算出的变换矩阵,来从注册在所述语音识别装置中的声学模型中选择针对所述当前用户的声学模型;以及第二声音命令识别单元,其被构造为通过使用所选择的声学模型,来从声音命令段中识别第二声音命令。

【技术特征摘要】
1.一种语音识别装置,该语音识别装置包括:语音输入单元,其被构造为获得由当前用户输入的语音;语音分割单元,其被构造为分割所获得的语音并输出至少两个声音命令段;预定义第一声音命令识别单元,其被构造为通过使用与说话者无关的声学模型,来从声音命令段中识别预定义的第一声音命令;变换矩阵计算单元,其被构造为基于被识别为所述预定义的第一声音命令的声音命令段,来计算针对所述当前用户的变换矩阵,其中,所计算出的变换矩阵能够使所述与说话者无关的声学模型与被识别为所述预定义的第一声音命令的声音命令段匹配;模型选择单元,其被构造为基于所计算出的变换矩阵,来从注册在所述语音识别装置中的声学模型中选择针对所述当前用户的声学模型;以及第二声音命令识别单元,其被构造为通过使用所选择的声学模型,来从声音命令段中识别第二声音命令。2.根据权利要求1所述的语音识别装置,其中,所述语音分割单元的输出还包括至少一个背景声音段,所述变换矩阵计算单元基于所述背景声音段以及被识别为所述预定义的第一声音命令的声音命令段,来计算所述变换矩阵,并且所计算出的变换矩阵能够使所述与说话者无关的声学模型,与所述背景声音段以及被识别为所述预定义的第一声音命令的声音命令段匹配。3.根据权利要求1或权利要求2所述的语音识别装置,其中,所述模型选择单元包括:基于音素的声学模型选择单元,其被构造为基于所计算出的变换矩阵,来从注册在所述语音识别装置中的音素集的基于音素的声学模型中,选择针对所述当前用户的音素集的基于音素的声学模型;以及/或者基于命令词的声学模型选择单元,其被构造为基于所计算出的变换
\t矩阵,来从注册在所述语音识别装置中的基于命令词的声学模型中,选择针对所述当前用户的基于命令词的声学模型。4.根据权利要求3所述的语音识别装置,其中,所述基于音素的声学模型选择单元包括:第一变换矩阵获取单元,其被构造为获取针对注册在所述语音识别装置中的音素集的基于音素的声学模型的变换矩阵;第一距离计算单元,其被构造为计算所计算出的针对所述当前用户的变换矩阵、与所获取到的针对音素集的基于音素的声学模型的变换矩阵之间的距离;以及基于音素的声学模型确定单元,其被构造为确定距离最小的音素集的基于音素的声学模型,作为所选择的针对所述当前用户的基于音素的声学模型。5.根据权利要求3所述的语音识别装置,其中,所述基于命令词的声学模型选择单元包括:第二变换矩阵获取单元,其被构造为针对预定义的命令词列表中的各命令词,来获取针对注册在所述语音识别装置中的与该命令词相对应的基于命令词的声学模型的变换矩阵;第二距离计算单元,其被构造为针对所述预定义的命令词列表中的各命令词,来计算所计算出的针对所述当前用户的变换矩阵、与所获取到的针对与该命令词相对应的基于命令词的声学模型的变换矩阵之间的距离;以及基于命令词的声学模型确定单元,其被构造为针对所述预定义的命令词列表中的各命令词,来确定距离最小的与该命令词相对应的基于命令词的声学模型,作为所选择的针对所述当前用户的基于命令词的声学模型。6.根据权利要求5所述的语音识别装置,其中,所述基于命令词的声学模型选择单元还包括:推荐单元,其被构造为推荐所述当前用户,针对所述基于命令词的
\t声学模型确定单元不能确定出相应的基于命令词的声学模型的命令词,来注册基于命令词的声学模型,作为所选择的基于命令词的声学模型。7.根据权利要求5所述的语音识别装置,其中,所述基于命令词的声学模型选择单元仅针对所述预定义的命令词列表中的、所述当前用户未在所述语音识别装置中注册相应的基于命令词的声学模型的命令词,来选择基于命令词的声学模型。8.根据权利要求1或权利要求2所述的语音识别装置,其中,所述语音识别装置将验证声学模型集中的声学模型是否涵盖预定义的命令词列表中的全部命令词,如果所述声学模型集中的声学模型涵盖所述预定义的命令词列表中的全部命令词,则所述语...

【专利技术属性】
技术研发人员:郭莉莉
申请(专利权)人:佳能株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1