异构解码网络的构建方法及系统、语音识别方法及系统技术方案

技术编号:10472650 阅读:176 留言:0更新日期:2014-09-25 11:03
本发明专利技术公开了一种异构解码网络的构建方法及系统、语音识别方法及系统,构建方法包括:获取业务所需的命令词解码网络和听写解码网络;构建命令词训练数据集和听写训练数据集;利用命令词训练数据集和听写训练数据集,确定命令词解码网络的补偿得分;优化命令词解码网络,并使优化后的命令词解码网络的每个弧上保存有命令词条、补偿得分、以及对应命令词条的声学模型得分;将优化后的命令词解码网络和听写解码网络并联组成异构解码网络。应用本发明专利技术实施例异构解码网络的构建方法及系统,通过配置一套识别引擎完成多种不同业务的并联识别、节省系统资源;应用本发明专利技术实施例语音识别方法及系统,可以提高识别效果及识别效率,降低系统的复杂度。

【技术实现步骤摘要】
异构解码网络的构建方法及系统、语音识别方法及系统
本专利技术涉及语音信号处理
,尤其涉及一种异构解码网络的构建方法及系统、语音识别方法及系统。
技术介绍
语音识别技术就是让机器通过识别和理解过程将语音信号转变为相应的文本或命令的技术。现有的语音识别系统,通常只能单独支持命令词识别(基于规则的语音识别系统)或听写识别(基于统计的语音识识别系统)。因此,在一些多业务的场景(比如在车载设备上的应用,既需要命令词识别,如“打电话给xxx”、“发短信给xxx”,还需要听写识别,如短信的内容,导航的目的地等;再比如手机语音助手上的使用,对于大部分的功能,比如聊天、查天气、查股票等都是听写识别,但是打电话和发短信功能都是使用的命令词识别)下,需要同时配置这两种系统,实现多种不同语音业务的并联识别。基于规则的语音识别系统利用命令词解码网络实现解码,而基于统计的语音识别系统利用听写解码网络实现解码。由于这两种类型的解码网络的结构不同,所以针对这两种类型的解码网络需要分别配置不同的识别引擎才能完成识别工作。这种方式不仅会占用大量系统资源,影响系统性能,而且,由于听写解码网络和命令词解码网络的结构不一致,需要进行置信度判决来选择最终的识别结果,可靠性差,效率低,而且增加了整个语音识别系统的复杂度。
技术实现思路
本专利技术实施例一方面提供了一种异构解码网络的构建方法及系统,可以在多业务的场景下,通过配置一套识别引擎完成多种不同业务的并联识别、节省系统资源。本专利技术实施例另一方面提供了一种基于该异构解码网络的语音识别方法及系统,以提高识别效果及识别效率,降低系统的复杂度。本专利技术实施例提供一种异构解码网络的构建方法,包括:获取业务所需的命令词解码网络和听写解码网络,所述命令词解码网络的每个弧上保存有一个命令词条以及对应所述命令词条的声学模型得分,所述听写解码网络的每个弧上保存有一个听写词条以及均对应所述听写词条的声学模型得分和语言模型得分;构建命令词训练数据集和听写训练数据集,所述命令词训练数据集内的命令词训练数据由所述命令词条构成,所述听写训练数据集内的听写训练数据由所述听写词条构成;利用所述命令词训练数据集和所述听写训练数据集,确定命令词解码网络的补偿得分;优化所述命令词解码网络,并使优化后的命令词解码网络的每个弧上保存有所述命令词条、所述补偿得分、以及对应所述命令词条的声学模型得分;将优化后的命令词解码网络和所述听写解码网络并联组成异构解码网络。优选地,所述利用所述命令词训练数据集和所述听写训练数据集,确定命令词解码网络的补偿得分包括:依次将所述命令词训练数据集内的每一个命令词训练数据输入至所述命令词解码网络和所述听写解码网络,分别得到对应所述命令词训练数据的第一命令词网络得分和第一听写网络得分;所述第一命令词网络得分为与所述命令词训练数据相匹配的命令词条对应的声学模型得分,所述第一听写网络得分为与所述命令词训练数据相匹配的听写词条对应的声学模型得分和语言模型得分之和;依次将所述听写训练数据集内的每一个听写训练数据分别输入至所述命令词解码网络和所述听写解码网络,分别得到对应所述听写训练数据的第二命令词网络得分和第二听写网络得分,所述第二命令词网络得分为与所述听写训练数据相匹配的命令词条对应的声学模型得分,所述第二听写网络得分为与所述听写训练数据相匹配的听写词条对应的声学模型得分和语言模型得分之和;确定所述命令词解码网络的补偿得分,并使所述补偿得分满足预设条件:对于命令词训练数据集内的设定比例的命令词训练数据,所述第一命令词网络得分与所述补偿得分之和大于所述第一听写网络得分;对于听写训练数据集内的设定比例的听写训练数据,所述第二命令词网络得分与所述补偿得分之和小于所述第二听写网络得分。优选地,所述确定所述命令词解码网络的补偿得分,并使所述补偿得分满足预设条件包括:获取满足第一取值范围且能够整除第一步进量的第一参数,以及满足第二取值范围且能够整除第二步进量的第二参数的所有参数组合;依次对每一组参数组合,获取所述命令词训练数据集内满足第一预设条件的命令词训练数据个数,所述第一预设条件为:所述第一参数和所述命令词训练数据对应的第一命令词网络得分的乘积与所述第二参数的和,大于所述命令词训练数据对应的第一听写网络得分;依次对每一组参数组合,获取所述听写训练数据集内满足第二预设条件的听写训练数据个数,所述第二预设条件为:所述第一参数和所述听写训练数据对应的第二命令词网络得分的乘积与所述第二参数的和,小于所述听写训练数据对应的第二听写网络得分;确定优选参数组合,所述优选参数组合对应的命令词训练数据个数和听写训练数据个数之和,大于其它参数组合对应的命令词训练数据个数和听写训练数据个数之和;将所述优选参数组合中第一参数和任意第一命令词网络得分的乘积与所述优选参数组合中第二参数的和,再减去所述第一命令词网络得分所得的结果,作为所述命令词解码网络的补偿得分。优选地,所述确定所述命令词解码网络的补偿得分,并使所述补偿得分满足预设条件包括:获取满足设定的取值范围且能够整除设定的步进量的参数集合;依次对所述参数集合中的每一个参数,获取所述命令词训练数据集内满足第三预设条件的命令词训练数据个数,所述第三预设条件为:所述命令词训练数据对应的第一命令词网络得分与所述参数的和,大于所述命令词训练数据对应的第一听写网络得分;依次对所述参数集合中的每一个参数,获取所述听写训练数据集内满足第四预设条件的听写训练数据个数,所述第四预设条件为:所述听写训练数据对应的第二命令词网络得分与所述参数的和,小于所述听写训练数据对应的第二听写网络得分;确定优选参数,所述优选参数对应的命令词训练数据个数和听写训练数据个数之和,大于其它参数对应的命令词训练数据个数和听写训练数据个数之和;将所述优选参数作为所述命令词解码网络补偿得分。本专利技术实施例还提供一种异构解码网络的构建系统,包括:解码网络获取单元,用于获取业务所需的命令词解码网络和听写解码网络,所述命令词解码网络的每个弧上保存有一个命令词条以及对应所述命令词条的声学模型得分,所述听写解码网络的每个弧上保存有一个听写词条以及均对应所述听写词条的声学模型得分和语言模型得分;训练数据集构建单元,用于构建命令词训练数据集和听写训练数据集,所述命令词训练数据集内的命令词训练数据由所述命令词条构成,所述听写训练数据集内的听写训练数据由所述听写词条构成;补偿得分确定单元,用于利用所述命令词训练数据集和所述听写训练数据集,确定命令词解码网络的补偿得分;优化单元,用于优化所述命令词解码网络,并使优化后的命令词解码网络的每个弧上保存有所述命令词条、所述补偿得分、以及对应所述命令词条的声学模型得分;并联单元,用于将优化后的命令词解码网络和所述听写解码网络并联组成异构解码网络。优选地,所述补偿得分确定单元包括:第一网络得分获取单元,用于依次将所述命令词训练数据集内的每一个命令词训练数据输入至所述命令词解码网络和所述听写解码网络,分别得到对应所述命令词训练数据的第一命令词网络得分和第一听写网络得分;所述第一命令词网络得分为与所述命令词训练数据相匹配的命令词条对应的声学模型得分,所述第一听写网络得分为与所述命令词训练数据相匹配的听写词条对应的声学模型本文档来自技高网...
异构解码网络的构建方法及系统、语音识别方法及系统

【技术保护点】
一种异构解码网络的构建方法,其特征在于,包括:获取业务所需的命令词解码网络和听写解码网络,所述命令词解码网络的每个弧上保存有一个命令词条以及对应所述命令词条的声学模型得分,所述听写解码网络的每个弧上保存有一个听写词条以及均对应所述听写词条的声学模型得分和语言模型得分;构建命令词训练数据集和听写训练数据集,所述命令词训练数据集内的命令词训练数据由所述命令词条构成,所述听写训练数据集内的听写训练数据由所述听写词条构成;利用所述命令词训练数据集和所述听写训练数据集,确定命令词解码网络的补偿得分;优化所述命令词解码网络,并使优化后的命令词解码网络的每个弧上保存有所述命令词条、所述补偿得分、以及对应所述命令词条的声学模型得分;将优化后的命令词解码网络和所述听写解码网络并联组成异构解码网络。

【技术特征摘要】
1.一种异构解码网络的构建方法,其特征在于,包括:获取业务所需的命令词解码网络和听写解码网络,所述命令词解码网络的每个弧上保存有一个命令词条以及对应所述命令词条的声学模型得分,所述听写解码网络的每个弧上保存有一个听写词条以及均对应所述听写词条的声学模型得分和语言模型得分;构建命令词训练数据集和听写训练数据集,所述命令词训练数据集内的命令词训练数据由所述命令词条构成,所述听写训练数据集内的听写训练数据由所述听写词条构成;利用所述命令词训练数据集和所述听写训练数据集,确定命令词解码网络的补偿得分;优化所述命令词解码网络,并使优化后的命令词解码网络的每个弧上保存有所述命令词条、所述补偿得分、以及对应所述命令词条的声学模型得分;将优化后的命令词解码网络和所述听写解码网络并联组成异构解码网络。2.根据权利要求1所述的方法,其特征在于,所述利用所述命令词训练数据集和所述听写训练数据集,确定命令词解码网络的补偿得分包括:依次将所述命令词训练数据集内的每一个命令词训练数据输入至所述命令词解码网络和所述听写解码网络,分别得到对应所述命令词训练数据的第一命令词网络得分和第一听写网络得分;所述第一命令词网络得分为与所述命令词训练数据相匹配的命令词条对应的声学模型得分,所述第一听写网络得分为与所述命令词训练数据相匹配的听写词条对应的声学模型得分和语言模型得分之和;依次将所述听写训练数据集内的每一个听写训练数据分别输入至所述命令词解码网络和所述听写解码网络,分别得到对应所述听写训练数据的第二命令词网络得分和第二听写网络得分,所述第二命令词网络得分为与所述听写训练数据相匹配的命令词条对应的声学模型得分,所述第二听写网络得分为与所述听写训练数据相匹配的听写词条对应的声学模型得分和语言模型得分之和;确定所述命令词解码网络的补偿得分,并使所述补偿得分满足预设条件:对于命令词训练数据集内的设定比例的命令词训练数据,所述第一命令词网络得分与所述补偿得分之和大于所述第一听写网络得分;对于听写训练数据集内的设定比例的听写训练数据,所述第二命令词网络得分与所述补偿得分之和小于所述第二听写网络得分。3.根据权利要求2所述的方法,其特征在于,所述确定所述命令词解码网络的补偿得分,并使所述补偿得分满足预设条件包括:获取满足第一取值范围且能够整除第一步进量的第一参数,以及满足第二取值范围且能够整除第二步进量的第二参数的所有参数组合;依次对每一组参数组合,获取所述命令词训练数据集内满足第一预设条件的命令词训练数据个数,所述第一预设条件为:所述第一参数和所述命令词训练数据对应的第一命令词网络得分的乘积与所述第二参数的和,大于所述命令词训练数据对应的第一听写网络得分;依次对每一组参数组合,获取所述听写训练数据集内满足第二预设条件的听写训练数据个数,所述第二预设条件为:所述第一参数和所述听写训练数据对应的第二命令词网络得分的乘积与所述第二参数的和,小于所述听写训练数据对应的第二听写网络得分;确定优选参数组合,所述优选参数组合对应的命令词训练数据个数和听写训练数据个数之和,大于其它参数组合对应的命令词训练数据个数和听写训练数据个数之和;将所述优选参数组合中第一参数和任意第一命令词网络得分的乘积与所述优选参数组合中第二参数的和,再减去所述第一命令词网络得分所得的结果,作为所述命令词解码网络的补偿得分。4.根据权利要求2所述的方法,其特征在于,所述确定所述命令词解码网络的补偿得分,并使所述补偿得分满足预设条件包括:获取满足设定的取值范围且能够整除设定的步进量的参数集合;依次对所述参数集合中的每一个参数,获取所述命令词训练数据集内满足第三预设条件的命令词训练数据个数,所述第三预设条件为:所述命令词训练数据对应的第一命令词网络得分与所述参数的和,大于所述命令词训练数据对应的第一听写网络得分;依次对所述参数集合中的每一个参数,获取所述听写训练数据集内满足第四预设条件的听写训练数据个数,所述第四预设条件为:所述听写训练数据对应的第二命令词网络得分与所述参数的和,小于所述听写训练数据对应的第二听写网络得分;确定优选参数,所述优选参数对应的命令词训练数据个数和听写训练数据个数之和,大于其它参数对应的命令词训练数据个数和听写训练数据个数之和;将所述优选参数作为所述命令词解码网络补偿得分。5.一种异构解码网络的构建系统,其特征在于,包括:解码网络获取单元,用于获取业务所需的命令词解码网络和听写解码网络,所述命令词解码网络的每个弧上保存有一个命令词条以及对应所述命令词条的声学模型得分,所述听写解码网络的每个弧上保存有一个听写词条以及均对应所述听写词条的声学模型得分和语言模型得分;训练数据集构建单元,用于构建命令词训练数据集和听写训练数据集,所述命令词训练数据集内的命令词训练数据由所述命令词条构成,所述听写训练数据集内的听写训练数据由所述听写词条构成;补偿得分确定单元,用于利用所述命令词训练数据集和所述听写训练数据集,确定命令词解码网络的补偿得分;优化单元,用于优化所述命令词解码网络,并使优化后的命令词解码网络的每个弧上保存有所述命令词条、所述补偿得分、以及对应所述命令词条的声学模型得分;并联单元,用于将优化后的命令词解码网络和所述听写解码网络并联组成异构解码网络。...

【专利技术属性】
技术研发人员:鹿晓亮单言丰刘强
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1