System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及音频识别领域,具体而言,涉及一种语音识别方法、装置、非易失性存储介质及电子设备。
技术介绍
1、目前相关技术中在对音频进行识别时,通常只能采用单个模型对音频进行识别,无法结合多个模型的识别结果。导致相关技术中在面对待识别音频的语种为小语种时通常无法保证识别结果的准确率。
2、针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
1、本申请实施例提供了一种语音识别方法、装置、非易失性存储介质及电子设备,以至少解决由于相关技术中无法综合考虑多个模型的识别结果导致的对小语种音频的识别结果准确率较低的技术问题。
2、根据本申请实施例的一个方面,提供了一种语音识别方法,包括:通过第一语音识别模型确定待识别音频的识别文本集合,其中,识别文本集合中包括采用第一语音识别模型识别待识别音频后得到的多条识别文本;确定识别文本集合中的各条识别文本分别对应的第一评价指标,其中,第一评价指标用于表征第一语音识别模型确定的各条识别文本的准确率;通过第二语音识别模型确定识别文本集合中的各条识别文本对应的第二评价指标,其中,第二评价指标用于表征第二语音识别模型确定的各条识别文本的准确率;依据识别文本集合中各条识别文本的第一评价指标和第二评价指标,在识别文本集合中确定目标识别文本作为待识别音频的识别结果。
3、可选地,依据识别文本集合中各条识别文本的第一评价指标和第二评价指标,在识别文本集合中确定目标识别文本作为待识别音频的识别结果包括:对各条识别文本对应的第一评
4、可选地,对各条识别文本对应的第一评价指标和第二评价指标进行加权求和,得到各条识别文本对应的第三评价指标包括:获取目标对象输入的第一评价指标对应的第一权重,以及第二评价指标对应的第二权重,并依据第一权重和第二权重对第一评价指标和第二评价指标进行加权求和计算,得到第三评价指标;或者,依据目标对象对第一语音识别模型和第二语音识别模型的历史评价结果确定第一语音识别模型和第二语音识别模型各自对应的权重,其中,第一语音识别模型对应的权重为第一权重,第二语音识别模型对应的权重为第二权重。
5、可选地,历史评价结果包括历史待识别音频对应的标准历史识别文本,历史待识别音频对应的历史识别文本集合,以及历史识别文本集合中的各条历史识别文本对应的历史第一评价指标和历史第二评价指标;依据目标对象对第一语音识别模型和第二语音识别模型的历史评价结果确定第一语音识别模型和第二语音识别模型各自对应的权重包括:在历史识别文本集合中确定与标准历史识别文本之间的相似度最大的目标历史识别文本;确定目标历史识别文本对应的历史第一评价指标和历史第二评价指标;比较历史第一评价指标和历史第二评价指标;在比较结果为历史第一评价指标大于历史第二评价指标的情况下,确定第一语音识别模型对应的权重大于第二语音识别模型对应的权重;在比较结果为历史第一评价指标小于历史第二评价指标的情况下,确定第一语音识别模型对应的权重小于第二语音识别模型对应的权重;在比较结果为历史第一评价指标等于历史第二评价指标的情况下,响应目标对象的输入结果确定第一语音识别模型对应的权重小于第二语音识别模型对应的权重。
6、可选地,第一语音识别模型为采用无监督训练方式进行预训练的模型,第二语音识别模型为采用弱监督训练方式进行预训练的模型。
7、可选地,第一语音识别模型和第二语音识别模型的模型结构均包括编码器-解码器结构,第一语音识别模型的损失函数包括对比预测编码损失函数。
8、可选地,待识别音频的语种为小语种,其中,小语种为训练数据收集成本大于预设成本阈值的语种,训练数据收集成本为收集预设数量的训练数据所需消耗的成本。
9、根据本申请实施例的另一方面,还提供了一种语音识别装置,包括:第一处理模块,用于通过第一语音识别模型确定待识别音频的识别文本集合,其中,识别文本集合中包括采用第一语音识别模型识别待识别音频后得到的多条识别文本;第二处理模块,用于确定识别文本集合中的各条识别文本分别对应的第一评价指标,其中,第一评价指标用于表征第一语音识别模型确定的各条识别文本的准确率;第三处理模块,用于通过第二语音识别模型确定识别文本集合中的各条识别文本对应的第二评价指标,其中,第二评价指标用于表征第二语音识别模型确定的各条识别文本的准确率;第四处理模块,用于依据识别文本集合中各条识别文本的第一评价指标和第二评价指标,在识别文本集合中确定目标识别文本作为待识别音频的识别结果。
10、根据本申请实施例的另一方面,还提供了一种非易失性存储介质,非易失性存储介质中存储有程序,其中,在程序运行时控制非易失性存储介质所在设备执行语音识别方法。
11、根据本申请实施例的另一方面,还提供了一种电子设备,包括:存储器和处理器,处理器用于运行存储在存储器中的程序,其中,程序运行时执行语音识别方法。
12、根据本申请实施例的另一方面,还提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现语音识别方法。
13、在本申请实施例中,采用通过第一语音识别模型确定待识别音频的识别文本集合,其中,识别文本集合中包括采用第一语音识别模型识别待识别音频后得到的多条识别文本;确定识别文本集合中的各条识别文本分别对应的第一评价指标,其中,第一评价指标用于表征第一语音识别模型确定的各条识别文本的准确率;通过第二语音识别模型确定识别文本集合中的各条识别文本对应的第二评价指标,其中,第二评价指标用于表征第二语音识别模型确定的各条识别文本的准确率;依据识别文本集合中各条识别文本的第一评价指标和第二评价指标,在识别文本集合中确定目标识别文本作为待识别音频的识别结果的方式,通过综合第一语音识别模型和第二语音识别模型的评价分数来确定最终的识别结果,达到了综合利用多个模型来确定最终识别结果的目的,从而实现了提高识别准确率的技术效果,进而解决了由于相关技术中无法综合考虑多个模型的识别结果导致的对小语种音频的识别结果准确率较低技术问题。
本文档来自技高网...【技术保护点】
1.一种语音识别方法,其特征在于,包括:
2.根据权利要求1所述的语音识别方法,其特征在于,依据所述识别文本集合中各条所述识别文本的所述第一评价指标和所述第二评价指标,在所述识别文本集合中确定目标识别文本作为所述待识别音频的识别结果包括:
3.根据权利要求2所述的语音识别方法,其特征在于,对各条所述识别文本对应的所述第一评价指标和第二评价指标进行加权求和,得到各条所述识别文本对应的第三评价指标包括:
4.根据权利要求3所述的语音识别方法,其特征在于,所述历史评价结果包括历史待识别音频对应的标准历史识别文本,所述历史待识别音频对应的历史识别文本集合,以及所述历史识别文本集合中的各条历史识别文本对应的历史第一评价指标和历史第二评价指标;依据所述目标对象对所述第一语音识别模型和所述第二语音识别模型的历史评价结果确定所述第一语音识别模型和所述第二语音识别模型各自对应的权重包括:
5.根据权利要求1所述的语音识别方法,其特征在于,所述第一语音识别模型为采用无监督训练方式进行预训练的模型,所述第二语音识别模型为采用弱监督训练方式进行预训练的模型
6.根据权利要求1所述的语音识别方法,其特征在于,所述第一语音识别模型和所述第二语音识别模型的模型结构均包括编码器-解码器结构,所述第一语音识别模型的损失函数包括对比预测编码损失函数。
7.根据权利要求1所述的语音识别方法,其特征在于,所述待识别音频的语种为小语种,其中,所述小语种为训练数据收集成本大于预设成本阈值的语种,所述训练数据收集成本为收集预设数量的训练数据所需消耗的成本。
8.一种语音识别装置,其特征在于,包括:
9.一种非易失性存储介质,其特征在于,所述非易失性存储介质中存储有程序,其中,在所述程序运行时控制所述非易失性存储介质所在设备执行权利要求1至7中任意一项所述语音识别方法。
10.一种电子设备,其特征在于,包括:存储器和处理器,所述处理器用于运行存储在所述存储器中的程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的语音识别方法。
11.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1至7中任意一项所述的语音识别方法。
...【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:
2.根据权利要求1所述的语音识别方法,其特征在于,依据所述识别文本集合中各条所述识别文本的所述第一评价指标和所述第二评价指标,在所述识别文本集合中确定目标识别文本作为所述待识别音频的识别结果包括:
3.根据权利要求2所述的语音识别方法,其特征在于,对各条所述识别文本对应的所述第一评价指标和第二评价指标进行加权求和,得到各条所述识别文本对应的第三评价指标包括:
4.根据权利要求3所述的语音识别方法,其特征在于,所述历史评价结果包括历史待识别音频对应的标准历史识别文本,所述历史待识别音频对应的历史识别文本集合,以及所述历史识别文本集合中的各条历史识别文本对应的历史第一评价指标和历史第二评价指标;依据所述目标对象对所述第一语音识别模型和所述第二语音识别模型的历史评价结果确定所述第一语音识别模型和所述第二语音识别模型各自对应的权重包括:
5.根据权利要求1所述的语音识别方法,其特征在于,所述第一语音识别模型为采用无监督训练方式进行预训练的模型,所述第二语音识别模型为采用弱监督训练方式进行预训练...
【专利技术属性】
技术研发人员:袁改娟,张后力,雷婷,朴慧青,龚健,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。