语音识别方法及装置制造方法及图纸

技术编号:23894743 阅读:20 留言:0更新日期:2020-04-22 07:58
本申请实施例提供一种语音识别方法及装置,方法包括:获取目标音频文件;根据预设策略集中各策略对应的质检规则,得到所述目标音频文件对应的质检分数;根据所述质检分数和预设质检阈值,确定所述目标音频文件的质检结果;本申请能够个性化、可配置化的进行语音识别,并能提升语音识别的准确性。

Speech recognition method and device

【技术实现步骤摘要】
语音识别方法及装置
本申请涉及语音识别领域,具体涉及一种语音识别方法及装置。
技术介绍
现有技术中语音质检的主要目的在于根据电话双方的通话内容判断有无违规行为,不同的企业对于违规的定义都不相同,现有技术很难满足语音质检的个性化、可配置化以及高准确性的要求。
技术实现思路
针对现有技术中的问题,本申请提供一种语音识别方法及装置,能够个性化、可配置化的进行语音识别,并能提升语音识别的准确性。为了解决上述问题中的至少一个,本申请提供以下技术方案:第一方面,本申请提供一种语音识别方法,包括:获取目标音频文件;根据预设策略集中各策略对应的质检规则,得到所述目标音频文件对应的质检分数;根据所述质检分数和预设质检阈值,确定所述目标音频文件的质检结果。进一步地,所述根据预设策略集中各策略对应的质检规则,得到所述目标音频文件对应的质检分数,包括:判断所述目标音频文件是否匹配所述质检规则中的预设关键词模板,若匹配,则获取对应的第一变动分值;根据所述质检规则的预设基本分值和所述第一变动分值,得到第一质检分数。进一步地,所述根据预设策略集中各策略对应的质检规则,得到所述目标音频文件对应的质检分数,还包括:判断所述目标音频文件是否匹配所述质检规则中的预设正则模板,若匹配,则获取对应的第二变动分值;根据所述质检规则的预设基本分值和所述第二变动分值,得到第二质检分数。进一步地,所述根据预设策略集中各策略对应的质检规则,得到所述目标音频文件对应的质检分数,还包括:根据预先添加标签的样本数据对预设NLP模型进行模型训练;根据经过所述模型训练后的NLP模型和所述目标音频文件,得到第三变动分值;根据所述质检规则的预设基本分值和所述第三变动分值,得到第三质检分数。第二方面,本申请提供一种语音识别装置,包括:目标音频文件获取模块,用于获取目标音频文件;策略集质检模块,用于根据预设策略集中各策略对应的质检规则,得到所述目标音频文件对应的质检分数;质检结果确定模块,用于根据所述质检分数和预设质检阈值,确定所述目标音频文件的质检结果。进一步地,所述策略集质检模块包括:关键词模板质检单元,用于判断所述目标音频文件是否匹配所述质检规则中的预设关键词模板,若匹配,则获取对应的第一变动分值;第一质检分数确定单元,用于根据所述质检规则的预设基本分值和所述第一变动分值,得到第一质检分数。进一步地,所述策略集质检模块还包括:正则模板质检单元,用于判断所述目标音频文件是否匹配所述质检规则中的预设正则模板,若匹配,则获取对应的第二变动分值;第二质检分数确定单元,用于根据所述质检规则的预设基本分值和所述第二变动分值,得到第二质检分数。进一步地,所述策略集质检模块还包括:NLP模型训练单元,用于根据预先添加标签的样本数据对预设NLP模型进行模型训练;NLP模型质检单元,用于根据经过所述模型训练后的NLP模型和所述目标音频文件,得到第三变动分值;第三质检分数确定单元,用于根据所述质检规则的预设基本分值和所述第三变动分值,得到第三质检分数。第三方面,本申请提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的语音识别方法的步骤。第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的语音识别方法的步骤。由上述技术方案可知,本申请提供一种语音识别方法及装置,通过获取目标音频文件;根据预设策略集中各策略对应的质检规则,得到所述目标音频文件对应的质检分数;根据所述质检分数和预设质检阈值,确定所述目标音频文件的质检结果,能够个性化、可配置化的进行语音识别,并能提升语音识别的准确性。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例中的语音识别方法的流程示意图之一;图2为本申请实施例中的语音识别方法的流程示意图之二;图3为本申请实施例中的语音识别方法的流程示意图之三;图4为本申请实施例中的语音识别方法的流程示意图之四;图5为本申请实施例中的语音识别装置的结构图之一;图6为本申请实施例中的语音识别装置的结构图之二;图7为本申请实施例中的电子设备的结构示意图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。考虑到现有技术中语音质检的主要目的在于根据电话双方的通话内容判断有无违规行为,不同的企业对于违规的定义都不相同,现有技术很难满足语音质检的个性化、可配置化以及高准确性的要求的问题,本申请提供一种语音识别方法及装置,通过获取目标音频文件;根据预设策略集中各策略对应的质检规则,得到所述目标音频文件对应的质检分数;根据所述质检分数和预设质检阈值,确定所述目标音频文件的质检结果,能够个性化、可配置化的进行语音识别,并能提升语音识别的准确性。为了能够个性化、可配置化的进行语音识别,并能提升语音识别的准确性,本申请提供一种语音识别方法的实施例,参见图1,所述语音识别方法具体包含有如下内容:步骤S101:获取目标音频文件。步骤S102:根据预设策略集中各策略对应的质检规则,得到所述目标音频文件对应的质检分数。可以理解的是,可以通过预先新建策略集,以及对应的,用户设定质检阈值,该质检阈值用于判定质检结果,根据定义值来取得三个区间,分别代表预警(warning)、复核(review)、通过(pass)。用户还可以定义基础分值,基础分值相当于默认值,表示用户新建策略集默认分为基础分值所设定的值。可选地,所述策略集可以由多个策略组成,所述策略由多条质检规则组成,所述质检规则可以由多条规则条件组成,所述规则条件由模板组成,所述模板包括但不限于:NLP模板、关键词模板、正则模板,一个策略集包含多个策略,用户可在策略集下创建多个策略。步骤S103:根据所述质检分数和预设质检阈值,确定所述目标音频文件的质检结果。可选地,一个策略可以添加多个质检规则,通过设定属性配置,条件配置来添加质检规则。具体地,通过选择规则类型来选择模板,可供选择的模板至少包括三种:正则模板、关键词模板、NLP模板(即下述NLP模型)。角色的设定本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,所述方法包括:/n获取目标音频文件;/n根据预设策略集中各策略对应的质检规则,得到所述目标音频文件对应的质检分数;/n根据所述质检分数和预设质检阈值,确定所述目标音频文件的质检结果。/n

【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:
获取目标音频文件;
根据预设策略集中各策略对应的质检规则,得到所述目标音频文件对应的质检分数;
根据所述质检分数和预设质检阈值,确定所述目标音频文件的质检结果。


2.根据权利要求1所述的语音识别方法,其特征在于,所述根据预设策略集中各策略对应的质检规则,得到所述目标音频文件对应的质检分数,包括:
判断所述目标音频文件是否匹配所述质检规则中的预设关键词模板,若匹配,则获取对应的第一变动分值;
根据所述质检规则的预设基本分值和所述第一变动分值,得到第一质检分数。


3.根据权利要求1所述的语音识别方法,其特征在于,所述根据预设策略集中各策略对应的质检规则,得到所述目标音频文件对应的质检分数,还包括:
判断所述目标音频文件是否匹配所述质检规则中的预设正则模板,若匹配,则获取对应的第二变动分值;
根据所述质检规则的预设基本分值和所述第二变动分值,得到第二质检分数。


4.根据权利要求1所述的语音识别方法,其特征在于,所述根据预设策略集中各策略对应的质检规则,得到所述目标音频文件对应的质检分数,还包括:
根据预先添加标签的样本数据对预设NLP模型进行模型训练;
根据经过所述模型训练后的NLP模型和所述目标音频文件,得到第三变动分值;
根据所述质检规则的预设基本分值和所述第三变动分值,得到第三质检分数。


5.一种语音识别装置,其特征在于,包括:
目标音频文件获取模块,用于获取目标音频文件;
策略集质检模块,用于根据预设策略集中各策略对应的质检规则,得到所述目标音频文件对应的质检分数...

【专利技术属性】
技术研发人员:崔晶晶左琦
申请(专利权)人:集奥聚合北京人工智能科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1