语音敏感词的识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36086591 阅读:38 留言:0更新日期:2022-12-24 11:02
本发明专利技术公开了一种语音敏感词的识别方法、装置、电子设备及存储介质。该方法包括:获取语音样本集,并在语言样本集的每个语音样本中识别多个敏感片段,并确定与各敏感片段分别对应的目标频次;确定与每个敏感片段分别对应的MFCC特征;按照目标频次,将与每个敏感片段分别对应的敏感MFCC特征输入至预先构建的语音敏感词决策树中,对语音敏感词决策树中的各项参数进行配置;获取与目标语音对应的目标MFCC特征,并将目标MFCC特征输入至完成配置的语音敏感词决策树中,获取对目标语音的敏感词识别结果。通过执行本技术方案,可以实现对语音中敏感词的识别,达到了提高语音敏感词识别的准确性的效果。确性的效果。确性的效果。

【技术实现步骤摘要】
语音敏感词的识别方法、装置、电子设备及存储介质


[0001]本专利技术涉及语音识别
,尤其涉及语音敏感词的识别方法、装置、电子设备及存储介质。

技术介绍

[0002]随着金融、电信以及医疗等行业的自助服务设备逐渐趋于智能化,语音识别技术已经成为在AI系统中主要的人机交互方式,例如智能电话客服因其可以完整的收集客户的意见与建议信息,同时节省了人力资源而被越来越多的人们使用。但是同时,由于语音信息的特殊性,语音信息中存在的敏感词,例如带有敏感倾向或不文明用语的词汇在一定程度上影响了语音识别信息的可读性等。
[0003]目前用于语音识别技术的敏感词的过滤方法,主要依赖于GSV

SVM(GlobalSecurityVerification

SupportVectorMachine,高斯混合模型超矢量

支持向量机)识别方法,上述方法为一种基于子空间映射和得分规整的识别方法,在一定程度上可以对语音中的敏感词进行筛选及删除,得到敏感词过滤后的语音识别结果。
[0004]专利技术人在实现本专利技术的过程中,发现该方法有如下缺陷:现有技术在敏感词识别的程度上存在语言处理技术精度差,语音敏感词识别率低,敏感词筛选结果不稳定,不利于敏感词过滤后的语音识别结果正常输出的问题,且针对上述问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术提供了一种语音敏感词的识别方法、装置、电子设备及存储介质,以解决现有技术中语音敏感词识别精度差的问题。
[0006]第一方面,本专利技术实施例提供了一种语音敏感词的识别方法,该方法包括:
[0007]获取语音样本集,并在语言样本集的各语音样本中识别多个敏感片段,并确定与每个敏感片段分别对应的目标频次;
[0008]确定与每个敏感片段分别对应的敏感MFCC(MelFrequencyCepstrumCoefficient,梅尔倒谱系数)特征;
[0009]按照目标频次,将与每个敏感片段分别对应的敏感MFCC特征输入至预先构建的语音敏感词决策树中,对语音敏感词决策树中的各项参数进行配置;
[0010]获取与目标语音对应的目标MFCC特征,并将目标MFCC特征输入至完成配置的语音敏感词决策树中,获取对目标语音的敏感词识别结果。
[0011]第二方面,本专利技术实施例提供了一种语音敏感词的识别装置,该装置包括:
[0012]敏感片段识别模块,用于获取语音样本集,并在语言样本集的各语音样本中识别多个敏感片段,并确定与每个敏感片段分别对应的目标频次;
[0013]敏感MFCC特征确定模块,用于确定与每个敏感片段分别对应的敏感MFCC特征;
[0014]语音敏感词决策树配置模块,用于按照目标频次,将与每个敏感片段分别对应的
敏感MFCC特征输入至预先构建的语音敏感词决策树中,对语音敏感词决策树中的各项参数进行配置;
[0015]敏感词识别模块,用于获取与目标语音对应的目标MFCC特征,并将目标MFCC特征输入至完成配置的语音敏感词决策树中,获取对目标语音的敏感词识别结果。
[0016]第三方面,本专利技术实施例提供了一种电子设备,所述电子设备包括:
[0017]至少一个处理器;以及
[0018]与所述至少一个处理器通信连接的存储器;其中,
[0019]所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的语音敏感词的识别方法。
[0020]第四方面,本专利技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的语音敏感词的识别方法。
[0021]本专利技术实施例的技术方案,通过识别语音样本集中的敏感片段,分别确定每个敏感片段的目标频次与敏感MFCC,通过将敏感MFCC输入至语音敏感决策树进行参数配置,将目标MFCC特征输入至参数配置完成的语音敏感决策树中以获取对目标语音的敏感词识别结果的技术手段,解决了现有技术中语音敏感词识别精度差的问题,提高了语音敏感词识别的准确性。
[0022]应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0023]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0024]图1a是根据本专利技术实施例一提供的一种语音敏感词的识别方法的流程图;
[0025]图1b是根据本专利技术实施例一提供的一种敏感MFCC特征获取方法的流程图;
[0026]图1c是根据本专利技术实施例一提供的方法所构建的语音敏感决策树的示意图;
[0027]图2a是根据本专利技术实施例二所适用的语音敏感词的识别方法的流程图;
[0028]图2b是根据本专利技术实施例二所提供的方法得到的词素端点分割结果的示意图;
[0029]图2c是根据本专利技术实施例二所提供的方法得到的一种语音敏感词识别方法的敏感词识别的结果示意图;
[0030]图2d是根据本专利技术实施例二所提供的方法对比在GSV

SVM识别方法下的敏感词识别的结果示意图;
[0031]图2e是根据本专利技术实施例二所提供的方法对比在i

vector+PLDA识别方法下的敏感词识别的结果示意图;
[0032]图3是根据本专利技术实施例三提供的一种种语音敏感词的识别装置的结构示意图;
[0033]图4是是根据本专利技术实施例四提供的一种可以用来实施本专利技术的实施例的电子设
备的结构示意图。
具体实施方式
[0034]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0035]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音敏感词的识别方法,其特征在于,包括:获取语音样本集,并在语言样本集的各语音样本中识别多个敏感片段,并确定与每个敏感片段分别对应的目标频次;确定与每个敏感片段分别对应的敏感梅尔倒谱系数MFCC特征;按照目标频次,将与每个敏感片段分别对应的敏感MFCC特征输入至预先构建的语音敏感词决策树中,对语音敏感词决策树中的各项参数进行配置;获取与目标语音对应的目标MFCC特征,并将目标MFCC特征输入至完成配置的语音敏感词决策树中,获取对目标语音的敏感词识别结果。2.根据权利要求1所述的方法,其特征在于,在语言样本集的各语音样本中识别多个敏感片段,并确定与每个敏感片段分别对应的目标频次,包括:将语言样本集的各语音样本与预先构建的敏感语音库中的各敏感语音进行匹配;根据匹配结果获取语音样本集中包括的各敏感片段,并确定与每个敏感片段分别对应的目标频次。3.根据权利要求2所述的方法,其特征在于,根据匹配结果获取语音样本集中包括的各敏感片段,并确定与每个敏感片段分别对应的目标频次,包括:根据与同一敏感语音匹配的全部语音样本片段,确定出与所述敏感语音对应的敏感片段;根据与该敏感语音匹配成功的次数,作为与该敏感语音匹配的敏感片段在目标语音样本中的出现频次;根据每个敏感片段的持续时长,计算与每个敏感片段分别对应的时长权重,并根据每个敏感片段的时长权重和出现频次,确定与每个敏感片段分别对应的目标频次。4.根据权利要求1所述的方法,其特征在于,确定与每个敏感片段分别对应的敏感MFCC特征,包括:对当前处理的目标敏感片段进行预加重处理,得到加重敏感信号;对加重敏感信号进行交叉分帧处理,得到多个音频帧,并对每个音频帧进行加窗处理,得到多个音频加窗帧;对多个音频加窗帧进行MFCC特征的提取,得到与目标敏感片段对应的敏感MFCC特征。5.根据权利要求1

4任一项所述的方法,其特征在于,按照目标频次,将与每个敏感片段分别对应的敏感MFCC特征输入至预先构建的语音敏感词决策树中,对语音敏感词决策树中的各项参数进行配置,包括:按照目标频次,生成与每个敏感片段分别对应的多个重复敏感片段;将各重复敏感片段分别输入至预先构建的语音敏感词决策树中,对语...

【专利技术属性】
技术研发人员:张小晶林荣荣梁志明支天波
申请(专利权)人:贵州小爱机器人科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1