一种训练声纹识别模型、声纹识别的方法及装置制造方法及图纸

技术编号:37578027 阅读:21 留言:0更新日期:2023-05-15 07:53
本申请的一些实施例提供了一种训练声纹识别模型、声纹识别的方法及装置,训练声纹识别模型的方法包括:获取训练样本数据集;循环执行如下过程,直至至少第i+1声纹相似度满足预设条件,将所述第i+1声纹识别模型作为目标声纹识别模型:根据第i声纹相似度和所述训练样本数据集,获取第i+1训练样本集,其中,所述第i声纹相似度是基于第i声纹识别模型和多个说话对象音频得到的;利用所述第i+1训练样本集对第i声纹识别模型进行训练,得到第i+1声纹识别模型;根据所述第i+1声纹识别模型和所述多个说话对象音频,获取所述多个说话对象间的第i+1声纹相似度。本申请的一些实施例可以提升声纹识别的准确度。升声纹识别的准确度。升声纹识别的准确度。

【技术实现步骤摘要】
一种训练声纹识别模型、声纹识别的方法及装置


[0001]本申请涉及声纹识别
,具体而言,涉及一种训练声纹识别模型、声纹识别的方法及装置。

技术介绍

[0002]语音话者分离技术(Speaker Diarization),通常是指将一段音频,按不同话者进行切分,得到每个话者的声纹特征。
[0003]目前,得益于声纹识别或声纹验证技术的发展,学术界和工业界对声纹特征的提取进行了持续性的深入研究,话者分离的声纹特征提取模块有了丰富的参考资料,甚至不少话者分离系统直接复用了声纹识别的声纹特征提取模块。通常在声纹识别或者声纹辨认系统中,常用于具有较长时间跨度的应用场景,例如用户注册一段声纹信息后,在几个月甚至几年内都无需再度注册,就可以使用声纹识别或辨认。但是,由于话者的嗓音随着录音设备、身体发育、健康状况乃至情绪变化会发生改变,因此其无法应用到离线话者的声纹识别,对于离线话者音频场景中无法获取准确的声纹识别结果。
[0004]因此,如何提供一种准确度较高的声纹识别的方法的技术方案成为亟需解决的技术问题。

技术实现思路

[0005]本申请的一些实施例的目的在于提供一种训练声纹识别模型、声纹识别的方法及装置,通过本申请的实施例的技术方案可以提升对话者的声纹识别的准确度,通用性较好。
[0006]第一方面,本申请的一些实施例提供了一种训练声纹识别模型的方法,包括:获取训练样本数据集,其中,所述训练样本数据集中包括:多个对象的多个音频样本;循环执行如下过程,直至至少第i+1声纹相似度满足预设条件,将所述第i+1声纹识别模型作为目标声纹识别模型:根据第i声纹相似度和所述训练样本数据集,获取第i+1训练样本集,其中,所述第i声纹相似度是基于第i声纹识别模型和多个说话对象音频得到的;利用所述第i+1训练样本集对第i声纹识别模型进行训练,得到第i+1声纹识别模型;根据所述第i+1声纹识别模型和所述多个说话对象音频,获取所述多个说话对象间的第i+1声纹相似度。
[0007]本申请的一些实施例通过训练样本数据集对不同训练阶段下的声纹识别模型进行训练,直至获取满足预设条件的目标声纹识别模型。本申请实施例可以获取鲁棒性较好的模型,为后续声纹识别提供模型基础,进而提升对话者的声纹识别的准确度,通用性较好。
[0008]在一些实施例,所述i=1时,通过如下方法获取所述第i声纹识别模型:从所述训练样本数据集中随机选择第一训练样本集对初始声纹识别模型进行训练,得到第一声纹识别模型。
[0009]本申请的一些实施例通过随机选择第一训练样本集对初始声纹识别模型进行训练得到第一声纹识别模型,可以实现模型的有效训练。
[0010]在一些实施例,所述第i声纹识别模型的目标函数与第i+1超参数、所述第i+1训练样本集中的样本相似度均值和样本相似度极值相关,其中,初始声纹识别模型和第i声纹识别模型的第一超参数不同。
[0011]本申请的一些实施例通过设计第i声纹识别模型的目标函数,使得目标函数与多个参数相关,可以实现模型的准确训练,提升模型训练效果。
[0012]在一些实施例,所述样本相似度均值与同类样本的声纹特征相似度均值和异类样本的声纹特征相似度均值相关,其中,所述同类样本表征同一对象的音频样本,所述异类样本表征不同对象的音频样本。
[0013]本申请的一些实施例通过获取样本相似度均值,可以准确得到与模型相关的参数,提升模型的有效性。
[0014]在一些实施例,所述样本相似度极值与第i调节超参数、所述同类样本的声纹特征相似度最小值和所述异类样本的声纹特征相似度最大值相关。
[0015]本申请的一些实施例通过多个参量得到样本相似度极值,确保模型的有效性。
[0016]在一些实施例,所述根据第i声纹相似度和所述训练样本数据集,获取第i+1训练样本集,包括:随机选取第一占比值;基于所述第i声纹相似度,获取与所述第一占比值对应的第一样本,并从所述训练样本数据集中选取与第二占比值对应的第二样本,其中,所述第一占比值和所述第二占比值之和为1,所述第一样本和所述第二样本构成所述第i+1训练样本集。
[0017]本申请的一些实施例通过选择训练样本集,可以提升训练的模型的鲁棒性和准确率。
[0018]在一些实施例,所述至少第i+1声纹相似度满足预设条件,包括:所述第i+1声纹相似度的准确率不小于预设值;或者,所述第i声纹相似度和所述第i+1声纹相似度均属于预设范围。
[0019]本申请的一些实施例通过不同的方式作为模型终止训练的预设条件,可以快速得到鲁棒性较好且准确度较高的目标声纹识别模型。
[0020]第二方面,本申请的一些实施例提供了一种声纹识别的方法,包括:获取待识别音频;将所述待识别音频输入至经过第一方面任一实施例所述的方法得到的目标声纹识别模型中,得到声纹识别结果,其中,所述声纹识别结果用于确认所述音频中所包含的目标对象的数量。
[0021]本申请的一些实施例通过目标声纹识别模型可以实现对待识别音频的准确识别,确认是否属于目标对象,准确度较高。
[0022]第三方面,本申请的一些实施例提供了一种训练声纹识别模型的装置,包括:样本获取模块,用于获取训练样本数据集,其中,所述训练样本数据集中包括:多个对象的多个音频样本;模型训练模块,用于:循环执行如下过程,直至至少第i+1声纹相似度满足预设条件,将所述第i+1声纹识别模型作为目标声纹识别模型:根据第i声纹相似度和所述训练样本数据集,获取第i+1训练样本集,其中,所述第i声纹相似度是基于第i声纹识别模型和多个说话对象音频得到的;利用所述第i+1训练样本集对第i声纹识别模型进行训练,得到第i+1声纹识别模型;根据所述第i+1声纹识别模型和所述多个说话对象音频,获取所述多个说话对象间的第i+1声纹相似度。
[0023]第四方面,本申请的一些实施例提供了一种声纹识别的装置,包括:获取模块,用于获取待识别音频;识别模块,用于将所述待识别音频输入至经过第一方面任一实施例所述的方法得到的目标声纹识别模型中,得到声纹识别结果,其中,所述声纹识别结果用于确认所述音频中所包含的目标对象的数量。
[0024]第三方面,本申请的一些实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时可实现如第一方面任一实施例所述的方法。
[0025]第四方面,本申请的一些实施例提供一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述程序时可实现如第一方面任一实施例所述的方法。
[0026]第五方面,本申请的一些实施例提供一种计算机程序产品,所述的计算机程序产品包括计算机程序,其中,所述的计算机程序被处理器执行时可实现如第一方面任一实施例所述的方法。
附图说明
[0027]为了更清楚地说明本申请的一些实施例的技术方案,下面将对本申请的一些实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种训练声纹识别模型的方法,其特征在于,包括:获取训练样本数据集,其中,所述训练样本数据集中包括:多个对象的多个音频样本;循环执行如下过程,直至至少第i+1声纹相似度满足预设条件,将所述第i+1声纹识别模型作为目标声纹识别模型:根据第i声纹相似度和所述训练样本数据集,获取第i+1训练样本集,其中,所述第i声纹相似度是基于第i声纹识别模型和多个说话对象音频得到的;利用所述第i+1训练样本集对第i声纹识别模型进行训练,得到第i+1声纹识别模型;根据所述第i+1声纹识别模型和所述多个说话对象音频,获取所述多个说话对象间的第i+1声纹相似度。2.如权利要求1所述的方法,其特征在于,所述i=1时,通过如下方法获取所述第i声纹识别模型:从所述训练样本数据集中随机选择第一训练样本集对初始声纹识别模型进行训练,得到第一声纹识别模型。3.如权利要求1或2所述的方法,其特征在于,所述第i声纹识别模型的目标函数与第i超参数、第i训练样本集的样本相似度均值和样本相似度极值相关,其中,初始声纹识别模型和第i声纹识别模型的第一超参数不同。4.如权利要求3所述的方法,其特征在于,所述样本相似度均值与同类样本的声纹特征相似度均值和异类样本的声纹特征相似度均值相关,其中,所述同类样本表征同一对象的音频样本,所述异类样本表征不同对象的音频样本。5.如权利要求4所述的方法,其特征在于,所述样本相似度极值与第i调节超参数、所述同类样本的声纹特征相似度最小值和所述异类样本的声纹特征相似度最大值相关。6.如权利要求1或2所述的方法,其特征在于,所述根据第i声纹相似度和所述训练样本数据集,获取第i+1训练样本集,包括:随机选取第一占比值;基于所述第i声纹相似度,获取与所述第一占比值对应的第一样本,并从所述...

【专利技术属性】
技术研发人员:唐延欢杜新凯蔡岩松鲜英刘凯韩振龙
申请(专利权)人:阳光保险集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1