声纹注册方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36939029 阅读:52 留言:0更新日期:2023-03-22 19:00
本公开提供了一种声纹注册方法、装置、电子设备及存储介质。本公开实施例的声纹注册方法可以包括:将第一说话人的语音样本切分为长度相同的多条语音段;将每条语音段切分为长度相同且彼此重叠的多个语音帧;获取每条语音段中每个语音帧的声纹识别特征,并根据语音段中所有语音帧的声纹识别特征获取语音段的声纹嵌入码;确定语音样本中每条语音段的声纹嵌入码与其他语音段的声纹嵌入码的相似度;根据每条语音段的声纹嵌入码的所有相似度和预设的相似度阈值确定有效的声纹嵌入码;根据语音样本对应的所有有效的声纹嵌入码获得第一说话人的注册声纹嵌入码。本公开可以实现无效音频部分的自检查和有效提取,使得注册声纹嵌入码能够更加准确地表示说话人的语音特征。能够更加准确地表示说话人的语音特征。能够更加准确地表示说话人的语音特征。

【技术实现步骤摘要】
声纹注册方法、装置、电子设备及存储介质


[0001]本公开涉及一种声纹注册方法、装置、电子设备及存储介质。

技术介绍

[0002]目前,需要使用预先注册的诸如声纹嵌入码等特征来实现语音。相关技术中,直接提取已标注有说话人的语音样本的声纹嵌入码作为预注册声纹嵌入码,以该预注册声纹嵌入码作为该语音识别中用于验证或识别的对比样本。
[0003]然而,由于已标注有说话人的语音样本质量参差不齐,例如可能会包含静音、背景音、其他说话人语音等噪音,音频类型和内容多种多样,时长较长等,导致预先注册的声纹嵌入码质量欠佳,从而影响语音识别的准确性。

技术实现思路

[0004]为了解决上述技术问题中的至少一个,本公开提供了一种声纹注册方法、装置、电子设备及存储介质。
[0005]根据本公开的一个方面,提供了一种声纹注册方法,包括:
[0006]将第一说话人的语音样本切分为长度相同的多条语音段;
[0007]将每条语音段切分为长度相同且彼此重叠的多个语音帧;
[0008]获取每条所述语音段中每个所述语音帧的声纹识别特征,并根据所述语音段中所有语音帧的声纹识别特征获取所述语音段的声纹嵌入码;
[0009]确定所述语音样本中每条语音段的声纹嵌入码与其他语音段的声纹嵌入码的相似度;
[0010]根据每条语音段的声纹嵌入码的所有相似度和预设的相似度阈值确定有效的声纹嵌入码;
[0011]根据所述语音样本对应的所有有效的声纹嵌入码获得所述第一说话人的注册声纹嵌入码。/>[0012]本公开第一方面的一些可能的实现方式中,所述根据每条语音段的声纹嵌入码的所有相似度和预设的相似度阈值确定所述语音段的声纹嵌入码是否有效,包括:
[0013]根据第一语音段的所有相似度和预设的相似度阈值,确定所述第一语音段的声音嵌入码的置信度;
[0014]在所述第一语音段的声音嵌入码的置信度大于或等于预设置信度阈值时,确定所述第一语音段的声音嵌入码有效;
[0015]在所述第一语音段的声音嵌入码的置信度小于所述预设置信度阈值时,确定所述第一语音段的声音嵌入码无效。
[0016]本公开第一方面的一些可能的实现方式中,所述根据所述第一语音段的所有相似度和预设的相似度阈值,确定所述第一语音段的声音嵌入码的置信度,包括:确定所述第一语音段的所有相似度中大于预设相似度阈值的相似度数量;根据所述大于预设相似度阈值
的相似度数量与所述第一语音段的相似度总数,确定所述第一语音段的声音嵌入码的置信度。
[0017]本公开第一方面的一些可能的实现方式中,所述第一语音段的声音嵌入码的置信度为所述大于预设相似度阈值的相似度数量与所述相似度总数的比值。
[0018]本公开第一方面的一些可能的实现方式中,所述根据所述语音样本对应的所有有效的声纹嵌入码获得所述第一说话人的注册声纹嵌入码,包括:以所述语音样本对应的所有有效的声纹嵌入码执行向量相加得到的结果作为所述第一说话人的注册声纹嵌入码;或者,以所述语音样本对应的所有有效的声纹嵌入码执行加权平均得到的结果作为所述第一说话人的注册声纹嵌入码。
[0019]根据本公开的第二方面,提供了一种声纹注册装置,包括:
[0020]第一切分单元,用于将第一说话人的语音样本切分为长度相同的多条语音段;
[0021]第二切分单元,用于将每条所述语音段切分为长度相同且彼此重叠的多个语音帧;
[0022]声纹识别单元,用于获取每条所述语音段中每个所述语音帧的声纹识别特征;
[0023]嵌入码提取单元,用于根据每条所述语音段中所有语音帧的声纹识别特征获取每条所述语音段的声纹嵌入码;
[0024]相似度确定单元,用于确定所述语音样本中每条语音段的声纹嵌入码与其他语音段的声纹嵌入码的相似度;
[0025]有效性确定单元,用于根据每条语音段的声纹嵌入码的所有相似度和预设的相似度阈值确定有效的声纹嵌入码;
[0026]注册声纹嵌入码获取单元,用于根据所述语音样本对应的所有有效的声纹嵌入码获得所述第一说话人的注册声纹嵌入码。
[0027]本公开第二方面的一些可能的实现方式中,所述有效性确定单元,具体用于:根据第一语音段的所有相似度和预设的相似度阈值,确定所述第一语音段的声音嵌入码的置信度;在所述第一语音段的声音嵌入码的置信度大于或等于预设置信度阈值时,确定所述第一语音段的声音嵌入码有效;在所述第一语音段的声音嵌入码的置信度小于所述预设置信度阈值时,确定所述第一语音段的声音嵌入码无效。
[0028]本公开第二方面的一些可能的实现方式中,所述所述有效性确定单元,具体用于:确定所述第一语音段的所有相似度中大于预设相似度阈值的相似度数量;根据所述大于预设相似度阈值的相似度数量与所述第一语音段的相似度总数,确定所述第一语音段的声音嵌入码的置信度。
[0029]本公开第二方面的一些可能的实现方式中,所述第一语音段的声音嵌入码的置信度为所述大于预设相似度阈值的相似度数量与所述相似度总数的比值。
[0030]本公开第二方面的一些可能的实现方式中,所述注册声纹嵌入码获取单元,具体用于:以所述语音样本对应的所有有效的声纹嵌入码执行向量相加得到的结果作为所述第一说话人的注册声纹嵌入码;或者,以所述语音样本对应的所有有效的声纹嵌入码执行加权平均得到的结果作为所述第一说话人的注册声纹嵌入码。
[0031]根据本公开的第三方面,提供了一种电子设备,包括:
[0032]存储器,所述存储器存储执行指令;以及
[0033]处理器,所述处理器执行所述存储器存储的执行指令,使得所述处理器执行上述的声纹注册方法。
[0034]根据本公开的第四方面,提供了一种可读存储介质,所述可读存储介质中存储有执行指令,所述执行指令被处理器执行时用于实现上述的声纹注册方法。
[0035]本公开实施例的声纹注册方法,通过将说话人的语音样本切分为多个语音段,再对多个语音段的声纹嵌入码进行有效性判定,最后根据有效的声纹嵌入码获得相应说话人的注册声纹嵌入码,可以实现无效音频部分的自检查和有效提取,使得最终得到的注册声纹嵌入码能够更加准确地表示说话人的语音特征,从而提升语音识别的准确性。
附图说明
[0036]附图示出了本公开的示例性实施方式,并与其说明一起用于解释本公开的原理,其中包括了这些附图以提供对本公开的进一步理解,并且附图包括在本说明书中并构成本说明书的一部分。
[0037]图1是根据本公开的一个实施方式的声纹注册方法的流程示意图。
[0038]图2是根据本公开的一个实施方式的采用处理系统的硬件实现方式的声纹注册装置示例图。
[0039]图中附图标记具体为:
[0040]200语音识别装置
[0041]300总线
[0042]400处理器
[0043]500存储器
[0044]600其它电路。
具体实施方式
...

【技术保护点】

【技术特征摘要】
1.一种声纹注册方法,其特征在于,包括:将第一说话人的语音样本切分为长度相同的多条语音段;将每条语音段切分为长度相同且彼此重叠的多个语音帧;获取每条所述语音段中每个所述语音帧的声纹识别特征,并根据所述语音段中所有语音帧的声纹识别特征获取所述语音段的声纹嵌入码;确定所述语音样本中每条语音段的声纹嵌入码与其他语音段的声纹嵌入码的相似度;根据每条语音段的声纹嵌入码的所有相似度和预设的相似度阈值确定有效的声纹嵌入码;根据所述语音样本对应的所有有效的声纹嵌入码获得所述第一说话人的注册声纹嵌入码。2.根据权利要求1所述的声纹注册方法,其特征在于,所述根据每条语音段的声纹嵌入码的所有相似度和预设的相似度阈值确定所述语音段的声纹嵌入码是否有效,包括:根据第一语音段的所有相似度和预设的相似度阈值,确定所述第一语音段的声音嵌入码的置信度;在所述第一语音段的声音嵌入码的置信度大于或等于预设置信度阈值时,确定所述第一语音段的声音嵌入码有效;在所述第一语音段的声音嵌入码的置信度小于所述预设置信度阈值时,确定所述第一语音段的声音嵌入码无效。3.根据权利要求2所述的声纹注册方法,其特征在于,所述根据所述第一语音段的所有相似度和预设的相似度阈值,确定所述第一语音段的声音嵌入码的置信度,包括:确定所述第一语音段的所有相似度中大于预设相似度阈值的相似度数量;根据所述大于预设相似度阈值的相似度数量与所述第一语音段的相似度总数,确定所述第一语音段的声音嵌入码的置信度。4.根据权利要求3所述的声纹注册方法,其特征在于,所述第一语音段的声音嵌入码的置信度为所述大于预设相似度阈值的相似度数量与所述相似度总数的比值。5.根据权利要求1所述的声纹注册方法,其特征在于,所述根据所述语音样本对应的所有有效的声纹嵌入码获得所述第一说话人的注册声纹嵌入码,包括:以所述语...

【专利技术属性】
技术研发人员:魏光辉李志飞
申请(专利权)人:出门问问武汉信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1