声纹模型训练方法、装置、设备以及存储介质制造方法及图纸

技术编号：28424916 阅读：34 留言：0更新日期：2021-05-11 18:33

本申请公开了一种声纹模型训练方法、装置、设备以及存储介质，涉及语音识别、深度学习等人工智能领域。该方法的一具体实施方式包括：获取训练样本集，其中，训练样本集包括多个样本说话人的音频；提取多个样本说话人的音频的语音特征；将语音特征输入到声纹模型，得到语音特征所属的说话人的分数和部分噪声的分数；基于语音特征所属的说话人的分数和部分噪声的分数，训练声纹模型。该实施方式提供了一种基于噪声比例的训练方式训练声纹模型，降低了模型训练的计算量，提高了模型训练的效率。

全部详细技术资料下载

【技术实现步骤摘要】
声纹模型训练方法、装置、设备以及存储介质
本申请实施例涉及计算机领域，具体涉及语音识别、深度学习等人工智能领域，尤其涉及声纹模型训练方法、装置、设备以及存储介质。
技术介绍
对于存在大量不同说话人的音频的领域，通常希望对存量的音频进行声纹模型的训练与优化，然后通过建立庞大的声纹库来进行声纹的比对查找，有助于领域内的业务的推进。随着社会和互联网的飞速发展，领域内会积累海量说话人的音频。如何在这么庞大的数据量下，训练得到一个效果更优的声纹模型，成为声纹领域亟待解决的问题。
技术实现思路
本申请实施例提出了一种声纹模型训练方法、装置、设备以及存储介质。第一方面，本申请实施例提出了一种声纹模型训练方法，包括：获取训练样本集，其中，训练样本集包括多个样本说话人的音频；提取多个样本说话人的音频的语音特征；将语音特征输入到声纹模型，得到语音特征所属的说话人的分数和噪声的分数；基于语音特征所属的说话人的分数和部分噪声的分数，训练声纹模型。第二方面，本申请实施例提出了一种声纹模型训练装置，包括：获取模块，被配置成获取训练样本集，其中，训练样本集包括多个样本说话人的音频；提取模块，被配置成提取多个样本说话人的音频的语音特征；识别模型，被配置成将语音特征输入到声纹模型，得到语音特征所属的说话人的分数和部分噪声的分数；训练模块，被配置成基于语音特征所属的说话人的分数和部分噪声的分数，训练声纹模型。第三方面，本申请实施例提出了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；...

【技术保护点】
1.一种声纹模型训练方法，包括：/n获取训练样本集，其中，所述训练样本集包括多个样本说话人的音频；/n提取所述多个样本说话人的音频的语音特征；/n将所述语音特征输入到声纹模型，得到所述语音特征所属的说话人的分数和噪声的分数；/n基于所述语音特征所属的说话人的分数和部分噪声的分数，训练所述声纹模型。/n

【技术特征摘要】
1.一种声纹模型训练方法，包括：
获取训练样本集，其中，所述训练样本集包括多个样本说话人的音频；
提取所述多个样本说话人的音频的语音特征；
将所述语音特征输入到声纹模型，得到所述语音特征所属的说话人的分数和噪声的分数；
基于所述语音特征所属的说话人的分数和部分噪声的分数，训练所述声纹模型。

2.根据权利要求1所述的方法，其中，所述提取所述多个样本说话人的音频的语音特征，包括：
将所述多个样本说话人的音频从时域变换到频域，以及在频域上提取所述语音特征，其中，所述语音特征包括以下至少一项：梅尔频率倒谱系数MFCC、感知线性预测PLP、滤波器组FBank。

3.根据权利要求1所述的方法，其中，所述声纹模型是Xvector；以及
所述将所述语音特征输入到声纹模型，得到所述语音特征所属的说话人的分数和噪声的分数，包括：
将所述语音特征输入到Xvector，得到所述语音特征所属的说话人对应的输出节点输出的分数和噪声对应的输出节点输出的分数，其中，所述Xvector的输出节点与所述训练样本集对应的样本说话人一一对应，除所述语音特征所属的说话人对应的输出节点之外的输出节点是噪声对应的输出节点。

4.根据权利要求1所述的方法，其中，在所述基于所述语音特征所属的说话人的分数和部分噪声的分数，训练所述声纹模型之前，还包括：
基于所述训练样本集，估计噪声先验分布；
基于所述噪声先验分布，选取所述部分噪声的分数。

5.根据权利要求1所述的方法，其中，所述基于所述语音特征所属的说话人的分数和部分噪声的分数，训练所述声纹模型，包括：
将所述语音特征所属的说话人的分数和所述部分噪声的分数输入至损失函数，计算得到损失值；
基于所述损失值更新所述声纹模型的网络参数，直至所述声纹模型收敛。

6.一种声纹模型训练装置，包括：
获取模块，被配置成获取训练样本集，其中，所述训练样本集包括多个样本说话人的音频；
提取模块，被配置成提取所述多个样本说话人的音频的语音特征；
识别模型，被配置成将所述语音特...

【专利技术属性】
技术研发人员：赵情恩，曾新贵，熊新雷，陈蓉，肖岩，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人