语音数据生成方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：27277852 阅读：24 留言：0更新日期：2021-02-06 11:44

本发明专利技术公开了一种语音数据生成方法、装置、计算机设备及存储介质，涉及人工智能技术领域，主要在于能够基于少数样本用户的样本语音数据，生成少数样本用户更多的语音数据，从而使得样本库中的不同用户的语音数据达到平衡。其中方法包括：获取目标用户的样本语音数据；对所述样本语音数据进行特征提取，得到所述样本语音数据对应的语音特征；根据所述样本语音数据对应的语音特征和预先构建的嵌入矩阵，计算所述样本语音数据对应的注意力分值，所述嵌入矩阵是通过对所述样本语音数据进行训练得到的；基于所述注意力分值，确定所述目标用户样本语音数据之外的验证语音数据。本发明专利技术采用了机器学习技术，主要适用于语音数据的生成。生成。生成。

全部详细技术资料下载

【技术实现步骤摘要】
语音数据生成方法、装置、计算机设备及存储介质

[0001]本专利技术涉及人工智能
，尤其是涉及一种语音数据生成方法、装置、计算机设备及存储介质。

技术介绍

[0002]在语音识别技术中，对于分类器来说，如果样本库中不同用户的语音数据量差距过大，分类器很难有良好的表现，会影响分类器识别的准确率，因此，为了确保语音识别的准确率，需要保证样本语音数据的平衡。
[0003]目前，对于不平衡的样本语音数据，通常采用欠采样的方式对多数样本语音数据进行数据消除，或者人为采集少数样本用户的语音数据进行数据补充。然而，如果消除多数样本语音数据中的部分数据，很可能会丢失有价值的用户信息，进而影响用户的语音识别精度，此外，对于补充语音数据的方式，由于受到用户隐私和安全因素的限制，很难获得少数样本用户的大量语音数据，且这种这种人为采集语音数据的方式，操作较为不便。

技术实现思路

[0004]本专利技术提供了一种语音数据生成方法、装置、计算机设备及存储介质，主要在于能够基于少数样本用户的样本语音数据，生成少数样本用户更多的语音数据，从而使得样本库中的不同用户的语音数据达到平衡，同时能够避免丢失有价值的用户信息，操作更加方便。
[0005]根据本专利技术的第一个方面，提供一种语音数据生成方法，包括：
[0006]获取目标用户的样本语音数据；
[0007]对所述样本语音数据进行特征提取，得到所述样本语音数据对应的语音特征；
[0008]根据所述样本语音数据对应的语音特征和预先构建的嵌入...

【技术保护点】

【技术特征摘要】
1.一种语音数据生成方法，其特征在于，包括：获取目标用户的样本语音数据；对所述样本语音数据进行特征提取，得到所述样本语音数据对应的语音特征；根据所述样本语音数据对应的语音特征和预先构建的嵌入矩阵，计算所述样本语音数据对应的注意力分值，所述嵌入矩阵是通过对所述样本语音数据进行训练得到的；基于所述注意力分值，确定所述目标用户样本语音数据之外的验证语音数据。2.根据权利要求1所述的方法，其特征在于，所述根据所述样本语音数据对应的语音特征和预先构建的嵌入矩阵，计算所述样本语音数据对应的注意力分值，包括：根据所述嵌入矩阵确定所述语音特征对应的查询向量、键向量和值向量；将所述语音特征对应的查询向量和键向量相乘，得到所述语音特征对应的权重值；根据所述语音特征对应的权重值和值向量，计算所述语音特征对应的注意力分值。3.根据权利要求1所述的方法，其特征在于，所述对所述样本语音数据进行特征提取，得到所述样本语音数据对应的语音特征，包括：对所述样本语音数据进行滤波处理，得到所述样本语音数据对应的语音能量；对所述语音能量进行离散余弦化处理，得到所述样本语音数据对应的语音特征。4.根据权利要求1所述的方法，其特征在于，在所述基于所述注意力分值，确定所述目标用户样本语音数据之外的验证语音数据之后，所述方法还包括：将所述目标用户的样本语音数据和验证语音数据，以及预设样本库中其他用户的样本语音数据确定为第一训练样本；利用预设神经网络算法对所述第一训练样本进行训练，构建预设语音识别模型。5.根据权利要求4所述的方法，其特征在于，在所述利用预设神经网络算法对所述第一训练样本进行训练，构建预设语音识别模型之后，所述方法还包括：将所述目标用户的样本语音数据和所述其他用户...

【专利技术属性】
技术研发人员：罗剑，王健宗，程宁，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人