语音数据生成方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:27277852 阅读:24 留言:0更新日期:2021-02-06 11:44
本发明专利技术公开了一种语音数据生成方法、装置、计算机设备及存储介质,涉及人工智能技术领域,主要在于能够基于少数样本用户的样本语音数据,生成少数样本用户更多的语音数据,从而使得样本库中的不同用户的语音数据达到平衡。其中方法包括:获取目标用户的样本语音数据;对所述样本语音数据进行特征提取,得到所述样本语音数据对应的语音特征;根据所述样本语音数据对应的语音特征和预先构建的嵌入矩阵,计算所述样本语音数据对应的注意力分值,所述嵌入矩阵是通过对所述样本语音数据进行训练得到的;基于所述注意力分值,确定所述目标用户样本语音数据之外的验证语音数据。本发明专利技术采用了机器学习技术,主要适用于语音数据的生成。生成。生成。

【技术实现步骤摘要】
语音数据生成方法、装置、计算机设备及存储介质


[0001]本专利技术涉及人工智能
,尤其是涉及一种语音数据生成方法、装置、计算机设备及存储介质。

技术介绍

[0002]在语音识别技术中,对于分类器来说,如果样本库中不同用户的语音数据量差距过大,分类器很难有良好的表现,会影响分类器识别的准确率,因此,为了确保语音识别的准确率,需要保证样本语音数据的平衡。
[0003]目前,对于不平衡的样本语音数据,通常采用欠采样的方式对多数样本语音数据进行数据消除,或者人为采集少数样本用户的语音数据进行数据补充。然而,如果消除多数样本语音数据中的部分数据,很可能会丢失有价值的用户信息,进而影响用户的语音识别精度,此外,对于补充语音数据的方式,由于受到用户隐私和安全因素的限制,很难获得少数样本用户的大量语音数据,且这种这种人为采集语音数据的方式,操作较为不便。

技术实现思路

[0004]本专利技术提供了一种语音数据生成方法、装置、计算机设备及存储介质,主要在于能够基于少数样本用户的样本语音数据,生成少数样本用户更多的语音数据,从而使得样本库中的不同用户的语音数据达到平衡,同时能够避免丢失有价值的用户信息,操作更加方便。
[0005]根据本专利技术的第一个方面,提供一种语音数据生成方法,包括:
[0006]获取目标用户的样本语音数据;
[0007]对所述样本语音数据进行特征提取,得到所述样本语音数据对应的语音特征;
[0008]根据所述样本语音数据对应的语音特征和预先构建的嵌入矩阵,计算所述样本语音数据对应的注意力分值,所述嵌入矩阵是通过对所述样本语音数据进行训练得到的;
[0009]基于所述注意力分值,确定所述目标用户样本语音数据之外的验证语音数据。
[0010]根据本专利技术的第二个方面,提供一种语音数据生成装置,包括:
[0011]获取单元,用于获取目标用户的样本语音数据;
[0012]提取单元,用于对所述样本语音数据进行特征提取,得到所述样本语音数据对应的语音特征;
[0013]第一确定单元,用于根据所述样本语音数据对应的语音特征和预先构建的嵌入矩阵,计算所述样本语音数据对应的注意力分值,所述嵌入矩阵是通过对所述样本语音数据进行训练得到的,
[0014]第二确定单元,用于基于所述注意力分值,确定所述目标用户样本语音数据之外的验证语音数据。
[0015]根据本专利技术的第三个方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:
[0016]获取目标用户的样本语音数据;
[0017]对所述样本语音数据进行特征提取,得到所述样本语音数据对应的语音特征;
[0018]根据所述样本语音数据对应的语音特征和预先构建的嵌入矩阵,计算所述样本语音数据对应的注意力分值,所述嵌入矩阵是通过对所述样本语音数据进行训练得到的;
[0019]基于所述注意力分值,确定所述目标用户样本语音数据之外的验证语音数据。
[0020]根据本专利技术的第四个方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:
[0021]获取目标用户的样本语音数据;
[0022]对所述样本语音数据进行特征提取,得到所述样本语音数据对应的语音特征;
[0023]根据所述样本语音数据对应的语音特征和预先构建的嵌入矩阵,计算所述样本语音数据对应的注意力分值,所述嵌入矩阵是通过对所述样本语音数据进行训练得到的;
[0024]基于所述注意力分值,确定所述目标用户样本语音数据之外的验证语音数据。
[0025]本专利技术提供的一种语音数据生成方法、装置、计算机设备及存储介质,与目前采用欠采样的方式对多数样本语音数据进行数据消除的方式相比,本专利技术能够获取目标用户的样本语音数据;并对所述样本语音数据进行特征提取,得到所述样本语音数据对应的语音特征;与此同时,根据所述样本语音数据对应的语音特征和预先构建的嵌入矩阵,计算所述样本语音数据对应的注意力分值,所述嵌入矩阵是通过对所述样本语音数据进行训练得到的;并基于所述注意力分值,确定所述目标用户样本语音数据之外的验证语音数据,由此通过提取样本数据量匮乏的目标用户的语音特征,能够计算样本语音数据对应的注意力分值,并依据该注意力分值生成目标用户的验证语音数据,从而能够根据目标用户的少数样本语音数据,生成更多的语音数据,使不同用户的样本语音数据达到平衡,避免采用欠采用的方式丢失掉有价值的用户信息,同时依据该样本语音数据训练的预设语音识别模型的语音识别精度也得到了提高。
附图说明
[0026]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0027]图1示出了本专利技术实施例提供的一种语音数据生成方法流程图;
[0028]图2示出了本专利技术实施例提供的另一种语音数据生成方法流程图;
[0029]图3示出了本专利技术实施例提供的一种语音数据生成装置的结构示意图;
[0030]图4示出了本专利技术实施例提供的另一种语音数据生成装置的结构示意图;
[0031]图5示出了本专利技术实施例提供的一种计算机设备的实体结构示意图。
具体实施方式
[0032]下文中将参考附图并结合实施例来详细说明本专利技术。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
[0033]目前,对于不平衡的样本语音数据,通常采用欠采样的方式对多数样本语音数据进行数据消除,或者人为采集少数样本用户的语音数据进行数据补充。然而,如果消除多数样本语音数据中的部分数据,很可能会丢失有价值的用户信息,进而影响用户的语音识别
精度,此外,对于补充语音数据的方式,由于受到用户隐私和安全因素的限制,很难获得少数样本用户的大量语音数据,且这种这种人为采集语音数据的方式,操作较为不便。
[0034]为了解决上述问题,本专利技术实施例提供了一种语音数据生成方法,如图1所示,所述方法包括:
[0035]101、获取目标用户的样本语音数据。
[0036]其中,目标用户为样本语音数据匮乏的用户,该目标用户的样本语音数据的数据量小于预设数据量,目标用户的样本语音数据为预设样本库中已经存在的语音数据,具体可以通过搜集不同用户的语音数据,构建预设样本库,在语音搜集的过程中,可能由于隐私和安全因素的限制,有些用户的样本语音数据量相比其他用户较少,为了确保训练的语音识别模型的语音识别精度,需要保证预设样本库不同用户的语音数据达到平衡,因此需要利用目标用户已有的样本语音数据,生成更多的样本语音数据,以达到预设样本库中不同用户的样本语音数据的平衡,确保后续的预设语音识别模型的语音识别精度,本专利技术实施例主要适用于语音数据的生成,本专利技术实施例的执行主体为能够生成目语音数据的装置或设备本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音数据生成方法,其特征在于,包括:获取目标用户的样本语音数据;对所述样本语音数据进行特征提取,得到所述样本语音数据对应的语音特征;根据所述样本语音数据对应的语音特征和预先构建的嵌入矩阵,计算所述样本语音数据对应的注意力分值,所述嵌入矩阵是通过对所述样本语音数据进行训练得到的;基于所述注意力分值,确定所述目标用户样本语音数据之外的验证语音数据。2.根据权利要求1所述的方法,其特征在于,所述根据所述样本语音数据对应的语音特征和预先构建的嵌入矩阵,计算所述样本语音数据对应的注意力分值,包括:根据所述嵌入矩阵确定所述语音特征对应的查询向量、键向量和值向量;将所述语音特征对应的查询向量和键向量相乘,得到所述语音特征对应的权重值;根据所述语音特征对应的权重值和值向量,计算所述语音特征对应的注意力分值。3.根据权利要求1所述的方法,其特征在于,所述对所述样本语音数据进行特征提取,得到所述样本语音数据对应的语音特征,包括:对所述样本语音数据进行滤波处理,得到所述样本语音数据对应的语音能量;对所述语音能量进行离散余弦化处理,得到所述样本语音数据对应的语音特征。4.根据权利要求1所述的方法,其特征在于,在所述基于所述注意力分值,确定所述目标用户样本语音数据之外的验证语音数据之后,所述方法还包括:将所述目标用户的样本语音数据和验证语音数据,以及预设样本库中其他用户的样本语音数据确定为第一训练样本;利用预设神经网络算法对所述第一训练样本进行训练,构建预设语音识别模型。5.根据权利要求4所述的方法,其特征在于,在所述利用预设神经网络算法对所述第一训练样本进行训练,构建预设语音识别模型之后,所述方法还包括:将所述目标用户的样本语音数据和所述其他用户...

【专利技术属性】
技术研发人员:罗剑王健宗程宁
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1