训练数据的筛选方法、装置、设备和存储介质制造方法及图纸

技术编号:30347290 阅读:38 留言:0更新日期:2021-10-12 23:37
本发明专利技术涉及一种训练数据的筛选方法、装置、设备和存储介质,方法包括:将获取的待筛选数据输入预先构建的语音活动检测模型进行检测,得到待筛选数据的语音帧和噪音帧;根据获取的语音帧级平均能量和噪音帧级平均能量,确定待筛选数据的信噪比;若信噪比大于第一预设阈值,对待筛选数据进行混响抑制,得到抑制数据;根据语音帧级平均能量和获取的抑制数据的平均能量,确定混响分量的平均能量;根据混响分量的平均能量和语音帧级平均能量,确定混响占比;若混响占比小于第二预设阈值,保留待筛选数据,实现了自动筛选训练数据,提高了训练数据的筛选效率。数据的筛选效率。数据的筛选效率。

【技术实现步骤摘要】
训练数据的筛选方法、装置、设备和存储介质


[0001]本专利技术涉及神经网络
,具体涉及一种训练数据的筛选方法、装置、设备和存储介质。

技术介绍

[0002]在训练语音识别模型中,为了训练的效果,往往需要海量的安静、低混响等优质训练数据。而海量的优质训练数据往往难以获取,现有方案中,为了获取大量优质训练数据,通常基于简单的字符规则,通过简单粗糙的匹配完成,或者是先通过简单的规则匹配后,再使用人工检查的方式进行筛选,使得训练数据的筛选效率较低。

技术实现思路

[0003]本专利技术提供一种训练数据的筛选方法、装置、设备和存储介质,以解决现有技术中训练数据的筛选效率较低的技术问题。
[0004]本专利技术解决上述技术问题的技术方案如下:
[0005]一种训练数据的筛选方法,包括:
[0006]将获取的待筛选数据输入预先构建的语音活动检测模型进行检测,得到待筛选数据的语音帧和噪音帧;
[0007]获取待筛选数据的语音帧级平均能量和噪音帧级平均能量;
[0008]根据所述语音帧级平均能量和所述噪音帧级平均能量,确定所述待筛选数据的信噪比;
[0009]若所述信噪比大于第一预设阈值,对所述待筛选数据进行混响抑制,得到抑制数据;
[0010]根据所述语音帧级平均能量和获取的所述抑制数据的平均能量,确定混响分量的平均能量;
[0011]根据所述混响分量的平均能量和所述语音帧级平均能量,确定混响占比;
[0012]若所述混响占比小于第二预设阈值,保留所述待筛选数据。
[0013]进一步地,上述所述的训练数据的筛选方法中,根据所述语音帧级平均能量和获取的所述抑制数据的平均能量,确定混响分量的平均能量,包括:
[0014]将所述语音帧级平均能量与所述抑制数据的平均能量的差值作为所述混响分量的平均能量。
[0015]进一步地,上述所述的训练数据的筛选方法中,所述语音活动检测模型的构建过程包括:
[0016]以标定的需求语音数据作为基础数据,构造噪音数据;
[0017]将所述噪音数据和所述需求语音数据分别输入待训练模型进行迭代训练,直到满足迭代停止条件,生成所述语音活动检测模型。
[0018]进一步地,上述所述的训练数据的筛选方法中,以标定的需求语音数据作为基础
数据,构造噪音数据,包括:
[0019]基于预设的噪音数据构造计算式,利用所述需求语音数据和从开源数据库中获取的加噪信号,构造所述噪音数据。
[0020]进一步地,上述所述的训练数据的筛选方法中,所述加噪信号包括冲激响应信号和噪音信号;
[0021]所述噪音数据构造计算式为:
[0022][0023]其中,所述x(n)表示所述噪音数据,所述s(n)表示所述需求语音数据,h(n)表示所述冲激响应信号,noise(n)表示所述噪音信号,表示所述信噪比控制参数。
[0024]进一步地,上述所述的训练数据的筛选方法,还包括:
[0025]若所述信噪比小于或等于第一预设阈值,或者,所述混响占比大于或等于第二预设阈值,舍去所述待选数据。
[0026]本专利技术还提供了一种训练数据的筛选装置,包括:
[0027]输入模块,用于将获取的待筛选数据输入预先构建的语音活动检测模型进行检测,得到待筛选数据的语音帧和噪音帧;
[0028]获取模块,用于获取待筛选数据的语音帧级平均能量和噪音帧级平均能量;
[0029]第一确定模块,用于根据所述语音帧级平均能量和所述噪音帧级平均能量,确定所述待筛选数据的信噪比;
[0030]混响抑制模块,用于若所述信噪比大于第一预设阈值,对所述待筛选数据进行混响抑制,得到抑制数据;
[0031]第二确定模块,用于根据所述语音帧级平均能量和获取的所述抑制数据的平均能量,确定混响分量的平均能量;根据所述混响分量的平均能量和所述语音帧级平均能量,确定混响占比;
[0032]筛选模块,用于若所述混响占比小于第二预设阈值,保留所述待筛选数据。
[0033]进一步地,上述所述的训练数据的筛选装置中,所述语音活动检测模型的构建过程包括:
[0034]以标定的需求语音数据作为基础数据,构造噪音数据;
[0035]将所述噪音数据输入待训练模型进行迭代训练,直到满足迭代停止条件,生成所述语音活动检测模型。
[0036]本专利技术还提供了一种训练数据的筛选设备,包括:处理器和存储器;
[0037]所述处理器用于执行所述存储器中存储的训练数据的筛选的程序,以实现上述任一项所述的训练数据的筛选方法。
[0038]本专利技术还提供了一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被执行时实现上述任一项所述的训练数据的筛选方法。
[0039]本专利技术的有益效果是:
[0040]通过将获取的待筛选数据输入预先构建的语音活动检测模型进行检测,得到待筛选数据的语音帧和噪音帧;根据获取的语音帧级平均能量和获取的噪音帧级平均能量,确定所述待筛选数据的信噪比;若所述信噪比大于第一预设阈值,对所述待筛选数据进行混响抑制,得到抑制数据;根据所述语音帧级平均能量和获取的所述抑制数据的平均能量,确
定混响分量的平均能量;根据所述混响分量的平均能量和所述语音帧级平均能量,确定混响占比;若所述混响占比小于第二预设阈值,保留所述待筛选数据,实现了自动筛选训练数据,提高了训练数据的筛选效率。
附图说明
[0041]图1为本专利技术的训练数据的筛选方法实施例的流程图;
[0042]图2为本专利技术的训练数据的筛选装置实施例的结构示意图;
[0043]图3为本专利技术的训练数据的筛选设备的结构示意图。
具体实施方式
[0044]以下结合附图对本专利技术的原理和特征进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。
[0045]图1为本专利技术的训练数据的筛选方法实施例的流程图,如图1所示,本实施例的训练数据的筛选方法具体可以包括如下步骤:
[0046]100、将获取的待筛选数据输入预先构建的语音活动检测模型进行检测,得到待筛选数据的语音帧和噪音帧;
[0047]在一个具体实现过程中,可以按照如下步骤构造语音活动检测模型。
[0048](1)以标定的需求语音数据作为基础数据,构造噪音数据。
[0049]具体地,可以基于预设的噪音数据构造计算式,利用所述需求语音数据和从开源数据库中获取的加噪信号,构造所述噪音数据。在一些实施例中,所述加噪信号可以包括冲激响应信号和噪音信号。
[0050]所述噪音数据构造计算式为计算式(1):
[0051][0052]其中,所述x(n)表示所述噪音数据,所述s(n)表示所述需求语音数据,h(n)表示所述冲激响应信号,noise(n)表示所述噪音信号,表示所述信噪比控制参数。
[0053](2)将所述噪音数据输入待训练模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种训练数据的筛选方法,其特征在于,包括:将获取的待筛选数据输入预先构建的语音活动检测模型进行检测,得到待筛选数据的语音帧和噪音帧;获取待筛选数据的语音帧级平均能量和噪音帧级平均能量;根据所述语音帧级平均能量和所述噪音帧级平均能量,确定所述待筛选数据的信噪比;若所述信噪比大于第一预设阈值,对所述待筛选数据进行混响抑制,得到抑制数据;根据所述语音帧级平均能量和获取的所述抑制数据的平均能量,确定混响分量的平均能量;根据所述混响分量的平均能量和所述语音帧级平均能量,确定混响占比;若所述混响占比小于第二预设阈值,保留所述待筛选数据。2.根据权利要求1所述的训练数据的筛选方法,其特征在于,根据所述语音帧级平均能量和获取的所述抑制数据的平均能量,确定混响分量的平均能量,包括:将所述语音帧级平均能量与所述抑制数据的平均能量的差值作为所述混响分量的平均能量。3.根据权利要求1所述的训练数据的筛选方法,其特征在于,所述语音活动检测模型的构建过程包括:以标定的需求语音数据作为基础数据,构造噪音数据;将所述噪音数据和所述需求语音数据分别输入待训练模型进行迭代训练,直到满足迭代停止条件,生成所述语音活动检测模型。4.根据权利要求3所述的训练数据的筛选方法,其特征在于,以标定的需求语音数据作为基础数据,构造噪音数据,包括:基于预设的噪音数据构造计算式,利用所述需求语音数据和从开源数据库中获取的加噪信号,构造所述噪音数据。5.根据权利要求4所述的训练数据的筛选方法,其特征在于,所述加噪信号包括冲激响应信号和噪音信号;所述噪音数据构造计算式为:其中,所述x(n)表示所述噪音数据,所述s(n)表示所述需求语音数据,h(n)表示所述冲激响应信号,noise(n)表示...

【专利技术属性】
技术研发人员:关海欣梁家恩
申请(专利权)人:云知声智能科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1