训练数据的筛选方法、装置、设备和存储介质制造方法及图纸

技术编号：30347290 阅读：38 留言：0更新日期：2021-10-12 23:37

本发明专利技术涉及一种训练数据的筛选方法、装置、设备和存储介质，方法包括：将获取的待筛选数据输入预先构建的语音活动检测模型进行检测，得到待筛选数据的语音帧和噪音帧；根据获取的语音帧级平均能量和噪音帧级平均能量，确定待筛选数据的信噪比；若信噪比大于第一预设阈值，对待筛选数据进行混响抑制，得到抑制数据；根据语音帧级平均能量和获取的抑制数据的平均能量，确定混响分量的平均能量；根据混响分量的平均能量和语音帧级平均能量，确定混响占比；若混响占比小于第二预设阈值，保留待筛选数据，实现了自动筛选训练数据，提高了训练数据的筛选效率。数据的筛选效率。数据的筛选效率。

全部详细技术资料下载

【技术实现步骤摘要】
训练数据的筛选方法、装置、设备和存储介质

[0001]本专利技术涉及神经网络
，具体涉及一种训练数据的筛选方法、装置、设备和存储介质。

技术介绍

[0002]在训练语音识别模型中，为了训练的效果，往往需要海量的安静、低混响等优质训练数据。而海量的优质训练数据往往难以获取，现有方案中，为了获取大量优质训练数据，通常基于简单的字符规则，通过简单粗糙的匹配完成，或者是先通过简单的规则匹配后，再使用人工检查的方式进行筛选，使得训练数据的筛选效率较低。

技术实现思路

[0003]本专利技术提供一种训练数据的筛选方法、装置、设备和存储介质，以解决现有技术中训练数据的筛选效率较低的技术问题。
[0004]本专利技术解决上述技术问题的技术方案如下：
[0005]一种训练数据的筛选方法，包括：
[0006]将获取的待筛选数据输入预先构建的语音活动检测模型进行检测，得到待筛选数据的语音帧和噪音帧；
[0007]获取待筛选数据的语音帧级平均能量和噪音帧级平均能量；
[0008]根据所述语音帧级平均能量和所述噪音帧级平均能量，确定所述待筛选数据的信噪比；
[0009]若所述信噪比大于第一预设阈值，对所述待筛选数据进行混响抑制，得到抑制数据；
[0010]根据所述语音帧级平均能量和获取的所述抑制数据的平均能量，确定混响分量的平均能量；
[0011]根据所述混响分量的平均能量和所述语音帧级平均能量，确定混响占比；
[0012]若所述混响占比小于第二预设...

【技术保护点】

【技术特征摘要】
1.一种训练数据的筛选方法，其特征在于，包括：将获取的待筛选数据输入预先构建的语音活动检测模型进行检测，得到待筛选数据的语音帧和噪音帧；获取待筛选数据的语音帧级平均能量和噪音帧级平均能量；根据所述语音帧级平均能量和所述噪音帧级平均能量，确定所述待筛选数据的信噪比；若所述信噪比大于第一预设阈值，对所述待筛选数据进行混响抑制，得到抑制数据；根据所述语音帧级平均能量和获取的所述抑制数据的平均能量，确定混响分量的平均能量；根据所述混响分量的平均能量和所述语音帧级平均能量，确定混响占比；若所述混响占比小于第二预设阈值，保留所述待筛选数据。2.根据权利要求1所述的训练数据的筛选方法，其特征在于，根据所述语音帧级平均能量和获取的所述抑制数据的平均能量，确定混响分量的平均能量，包括：将所述语音帧级平均能量与所述抑制数据的平均能量的差值作为所述混响分量的平均能量。3.根据权利要求1所述的训练数据的筛选方法，其特征在于，所述语音活动检测模型的构建过程包括：以标定的需求语音数据作为基础数据，构造噪音数据；将所述噪音数据和所述需求语音数据分别输入待训练模型进行迭代训练，直到满足迭代停止条件，生成所述语音活动检测模型。4.根据权利要求3所述的训练数据的筛选方法，其特征在于，以标定的需求语音数据作为基础数据，构造噪音数据，包括：基于预设的噪音数据构造计算式，利用所述需求语音数据和从开源数据库中获取的加噪信号，构造所述噪音数据。5.根据权利要求4所述的训练数据的筛选方法，其特征在于，所述加噪信号包括冲激响应信号和噪音信号；所述噪音数据构造计算式为：其中，所述x(n)表示所述噪音数据，所述s(n)表示所述需求语音数据，h(n)表示所述冲激响应信号，noise(n)表示...

【专利技术属性】
技术研发人员：关海欣，梁家恩，
申请(专利权)人：云知声智能科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人