一种基于模型融合的神经网络噪声源分类的方法及装置制造方法及图纸

技术编号：42645957 阅读：6 留言：0更新日期：2024-09-06 01:40

本申请公开了一种基于模型融合的神经网络噪声源分类的方法及装置，涉及噪声分类技术领域，解决了现有模型训练中泛化性差，识别稳定性不高且各类别准确率不均衡的问题，该方法包括：构建训练集，利用所述训练集对卷积神经网络模型进行多轮步骤的训练和测试，将筛选出的模型采用模型融合技术进行权重的求和平均并进行模型的推理部署，通过模型的迭代训练，有针对性地调整较难训练的类别在损失函数中的权重，进行类别识别准确率的平衡，然后通过模型融合技术，进一步平衡了各类别的准确率，并且提高了最终的融合模型的泛化性和鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及噪声分类，尤其是一种基于模型融合的神经网络噪声源分类的方法及装置。

技术介绍

1、近年来，随着工业技术的迅速发展与人民生活水平的日益提升，生活中的噪声源种类越来越多，包括生活噪声、环境噪声、工业噪声等。由噪声污染所产生的矛盾、纠纷越来越多，随着人们生活质量的提高，人们对于环境噪声的影响也愈发重视，与噪声相关的法律维权事件也越来越多了。因此，在新的噪声法颁布的背景下，噪声源类别的分辨也成为了众多监管部门面临的重要课题。

2、噪声源分类是指分辨出噪声发声源所属的类别，目前有基于传统算法和神经网络算法两种实现方式。传统的噪声源分类算法对音频特征进行人工提取，然后依据其特征之间的差异进行分类，存在分类准确率难以提升并且噪声源分类类别较为单一的问题。现阶段基于神经网络算法的方法普遍受制于训练样本少，导致模型精度较差，鲁棒性与泛化性不强，并且模型在实际使用中参数数量和计算量过于庞大的问题。

3、公开号为cn115358718a的中国专利公开了基于智能监测前端的噪声污染分类及实时监管方法，包括：步骤1：实时监测；步骤2：数据处理；步骤3：声纹识别；步骤4：噪声数据审核；步骤5：噪声事件归纳；步骤6：噪声事件告警；步骤7：噪声事件处理；步骤8：噪声事件建档。本专利技术将ai声纹识别技术和物联网技术应用于噪声监管，对噪声污染进行科学分类，联动噪声超标告警和运维管理，实现实时监管和跟踪处理。实现噪声污染分类精细化同时，按生活噪声、交通噪声、工业噪声、施工噪声、自然噪声五大类划分，确保监管有效及时；噪声污染事件联动噪

4、公开号为cn114861784a的中国专利公开了基于迁移学习的环境声音分类分析方法、装置和介质，其中的方法包括：使用yamnet模型对的环境声音样本进行特征提取，获得噪声并将所述噪声嵌入每个所述环境声音样本的序列的声音特征，得到特征向量；采用深度卷积神经网络对所述特征向量进行深度特征提取，获得每个所述环境声音样本的深层嵌入特征；将所述深层嵌入特征输入深度卷积神经网络的全连接层进行模型的训练和测试，输出每个所述环境声音样本的序列的预测概率，用多数投票法得到最终的环境声音分类结果。本申请将为节省研发资源，以及将大数据机器学习成果转移到小数据、定制化应用等等提供了一个便捷的渠道，具有广泛的应用前景以及巨大的实用价值。

5、目前自然界的环境噪声和人们生活中人为产生的噪声种类很多，多达几十上百种。在各种噪声中，存在特征明显区别于其他的噪声，如鸣笛声；也有很相近的声音，飞机声和工程车由远及近的声音十分接近，导致上述专利在模型训练中泛化性差，识别稳定性不高且各类别准确率不均衡的问题。

技术实现思路

1、本申请的目的在于克服现有噪声分类模型训练中泛化性差，识别稳定性不高且各类别准确率不均衡的问题，提供一种基于模型融合的神经网络噪声源分类的方法及装置。

2、第一方面，提供了一种基于模型融合的神经网络噪声源分类的方法，包括：

3、构建包含多种类别噪声源的训练集；

4、利用所述训练集对卷积神经网络模型进行多轮步骤的训练和测试，以筛选出至少两个权重及对应的模型；

5、将筛选出的模型采用模型融合技术进行权重的求和平均，以获得融合模型；

6、利用所述融合模型进行噪声源分类。

7、在一些可能的实现方式中，构建包含多种类别噪声源的训练集，包括：

8、收集包含多种类别噪声源的标记数据集；

9、对所述标记数据集进行预处理和标准化处理，以得到训练集。

10、在一些可能的实现方式中，利用所述训练集对卷积神经网络模型进行多轮训练和测试，以筛选出至少两个权重及对应的模型，包括：

11、s201、进行第一轮模型训练，在第一轮模型训练中，设置初始学习率为0.01，采用余弦退火的方式，下限学习率为0.00001，损失函数中各个类别的权重比例均为1，测试全部类别的准确率，记录准确率低于预设值的类别标签；

12、s202、根据所述准确率低于预设值的类别标签和识别率计算相应类别标签在损失函数中的权重，若类别标签的准确率与预设值每相差5%，则将所述类别标签在损失函数中的权重提升为原来的2倍；

13、s203、加载上一轮模型训练中的权重，并将步骤s202中计算得到的相应类别标签对应的权重加到损失函数上，设置初始学习率为0.001，采用余弦退火的方式，下限学习率为0.00001，进行下一轮训练，测试全部类别的准确率，再次记录准确率低于预设值的类别标签；

14、s204、重复步骤s202和步骤s203进行n次训练，将整体识别率排名前m的m个权重记录下来，其中，n>m，m≥2。

15、在一些可能的实现方式中，若类别标签的准确率与预设值相差不足5%，则按5%处理。

16、在一些可能的实现方式中，所述卷积神经网络模型依次包括：二维conv层、特征提取模块、二维depthwiseconv层、mean池化层、二维conv层、池化层、reshape层、二维conv层和softmax层，其中，所述特征提取模块包括4个transitionblock块和12个normalblock块。

17、第二方面，提供了一种基于模型融合的神经网络噪声源分类的装置，包括：

18、构建模块，用于构建包含多种类别噪声源的训练集；

19、训练模块，用于利用所述训练集对卷积神经网络模型进行多轮步骤的训练和测试，以筛选出至少两个权重及对应的模型；

20、融合模块，用于将筛选出的模型采用模型融合技术进行权重的求和平均，以获得融合模型；

21、分类模块，用于利用所述融合模型进行噪声源分类。

22、在一些可能的实现方式中，所述训练模块包括：

23、初训子模块，用于进行第一轮模型训练，在第一轮模型训练中，设置初始学习率为0.01，采用余弦退火的方式，下限学习率为0.00001，损失函数中各个类别的权重比例均为1，测试全部类别的准确率，记录准确率低于预设值的类别标签；

24、计算子模块，用于根据所述准确率低于预设值的类别标签和识别率计算相应类别标签在损失函数中的权重，若类别标签的准确率与预设值每相差5%，则将所述类别标签在损失函数中的权重提升为原来的2倍；

25、轮训子模块，用于加载上一轮模型训练中的权重，并将步骤s202中计算得到的相应类别标签对应的权重加到损失函数上，设置初始学习率为0.001，采用余弦退火的方式，下限学习率为0.00001，进行下一轮训练，测试全部类别的准确率，再次记录准确率低于预设值的类别标签；

26、循环子模块，用于重复执行计算子模块和轮训子模块以进行n次训练，将整体识别率排名前m的m个权重记录下来，其中，n>m，m≥2。

27、第三方面，提供了一种包含指令的计算机程序产品，当其在计算本文档来自技高网...

【技术保护点】

1.一种基于模型融合的神经网络噪声源分类的方法，其特征在于，包括：

2.根据权利要求1所述的基于模型融合的神经网络噪声源分类的方法，其特征在于，构建包含多种类别噪声源的训练集，包括：

3.根据权利要求1所述的基于模型融合的神经网络噪声源分类的方法，其特征在于，利用所述训练集对卷积神经网络模型进行多轮训练和测试，以筛选出至少两个权重及对应的模型，包括：

4.根据权利要求3所述的基于模型融合的神经网络噪声源分类的方法，其特征在于，若类别标签的准确率与预设值相差不足5%，则按5%处理。

5.根据权利要求1所述的基于模型融合的神经网络噪声源分类的方法，其特征在于，所述卷积神经网络模型依次包括：二维conv层、特征提取模块、二维DepthwiseConv层、mean池化层、二维conv层、池化层、Reshape层、二维conv层和Softmax层，其中，所述特征提取模块包括4个TransitionBlock块和12个NormalBlock块。

6.一种基于模型融合的神经网络噪声源分类的装置，其特征在于，包括：

7.根据

8.一种计算机程序产品，其特征在于，所述计算机程序产品内存储有计算机指令，所述计算机指令被处理器执行时实现权利要求1-5中任一项所述方法。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储用于设备执行的程序代码，该程序代码包括用于执行如权利要求1-5中任一项所述方法的步骤。

10.一种电子设备，其特征在于，所述电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如权利要求1-5中任一项所述方法。

...

【技术特征摘要】

1.一种基于模型融合的神经网络噪声源分类的方法，其特征在于，包括：

2.根据权利要求1所述的基于模型融合的神经网络噪声源分类的方法，其特征在于，构建包含多种类别噪声源的训练集，包括：

4.根据权利要求3所述的基于模型融合的神经网络噪声源分类的方法，其特征在于，若类别标签的准确率与预设值相差不足5%，则按5%处理。

5.根据权利要求1所述的基于模型融合的神经网络噪声源分类的方法，其特征在于，所述卷积神经网络模型依次包括：二维conv层、特征提取模块、二维depthwiseconv层、mean池化层、二维conv层、池化层、reshape层、二维conv层和softmax层，其中...

【专利技术属性】
技术研发人员：纪盟盟，贾洋洋，顾伟伟，谢兆倩，席英伟，马艳丽，
申请(专利权)人：杭州爱华仪器有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人