System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于多感受野的神经网络的异音检测方法及系统技术方案_技高网

一种基于多感受野的神经网络的异音检测方法及系统技术方案

技术编号:43619223 阅读:5 留言:0更新日期:2024-12-11 15:00
本发明专利技术提供一种基于多感受野的神经网络的异音检测方法及系统,涉及工业智能诊断与质量控制技术领域,该方法包括步骤采集工业设备在各种工作状态下的音频信号数据,并对采集的音频信号数据进行标注;基于标注好的数据构建数据集并划分;对数据集中的音频信号进行预处理,从预处理后的音频信号中提取梅尔频谱特征;将梅尔频谱特征输入到提前构建好的异音检测模型中进行训练,得到训练好的异音检测模型;将待测音频信号样本输入到训练好的异音检测模型中进行预测,得到预测结果,并依据预测结果对工业设备进行分类。本发明专利技术能够动态捕捉多尺度音频特征,并通过丰富的特征表示能力显著提高异音检测的准确性和鲁棒性。

【技术实现步骤摘要】

本专利技术涉及工业智能诊断与质量控制,尤其涉及一种基于多感受野的神经网络的异音检测方法及系统


技术介绍

1、随着工业领域对声音信号分析的需求日益增长,传统的异音检测方法,如基于统计分析、傅里叶变换及谱分析的技术,在一定程度上已无法满足复杂声学环境下的检测要求。这些传统方法通常依赖于手工设计的特征,且在面对非平稳和复杂噪声背景时,表现出检测精度不足的问题。此外,这些方法往往需要大量的领域知识和经验,难以在不熟悉特定应用场景的情况下取得理想的检测效果。

2、近年来,基于深度学习的技术迅速发展,尤其是在计算机视觉、自然语言处理等领域取得了显著成效,深度学习提供了新的数据表示,自动提取特征,包括非线性结构。异音检测作为一种典型的分类问题,已开始引入深度学习的方法进行改进。尽管深度学习技术在异音检测中展示了巨大的潜力,但其性能往往受到特征提取模块的影响,尤其是在处理复杂且多样化的数据时。不同的音频特征可能具有不同的时间尺度和频率特征。传统的卷积神经网络(cnn)通常使用固定大小的感受野,这可能无法充分捕捉异音中涉及的多尺度特征,同时,传统的神经网络使用标量来表示特征,往往会忽略样本的结构信息(如位置、方向、大小等)。

3、因此,亟需一种特征提取精确性高、鲁棒性强的异音检测方法。


技术实现思路

1、为此,本专利技术实施例提供了一种基于多感受野的神经网络的异音检测方法及系统,用于解决现有技术中传统异音检测方法精度不足,且深度学习技术在处理复杂异音数据时特征提取受限的问题

2、为了解决上述问题,本专利技术实施例提供一种基于多感受野的神经网络的异音检测方法,该方法包括:

3、步骤s1:采集工业设备在各种工作状态下的音频信号数据,涵盖工业设备在正常和异常运行条件下的音频信号,并对采集的音频信号数据进行标注;

4、步骤s2:基于标注好的数据构建数据集,并将数据集划分为训练集和验证集;

5、步骤s3:对数据集中的音频信号进行预处理,从预处理后的音频信号中提取梅尔频谱特征;

6、步骤s4:将梅尔频谱特征输入到提前构建好的异音检测模型中进行训练,得到训练好的异音检测模型,具体包括:

7、将梅尔频谱特征输入到提前构建好的异音检测模型中,首先通过卷积神经网络提取初级特征,再利用选择性卷积核网络模块进行多尺度特征提取与融合,接着通过特征降维与软注意力机制实现特征的自适应选择,最后通过胶囊网络模块完成分类任务;

8、在训练过程中,使用五折交叉验证对异音检测模型的性能进行评估,优化其参数,最终得到训练好的异音检测模型;

9、步骤s5:将待测音频信号样本输入到训练好的异音检测模型中进行预测,得到预测结果,并依据预测结果对工业设备进行分类。

10、优选地,所述对数据集中的音频信号预处理的方法,包括去除背景噪声和归一化处理。

11、优选地,所述从预处理后的音频信号中提取梅尔频谱特征的方法为:

12、将连续的音频信号分割成多个短时帧,对每一帧信号进行加窗处理;

13、对每一帧加窗后的信号进行快速傅里叶变换,将时间域信号转换为频率域信号,得到该帧的频谱表示;

14、对快速傅里叶变换得到的频谱进行平方运算,计算每个频率分量的功率谱;

15、将功率谱通过一组梅尔滤波器进行处理;

16、对梅尔滤波器组输出的能量进行对数运算,得到对数能量谱。

17、优选地,所述将梅尔频谱特征输入到提前构建好的异音检测模型中进行训练,得到训练好的异音检测模型的方法为:

18、将连续的音频信号分割成多个短时帧,对每一帧信号进行加窗处理;

19、对每一帧加窗后的信号进行快速傅里叶变换,将时间域信号转换为频率域信号,得到该帧的频谱表示;

20、对快速傅里叶变换得到的频谱进行平方运算,计算每个频率分量的功率谱;

21、将功率谱通过一组梅尔滤波器进行处理;

22、对梅尔滤波器组输出的能量进行对数运算,得到对数能量谱。

23、优选地,所述通过卷积神经网络提取初级特征的方法为:

24、使用一层卷积神经网络对梅尔频谱特征进行初步处理,得到初级特征,,其中h、c、w分别代表特征的高度、通道数和宽度,代表实数集。

25、优选地,所述利用选择性卷积核网络模块进行多尺度特征提取与融合的方法为:

26、使用不同大小的卷积核和relu激活函数,对初级特征进行多尺度特征提取,得到不同的特征映射和,,;

27、将特征映射和进行融合,得到综合特征;

28、对融合后的综合特征进行全局平均池化操作,得到全局特征表示。

29、优选地,所述通过特征降维与软注意力机制实现特征的自适应选择的方法为:

30、通过全连接层对全局特征表示进行降维,得到压缩后的特征向量,其中为压缩向量的长度;

31、利用压缩后的特征向量引导跨通道的软注意力机制,自适应地调整对不同空间尺度信息的关注程度,得到软注意力向量和;

32、根据软注意力向量和,对和进行加权融合,得到张量特征。

33、优选地,所述通过胶囊网络模块完成分类任务的方法为:

34、将张量特征转换为向量特征,并封装为初级胶囊单元;

35、利用动态路由机制对初级胶囊单元进行聚合,生成分类概率向量,其中向量的模长表示某个类别的概率;

36、通过反向传播更新胶囊单元内的权重参数,直至权重参数固定,完成整个网络模型的训练。

37、优选地,所述动态路由机制具体包括:

38、每个初级胶囊单元  是一个向量,表示输入数据中局部特征的不同属性;

39、对于每个初级胶囊单元 和每个目标胶囊单元 ,计算预测向量 ;

40、将路由系数 初始化为相等的值,表示初级胶囊单元  和目标胶囊单元 之间的连接强度;

41、根据路由系数 和预测向量 ,计算目标胶囊单元的输入;

42、对目标胶囊单元的输入应用 squash 激活函数,得到目标胶囊单元的输出 ;

43、根据目标胶囊单元的输出 和预测向量 之间的内积,更新路由系数。

44、优选地,在训练网络时,异音检测模型的损失包括重建损失和边际损失,其中重建损失,是由三层全连接层根据  重建得到的梅尔频谱特征和原始的梅尔频谱特征计算得出,具体损失如下:

45、;

46、其中,为边际损失; 为重建损失,为损失系数。

47、本专利技术实施例还提供了一种基于多感受野的神经网络的异音检测系统,该系统用于实现上述所述的基于多感受野的神经网络的异音检测方法,具体包括:

48、音频信号采集模块,用于采集工业设备在各种工作状态下的音频信号数据,涵盖工业设备在正常和异常运行条件下的音频信号,并对采集的音频信号数据进行标注;...

【技术保护点】

1.一种基于多感受野的神经网络的异音检测方法,其特征在于,包括:

2.根据权利要求1所述的基于多感受野的神经网络的异音检测方法,其特征在于,所述对数据集中的音频信号预处理的方法,包括去除背景噪声和归一化处理。

3.根据权利要求1所述的基于多感受野的神经网络的异音检测方法,其特征在于,所述从预处理后的音频信号中提取梅尔频谱特征的方法为:

4. 根据权利要求1所述的基于多感受野的神经网络的异音检测方法,其特征在于, 所述通过卷积神经网络提取初级特征的方法为:

5.根据权利要求4所述的基于多感受野的神经网络的异音检测方法,其特征在于,所述利用选择性卷积核网络模块进行多尺度特征提取与融合的方法为:

6.根据权利要求5所述的基于多感受野的神经网络的异音检测方法,其特征在于,所述通过特征降维与软注意力机制实现特征的自适应选择的方法为:

7.根据权利要求6所述的基于多感受野的神经网络的异音检测方法,其特征在于,所述通过胶囊网络模块完成分类任务的方法为:

8.根据权利要求7所述的基于多感受野的神经网络的异音检测方法,其特征在于,所述动态路由机制具体包括:

9. 根据权利要求8所述的基于多感受野的神经网络的异音检测方法,其特征在于,在训练网络时,异音检测模型的损失包括重建损失和边际损失,其中重建损失,是由三层全连接层根据  重建得到的梅尔频谱特征和原始的梅尔频谱特征计算得出,具体损失如下:

10.一种基于多感受野的神经网络的异音检测系统,其特征在于,所述系统用于实现权利要求1至9任意一项所述的基于多感受野的神经网络的异音检测方法,具体包括:

...

【技术特征摘要】

1.一种基于多感受野的神经网络的异音检测方法,其特征在于,包括:

2.根据权利要求1所述的基于多感受野的神经网络的异音检测方法,其特征在于,所述对数据集中的音频信号预处理的方法,包括去除背景噪声和归一化处理。

3.根据权利要求1所述的基于多感受野的神经网络的异音检测方法,其特征在于,所述从预处理后的音频信号中提取梅尔频谱特征的方法为:

4. 根据权利要求1所述的基于多感受野的神经网络的异音检测方法,其特征在于, 所述通过卷积神经网络提取初级特征的方法为:

5.根据权利要求4所述的基于多感受野的神经网络的异音检测方法,其特征在于,所述利用选择性卷积核网络模块进行多尺度特征提取与融合的方法为:

6.根据权利要求5所述的基于多感受野的神经网络的异音检测方法,其特征...

【专利技术属性】
技术研发人员:于银虎周良宏
申请(专利权)人:中科声玄苏州科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1