一种基于混合注意力机制残差网络的滚动轴承故障诊断方法技术

技术编号:38012002 阅读:8 留言:0更新日期:2023-06-30 10:33
本发明专利技术公开了一种基于混合注意力机制残差网络的滚动轴承故障诊断方法,针对滚动轴承故障诊断问题,提出一种基于通道注意力和空间注意力的混合注意力机制模块和ResNet神经网络相结合的诊断方法。首先将滚动轴承振动信号进行二阶同步压缩连续小波变换,转换为三维时频图像。然后将通道注意力模块和空间注意力模块进行串联构成混合注意力模块,将其加入到ResNet神经网络中。最后将加入混合注意力机制的ResNet神经网络对时频图进行特征提取并判定其故障类型。将混合注意力机制和ResNet神经网络相结合,运用到滚动轴承的故障诊断,通过实验表明能够提高ResNet神经网络的特征提取和滚动轴承的故障诊断,具有很好的应用前景。具有很好的应用前景。具有很好的应用前景。

【技术实现步骤摘要】
一种基于混合注意力机制残差网络的滚动轴承故障诊断方法


[0001]本专利技术涉及一种滚动轴承故障检测方法,尤其涉及一种基于混合注意力机制残差网络的滚动轴承故障诊断方法。

技术介绍

[0002]旋转机械是现代工业的重要组成部分,而轴承又是旋转机械的核心部件。大多是在高温、高污染的环境中进行运作,再附加上运作时各种不确定因数的影响导致其工况具有极大的变化性,各种部件在这种变载荷变工况的情况下,极大的提高了发生故障的概率。而滚动轴承在这些系统中承担着传递载荷和支撑载荷的作用,它相对于其他部件的故障率高达40%。滚动轴承发生故障之后将会引发一系列事故,若故障程度较轻,则会造成传动部件所有的零件受到冲击导致损坏而停机,造成经济损失。经济损失的大小则是根据任务的重要性判断,往往每一个任务造成的经济损失都是不可估量的。而故障程度严重时,若未即使更换零件,会导致整个机器设备受到影响。严重时可导致传动部件断裂从而造成极大的安全事故。因此如何对轴承进行故障诊断是非常必要的。
[0003]在故障诊断技术的发展历程中,从传统的基于解析模型和信号处理的诊断方法逐渐发展到现在被广泛使用的数据驱动的故障诊断方法。传统的解析模型的方法随着技术的发展,轴承的结构越来越复杂,构建准确的系统模型也越来越困难,无法保证系统模型的可靠性和精确性,从而很难获得精确的故障诊断结果。传统的知识的故障诊断方法由于其对专家知识的依赖性,故障诊断的准确率取决于专家经验知识的水平高低和丰富程度,所以该方法通用性比较差。
[0004]随着计算机技术和传感器技术的发展,收集到的机械设备运行状态的数据也越来越丰富,为智能化故障诊断技术开辟了一条新路径,尤其是神经网络技术,能够自动地学习数据之间的相关性,实现端到端的智能化故障诊断,该方法主要由信号获得、信号特征提取和故障诊断三个环节,其中信号特征提取是最重要环节。虽然许多传统机器学习和深度学习方法已能够完成滚动轴承故障诊断任务,但是仍然存在一些不足:(1)传统时频分析方法如小波分析、短时傅里叶变换等在分析非平稳信号时,时频图模糊,信号表征差,神经网络学习效果不佳,故障诊断准确度不高。(2)在小样本下神经网络模型随着层数的提高,会出现模型退化和过拟合的问题。(3)实际生产中仍迫切需要更高精度、更佳稳定性的滚动轴承故障诊断方法,以期最大限度降低故障造成的各种损失。(4)信号中对应于故障的特征频率成分与干扰分布在不同的信号尺度中,且工况变化会改变这种分布,因此不同尺度下的信息对故障诊断的价值并不等同。现有技术未能充分考虑到不同尺度间信息的差异,极易受到无关和冗余信息的干扰。

技术实现思路

[0005]专利技术目的:针对以上问题,本专利技术提出一种基于混合注意力机制残差网络的滚动轴承故障诊断方法,能够抑制模型退化,避免模型过拟合,提升轴承故障诊断的诊断效率、
精度和稳定性。
[0006]技术方案:本专利技术所采用的技术方案是一种基于混合注意力机制残差网络的滚动轴承故障诊断方法,包括以下步骤:
[0007]步骤1:将滚动轴承的振动信号通过二阶同步压缩连续小波变换转化成深度学习模型易处理的三维时频图像;
[0008]步骤2:按照比例将时频图像分成训练集和测试集。为能够帮助网络更加高效和准确的收敛,将图像进行归一化预处理。
[0009]步骤3:初始化网络及学习参数,将训练集的图片输入基于混合注意力机制模块的残差网络中进行训练;所述基于混合注意力机制模块的残差网络针对二阶同步压缩连续小波变换设计,其结构为:残差块结构和输出端加法器之间设有混合注意力机制模块;所述混合注意力机制模块包括串联的空间注意力机制模块和通道注意力机制模块;
[0010]训练过程包括:正向计算各节点网络预测输出,使用交叉熵函数计算网络预测值和目标值的损失,通过反向传播求取权重和偏置的梯度,更新权重和偏置;参数更新后,继续从输入层开始,利用新的参数正向传递计算损失,经若干次循环,以损失最小化对应的权重W和偏置b作为最佳参数;
[0011]步骤4,使用训练中正确率最高的模型对测试集进行验证,验证后作为滚动轴承故障诊断模型。
[0012]步骤1中采用二阶同步压缩连续小波变换(WSST2)将原始振动信号转换为三维时频图,信号x(t)在WSST2被定义为:
[0013][0014]式中,为振动信号x(t)的二阶同步压缩连续小波变换信号,表示正实数域,W
x
(a,b)为在母小波ψ(t)下二阶同步压缩连续小波变换频域表示,δ(*)为狄拉克函数,是振动信号x(t)二阶瞬时频率估计,其中是在母小波ψ1=tψ(t)下连续小波变换频域表示,是在母小波ψ1=tψ(t)下连续小波变换频域表示,Re(*)表示取实部,a是连续小波变换尺度,b是平移因子,ξ是频率变量。
[0015]步骤2中考虑输入数据的范围为0~1或者

1~1时,神经网络表现出最佳的训练性能,所以对输入数据进行归一化。本专利技术采用方法是均值标准差归一化,计算输入数据的均值和标准差,并对其进行缩放,使每个通道的均值为0,标准差为1,公式为:
[0016]x
scale=(x

μ)/S
[0017]其中x为要归一化的值,x
scale
为归一化之后的值。μ为样本的平均值,S为样本的标准差。
[0018]步骤3中网络中加入混合注意力机制模块,该模块是由是空间注意力机制和通道注意力机制的模块组合,此方法能够同时捕捉图像的通道维度和空间维度中的全局特征依赖关系,从而能够实现更精确的特征提取。其中,通道注意力捕捉特征图为卷积输出F(F∈R
C*H*W
,C为特征图的通道数,H为特征图的高,W为特征图的宽)。将特征图F加上通道注意力,
点乘特征图F得到特征图F。将特征图F

加上空间注意力,点成特征图F

得到特征图F”。(如图2所示)。具体过程如下式(2)和(3)所示:
[0019][0020][0021]其中,表示矩阵点成运算,M
C
(F)为通达注意力模块的系数,M
C
(F)∈R
C*1*1
,M
s
(F

)为空间注意力模块的系数,M
s
(F

)∈R
1*H*W

[0022]其中,
[0023][0024][0025]其中,σ是Sigmoid函数,为特征图F全局池化、最大池化得到的C*1*1的特征图,即W0、W1为多层感知机MLP的权重,对于和两个输入都是共享的,f
7*7
是一个7*7的卷积,为特征图F全局池化、最大池化得到的1*H*W的特征图,即
[0026]步骤3中网络使用混合注意力机制模块的残差网络。随着深度卷积神经网络层数的增加,会出现梯度消失或爆炸现象,残差网络(ResNet)是采用了恒等路径来减轻参数优化的难度能提取本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于混合注意力机制残差网络的滚动轴承故障诊断方法,其特征在于,包括以下步骤:步骤1,将滚动轴承的振动信号通过二阶同步压缩连续小波变换转化成三维时频图像;步骤2,将时频图像分成训练集和测试集,并进行归一化预处理;步骤3,初始化网络及学习参数,将训练集的图片输入基于混合注意力机制模块的残差网络中进行训练;所述基于混合注意力机制模块的残差网络针对二阶同步压缩连续小波变换设计,其结构为:残差块结构和输出端加法器之间设有混合注意力机制模块;所述混合注意力机制模块包括串联的空间注意力机制模块和通道注意力机制模块;训练过程包括:正向计算各节点网络预测输出,使用交叉熵函数计算网络预测值和目标值的损失,通过反向传播求取权重和偏置的梯度,更新权重和偏置;参数更新后,继续从输入层开始,利用新的参数正向传递计算损失,经若干次循环,以损失最小化对应的权重W和偏置b作为最佳参数;步骤4,使用训练中正确率最高的模型对测试集进行验证,验证后作为滚动轴承故障诊断模型。2.根据权利要求1所述的基于混合注意力机制残差网络的滚动轴承故障诊断方法,其特征在于:采用二阶同步压缩连续小波变换将原始振动信号转换为三维时频图:式中,为振动信号x(t)的二阶同步压缩连续小波变换信号,表示正实数域,W
x
(a,b)为在母小波ψ(t)下二阶同步压缩连续小波变换频域表示,δ(*)为狄拉克函数,是振动信号x(t)二阶瞬时频率估计,其中是在母小波ψ1=tψ(t)下连续小波变换频域表示,是在母小波ψ1=tψ(t)下连续小波变换频域表示,Re(*)表示取实部,a是连续小波变换尺度,b是平移因子,ξ是频率变量。3.根据权利要求1所述的基于混合注...

【专利技术属性】
技术研发人员:张永林徐倩楠苏金龙缪睿
申请(专利权)人:江苏科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1