一种基于双向注意力生成对抗网络的故障诊断方法及应用技术

技术编号:32963401 阅读:74 留言:0更新日期:2022-04-09 10:57
本发明专利技术公开了一种基于双向注意力生成对抗网络的故障诊断方法及应用。所述方法具体如下:采集正常状态及故障状态下的振动加速度信号,将振动加速度信号截取成多个正常样本和故障样本;划分第一训练集与测试集;构建双向注意力生成对抗网络模型;采用第一训练集对双向注意力生成对抗网络模型进行训练;使用训练好的双向注意力生成对抗网络模型,生成额外的故障样本,组成第二训练集;搭建故障分类模型,并采用第二训练集训练故障分类模型;将测试集中的样本输入到训练好的故障分类模型中进行测试,得到最终诊断结果。本发明专利技术能够使用所发明专利技术的网络模型生成高质量的故障数据,从而平衡原始的训练集,并提高故障诊断的精度。并提高故障诊断的精度。并提高故障诊断的精度。

【技术实现步骤摘要】
一种基于双向注意力生成对抗网络的故障诊断方法及应用


[0001]本专利技术涉及机械故障诊断领域,具体涉及一种基于双向注意力生成对抗网络的故障诊断方法及应用。

技术介绍

[0002]轴承和齿轮是一种常见的通用零部件,在工程机械、精密机床、轨道交通等的机械设备中扮演者重要的角色。在设备的运行时,这些零部件往往会在力与载荷的作用下而发生磨损、裂纹、剥落等故障,一旦发生故障且未能及时处理,将造成巨大的经济损失,甚至是人员伤亡。因此对旋转设备零部件的健康状态进行监测和诊断具有重要的意义。
[0003]随着人工智能技术的不断发展,一些基于深度学习的技术被逐渐应用到故障诊断领域并取得了良好的效果。这些基于深度学习的故障诊断技术可以直接从收集到的历史数据中提取特征,然后对提取到的特征进行分类,以识别设备的健康状态。基于深度学习的故障诊断技术得以取得较优成绩的前提是拥有大量的高质量训练数据。然而,受设备工作环境的影响及数据采集条件的限制,实际上,采集到的正常数据的数量往往是充足的,而故障数据的数量却是很少的。这种数据不平衡的现象在当前故障诊断领域是一个亟待解决的问题。在训练数据不平衡的情况下,基于深度学习故障诊断方法的性能将会显著退化。
[0004]生成对抗网络具有良好的数据生成能力。针对故障样本量小、数据不平衡的问题,生成对抗网络在故障诊断领域同样被得到了广泛的应用。首先使用有限的故障样本训练一个生成对抗网络模型,然后使用训练好的网络模型生成大量的故障样本。这些生成的样本可以扩充原有故障数据,使原来不平衡的训练集得以重新平衡。
[0005]在专利技术专利一种面向小样本特征的基于改进生成对抗网络的故障诊断方法 (朱晓荣,曹家明,池德盛,陈雨萱,沈雍钧,田忆军,庄益康,史坤.一种面向小样本特征的基于改进生成对抗网络的故障诊断方法:中国,CN 112039687 A[P]. 2020

12

04.)中,专利技术人公开了一种生成对抗神经网络和卷积神经网络相结合的故障诊断方法。在所提出的生成对抗网络模型中,其生成器和判别器大多是采用的反卷积和卷积结构。这就限制了生成对抗网络从全局的角度捕捉原始振动信号的特征,从而导致生成的振动信号缺乏全局性信息,不能生成更为有效的故障样本,而这又进一步限制了基于生成对抗网络样本扩充方法的诊断精度。

技术实现思路

[0006]为了解决现有技术存在的问题,本专利技术提供一种基于双向注意力生成对抗网络的故障诊断方法及应用,所述方法通过生成对抗网络捕捉原始数据的特征分布并生成相关的数据,并利用双向注意力模型,将生成对抗网络能够强化故障相关的区域特征同时能够有选择性的融合不同通道的特征。通过本专利技术,可以生成振动信号样本并进一步改善生成样本的质量,从而提高故障诊断模型对装备健康状态进行监测和诊断的准确性和实用性。
[0007]本专利技术采用以下技术方案来实现:
[0008]一种基于双向注意力生成对抗网络的故障诊断方法,包括以下步骤:
[0009]S1、数据的采集与标定,分别从旋转设备上采集正常状态下的振动加速度信号及故障状态下的振动加速度信号,将采集到的正常状态下和故障状态下的振动加速度信号分别截取成多个正常样本和故障样本;
[0010]S2、将步骤S1中获取的多个正常样本和故障样本划分为第一训练集与测试集;
[0011]S3、构建双向注意力生成对抗网络模型;
[0012]S4、采用第一训练集对双向注意力生成对抗网络模型进行训练;
[0013]S5、使用已经训练好的双向注意力生成对抗网络模型,生成额外的故障样本,并将额外的故障样本与第一训练集中的故障样本混合在一起形成一个新的样本集,将新的样本集与正常样本共同组成一个平衡的第二训练集;
[0014]S6、搭建故障分类模型,并采用第二训练集训练故障分类模型,得到训练好的故障分类模型;
[0015]S7、将测试集中的样本输入到训练好的故障分类模型中进行测试,得到最终诊断结果。
[0016]进一步地,步骤S1中,使用加速度传感器收集振动加速度信号,划分样本时,每个样本包括的样本点数不少于每个周期的采样点数,样本点数为2的幂次方,样本的标签为采集该样本时设备的健康状态。
[0017]进一步地,步骤S2中,在第一训练集中,正常样本的数量与故障样本的数据不等,故障样本的数量由不平衡比例(IR,Imbalanceratio,即:正常样本数量与故障样本数量之比)决定,在测试集中,正常样本的数量和故障样本的数量相同;
[0018]所述不平衡比例在实际应用是指现场中收集到的正常样本数量与故障样本数量的比例;在模拟实验中是指人为划定的正常样本数量与故障样本数量之比,故障样本数量=正常样本数量/不平衡比例。
[0019]进一步地,步骤S3中,在PyTorch框架下,首先构建双向注意力模型,同时,针对振动加速度信号为一维数据的特点搭建适用于一维振动加速度信号的生成对抗网络,并将双向注意力模型嵌入到生成对抗网络中;
[0020]所述双向注意力模型包括时序注意力模型和通道注意力模型;
[0021]所述适用于一维振动加速度信号的生成对抗网络包括一维反卷积的第一生成器和一维卷积的第一判别器,具体如下:
[0022]一维反卷积的第一生成器:将一个256
×
8维的噪声直接通过4个连续的反卷积层,输出生成的故障样本;
[0023]一维卷积的第一判别器:将第一生成器生成的故障样本或第一训练集中真实的故障样本,直接输入到4个连续的卷积层,输出相应的真实性标签,即0 或1,其中0表示生成的故障样本,1表示真实的故障样本。
[0024]进一步地,所述时序注意力模型包括两个卷积层和一个softmax(
·
)函数;时序注意力模型通过两个特征映射元素间的乘积与元素求和操作得到最终的特征映射,时序注意力模型的构建具体包括以下步骤:
[0025]S3.1.1、将一个N
×
1维的特征向量X
tam
同时输入到两个1
×
1维的卷积层中并分别得到相应的第一特征映射P
tam
和第二特征映射Q
tam
,其中第一特征映射P
tam
作为时序注意力
模型提取到的初级特征映射,而第二特征映射Q
tam
用于计算注意力权重值;
[0026]S3.1.2、将第二特征映射Q
tam
输入至softmax(
·
)函数中,得到一个N
×
1维的注意力权重向量S
tam
,且S
tam
中所有元素之和为1,具体如下:
[0027][0028]其中,为S
tam
中的第i个元素,是Q
tam
中的第i个元素;exp(
·
)表示以自然常数e为底的指数函数;
[0029]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于双向注意力生成对抗网络的故障诊断方法,其特征在于,包括以下步骤:S1、数据的采集与标定,分别从旋转设备上采集正常状态下的振动加速度信号及故障状态下的振动加速度信号,将采集到的正常状态下和故障状态下的振动加速度信号分别截取成多个正常样本和故障样本;S2、将步骤S1中获取的多个正常样本和故障样本划分为第一训练集与测试集;S3、构建双向注意力生成对抗网络模型;S4、采用第一训练集对双向注意力生成对抗网络模型进行训练;S5、使用已经训练好的双向注意力生成对抗网络模型,生成额外的故障样本,并将额外的故障样本与第一训练集中的故障样本混合在一起形成一个新的样本集,将新的样本集与正常样本共同组成一个第二训练集;S6、搭建故障分类模型,并采用第二训练集训练故障分类模型,得到训练好的故障分类模型;S7、将测试集中的样本输入到训练好的故障分类模型中进行测试,得到最终诊断结果。2.根据权利要求1所述的一种基于双向注意力生成对抗网络的故障诊断方法,其特征在于,步骤S1中,使用加速度传感器收集振动加速度信号,划分样本时,每个样本包括的样本点数不少于每个周期的采样点数,样本点数为2的幂次方,样本的标签为采集该样本时设备的健康状态;步骤S2中,在第一训练集中,正常样本的数量与故障样本的数据不等,故障样本的数量由不平衡比例决定,在测试集中,正常样本的数量和故障样本的数量相同;所述不平衡比例在实际应用是指现场中收集到的正常样本数量与故障样本数量的比例,在模拟实验中是指人为划定的正常样本数量与故障样本数量之比;故障样本数量=正常样本数量/不平衡比例。3.根据权利要求1所述的一种基于双向注意力生成对抗网络的故障诊断方法,其特征在于,步骤S3中,在PyTorch框架下,首先构建双向注意力模型,同时,针对振动加速度信号为一维数据的特点搭建适用于一维振动加速度信号的生成对抗网络,并将双向注意力模型嵌入到生成对抗网络中;所述双向注意力模型包括时序注意力模型和通道注意力模型;所述适用于一维振动加速度信号的生成对抗网络包括一维反卷积的第一生成器和一维卷积的第一判别器,具体如下:一维反卷积的第一生成器:将一个256
×
8维的噪声直接通过4个连续的反卷积层,输出生成的故障样本;一维卷积的第一判别器:将第一生成器生成的故障样本或第一训练集中真实的故障样本,直接输入到4个连续的卷积层,输出相应的真实性标签,即0或1,其中0表示生成的故障样本,1表示真实的故障样本。4.根据权利要求3所述的一种基于双向注意力生成对抗网络的故障诊断方法,其特征在于,所述时序注意力模型包括两个卷积层和一个softmax(
·
)函数;时序注意力模型通过两个特征映射元素间的乘积与元素求和操作得到最终的特征映射,时序注意力模型的构建具体包括以下步骤:S3.1.1、将一个N
×
1维的特征向量X
tam
同时输入到两个1
×
1维的卷积层中并分别得到
相应的第一特征映射P
tam
和第二特征映射Q
tam
,其中第一特征映射P
tam
作为时序注意力模型提取到的初级特征映射,而第二特征映射Q
tam
用于计算注意力权重值;S3.1.2、将第二特征映射Q
tam
输入至softmax(
·
)函数中,得到一个N
×
1维的注意力权重向量S
tam
,且S
tam
中所有元素之和为1,具体如下:其中,为S
tam
中的第i个元素,是Q
tam
中的第i个元素;exp(
·
)表示以自然常数e为底的指数函数;S3.1.3、在注意力权重向量S
tam
和第一特征映射P
tam
间做哈达玛乘积,进而得到时序注意力特征映射T
tam
,具体如下:其中,是T
tam
中的第i个元素值;S3.1.4、在T
tam
和X
tam
之间使用一个残差连接,时序注意力模型的输出Y
tam
表示为:其中,y
tami
是Y
tam
中第i个位置的响应值,λ是尺度缩放因子,通过网络训练得到。5.根据权利要求3所述的一种基于双向注意力生成对抗网络的故障诊断方法,其特征在于,所述通道注意力模型包括一个卷积层和一个softmax(
·
)函数;通道注意力模型通过对特征映射的转置操作及特征映射元素间的乘积操作得到最终的特征表示,通道注意力模型的构建具体包括以下步骤:S3.2.1、将一个1
×
N
×
C维的输入向量X
cam
通过转置操作转换为一个1
×
C
×

【专利技术属性】
技术研发人员:李巍华王汝艮陈祝云张绍辉
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1