一种基于Feature-levelSMOTE的复杂装备不均衡故障诊断方法技术

技术编号:36382594 阅读:47 留言:0更新日期:2023-01-18 09:44
本申请提供了一种基于Feature

【技术实现步骤摘要】
一种基于Feature

level SMOTE的复杂装备不均衡故障诊断方法


[0001]本申请属于复杂装备不均衡故障诊断方法
,更具体地说,是涉及一种基于Feature

level SMOTE的复杂装备不均衡故障诊断方法。

技术介绍

[0002]复杂装备长期在高温、高压、高速旋转以及高强度振动等异常恶劣的环境下工作,其部件将不可避免地遇到性能衰退甚至故障,这增加了工程事故发生的概率。以飞机的核心子系统——航空发动机为例,其可靠性直接影响着飞机的飞行安全。发动机的早期故障诊断是避免重大的飞行事故的重要途径,也就是说,如果可以及时诊断出发动机的故障,则可以通过维修来确保发动机的安全运行,并且还可以节约维修成本。因此,对发动机进行实时的故障诊断成为发动机健康管理中重要的措施之一。
[0003]发动机的故障诊断方法主要分为三类:基于物理模型的方法、基于传统机器学习的方法以及基于深度学习的方法。一方面,基于物理模型的方法需要建立一个精确的物理模型去描述发动机的运行状态,然而复杂设备的损伤传播过程和动态响应非常复杂,这将导致整个建模过程会非常艰巨。另一方面,基于传统机器学习的方法则需要工程师手工选择监控数据的统计特征,如果选择的特征不能很好地表征发动机的健康状态,那么这个方法就会面临失效的风险。相反地,基于深度学习的方法可以从监测数据中自动学习丰富且有用的特征,然后使用这些特征来推断发动机的健康状态,既不需要复杂的建模过程,又不需要工程师专门地选择特征,这使得故障诊断过程更加直接。
[0004]然而,直接使用传统的深度学习方法对发动机进行故障诊断仍将面临以下挑战:(1)类间不均衡训练集中正常样本的数目远远多于故障样本的数目,这导致度模型在训练的过程中即使无法正确地诊断故障样本但依然可以获得非常高的分类精度。例如,如果数据集的不均衡率为99:1,那么即使深度神经网络将所有训练样本都诊断为正常样本,那么模型的分类精度依然高达99%。(2) 类间混叠如图1(a)所示,正常样本与故障样本相互混叠。并且在混叠的区域,正常样本的概率密度甚至高于故障样本的概率密度,这给分类器的学习带来了极大挑战。因为在这种情况下,传统的分类模型更倾向于将故障样本诊断为正常样本,这是一个非常糟糕的诊断结果。因此,申请的重要任务就是平衡数据集和降低类间混叠。
[0005]迄今为止,重采样依然是解决不均衡分类问题的重要方法,主要被分为两类:降采样技术和过采样技术。降采样技术通过移除多数类样本的方式来平衡各类样本的数目,而这种移除的策略容易造成有用信息的损失。针对信息损失的问题,许多改进的降采样技术有选择而非随机地移除多数类样本,例如 Neighborhood Cleaning Rule,Tomek Link,One

Sided Selection, Clustering

based Downsampling,and NB

based Downsampling,虽然都尽力避免移除有代表性的多数类样本,但是依然无法避免有用信息的损失。
[0006]过采样技术是通过增加少数类样本而不是移除多数类样本的方式来平衡样本数
量,可以有效地避免信息的损失。最简单的随机过采样技术是通过随机复制少数类样本的方式来平衡各类样本的数目,而这种随机复制的策略容易造成分类器的过拟合问题。流行的SMOTE算法通过生成而非随机复制的方式来扩增少数类样本,可以在一定程度上缓解分类器的过拟合问题。并且针对SMOTE算法没有考虑多数类样本分布而有可能引入噪声样本的不足,近年来出现了许多改进的SMOTE算法来提高生成样本的质量,包括Borderline

SMOTE,SVM

SMOTE, and KMeans

SMOTE等。但是,在多数类样本和少数类样本相互混叠的情况下, SMOTE算法及其变体将会进一步增加两者之间的混叠程度,这会给分类器的学习带来了极大的挑战。
[0007]以SMOTE算法为例,SMOTE算法通过在原始空间中的相邻少数类样本的连线上随机采样来生成故障样本。生成样本的加入使得样本分布有可能变为如图 1(b)所示,这显然好于如图1(a)所示的样本分布。因为此时在混叠区域的中心位置,故障样本的概率密度高于正常样本的概率密度,这些故障可以被诊断出来。
[0008]然而,在原始空间中直接进行数据增强面依然存在不足。一方面,如图1(b) 所示,在混叠区域的中心位置,正常样本面临着被诊断为故障样本的风险。也就是说,对故障样本的准确率的提升是以牺牲正常样本的准确率为代价的。另一方面,在混叠区域的边缘位置,故障样本的概率密度低于正常样本的概率密度,依然倾向于被传统的分类模型错误地诊断为正常样本。而本申请采用DSGRU 将原始数据映射到特征空间,在特征空间中正常样本与故障样本相互远离,如图1(c)所示。然后,在特征空间中采用SMOTE进行数据增强,以平衡故障样本与正常样本的数目,如图1(d)所示。

技术实现思路

[0009]为实现上述目的,本申请采用的技术方案是:提供一种基于Feature

level SMOTE的复杂装备不均衡故障诊断方法,通过将样本映射到嵌入式空间,并在嵌入式空间内采用MLP对样本进行故障诊断。
[0010]可选地,包括训练过程,所述训练过程包括以下步骤:
[0011]步骤一:数据处理,得到故障特征参数;
[0012]步骤二:训练过程空间映射,采用DSGRU实现空间映射,将混叠的样本映射到嵌入式空间中,在嵌入式空间中降低正常样本和故障样本之间的混叠程度;
[0013]步骤三:数据增强,采用SMOTE算法对故障样本进行数据增强,平衡各类型样本之间的数目差异;在正常样本和故障样本的嵌入式空间中,使用SMOTE 算法生成属于少数类的故障样本,并与原来的正常样本一起组成均衡的数据集;
[0014]步骤四:训练过程故障分类,采用MLP对嵌入式空间中进行了数据增强后的样本进行故障诊断,构建样本嵌入式表示与标签之间的映射,对辨识故障。
[0015]可选的,步骤二中,DSGRU包括特征提取模块和损失计算模块,训练过程空间映射选用GRU网络作为孪生神经网络的特征提取模块,GRU网络包括2个 GRU层和1个全连接层,GRU层包括多个GRU单元;
[0016]GRU单元的计算函数如下所示:
[0017][0018][0019][0020][0021]可选的,损失计算模块采用对比损失来训练孪生神经网络的权重,对比损失定义如下:
[0022][0023]可选的,当最小化对比损失L
sia
时,若和属于相同类型的样本 (y
k
=1),对比损失的第k项趋向于越来越小,和越来越接近;反之,和属于不同类型的样本(y
k
=0),则趋向于越来越小,即越来越大,但不会超过d,和越本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于Feature

level SMOTE的复杂装备不均衡故障诊断方法,其特征在于:通过将样本映射到嵌入式空间,并在嵌入式空间内采用MLP对样本进行故障诊断。2.如权利要求1所述的基于Feature

level SMOTE的复杂装备不均衡故障诊断方法,其特征在于:包括训练过程,所述训练过程包括以下步骤:步骤一:数据处理,得到故障特征参数;步骤二:训练过程空间映射,采用DSGRU实现空间映射,将混叠的样本映射到嵌入式空间中,在嵌入式空间中降低正常样本和故障样本之间的混叠程度;步骤三:数据增强,采用SMOTE算法对故障样本进行数据增强,平衡各类型样本之间的数目差异;在正常样本和故障样本的嵌入式空间中,使用SMOTE算法生成属于少数类的故障样本,并与原来的正常样本一起组成均衡的数据集;步骤四:训练过程故障分类,采用MLP对嵌入式空间中进行了数据增强后的样本进行故障诊断,构建样本嵌入式表示与标签之间的映射,对辨识故障。3.如权利要求2所述的基于Feature

level SMOTE的复杂装备不均衡故障诊断方法,其特征在于:步骤二中,DSGRU包括特征提取模块和损失计算模块,训练过程空间映射选用GRU网络作为孪生神经网络的特征提取模块,GRU网络包括2个GRU层和1个全连接层,GRU层包括多个GRU单元;GRU单元的计算函数如下所示:GRU单元的计算函数如下所示:GRU单元的计算函数如下所示:GRU单元的计算函数如下所示:4.如权利要求3所述的基于Feature

level SMOTE的复杂装备不均衡故障诊断方法,其特征在于:损失计算模块采用对比损失来训练孪生神经网络的权重,对比损失定义如下:5.如权利要求4所述的基于Feature

level SMOTE的复杂装备不均衡故障诊断方法,其特征在于:当最小化对比损失L
sia
时,若和属于相同类型的样本(y
k
=1),对比损失的第k项趋向于越来越小,和越来越接近;反之,和属于不同类型的样本(y
k
=0),则趋向于越来越小,即越来越大,但不会超过d,和越来越远离。6.如权利要求2所述的基于Feature

level SMOTE的复杂装备不均衡故障诊断方法,其特征在于:步骤三中,对于任意一故障样本,其生成过程如下:首先,找到与最相...

【专利技术属性】
技术研发人员:钟诗胜赵明航刘丹林琳张永健付旭云刘雪云
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1