一种基于深度注意力数据增强的航空发动机异常检测方法技术

技术编号:38903943 阅读:22 留言:0更新日期:2023-09-22 14:22
本申请涉及航空发动机异常检测技术领域,尤其涉及一种基于深度注意力数据增强的航空发动机异常检测方法,使用Encoder网络将训练集X映射到特征空间中Z;采用DA

【技术实现步骤摘要】
一种基于深度注意力数据增强的航空发动机异常检测方法


[0001]本申请属于航空发动机异常检测
,更具体地说,是涉及一种基于深度注意力数据增强的航空发动机异常检测方法。

技术介绍

[0002]航空发动机是飞机的核心部件,其健康状况会对飞机航行的稳定性和安全性产生巨大影响。为了防止发动机的早期异常在航行时产生连锁反应导致重大故障,最有效的办法就是在起飞前进行准确的异常检测和全面的健康检查,这样就可以提前采取必要的措施(如维修或者更换发动机)来减少昂贵的计划外维护和避免严重的飞行事故。因此,探索准确的发动机异常检测方法具有重要意义。
[0003]目前,航空发动机的异常检测方法主要分为三类:基于模型、基于传统机器学习和基于深度学习的方法。基于模型的方法具有较好的解释性,但是却需要大量的领域知识。特别是对于高度复杂的热力机械,构建一个精确的物理解析模型来分析损伤的传播过程和动态响应是极其困难的,这限制了该类方法的实际应用。基于传统机器学习的方法可以避免复杂的建模过程,但是这些浅层模型却难以从原始监控数据中学习可辨识的有用特征,还需要结合工程师手工设计的统计特征。如果选择的统计特征无法表征航空发动机的健康状态,将会严重影响最终的异常检测结果。
[0004]相反的,基于深度学习的方法可以自动地从原始监控数据中提取有用特征,既避免了复杂的建模过程,又解决了手工选择特征的困难,因此,深度学习在航空发动机的异常检测领域展现出非凡的潜力。譬如,现有技术中有使用滤波器进行数据预处理,然后结合深度卷积神经网络对航空发动机的健康状态进行诊断。还有采用一组长短期记忆网络来学习性能监控参数与发动机健康状态的复杂映射关系,从而完成多传感器条件下的航空发动机异常检测。也有结合深度贝叶斯网络和Shapley加性解释构建一种可解释的异常检测和故障预测框架,并在在真实的发动机数据集上验证了框架的有效性。也有选用卷积自编码器提取原始监控数据的high

level特征,然后结合权重无关网络来诊断发动机是否发生异常。但上述诊断方法均欠缺一个类别均衡的训练集。
[0005]航空发动机从正常状态衰退到异常状态,一般情况下需要经历很多次飞行循环,那么能够收集到的异常样本的数量是非常有限的,导致其远远少于正常样本的数量。另一方面,当航空发动机处于早期异常状态的时候,异常样本与近期的正常样本又会非常相似,从而导致两者的相互混叠。如1(a)所示,若直接使用深度学习进行航空发动机的异常检测将面临着数据不均衡和样本混叠的双重挑战。第一个挑战:在训练阶段,深度学习模型的损失由正常样本主导,也就是说,只要正常样本被正确地分类,那么训练误差就会降得非常小。在这种情况下,深度学习模型会更加关注正常样本,并倾向于把异常样本诊断为正常样本。然而,这在实际工程应用中是不被允许的。第二个挑战:异常样本与正常样本相互混叠,如果直接进行数据增强,合成的异常样本有可能落入正常样本聚集的区域,此时部分生成的样本更接近正常样本,但是仍然带有“异常”的标签,这将误导深度学习模型的训练。
[0006]至今,传统数据重采样技术一般选用欠采样技术或过采样技术是解决上述挑战。
[0007](一)许多欠采样技术面临信息损失的难题。许多欠采样技术采用的随机移除策略很可能会移除重要的正常样本,对于高度混叠的数据而言,也可能会移除比较多的边界样本。
[0008]欠采样技术的工作原理为:通过减少正常样本的数目N,以匹配异常样本的数目A,即移除(N

A)个正常样本,如图1中(a)

(b)所示。当A远小于N时,会导致过多的信息损失。
[0009](二)过采样技术则面临生成噪声样本的风险。譬如,流行的SMOTE通过在异常样本与其相邻异常样本之间的连线上随机采样来生成新的异常样本,那么生成的异常样本极有可能落入危险区域。为了缓解这个问题,出现了很多SMOTE的变体。譬如,Borderline

SMOTE首先定义一组“危险”样本,即那些有可能被分类网络误分的异常样本,然后对这些异常样本进行过采样。KMeans

SMOTE首先使用KMeans将输入数据划分成不同的簇,然后在每个簇中分别使用SMOTE生成异常样本。虽然Borderline

SMOTE和KMeans

SMOTE等可以在一定程度上降低生成噪声样本的风险,但是对于高度混叠的数据而言,其效果也是比较有限的。
[0010]过采样技术的工作原理为:通过增加异常样本的数目,以匹配正常样本的数目,即生成(N

A)个异常样本,如图1中(a)

(c)所示。当异常样本与正常样本高度混叠时,生成的异常样本极有可能落在正常样本聚集的区域(称为危险区域)而被视为噪声样本。但该两项技术对数据的处理,不均衡程度高,混叠程度高,影响诊断的有效性。
[0011]综上所述,急需研发一种新的基于深度注意力数据增强的航空发动机异常检测方法,以解决上述技术问题。

技术实现思路

[0012]为实现上述目的,本申请采用的技术方案是:提供一种基于深度注意力数据增强的航空发动机异常检测方法,包括以下步骤:
[0013]步骤一,使用聚类算法将正常样本聚成K个簇,形成聚类中心,然后将聚类中心与异常样本构成欠采样后的训练集X;
[0014]步骤二,首先,使用Encoder网络将训练集X映射到一个类内聚集并且类间分离的特征空间中;然后,在学习的特征空间中采用自注意力模块自适应地生成异常样本特征Z
new
;最后,使用Decoder网络将生成的异常样本特征Z
new
映射回原始空间中,生成异常样本异常样本与欠采样后的训练集X构成均衡的训练集;
[0015]步骤三:使用均衡的训练集训练注意力网络,将训练好的注意力网络作为分类网络,用于诊断发动机是否发生异常。
[0016]可选地,采用自注意力模块自适应地生成异常样本特征Z
new
的过程称为DA

SMOTE。
[0017]可选地,步骤二中,使用训练完成的Encoder网络将欠采样后的训练集X映射到一个类间相离且类内相聚的特征空间中,即Z=Encoder(X)。
[0018]可选地,DA

SMOTE用于生成异常样本,DA

SMOTE生成异常样本的过程如下:
[0019]步骤S101,将异常样本特征z与相邻的异常样本特征拼接形成一个特征对其中,z∈Z;
[0020]步骤S102,特征对经过注意力模块处理,得到标量输出θ,如公式(5)所示:
[0021][0022]式中,代表ReLU激活函数,W1、W2、W3代表线性映射的参数矩阵;
[0023]步骤S103,通过Sigmoid函数将标量输出θ变换到(0,1)之间,如公式(6)所示:
[0024][0025]式中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度注意力数据增强的航空发动机异常检测方法,其特征在于:包括以下步骤:步骤一,使用聚类算法将正常样本聚成X个簇,形成聚类中心,然后将聚类中心与异常样本构成欠采样后的训练集X;步骤二,首先,使用Encoder网络将训练集X映射到一个类内聚集并且类间分离的特征空间中;然后,在学习的特征空间中采用自注意力模块自适应地生成异常样本特征Z
new
;最后,使用Decoder网络将生成的异常样本特征Z
new
映射回原始空间中,生成异常样本异常样本与欠采样后的训练集X构成均衡的训练集;步骤三:使用均衡的训练集训练注意力网络,将训练好的注意力网络作为分类网络,用于诊断发动机是否发生异常。2.如权利要求1所述的一种基于深度注意力数据增强的航空发动机异常检测方法,其特征在于:采用自注意力模块自适应地生成异常样本特征Z
new
的过程称为DA

SMOTE。3.如权利要求2所述的一种基于深度注意力数据增强的航空发动机异常检测方法,其特征在于:步骤二中,使用训练完成的Encoder网络将欠采样后的训练集X映射到一个类间相离且类内相聚的特征空间中,即Z=Encoder(X)。4.如权利要求3所述的一种基于深度注意力数据增强的航空发动机异常检测方法,其特征在于:DA

SMOTE用于生成异常样本,DA

SMOTE生成异常样本的过程如下:步骤S101,将异常样本特征z与相邻的异常样本特征拼接形成一个特征对其中,z∈Z;步骤S102,特征对经过注意力模块处理,得到标量输出θ,如公式(5)所示:式中,代表ReLU激活函数,W1、W2、W3代表线性映射的参数矩阵;步骤S103,通过Sigmoid函数将标量输出θ变换到(0,1)之间,如公式(6)所示:式中,为学习得到的插值因子;步骤S104,生成的异常样本特征Z
new
如公式(7)所示:5.如权利要求4所述的一种基于深度注意力数据增强的航空发动机异常检测方法,其特征在于:使用训练完成的Decoder网络将增强后的集合[Z,Z
new
]映射回到原始空间中,即原始空间与训练集X一起构成均衡的训练集6.如权利要求5所述的一种基于深度注意力数据增强的航空发动机异常检测方法,其特征在于:插值因子采用两种损失函数学习得到,两种损失函数分别为:重构损失和三中心损失;
重构损失:采用类均衡的l2‑
norm作为重构损失如公式(8)所示:式中,x
i
是X中的第i个元素,并且是x
i
的重构表示,|
·
|代表集合中元素个数,并且||
·
||2代表l2‑
norm,β∈[0,1)是一个超参数,β设置为0.999,当x
i
为正常样本时,n
i
=K;当x
i
为异常样本时,n
i
=A;三中心损失:采用三中心损失指导特征表示和插值因子的学习,如公式(9)所示:式中,z
i
是Z∪Z
new
中的第i个元素,d是一个超参数,d设置为5;当z
i
为正常样本特征时,则c
i
是正常...

【专利技术属性】
技术研发人员:赵明航钟诗胜刘丹林琳付旭云刘雪云
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1