当前位置: 首页 > 专利查询>宁波大学专利>正文

一种基于鲁棒无监督误差生成策略的故障检测方法技术

技术编号:38369237 阅读:14 留言:0更新日期:2023-08-05 17:34
本发明专利技术公开一种基于鲁棒无监督误差生成策略的故障检测方法,针对工业过程时序采样数据中存在的离群异常数据样本问题,设计相应的鲁棒训练过程,从而利用无监督误差生成策略对工业过程实施数据驱动的故障检测。具体来讲,本发明专利技术利用差分进化算法依次逐个训练得到鲁棒回归系数向量,然后通过鲁棒回归系数向量组合而成的鲁棒误差生成矩阵为新时刻的采样数据生成对应的误差,从而利用误差的变化来反映工业过程的运行是否出现故障。相比于传统方法,本发明专利技术的最大优势就是可直接利用可能掺杂有离群采样数据的训练数据训练得到相应的模型,从而通过模型生成误差用于故障检测。此外,本发明专利技术并未将离群采样数据剔除,训练过程中同样考量了这类数据的作用。样考量了这类数据的作用。样考量了这类数据的作用。

【技术实现步骤摘要】
一种基于鲁棒无监督误差生成策略的故障检测方法


[0001]本专利技术涉及一种工业过程故障检测方法,特别涉及一种基于鲁棒无监督误差生成策略的故障检测方法。

技术介绍

[0002]在工业智能制造的大背景下,如何利用工业过程中采集的数据实施调度控制,状态监测,故障检测与诊断等是当前的热门话题。由于生产安全是第一位,而保障产品稳定的品质是维持企业盈利能力的基本手段,因此实时的检测出工业生产过程中出现的故障是非常重要的。现阶段利用采样数据实施故障检测的方法技术多见于使用多变量统计分析算法,对工业过程正常工况的采样数据实施无监督的特征学习,从而利用提取的潜特征和模型重构误差的变化来反映对应的采样数据是否源自于故障工况。从这类方法实施的流程可以看出,获取正常工况下的采样数据是第一步。
[0003]然而,工业过程在采集数据的过程中,即时在正常工况条件下,采集到离群的异常数据样本的情况也是存在的,这就导致相应的特征学习模型并非是建立在完全正常的采样数据下的,相应的特征表示和模型误差就无法准确的实现故障检测。现有的技术文献中有较多的识别采样数据中掺杂的离群异常数据样本的方法,但是这类方法更多的是关注于如何剔除离群的异常数据样本。虽然,结合使用这类离群异常数据识别方法识别出训练数据中存在的离群异常数据后,传统的数据驱动故障检测方法也能应用,但是一个适宜的数据分析规律是:离群异常数据不能只是识别后剔除,他们本身也可以提供有用的信息。从这个角度来讲,应对工业过程训练数据集中的离群异常数据样本问题,实施鲁棒的故障检测还需综合考量离群数据样本的问题。
[0004]从实施故障检测所需的无监督特征学习方法的本质来看,对采样数据进行重构估计从而使期望的重构误差最小化是模型训练的基本目标。再进一步考虑工业过程生产的连续性,在时间先后上的采样数据之间存在一定的时序交叉关系,即工业过程的一个测量变量对另一个测量变量的影响是时序滞后的。因此,训练并利用无监督的误差生成模型是实施工业过程故障检测的关键。然而,基于梯度下降或最小二乘思想的多变量分析算法都无法直接应对训练数据集中掺杂的离群异常数据问题。另一类可求解重构误差最小化目标的智能优化算法可以提供全新的解决思路,但是还未在数据驱动的故障检测领域得到充分的关注,现有技术文献中也缺少这类方法如何解决离群异常数据问题的鲁棒建模方法。

技术实现思路

[0005]本专利技术所要解决的主要技术问题是:如何针对工业过程时序采样数据中存在的离群异常数据样本问题,设计相应的鲁棒训练过程,从而利用无监督误差生成策略对工业过程实施数据驱动的故障检测。具体来讲,本专利技术方法首先设计使用差分进化(Differential Evolution,缩写:DE)算法依次逐个训练得到相应的鲁棒回归系数向量,然后通过鲁棒回归系数向量组合而成的鲁棒误差生成矩阵为新时刻的采样数据生成对应的误差,从而利用误
差的变化来反映工业过程的运行是否出现故障。
[0006]本专利技术方法解决上述问题所采用的技术方案为:一种基于鲁棒无监督误差生成策略的故障检测方法,具体包括以下所示步骤。
[0007]步骤(一),训练前的准备,具体包括准备训练数据,设置预设参数,和确定差分进化过程准备这三个方面,具体分别如下所示。
[0008](1)准备训练用的数据矩阵X,具体包括以下所示步骤(1.1)至步骤(1.5)。
[0009]步骤(1.1):从工业过程对应的历史采样数据库中,获取最近N个采样时刻的N组采样数据,并将这N组采样数据对应表示成N个M
×
1维的实数向量x1,x2,

,x
N
后,再将其合并成一个M
×
N维的数据矩阵Z=[x1,x2,

,x
N
];其中,工业过程在每个采样时刻都可以通过M个测量仪表对应获取M个测量值,并将这M个测量值组成一组采样数据。
[0010]步骤(1.2):将Z中的第m行向量标记为z
m
,再确定z
m
中N个元素的中位数μ
m
后,根据公式对z
m
进行鲁棒中心化处理,对应得到1
×
N维的行向量其中,测量值的序号m=1,2,

,M。
[0011]步骤(1.3):确定中N个元素的中位数后,再根据计算中位绝对差δ
m

[0012]步骤(1.4):根据公式分别对z1,z2,

,z
M
实施鲁棒标准化处理,对应得到M个1
×
N维的实数向量后,再将合并成一个M
×
N维的数据矩阵其中,中的第1行向量,第2行向量,至第M行向量分别等于
[0013]步骤(1.5):将中的第1列向量,第2列向量,至第N列向量依次标记为后,再根据如下所示公式

组建训练用的数据矩阵X:
[0014]其中,D表示时序相关阶数,分别表示中的第1列向量,第2列向量,至第D列向量,第D+1列向量,第D+2列向量,至第N

D列向量,至第N

1列向量,第N列向量。
[0015](2)设置训练用的参数,具体包括:进化个体的总数K,最大迭代次数J,初始变异因子α0,初始交叉概率β0,每个进化个体都表示成一个1
×
w维的实数向量,第j次迭代中的变异因子α和交叉概率β具体按照如下所示公式

和公式

分别确定:分别确定:
[0016]其中,w=M(D+1)

1,exp()表示以自然常数为底数的指数函数,j=1,2,

,J。
[0017](3)确定对进化个体实施更新的差分进化过程,包括生成变异向量,确定交叉向量,更新进化个体三个步骤,具体如步骤(3.1)至步骤(3.3)。
[0018]步骤(3.1):根据如下所示公式

生成第k个进化个体s
k
对应的变异向量v
k

[0019]其中,表示第j次迭代中的最佳个体,r1和r2表示从区间[1,K]中随机生成的两个不相等的整数,每次调用公式

时,r1和r2都必须重新随机生成,进化个体的编号k=1,2,

,K。
[0020]步骤(3.2):根据如下所示公式

确定第k个进化个体s
k
对应的交叉向量u
k

[0021]其中,和分别表示v
k
,s
k
和u
k
中的第i个元素,r3是从区间[0,1]中生成的随机数,且每次调用公式

时都必须重新生成r3,i=1,2,

,w。
[0022]步骤(3.3):根据如下所示公式

对第k个进化个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于鲁棒无监督误差生成策略的故障检测方法,其特征在于,具体包括以下步骤:步骤(一),训练前的准备,具体包括如下所示的三个方面;(1)准备训练用的数据矩阵X,具体包括以下所示步骤(1.1)至步骤(1.5);步骤(1.1):从工业过程对应的历史采样数据库中,获取最近N个采样时刻的N组采样数据,并将这N组采样数据对应表示成N个M
×
1维的实数向量x1,x2,

,x
N
后,再将其合并成一个M
×
N维的数据矩阵Z=[x1,x2,

,x
N
];其中,工业过程在每个采样时刻都可以通过M个测量仪表对应获取M个测量值,由这M个测量值组成的一组采样数据可对应表示成一个M
×
1维的实数向量;步骤(1.2):将Z中的第m行向量标记为z
m
,再确定z
m
中N个元素的中位数μ
m
后,根据公式对z
m
进行鲁棒中心化处理,对应得到1
×
N维的行向量其中,m=1,2,

,M;步骤(1.3):确定中N个元素的中位数后,再根据计算中位绝对差δ
m
;步骤(1.4):根据公式分别对z1,z2,

,z
M
实施鲁棒标准化处理,对应得到M个1
×
N维的实数向量后,再将合并成一个M
×
N维的数据矩阵其中,中的第1行向量,第2行向量,至第M行向量分别等于步骤(1.5):将中的第1列向量,第2列向量,至第N列向量依次标记为后,再根据如下所示公式

组建训练用的数据矩阵X:其中,D表示时序相关阶数,分别表示中的第1列向量,第2列向量,至第D列向量,第D+1列向量,第D+2列向量,至第N

D列向量,至第N

1列向量,第N列向量;(2)设置训练用的参数,具体包括:进化个体的总数K,最大迭代次数J,初始变异因子α0,每个进化个体都表示成一个1
×
w维的实数向量,第j次迭代中的变异因子α和交叉概率β具体按照如下所示公式

和公式

分别进行设置:分别进行设置:其中,w=M(D+1)

1,exp()表示以自然常数为底数的指数函数;(3)确定对进化个体实施更新的差分进化过程,包括生成变异向量,确定交叉向量,更新进化个体三个步骤;步骤(二),逐个训练得到M个1
×
w维的鲁棒回归系数向量θ1,θ2,


M
,具体的实施过程如步骤(A)至步骤(E)所示;
步骤(A):设置m=1和j=1;步骤(B):将X中的第m行向量当做成输出向量y
m
,其余w行向量组成w
×
(N

D)维的输入矩阵X
m
,再从区间[

1,1]中随机生成K个1
×
w维的实数向量,对应表示K个进化个体s1,s2,

,s
K
;步骤(C):分别确定K个进化个体s1,s2,

,s
K
对应的适应度值F(s1),F(s2),

,F(s
K
)后,再将最小的适应度值对应的进化个体标记为第j次迭代中的最佳个体步骤(D),判断j是否小于J;若是,则根据步骤(一)中确定的差分进化过程,对每个进化个体实施更新,再设置j=j+1后,返回步骤(C);若否,则设置第m个鲁棒回归系数向量后,再执行步骤(E);步骤(E),判断m是否小于M,若是,则分别设置m=m+1和j=1后,再返回步骤(B);若否,则训练得到M个1
×
w维的鲁棒回归系数向量θ1,θ2,


M
;步骤(三),确定并保留用于在线故障检测的参数,具体包括:步骤(1.2)中确定的M个中位数μ1,μ2,


M
,步骤(1.3)中确定的M个中位绝对差δ1,δ2,


M
,由θ1,θ2,


M
组成的鲁棒误差生成矩阵Θ,对生成的误差向量实施鲁棒标准化处理所需的中位数η1,η2,


M
和中位绝对差σ1,σ2,


M
,故障检测指标的控制限其中,组成鲁棒误差生成矩阵Θ的具体方式如公式

所示,确定中位数η1,η2,


M
和中位绝对差σ1,σ2,


M
的过程如步骤(F)至步骤(H)所示,将自由度等于M的卡方分布在置信度等于99.75%条件下的取值确定为控制限骤(H)所示,将自由度等于M的卡方分布在置信度等于99.75%条件下的取值确定为控制限在公式

中,Θ中对角线上的元素都等于0,非对角线上的元素则分别由θ...

【专利技术属性】
技术研发人员:雷羽虹李文磊蓝艇
申请(专利权)人:宁波大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1