本发明专利技术公开了一种基于局部邻域标准化和贝叶斯推断的ICA-PCA多工况故障诊断方法,该方法首先对工业过程的各个正常工况进行独立采样获得训练数据集,通过对训练集局部邻域标准化,获得服从单一分布的数据集,然后利用ICA-PCA方法分别对该数据集的高斯特性和非高斯特性进行分析处理,获得全局模型。在线监控阶段对工业过程数据进行独立重复采样,经过局部邻域标准化处理后应用所述模型分析处理获得多个统计量,再根据贝叶斯推断将多个统计量组合成一个统计量,通过比较控制限,获得故障诊断结果。相比与传统故障诊断方法,本发明专利技术可以简化处理过程,提高诊断效果,改善过程监测性能,同时方便工作人员监测观察,有利于杜绝安全隐患,保障工业过程的正常运行。
【技术实现步骤摘要】
本专利技术属于工业过程监测领域,尤其涉及一种基于局部邻域标准化和贝叶斯推断 的ICA-PCA多工况故障诊断方法。
技术介绍
现代复杂工业过程中往往包含非线性、非高斯、动态性等特点的不同工况,而且多 工况下数据服从不同分布。然而大多数多元统计过程监测方法如主成分分析(PCA)、偏最小 二乘(PLS)都假设数据服从单一高斯分布,因此这些方法应用在多工况过程中其监测效果 有较大的局限。 近年来,为了能够有效地解决多工况过程的在线监测问题,一些学者提出了多模 型的监测策略,高斯混合模型(GMM)、PCA混合模型等方法通过应用多个高斯成分表征过程 数据,不同工况下的数据通过对应的高斯成分特征提取,从而在多工况过程中获得了良好 的监测性能。然而在离线建模阶段,如何将历史数据分类到对应子模型的先验知识是很难 获得的,而且在线监控阶段新数据所属的模型不易确定,不同的子模型都有各自的监测图, 不方便操作人员观察判断。 所以就需要一种既能简化处理既简化处理过程,提高监测性能,而且方便操作人 员观察,利于工业过程的运行管理的故障诊断方法。
技术实现思路
本专利技术针对多工况工业过程的非线性、动态性、多分布的特点提供一种基于局部 邻域标准化和贝叶斯推断的ICA-PCA多工况故障诊断方法。 本专利技术的目的是通过以下技术方案来实现的: -种基于局部邻域标准化和贝叶斯推断的ICA-PCA多工况故障诊断方法,所述方 法包括以下过程: 首先收集不同工况下正常数据组成训练集,用局部邻域标准化方法对训练集进行 预处理,并采用ICA-PCA算法建立模型,获得3个统计量,然后应用贝叶斯推断将所述统计 量组合成为一个统计量,并确定相应控制限。 当新的数据点到来时,将其放入历史训练集中利用局部邻域标准化方法进行预处 理,然后再将该数据点移除,通过所述ICA-PCA模型获得相应统计量。 通过贝叶斯推断将所述统计量组合成一个统计量,通过比较在线统计量与控制限 的大小来对是否出现故障做出决策。 需要对当前工况监测时,不需要知道当前是哪一个工况,而且只需要观察一个监 测变量图。 本专利技术的具体步骤如下:步骤1 :收集工业过程中各个工况正常运行的数据组成训练样本集; 步骤2:利用局部邻域标准化方法对训练样本进行预处理,使得多工况数据可以 由单一模型来表不; 所述局部邻域标准化算法为: 假设样本集XeRmXn,其中,m是过程变量的数目,n是样本数据的大小;样本 XieR?xi(i =H'n)的局部邻域Nk(Xi)表示样本在X中由欧氏距离确定的k个最近 邻,其中=彳乂,#,…,#};然后利用每个样本的第一个邻居的邻域均值和邻域标准 差进行标准化处理:如式(1) 其中,Zi表示经过局部邻域标准化处理后的Xy?<.%(<))和·KiVjO)分别表示样 本^的第一个邻居的4的邻域均值和邻域标准差,s表示求标准差; 步骤3:根据步骤2获得的预处理样本集,应用ICA-PCA算法分析处理获得离线建 模模型; 假设m维的样本x(k) = T可以由r维的未知独立成分 [Sl,s2,…,sJT的线性组合来表示,其中r彡m,他们之间的关系如式⑵所示: X=A·S+E (2) X= e RmXn代表训练数据矩阵,A=[a a2,…,aj e RW代表混 合系数矩阵,Se[Sl,S2,…,SJe!TXn代表独立成分矩阵,Ee以~代表残差矩阵;对于获 得的残差矩阵E通过协方差矩阵奇异值分解获得PCA模型,假设PCA模型有q个主成分,E 可以通过奇异值分 解为如式(3):Ετ=ΤΡτ+Ε' (3) 式中,TeRnx,ppe 分别代表主成分子空间的得分矩阵和载荷矩阵,Ε'是 PCA模型中的残差矩阵; 其ICA-PCA算法步骤为:Stepl:求样本x(k)的协方差矩阵Rx=E(x(k)xT(k)),E表示求期望,并进行特征 值分解:得式⑷Rx=UAUT (4) 其中U表示Rx的特征向量组成的矩阵,Λ为特征值组成的对角矩阵;Step2:对样本进行白化处理:得式(5)z(k) =Qx(k) =QAs(k) =Bs(k) (5)z(k)表示经过白化处理后的x(k),其中Q=Λ1/2UT;根据X=A·S+E,其中, XeRmXn,AeRmXf,seRfXn,EeRmXn,当r =m 时,X=A.S,这里我们考虑r=m的情 况;因此,X(k) =As(k),B是一个正交矩阵; Step3 :选择独立成分的个数r,设置i= 1 ;这里的i用来作为Step3_Step8迭代 过程的下标及结束迭代条件; Step4 :随机选取一个单位方差的初始化向量b1;Step5 :令1^=E{zg(biTz)}-E{g'(b/zMbi,其中z是经过白化处理后的训练样本 向量,g和g'分别代表式(6)中3个非二次函数中任意一个函数的一阶和二阶导数: G2(u)=exp(-a2u2/2) G3(u)=u4 其中1彡a# 2,a产1,本文选择G1; St印6 :然后将h按照式(7)和式(8)进行标准正交化: W St印7 :假如匕没有收敛,返回St印3 ; Step8 :假如bi收敛,输出bi;如果i<m,那么i=i+Ι并返回Step2 ;Step9:根据迭代结束后获得的正交阵B和所述Q矩阵求得独立成分矩阵:如式 (9) S=BTQX (9) St印10 :根据式(2)求得残差矩阵E,并应用协方差矩阵奇异值分解获得PCA模 型,然后分别获得属于非高斯空间的统计量I2(k) = (BTQx(k))T(BTQx(k))和高斯空间的统 计量SPE(k) =e(k)Te(k) =x(k)T(I-PqPqT)x(k),T2(k) =t(k)TAΗ(1〇 ;其中,e(k)是残 差矩阵的第k个样本向量,Pq代表PCA模型载荷矩阵的前q个向量组成的矩阵,I表示单位 矩阵,t(k)表示得分矩阵的第k个样本向量,Λ1是特征值对角矩阵的逆矩阵形式; 步骤4 :根据步骤3获得ICA-PCA模型的统计量应用核密度(KDE)方法分别计算 出各自的控制限,KDE算法为:给出一个η个样本的数据集X,则X的分布密度可以计算为式 (10) :其中,h表示带宽,Κ表示核函数,选择高斯核函f?,然后求得 X均值的置信水平为99%的置信上限作为控制限; 步骤5:在线监控阶段,对于每一个新的采样点x_,寻找其在训练集X中的最近邻 ,并利用的邻域均值(< ))和邻域标准差W))对新样本进行标准化处 理,然后根据步骤3中的St印10分别计算出统计量/_,SPEnew,71 ; 步骤6 :通过贝叶斯推断的方法将上述3个统计量组合成为一个统计量,非高斯空 间XKA发生故障的概率表示为式(11): Ρ表示一种概率,巧表示已知在非高斯空间心冲,发生故障的概率, 表示已知发生故障,故障出现在非高斯空间的概率,表示非高斯空间发生故障 的概率,表示在非高斯空间的概率。 其中, Χιω表示当前样本X的非高斯空间,N表示正常情况,F表示故障情况,6.、表示非 高斯空间正常的概率,户_表示非高斯空间发生故障的概率;々^和^5#分别设置为α和 1-α,α为置信水平; 和可以由(13)和(14)计算: 其中,&为非高斯空间的控制限,表示在非高斯空本文档来自技高网...
【技术保护点】
基于局部邻域标准化和贝叶斯推断的ICA‑PCA多工况故障诊断方法,其特征在于,包括以下步骤:步骤1:收集工业过程中各个工况正常运行的数据组成训练样本集;步骤2:利用局部邻域标准化方法对训练样本进行预处理,使得多工况数据可以由单一模型来表示;所述局部邻域标准化算法为:假设样本集X∈Rm×n,其中,m是过程变量的数目,n是样本数据的大小;样本xi∈Rm×1(i=1,2…,n)的局部邻域Nk(xi)表示样本在X中由欧氏距离确定的k个最近邻,其中然后利用每个样本的第一个邻居的邻域均值和邻域标准差进行标准化处理:如式(1)Zi=xi-m(Nk(xi1))s(Nk(xi1))---(1)]]>其中,Zi表示经过局部邻域标准化处理后的xi,和分别表示样本xi的第一个邻居的的邻域均值和邻域标准差,s表示求标准差;步骤3:根据步骤2获得的预处理样本集,应用ICA‑PCA算法分析处理获得离线建模模型;假设m维的样本x(k)=[x1(k),x2(k),…,xm(k)]T可以由r维的未知独立成分[s1,s2,…,sr]T的线性组合来表示,其中r≤m,他们之间的关系如式(2)所示:X=A·S+E(2)X=[x1,x2,…,xn]∈Rm×n代表训练数据矩阵,A=[a1,a2,…,ar]∈Rm×r代表混合系数矩阵,S∈[s1,s2,…,sn]∈Rr×n代表独立成分矩阵,E∈Rm×n代表残差矩阵;对于获得的残差矩阵E通过协方差矩阵奇异值分解获得PCA模型,假设PCA模型有q个主成分,E可以通过奇异值分解为如式(3):ET=TPT+E′(3)式中,T∈Rn×q和P∈Rm×q分别代表主成分子空间的得分矩阵和载荷矩阵,E′是PCA模型中的残差矩阵;其ICA‑PCA算法步骤为:Step1:求样本x(k)的协方差矩阵Rx=E(x(k)xT(k)),E表示求期望,并进行特征值分解:得式(4)Rx=UΛUT(4)其中U表示Rx的特征向量组成的矩阵,Λ为特征值组成的对角矩阵;Step2:对样本进行白化处理:得式(5)z(k)=Qx(k)=QAs(k)=Bs(k)(5)z(k)表示经过白化处理后的x(k),其中Q=Λ‑1/2UT;根据X=A·S+E,其中,X∈Rm×n,A∈Rm×r,S∈Rr×n,E∈Rm×n,当r=m时,X=A·S;因此,x(k)=As(k),B是一个正交矩阵;Step3:选择独立成分的个数r,设置i=1;Step4:随机选取一个单位方差的初始化向量bi;Step5:令bi=E{zg(biTz)}‑E{g'(biTz)}bi,其中z是经过白化处理后的训练样本向量,g和g'分别代表式(6)非二次函数中的一阶和二阶导数:G1(u)=1a1log cosh(a1u)---(6)]]>其中1≤a1≤2;Step6:然后将bi按照式(7)和式(8)进行标准正交化:bi=bi-Σj=1i-1(biTbj)bj---(7)]]>bi=bi||bi||---(8)]]>Step7:假如bi没有收敛,返回Step3;Step8:假如bi收敛,输出bi;如果i≤m,那么i=i+1并返回Step2;Step9:根据迭代结束后获得的正交阵B和所述Q矩阵求得独立成分矩阵:如式(9)S=BTQX(9)Step10:根据式(2)求得残差矩阵E,并应用协方差矩阵奇异值分解获得PCA模型,然后分别获得属于非高斯空间的统计量I2(k)=(BTQx(k))T(BTQx(k))和高斯空间的统计量SPE(k)=e(k)Te(k)=x(k)T(I‑PqPqT)x(k),T2(k)=t(k)TΛ‑1t(k);其中,e(k)是残差矩阵的第k个样本向量,Pq代表PCA模型载荷矩阵的前q个向量组成的矩阵,I表示单位矩阵,t(k)表示得分矩阵的第k个样本向量,Λ‑1是特征值对角矩阵的逆矩阵形式;步骤4:根据步骤3获得ICA‑PCA模型的统计量应用核密度(KDE)方法分别计算出各自的控制限,KDE算法为:给出一个n个样本的数据集x,则x的分布密度可以计算为式(10):q(x)=1nΣi=1n1hK(x-xih)---(10)]]>其中,h表示带宽,K表示核函数,选择高斯核函数然后求得x均值的置信水平为99%的置信上限作为控制限;步骤5:在线监控阶段,对于每一个新的采样点xnew,寻找其在训练集X中的最近邻并利用的邻域均值和邻域标准差对新样本xnew进行标准化处理,然后根据步骤3中的Step10分别计算出统计量SPEnew,步骤6:通过贝叶斯推断的方法将上述3个统计量组合成为一个统计量,非高斯空间XICA发生故障的概率表示为式(11):PI2(F|XICA)=PI2(XICA|F)PI2FPI2XICA---(11)]]>P表示一种概率,表示已知在非高斯空间XICA中,发生故障的概率,表示已...
【技术特征摘要】
【专利技术属性】
技术研发人员:熊伟丽,郭校根,
申请(专利权)人:江南大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。