基于偏鲁棒M回归和多重插补的智能数据监测方法技术

技术编号:39192003 阅读:9 留言:0更新日期:2023-10-27 08:39
本发明专利技术公开了基于偏鲁棒M回归和多重插补的智能数据监测方法,包括基于偏鲁棒M回归和多重插补的智能数据监测方法,包括基于信息多重插补和变分信息瓶颈的在线监控方法以及基于变分信息瓶颈和深度支持向量数据描述的离线建模方法,其中基于信息多重插补和变分信息瓶颈的在线监控方法包括数据采集及预处理、数据分析、剔除异常值缺失数据填补,基于变分信息瓶颈和深度支持向量数据描述的离线建模方法包括数据采集及预处理、变分瓶颈处理、深度支持向量处理。本发明专利技术利用偏鲁棒M回归方法克服了异常值对模型的影响,基于贝叶斯推理,并利用深度学习和变分理论对模型进行参数化,实现有效的输出相关特征提取。现有效的输出相关特征提取。现有效的输出相关特征提取。

【技术实现步骤摘要】
基于偏鲁棒M回归和多重插补的智能数据监测方法


[0001]本专利技术涉及过程监控和故障检测领域,具体为基于偏鲁棒M回归和多重插补的智能数据监测方法。

技术介绍

[0002]过程监控(Statistical Process Monitoring,PM)是一种质量控制方法,通过对生产过程中收集的数据进行分析和解释,来实现对工业过程的实时监控和改进。一般而言,PM由三个阶段组成:1)离线建模,利用正常工艺条件下的历史数据建立多元统计分析模型;2)在线监测,利用模型对过程进行监测并检测故障。运行工况和工作环境日趋复杂,失效概率逐渐增大
[0003]运行工况和工作环境日趋复杂,失效概率逐渐增大。此外,正常训练数据中缺失值的存在会导致监控模型不准确,降低了故障检测率,增加了误报率。面对现代工业过程中的故障,基于模型的过程监测方法显得无能为力。与基于模型的PM方法相比,基于数据驱动的PM方法不依赖于过程机理知识,在实际生产PM中具有广泛的应用前景。
[0004]因此本专利技术提供一种基于偏鲁棒M回归和多重插补的缺失数据填补的过程监控和故障检测方法,旨在有效处理在线监测阶段的数据缺失问题。

技术实现思路

[0005]本专利技术的目的在于提供基于偏鲁棒M回归和多重插补的智能数据监测方法,以解决上述
技术介绍
中提出的问题。
[0006]为实现上述目的,本专利技术提供如下技术方案:基于偏鲁棒M回归和多重插补的智能数据监测方法,包括基于信息多重插补和变分信息瓶颈的在线监控方法以及基于变分信息瓶颈和深度支持向量数据描述的离线建模方法,其中基于信息多重插补和变分信息瓶颈的在线监控方法包括步骤:
[0007]数据采集及预处理,针对不同数据缺失条件下过程监控和故障检测的应用场景,将传感器布置于待检测设备的合理位置,以收集数据;根据传感器采样频率及收集到的数据量划分数据样本长度;对于每个原始数据样本进行故障类型标注,以构建训练数据集;
[0008]数据分析,根据具体应用场景,将上述采集到的数据分为过程数据X=[x1,x2,

,x
n
]T
和质量数据Y=[y1,y2,

,y
n
]T
,若Y是单个质量变量,则可以直接利用偏鲁棒M回归剔除X和Y中的异常值;对于多个质量变量,先通过加权的方法将其转化为单个质量变量,然后再使用偏鲁棒M回归进行处理;
[0009]剔除异常值:标准化过程数据X和质量数据Y;通过计算不良杠杆权重高剩余权重和一般权重w
i
,初始化权重矩阵W;计算加权过程数据X
W
=WX和加权质量数据Y
W
=WY,其中W=diag(w);
[0010]缺失数据填补:基于贝叶斯推理,将缺失数据的不确定性考虑在内,产生若干个可能的插值,从而形成若干个完整的数据集。然后,对每个数据集进行同样的处理,通过综合
分析得到估计量,完成统计推断;
[0011]基于变分信息瓶颈和深度支持向量数据描述的离线建模方法包括步骤:
[0012]数据采集及预处理,获取传感器历史数据,并经上述数据采集及预处理后基于先验知识,将预处理后的数据X'划分为:X'=[X1',X2',

,X
b
',

,X
B
'],其中式中b是过程变量的数量,B是块的个数,对于每个区块,使用对应的过程数据X
b
'和质量数据Y'来训练变分信息瓶颈模型;
[0013]变分瓶颈处理,使用变分信息瓶颈提取质量相关特征:在信息瓶颈准则的基础上,利用深度学习和变分理论对模型进行参数化;在数据缺失条件下,为了实现有效的输出相关特征提取,在变分信息瓶颈模型中设计了编码器q
φ
(v|x)和解码器p
θ
(y|x),其中φ和θ分别为变分参数和生成参数;通过求解均方误差损失函数,得到质量相关特征v
b

[0014]深度支持向量处理,构造深度支持向量数据描述进行块级监测:采用核技巧通过v
b
训练深度支持向量数据描述模型训练深度支持向量数据描述模型并最小化超球体积;φ(g)是一个具有L个隐藏层和权值M的深度神经网络。深度支持向量数据描述模型第一项惩罚了φ(g)到超球中心c的距离,最后一项是超参数为λ的网络权重衰减正则项;深度支持向量数据描述模型的神经网络采用两层隐含层设计,并设置合适的隐含特征的维度和超参数,置信水平设为α=0.99;通过随机梯度下降算法优化权重矩阵M
b
,使得v
b
能够聚集在特征空间中的超球心c
b
周围。
[0015]优选的,在线监控方法中缺失数据填补步骤具体包括:
[0016]a:剔除异常值后,定义工业过程中的观测数据Z
obs
和缺失数据Z
obs
,令,令选取合理的初始值代替Z
mis

[0017]b:构造变分信息瓶颈模型参数θ的后验分布P(θ|Z
obs
)=∫P(θ|Z
obs
,Z
mis
)P(Z
obs
,Z
mis
)dZ
mis
和给定Z
obs
的Z
mis
的条件密度P(Z
mis
|Z
obs
)=∫P(Z
mis
|Z
obs
,θ)P(θ|Z
obs
)dθ;
[0018]c:从给定Z的θ的条件密度P(θ|Z
obs
,Z
mis
)初始参数θ,通过迭代的方式计算后验分布P(θ|Z
obs
);
[0019]d:基于当前参数θ
i
,基于步骤二计算缺失数据的第(i+1)
th
次迭代;
[0020]e:从条件密度的的第(i+1)
th
迭代中计算变分信息瓶颈模型的估计参数
[0021]f:重复步骤c和步骤d,生成马尔科夫链用蒙特卡洛方法给出缺失数据的分布;由此得到完整的数据集Z'=[X',Y'],其中X'和Y'分别为完整的过程数据和无异常值的质量数据。
[0022]与现有技术相比,本专利技术的有益效果是:
[0023]本专利技术利用偏鲁棒M回归方法克服了异常值对模型的影响,基于贝叶斯推理,将缺失数据的不确定性考虑在内,构造若干个完整的数据集;在信息瓶颈准则的基础上,利用深度学习和变分理论对模型进行参数化,实现有效的输出相关特征提取。
[0024]综上,本专利技术的方法能够实现:
[0025]1)本专利技术能够有效处理非线性过程在线监测阶段的数据缺失问题;
[0026]2)本专利技术能够降低误报率,提高故障检测率,能够以较短的检测时延在早期检测本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于偏鲁棒M回归和多重插补的智能数据监测方法,其特征在于,包括基于信息多重插补和变分信息瓶颈的在线监控方法以及基于变分信息瓶颈和深度支持向量数据描述的离线建模方法,其中基于信息多重插补和变分信息瓶颈的在线监控方法包括步骤:数据采集及预处理,针对不同数据缺失条件下过程监控和故障检测的应用场景,将传感器布置于待检测设备的合理位置,以收集数据;根据传感器采样频率及收集到的数据量划分数据样本长度;对于每个原始数据样本进行故障类型标注,以构建训练数据集;数据分析,根据具体应用场景,将上述采集到的数据分为过程数据X=[x1,x2,...,x
n
]
T
和质量数据Y=[y1,y2,...,y
n
]
T
,若Y是单个质量变量,则可以直接利用偏鲁棒M回归剔除X和Y中的异常值;对于多个质量变量,先通过加权的方法将其转化为单个质量变量,然后再使用偏鲁棒M回归进行处理;剔除异常值:标准化过程数据X和质量数据Y;通过计算不良杠杆权重高剩余权重和一般权重wi,初始化权重矩阵W;计算加权过程数据XW=WX和加权质量数据Y
W
=WY,其中W=diag(w);缺失数据填补:基于贝叶斯推理,将缺失数据的不确定性考虑在内,产生若干个可能的插值,从而形成若干个完整的数据集。然后,对每个数据集进行同样的处理,通过综合分析得到估计量,完成统计推断;基于变分信息瓶颈和深度支持向量数据描述的离线建模方法包括步骤:数据采集及预处理,获取传感器历史数据,并经上述数据采集及预处理后基于先验知识,将预处理后的数据X

划分为:X

=[X
′1,X
′2,...,X

b
,...,X

B
],其中式中b是过程变量的数量,B是块的个数,对于每个区块,使用对应的过程数据X

b
和质量数据Y

来训练变分信息瓶颈模型;变分瓶颈处理,使用变分信息瓶颈提取质量相关特征:在信息瓶颈准则的基础上,利用深度学习和变分理论对模型进行参数化;在数据缺失条件下,为了实现有效的输出相关特征提取,在变分信息瓶颈模型中设计了编码器q
φ
(v|x)和解码器p
θ
(y|x),其中φ和θ分别为变分参数和生成参数;通过求解均方误差损失函数,得到质量相关特征v
b
;深度支持向量处理,构造深度支...

【专利技术属性】
技术研发人员:王昊
申请(专利权)人:泰州历帆科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1