基于局部标签传播的即时学习半监督软测量建模方法技术

技术编号:34402573 阅读:73 留言:0更新日期:2022-08-03 21:44
本发明专利技术涉及一种基于局部标签传播的即时学习半监督软测量建模方法,该方法通过局部标签传播算法充分提取未标记样本中的信息,通过整体优化即时学习算法建立关于查询数据的在线模型,并作为约束项加入局部标签传播算法中。对于采集的查询数据,首先根据已被标记的历史数据,通过整体优化即时学习算法建立局部模型,然后在所有的历史样本中选择出查询数据的相似样本,最后通过基于局部模型约束的局部标签传播算法计算查询数据的输出预测值。本发明专利技术不仅能够很好地处理工业过程的非线性、时变性及多重共线性问题,还可以有效利用大量的未被标记的历史数据,提高历史样本的利用率及软测量模型的预测精度。测量模型的预测精度。测量模型的预测精度。

【技术实现步骤摘要】
基于局部标签传播的即时学习半监督软测量建模方法


[0001]本专利技术属于工业过程检测
,涉及工业过程软测量技术,具体地说,涉及了一种基于局部标签传播的即时学习半监督软测量建模方法。

技术介绍

[0002]在现代工业生产过程中,许多重要质量变量(例如:油品黏度、组分等)难以实时测量,给化工过程控制与优化带来很大影响。因为化工生产过程存在样品现场取样困难、分析仪器成本高以及分析时间滞后等问题,在实际生产过程中,往往难以使用在线分析仪表和离线化验等方式对质量变量进行实时测量,无法对质量变量形成闭环控制。因此,质量变量如何实时获取成为过程控制首先要解决的问题。由此,软测量进入了过程工业控制领域的研究视线。
[0003]常用的数据驱动软测量建模方法包括主元回归(Principal Component Regression,简称:PCR)、偏最小二乘回归(Partial Least Square Regression,简称:PLSR)以及人工神经网络(Artificial Neural Network,简称:ANN)。上述软测量算法建立的模型属于离线模型,模型建立后不会随着生成过程的改变而自适应调整,无法跟踪生产状态的变化,从而导致预测精度逐渐下降。因此,软测量模型的自动维护成为了算法研究与改进的重点。因此,为了适应现代化工生产过程表现出的多模态特性和时变特性,各种在线建模算法已经被广泛应用于生产过程的监控与质量变量预测。
[0004]目前,主流的在线软测量建模算法包括:滑动窗算法(Moving window algorithm)、递归算法(Recursive learning)、时间差分算法(Time difference,TD)以及即时学习算法(Just in time learning,JITL)。其中,前三种都是根据时间相关性更新模型,属于时间自适应算法;即时学习算法是基于空间相关性对模型进行更新和维护,属于空间自适应算法。相比其他算法,即时学习算法的优势在于可以更好的适应生产过程中的突变现象,并且由于该算法对每个样本都建立局部模型,因此,也可以很好的描述过程变量之间的非线性关系。
[0005]虽然最近已经有很多基于即时学习框架的建模方法被提出,并且取得了不错的效果,但大部分方法只能利用已被标记的历史数据。然而,由于质量变量的采样频率低,时延大的问题,被标记的样本往往只占所有历史数据的小部分。因此,仅利用少量的标记样本不仅浪费了大量的未标记样本,还可能无法准确的反映辅助变量与质量变量之间的潜在关系。由上可知,采用传统即时学习算法建立的模型存在样本利用率低且预测精度差的问题。

技术实现思路

[0006]本专利技术针对现有即时学习技术存在的无法利用未标记的历史样本等上述问题,提供一种基于局部标签传播的即时学习半监督软测量建模方法(Just in time learning algorithm based on local label propagation,LLPJITL),将即时学习方法扩展到半监督领域,可以高效的提取未标记样本中蕴含的信息,提高了模型优化效率与预测精度。
[0007]为了达到上述目的,本专利技术提供了一种基于局部标签传播的即时学习半监督软测量建模方法,其具体步骤为:
[0008](一)通过工业传感器以及实验室化验分析等方式分别获取辅助变量以及质量变量的真实值,共得到n个历史样本m1=m+1,m为辅助变量的数量。其中,前n
l
个历史样本为已被标记的样本剩余的n
u
个样本为未被标记的样本
[0009](二)将已采集到的数据作为初始训练数据集对初始训练数据集按照公式(1)进行标准化处理,使其均值为0、方差为1,得到训练数据集X
std
为数据X标准化处理后得到的数据,为变量值标准化处理后得到的变量值,公式(1)表示为:
[0010][0011]式中,函数mean(
·
)表示计算矩阵各行的均值,函数std(
·
)表示计算矩阵各行的标准差;
[0012](三)对于新采集的查询数据按照公式(1)进行标准化处理并且将其按照未被标记的样本加入到历史数据库
[0013](四)根据历史数据中已被标记的样本首先通过改进的协同表示算法(Improved collaborative representation learning algorithm,ICRL)计算出样本集中的样本与的相似度权重然后通过局部加权岭回归算法(Weighted ridge regression,WRR)建立关于查询数据的局部模型,模型系数为
[0014](五)在历史数据中,根据欧式距离选择出空间上距离查询数据最近的k1个历史样本,作为空间近邻样本集(包含);然后,将所有空间近邻样本的k2个时序近邻样本作为时间近邻样本集k=k1×
k2;最后,合并空间以及时间近邻样本集,得到的双重近邻样本k
lp
为双重近邻样本的数量;
[0015](六)根据近邻样本通过基于局部模型约束的标签传播算法计算查询数据的输出值
[0016](七)当通过实验室化验分析等方式得到查询数据x
q
真实输出值y
q
时,将样本[x
q
,y
q
]加入到训练数据集中,并且重新进行标准化处理,以扩充历史数据中所包含的工作
区间;否则,维持训练数据集中所包含空间不变。
[0017]进一步的,所述步骤(四)中,利用已被标记的样本通过改进的协同表示算法计算出样本集中的样本与的相似度权重的具体步骤为:
[0018]利用样本集建立离线岭回归模型,优化目标为:
[0019][0020]式中,为离线岭回归模型的岭回归系数,λ0为离线岭回归模型的正则项系数;
[0021]求解优化目标,得出离线岭回归模型的岭回归系数θ0的解析表达式为:
[0022]θ0=(X
L
X
LT
+λ0×
I)
‑1X
L
Y
L
ꢀꢀ
(3)
[0023]式中,X
LT
为数据X
L
的转置,I为单位矩阵;
[0024]根据离线岭回归模型的岭回归系数θ0通过公式(4)计算出各输入变量的权重矩阵公式(4)表示为:
[0025][0026]式中,θ0(1)为岭回归系数θ0的第一个元素,θ0(m)为岭回归系数θ0的第m个元素,为模型系数θ0所有元素绝对值的和;
[0027]建立查询数据与样本集之间的改进协同表示模型,优化目标为:
[0028][0029]式中,λ
ICRL
为的正则项系数,为对角矩阵,对角元素为各样本与查询数据之间的欧氏距离;
[0030]通过公式(6)计算协同表示系数β,公式(6)表示为:
[0031][0032]利用协同表示系数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于局部标签传播的即时学习半监督软测量建模方法,其特征在于,其具体步骤为:(一)通过工业传感器以及实验室化验分析等方式分别获取辅助变量以及质量变量的真实值,共得到n个历史样本为辅助变量的数量。其中,前n
l
个历史样本为已被标记的样本剩余的n
u
个样本为未被标记的样本(二)将已采集到的数据作为初始训练数据集对初始训练数据集按照公式(1)进行标准化处理,使其均值为0、方差为1,得到训练数据集X
std
为数据X标准化处理后得到的数据,为变量值标准化处理后得到的变量值,公式(1)表示为:式中,函数mean(
·
)表示计算矩阵各行的均值,函数std(
·
)表示计算矩阵各行的标准差;(三)对于新采集的查询数据按照公式(1)进行标准化处理并且将其按照未被标记的样本加入到历史数据库中;(四)根据历史数据中已被标记的样本首先通过改进的协同表示算法计算出样本集中的样本与的相似度权重然后通过局部加权岭回归算法建立关于查询数据的局部模型,模型系数为(五)在历史数据中,根据欧式距离选择出空间上距离查询数据最近的k1个历史样本,作为空间近邻样本集(包含);然后,将所有空间近邻样本的k2个时序近邻样本作为时间近邻样本集最后,合并空间以及时间近邻样本集,得到的双重近邻样本k
lp
为双重近邻样本的数量;(六)根据近邻样本通过基于局部模型约束的标签传播算法计算查询数据的输出值(七)当通过实验室化验分析等方式得到查询数据x
q
真实输出值y
q
时,将样本[x
q
,y
q
]加入到训练数据集中,并且重新进行标准化处理,以扩充历史数据中所包含的工作区间;否则,维持训练数据集中所包含空间不变。2.如权利要求1所述的基于局部标签传播的即时学习半监督软测量建模方法,其特征在于,步骤(四)中,利用已被标记的样本通过改进的协同表示算法计算出样
本集中的样本与的相似度权重的具体步骤为:利用样本集建立离线岭回归模型,优化目标为:式中,为离线岭回归模型的岭回归系数,λ0为离线岭回归模型的正则项系数;求解优化目标,得出离线岭回归模型的岭回归系数W0的解析表达式为:θ0=(X
L
X
LT
+λ0×
I)
‑...

【专利技术属性】
技术研发人员:王平尹贻超李雪静邓晓刚
申请(专利权)人:中国石油大学华东
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1