一种基于JIT-RVM的多模态间歇过程建模方法技术

技术编号:19318834 阅读:24 留言:0更新日期:2018-11-03 10:12
本发明专利技术公开了一种基于JIT‑RVM的多模态间歇过程建模方法,属于间歇过程监测技术领域。首先将三维间歇过程历史数据沿时间方向展开并进行标准化;然后利用SCFCM算法对标准化后的数据进行模态划分,得到多个模态数据子集,在RVM中引入即时学习,并引入能够同时从模态归属和结构距离上评价数据相似性的数据融合相似度计算因子,计算实时数据与历史数据之间的数据融合相似度;最后以数据融合相似度最大化为寻优目标,建立即时学习最优训练数据集,进而利用RVM算法建立多模态间歇过程模型。本方法充分考虑了间歇过程数据的动态特性,采用即时学习和数据融合相似度建立了即时学习最优训练数据集,提高了建模精度。

A multimodal batch process modeling method based on JIT-RVM

The invention discloses a multi-mode batch process modeling method based on JIT RVM, which belongs to the technical field of batch process monitoring. Firstly, the historical data of three-dimensional batch process is expanded and standardized along the time direction; secondly, the standardized data is divided into several subsets of modal data by using SCFCM algorithm, and real-time learning is introduced into RVM, and data fusion which can simultaneously evaluate data similarity from modal attribution and structural distance is introduced. The similarity between real-time data and historical data is calculated by similarity calculation factor. Finally, the optimal training data set for real-time learning is established with the goal of maximizing the similarity of data fusion, and then the multi-modal batch process model is established by using RVM algorithm. This method takes full account of the dynamic characteristics of batch process data, and establishes the optimal training data set of real-time learning by using the similarity of real-time learning and data fusion, which improves the accuracy of modeling.

【技术实现步骤摘要】
一种基于JIT-RVM的多模态间歇过程建模方法
本专利技术涉及一种多模态间歇过程建模方法,属于间歇过程监测
,尤其涉及一种基于即时学习相关向量机(Just-in-timeLearningRelevanceVectorMachine,JIT-RVM)的多模态间歇过程建模方法。
技术介绍
间歇生产过程是精细化工、生物化学、制药以及食品等工业生产领域的一种重要生产方式。建立高质量的间歇过程模型,能够准确描述间歇过程的动态变化,为间歇过程监测与优化控制提供基础。传统的基于主元回归、偏最小二乘回归、人工神经网络、支持向量回归等数据驱动建模方法缺乏对于模型不确定性的表达,所建模型不具备统计解释性,建模精度较低。基于相关向量机(RelevanceVectorMachine,RVM)的建模方法能够将模型参数视为随机变量并赋予先验分布,通过观测数据对分布参数进行修正,并通过贝叶斯推理给出模型的不确定性,使模型具备统计解释性,已应用于间歇过程建模,具有较高的模型精度。然而,实际间歇过程中存在多个生产模态,不同模态具有不同的过程特性,且含有复杂的动态特性,而现有的基于RVM的多模态间歇过程建模方法利用同一模态的过程数据训练模型,使得训练数据集中包含了部分与当前过程特性不相似的无效训练数据,制约了模型精度的提高。因此,需要在建模前对历史数据进行筛选,提取与当前过程数据最为相似的历史数据建立有效训练数据集。本专利技术充分考虑间歇过程数据的动态特性,在RVM中引入即时学习和数据融合相似度计算因子,建立了即时学习最优训练数据集,提高了模型的精度。
技术实现思路
本专利技术以提高多模态间歇过程建模精度为目的,先将三维间歇过程历史数据沿时间方向展开并进行标准化;然后利用时序约束的模糊C均值聚类(Sequence-ConstrainedFuzzyC-Means,SCFCM)对标准化后的数据进行模态划分,得到多个模态数据子集,在RVM中引入即时学习,并引入能够同时从模态归属和结构距离上评价数据相似性的数据融合相似度计算因子,利用数据融合相似度计算因子计算实时数据与历史数据之间的数据融合相似度;最后,以数据融合相似度最大化为寻优目标,获得即时学习最优训练数据集,进而利用RVM算法建立多模态间歇过程模型。本专利技术采用的技术方案为一种基于JIT-RVM的多模态间歇过程建模方法,该方法具体包括以下步骤:步骤一:将间歇过程状态变量及测量变量三维历史数据沿变量方向展开为二维数据,再将三维历史数据中状态变量数据按时间方向展开为二维数据并标准化数据,由此得到预处理后的间歇过程数据;步骤二:利用SCFCM算法对步骤一得到的预处理后的间歇过程数据进行模态划分,得到多模态划分结果;步骤三:利用间歇过程状态变量的机理模型进行状态估计,得到状态变量实时估计数据,根据步骤二所得多模态划分结果,判断间歇过程数据所属模态及其编号;步骤四:引入数据融合相似度计算因子,计算状态变量实时估计数据与历史数据之间的相似度,提取所有相似历史数据的输入部分及其对应输出值部分,构建即时学习最优相似训练集,建立JIT-RVM模型,最终得到多模态间歇过程模型。具体而言,步骤一包括如下步骤:将间歇过程三维历史状态变量数据按照时间方向展开为二维矩阵Xt(IJ1×K),其中i为批次编号,Xi为第i个批次的状态数据矩阵,I为总批次个数,J1为状态变量个数,K为总采样时间,并根据式(1)对展开数据Xt进行时间方向上的标准化。式中,mean(·)为数据集按照时间方向上的均值;std(·)为数据集按照时间方向上的标准差;为标准化后的数据集。将间歇过程状态变量及测量变量历史数据按照变量方向展开为二维矩阵Xv(IK×J1)、Yv(IK×J2),Yi为第i个批次的测量变量数据矩阵,J2为测量变量个数,为后续步骤提供数据基础。步骤二包括如下步骤:利用轨迹划分法对经时间展开后的待划分数据集进行模态粗划分,获得C个粗划分聚类中心1<C<<N;左侧边界及隶属度矩阵其中N为训练数据个数,n为数据编号,c为聚类中心编号,vc和bc分别为第c个聚类中心及其左边界,uc,n为第n个训练数据对第c个聚类中心的隶属度。采用式(2)的目标函数,根据误差平方和最小原则,进行SCFCM模态细划分。式中,m为模糊聚类指数,1≤m<∞;||·||为L2范式。为了求解式(2)所示优化函数,引入拉格朗日乘子,利用式(3)和式(4)分别计算第k个聚类中心以及数据对第k个聚类中心的隶属度,k为当前聚类中心序号。考虑训练数据集的时序性,引入迭代最优策略,按照时序逐个读入训练数据及其粗划分后的结果,若训练数据处于第k类的前半区间[bk,bk+zk/2],zk=bk+1-bk,zC=N-bC,k=2,3,...,C,则按照式(5)更新数据的隶属度;若训练数据处于第k类的后半区间[bk+zk/2,bk+1],zk=bk+1-bk,k=1,2,...,C-1,则按照式(6)更新数据的隶属度。式中,h为聚类中心编号;zk为第k类的区间长度。利用式(7)对第k个聚类中心vk进行更新,记更新后的第k个聚类中心为利用式(8)对第k个聚类中心的误差平方和Lk进行更新,记更新后的第k个聚类中心的误差平方和为判断目标误差平方和是否小于设定的阈值,或更新后隶属度与原隶属度uc,n之差是否小于一定范围,若两个条件均不满足,则重新执行式(5)至式(8)的计算过程,进行模态更新;若有一个条件满足,则更新结束。提取数据的隶属度向量中最大值及其序号利用式(9)进行模态识别,若最大隶属度则认为属于第主模态;若最大隶属度且次最大隶属度为或则认为当前样本处于由第至第个或由第至第个主模态间的过渡模态。式中,κn为当前数据所属模态序号。判断是否已遍历所有训练数据,若是,则模态划分结束;若否,则读取下一个训练样本,并利用式(6)至式(9)进行模态划分,最终获得多模态划分结果,将Xv(IK×J1),Yv(IK×J2)划分为C个主模态数据子集以及D个过渡模态数据子集,D=C-1。步骤三包括如下步骤:利用式(10)所示间歇过程机理模型进行状态实时估计,获得状态变量实时估计新数据xtest,并利用步骤二所得模态划分结果,获得状态变量实时估计数据xtest所属模态及其编号κtest,若当前数据属于主模态,则提取第κtest个主模态历史数据子集;若当前数据处于过渡模态,则提取第κtest个过渡模态及其相邻两主模态历史数据子集,构成状态变量实时估及数据xtest的模态历史数据子集{Xtest,Ytest}。式中,υ为控制变量;η为系统噪声。步骤四包括如下步骤:为了从过程特性上和空间特性同时寻找与状态变量实时估计数据xtest特性相近的历史数据,分别根据式(11)和式(12)计算数据模态相似度Sm,n和数据代数空间相似度So,n。Sm,n=exp(-||utest-un||2)(11)So,n=exp(-||xtest-xn||2)(12)式中,n为数据序号;un和utest分别第n个历史数据与状态变量新数据的隶属度值;xn为第n个历史状态数据。为了融合两个相似度,利用式(13)和式(14)分别对计算出的数据模态相似度Sm,n和数据代数空间相似度So,n进行标准化。式中,为数据模本文档来自技高网...

【技术保护点】
1.一种基于JIT‑RVM的多模态间歇过程建模方法,其特征在于:该方法具体包括以下步骤:步骤一:将间歇过程状态变量及测量变量三维历史数据沿变量方向展开为二维数据,再将三维历史数据中状态变量数据按时间方向展开为二维数据并标准化数据,由此得到预处理后的间歇过程数据;步骤二:利用SCFCM算法对步骤一得到的预处理后的间歇过程数据进行模态划分,得到多模态划分结果;步骤三:利用间歇过程状态变量的机理模型进行状态估计,得到状态变量实时估计数据,根据步骤二所得多模态划分结果,判断间歇过程数据所属模态及其编号;步骤四:引入数据融合相似度计算因子,计算状态变量实时估计数据与历史数据之间的相似度,提取所有相似历史数据的输入部分及其对应输出值部分,构建即时学习最优相似训练集,建立JIT‑RVM模型,最终得到多模态间歇过程模型。

【技术特征摘要】
1.一种基于JIT-RVM的多模态间歇过程建模方法,其特征在于:该方法具体包括以下步骤:步骤一:将间歇过程状态变量及测量变量三维历史数据沿变量方向展开为二维数据,再将三维历史数据中状态变量数据按时间方向展开为二维数据并标准化数据,由此得到预处理后的间歇过程数据;步骤二:利用SCFCM算法对步骤一得到的预处理后的间歇过程数据进行模态划分,得到多模态划分结果;步骤三:利用间歇过程状态变量的机理模型进行状态估计,得到状态变量实时估计数据,根据步骤二所得多模态划分结果,判断间歇过程数据所属模态及其编号;步骤四:引入数据融合相似度计算因子,计算状态变量实时估计数据与历史数据之间的相似度,提取所有相似历史数据的输入部分及其对应输出值部分,构建即时学习最优相似训练集,建立JIT-RVM模型,最终得到多模态间歇过程模型。2.根据权利要求1所述的一种基于JIT-RVM的多模态间歇过程建模方法,其特征在于:步骤一包括如下步骤:将间歇过程三维历史状态变量数据按照时间方向展开为二维矩阵Xt(IJ1×K),其中i为批次编号,Xi为第i个批次的状态数据矩阵,I为总批次个数,J1为状态变量个数,K为总采样时间,并根据式(1)对展开数据Xt进行时间方向上的标准化;式中,mean(·)为数据集按照时间方向上的均值;std(·)为数据集按照时间方向上的标准差;为标准化后的数据集;将间歇过程状态变量及测量变量历史数据按照变量方向展开为二维矩阵Xv(IK×J1)、Yv(IK×J2),Yi为第i个批次的测量变量数据矩阵,J2为测量变量个数,为后续步骤提供数据基础。3.根据权利要求1所述的一种基于JIT-RVM的多模态间歇过程建模方法,其特征在于:步骤二包括如下步骤:利用轨迹划分法对经时间展开后的待划分数据集进行模态粗划分,获得C个粗划分聚类中心1<C<<N;左侧边界及隶属度矩阵U=[uc,n](C×N),其中N为训练数据个数,n为数据编号,c为聚类中心编号,vc和bc分别为第c个聚类中心及其左边界,uc,n为第n个训练数据对第c个聚类中心的隶属度;采用式(2)的目标函数,根据误差平方和最小原则,进行SCFCM模态细划分;式中,m为模糊聚类指数,1≤m<∞;||·||为L2范式;为了求解式(2)所示优化函数,引入拉格朗日乘子,利用式(3)和式(4)分别计算第k个聚类中心以及数据对第k个聚类中心的隶属度,k为当前聚类中心序号;考虑训练数据集的时序性,引入迭代最优策略,按照时序逐个读入训练数据及其粗划分后的结果,若训练数据处于第k类的前半区间[bk,bk+zk/2],zk=bk+1-bk,zC=N-bC,k=2,3,...,C,则按照式(5)更新数据的隶属度;若训练数据处于第k类的后半区间[bk+zk/2,bk+1],zk=bk+1-bk,k=1,2,...,C-1,则按照式(6)更新数据的隶属度;式中,h为聚类中心编号;zk为第k类的区间长度;利用式(7)对第k个聚类中心vk进行更新,记更新后的第k个聚类中心为利用式(8)对第k个聚类中心的误差平方和Lk进行更新,记更新后的第k个聚类中心的误差平方和为判断目标误差平方和是否小于设定的阈值,或更新后隶属度与原隶属度uc,n之差是否小于一定范围,若两个条件均不满足,则重新执行式(5)至式(8)的计算过程,进行模态更新;若有一个条件满足,则更新结束;提取数据的隶属度向量中最大值及其序号利用式(9)进行模态识别,若最大隶属度则认为属于第...

【专利技术属性】
技术研发人员:王建林张维佳韩锐邱科鹏赵利强
申请(专利权)人:北京化工大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1