基于混合MPLS的多阶段过程质量预报方法技术

技术编号:16586758 阅读:24 留言:0更新日期:2017-11-18 14:19
本发明专利技术涉及一种基于混合MPLS的多阶段过程质量预报方法。首先,利用GMM模型对每批次采集数据进行阶段识别。针对多批次同一子阶段长度不等问题,应用动态时间归整(Dynamic time warping,DTW)算法依据相似度最小和最长反应持续时间同步为等长轨迹。并在同步后的数据集中按变量展开方式建立单MPLS模型。其次,根据Fisher判据分析(Fisher DiscriminantAnalysis,FDA)方法寻找各数据集之间最佳的投影向量,最小化子阶段数据样本间的相关性,并引入核密度方法估计各子阶段数据在最佳投影向量上的概率密度分布,来在线监测阶段切换。最后,利用贝叶斯原则融合各子阶段MPLS模型进行质量预报。

Multi stage process quality prediction method based on hybrid MPLS

The present invention relates to a multi-stage process quality prediction method based on hybrid MPLS. First, the GMM model is used to identify each batch of data. For multiple batches of the same stage of unequal length, using dynamic time warping (Dynamic time warping, DTW) algorithm based on the similarity between the minimum and maximum duration of response synchronization for isometric trajectory. The single MPLS model is established by the variable expansion method in the synchronized data set. Secondly, according to the Fisher criterion analysis (Fisher DiscriminantAnalysis, FDA) method to search for the optimal projection vector between each data set, the correlation minimization sub stage between data samples, and the introduction of kernel density estimation method of sub phase data in the best projection vector on the probability density distribution, online monitoring stage switch. Finally, the Bayesian principle is used to fuse each sub stage MPLS model to forecast the quality.

【技术实现步骤摘要】
基于混合MPLS的多阶段过程质量预报方法
本专利技术属于自动化控制
,具有涉及一种基于混合MPLS的多阶段过程质量预报方法。
技术介绍
在工业过程中,由于工艺和检测技术的限制,产品的质量指标难以在线直接测量,需要离线分析得到,导致产品质量信息具有一定的时间滞后性,使得产品质量很难得到在线反馈和控制。但是工业过程中许多易于测量的过程变量蕴含着最终的质量信息,可以通过分析过程变量和产品质量测量值之间的关系,进而对产品生产过程建模,实现对产品质量的在线预测。传统的基于解析模型的生产过程质量预测需要准确的数学和生产经验,从而限制了其实际应用。多向主元分析(Multi-wayPrincipleComponentAnalysis,MPCA)和多向偏最小二乘(Multi-waypartialLeastSquares,MPLS)是经常采用的统计过程控制方法(MultipleStatisticalProcessControl,MSPC)。MPLS是采用多元统计分析方法,将过程数据和质量数据从高维数据空间投影到低维特征子空间,所得到的特征变量保留了原始数据的特征信息,是一种高维数据处理的有效工具。但是传统的MPLS使用整个处理过程数据作为输入,提取和质量变量最相关的特征过程变量,所建立的预报模型需要全局的处理数据之间高度的相关性,忽略了局部的反应过程对最终质量的影响。事实上,工业生产过程存在多阶段、局部性等固有特征。因此更多潜在的局部信息可以通过将数据分为更有意义的数据块进行分析,多阶段方法广泛地应用在在线和离线的质量预报。Duchesne等提出轨迹Multi-blockPLS方法,利用中间过程质量信息提取多阶段和质量变量相关的特征,但是工业过程中中间质量信息很少,限制了该方法的应用。于涛等应用MPCA方法对按批次展开的时间块进行PCA计算,通过第一主元的变化和阶段内负载矩阵的变化作为依据进行阶段划分,再在相关阶段建立PLS模型,取得一定质量预报效果。但是对测量变量的PCA分析未能有效地解释质量相关的变化,而且各阶段模型相互独立,未能反应局部过程对最终质量的影响。
技术实现思路
为了克服现有技术的不足,提出了一种基于混合MPLS的多阶段过程质量预报方法。首先,利用GMM模型对每批次采集数据进行阶段识别。针对多批次同一子阶段长度不等问题,应用动态时间归整(Dynamictimewarping,DTW)算法依据相似度最小和最长反应持续时间同步为等长轨迹。并在同步后的数据集中按变量展开方式建立单MPLS模型。其次,根据Fisher判据分析(FisherDiscriminantAnalysis,FDA)方法寻找各数据集之间最佳的投影向量,最小化子阶段数据样本间的相关性,并引入核密度方法估计各子阶段数据在最佳投影向量上的概率密度分布,来在线监测阶段切换。最后,利用贝叶斯原则融合各子阶段MPLS模型进行质量预报。专利技术的技术方案为:一种基于混合MPLS的多阶段过程质量预报方法,本方法基于在偏最小二乘,记作PLS,PLS是多元统计分析中一个重要的方法,研究多维矩阵X和Y之间的关系,寻找最优的低维特征解释方向,多向偏最小二乘方法,记作MPLS,是PLS的一种推广形式,其通过将多批次的历史过程数据矩阵X(I×J×K)和质量数据矩阵Y(I×M×K)以变量方式展开为二维矩阵X(IK×J)和Y(IK×M),并提取低维的潜在特征;MPLS形式如下:X(IK×J)=TPT+EY(IK×M)=QUT+F式中,T(IK×A),P(J×A)为矩阵X的得分和负载矩阵,同一子阶段内数据分布相似,不同阶段间的分布差异很大,为了保证子阶段内相似数据分布的预报性能,分别建立各子阶段MPLS模型,并结合Fisher判据分析和核密度估计方法优点提出一种FDA_Kernel状态监测方法,显著子阶段内以及阶段间的状态切换,实现多阶段状态监测,根据贝叶斯原则在FDA_Kernel状态监测中融合质量变量信息得到混合MPLS模型,具体步骤为:第一步,进行离线建模1)对I批历史过程数据xi(K×J)和质量数据yi(K×M)进行标准化。并根据GMM模型对过程和质量数据组成的高维分布进行阶段识别,得到每批次p个子阶段数据子集,其中i为对应历史过程批次,J为测量变量个数,M为质量变量个数,K为批次反应时间;2)根据相似度最小和同一子阶段最大持续时间原则,应用动态时间规整技术(DTW)同步多批次同一子阶段为等长轨迹;3)同步后的子阶段数据按变量展开方式得到子阶段过程数据Xi(Ki×J)和质量数据Yi(Ki×M),其中,Ki,n为第n批历史批次第i个阶段的数据样本数,i=1,2,..,p,并在各子阶段中建立MPLS模型;第二步,在线质量预报1)当新的测量数据xnew∈R1×J到来时,对新数据标准化,计算xnew∈R1×J在最佳分离向量的投影值x∈R,计算x属于各子阶段的先验概率,2)计算xnew∈R1×J在各子阶段MPLS模型的质量预报输出,方法为:假定经阶段划分得到的n个子阶段过程变量数据集质量变量数据集其中,J,M为过程数据和质量变量维数,Ki为第i个子阶段数据集样本数,i=1,2,..,n,具体包含以下步骤:1)利用FDA方法得到最佳投影变换后的n个数据集和最佳分离向量w,并利用核密度方法估计数据集中数据样本概率密度分布模型fi(x),i=1,2,..,n,2)在第i个阶段中利用过程变量集和质量变量数据集建立子阶段MPLSi模型,3)利用质量变量数据集修正第i个阶段的概率密度分布模型fi(x),得到后验概率模型pi(x|y),4)对新的采集数据xnew∈R1×J,利用计算xnew在最佳分离向量w的投影值根据贝叶斯原则对在线过程变量数据xnew按照下式进行质量预报,yi=xnewRi其中,为混合的质量预报值,yi为第i个阶段的MPLSi模型的质量预报值,Ri为对应子阶段MPLS模型的回归系数,i=1,2,..,p。本专利技术有益效果本专利技术引入统计分布较好的高斯混合模型,识别和聚类出工业过程多子阶段数据集,分别在各子阶段数据集中建立MPLS模型,根据贝叶斯原则融合各子阶段模型进行质量预报,该方法能够有效地实现过程监测,实现较精确的质量预测。说明书附图图1部分训练批次数据集各阶段划分示意图;图2(a)、(b)、(c)示出阶段1、2、3训练数据在最佳分离向量上概率密度分布图图3MPLS方法对测试批次5菌体浓度预报值和实际浓度值。图4MPLS方法对测试批次5青霉素浓度预报值和实际浓度值图5混合MPLS方法对测试批次5菌体浓度预报值和实际浓度值图6混合MPLS方法对测试批次5青霉素浓度预报值和实际浓度值具体实施方式在本专利技术中,引入统计分布较好的高斯混合模型,识别和聚类出工业过程多子阶段数据集,分别在各子阶段数据集中建立MPLS模型,根据贝叶斯原则融合各子阶段模型进行质量预报,该方法在多向偏最小二乘基础上实现较精确的质量预测。偏最小二乘(PLS)是多元统计分析中一个重要的方法,PLS侧重多维矩阵X和Y之间的关系,寻找最优的低维特征解释方向,这种最优是建立在从输入空间到输出空间的预测能力意义上的。多向偏最小二乘方法(MPLS)是PLS的一种推广,其通过将多批次的历史过程数据矩阵X(I×J×K)本文档来自技高网
...
基于混合MPLS的多阶段过程质量预报方法

【技术保护点】
一种基于混合MPLS的多阶段过程质量预报方法,其特征是:本方法基于在偏最小二乘,记作PLS,PLS是多元统计分析中一个重要的方法,研究多维矩阵X和Y之间的关系,寻找最优的低维特征解释方向,多向偏最小二乘方法,记作MPLS,是PLS的一种推广形式,其通过将多批次的历史过程数据矩阵X(I×J×K)和质量数据矩阵Y(I×M×K)以变量方式展开为二维矩阵X(IK×J)和Y(IK×M),并提取低维的潜在特征;MPLS形式如下:X(IK×J)=TP

【技术特征摘要】
1.一种基于混合MPLS的多阶段过程质量预报方法,其特征是:本方法基于在偏最小二乘,记作PLS,PLS是多元统计分析中一个重要的方法,研究多维矩阵X和Y之间的关系,寻找最优的低维特征解释方向,多向偏最小二乘方法,记作MPLS,是PLS的一种推广形式,其通过将多批次的历史过程数据矩阵X(I×J×K)和质量数据矩阵Y(I×M×K)以变量方式展开为二维矩阵X(IK×J)和Y(IK×M),并提取低维的潜在特征;MPLS形式如下:X(IK×J)=TPT+EY(IK×M)=QUT+F式中,T(IK×A),P(J×A)为矩阵X的得分和负载矩阵,同一子阶段内数据分布相似,不同阶段间的分布差异很大,为了保证子阶段内相似数据分布的预报性能,分别建立各子阶段MPLS模型,并结合Fisher判据分析和核密度估计方法优点提出一种FDA_Kernel状态监测方法,显著子阶段内以及阶段间的状态切换,实现多阶段状态监测,根据贝叶斯原则在FDA_Kernel状态监测中融合质量变量信息得到混合MPLS模型,具体步骤为:第一步,进行离线建模1)对I批历史过程数据xi(K×J)和质量数据yi(K×M)进行标准化。并根据GMM模型对过程和质量数据组成的高维分布进行阶段识别,得到每批次p个子阶段数据子集,其中i为对应历史过程批次,J为测量变量个数,M为质量变量个数,K为批次反应时间;2)根据相似度最小和同一子阶段最大持续时间原则,应用动态时间规整技术(DTW)同步多批次同一子阶段为等长轨迹;3)同步后的子阶段数据按变量展开方式得到子阶段...

【专利技术属性】
技术研发人员:王培良叶晓丰杨泽宇
申请(专利权)人:湖州师范学院
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1