当前位置: 首页 > 专利查询>浙江大学专利>正文

基于协同训练LWPLS的青霉素生产过程的控制方法技术

技术编号:13040038 阅读:105 留言:0更新日期:2016-03-23 11:12
本发明专利技术公开了基于协同训练LWPLS的青霉素生产过程的控制方法,用于在建模数据较少条件下的软测量建模并实现对于青霉素生产过程产品信息的预测。本发明专利技术利用基于协同训练的局部加权偏最小二乘学习方法,建立了一个有效的非线性预测模型,并克服了青霉素生产过程采样数据过少的情况下模型精度不高的问题,提高了针对该过程建立的模型预测准确率和性能,从而使得青霉素生产过程更加可靠,产品质量更加稳定。

【技术实现步骤摘要】

本专利技术属于青霉素生产过程预测与控制领域,尤其涉及一种基于少量样本情况下 利用协同训练算法与局部加权偏最小二乘算法的软测量建模方法。
技术介绍
在青霉素生产过程中,青霉素产品浓度的检测与控制有着至关重要的意义。由于 检测设备成本以及成分检测难度、时间滞后等因素的影响,青霉素生产过程中多采用软测 量方法来预测青霉素浓度信息。在工业过程中,类似于青霉素浓度这种具有重要作用的变 量我们称之为主导变量,其他的一些易于测量的变量我们称之为辅助变量。软测量指的是 通过建立工业过程变量之间的数学模型,实现利用辅助变量预测主导变量信息的技术方 法。 传统的软测量建模方法除了基于机理模型的方法以外,大多数采用多元统计分析 和机器学习的方法,例如主元回归PCR和偏最小二乘PLS等,在机理模型难以获取的情况 下,基于数据驱动的多元统计分析方法已经成为工业过程软测量的主流方法。但是,传统的 多元统计方法在训练样本数目较少的情况下,所建立起的模型往往不能够达到有效的预测 精度;此外,传统多元统计学习方法建模时,得到利用的往往都是那些既包括辅助变量又包 括对应主导变量信息的数据,亦即我们所说的有标签数据,而没有对应主导变量仅包含辅 助变量信息的数据,也就是我们所说的无标签数据往往被忽视了。利用已有的有标签数据 建立起来的模型往往精度不够,而有着一定有用信息的无标签数据又被浪费掉了,传统方 法的这一弊端大大限制了它们的预测效果。
技术实现思路
本专利技术的目的在于针对青霉素生产过程中现有技术的不足,提供一种基于协同训 练LWPLS的青霉素生产过程的控制方法,本专利技术是针对青霉素生产过程中训练数据较少情 况下的软测量建模问题。该方法首先利用集散控制系统收集有标签与无标签数据,利用有 标签数据建立初始的具有一定差异性的两个模型,然后在初始模型的基础上,通过不断的 迭代循环,逐步的将置信度最高的无标签数据转换为有标签数据并加入到训练集中来,逐 渐扩大训练集的样本数目,最终达到提高模型精度的效果。本专利技术不仅提高了青霉素生产 过程的软测量模型预测效果,增强了过程操作员对过程状态的掌握,使工业生产更加安全, 产品质量更加稳定;而且很大程度上改善了软测量建模方法对过程知识的依赖性,更加有 利于工业过程的自动化实施。 本专利技术的目的是通过以下技术方案实现的:一种基于协同训练LWPLS的青霉素生 产过程的控制方法,包括以下步骤: (1)利用集散控制系统以及离线检测方法,收集工业生产过程的数据,所述数据包 括主导变量数据和辅助变量数据,所述主导变量数据为青霉素浓度,组成建模用的训练样 本集。对于收集到的训练样本集,一部分为既包含主导变量数据也包含辅助变量数据的有 标签样本,组成有标签样本集DeRKX\其中,K为有标签样本集中采样数据点的个数,J为 有标签样本集中的变量个数,R为实数集;另一部分为只包含辅助变量数据的无标签样本, 组成无标签样本集UeRNXM,其中,N为无标签样本集中采样数据点的个数,Μ为无标签样本 集中的变量个数,将这些数据存入历史数据库。 (2)将有标签样本集D按照生产批次进行分类,针对同一个生产批次中的有标签 样本,沿着时间点方向对每一个样本进行排列,得到新的数据矩阵,并对其进行预处理和归 一化,即使得各个过程变量的均值为零,方差为1,得到新的二维数据矩阵De 。 (3)将步骤2得到的二维数据矩阵5分割为自变量矩ρ? 因变量矩¥?其中组成因变量矩阵的因变量数据为主导变量数据,即青霉 素浓度;由此,该二维数据矩阵)可以重新描述夕 (4)利用步骤3得到的自变量矩罔与因变量矩罔并采用不同的距离度量方式来构造两个不同的初始模型。假设样本之间的距离为d,则相似 度ω=fun(d)分别表示为: ω:=ed/1° (1) ω2= 3 d/1° (2) 由此我们可以获得两个不同的初始局部加权偏最小二乘模型LWPLS1和LWPLS2。 (5)首先,利用初始的模型LWPLSKco1:ed/1°)对所有无标签样本进行预测,从 无标签样本中选取一个置信度最高的样本,与其预测值一起组成一个新的有标签数据,将 其加入到LWPLS2的训练集中,再训练出新的模型LWPLS2,再利用LWPLS2选取置信度最高 的无标签样本,与其预测值一起组成一个新的有标签数据,添加到LWPLS1的训练集中更新 LWPLS1,如此不断迭代使用无标签数据更新模型训练数据,当达到终止条件时,终止迭代。 (6)将建模数据和各个模型参数存入历史数据库和实时数据库中备用。 (7)收集新的过程数据,并对其进行预处理和归一化。 (8)采用基于协同训练算法的局部加权偏最小二乘方法对工业过程的变量进行预 测,根据得到的预测值,对工业过程中的辅助变量数据进行调节,实现工业过程的控制。 进一步地,所述步骤4具体为:对:,..其第n(n= 1,2, 3···Κ)个样本点表述为:xn= T,yn。并利用样本点的自变量之间的距离来计算它们的相似度。设样本点\和Sn之间 的相似度为ω,则ω的计算方法为:ωη=fun(dn) (3)(4:) 其中,Χηι表示第n个样本点中第i个自变量,Xqi表示第q个样本点中第i个自变 量;对于测试样本Sq:Xq,通过计算每个训练样本与其之间的相似度CO,并选取相似度最高 的前k个训练样本构造模型对测试样本的对应输出进行预测,构造及预测的步骤如下: (1)确定隐变量个数R,并设其在算法中的初值r= 1。 (2)计算每个训练样本与测试样本之间的相似度ω,并取ω值最大的k个样本, 相应的将它们的ω值组成相似度矩阵Ω=diag(ωω2,…,ωk),并计算中间变量I,乙 以及Xqj: 其中,lke…为一个元素全为1的向量。 (3)计算X的第r个隐变量:tr=Xrwr (10) 其中,^为丈ΩΥ,的最大特征值对应的特征向量。 (4)计算X的第r个负载向量和回归系数向量: (5)计算第q个样本点xq的第r个隐变量:(13) (6)当r=R,贝丨J计算相应的预测值\ =ν+ |χ爲,完成迭代,否则令r~lxq_r+1=Xq_r-tq_rpr (16) 然后令r=r+1,将上述三式代入第(3)步,继续进行迭代计算。 进一步地,所述步骤5具体为: 首先,利用初始的模型LWPLS1对所有无标签样本进行预测,在无标签数据集中, 对于每个样本点= …,建立训练样本关于样本点的局部加权模 型Model,根据此模型得到该样本点的预测值yi,并计算此模型在前k-ι个有标签样本点上 的均方误差值RMSE1;接下来,将该无标签样本X^及其预测值yi作为一个新的有标签样本 加入到原有的训练集中去,并重新建立新的训练集对于此样本的模型Model'。计算Model' 在后k-1样本点上的均方误差值RMSE/,并计算二者的差值RMSEdlM=RMSE「RMSE/。按 照此方法计算每个无标签样本的RMSEdlM,i= 1,2···Ν。若所有RMSEdlf均小于0,则认为已 经达到终止条件,停止迭代,否则,取使得RMSEdlf最大的新加标签样本作为置信度最高的样 本,亦S=为新的有标签样本添加到LWPLS2的训练集中 去以更新该训练集,并从无标签数据集中剔除样本点Xf。当前第1页1 2 3本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/54/CN105425583.html" title="基于协同训练LWPLS的青霉素生产过程的控制方法原文来自X技术">基于协同训练LWPLS的青霉素生产过程的控制方法</a>

【技术保护点】
一种基于协同训练LWPLS的青霉素生产过程的控制方法,其特征在于,包括以下步骤:(1)利用集散控制系统以及离线检测方法,收集工业生产过程的数据,所述数据包括主导变量数据和辅助变量数据,所述主导变量数据为青霉素浓度,组成建模用的训练样本集。对于收集到的训练样本集,一部分为既包含主导变量数据也包含辅助变量数据的有标签样本,组成有标签样本集D∈RK×J,其中,K为有标签样本集中采样数据点的个数,J为有标签样本集中的变量个数,R为实数集;另一部分为只包含辅助变量数据的无标签样本,组成无标签样本集U∈RN×M,其中,N为无标签样本集中采样数据点的个数,M为无标签样本集中的变量个数,将这些数据存入历史数据库。(2)将有标签样本集D按照生产批次进行分类,针对同一个生产批次中的有标签样本,沿着时间点方向对每一个样本进行排列,得到新的数据矩阵,并对其进行预处理和归一化,即使得各个过程变量的均值为零,方差为1,得到新的二维数据矩阵(3)将步骤2得到的二维数据矩阵分割为自变量矩阵与因变量矩阵其中组成因变量矩阵的因变量数据为主导变量数据,即青霉素浓度;由此,该二维数据矩阵可以重新描述为:Σi=1KSi:(XiM,Yi);]]>(4)利用步骤3得到的自变量矩阵与因变量矩阵并采用不同的距离度量方式来构造两个不同的初始模型。假设样本之间的距离为d,则相似度ω=fun(d)分别表示为:ω1=e‑d/10     (1)ω2=3‑d/10     (2)由此我们可以获得两个不同的初始局部加权偏最小二乘模型LWPLS1和LWPLS2。(5)首先,利用初始的模型LWPLS1(ω1=e‑d/10)对所有无标签样本进行预测,从无标签样本中选取一个置信度最高的样本,与其预测值一起组成一个新的有标签数据,将其加入到LWPLS2(ω2=3‑d/10)的训练集中,再训练出新的模型LWPLS2,再利用LWPLS2选取置信度最高的无标签样本,与其预测值一起组成一个新的有标签数据,添加到LWPLS1的训练集中更新LWPLS1,如此不断迭代使用无标签数据更新模型训练数据,当达到终止条件时,终止迭代。(6)将建模数据和各个模型参数存入历史数据库和实时数据库中备用。(7)收集新的过程数据,并对其进行预处理和归一化。(8)采用基于协同训练算法的局部加权偏最小二乘方法对工业过程的变量进行预测,根据得到的预测值,对工业过程中的辅助变量数据进行调节,实现工业过程的控制。...

【技术特征摘要】

【专利技术属性】
技术研发人员:葛志强包亮
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1