一种氨糖发酵过程中GlcNAc含量的预测方法及系统技术方案

技术编号:36388896 阅读:20 留言:0更新日期:2023-01-18 09:52
本发明专利技术涉及氨糖发酵技术领域,提供了一种氨糖发酵过程中GlcNAc含量的预测方法及系统,包括:获取待预测样本的特征,计算待预测样本对各阶段的隶属度;当待预测样本对某阶段的隶属度大于设定值时,采用该阶段对应的子模型进行GlcNAc含量的预测;当待预测样本对所有阶段的隶属度均小于设定值时,则选择隶属度最大的两个阶段,分别采用两个阶段对应的子模型进行GlcNAc含量的预测,并将两个预测结果进行加权和,得到最终的GlcNAc含量;其中,采用聚类算法将训练集中的样本数据划分到多个簇,每个簇对应一个氨糖发酵阶段,每个阶段包含的样本数据均用于训练神经网络,得到一个子模型。对于GlcNAc的含量具有良好的预测能力,同时满足了对于算法高精度与快收敛的要求。对于算法高精度与快收敛的要求。对于算法高精度与快收敛的要求。

【技术实现步骤摘要】
一种氨糖发酵过程中GlcNAc含量的预测方法及系统


[0001]本专利技术属于氨糖发酵
,尤其涉及一种氨糖发酵过程中GlcNAc含量的预测方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]微生物发酵是一个复杂且漫长的过程,具有多阶段的特点。一个完整的氨糖发酵生产过程通常需要约50

60小时,在氨糖发酵过程中,菌种通常会经历多种不同的生长阶段。由于各阶段的微生物生长特性存在差异,需要针对各阶段的参数调节具有不同的策略。如果对于这些因素不予理会,并对整个氨糖发酵过程建立统一的全局模型,将会增加模型结构的复杂程度,进而降低模型泛化能力。
[0004]采用多阶段建模的方式,可以更好的贴合氨糖的发酵过程,模型结构也相对较为简单。然而,对于氨糖发酵过程的多阶段软测量建模工作,氨糖发酵过程阶段样本划分的不准确将会严重影响模型的泛化能力,进而降低模型的预测精度。聚类算法是一种有效的数据分析技术,相比于依据人工的经验进行划分,采用聚类分析算法在划分准确性、解释度等方面都具有较为明显的优势。
[0005]在氨糖发酵过程中的某个时刻,可能既存在迟缓期的特征,也包含对数生长期的特征,处于一种相对模糊的阶段。针对此类问题,传统的聚类方法就显得不太适用。在该情况下,需要将氨糖发酵过程中的对象进行模糊的划分,并给出对象属于各类别的可能性。随着对于聚类算法研究的不断深入,有研究者发现利用模糊集理论可以针对此类问题进行有效处理,模糊聚类方法由此产生。模糊聚类方法是将样本与各类别的模糊关系通过隶属度方式进行确定。与传统的聚类算法相比,模糊聚类方法更加适用于许多边界不清的分类问题的求解。
[0006]随着对模糊聚类方法的研究,人们发现许多提出的模糊聚类方法对于数据量大、实时性要求高的问题表现不佳。为了解决此问题,模糊C

均值聚类(FCM)算法对目标函数进行了改进。FCM算法的核心是寻找分类中心,分类中心数量与类别数相同,同一类别的样本会分布在本类别分类中心附近。FCM方法作为一种局部搜索算法,采用梯度下降方式寻找最优聚类中心。因此,如果FCM初始聚类中心选择不当,则容易陷入局部最优点。

技术实现思路

[0007]为了解决上述
技术介绍
中存在的技术问题,本专利技术提供一种氨糖发酵过程中GlcNAc含量的预测方法及系统,引入多阶段建模思想,通过GA

FCM聚类算法对样本数据进行阶段划分后,利用划分的样本分别建立对应的子模型,最后利用组合策略对子模型进行组合,对于发酵生产过程中N

乙酰氨基葡萄糖(GlcNAc)的含量具有良好的预测能力,同时满足了对于算法高精度与快收敛的要求。
[0008]为了实现上述目的,本专利技术采用如下技术方案:
[0009]本专利技术的第一个方面提供一种氨糖发酵过程中GlcNAc含量的预测方法,其包括:
[0010]获取待预测样本的特征,计算待预测样本对各阶段的隶属度;
[0011]当待预测样本对某阶段的隶属度大于设定值时,采用该阶段对应的子模型进行GlcNAc含量的预测;
[0012]当待预测样本对所有阶段的隶属度均小于设定值时,则选择隶属度最大的两个阶段,分别采用两个阶段对应的子模型进行GlcNAc含量的预测,并将两个预测结果进行加权和,得到最终的GlcNAc含量;
[0013]其中,采用聚类算法将训练集中的样本数据划分到多个簇,每个簇对应一个氨糖发酵阶段,每个阶段包含的样本数据均用于训练神经网络,得到一个子模型。
[0014]进一步地,所述聚类算法的步骤包括:
[0015]步骤(1)产生遗传算法的初始种群,种群中的每个个体编码一种FCM算法初始聚类中心;
[0016]步骤(2)基于训练集中的样本数据,计算每个个体的适应度值;
[0017]步骤(3)判断是否满足遗传算法的停止条件,若满足则继续步骤(4);若不满足则利用选择、交叉和变异操作更新种群,返回步骤(2);
[0018]步骤(4)选择种群中的最优个体,解码最优个体,作为FCM算法初始聚类中心;
[0019]步骤(5)基于聚类中心,更新隶属度矩阵;
[0020]步骤(6)基于隶属度矩阵,对聚类中心进行更新;
[0021]步骤(7)基于更新后的聚类中心,计算目标函数值,若满足收敛误差,则聚类停止,输出隶属度矩阵和聚类中心;否则返回步骤(5)。
[0022]进一步地,所述子模型的构建过程为:
[0023]步骤

设置基于动量因子的BP神经网络的拓扑结构和参数;
[0024]步骤

对遗传算法的种群执行初始化,种群中的每个个体编码一种基于动量因子的BP神经网络的权值及阈值;
[0025]步骤

基于某阶段包含的样本数据,计算种群中每个个体的适应度值,并执行选择、交叉和变异操作更新种群;
[0026]步骤

判断是否满足遗传算法的终止条件,若满足则执行步骤

;否则返回步骤


[0027]步骤

基于适应度值在种群中选择出最优个体,将最优个体进行解码,作为基于动量因子的BP神经网络的初始权值和阈值,并结合设置的拓扑结构和参数,采用某阶段包含的样本数据对基于动量因子的BP神经网络进行训练,得到子模型。
[0028]进一步地,所述基于动量因子的BP神经网络的权值更新方式为:
[0029][0030][0031]式中:α为动量系数,α∈(0,1),η表示学习率,v(n)表示第n次迭代输入层到隐藏层之间的权值向量,w(n)表示第n次迭代隐藏层到输出层之间的权值向量,Δv(n)表示第n次
迭代输入层到隐藏层之间权值误差向量,Δw(n)表示第n次迭代隐藏层到输出层之间权值误差向量,E表示性能指标函数。
[0032]进一步地,所述基于动量因子的BP神经网络的学习率表示如下:
[0033]η(n+1)=η(n)
·2‑
sign[e(n)

e(n

1)][0034]式中:η(n)为BP神经网络采用的学习率;e(n)为误差值;n表示迭代次数;sign表示符号函数。
[0035]进一步地,通过计算各特征的平均不纯度减少与平均精确度减少,采用RF模型对特征进行关联度分析,选择与GlcNAc关联度最高的特征,用于子模型的构建。
[0036]进一步地,所述将两个预测结果进行加权和用公式表示为:
[0037][0038]式中,u
a
表示待预测样本对阶段a的隶属度,u
b
表示待预测样本对阶段b的隶属度,y
a
(x)表示阶段a对应的子模型的预测结果,y
b
(x)表示阶段b对应的子模型的预测结本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种氨糖发酵过程中GlcNAc含量的预测方法,其特征在于,包括:获取待预测样本的特征,计算待预测样本对各阶段的隶属度;当待预测样本对某阶段的隶属度大于设定值时,采用该阶段对应的子模型进行GlcNAc含量的预测;当待预测样本对所有阶段的隶属度均小于设定值时,则选择隶属度最大的两个阶段,分别采用两个阶段对应的子模型进行GlcNAc含量的预测,并将两个预测结果进行加权和,得到最终的GlcNAc含量;其中,采用聚类算法将训练集中的样本数据划分到多个簇,每个簇对应一个氨糖发酵阶段,每个阶段包含的样本数据均用于训练神经网络,得到一个子模型。2.如权利要求1所述的一种氨糖发酵过程中GlcNAc含量的预测方法,其特征在于,所述聚类算法的步骤包括:步骤(1)产生遗传算法的初始种群,种群中的每个个体编码一种FCM算法初始聚类中心;步骤(2)基于训练集中的样本数据,计算每个个体的适应度值;步骤(3)判断是否满足遗传算法的停止条件,若满足则继续步骤(4);若不满足则利用选择、交叉和变异操作更新种群,返回步骤(2);步骤(4)选择种群中的最优个体,解码最优个体,作为FCM算法初始聚类中心;步骤(5)基于聚类中心,更新隶属度矩阵;步骤(6)基于隶属度矩阵,对聚类中心进行更新;步骤(7)基于更新后的聚类中心,计算目标函数值,若满足收敛误差,则聚类停止,输出隶属度矩阵和聚类中心;否则返回步骤(5)。3.如权利要求1所述的一种氨糖发酵过程中GlcNAc含量的预测方法,其特征在于,所述子模型的构建过程为:步骤

设置基于动量因子的BP神经网络的拓扑结构和参数;步骤

对遗传算法的种群执行初始化,种群中的每个个体编码一种基于动量因子的BP神经网络的权值及阈值;步骤

基于某阶段包含的样本数据,计算种群中每个个体的适应度值,并执行选择、交叉和变异操作更新种群;步骤

判断是否满足遗传算法的终止条件,若满足则执行步骤

;否则返回步骤

;步骤

基于适应度值在种群中选择出最优个体,将最优个体进行解码,作为基于动量因子的BP神经网络的初始权值和阈值,并结合设置的拓扑结构和参数,采用某阶段包含的样本数据对基于动量因子的BP神经网络进行训练,得到子模型。4.如权利要求3所述的一种氨糖发酵过程中GlcNAc含量的预测方法,其特征在于,所述基于动量因子的BP神经网络的权值更新方式为:基于动量因子的BP神经网络的权值更新方式为:
式中:α为动量系数,α∈(0,1),η表示学习率,v(n)表示第n次迭代...

【专利技术属性】
技术研发人员:王艳卢伟杨文峰纪志成卢健行张倩张建华赵鹏
申请(专利权)人:山东润德生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1