燃料乙醇发酵过程工业知识图谱构建方法技术

技术编号:30229370 阅读:17 留言:0更新日期:2021-09-29 09:59
本发明专利技术公开了一种燃料乙醇发酵过程工业知识图谱构建方法,属于工业生物发酵过程智能制造领域。该方法分为三个阶段:首先需要采集燃料乙醇生产过程中的液化过程、酒母过程和发酵过程的数据,根据采集到的数据,构建并优化一个出罐乙醇体积比的预测模型,根据此模型初步筛选影响燃料乙醇生产过程的重要特征;然后以这些特征为根源,寻找上级生产阶段中与它们有明显因果关系的变量,直到每个生产阶段所有符合条件的变量被找到;最后以知识图谱的形式呈现找到的关键变量及其之间的因果关系程度。呈现找到的关键变量及其之间的因果关系程度。呈现找到的关键变量及其之间的因果关系程度。

【技术实现步骤摘要】
燃料乙醇发酵过程工业知识图谱构建方法


[0001]本专利技术属于工业生物发酵过程智能制造领域,涉及在工业生物发酵过程中,一种燃料乙醇发酵过程工业知识图谱构建方法,以便对关键变量的控制并提高燃料乙醇生产的质量和效率。

技术介绍

[0002]随着全球工业化的快速发展和社会经济的迅猛增长,传统能源煤矿、石油等化石燃料逐渐短缺,相伴而生的环境污染问题也不可忽视。燃料乙醇作为绿色、可再生的生物燃料,正在取代一次燃料的地位。燃料乙醇是体积分数在99.5%以上的无水乙醇,主要通过以生物质为原料经生物发酵作用等途径获得,它不添加变性剂,可作为燃料使用,是一种可再生资源,也是一种清洁的高辛烷值燃料,其燃烧性能和传统燃料相似。
[0003]燃料乙醇的美好前景决定了其在工业燃料生产领域的重要地位,其生产质量和效率也因此成为各方关注的焦点。燃料乙醇发酵制法的生产过程复杂,它涉及到拌料液化、酒母和发酵过程中大量需监测的变量以及多种物理和化学反应,其机理复杂,各变量的反应及数据采集工作不同程度地有所滞后,是一种具有多变量、纯滞后、非线性和强耦合的复杂被控对象。要保证燃料乙醇的高质高效生产,出罐乙醇体积比是一个关键指标,如果能够找到影响该关键指标的重要变量,通过连锁反应,即可在一定程度上从根源对整个燃料乙醇生产过程进行监测和控制。此策略的思路是根据燃料乙醇生产过程中的过程变量建立出罐乙醇体积比的软测量模型,先由模型筛选重要变量,再按照不同生产阶段的时间顺序,在可能对这些重要变量产生决定性影响的变量中继续筛选,直到在处于生产过程较早阶段且相对容易控制的液化环节中找到最可能影响后续过程的重要变量,最终将重要变量及其之间的影响关系以工业知识图谱的形式展现。燃料乙醇生产工厂的操作人员可以由知识图谱查看关键变量,对变量监控和机理分析有一定帮助。
[0004]XGBoost(eXtreme Gradient Boosting)树形模型是数据驱动的开源框架,在SHAP(SHapley Additive exPlanations)方法的特征选择指导下可以有效构建软测量模型并得到对出罐乙醇体积比影响最大的变量。以这些变量为根基,用基于评分的因果关系发现算法FGES(Fast Greedy Equivalence Search)追根溯源,在燃料乙醇生产的各个阶段中找到其他决定性变量。根据上述信息,可以构建燃料乙醇发酵过程关键指标的工业知识图谱。

技术实现思路

[0005]本专利技术的目的是针对燃料乙醇发酵过程构建一个包含各阶段重要变量的工业知识图谱,为工厂操作人员提供关键变量及其相互影响关系的参考,提高燃料乙醇生产的质量和效率,同时也对生产机理有一定启发和验证作用。
[0006]基于上述目的,本专利技术提供一种燃料乙醇发酵过程工业知识图谱构建方法,包含以下三个阶段:获取燃料乙醇生产过程历史数据,构建并优化预测模型;提取出罐乙醇体积比和各生产阶段中重要变量的因果关系及其对应权重值;绘制能准确表示此关系的工业知
识图谱,用于对关键变量的控制并提高燃料乙醇生产的质量和效率。
[0007]针对构建并优化预测模型阶段,本专利技术建立一个燃料乙醇生产过程中出罐乙醇体积比的软测量模型,具体步骤如下:
[0008](1)获取燃料乙醇生产过程中液化过程、酒母过程和发酵过程的生产历史数据;
[0009](2)构建基于XGBoost框架的预测模型并训练;XGBoost模型的目标函数如下:
[0010][0011]其中,l为损失函数,t为迭代轮数,Ω(f
t
)为正则项,constant为常数项,f
t
(x
i
)表示一个新的子模型,即回归树。经过泰勒展开近似并省去每次迭代过程中的常数损失函数后,目标函数可化简为:
[0012][0013]其中分别代表上一轮迭代中损失函数的一阶偏导数和二阶偏导数。
[0014](3)使用网格搜索方法,调整步骤(2)中预测模型的参数,确定最佳参数并重新训练模型;
[0015](4)利用SHAP方法分析步骤(3)所得模型各特征的重要性,以此为标准,得到筛选后的特征;单个特征的SHAP重要性计算公式为:
[0016][0017]其中S为模型中使用的特征的子集,j为该特征的编号,x1,

,x
p
为特征的向量,p为特征的数量,为S的权重,val(S)为S的预测值;
[0018](5)根据步骤(4)的特征筛选结果,重新构建、训练模型并再次确定最优参数。查看各特征的重要性。
[0019]本专利技术所述燃料乙醇发酵过程工业知识图谱构建方法中,所述生产历史数据,针对液化过程,包含pH、干物、粘度、DP4+、DP3、DP2、葡萄糖、果糖、琥珀酸、乳酸、甘油、乙酸、乙醇、色谱还原糖、色谱总糖、DE、GI和SI等变量数据;针对酒母过程,包含pH、干物、酵母数、出芽率、死亡率、DP4+、DP3、DP2、葡萄糖、果糖、琥珀酸、乳酸、甘油、乙酸、乙醇、色谱还原糖、色谱总糖、乙醇/甘油和乙醇体积比等变量数据;针对发酵过程,包含发酵8小时、24小时和40小时共三组变量,每组变量包含DP4+、DP3、DP2、葡萄糖、果糖、琥珀酸、乳酸、甘油、乙酸、乙醇、色谱还原糖、色谱总糖、乙醇/甘油和乙醇体积比等变量数据;另有出罐乙醇体积比数据。
[0020]进一步地,本专利技术所述燃料乙醇发酵过程工业知识图谱构建方法中,所述构建基于XGBoost框架的预测模型并训练,将生产历史数据中除出罐乙醇体积比外的变量作为自变量,出罐乙醇体积比作为因变量。参数参考常用值和经验值进行选择,暂不对自变量做筛选。
[0021]更进一步地,本专利技术所述燃料乙醇发酵过程工业知识图谱构建方法中,所述调整参数使用网格搜索方法,给模型的各个参数在一定范围内设置可能的预选值,在此范围内将各参数组合成参数组,分别训练,多次模拟建模,从而在其中选定最优者。
[0022]更进一步地,本专利技术所述燃料乙醇发酵过程工业知识图谱构建方法中,所述利用SHAP方法筛选特征,分析特征对预测结果产生的影响,通过计算在预测中每个特征的贡献来确定该特征的重要程度。按特征重要性顺序,每次保留一定数量的特征,舍弃其余特征,多次建模,选定最优者后完成特征筛选。
[0023]更进一步地,本专利技术所述燃料乙醇发酵过程工业知识图谱构建方法中,所述重新构建、训练模型并再次确定最优参数,将利用SHAP方法筛选后的特征作为模型自变量,再次使用网格搜索方法调整参数。建模完成后用SHAP方法查看特征重要程度,删除其中属于发酵过程的组变量(8h、24h和40h)中的同名重复特征。记录其余特征和对应的重要性数值。
[0024]针对提取出罐乙醇体积比和各生产阶段中重要变量的因果关系及其对应权重值阶段,本专利技术考虑燃料乙醇生产过程的发生顺序,提出提取变量因果关系及其对应权重值的方法,具体步骤如下:
[0025](1)提取液化过程、酒母过程和发酵过程中的变量和出罐乙醇体积比之间的影响作用;<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.燃料乙醇发酵过程工业知识图谱构建方法,其特征在于,包含以下三个阶段:获取生产历史数据,构建并优化预测模型;提取出罐乙醇体积比和各生产阶段中重要变量的因果关系及其对应权重值;绘制能准确表示此关系的工业知识图谱;以应用于对关键变量的控制并提高燃料乙醇生产的质量和效率;在预测模型的构建和优化阶段,包括步骤:(1)获取燃料乙醇生产过程中液化过程、酒母过程和发酵过程的生产历史数据;(2)构建基于XGBoost框架的预测模型并训练;XGBoost模型的目标函数如下:其中,l为损失函数,t为迭代轮数,Ω(f
t
)为正则项,constant为常数项,f
t
(x
i
)表示一个新的子模型,即回归树;经过泰勒展开近似并省去每次迭代过程中的常数损失函数后,目标函数可化简为:其中分别代表上一轮迭代中损失函数的一阶偏导数和二阶偏导数;(3)使用网格搜索方法,调整步骤(2)中预测模型的参数,确定最佳参数并重新训练模型;(4)利用SHAP方法分析步骤(3)所得模型各特征的重要性,以此为标准,得到筛选后的特征;单个特征的SHAP重要性计算公式为:其中S为模型中使用的特征的子集,j为该特征的编号,x1,

,x
p
为特征的向量,p为特征的数量,为S的权重,val(S)为S的预测值;(5)根据步骤(4)的特征筛选结果,重新构建、训练模型并再次确定最优参数;查看各特征的重要性。2.根据权利要求1所述的燃料乙醇发酵过程工业知识图谱构建方法,其特征在于,步骤(1)中所述的燃料乙醇生产数据,针对液化过程,包含pH、干物、粘度、DP4+、DP3、DP2、葡萄糖、果糖、琥珀酸、乳酸、甘油、乙酸、乙醇、色谱还原糖、色谱总糖、DE、GI和SI等变量数据;针对酒母过程,包含pH、干物、酵母数、出芽率、死亡率、DP4+、DP3、DP2、葡萄糖、果糖、琥珀酸、乳酸、甘油、乙酸、乙醇、色谱还原糖、色谱总糖、乙醇/甘油和乙醇体积比等变量数据;针对发酵过程,包含发酵8小时、24小时和40小时共三组变量,每组变量包含DP4+、DP3、DP2、葡萄糖、果糖、琥珀酸、乳酸、甘油、乙酸、乙醇、色谱还原糖、色谱总糖、乙醇/甘油和乙醇_体积比等变量数据;另有出罐乙醇体积比数据。3.根据权利要求1所述的燃料乙醇发酵过程工业知识图谱构建方法,其特征在于,步骤(2)中,所述构建基于XGBoost框架的预测模型,参数参考常用值和经验值进行选择,暂不对输入特征做筛选。
4.根据权利要求1所述的燃料乙醇发酵过程工业知识图谱构建方法,其特征在于,步骤(3)中,网格搜索法主要是给模型的各个参数设置预选值,在预选值范围内将各参数组合训练,多次模拟建模,从而在其中选定最优者。5.根据权利要求1所述的燃料乙醇发酵过程工业知识图谱...

【专利技术属性】
技术研发人员:颜学峰康叶茗董裕峰卢伟鹏庄英萍邓立康田晓俊刘晓峰刘小辰张志凌田锡炜王冠孙新通范新龙刘新颖从志会
申请(专利权)人:国投生物能源铁岭有限公司国投生物科技投资有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1