System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于随机森林的三元混合物闪点预测方法技术_技高网

一种基于随机森林的三元混合物闪点预测方法技术

技术编号:43827781 阅读:1 留言:0更新日期:2024-12-31 18:28
本发明专利技术公开了一种基于随机森林的三元混合物闪点预测方法,测定三元混合物实验样本的闪点值并建立数据集;对数据集的三元混合物实验样本进行分子描述符计算;对数据集进行训练集与测试集的划分;对训练集的分子描述符进行筛选,得到需要保留的分子描述符;选择随机森林回归算法的四个超参数;基于训练集进行训练并构建闪点预测模型;对闪点预测模型进行评估与验证。本发明专利技术能够高效、准确地预测三元混合物的闪点值,提供工业生产中必要的安全数据,显著提高了预测精度,避免安全事故的发生。

【技术实现步骤摘要】

本专利技术涉及一种基于随机森林的三元混合物闪点预测方法


技术介绍

1、在化学工业和工程中,确保易燃液体安全使用至关重要。闪点是指在特定试验条件下,可燃液体上方能够形成蒸汽与空气可燃混合物的最低温度,是液体可燃性危险的一个关键特性。一般来说,闪点越低的物质挥发性越强,发生火灾的风险越大。为了在安全过程中防止火灾或爆炸,掌握物质闪点的先验知识是至关重要的,因为它是评估其可燃性危害的主要属性。

2、目前,纯化合物的闪点数据可以从各种来源获得,例如兰格化学手册(lange'shandbook of chemistry)和美国化学工程师协会的dippr数据库。然而,在工业应用中,混合物更为普遍,混合物中每种组分的比例在应对不同需求时会发生改变。虽然实验测量仍然是确定易燃液体闪点的最直接有效的方法,但由于工业生产中混合物产品多样化,甚至存在毒性或放射性等情况,使得实验测量存在很大难度。因此,迫切需要开发安全可靠的方法来评估工业生产中涉及的混合物的闪点。

3、早期的研究主要采用经验相关法,根据沸点、密度、蒸汽压等因素来估计物质的闪点。尽管该类方法计算简单,但其估计值与实验值相比往往产生显著偏差。近年来,利用定量结构-性能关系(quantitative structure-property relationship,qspr)预测混合物闪点或其他物理化学性质的研究大量涌现,显示出其良好的应用前景。

4、目前qspr技术主要集中在预测纯组分或二元混合物的闪点,只有少数研究集中在预测三元混合物的闪点上。

5、预测三元混合物的闪点比预测纯化合物或二元混合物的闪点更为复杂,需要适当的规则来计算多组分混合物的描述符,并采用高性能的建模方法。多组分混合描述符的计算规则需要考虑多个因素,而不是简单地将每个组分的分子描述符值相加。除了传统的多元线性回归(mlr)方法用于构建qspr模型外,越来越多的机器学习技术已被引入到qspr模型构建中,并使用优化算法来提高其性能。在机器学习领域,与传统方法相比,集成学习方法在分类和回归方面表现出了优越的性能。在这些方法中,随机森林作为一种集成学习方法,已被广泛用于处理复杂的分类或回归任务。然而,目前文献中尚未报道应用随机森林预测混合物闪点的相关内容。


技术实现思路

1、本专利技术的目的是针对当前利用实验测定法去估计混合物闪点的高成本、危险性等缺点,以及经验方法估计混合物闪点的准确性差的问题,从而提出了一种基于随机森林技术的从分子结构角度高精度预测三元混合物闪点的方法。

2、本专利技术所采用的技术方案有:

3、一种基于随机森林的三元混合物闪点预测方法,包括如下步骤:

4、s1:测定三元混合物实验样本的闪点值并建立数据集;

5、s2:对数据集的三元混合物实验样本进行分子描述符计算;

6、s3:对数据集进行训练集与测试集的划分;

7、s4:对训练集的分子描述符进行筛选,得到需要保留的分子描述符;

8、所述筛选包括预筛选与自动筛选两个阶段,其中预筛选阶段是将训练集中描述符特征方差为0或接近0的描述符剔除;自动筛选阶段是采用遗传算法与随机森林回归算法结合的方式来确定最终被保留的描述符特征;

9、s5:选择随机森林回归算法的四个超参数,对应为:树的数目、树的最大深度、内部节点最小样本数和叶节点最小样本数,确定最优超参数组合,并以训练集上交叉验证的均方误差作为超参数组合优劣的评估标准;

10、s6:基于步骤s5训练集进行训练并构建闪点预测模型;

11、s7:对闪点预测模型进行评估与验证。

12、进一步地,s1中,所述三元混合物实验样本是由不同纯组分以不同比例混合而成;各实验样本的闪点值在闭杯条件下使用syd-261闪点测试仪测得。

13、进一步地,s2中,分子描述符计算包括纯组分分子描述符的计算和混合物分子描述符的计算。

14、进一步地,所述纯组分分子描述符计算是采用dragon软件计算用于混合的各组分的分子描述符(d);

15、所述混合物分子描述符计算是采用对数计算规则确定三元混合物的混合分子描述符(dm),计算规则为:

16、进一步地,s3中,训练集和测试集的划分比例为4:1。

17、进一步地,s4中,随机森林回归算法包括如下步骤:

18、41)随机从训练集中有放回地获得n个样本;

19、42)随机从描述符特征中选择k个特征;

20、43)反复执行步骤41)和42)从而得到大量回归树;

21、44)将所有回归树输出结果的平均值作为随机森林回归算法的输出值。

22、进一步地,所述回归树构建过程为:

23、(1)假定训练集d={(x1,y1),(x2,y2),...,(xn,yn)}包含n个样本,样本所对应的特征向量为:

24、(2)以特征向量的第j个特征将所有特征向量排序后,并以第j个特征的取值s为分割点,将排序好的特征向量分割成两个区域,对应为:

25、r1(j,s)={x|x(j)≤s}

26、r2(j,s)={x|x(j)>s}

27、通过求解公式:得到最佳的j和s的值;

28、式中,c1和c2为分割后对应区域的固定输出值;

29、由于最优输出值是对应区域目标值的平均值,将上式表示为:

30、

31、其中,

32、(3)选择最佳的j和s将特征空间分割为r1(j,s)和r2(j,s)两个区域;

33、(4)计算每个区域的输出值:式中,m=1,2;

34、(5)反复执行步骤(3)和(4)直到达到终止条件;

35、(6)最终训练集的特征空间被划分为m个区域{r1,r2,...,rm},回归树的输

36、出函数表示为:

37、

38、其中,

39、

40、进一步地,s4中,遗传算法与随机森林回归算法结合的过程包括:

41、(1)随机初始化遗传算法的n个染色体的初始种群;

42、(2)对每个染色体取值,提取训练集中分子描述符值作为随机森林回归算法的输入;以交叉验证的均方误差作为每个种群的适应度;

43、(3)依次执行选择、交叉和变异操作,直至满足停止条件;

44、(4)输出最佳适应度的染色体,从而得到分子描述符的最佳特征子集。

45、进一步地,s5中,采用格点搜索法确定最优超参数组合。

46、进一步地,s7中,闪点预测模型进行评估与验证包括:拟合能力、稳定性以及预测能力。

47、本专利技术具有如下有益效果:

48、1)本专利技术能够仅根据可燃液体混合物的组分配比高效、准确地预测其闪点值,为工业生产中的可燃液体混合物的生产、运输、存本文档来自技高网...

【技术保护点】

1.一种基于随机森林的三元混合物闪点预测方法,其特征在于:包括如下步骤:

2.如权利要求1所述的基于随机森林的三元混合物闪点预测方法,其特征在于:S1中,所述三元混合物实验样本是由不同纯组分以不同比例混合而成;各实验样本的闪点值在闭杯条件下使用SYD-261闪点测试仪测得。

3.如权利要求1所述的基于随机森林的三元混合物闪点预测方法,其特征在于:S2中,分子描述符计算包括纯组分分子描述符的计算和混合物分子描述符的计算。

4.如权利要求3所述的基于随机森林的三元混合物闪点预测方法,其特征在于:所述纯组分分子描述符计算是采用Dragon软件计算用于混合的各组分的分子描述符(d);

5.如权利要求1所述的基于随机森林的三元混合物闪点预测方法,其特征在于:S3中,训练集和测试集的划分比例为4:1。

6.如权利要求1所述的基于随机森林的三元混合物闪点预测方法,其特征在于:S4中,随机森林回归算法包括如下步骤:

7.如权利要求6所述的基于随机森林的三元混合物闪点预测方法,其特征在于:所述回归树构建过程为:

8.如权利要求1所述的基于随机森林的三元混合物闪点预测方法,其特征在于:S4中,遗传算法与随机森林回归算法结合的过程包括:

9.如权利要求1所述的基于随机森林的三元混合物闪点预测方法,其特征在于:S5中,采用格点搜索法确定最优超参数组合。

10.如权利要求1所述的基于随机森林的三元混合物闪点预测方法,其特征在于:S7中,闪点预测模型进行评估与验证包括:拟合能力、稳定性以及预测能力。

...

【技术特征摘要】

1.一种基于随机森林的三元混合物闪点预测方法,其特征在于:包括如下步骤:

2.如权利要求1所述的基于随机森林的三元混合物闪点预测方法,其特征在于:s1中,所述三元混合物实验样本是由不同纯组分以不同比例混合而成;各实验样本的闪点值在闭杯条件下使用syd-261闪点测试仪测得。

3.如权利要求1所述的基于随机森林的三元混合物闪点预测方法,其特征在于:s2中,分子描述符计算包括纯组分分子描述符的计算和混合物分子描述符的计算。

4.如权利要求3所述的基于随机森林的三元混合物闪点预测方法,其特征在于:所述纯组分分子描述符计算是采用dragon软件计算用于混合的各组分的分子描述符(d);

5.如权利要求1所述的基于随机森林的三元混合物闪点预测方法,其特征在...

【专利技术属性】
技术研发人员:宋双玉姚吴昊乐雨袁许强韩飞龙
申请(专利权)人:江苏理工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1