一种基于随机森林算法的碳钢腐蚀速率预测方法技术

技术编号:27316886 阅读:27 留言:0更新日期:2021-02-10 09:50
本发明专利技术公开了一种基于随机森林算法的碳钢腐蚀速率预测方法,属于金属材料的腐蚀预测技术领域,本发明专利技术采集影响碳钢腐蚀的主要因素SO2、温度、湿度和降雨,利用高通量的腐蚀监测探头,每分钟采集一条温度、湿度和腐蚀电流数据点,测试站点共采集一年的数据量;利用随机森林算法,建立SO2、温度、湿度和腐蚀电流的关系模型,可大幅降低试验成本、缩短试验周期。缩短试验周期。缩短试验周期。

【技术实现步骤摘要】
一种基于随机森林算法的碳钢腐蚀速率预测方法


[0001]本专利技术属于钢铁制造
,具体涉及一种基于随机森林算法的碳钢腐蚀速率预测方法。

技术介绍

[0002]我国幅员辽阔,跨越五大气候带,拥有沿海、内陆、湿热、干旱、城市、乡村、工业等众多的大气环境类型,影响材料腐蚀的环境因素复杂,不同的地区具有不同的大气腐蚀性,仅一个地区的腐蚀速率不具有代表性,而在钢材的推广过程中,用户又希望获得目标钢种在当地的腐蚀速率。
[0003]传统的获得腐蚀速率的方法是通过现场挂片,但是挂片成本高、周期长,尤其偏远地区的挂片,无论是挂样还是取样更是受到了气候和交通的双重限制。
[0004]随机森林是基于bagging(套袋法)和决策树的集成算法,通过随机取样,提高模型的泛化能力,从而提高预测的准确性。

技术实现思路

[0005]专利技术目的:本专利技术的目的在于提供基于随机森林算法的碳钢腐蚀速率预测方法,是结合计算机技术利用随机森林算法建立的碳钢腐蚀速率预测方法。
[0006]技术方案:为实现上述专利技术目的,本专利技术采用如下技术方案:
[0007]一种基于随机森林算法的碳钢腐蚀速率预测方法,包括以下步骤:
[0008]1)采集数据:采集影响碳钢腐蚀的主要因素SO2、温度、湿度和降雨,利用高通量的腐蚀监测探头,每分钟采集一条温度、湿度和腐蚀电流数据点,测试站点共采集一年的数据量;
[0009]2)数据前期处理:对采集的数据点筛选出异常值并删除;
[0010]3)建立腐蚀预测模型:利用随机森林算法,建立SO2、温度、湿度和腐蚀电流的关系模型;
[0011]4)验证模型:利用传统的挂片腐蚀速率验证模型计算的腐蚀速率准确度;
[0012]a(x)=(1-|v
1-v2|/v2)*100%
[0013]式中,a(x)表示腐蚀准确率,v1表示传统的挂片腐蚀速率,v2表示模型计算的腐蚀速率;
[0014]5)预测碳钢腐蚀速率:收集的SO2、温度、湿度、降雨等信息,利用已建立的腐蚀预测模型,对碳钢进行腐蚀速率预测。
[0015]进一步地,步骤1)中,所述的采集数据具体为每一分钟采集一个数据点,采集的数据项包括SO2、温度、湿度、降雨量和腐蚀电流,采集一年的数据量(约50万条)。
[0016]进一步地,步骤2)中,所述的数据前期处理具体为对完全重复的数据删除后,将数据根据降雨情况划分为雨季和旱季两段数据;步骤2)中,将降雨信息,只要下雨,不论降雨量大小,一律置为数值1;对没有降雨的数据点,按照湿度大小划分数据等级,具体划分原则
见表1;将降雨信息和湿度等级的划分值作为影响碳钢腐蚀速率的因素,并参与模型计算。
[0017]进一步地,所述的步骤3)中,将测试地点的SO2、温度、湿度和数值等级划分值作为自变量x,腐蚀电流数值作为因变量y,利用随机森林算法,建立x和y之间的关系模型,即腐蚀预测模型。
[0018]进一步地,步骤3)中,所述的建立腐蚀预测模型,包括如下步骤:
[0019]3.1)使用Bootstrap方法随机有放回地从N个原始训练样本中选择n(n<N)个样本生成m个训练子集。
[0020]3.2)分别对m个训练子集进行决策树建模:在节点上所有的样本特征中随机选择一部分样本特征,依据最小均方差进行决策树的左右子树划分,递归建树直到满足终止条件:
[0021][0022]其中,对于任意划分特征A,对应任意划分点a两边划分成的数据集D1和D2;式中,x
i
为样本值,y
i
是与x
i
对应的真实值,c1为D1数据集的样本输出均值,c2为D2数据集的样本输出均值;每棵决策树由样本量为n的训练子集X和θ
k
(随机向量序列{θ
k
,k=1,2....n}独立同分布)生成;
[0023]3.3)重复以上步骤,将多棵决策树组成随机森林,即所有决策树的集合{h(X,θ
k
),k=1,2...n},其中,每个决策树模型h(X,θ
k
)都有一票投票权来选择输入变量x的分类结果:
[0024][0025]其中,H(x)表示随机森林分类结果,h
i
(x)是单个决策树分类结果,Y表示分类目标,I(.)为示性函数;
[0026]3.4)将测试样本输入随机森林回归模型,采用简单投票机制,即票数最多的作为最终预测结果,并与实际值对比,评价模型的拟合效果。
[0027]进一步地,步骤5)中,利用步骤3)建立的关系模型,将SO2、温度、湿度和降雨信息输入至模型中,计算出腐蚀电流值,根据法拉第定律进一步将腐蚀电流换算成腐蚀速率。
[0028]有益效果:与传统的获得腐蚀速率的挂片方法相比,本专利技术采集影响碳钢腐蚀的主要因素SO2、温度、湿度和降雨,利用高通量的腐蚀监测探头,每分钟采集一条温度、湿度和腐蚀电流数据点,测试站点共采集一年的数据量;利用随机森林算法,建立SO2、温度、湿度和腐蚀电流的关系模型,可大幅降低试验成本、缩短试验周期。
附图说明
[0029]图1为基于随机森林算法的碳钢腐蚀速率预测数据处理及建模流程图。
具体实施方式
[0030]下面结合附图和具体实施实例对本专利技术做进一步的说明。
[0031]如图1所示,一种基于随机森林算法的碳钢腐蚀速率预测方法,包括以下步骤:
[0032]1)采集数据:采集影响碳钢腐蚀的主要因素SO2、温度、湿度和降雨,利用高通量的
腐蚀监测探头,每分钟采集一条温度、湿度和腐蚀电流数据点,测试站点共采集一年的数据量;
[0033]2)数据前期处理:对采集的数据点筛选出异常值并删除;
[0034]3)建立腐蚀预测模型:利用随机森林算法,建立SO2、温度、湿度和腐蚀电流的关系模型;建立随机森林决策树模型的步骤如下:
[0035]3.1)使用Bootstrap方法随机有放回地从N个原始训练样本中选择n(n<N)个样本生成m个训练子集。
[0036]3.2)分别对m个训练子集进行决策树建模:在节点上所有的样本特征中随机选择一部分样本特征,依据最小均方差进行决策树的左右子树划分,递归建树直到满足终止条件。
[0037][0038]其中,对于任意划分特征A,对应任意划分点a两边划分成的数据集D1和D2。式中,x
i
为样本值,y
i
是与x
i
对应的真实值,c1为D1数据集的样本输出均值,c2为D2数据集的样本输出均值。
[0039]每棵决策树由样本量为n的训练子集X和θ
k
(随机向量序列{θ
k
,k=1,2....n}独立同分布)生成。
[0040]3.3)重复以上步骤,将多棵决策树组成随机森林,即所有决策树的集合{h(X,θ
k本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于随机森林算法的碳钢腐蚀速率预测方法,其特征在于:包括以下步骤:1)采集数据:采集影响碳钢腐蚀的主要因素SO2、温度、湿度和降雨,利用高通量的腐蚀监测探头,每分钟采集一条温度、湿度和腐蚀电流数据点,测试站点共采集一年的数据量;2)数据前期处理:对采集的数据点筛选出异常值并删除;3)建立腐蚀预测模型:利用随机森林算法,建立SO2、温度、湿度和腐蚀电流的关系模型;4)验证模型:利用挂片腐蚀速率验证模型计算的腐蚀速率准确度;a(x)=(1-|v
1-v2|/v2)*100%式中,a(x)表示腐蚀准确率,v1表示传统的挂片腐蚀速率,v2表示模型计算的腐蚀速率;5)预测碳钢腐蚀速率:收集的SO2、温度、湿度、降雨等信息,利用已建立的腐蚀预测模型,对碳钢进行腐蚀速率预测。2.根据权利要求1所述的一种基于随机森林算法的碳钢腐蚀速率预测方法,其特征在于:步骤1)中,所述的采集数据具体为每一分钟采集一个数据点,采集的数据项包括SO2、温度、湿度、降雨量和腐蚀电流,采集一年的数据量。3.根据权利要求1所述的一种基于随机森林算法的碳钢腐蚀速率预测方法,其特征在于:步骤2)中,所述的数据前期处理具体为对完全重复的数据删除后,将数据根据降雨情况划分为雨季和旱季两段数据;将降雨信息,只要下雨,不论降雨量大小,一律置为数值1;对没有降雨的数据点,按照湿度大小划分数据等级;将降雨信息和湿度等级的划分值作为影响碳钢腐蚀速率的因素,并参与模型计算。4.根据权利要求1所述的一种基于随机森林算法的碳钢腐蚀速率预测方法,其特征在于:所述的步骤3)中,将测试地点的SO2、温度、湿度和数值等级划分值作为自变量x,腐蚀电流数值作为因变量y,利用随机森林算法,建立x和y之间的关系模型,即腐蚀预测模型。5.根据权利要求4所述的一种基于随机森林...

【专利技术属性】
技术研发人员:代芹芹范益蔡佳兴程学群马宏驰
申请(专利权)人:南京钢铁股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1