基于LightGBM与随机搜索法的燃煤锅炉排烟温度预测方法及系统技术方案

技术编号:34081562 阅读:32 留言:0更新日期:2022-07-11 19:00
本发明专利技术公开了一种基于LightGBM与随机搜索法的燃煤锅炉排烟温度预测方法及系统,解决了现有神经网络模型存在易陷入局部极小值、易过拟合等缺陷,支持向量机模型存在不适用于大样本学习的问题。方法包括采集历史运行数据,进行数据清洗和归一化,根据互信息熵进行特征选取,采用LightGBM算法构建模型,随机搜索算法对超参数进行优化,获得最优模型进行验证应用。本发明专利技术采用LightGBM与随机搜索算法建立和优化预测模型,有效防止过拟合现象,模型泛化能力出色,支持大样本学习策略,训练更加高效,计算速度更快,且可以实现更低的模型偏差,同时结合随机搜索算法,寻找到最优超参数组合,进一步提升了模型的精度,获得了高性能的燃煤锅炉排烟温度预测模型。锅炉排烟温度预测模型。锅炉排烟温度预测模型。

【技术实现步骤摘要】
基于LightGBM与随机搜索法的燃煤锅炉排烟温度预测方法及系统


[0001]本专利技术涉及燃煤锅炉
,尤其是涉及基于LightGBM与随机搜索法的燃煤锅炉排烟温度预测方法及系统。

技术介绍

[0002]锅炉效率是燃煤电站机组运行重点关注的指标,通常采用反平衡法进行计算。其中,排烟热损失是锅炉热损失中最大的一项,占锅炉热损失的80%以上,燃煤锅炉排烟温度每上升20℃,排烟热损失增加约1%。
[0003]排烟温度是一种影响因素十分复杂的运行指标,受到煤种煤质、机组负荷、燃烧运行工况等多因素的综合影响。我国燃煤电站通常采用配煤掺烧的方式,因此建立燃煤锅炉排烟温度预测模型,以排烟温度作为优化目标,不仅可以实现配煤优化,同时可以实现既定煤种情况下的燃烧优化调整,降低排烟热损失从而提高锅炉效率。
[0004]目前已有文献及专利针对排烟温度的预测主要是基于机器学习与数据挖掘的方法,最常用的是神经网络和支持向量机模型,但是神经网络模型存在易陷入局部极小值、易过拟合等缺陷,支持向量机模型存在不适用于大样本学习问题等问题。

技术实现思路

[0005]本专利技术主要是解决现有对排烟温度的预测常用神经网络和支持向量机模型,但神经网络模型存在易陷入局部极小值、易过拟合等缺陷,支持向量机模型存在不适用于大样本学习的问题,提供了一种基于LightGBM与随机搜索法的燃煤锅炉排烟温度预测方法及系统。
[0006]本专利技术的上述技术问题主要是通过下述技术方案得以解决的:一种基于LightGBM与随机搜索法的燃煤锅炉排烟温度预测方法,包括以下步骤:S1.采集历史运行数据,包括作为输入数据的煤种煤质数据、运行状态数据,和作为输出数据的排烟温度数据,对数据进行预处理,获得预处理后数据矩阵Q

* = [X

*,Y

*] = [X1’
*
, X2’
*
,

X
m

*
,Y

*
],其中X
i

*
为预处理后输入变量,Y

*
为预处理后排烟温度;S2.根据预处理后的数据分别计算概率分布密度、、和联合概率分布密度,根据概率密度分布计算互信息熵,根据互信息熵的取值,获取满足阈值的输入变量作为模型有效输入变量,建立模型输入输出数据矩阵,X1’
*

X
v

*
为模型输入变量,Y

*
为模型输出变量,t为模型输入变量数量;S3.根据输入输出数据矩阵R,利用LightGBM算法构建燃煤锅炉排烟温度预测模型,确定模型的超参数及超参数寻优区间;LightGBM是一种基学习器为决策树的集成学习算法,是针对传统GBDT的改进算
法。
[0007]采用LightGBM算法的有益效果是:LightGBM轻量梯度提升机是一种分布式、高性能的GBDT梯度提升树优化框架,计算速度快,内存占用小,支持特征并行和数据并行,在工程上进行了优化。LightGBM模型采用了直方图算法与带深度限制的按叶生长策略。直方图算法将特征进行分桶处理,构造宽度为W的直方图,将连续特征离散化,从而遍历时将离散化的值作为索引值在直方图中进行累计,搜索出最优特征划分点。Leaf

wise 按叶生长策略在每次分裂时选择分裂信息增益最大的节点进行分裂进行迭代,同时显式设置树的深度,有效减小模型复杂度,减低过拟合风险。
[0008]S4. 采用输入输出数据矩阵R对燃煤锅炉排烟温度预测模型进行训练,利用随机搜索算法对燃煤锅炉排烟温度预测模型的超参数进行优化,确定燃煤锅炉排烟温度预测模型最佳超参数组合,获得最优燃煤锅炉排烟温度预测模型;S5.实时采集燃煤锅炉的入炉煤种煤质数据与所需的运行状态数据,经过预处理后输入至最优燃煤锅炉排烟温度预测模型,输出预测的排烟温度。
[0009]本专利技术采用LightGBM与随机搜索算法建立和优化燃煤锅炉排烟温度预测模型,可以有效防止过拟合现象,模型泛化能力出色,支持大样本学习策略,训练更加高效,计算速度更快,且可以实现更低的模型偏差,同时结合随机搜索算法,寻找到最优超参数组合,进一步提升了模型的精度,获得了高性能的燃煤锅炉排烟温度预测模型。
[0010]作为一种优选方案,所述步骤S1具体过程包括:S11. 对数据点零值和缺失值进行删除;S12.煤种煤质数据和运行状态数据组成的输入数据形成矩阵,其中n为去除存在零值和缺失值数据点后的样本量,m为输入参数数量,输出数据排烟温度形成矩阵,根据n个数据样本量,建立n个m+1维数据点,设第i个数据点q
i
为(x
i1
,x
i2
,

x
im
,y
i
),i=1,2

n,第j个输入参数变量的数据序列为,输出参数变量的数据序列为
,形成原始数据矩阵;S13.对数据异常值进行检测和清洗,形成原始有效数据矩阵,其中s为原始有效数据点数量;S14. 对原始有效数据矩阵Q

中各列Q1’
、Q2’

Q
m+1

数据采用min

max方法进行归一化处理,获得归一化后数据矩阵。
[0011]作为一种优选方案,所述步骤S13中对数据异常值进行检测和清洗具体包括:S131. 对原始数据矩阵Q中各列Q1、Q2…
Q
m+1
数据采用min

max方法进行归一化处理,得到归一化后数据矩阵
;S132.设置密度函数Minpts;S133.计算、(1<=i,j<=n,且i≠j)之间的欧几里得距离,计算公式为:,其中,为数据点与数据点的欧式距离,m+1为数据点的维度,与分别为数据点与的第k维;S134.对数据点,将,1<=j<=n,且j≠i从小到大排列形成新队列,取新队列中的第k大的值,满足条件k=Minpts,该值为k

distance();将得到的k

distance(),1<=i<=n,由小到大进行排列并绘制成k

distance图,找到斜率发生突变的点,该点的k

distance值即为邻域半径ε;S135. 利用ε和Minpts,采用DBSCAN聚类算法划分簇,不属于任何簇的数据点即判定为异常点,将异常点删除。
[0012]本方案采用DBSCAN密度聚类方法进行检测,DBSCAN聚类算法通过找出核心对象,即其邻域稠密的对象,并连接核心对象和邻域,形成稠密区域作为簇。其中,两个核心参数为邻域半径ε和密度阈值Minpts,两个参数确定邻本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于LightGBM与随机搜索法的燃煤锅炉排烟温度预测方法,其特征在于:包括以下步骤:S1.采集历史运行数据,包括作为输入数据的煤种煤质数据、运行状态数据,和作为输出数据的排烟温度数据,对数据进行预处理,获得预处理后数据矩阵Q

* = [X

*
,Y

*
] = [X1’
*
, X2’
*
,

X
m

*
,Y

*
],其中X
i

*
为预处理后输入变量,Y

*
为预处理后排烟温度;S2.根据预处理后的数据分别计算概率分布密度、、和联合概率分布密度,根据概率密度分布计算互信息熵,根据互信息熵的取值,获取满足阈值的输入变量作为模型有效输入变量,建立模型输入输出数据矩阵,X1’
*

X
v

*
为模型有效输入变量,Y

*
为模型输出变量,v为模型输入变量数量;S3.根据输入输出数据矩阵R,利用LightGBM算法构建燃煤锅炉排烟温度预测模型,确定模型的超参数及超参数寻优区间;S4. 采用输入输出数据矩阵R对燃煤锅炉排烟温度预测模型进行训练,利用随机搜索算法对燃煤锅炉排烟温度预测模型的超参数进行优化,确定燃煤锅炉排烟温度预测模型最佳超参数组合,获得最优燃煤锅炉排烟温度预测模型;S5.实时采集燃煤锅炉的入炉煤种煤质数据与所需的运行状态数据,经过预处理后输入至最优燃煤锅炉排烟温度预测模型,输出预测的排烟温度。2.根据权利要求1所述的基于LightGBM与随机搜索法的燃煤锅炉排烟温度预测方法,其特征是所述步骤S1具体过程包括:S11.对数据点零值和缺失值进行删除;S12.煤种煤质数据和运行状态数据组成的输入数据形成矩阵,其中n为去除存在零值和缺失值数据点后的样本量,m为输入参数数量,输出数据排烟温度形成矩阵,根据n个数据样本量,建立n个m+1维数据点,设第i个数据点q
i
为(x
i1
,x
i2
,

x
im
,y
i
),i=1,2

n,第j个输入参数变量的数据序列为,输出参数变量的数据序列为
,形成原始数据矩阵;S13.对数据异常值进行检测和清洗,形成原始有效数据矩阵,其中s为原始有效数据点数量;S14.对原始有效数据矩阵Q

中各列Q1’
、Q2’

Q
m+1

数据采用min

max方法进行归一化处理,获得归一化后数据矩阵。3.根据权利要求2所述的基于LightGBM与随机搜索法的燃煤锅炉排烟温度预测方法,其特征是所述步骤S13中对数据异常值进行检测和清洗具体包括:S131.对原始数据矩阵Q中各列Q1、Q2…
Q
m+1
数据采用min

max方法进行归一化处理,得到归一化后数据矩阵
;S132.设置密度函数Minpts;S133.计算、(1<=i,j<=n,且i≠j)之间的欧几里得距离,计算公式为:其中,为数据点与数据点的欧式距离,m+1为数据点的维度,与分别为数据点与的第k维;S134.对数据点,将,1<=j<=n,且j≠i从小到大排列形成新队列,取新队列中的第k大的值,满足条件k=Minpts,该值为k

distance();将得到的k

distance(),1<=i<=n,由小到大进行排列并绘制成k

distance图,找到斜率发生突变的点,该点的k

distance值即为邻域半径ε;S135. 利用ε和Minpts,采用DBSCAN聚类算法划分簇,不属于任何簇的数据点即判定为异常点,将异常点删除。4.根据权利要求2所述的基于LightGBM与随机搜索法的燃煤锅炉排烟温度预测方法,其特征是所述步骤S2中互信息熵的计算包括:S21. 采用核密度估计法计算概率分布密度、、和联合概率分布密度;其中,为变量第i个数据的概...

【专利技术属性】
技术研发人员:魏勇孙胡彬江学文周晓亮李楠叶君辉赵敏寿志杰詹港明卢子轩
申请(专利权)人:杭州集益科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1