一种基于GBDT回归模型的办公建筑能耗预测方法技术

技术编号:38914528 阅读:13 留言:0更新日期:2023-09-25 09:29
本发明专利技术适用于建筑能耗技术领域,公开了一种基于梯度提升决策树(GBDT)回归模型的办公建筑能耗预测方法。预测方法包括获取建筑物历史能耗数据及其影响特征数据,整理数据并以季节划分;根据Pearson相关系数和ETC的特征影响度进行特征选择;训练方法包括对不同季节的数据归一化处理;设定平方损失函数、绝对损失函数、回归树学习率,训练GBDT模型;将对应季节的待预测数据输入GBDT模型,反归一化预测输出数据后,得到待预测日的建筑物能耗预测值;最后以均方根误差RMSE、平均绝对误差MAE验证GBDT模型效果。本发明专利技术说明了GBDT预测的流程与方法,能够消除不同量纲对预测结果的影响,降低输入向量的维度,提高模型的训练速度,减少样本中异常值对训练和预测结果的影响,具有较高的预测准确度,对建筑节能建设具有一定的实际意义。意义。意义。

【技术实现步骤摘要】
一种基于GBDT回归模型的办公建筑能耗预测方法


[0001]本专利技术涉及建筑能耗
,尤其涉及一种基于梯度提升决策树(GBDT)回归模型的办公建筑能耗预测方法。

技术介绍

[0002]随着社会经济的发展,城市化进程加快,建筑能耗在全国能源消耗中占比日益增大,使得全社会不得不关注建筑节能改造。能耗预测的准确性成为了建筑领域寻求节能方式的一个重要着眼点。同时,国家正大力推进“近零能耗”、“超低能耗”建筑建设,通过高精确度的能耗预测技术,可为平衡建筑用能与供能以及储能系统运行方案提供决策依据,提高建筑的优化运行效益,从而促进“近零能耗建筑”和“超低能耗建筑”在我国健康持久发展。
[0003]建筑能耗预测受环境温度、气象条件等各种因素的影响,建模精度也随之受到影响而降低;另外,能耗预测数据中,由于各种特殊情况的存在,不免会包含异常值,导致误差增大,目前存在的问题使得建立一个高精确度的预测模型成为难题。

技术实现思路

[0004]本专利技术的目的在于提供一种基于GBDT回归模型的办公建筑能耗预测方法,效果在于:能够消除不同量纲对预测结果的影响,降低输入向量的维度,提高模型的训练速度,减少样本中异常值对训练和预测结果的影响,具有较高的预测准确度。
[0005]通过一种基于GBDT回归模型的办公建筑能耗预测方法,如附图1所示,其特征在于,包括如下步骤:获取建筑物历史能耗数据及其影响特征数据。所述影响特征数据不仅仅包括采集的建筑所处的气候环境数据、建筑自身的围护结构,应特别包括建筑物内人员情况、建筑物内部用能设备的性能,所述建筑物历史能耗数据为建筑物的各种设备的能耗数据、制冷机组的能耗数据等。
[0006]整理已获取的数据并以季节划分;通过Pearson相关系数,分析建筑物能耗的影响因素与建筑物能耗的相关性,根据相关性程度选择主要特征;同时,同时将所述数据分别输入ETC模型,输出其特征重要性指数;最后加权平均每个特征对应的Pearson相关系数与特征重要性指数,选出其中相关性高的几种特征为主要影响特征。
[0007]将所述主要特征数据以及特征数据所对应的建筑物历史能耗数据进行归一化处理,得到训练样本数据。其主要实现步骤如下:以划分后的主要特征数据分别生成输入向量,其对应的建筑物历史能耗数据作为输出向量。
[0008]对所述划分后的输入向量和输出向量进行归一化处理,即采用Z

score标准化方法将原数据的每一个特征维度属性值更改为均值为0,标准差为1的高斯分布,生成不同季节的无量纲化训练样本集,从而消除量纲不一致导致的预测结果差别较大的情况。所述Z

score标准化方法表示为:
式中,x为输入向量,μ为输入向量x所在列的均值,δ为输入向量x所在列的标准差,x'为输入向量x经Z

score标准差标准化后的值。
[0009]分别输入所述归一化处理后的不同季节的训练样本集构建GBDT回归预测模型,样本集为,其中x为输入向量,y为输出向量;利用平方损失与绝对损失GBDT算法以及回归树的学习率进行回归预测。如图2所示,GBDT模型通过多轮迭代,每轮迭代产生一个弱分类器,每个分类器在上一轮分类器的负梯度基础上进行训练,训练经过最大次数迭代后输出结果得到最终的建筑物能耗预测值。
[0010]优选地,设定的平方损失函数为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
公式(1)优选地,设定的绝对损失函数为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
公式(2)公式(1)和公式(2)中,y为建筑物能耗实际值,f(x)为建筑物能耗预测值。
[0011]进一步地,输入所述训练样本集T,初始化GBDT回归预测模型。设定回归树个数k=1,2

,K,对于样本 i=1,2,

,N;计算第k

1棵树的初始值f0(x)。当f
0 (xi)为样本T中建筑物能耗实际值的均值时f
a0 (xi),计算第i个样本位置的残差A
i
;当f
0 (xi)为样本T中建筑物能耗实际值的中位数f
b0 (xi)时,计算第i个样本位置的残差B
i

[0012]进一步地,由于平方损失函数对于异常点非常敏感,导致异常点处预测误差过大,而绝对损失函数对于异常点有更好的鲁棒性,因此优化负梯度的计算方法。
[0013]优选地,损失函数L的负梯度r
ki
的计算方法为:1、当A
i
<B
i
时,r
ki
计算公式如下:
ꢀꢀꢀꢀꢀꢀ
公式(3)2、当A
i
>B
i
时,r
ki
计算公式如下:
ꢀꢀꢀꢀꢀ
公式(4)公式(3)和公式(4)中,yi为T样本中第k

1棵树的第i个样本的建筑物能耗实际值, f
k
‑1(xi)为第k

1棵树的第i个样本的建筑物能耗预测值,sign为符号函数。
[0014]遍历样本集T中的每个特征,根据公式(1)和公式(2),并根据第i个样本位置的某个特征作为划分节点,计算所有可能划分的情况的建筑物能耗实际值的总损失函数,取第一个总损失函数最小的组合对应的特征值作为划分节点。
[0015]优选地,根据负梯度计算得到的新的训练集,拟合一棵回归树,得到第k棵树的叶节点区域R
kj
,对j=1,2,

,J,利用线性搜索,估计使损失函数L
的极小化的常数值C
kj
。由于负梯度的计算结合了平方损失与绝对损失,为避免C
kj
的值不准确,计算公式如下:
ꢀꢀ
公式(5)公式(5)中,γ
kj
为第k棵树的第j个叶节点中伪残差的均值,N为第k棵树的第j个叶节点的样本数量,min()表示取其中的最小值。
[0016]进一步地,更新回归树,得到第k棵树输出的i个建筑物能耗预测值f
k
(x)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
公式(6)公式(6)中,f
k
‑1(x)为第k

1棵树的建筑物能耗预测值,J为回归树的叶子节点的个数,C
kj
为迭代k次的第j个节点中使损失函数最小的常数值,I(x∈R
kj
)为示性函数,lr为学习率。
[0017]优选地,由于原始的学习率为1,通常会使GBDT模型训练时得到相同的数,导致预测过拟合,极大地降低了模型的预测精度。因此,依据Shrinkage(收缩率)的思想,本专利技术设定学习率lr=0.08。
[0018]优选地,经过最大迭代次数K次拟合回归树后,输出最终的GBDT预测模型 F(本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于梯度提升决策树(GBDT)回归模型的办公建筑能耗预测方法,如附图1所示,其特征在于,包括如下步骤:步骤S1、获取建筑物历史能耗数据及其影响因素数据;步骤S2、整理所述获取的数据并以季节划分,采用Pearson相关系数和ETC的特征影响度度量影响因素,确定主要特征;步骤S3、将所述主要特征数据以及对应的建筑物历史能耗数据进行归一化处理,得到训练样本数据;步骤S4、设定平方损失函数、绝对损失函数、回归树学习率,利用所得训练样本数据构建不同季节的GBDT回归预测模型;步骤S5、获取所述训练样本对应季节的待预测数据,包括待预测日的建筑物能耗影响特征数据,归一化处理后得到待预测集;步骤S6、将所述待预测集输入对应季节的GBDT模型,反归一化方法处理预测输出数据,得到待预测日的建筑物能耗预测值;步骤S7、以均方根误差RMSE、平均绝对误差MAE作为GBDT模型的评价指标,验证模型效果;其中,RMSE、MAE越小表示预测效果越佳,反之则越差。2.根据权利要求1所述的基于GBDT回归模型的办公建筑能耗预测方法,其特征在于,所述步骤S1中,建筑物能耗的影响特征数据不仅仅包括采集的建筑所处的气候环境数据、建筑自身的围护结构,应特别包括建筑物内人员情况、建筑物内部用能设备的性能,所述建筑物历史能耗数据为建筑物的各种设备的能耗数据、制冷机组的能耗数据等。3.根据权利要求1所述的基于GBDT回归模型的办公建筑能耗预测方法,其特征在于,将所述步骤S2中,以季节划分原始数据,通过Pearson相关系数,分析建筑物能耗的影响因素与建筑物能耗的相关性,根据相关性程度选择主要特征;同时将所述数据分别输入ETC模型,输出其特征重要性指数,最后加权平均每个特征对应的Pearson相关系数与特征重要性指数,选出其中相关性高的特征为主要影响特征。4.根据权利要求3所述的基于GBDT回归模型的办公建筑能耗预测方法,其特征在于,所述步骤S3中,通过所述预处理,包括输入向量和输出数据划分和归一化处理;以划分后的主要特征数据分别生成输入向量,其对应的建筑物历史能耗数据作为输出向量;对所述划分后的输入向量和输出向量进行归一化处理,即采用Z

score标准化方法将原数据的每一个特征维度属性值更改为均值为0,标准差为1的高斯分布,生成不同季节的无量纲化训练样本集,从而消除量纲不一致导致的预测结果差别较大的情况。5.根据权利要求1所述的基于GBDT回归模型的办公建筑能耗预测方法,其特征在于,所述步骤S4中,训练方法包括分别输入所述归一化处理后的不同季节的训练样本集构建GBDT模型,样本集为,其中x为特征向量,y为目标向量;利用平方损失与绝对损失GBDT算法以及回归树的学习率进行回归预测。6. 根据权利要求5所述的基于GBDT回归模型的办公建筑能耗预测方法,其特征在于,设定平方损失函数和绝对损失函数如下:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
公式(1)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
公式(2)公式(1)和公式(2)中,y为建筑物能耗实际值,f(x)为建筑物能耗预测值。7.根据权利要求5所述的基于GBDT回归模型的办公建筑能耗预测方法,其特征在于,原始的学习率为1,通常会使GBDT模型训练时得到相同的数值,导致预测过拟合;因此,依据Shrinkage(收缩率)的思想,设定学习率lr=0.08。8.根据权利要求1所述的基于GBDT回归模型的办公建筑能耗预测方法,其特征在于,根据公式(1)所述平方损失函数和公式(2)所述绝对损失函数,根据权利要求7所述学习率,进行梯度提升决策树回归预测;GBDT模型通过多轮迭代,每轮迭代产生一个弱分类器,每个分类器在上一轮分类器的负梯度基础上进行训练,训练经过最大次数迭代后输出结果得到最终的建筑物能耗预测值,具体步骤如下:(1) 初始化GBDT模型,设定回归树个数k=1,2

,K,对于样本T的样本位置i=1,...

【专利技术属性】
技术研发人员:郑清涛李进王栋伟张玲骆丽仪孙金礼熊湜吴咏昆陈丝绸
申请(专利权)人:珠海中建兴业绿色建筑设计研究院有限公司水发兴业能源珠海有限公司珠海兴业绿色建筑科技有限公司珠海兴业节能科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1