基于集成学习的用电数据和非电用能关联预测方法技术

技术编号:36259687 阅读:33 留言:0更新日期:2023-01-07 09:56
本发明专利技术提供的一种基于集成学习的用电数据和非电用能关联预测方法,包括以下步骤:S1.采集用户的历史的用电数据和非电用能数据,并对用电数据和非电用能数据进行清洗;S2.对用电数据和非电用能数据进行归一化处理;S3.对基于归一化处理后的用电数据和非电用能数据确定出用电数据和非电用能数据的相关性,并筛选出相关性大于设定阈值的用电数据和非电用能数据;S4.将筛选出的用电数据和非用电数据输入至随机森林算法模块、GBDT算法模块以及Elastic Net算法模块中进行训练,三个算法模块分别输出三个非电用能预测结果;S5.判断三个非电用能预测结果与步骤S3筛选出的非电用能数据之间的误差指标是否在设定阈值范围内,则返回步骤S3;如是,则进入步骤S6;S6.从步骤S2中经过归一化处理后的用电数据中筛选出m个样本输入至随机森林算法模块、GBDT算法模块以及Elastic Net算法模块中进行处理,得到中间预测结果,然后将中间预测结果输入至线性回归算法模块中进行处理,得到最终的非电用能预测结果。结果。

【技术实现步骤摘要】
基于集成学习的用电数据和非电用能关联预测方法


[0001]本专利技术涉及一种能耗预测方法,尤其涉及一种基于集成学习的用电数据和非电用能关联预测方法。

技术介绍

[0002]能耗预测主要是指对各种能耗的需求量及其比例关系的未来状况的推测;通过能耗预测,可以建立能源消耗与环境保护之间的关系,有针对性地调整能源结构和工业布局,有助于国家建设资源节约型国家和碳中和战略的实施;同时,通过能耗预测有助于电网公司对用户非电用能趋势研判。
[0003]现有技术中,对于用户的非电用能预测仅仅只针对于用户的非电用能历史数据进行分析,脱离了用电数据,从而对电力公司的电力调度不能提供相应的参考。
[0004]因此,为了解决上述技术问题,亟需提出一种新的技术手段。

技术实现思路

[0005]有鉴于此,本专利技术的目的是提供一种基于集成学习的用电数据和非电用能关联预测方法,基于用户的用电数据和非电用能数据对用户未来设定时段的非电用能进行预测,能够为电力运行调度提供准确的数据依据,而且,基于集成学习进行处理,能够有效确保最终预测结果的准确性,提升最终预测结果的可参考性。
[0006]本专利技术提供的一种于集成学习的用电数据和非电用能关联预测方法,包括以下步骤:
[0007]S1.采集用户的历史的用电数据和非电用能数据,并对用电数据和非电用能数据进行清洗;
[0008]S2.对用电数据和非电用能数据进行归一化处理;
[0009]S3.对基于归一化处理后的用电数据和非电用能数据确定出用电数据和非电用能数据的相关性,并筛选出相关性大于设定阈值的用电数据和非电用能数据;
[0010]S4.将筛选出的用电数据和非用电数据输入至随机森林算法模块、GBDT算法模块以及Elastic Net算法模块中进行训练,三个算法模块分别输出三个非电用能预测结果;
[0011]S5.判断三个非电用能预测结果与步骤S3筛选出的非电用能数据之间的误差指标是否在设定阈值范围内,则返回步骤S3;如是,则进入步骤S6;
[0012]S6.从步骤S2中经过归一化处理后的用电数据中筛选出m个样本输入至随机森林算法模块、GBDT算法模块以及Elastic Net算法模块中进行处理,得到中间预测结果,然后将中间预测结果输入至线性回归算法模块中进行处理,得到最终的非电用能预测结果。
[0013]进一步,步骤S2中,通过如下方法对用电数据和非电用能数据进行归一化处理:
[0014][0015]其中:x'为归一化处理后的用电数据或者非电用能数据,x为归一化处理前的用电数据或者非电用能数据,x
max
为归一化处理前用电数据或者非电用能数据的最大值,x
min
为归一化处理前用电数据或者非电用能数据的最小值。
[0016]进一步,用电数据和非电用能数据的相关性计算具体包括:
[0017]计算用电数据与非电用能数据的Pearson相关性系数ρ
X,Y

[0018][0019]其中:为归一化处理后的用电数据,为归一化处理后的非电用能数据,N为用电数据和非用电数据的长度;
[0020]计算用电数据与非电用能数据的灰色关联度系数r
X,Y

[0021]其中,Z=|X

Y|,表示用电数据和非电用能数据的差值绝对值,z
max
为用电数据和非电用能数据的差值绝对值的最大值,z
min
为用电数据和非电用能数据的差值绝对值的最小值,β为分辨系数,取值范围为(0,1);
[0022]确定最终的用电数据和非电用能数据的相关性系数R:
[0023]R=max(ρ
X,Y
,r
X,Y
)。
[0024]进一步,步骤S5中,误差指标包括平均绝对误差和平均绝对百分比误差。
[0025]本专利技术的有益效果:通过本专利技术,基于用户的用电数据和非电用能数据对用户未来设定时段的非电用能进行预测,能够为电力运行调度提供准确的数据依据,而且,基于集成学习进行处理,能够有效确保最终预测结果的准确性,提升最终预测结果的可参考性。
附图说明
[0026]下面结合附图和实施例对本专利技术作进一步描述:
[0027]图1为本专利技术的流程图。
具体实施方式
[0028]以下进一步对本专利技术做出详细说明:
[0029]本专利技术提供的一种基于集成学习的用电数据和非电用能关联预测方法,包括以下步骤:
[0030]S1.采集用户的历史的用电数据和非电用能数据,并对用电数据和非电用能数据进行清洗;其中,数据进行清洗用于剔除异常数据,比如用电数据或者非用电数据中过大或者过小的数据点,从而利于后续处理结果的准确性;
[0031]S2.对用电数据和非电用能数据进行归一化处理;具体地:
[0032]通过如下方法对用电数据和非电用能数据进行归一化处理:
[0033][0034]其中:x'为归一化处理后的用电数据或者非电用能数据,x为归一化处理前的用电数据或者非电用能数据,x
max
为归一化处理前用电数据或者非电用能数据的最大值,x
min
为归一化处理前用电数据或者非电用能数据的最小值。对非电用能数据包括如水、天然气、煤或者燃油等用量数据;
[0035]S3.对基于归一化处理后的用电数据和非电用能数据确定出用电数据和非电用能数据的相关性,并筛选出相关性大于设定阈值的用电数据和非电用能数据;其中,相关性的设定阈值根据历史经验进行设定,此属于现有技术,对于相关性的确定,具体地:
[0036]用电数据和非电用能数据的相关性计算具体包括:
[0037]计算用电数据与非电用能数据的Pearson相关性系数ρ
X,Y

[0038][0039]其中:为归一化处理后的用电数据,为归一化处理后的非电用能数据,N为用电数据和非用电数据的长度;
[0040]计算用电数据与非电用能数据的灰色关联度系数r
X,Y

[0041]其中,Z=|X

Y|,表示用电数据和非电用能数据的差值绝对值,z
max
为用电数据和非电用能数据的差值绝对值的最大值,z
min
为用电数据和非电用能数据的差值绝对值的最小值,β为分辨系数,取值范围为(0,1);
[0042]确定最终的用电数据和非电用能数据的相关性系数R:
[0043]R=max(ρ
X,Y
,r
X,Y
);通过上述,结合了两种相关性进行取最大值处理,从而能够提升最终预测结果的准确性。
[0044]S4.将筛选出的用电数据和非用电数据输入至随机森林算法模块、GBDT(梯度提升决策树算法的简称)算法模块以及Elastic Net算法模块中进行处理,三个算法模块分别输出未来设定时本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于集成学习的用电数据和非电用能关联预测方法,其特征在于:包括以下步骤:S1.采集用户的历史的用电数据和非电用能数据,并对用电数据和非电用能数据进行清洗;S2.对用电数据和非电用能数据进行归一化处理;S3.对基于归一化处理后的用电数据和非电用能数据确定出用电数据和非电用能数据的相关性,并筛选出相关性大于设定阈值的用电数据和非电用能数据;S4.将筛选出的用电数据和非用电数据输入至随机森林算法模块、GBDT算法模块以及Elastic Net算法模块中进行训练,三个算法模块分别输出三个非电用能预测结果;S5.判断三个非电用能预测结果与步骤S3筛选出的非电用能数据之间的误差指标是否在设定阈值范围内,则返回步骤S3;如是,则进入步骤S6;S6.从步骤S2中经过归一化处理后的用电数据中筛选出m个样本输入至随机森林算法模块、GBDT算法模块以及Elastic Net算法模块中进行处理,得到中间预测结果,然后将中间预测结果输入至线性回归算法模块中进行处理,得到最终的非电用能预测结果。2.根据权利要求1所述基于集成学习的用电数据和非电用能关联预测方法,其特征在于:步骤S2中,通过如下方法对用电数据和非电用能数据进行归一化处理:其中:x'为归一化处理后的用电数据或者非电用能数据,x为归一化处理前的用电数据或者非电用能数据,x

【专利技术属性】
技术研发人员:张泽坤段立蒋荣谢禄江黄平怡李柯沂朱韵攸邓劲松吉涛刘美川钟淘淘甘嵩
申请(专利权)人:国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1