基于数据增强策略和残差自修正学习模型的负荷预测方法技术

技术编号:37191918 阅读:10 留言:0更新日期:2023-04-20 22:52
本发明专利技术涉及基于数据增强策略和残差自修正学习模型的负荷预测方法,属于负荷预测技术领域,考虑到用户用电结构日趋复杂等,提出一种两阶段数据增强方法,建立以张量核范数为约束的低秩张量补全模型;并通过构建稳定性更强的生成对抗网络模型,识别少数类样本之间的分布特性,根据其分布特性模拟生成新样本以实现类别平衡。考虑用户用电行为波动性及不确定性增加对负荷预测精度要求的提升,提出一种基于残差自修正集成负荷预测方法。通过构建适用于时序数据的负荷预测模型和残差预测模型,并建立一种结合负荷预测和残差预测的残差自修正集成模型,将各个预测结果收集并进行组合决策,得到最终的预测结果,以提升负荷预测精度。以提升负荷预测精度。以提升负荷预测精度。

【技术实现步骤摘要】
基于数据增强策略和残差自修正学习模型的负荷预测方法


[0001]本专利技术属于负荷预测
,具体涉及基于数据增强策略和残差自修正学习模型的负荷预测方法。

技术介绍

[0002]随着新型电力系统的快速建设以及能源互联网技术的快速发展,电力用户的负荷模式愈趋多变及复杂,负荷波动性与不确定性程度加剧。电力负荷的精准预测预测可以为电力系统安全、稳定、经济运行提供支撑,并为电力系统的电网调度运行提供决策依据。从长远来说,整个电力系统的规划建设与发展都和电力负荷预测结果息息相关。因此,亟需构建精准、高效的负荷预测模型,以适应新型电力系统及能源互联网发展形势下负荷变化的新趋势。
[0003]当前以提高负荷预测精度为导向的数据增强技术包括负荷缺失数据重构以及负荷类别不平衡处理两方面。关于缺失数据重构,现有技术基于灰色自适应K

最近邻(Grey Adaptive K

Nearest Neighbor,GAKN)选取一定量的历史负荷数据构建原始数据样本库,基于朴素K

最近邻(K

Nearest Neighbor,KNN)理论,提取负荷时间序列特征,并基于阈值筛选方法过滤差异性较强的的特征序列;利用相邻点的灰色关联指数(Grey Relation Coefficient,GRC)设置相邻点权重大小,从而有效提升缺失数据补全精度。关于负荷数据类别不平衡处理,现有技术一使用基于边界的数据合成(borderline

smote,BS)算法,通过计算各条负荷曲线之间的弗雷歇距离,遍历少数类训练样本,设定与多数类样本集群相邻的少数类样本为边界元素,并构成边界元素集合;针对该边界元素集合,利用SMOTE算法随机生成新的训练样本,合理设定数据生成比例参数大小,使少数类与多数类样本之间样本数目大致相等。但是,该方案在补全缺失数据时并未充分考虑负荷数据的时空关联特征,在较高数据缺失比例下补全效果欠佳,且需要大量完整样本序列训练,无法适用于大比例数据缺失补全应用场景;在解决负荷数据不平衡问题时通常利用欠采样或者过采样技术平衡负荷样本,但由于欠采样随机丢失大类样本,往往会产生重要信息丢失的不利情况;过采样通常只利用局部先验信息学习并进行补全,生成数据跟真实负荷数据分布结构存在较大差距。
[0004]负荷预测的残差是指负荷预测结果和真实负荷值的差值,本质是以负荷数据为基础产生的序列数据,具有随机性与无序性等特征。由于残差数据与历史残差数据之间存在时空关联性,因此也可以针对残差数据进行预测。现有技术通过实际模型捕捉残差序列的变换特征,以此为理论基础实现对残差的预测,以预测的残差值为基准修正负荷预测结果,进而提升负荷预测精度;此外,现有技术通过残差自修正集成模型预测残差值,该集成模型是使用若干组模型同时预测负荷序列和预测残差序列,最后采用相关集成策略组合模型,将负荷预测序列和残差预测序列相叠加得到最后负荷预测结果。但是,现有技术存在预测模式单一、非线性映射能力较弱、不同场景下泛化能力较弱等固有缺陷,导致其应用于负荷预测可靠性与准确性不足。现有技术在残差修正预测研究中,采用非时序的深度学习模型,
在输入数据中添加特征数据拟合残差,并用拟合出的残差预测值修正负荷预测结果。并且,该技术仅分析了输入特征数据与残差序列的关联耦合特性,并未深度解析残差序列时序变换特性,最终负荷预测精度受到限制。
[0005]因此,现阶段需设计基于数据增强策略和残差自修正学习模型的负荷预测方法,来解决以上问题。

技术实现思路

[0006]本专利技术目的在于提供基于数据增强策略和残差自修正学习模型的负荷预测方法,用于解决上述现有技术中存在的技术问题,构建精准、高效的负荷预测模型,以适应新型电力系统及能源互联网发展形势下负荷变化的新趋势。
[0007]为实现上述目的,本专利技术的技术方案是:
[0008]基于数据增强策略和残差自修正学习模型的负荷预测方法,包括以下步骤:S1:考虑到用户用电结构日趋复杂,提出一种两阶段数据增强方法,通过将原始负荷数据转化为高维张量格式,建立以张量核范数为约束的低秩张量补全模型;S2:通过构建稳定性更强的生成对抗网络模型,识别少数类样本之间的分布特性,根据其分布特性模拟生成新样本以实现类别平衡;S3:考虑用户用电行为波动性及不确定性增加对负荷预测精度要求的提升,提出一种基于残差自修正集成负荷预测方法;S4:通过构建适用于时序数据的负荷预测模型和残差预测模型,并建立一种结合负荷预测和残差预测的残差自修正集成模型,将各个预测结果收集并进行组合决策,得到最终的预测结果。
[0009]进一步的,步骤S1具体如下:
[0010]基于张量核范数约束的低秩张量补全模型原理如公式(1)所示:
[0011][0012]式中:表示待补全的负荷张量,表示初始负荷张量;Ω表示可观测元素的集合;||
·
||
TNN
代表张量核范数大小;P
Ω
(
·
)表示采样操作符,其计算公式如式(2)所示:
[0013][0014]设辅助变量并构建增广拉格朗日函数如公式(3)所示:
[0015][0016]式中:Q为拉格朗日乘子,β为平衡参数;<
·
>代表张量内积;||
·
||
F
代表张量F范数。
[0017]进一步的,步骤S1的负荷数据缺失补全流程如下:
[0018]S101:缺失张量建立;设表示N个用户H天负荷的X={x
i
:i=1,2,

,N*H,x
i
∈R
d
},按照公式(4),通过将负荷数据X映射为缺失张量缺失部分数据用0代替,并对进行归一化以加快算法收敛;
[0019][0020]S102:各张量初始化;将缺失张量的所有值赋给补全张量并初始化辅助张量为全0,拉格朗日乘子张量为全0;
[0021]S103:交替优化;依据交替方向乘子法原则,通过式(5)、式(6)、式(7)不断求解补全负荷张量辅助张量以及拉格朗日乘子最后当误差ε小于预先设定的阈值或者迭代轮数I已累加至上限时,认为张量核范数已达到最小,算法收敛;
[0022][0023][0024][0025]S104:二维矩阵复原;按照公式(8)将补全张量逆映射为此前的负荷数据二维矩阵格式,获取缺失数据补全后的二维负荷数据集X;
[0026][0027]式中:D表示一天的采样时段数目,floor(
·
)表示向下取整,%表示取余操作。
[0028]进一步的,步骤S2具体如下:
[0029]生成对抗网络为生成器与判别器之间的相互对抗与博弈;生成器通过采样随机噪声,以此构建隐变量空间和实际样本空间的映射关系,最终生成维度同实际样本高度相似的输出样本;判别器分析输入是否来自于实际样本或者生成样本,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于数据增强策略和残差自修正学习模型的负荷预测方法,其特征在于,包括以下步骤:S1:考虑到用户用电结构日趋复杂,提出一种两阶段数据增强方法,通过将原始负荷数据转化为高维张量格式,建立以张量核范数为约束的低秩张量补全模型;S2:通过构建稳定性更强的生成对抗网络模型,识别少数类样本之间的分布特性,根据其分布特性模拟生成新样本以实现类别平衡;S3:考虑用户用电行为波动性及不确定性增加对负荷预测精度要求的提升,提出一种基于残差自修正集成负荷预测方法;S4:通过构建适用于时序数据的负荷预测模型和残差预测模型,并建立一种结合负荷预测和残差预测的残差自修正集成模型,将各个预测结果收集并进行组合决策,得到最终的预测结果。2.根据权利要求1所述的基于数据增强策略和残差自修正学习模型的负荷预测方法,其特征在于,步骤S1具体如下:基于张量核范数约束的低秩张量补全模型原理如公式(1)所示:式中:表示待补全的负荷张量,表示初始负荷张量;Ω表示可观测元素的集合;||
·
||
TNN
代表张量核范数大小;P
Ω
(
·
)表示采样操作符,其计算公式如式(2)所示:设辅助变量并构建增广拉格朗日函数如公式(3)所示:式中:Q为拉格朗日乘子,β为平衡参数;<
·
>代表张量内积;||
·
||
F
代表张量F范数。3.根据权利要求2所述的基于数据增强策略和残差自修正学习模型的负荷预测方法,其特征在于,步骤S1的负荷数据缺失补全流程如下:S101:缺失张量建立;设表示N个用户H天负荷的X={x
i
:i=1,2,

,N*H,x
i
∈R
d
},按照公式(4),通过将负荷数据X映射为缺失张量缺失部分数据用0代替,并对进行归一化以加快算法收敛;S102:各张量初始化;将缺失张量的所有值赋给补全张量并初始化辅助张量为全0,拉格朗日乘子张量为全0;S103:交替优化;依据交替方向乘子法原则,通过式(5)、式(6)、式(7)不断求解补全负荷张量辅助张量以及拉格朗日乘子最后当误差ε小于预先设定的阈值或者迭代轮数I已累加至上限时,认为张量核范数已达到最小,算法收敛;张量核范数已达到最小,算法收敛;
S104:二维矩阵复原;按照公式(8)将补全张量逆映射为此前的负荷数据二维矩阵格式,获取缺失数据补全后的二维负荷数据集X;式中:D表示一天的采样时段数目,floor(
·
)表示向下取整,%表示取余操作。4.根据权利要求3所述的基于数据增强策略和残差自修正学习模型的负荷预测方法,其特征在于,步骤S2具体如下:生成对抗网络为生成器与判别器之间的相互对抗与博弈;生成器通过采样随机噪声,以此构建隐变量空间和实际样本空间的映射关系,最终生成维度同实际样本高度相似的输出样本;判别器分析输入是否来自于实际样本或者生成样本,其输出为分布于0和1之间的概率值;在彼此对抗博弈并学习的过程中,生成器生成的样本质量逐步优化,直至判别器无法判定生成样本来源,从而达到纳什平衡。5.根据权利要求4所述的基于数据增强策略和残差自修正学习模型的负荷预测方法,其特征在于,步骤S2中负荷类别不平衡处理步骤如下:S201:判别器D训练过程;从固定G的权重W和偏置b出发,仅利用G的前向传播过程,从符合标准正态分布的高斯噪声z中采样,通过G得到G(z),经过D的输入层、隐藏层、输出层,输出认为其是真实负荷样本的信念值D(G(z)),计算D(G(z))与其标签0的损失函数值,得到误差Loss
G
;另一方面,输入归一化到[

1,1]的真实负荷样本x,同理经过D的网络层输出信念值D(x),计算D(x)与其标签1的损失函数值,得到误差Loss
R
;误差Loss
G
和Loss
R
联合构成判别器总误差Loss,基于误差反向传播算法,将Loss传播到D中的各个神经元节点,并更新权重W和偏置b;S202:生成器G训练过程;固定D的权重W和偏置b,仅利用D对样本真伪的鉴定功能;从高斯噪声z中采样,经过G的输入层、隐藏层、输出层,得到一批生成样本G(z),再将G(z)输入到D中,到信念值D(G(z)),计算D(G(z))与真实性标签1的损失函数值,得到误差Loss
G
,利用反向传播更新G中神经元节点的权重W和偏置b;S203:少数类样本判定;通过遍历负荷样本集S={S1,S2,

,S
m
},获取每个负荷类别的样本数目N
s
={N1,N2,

,N
m
},将最大类别样本数目max(N
s
)记作N
L
;将N
L
/2设定为判断负荷类别是否为少数类的阈值,若某类负荷样本数目小于该阈值,则判定为少数类样本,并对其进行样本扩充;S204:网络训练;若第i类为少数类样本,建立生成器G和判别器D,输入该类样本负荷数据,并训练G和D,当G和D达到纳什平衡时,表示模型训练完成;S205:样本生成;从符合标准正态分布的高斯噪声z中采样,输入到训练好的G,通过前向传播经过G中的各个网络层便可得到生成样本G(z),将G(z)加入到第i类少数类负荷样本子集S
i
,重复此过程,直至生成样本数量达到0.5*N
L

N
i
,得到样本扩充后的负荷样本子集S'
i
;S206:类别平衡;对每一类别负荷样本集,判断其是否符合少数类样本标准,若不符合,则跳过;否则,重复步骤S...

【专利技术属性】
技术研发人员:马国真王云佳张泽亚胡珀庞凝刘雪飞夏静徐晓彬李航天
申请(专利权)人:国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1