【技术实现步骤摘要】
基于数据增强策略和残差自修正学习模型的负荷预测方法
[0001]本专利技术属于负荷预测
,具体涉及基于数据增强策略和残差自修正学习模型的负荷预测方法。
技术介绍
[0002]随着新型电力系统的快速建设以及能源互联网技术的快速发展,电力用户的负荷模式愈趋多变及复杂,负荷波动性与不确定性程度加剧。电力负荷的精准预测预测可以为电力系统安全、稳定、经济运行提供支撑,并为电力系统的电网调度运行提供决策依据。从长远来说,整个电力系统的规划建设与发展都和电力负荷预测结果息息相关。因此,亟需构建精准、高效的负荷预测模型,以适应新型电力系统及能源互联网发展形势下负荷变化的新趋势。
[0003]当前以提高负荷预测精度为导向的数据增强技术包括负荷缺失数据重构以及负荷类别不平衡处理两方面。关于缺失数据重构,现有技术基于灰色自适应K
‑
最近邻(Grey Adaptive K
‑
Nearest Neighbor,GAKN)选取一定量的历史负荷数据构建原始数据样本库,基于朴素K
‑
最近邻(K
‑
Nearest Neighbor,KNN)理论,提取负荷时间序列特征,并基于阈值筛选方法过滤差异性较强的的特征序列;利用相邻点的灰色关联指数(Grey Relation Coefficient,GRC)设置相邻点权重大小,从而有效提升缺失数据补全精度。关于负荷数据类别不平衡处理,现有技术一使用基于边界的数据合成(borderline
‑
smote,BS) ...
【技术保护点】
【技术特征摘要】
1.基于数据增强策略和残差自修正学习模型的负荷预测方法,其特征在于,包括以下步骤:S1:考虑到用户用电结构日趋复杂,提出一种两阶段数据增强方法,通过将原始负荷数据转化为高维张量格式,建立以张量核范数为约束的低秩张量补全模型;S2:通过构建稳定性更强的生成对抗网络模型,识别少数类样本之间的分布特性,根据其分布特性模拟生成新样本以实现类别平衡;S3:考虑用户用电行为波动性及不确定性增加对负荷预测精度要求的提升,提出一种基于残差自修正集成负荷预测方法;S4:通过构建适用于时序数据的负荷预测模型和残差预测模型,并建立一种结合负荷预测和残差预测的残差自修正集成模型,将各个预测结果收集并进行组合决策,得到最终的预测结果。2.根据权利要求1所述的基于数据增强策略和残差自修正学习模型的负荷预测方法,其特征在于,步骤S1具体如下:基于张量核范数约束的低秩张量补全模型原理如公式(1)所示:式中:表示待补全的负荷张量,表示初始负荷张量;Ω表示可观测元素的集合;||
·
||
TNN
代表张量核范数大小;P
Ω
(
·
)表示采样操作符,其计算公式如式(2)所示:设辅助变量并构建增广拉格朗日函数如公式(3)所示:式中:Q为拉格朗日乘子,β为平衡参数;<
·
>代表张量内积;||
·
||
F
代表张量F范数。3.根据权利要求2所述的基于数据增强策略和残差自修正学习模型的负荷预测方法,其特征在于,步骤S1的负荷数据缺失补全流程如下:S101:缺失张量建立;设表示N个用户H天负荷的X={x
i
:i=1,2,
…
,N*H,x
i
∈R
d
},按照公式(4),通过将负荷数据X映射为缺失张量缺失部分数据用0代替,并对进行归一化以加快算法收敛;S102:各张量初始化;将缺失张量的所有值赋给补全张量并初始化辅助张量为全0,拉格朗日乘子张量为全0;S103:交替优化;依据交替方向乘子法原则,通过式(5)、式(6)、式(7)不断求解补全负荷张量辅助张量以及拉格朗日乘子最后当误差ε小于预先设定的阈值或者迭代轮数I已累加至上限时,认为张量核范数已达到最小,算法收敛;张量核范数已达到最小,算法收敛;
S104:二维矩阵复原;按照公式(8)将补全张量逆映射为此前的负荷数据二维矩阵格式,获取缺失数据补全后的二维负荷数据集X;式中:D表示一天的采样时段数目,floor(
·
)表示向下取整,%表示取余操作。4.根据权利要求3所述的基于数据增强策略和残差自修正学习模型的负荷预测方法,其特征在于,步骤S2具体如下:生成对抗网络为生成器与判别器之间的相互对抗与博弈;生成器通过采样随机噪声,以此构建隐变量空间和实际样本空间的映射关系,最终生成维度同实际样本高度相似的输出样本;判别器分析输入是否来自于实际样本或者生成样本,其输出为分布于0和1之间的概率值;在彼此对抗博弈并学习的过程中,生成器生成的样本质量逐步优化,直至判别器无法判定生成样本来源,从而达到纳什平衡。5.根据权利要求4所述的基于数据增强策略和残差自修正学习模型的负荷预测方法,其特征在于,步骤S2中负荷类别不平衡处理步骤如下:S201:判别器D训练过程;从固定G的权重W和偏置b出发,仅利用G的前向传播过程,从符合标准正态分布的高斯噪声z中采样,通过G得到G(z),经过D的输入层、隐藏层、输出层,输出认为其是真实负荷样本的信念值D(G(z)),计算D(G(z))与其标签0的损失函数值,得到误差Loss
G
;另一方面,输入归一化到[
‑
1,1]的真实负荷样本x,同理经过D的网络层输出信念值D(x),计算D(x)与其标签1的损失函数值,得到误差Loss
R
;误差Loss
G
和Loss
R
联合构成判别器总误差Loss,基于误差反向传播算法,将Loss传播到D中的各个神经元节点,并更新权重W和偏置b;S202:生成器G训练过程;固定D的权重W和偏置b,仅利用D对样本真伪的鉴定功能;从高斯噪声z中采样,经过G的输入层、隐藏层、输出层,得到一批生成样本G(z),再将G(z)输入到D中,到信念值D(G(z)),计算D(G(z))与真实性标签1的损失函数值,得到误差Loss
G
,利用反向传播更新G中神经元节点的权重W和偏置b;S203:少数类样本判定;通过遍历负荷样本集S={S1,S2,
…
,S
m
},获取每个负荷类别的样本数目N
s
={N1,N2,
…
,N
m
},将最大类别样本数目max(N
s
)记作N
L
;将N
L
/2设定为判断负荷类别是否为少数类的阈值,若某类负荷样本数目小于该阈值,则判定为少数类样本,并对其进行样本扩充;S204:网络训练;若第i类为少数类样本,建立生成器G和判别器D,输入该类样本负荷数据,并训练G和D,当G和D达到纳什平衡时,表示模型训练完成;S205:样本生成;从符合标准正态分布的高斯噪声z中采样,输入到训练好的G,通过前向传播经过G中的各个网络层便可得到生成样本G(z),将G(z)加入到第i类少数类负荷样本子集S
i
,重复此过程,直至生成样本数量达到0.5*N
L
‑
N
i
,得到样本扩充后的负荷样本子集S'
i
;S206:类别平衡;对每一类别负荷样本集,判断其是否符合少数类样本标准,若不符合,则跳过;否则,重复步骤S...
【专利技术属性】
技术研发人员:马国真,王云佳,张泽亚,胡珀,庞凝,刘雪飞,夏静,徐晓彬,李航天,
申请(专利权)人:国家电网有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。