当前位置: 首页 > 专利查询>浙江大学专利>正文

基于CDoubleGAN的电网时序数据生成模型系统技术方案

技术编号:39328636 阅读:19 留言:0更新日期:2023-11-12 16:05
本发明专利技术公开了基于CDoubleGAN的电网时序数据生成模型系统。本发明专利技术中,创新性地采用了编解码器加上双GAN的结构,使得模型的训练更加稳定,模型的效果更好;通过使用AR

【技术实现步骤摘要】
基于CDoubleGAN的电网时序数据生成模型系统


[0001]本专利技术属于电网时序数据
,具体为基于CDoubleGAN的电网时序数据生成模型系统。

技术介绍

[0002]数据是人工智能发展的重要基础之一,但由于在很多实际环境(比如电力系统环境)中,一方面,大量高质量样本的采集是十分困难的,特别是对于时序数据而言,数据缺失以及数据种类不平衡等问题经常存在,而少量样本很难用于复杂的模型的准确训练,另一方面,部分数据存在敏感信息,不能将原始数据直接用于其他环境,故需要对其进行脱敏,以实现敏感隐私数据的可靠保护,而时序数据生成模型以较少的样本数量来生成大量高质量样本,同时变相对原始数据集脱敏,另外考虑到深度学习技术在智能电网中的发展状况,且电力系统暂态稳定分析在电网的发展中越来越重要,该生成模型对于电力系统后续研究来说具有重要的价值。
[0003]Mogren等人提出了C

RNN

GAN,成为使用GAN生成连续序列数据的首批示例之一,随后Esteban(2017)等人提出了RCGAN,其网络架构与C

RNN

GAN不同,将判别器设置为单向结构,同时以其他信息为条件,构成了条件GAN,之后Yoon(2019)等人提出TimeGAN,将无监督GAN网络和监督回归自模型以及变分编码器相结合,使得时序数据GAN的训练更稳定,同时保留了时间序列的时间动态,Ni(2020)等人提出了Conditional Sig

Wasserstein GANs,通过Signature Wasserstein

1(Sig

W1)的度量来捕获时间序列模型的时间依赖性,将其作用域时间序列GAN中的判别器,同时提出条件自回归前馈神经网络(AR

FNN),捕获时间的自回归性质,将过去的序列和噪声映射到未来的序列中。
[0004]但是对于电网系统中的高特征维度数据而言,训练就会很不稳定,Conditional Sig

Wasserstein GANs采用的Sig

W1度量所占用的内存资源会随着特征维度升高呈指数型增长,面对高维度特征的时序数据也难以训练。

技术实现思路

[0005]本专利技术的目的在于:为了解决上述提出的问题,提供基于CDoubleGAN的电网时序数据生成模型系统。
[0006]本专利技术采用的技术方案如下:基于CDoubleGAN的电网时序数据生成模型系统,所述电网时序数据生成模型系统包括编解码器、时刻样本生成器及对应的判别器、时序样本生成器及对应的判别器;
[0007]所述编解码器的作用是对时序数据进行编解码,将时序数据映射到更低维度的数据空间;
[0008]所述时刻样本生成器和时刻样本鉴别器组成了Transient GAN;
[0009]所述时序样本生成器和时序样本鉴别器组成了Time

series GAN。
[0010]在一优选的实施方式中,所述编解码器结构作用于整个模型的前后两端,一方面,
编解码器降低了数据特征的维度,最大程度保留了特征信息,另一方面,编解码器将数据归一化到0~1之间,相比于直接使用高斯混合模型对特征数据进行处理。
[0011]在一优选的实施方式中,所述编解码器的处理具有更强的适应性;时刻样本生成器的输入为随机噪声和样本所属的类别标签,输出为符合类别标签信息的单一时刻样本,用于时序样本生成前的预生成;时序样本生成器的输入为随机噪声和样本所属的类别标签,以及时刻样本生成器生成的单一时刻样本,输出为符合标签信息的时序样本;两者的判别器的输入为真实的时刻/时序的样本和生成器生成的时刻/时序的样本,输出为对真实样本和生成样本的分布距离的评价指标。
[0012]在一优选的实施方式中,所述编解码器的作用是对时序数据进行编解码,将时序数据映射到更低维度的数据空间,假设样本时间序列为X:{x(t):t=1,...,n},其中将被映射到H:{h(t):t=1,...,n},其中n表示时间维度,f
dim1
和f
dim1
分别表示的数据前后的特征维度,前后映射不改变时间维度,仅改变特征维度,同时为保证后续生成器的稳定训练,对特征数据做自适应归一化,使得映射后的所有特征f∈(0,1),编解码器的模型架构如图2所示,编码器和解码器的模型的共同部分包括五层GRU、若干层全连接层、leakyrelu激活层和Batchnorm层组成,其中GRU层用来提取样本数据的时序特征,BatchNorm层用来稳定训练,另外,编码器最后多加了一层Sigmiod层,来完成之前说明的归一化操作,编码器的输入X和解码器的输出之间的Mean Square Error(MSE)损失即为整个模型的损失函数。
[0013]在一优选的实施方式中,所述时刻样本生成器的输入为随机噪声(Z1~N(0,1))以及样本类别标签y,输出为已编码的单个时刻的样本数据
[0014]在一优选的实施方式中,所述时刻样本鉴别器的输入为真实样本中单个时刻的数据或者为生成器生成的单个时刻样本数据其模型结构如图3所示,其生成器和鉴别器共有的部分包括标签的嵌入层、若干全连接层和LeakyRelu激活函数。
[0015]在一优选的实施方式中,所述鉴别器在每对全连接层和LeakyRelu激活函数后都进行了谱归一化的处理;
[0016]生成器和鉴别器的目标函数如式(6)所示,其中h(1)表示编码过的真实的初始时刻的特征数据,y表示其对应的标签类别,表示编码过的生成的初始时刻的特征数据,表示其对应的标签类别,在训练过程中,鉴别器往目标函数扩大的方向优化,生成器往目标函数减小的方向优化,故此,生成器的目标函数如式(7)所示,鉴别器的目标函数如式(8)所示:
[0017][0018][0019][0020]在一优选的实施方式中,所述时序样本生成器的输入为随机噪声Z2:{z(t):t=1,...,n}(其中且z(t)~N(0,1))、样本类别标签y以及时刻样本生成器生成的初
始时刻的特征数据输出为时序的样本数据
[0021]在一优选的实施方式中,所述时序样本鉴别器的输入为真实样本时序数据H:{h(t):t=1,...,n}或者为生成的时序样本数据其生成器部分参考了SigCWGAN,使用AR

FNN,其作用是将过往的时刻数据和随机噪音z(1,2...,n)映射为未来n个时刻的时序数据,同时对于每一个t时刻而言,使得预测的下一个时刻t+1的条件分布尽可能接近真实条件分布P(h(t+1)|h(1,...,t)),这里的AR

FNN网络有前馈神经网络(残差网络构成)以及LeakyRelu激活函数等组成,具体模型结构如图4所示。
[0022]在一优选的实施方式中,所述AR

FNN网络训练过程如图5本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于CDoubleGAN的电网时序数据生成模型系统,其特征在于:所述电网时序数据生成模型系统包括编解码器、时刻样本生成器及对应的判别器、时序样本生成器及对应的判别器;所述编解码器的作用是对时序数据进行编解码,将时序数据映射到更低维度的数据空间;所述时刻样本生成器和时刻样本鉴别器组成了Transient GAN;所述时序样本生成器和时序样本鉴别器组成了Time

series GAN。2.如权利要求1所述的基于CDoubleGAN的电网时序数据生成模型系统,其特征在于:所述编解码器结构作用于整个模型的前后两端,一方面,编解码器降低了数据特征的维度,最大程度保留了特征信息,另一方面,编解码器将数据归一化到0~1之间,相比于直接使用高斯混合模型对特征数据进行处理。3.如权利要求1所述的基于CDoubleGAN的电网时序数据生成模型系统,其特征在于:所述编解码器的处理具有更强的适应性;时刻样本生成器的输入为随机噪声和样本所属的类别标签,输出为符合类别标签信息的单一时刻样本,用于时序样本生成前的预生成;时序样本生成器的输入为随机噪声和样本所属的类别标签,以及时刻样本生成器生成的单一时刻样本,输出为符合标签信息的时序样本;两者的判别器的输入为真实的时刻/时序的样本和生成器生成的时刻/时序的样本,输出为对真实样本和生成样本的分布距离的评价指标。4.如权利要求1所述的基于CDoubleGAN的电网时序数据生成模型系统,其特征在于:所述编解码器的作用是对时序数据进行编解码,将时序数据映射到更低维度的数据空间,假设样本时间序列为X:{x(t):t=1,...,n},其中将被映射到H:{h(t):t=1,...,n},其中n表示时间维度,f
dim1
和f
dim1
分别表示的数据前后的特征维度,前后映射不改变时间维度,仅改变特征维度,同时为保证后续生成器的稳定训练,对特征数据做自适应归一化,使得映射后的所有特征f∈(0,1),编码器和解码器的模型的共同部分包括五层GRU、若干层全连接层、leakyrelu激活层和Batchnorm层组成,其中GRU层用来提取样本数据的时序特征,BatchNorm层用来稳定训练,另外,编码器最后多加了一层Sigmiod层,来完成之前说明的归一化操作,编码器的输入X和解码器的输出之间的Mean Square Error(MSE)损失即为整个模型的损失函数。5.如权利要求1所述的基于CDoubleGAN的电网时序数据生成模型系统,其特征在于:所述时刻样本生成器的输入为随机噪声(Z1~N(0,1))以及样本类别标签y,输出为已编码的单个时刻的样本数据6.如权利要求1所述的基于CDoubleGAN的电网时序数据生成模型系统,其特征在于:所述时刻样本鉴别器的输入为真实样本中单个时刻的数据或者为生成器生成的单个时刻样本数据其生成器和鉴...

【专利技术属性】
技术研发人员:陈润泽张亶张启飞叶瑞涛
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1