一种构建多源异构电力分布式数据库的方法和系统技术方案

技术编号:38632332 阅读:12 留言:0更新日期:2023-08-31 18:30
本发明专利技术涉及电力系统技术领域,公开了一种构建多源异构电力分布式数据库的方法和系统。其中,方法包括以下步骤:对用户电力消费行为相关数据进行数据标准化处理;将标准化处理后的数据进行因素关联度分析;对标准化处理后的数据进行主成分分析;以因素关联度分析和主成分分析的结果作为生成对抗网络的输入,构建电力消费特征场景;将结果数据按照CWM规范化,并存入分布式数据库。本发明专利技术充分利用了主成分分析的降维特性和因素关联度作为生成对抗网络输入带来的训练指向性,可降低数据维度,提高模型收敛速度,同时保留了影响用户电力消费的主要因素,可解决目前综合能源电力数据量大,但重要信息维度单一,多能源之间存在数据壁垒的问题。的问题。的问题。

【技术实现步骤摘要】
一种构建多源异构电力分布式数据库的方法和系统


[0001]本专利技术涉及电力系统
,具体而言,涉及一种构建多源异构电力分布式数据库的方法和系统。

技术介绍

[0002]传统能源单独供应模式因其能源利用率低以及污染严重等缺点已经不能满足时代的需要,以电力消费为中心,基于数字信息技术、多能源联合统筹供应、能源阶梯应用的综合能源系统将逐渐成为能源供应模式的主流。
[0003]就目前综合能源电力大数据建设来看,各资源内部已实现了良好的数据监测、分析,但多能源之间还未形成广泛有效的数据沟通,与用户电力消费行为息息相关的海量数据,包括负荷功率、电价、时间、气温、湿度、降雨量、地域、经济、突发事件因素,以及负荷波动和电能质量指标等,还没有得到充分挖掘利用,重要信息维度单一,数据价值没有得到充分开发;各领域之间还存在数据壁垒,多能互补协调控制空间有限,多元异构数据库建立机制有待完善,不利于实现电力电量的最优化配置。电力行业海量数据在其他能源行业中支撑力不足,数据价值挖掘不充分,极大地阻碍了能源服务市场的快速发展。
[0004]有鉴于此,特提出本申请。

技术实现思路

[0005]本专利技术的目的在于提供一种构建多源异构电力分布式数据库的方法和系统,解决目前综合能源电力数据量大,但重要信息维度单一,多能源之间存在数据壁垒的问题。
[0006]本专利技术通过下述技术方案实现:
[0007]一方面,提供一种构建多源异构电力分布式数据库的方法,包括以下步骤:
[0008]S1:获取用户电力消费行为数据;
[0009]S2:根据用户电力消费行为数据进行用户电力消费影响因素关联度分析和相关性排序;
[0010]S3:利用PCA算法对用户电力消费行为数据进行特征分析,得到主成分数据;
[0011]S4:根据主成分数据,利用GAN算法生成电力消费特征场景数据;
[0012]S5:按照CWM数据规范将电力消费特征场景数据存入OceanBase分布式数据库。
[0013]进一步的,用户电力消费行为数据包括负荷功率、电价、气温、湿度、降雨量、地域、经济、突发事件因素,以及负荷波动和电能质量指标;负荷波动为瞬时功率与日平均功率的偏差;电能质量指标包括电压偏差、电压波动和闪变、谐波电流、间谐波电压和电压不平衡度。
[0014]进一步的,S2之前,包括以下步骤:采用z

score标准化对用户电力消费行为数据进行预处理;
[0015]z

score标准化的模型表达式为
[0016][0017][0018][0019]其中,x
i
为原始数据,i=1,2,3,

,n;为原始数据的算术平均值;s为原始数据的标准差;y
i
表示经过标准化后得到新数据。
[0020]进一步的,S2包括以下步骤:
[0021]通过Spearman相关系数法分析负荷功率与电价、气温、湿度、降雨量、地域、经济、突发事件因素、负荷波动和电能质量指标之间的相关性系数;
[0022]根据相关性系数进行相关性排序;
[0023]Spearman相关系数法的模型表达式为
[0024]d
i
=rank1‑
rank2(4),
[0025][0026]其中,d
i
表示两列数对应元素的等级差,r
s
为Spearman相关系数,r
s
∈(

1,1),n表示样本数。
[0027]进一步的,S3包括以下步骤:
[0028]对标准化处理后的用户电力消费行为数据进行主成分分析,得到p个特征值,并对p个特征值按由大到小的顺序排序;
[0029]从顺序排列的p个特征值中选择前q个特征值,根据选择的前q个特征值计算出主成分个数;
[0030]获取p个特征值对应的特征向量,将获取的特征向量组成特征矩阵;根据特征矩阵提取出主成分个数对应的主成分数据。
[0031]进一步的,主成分分析的模型表达式为
[0032][0033][0034][0035]|C
T
C

λE|=0
ꢀꢀ
(9),
[0036]其中,y
ij
为标准化后的用户电力消费数据,i=1,2,...,m,j=1,2,

n,m为影响电力消费的变量数,n为某变量的样本数;c
jk
为两变量之间的协方差,构成协方差矩阵C;式(7)中,用户电力消费数据经过z

score标准化后,E为单位矩阵,C
T
为C的转置;
[0037]计算主成分个数的模型表达式为其中,Y
w
(w=1,2,3,

,m)为标准化后的用户电力消费数据;为经过主成分分析后选取的q个特征值,当w大于q时,对应的元素用0填充;||
·
||2为2范数操作;δ为预设的误差取值,取值范围为[0,1];
[0038]提取主成分数据的模型表达式为Y
PCA
=U
T
Y(11),U为p个特征值对应的特征向量组成的特征矩阵,U=(u1,u2,

,u
q
),Y为标准化后的用户电力消费数据组成的矩阵。
[0039]进一步的,S4包括以下步骤:
[0040]根据相关性系数的大小顺序,从负荷功率与电价、气温、湿度、降雨量、地域、经济、突发事件因素、负荷波动和电能质量指标之间的相关性系数中选取多个相关性系数;
[0041]获取随机噪声数据,将随机噪声数据和选取的多个相关性系数输入生成对抗网络,得到生成数据;
[0042]将主成分数据和生成数据输入判别网络,得到用于度量生成数据与主成分数据之间差异的标量,并将标量反馈给生成对抗网络和判别网络,直到达到纳什平衡,得到电力消费特征场景数据。
[0043]进一步的,GAN算法的目标函数表示为
[0044][0045]其中,V(D,G)是二分类的交叉熵函数,用于最小化p
G
(z|c)和p
PCA
(y)之间的JS距离;y
PCA
~p
PCA
(y)表示y
PCA
服从概率分布p
PCA
(y);z~p
z
(z)表示z服从概率分布p
z
(z);E表示分布的期望。
[0046]另一方面,提供一种构建多源异构电力分布式数据库的系统,包括
[0047]原始数据获取模块,用于获取用户电力消费行为数据;
[0048]数据预处理模块,用于采用z

score标准化对用户电力消费行为数据进行预处理;
[0049]相关性分析模块,用于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种构建多源异构电力分布式数据库的方法,其特征在于,包括以下步骤:S1:获取用户电力消费行为数据;S2:根据用户电力消费行为数据进行用户电力消费影响因素关联度分析和相关性排序;S3:利用PCA算法对用户电力消费行为数据进行特征分析,得到主成分数据;S4:根据主成分数据,利用GAN算法生成电力消费特征场景数据;S5:按照CWM数据规范将电力消费特征场景数据存入OceanBase分布式数据库。2.根据权利要求1所述的一种构建多源异构电力分布式数据库的方法,其特征在于,用户电力消费行为数据包括负荷功率、电价、气温、湿度、降雨量、地域、经济、突发事件因素,以及负荷波动和电能质量指标;负荷波动为瞬时功率与日平均功率的偏差;电能质量指标包括电压偏差、电压波动和闪变、谐波电流、间谐波电压和电压不平衡度。3.根据权利要求2所述的一种构建多源异构电力分布式数据库的方法,其特征在于,S2之前,包括以下步骤:采用z

score标准化对用户电力消费行为数据进行预处理;z

score标准化的模型表达式为score标准化的模型表达式为score标准化的模型表达式为其中,x
i
为原始数据,i=1,2,3,

,n;为原始数据的算术平均值;s为原始数据的标准差;y
i
表示经过标准化后得到新数据。4.根据权利要求2或3所述的一种构建多源异构电力分布式数据库的方法,其特征在于,S2包括以下步骤:通过Spearman相关系数法分析负荷功率与电价、气温、湿度、降雨量、地域、经济、突发事件因素、负荷波动和电能质量指标之间的相关性系数;根据相关性系数进行相关性排序;Spearman相关系数法的模型表达式为d
i
=rank1‑
rank2(4),其中,d
i
表示两列数对应元素的等级差,r
s
为Spearman相关系数,r
s
∈(

1,1),n表示样本数。5.根据权利要求4所述的一种构建多源异构电力分布式数据库的方法,其特征在于,S3包括以下步骤:对标准化处理后的用户电力消费行为数据进行主成分分析,得到p个特征值,并对p个特征值按由大到小的顺序排序;
从顺序排列的p个特征值中选择前q个特征值,根据选择的前q个特征值计算出主成分个数;获取p个特征值对应的特征向量,将获取的特征向量组成特征矩阵;根据特征矩阵提取出主成分个数对应的主成分数据。6.根据权利要求5所述的一种构建多源异构电力分布式数据库的方法,其特征在于,主成分分析的模型表达式为主成分分析的模型表达式为主成分分析的模型表达式为|C
T
C

λE|=0
ꢀꢀꢀꢀ
(9),其中,y
ij
为标准化后的用户电力消费数据,i=1,2,...,m,j=1,2,

n,m为影响电力消费的变量数,n为某变量的样本数;c
jk
为两变量之间的协方差,构成协方差矩阵C;式(7)中,用户电力消费数据经过z

score标准化后,E为单位矩阵,C
T
为C的转置;计算主成分个数的模型表达式为其中,Y
w
(w=1,2,3,

,m)为标准化后的用户电力消费数据;为经过主成分分析后选取的q个特征值,当w大于q时,对应的元素用0填充;||
·...

【专利技术属性】
技术研发人员:高峰杨亚兰黄睿方飚李享林斌毕悦唐榆东邓明贵周林抒马超
申请(专利权)人:国网四川综合能源服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1