一种频域分布一致性的小样本用户用电数据扩充方法技术

技术编号:28449742 阅读:14 留言:0更新日期:2021-05-15 21:11
本发明专利技术提供了一种频域分布一致性的小样本用户用电数据扩充方法,在充分考虑用户用电数据频域特性的基础上,通过采集获取小样本用电用户的日用电负荷数据,计算小样本用户日用电负荷数据的频域映射向量,采用概率分布方差最小生成对抗网络方法扩充生成频域用户待选数据,按照样本累计余弦散度最小准则筛选频域用户用电数据,基于频域逆变换计算扩充的时域小样本用户用电数据;有效提高小样本用户用电扩充数据与原始数据在频域分布上的一致性。扩充数据与原始数据在频域分布上的一致性。扩充数据与原始数据在频域分布上的一致性。

【技术实现步骤摘要】
一种频域分布一致性的小样本用户用电数据扩充方法


[0001]本专利技术属于智能用电用户用电行为辨识领域,尤其涉及一种频域分布一致性的小样本用户用电数据扩充方法。

技术介绍

[0002]用户用电行为辨识是泛在电力物联网背景下实现智慧能源综合服务的必要措施。而使用大数据人工智能分析用户用电行为时,数据集样本往往存在不均衡性,导致用电数据的分类不准确导致后续数据分析处理出现问题,因此通过小样本用户用电数据生成方法来扩充小样本数据使数据集平衡具有重要意义。生成对抗网络是一种深度学习模型,擅长生成与输入数据分布相近的扩充数据,是解决小样本数据扩充问题的新方法。
[0003]现有的小样本用户用电数据扩充方法,一方面从生成算法上来讲,多是样本的简单复制,不具有多样性,导致后续分析的泛化能力不强;另一方面多是考虑时域来进行分类,没有充分考虑用户用电数据在频域上的特性。针对现有小样本用户用电数据生成方法的局限性,本专利技术在充分考虑用户用电数据频域特性的基础上,通过采集获取小样本用电用户的日用电负荷数据,计算小样本用户日用电负荷数据的频域映射向量,采用概率分布方差最小生成对抗网络方法扩充生成频域用户待选数据,按照样本累计余弦散度最小准则筛选频域用户用电数据,基于频域逆变换计算扩充的时域小样本用户用电数据;有效提高小样本用户用电扩充数据与原始数据在频域分布上的一致性。

技术实现思路

[0004]本专利技术的目的在于提供一种频域分布一致性的小样本用户用电数据扩充方法,该方法包括以下步骤:
[0005]S1.采集获取小样本用电用户的日用电负荷数据;
[0006]S2.计算小样本用户日用电负荷数据的频域映射向量;
[0007]S3.采用概率分布方差最小生成对抗网络方法扩充生成频域用户待选数据;
[0008]S4.按照样本累计余弦散度最小准则筛选频域用户用电数据;
[0009]S5.基于频域逆变换计算扩充的时域小样本用户用电数据。
[0010]与一般技术相比,本专利技术在充分考虑用户用电数据频域特性的基础上,通过采集获取小样本用电用户的日用电负荷数据,计算小样本用户日用电负荷数据的频域映射向量,采用概率分布方差最小生成对抗网络方法扩充生成频域用户待选数据,按照样本累计余弦散度最小准则筛选频域用户用电数据,基于频域逆变换计算扩充的时域小样本用户用电数据;有效提高小样本用户用电扩充数据与原始数据在频域分布上的一致性。
附图说明
[0011]图1为本专利技术方法整体流程图。
[0012]图2为本专利技术方法典型应用场景图。
具体实施方式
[0013]下面结合附图,对优选实施例作详细说明。应该强调的是,下述说明仅仅是示例性的,而不是为了限制本专利技术的范围及其应用。如图 1所示为本专利技术的方法流程图,以下结合具体实施例对本专利技术的方法进行进一步说明。
[0014]具体实施应用场景如图2所示,某小样本用电用户总数为2,通过智能电表获取某分类后的小样本用户的日用电负荷数据,采样间隔为0.5小时,通过傅里叶变换计算频域映射量,利用生成对抗性网络生成频域扩充数据,基于分布间余弦距离最小准则筛选优质的频域数据,通过频域逆变换得到时域的小样本扩充数据。得到的扩充数据可用作原小样本用户用电的预测负荷数据,也可合并进行数据分析,克服类不平衡现象带来的诸多问题。
[0015]本专利技术提供的一种频域分布一致性的小样本用户用电数据扩充方法,包括以下步骤:
[0016]S1.采集获取小样本用电用户的日用电负荷数据
[0017]设小样本用电用户总数为K(K的取值范围为1~100),设扩充大样本倍数为Z(取值范围为5~10),扩充因子为λ(取值范围为2~5);利用家庭用户智能电表采集获取每个小样本用电用户k((k的取值范围为1~K)的日用电负荷数据,按照采样间隔T(单位小时),周期性地采集小样本用电用户第i(i的取值范围为1~50)个统计时刻内的用电数据D
k
(i),获取日用电负荷数据集合{D
k
(i)(}(i=1,...,N),其中floor(*)表示对*向下取整操作。
[0018]实例中设小样本用电用户总数为K=2,设扩充大样本倍数为Z=2,扩充因子为λ=2;利用家庭用户智能电表采集获取每个小样本用电用户k((k的取值范围为1~K()的日用电负荷数据,按照采样间隔 T=0.5(单位小时),周期性地采集小样本用电用户第i(i的取值范围为1~50)个统计时刻内的用电数据D
k
(i),获取日用电负荷数据集合 {D
k
(i)(}(i=1,...,N),其中floor(*)表示对*向下取整操作。
[0019]S2.计算小样本用户日用电负荷数据的频域映射向量
[0020]对每个小样本用电用户k,根据公式计算小样本用电用户k的日用电负荷数据频域映射量X
k
(s)(s=1,...,N),获取所有用户的日用电数据频域映射量向量量向量
[0021]实例中对每个小样本用电用户k,根据公式计算小样本用电用户k的日用电负荷数据频域映射量X
k
(s)(s=1,...,N),获取所有用户的日用电数据频域映射量向量
[0022]S3.采用概率分布方差最小生成对抗网络方法扩充生成频域用户待选数据
[0023]以K个小样本用电用户的日用电负荷数据频域映射向量作为数据输入,采用梯度下降法,按照概率分布方差最小准则对生成对抗网络进行数据扩展训练,扩充生成P=λ
·
Z个频域用户待选数据,其中第 p(p=1,...,P)个用户待选的日频域数据向量为
[0024]实例中以K个小样本用电用户的日用电负荷数据频域映射向量作为数据输入,采用梯度下降法,按照概率分布方差最小准则对生成对抗网络进行数据扩展训练,扩充生成P=λ
·
Z个频域用户待选数据,其中第p(p=1,...,P)个用户待选的日频域数据向量为
[0025]S4.按照样本累计余弦散度最小准则筛选频域用户用电数据
[0026]对每个扩充生成的第p个待选用户日频域数据,按照公式计算待选数据的样本累计余弦散度Q(p);按照 Q(p)值由小到大对待选用户日频域数据向量进行排序操作;选择前Z 个待选用户数据作为扩充用户用电日频域数据
[0027]实例中对每个扩充生成的第p个待选用户日频域数据,按照公式计算待选数据的样本累计余弦散度Q(p);按照Q(p)值由小到大对待选用户日频域数据向量进行排序操作;选择前Z个待选用户数据作为扩充用户用电日频域数据
[0028]S5.基于频域逆变换计算扩充的时域小样本用户用电数据
[0029]对每个第z个扩充用户用电日频域数据按照公式依次计算q=1,...,N计算扩充数据的时域分量 H
z
(q)(q=1,...,N),构成扩充日用电负荷数据{H
z
(q)}(q=1,...,N),完成小样本用户用电数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种频域分布一致性的小样本用户用电数据扩充方法,包括以下步骤:S1.采集获取小样本用电用户的日用电负荷数据;S2.计算小样本用户日用电负荷数据的频域映射向量;S3.采用概率分布方差最小生成对抗网络方法扩充生成频域用户待选数据;S4.按照样本累计余弦散度最小准则筛选频域用户用电数据;S5.基于频域逆变换计算扩充的时域小样本用户用电数据。2.根据权利要求1所述的一种频域分布一致性的小样本用户用电数据扩充方法,其特征在于,所述步骤S1中,小样本用电用户总数为K(K的取值范围为1~100),扩充大样本倍数为Z(取值范围为5~10),扩充因子为λ(取值范围为2~5);采样间隔为T(单位小时),小样本用电用户k(k的取值范围为1~K)的日用电负荷数据第i(i的取值范围为1~50)个统计时刻内的用电数据为D
k
(i),小样本用电用户k日用电负荷数据集合为{D
k
(i)}(i=1,...,N)。3.根据权利要求1所述的一种频域分布一致...

【专利技术属性】
技术研发人员:陆俊李国成王赟
申请(专利权)人:华北电力大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1