基于数据增强和Tri-Training的电力数据异常检测方法及系统技术方案

技术编号:33706146 阅读:15 留言:0更新日期:2022-06-06 08:28
本发明专利技术属于电力数据治理的技术领域,提供了基于数据增强和Tri

【技术实现步骤摘要】
基于数据增强和Tri

Training的电力数据异常检测方法及系统


[0001]本专利技术属于电力数据治理的
,尤其涉及基于数据增强和Tri

Training的电力数据异常检测方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]随着电力物联网建设的有序开展,电力公司采集和存储了海量异构的业务数据。为了助力智慧业务分析应用的建设,公司开展非固定场景下的周期性数据治理工作,在质量识别与治理方面花费大量时间与人力,为业务发展带来了一定的经济成本,也带来了一定的推进阻力。
[0004]面对高频低效的数据管理工作,亟需利用当前数据挖掘、模式识别、深度学习等技术,构建自动化数据质量识别方法,结合数据管理技术与机制,形成质量知识库与治理行为规则,对异构数据环境下的数据拓扑关系进行智能化管理及应用。针对业务需求执行智能化数据治理工作,降低人员成本,缩短治理周期,助力智慧分析业务有效发展。
[0005]数据中台的数据质量是数据高效分析以及数据可靠共享的基础。而脏数据识别是数据质量识别的首要和常态化工作,传统脏数据识别主要依靠数据专家、业务专家等人力人工,随着各行业及各专业数据化建设规模逐渐扩大,依靠传统方法对海量、实时、异构的数据质量识别方法渐显不足。主要问题在人工成本大、时间周期长,依赖专家经验无法并发批量工作,人工治理还会引发错漏现象等,无法快速准确低成本地满足业务数据使用需求;
[0006]目前,数据中台汇聚了公司各专业全量业务数据,数据中台的海量异构多源数据存在很多脏数据。但是,人工识别异常电力数据成本巨大,同时,电力数据的标签相对较少,这些都对电力数据的高效、准确的识别造成了很大的挑战。

技术实现思路

[0007]为了解决上述
技术介绍
中存在的至少一项技术问题,本专利技术提供基于数据增强和Tri

Training的电力数据异常检测方法及系统,其实现对脏数据即异常数据的高效准确的识别,为数据业务的高效开展提供数据基础;规避数据异常带来的安全风险,有效提高电网公司优质服务能力。
[0008]为了实现上述目的,本专利技术采用如下技术方案:
[0009]本专利技术的第一个方面提供基于数据增强和Tri

Training的电力数据异常检测方法,包括如下步骤:
[0010]获取用电序列数据;
[0011]对用电序列数据进行预处理,得到预处理后的用电序列数据集合;
[0012]对预处理后的用电序列数据进行数据映射增强,获得用电序列数据在不同特征空
间中的数据表征;
[0013]对用电序列数据在不同特征空间中的数据表征,基于Tri

Training方法对电力数据进行异常判定。
[0014]本专利技术的第二个方面提供基于数据增强和Tri

Training的电力数据异常检测系统,包括:
[0015]数据获取模块,被配置为:获取用电序列数据;
[0016]数据预处理模块,被配置为:对用电序列数据进行预处理,得到预处理后的用电序列数据集合;
[0017]数据映射模块,被配置为:对预处理后的用电序列数据进行数据映射增强,获得用电序列数据在不同特征空间中的数据表征;
[0018]数据异常判断模块,被配置为:对用电序列数据在不同特征空间中的数据表征,基于Tri

Training方法对电力数据进行异常判定。
[0019]本专利技术的第三个方面提供一种计算机可读存储介质。
[0020]一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的基于数据增强和Tri

Training的电力数据异常检测方法中的步骤。
[0021]本专利技术的第四个方面提供一种计算机设备。
[0022]一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的基于数据增强和Tri

Training的电力数据异常检测方法中的步骤。
[0023]与现有技术相比,本专利技术的有益效果是:
[0024]本专利技术通过对电力数据表征映射到不同特征空间的方式,获得了同一电力数据的不同表征形式,能够进一步发掘异常电力数据的模式,提高异常数据判别的准确性。
[0025]本专利技术通过对数据的转换,增加了用电序列数据的训练量,扩大了异常数据判别数据集的规模,提高了异常数据判别模型的健壮性和适用性。
[0026]本专利技术通过多判别器的方式进行异常数据的判别,避免了单一判别器偏好带来的不利影响,确保了电力数据异常判别的准确性和健壮性。
附图说明
[0027]构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0028]图1为本公开实施例提供的基于数据增强和Tri

Training的电力数据异常检测方法流程示意图;
[0029]图2为本公开实施例提供的基于数据增强和Tri

Training的电力数据异常检测系统结构示意图。
具体实施方式
[0030]下面结合附图与实施例对本专利技术作进一步说明。
[0031]应该指出,以下详细说明都是例示性的,旨在对本专利技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本专利技术所属
的普通技术人员通常
理解的相同含义。
[0032]需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本专利技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0033]实施例一
[0034]如图1所示,本实施例提供了基于数据增强和Tri

Training的电力数据异常检测方法,包括如下步骤:
[0035]S101:获取用电序列数据;
[0036]S102:对用电序列数据进行预处理,得到预处理后的用电序列数据集合;
[0037]其中,所述预处理包括数据规范化、数据转换以及数据增强。
[0038]S103:对预处理后的用电序列数据进行数据增强,获得用电序列数据在不同特征空间中的数据表征;
[0039]S104:对用电序列数据在不同特征空间中的数据表征,基于Tri

Training方法对电力数据进行异常判定。
[0040]其中,S101中,所述用电序列数据是随时间变化的序列数据,每隔一段固定周期Δt定时采集。
[0041]本实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于数据增强和Tri

Training的电力数据异常检测方法,其特征在于,包括:获取用电序列数据;对用电序列数据进行预处理,得到预处理后的用电序列数据集合;对预处理后的用电序列数据进行数据映射增强,获得用电序列数据在不同特征空间中的数据表征;对用电序列数据在不同特征空间中的数据表征,基于Tri

Training方法对电力数据进行异常判定。2.如权利要求1所述的基于数据增强和Tri

Training的电力数据异常检测方法,其特征在于,所述预处理包括数据规范化、数据转换、数据增强以及数据标记。3.如权利要求1所述的基于数据增强和Tri

Training的电力数据异常检测方法,其特征在于,所述对预处理后的用电序列数据进行数据映射增强包括特征提取和小波分解,通过特征提取和小波分解进行映射转换。4.如权利要求3所述的基于数据增强和Tri

Training的电力数据异常检测方法,其特征在于,所述通过特征提取和小波分解进行映射转换的过程包括:对每一个用电序列数据,通过计算用电序列数据中用电负荷统计量的方式进行特征提取,提取用电序列数据的统计特征;结合用电序列数据的标签,构建一个针对原用电序列数据在统计量空间中的映射,形成一个在统计量空间中的集合;对每一个用电序列数据,通过三层小波分解,将每一个用电序列数据中的用电序列数据从时域转换为频域,结合用电序列数据的标签,构建一个针对原用电序列数据在频域空间中的映射,形成一个在频域空间中的集合。5.如权利要求1所述的基于数据增强和Tri

Training的电力数据异常检测方法,其特征在于,所述用电序列数据的统计特征包括:负荷平均值统计量、负荷最小值统计量、负荷最大值统计量、负荷中位数统计量、负荷众数统计量、负荷标准差统计量以及负荷变化范围统计量。6.如权利要求1所述的基于数据增强和Tri

Traini...

【专利技术属性】
技术研发人员:马超严莉黄振刘荫杨冠群郑海杰张闻彬汤琳琳王高洲赵晓
申请(专利权)人:国网山东省电力公司信息通信公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1