一种基于神经网络的窃电检测方法技术

技术编号:39419786 阅读:11 留言:0更新日期:2023-11-19 16:08
本发明专利技术公开了一种基于神经网络的窃电检测方法,包括以下步骤:S1、数据预处理:对输入的数据集中存在的缺失情况进行预处理,填补缺失值,并对数据进行归一化处理;S2、根据窃电数据特征创建检测网络模型,使用处理好的数据集来训练模型;S3、加载模型,根据输入的电力消耗数据来进行检测。该发明专利技术的窃电检测方法通过利用卷积神经网络来提取数据周内与相邻周间信息,并利用自注意力机制来提取月份间的信息,且针对难以从复杂的序列模式提取出模式的依赖关系问题,对序列进行了分解,从而提高窃电检测的准确率并降低检测的假阳率。检测的准确率并降低检测的假阳率。检测的准确率并降低检测的假阳率。

【技术实现步骤摘要】
一种基于神经网络的窃电检测方法


[0001]本专利技术属于窃电检测
,具体涉及到一种基于神经网络的窃电检测方法。

技术介绍

[0002]现如今,电力在我们的生活中扮演着越来越重要的角色,汽车的动力来源也正逐渐从燃油变为电力,但是电力从生产到消耗的过程中存在着两种类型的损耗:技术性损耗和非技术性损耗,其中非技术性损耗主要是窃电造成的。窃电者未经电力公司授权而消耗的能源,窃电行为带来了严重的安全隐患,危及居民的生命安全。早期的检测窃电行为主要靠人工手段,但近年来智能电网的建设以及基于神经网络的人工智能技术的发展为我们解决窃电问题提供了新的机遇。但是现有结合两者技术的方法针对已有数据所做出的归纳偏置还有待完善,没有充分利用现有数据的特性。
[0003]现有技术方案大致分为三种:基于状态的检测方法、基于博弈的检测方法以及基于分类的检测方法。基于状态的检测方法使用特定的硬件设备,如无线传感器和射频识别标签来进行检测,以提供高检测精度,但其额外需要的硬件设施也为监管系统引入了额外的成本开销;基于博弈的检测方法则将窃电检测问题建模为窃电者和电力公司间的博弈,通过制定盗窃电力人员、监管人员和电力公司在内的所有与电力生产消费环节的有关实体的效用函数和潜在战略的方式,基于博弈的检测方法需要兼顾多方的博弈,其实施难度很大,且效果往往也不是最优;基于分类的检测方法则利用电力消费者存在的固有消费模式来甄别潜在的窃电者,相较于正常用户,窃电者的消费模式是不规则的,而针对分类方法则有传统的机器学习和神经网络方法,神经网络对如今大数据的适配度更好,能达到的性能上限也更高,但是现有的神经网络方法往往是把已有的其他任务网络架构直接套用到电力消耗的数据上,很少对电力消耗的数据做出针对性的架构设计,限制了其的检测率的提高,且导致其拥有更高的假阳性率。

技术实现思路

[0004]针对现有技术的不足,本专利技术旨在提出一种基于神经网络的窃电检测方法,该方法综合考虑电力消耗数据本身作为时序数据特点,对进行窃电检测的神经网络结构做出针对性的调整,通过对窃电数据复杂的相关性和周期性进行建模,解决现有的基于神经网络窃电检测方法的网络架构没有很好的利用数据集特点的问题,从而提高窃电检测的准确率并降低检测的假阳率。
[0005]为了解决上述技术问题,本专利技术通过以下方式来实现:
[0006]一种基于神经网络的窃电检测方法,包括以下步骤:
[0007]S1、数据预处理:对输入的数据集中存在的缺失情况进行预处理,填补缺失值,并对数据进行归一化处理;
[0008]S2、根据窃电数据特征创建检测网络模型,使用处理好的数据集来训练模型;
[0009]S3、加载模型,根据输入的电力消耗数据来进行检测。
[0010]进一步,所述步骤S1中数据预处理具体包括如下步骤:
[0011]S11、数据采集与标注:采集用户每日耗电数据组成数据集,由国家电网的工程师依据经验对用电量、台区损失电量和线损率综合分析标注每个用户是否进行了窃电;
[0012]S12、对步骤S11中的数据集进行读取,查看每日的耗电数据,并从中找到因设备或者网络故障导致的存在缺失值的数据;
[0013]S13、在数据集中识别空间相近似的10个样本,并计算它们之间的欧氏距离,再找到每个缺失样本距离最小的10样本来估算数据点的缺失值,每个样本的缺失值使用该10个邻居的平均值进行插补,计算公式如下:
[0014][0015]其中,D
ij
表示第i个和第j个样本之间的欧氏距离,x
i
和x
j
分别表示第i个样本和第j个样本;
[0016]S14、对于不同用户数据进行归一化处理,归一化公式如下:
[0017][0018]其中,X
norm
表示处理后的向量,x
i
表示原始向量的每一个维度,x
min
表示该向量所有维度中的最小值,x
max
表示该向量所有维度中的最大值。
[0019]进一步,所述步骤S2中创建窃电检测网络模型,使用预处理完的数据作为输入,具体包括如下步骤:
[0020]S21、将预处理完的数据输入至特征提取网络,整个网络表述为三个部分,每部分负责提取不同的特征,最后将三部分特征组合在一起后输入分类网络进行分类,且充分利用电力消耗数据本身特性,三部分特征提取网络在数据输入时分别做以下处理;
[0021]S22、特征提取网络1利用卷积神经网络来提取数据的部分知识,将一维线性的数据进行二维化处理,具体卷积操作是利用不同尺度的卷积操作,分别学习不同天数的同一周内部相邻k天以及跨周的相邻k周之间的相关知识,并使用三个卷积块操作且保持矩阵的形状不变,将三者输出的通道拼接起来经过池化层和激活层作为输出;
[0022]特征提取网络1的具体描述如下所示:
[0023]S221、将预处理后的数据进行维度上的变形,将其从X
in
∈R1×1×
T
,变成X
in1
∈R1×7×
(T/7)
,若T不能被7整除,则将余数部分丢弃,变形后的数据变成一个二维矩阵;
[0024]S222、特征提取网络1利用不同尺度的卷积块操作对重新排列后的数据进行特征提取,尺度分别是3
×
3、5
×
5、7
×
7,即对一周内相邻的三天、五天、七天耗电量的数据关系进行建模,同时对相邻周的同一天也进行了建模;
[0025]具体卷积块操作的运算过程是:
[0026]卷积块依次由卷积层、批归一化层、ReLU激活函数层及卷积层、批归一化层、ReLU激活函数层组成,两卷积层的卷积核大小分别是16
×1×3×
3和32
×1×3×
3,且卷积运算使用padding运算保持二维向量的尺度不变,对于输入维度为X
in1
∈R1×7×
(T/7)
的数据,其输出为X
out13
∈R
32
×7×
(T/7)

[0027]S223、将三个卷积块的输出通道数拼接起来,最终输出为X
out1
∈R
96
×7×
(T/7)
,特征提
取网络1公式表示如下:
[0028]X

out1k
=ReLU(BatchNorm(Conv
2d
(Padding(X
in1
)))),k∈{3,5,7}
ꢀꢀꢀ
(3)
[0029]X
out1k
=ReLU(BatchNorm(Conv
2d
(Padding(X

out1k
)))),k∈{3,5,7}
ꢀꢀꢀ
(4)
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于神经网络的窃电检测方法,其特征在于:包括以下步骤:S1、数据预处理:对输入的数据集中存在的缺失情况进行预处理,填补缺失值,并对数据进行归一化处理;S2、根据窃电数据特征创建检测网络模型,使用处理好的数据集来训练模型;S3、加载模型,根据输入的电力消耗数据来进行检测。2.如权利要求1所述的一种基于神经网络的窃电检测方法,其特征在于:所述步骤S1中数据预处理具体包括如下步骤:S11、数据采集与标注:采集用户每日耗电数据组成数据集,由工程师依据经验对用电量、台区损失电量和线损率综合分析标注每个用户是否进行了窃电;S12、对步骤S11中的数据集进行读取,查看每日的耗电数据,并从中找到因设备或者网络故障导致的存在缺失值的数据;S13、在数据集中识别空间相近似的10个样本,并计算它们之间的欧氏距离,再找到每个缺失样本距离最小的10样本来估算数据点的缺失值,每个样本的缺失值使用该10个邻居的平均值进行插补,计算公式如下:其中,D
ij
表示第i个和第j个样本之间的欧氏距离,x
i
和x
j
分别表示第i个样本和第j个样本;S14、对于不同用户数据进行归一化处理,归一化公式如下:其中,X
norm
表示处理后的向量,x
i
表示原始向量的每一个维度,x
min
表示该向量所有维度中的最小值,x
max
表示该向量所有维度中的最大值。3.如权利要求1所述的一种基于神经网络的窃电检测方法,其特征在于:所述步骤S2中创建窃电检测网络模型,使用预处理完的数据作为输入,具体包括如下步骤:S21、将预处理完的数据输入至特征提取网络,整个网络表述为三个部分,每部分负责提取不同的特征,最后将三部分特征组合在一起后输入分类网络进行分类,且充分利用电力消耗数据本身特性,三部分特征提取网络在数据输入时分别做以下处理;S22、特征提取网络1利用卷积神经网络来提取数据的部分知识,将一维线性的数据进行二维化处理,具体卷积操作是利用不同尺度的卷积操作,分别学习不同天数的同一周内部相邻k天以及跨周的相邻k周之间的相关知识,并使用三个卷积块操作且保持矩阵的形状不变,将三者输出的通道拼接起来经过池化层和激活层作为输出;S23、特征提取网络2利用注意力机制来提取数据的部分知识,将数据按月进行分割作为注意力机制的输入,并在输入前引入固定位置编码作为不同月份的顺序知识;S24、特征提取网络3利用电力消耗数据作为时间序列数据本身的特性进行建模,将数据分解后再进行学习到相应的知识,特征提取网络3主要由两部分组成,一部分是序列分解模块,其作用是把原始的时间序列分解为季节项和趋势项,另一部分是混合全连接网络,其
作用是进行一个重新编码;S25、最后将三部分特征提取网络的输出拼接在一起输入到分类网络,进行分类任务的预测,分类网络使用全连接层进行计算,输出的值X
class_out
若大于0.5表示有窃电行为。4.如权利要求3所述的一种基于神经网络的窃电检测方法,其特征在于:所述步骤S22特征提取网络1的具体步骤如下所示:S221、将预处理后的数据进行维度上的变形,将其从X
in
∈R1×1×
T
,变成X
in1
∈R1×7×
(T/7)
,若T不能被7整除,则将余数部分丢弃,变形后的数据变成一个二维矩阵;S222、特征提取网络1利用不同尺度的卷积块操作对重新排列后的数据进行特征提取,尺度分别是3
×
3、5
×
5、7
×
7,即对一周内相邻的三天、五天、七天耗电量的数据关系进行建模,同时对相邻周的同一天也进行了建模;S223、将三个卷积块的输出通道数拼接起来,最终输出为X
out1
∈R
96
×7×
(T/7)
,特征提取网络1公式表示如下:X

out1k
=ReLU(BatchNorm(Conv
2d
(Padding(X
in1
)))),k∈{3,5,7}
ꢀꢀ
(3)X
out1k
=ReLU(BatchNorm(Conv
2d
(Padding(X

out1k
)))),k∈(3,5,7}
ꢀꢀꢀꢀ
(4)X
out1
=[X
out13
,X
out15
,X
out17
] (5)其中,X

out1k
指的是某个卷积层进行第一次卷积运算后的输出,X
out1k
表示第二次卷积运算后的输出,BatchNorm()是归一化操作,Conv
2d
是卷积运算的符号。5.如权利要求3所述的一种基于神经网络的窃电检测方法,其特征在于:所述步骤S23特征提取网络2的具体步骤如下所示:S231、噪声输入是从标准正态分布中数据组成,其向量维度是1
×1×
T,因Transformer编码器的输入是多个向量,将向量按月进行切分,共分成T/30个向量作为输入,若不满30天的余数直接丢弃,分割后向量的维度是X
in2
∈R1×
30
×
(T/30)
;S232、位置编码模块负责给输入向量添加序列的位置信息,其将包含有位置信息的向量与预处理好的向量作相加运算,位置编码向量维度是X
e
∈R1×
30
×
(T/30)
,且位置编码向量的参数是可学习的,以便在端到端的训练过程中学习到比绝对位置编码含有更丰富位置信息的编码;S233、加入位置编码后的数据输入,连续经过3个Transformer编码器后获得输出特征,该Transformer编码器由自注意力层、层归一化层、残差连接和全连接层构成,输入数据依次经过自注意力层、通过残差连接方式输入到层归一化层、通过全连接层和残差连接方式输入到层归一化层后最终输出。6.如权利要求3所述的一种基于神经网络的窃电检测方法,其特征在于:所述步骤S24特征提取网络3的具体步骤如下所示:S241、序列分解模块通过平均池化的方式将时间序列拆解为季节性和趋势性,其公式表达如下:X
t
=AvgPool(Padding(X))
...

【专利技术属性】
技术研发人员:李琪林方建全周尧彭德中
申请(专利权)人:国网四川省电力公司营销服务中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1