基于w事件级本地差分隐私的智能电网数据聚合方法技术

技术编号:38270297 阅读:14 留言:0更新日期:2023-07-27 10:25
本发明专利技术公开了一种基于w事件级本地差分隐私的智能电网数据聚合方法。智能电表在本地通过对历史数据进行处理,找到最优的端点值对数据截断处理,其次,在每个时刻用户根据电网数据的相关性通过偏差距离对数据流进行分组,当偏差距离较小时,将数据分为一个组,临时存储在智能电表端,并设置隐私预算的取值,电表在本地进行扰动,相同组的数据只汇报一个扰动后的值。最后,网关在收到一个区域智能电表的报告值后,对该时刻的数据进行聚合计算,将聚合值发送给控制中心。相较于传统的保护方案,本发明专利技术不依赖于可信的网关,在保护用户的用电模式的同时减少了计算和存储开销。式的同时减少了计算和存储开销。式的同时减少了计算和存储开销。

【技术实现步骤摘要】
[0012]偏差主要由截断造成的绝对误差构成,只有当数据过大或过小被截断后,才会导致偏差的产生,偏差定义如下:
[0013][0014]由于扰动使用拉普拉斯机制,所以,方差可以定义为:
[0015][0016]其中,Δ表示数据的敏感度,在本地差分隐私的情况下,Δ=(τ
tail

τ
head
)。
[0017]S3、在每个时间戳上,根据数据的偏差距离将变化不大的数据划分为一个组,然后比较当前时间戳的值和分组之间的相似性,决定是否对该时刻数据扰动处理。偏差函数可以策略数据和平均值之间的误差,偏差距离定义为:
[0018][0019]其中,G
t
是当前时刻的临时分组,是前一时刻的分组和当前时刻值的并集。
[0020]S4、通过步骤S3,如果需要扰动处理,对该时刻的数据添加拉普拉斯噪声提交给网关,拉普拉斯噪声机制的敏感度由步骤S2确定;否则,向网关提交上一个发布时刻的发布值。
[0021]S5、网关收到了海量用户在某一时刻发布的数据,对这一时刻的数据进行聚合计算,将聚合结果发布到控制中心。
[0022]进一步的,步骤(S2)包括如下具体过程:
[0023]在数据域[min,max]之间,分别取s个值,作为τ
head
和τ
tail
的域B
head
和B
tail
,,每次实验取其中两个值作为τ
head
和τ
tail
,对历史数据通过步骤S3、S4扰动处理,找到期望平均误差最小的两个阈值作为截断的端点值,然后用两个端点值对数据做截断处理。
[0024]进一步的,步骤(S3)具体方法如下:
[0025]视P
t
‑1为前一时刻的分组,当新的时刻t到来时,假设t时刻截断后的数据与前序时刻没有明显变化,令求分组G
t
的偏差距离f
dev
(G
t
),当偏差距离小于一个阈值θ时,视数据没有发生改变,提交前边发布时刻的扰动值,当前时刻的分组则为P
t
=G
t
;否则数据需要扰动处理,并新建一个分组
[0026]进一步的,步骤(S4)中,智能电表需要根据分组情况对数据添加拉普拉斯噪声,其中,为满足w

事件级本地差分隐私,本专利技术使用隐私预算吸收的方式给每个时间戳分配隐私预算:在w长度的窗口下,预先设置每个时刻的隐私预算为如果不需要扰动处理,设置当前时刻的隐私预算为0,如果需要扰动处理,计算前w

1时刻内隐私预算为0的时刻有t
A
个,则该时刻隐私预算为
[0027]智能电表分配隐私预算后,并根据S2步骤中的阈值给需要扰动的数据添加拉普拉
斯噪声,计算过程如下:
[0028][0029]进一步方案中,步骤(S5)中,网关收到智能电表传来的扰动值后,无需知道其他参数,直接对某一地区所有用户报告的值进行聚合计算,得到总的估计值。
[0030]有益效果:本专利技术是一种智能电网数据流发布的满足w事件级本地差分隐私的技术,并且找到最优的阈值降低数据敏感度,利用电网数据之间的相关性对数据进行分组扰动处理,最后由网关进行聚合计算。在满足本地差分隐私的前提下,对测试数据的聚合结果仍然达到较高的准确率。与现有的技术相比,本专利技术的突出实质特点和显著性进步主要体现在以下几个方面:
[0031](1)对比传统的智能电网加密手段,本专利技术只需要对数字进行简单的计算分组和扰动处理,拥有较小的计算开销,也不必考虑智能电表设备的存储性能,减少了存储开销。
[0032](2)本专利技术在本地差分隐私的设置下,每个智能电表只需在本地进行所有操作,发送的数据是扰动数据,攻击者无法获得用户的真实用电数据。
[0033](3)在对数据进行扰动处理,分配隐私预算的时刻,不是每个时刻分配相同的隐私预算,而是采用隐私预算吸收的方案,进一步提交了估计的准确度。
附图说明
[0034]图1为本专利技术的总体流程图;
[0035]图2为本专利技术的智能电表对数据相关性判断并扰动处理的流程图。
具体实施方式
[0036]为详细的说明本专利技术所公开的技术方案,下面结合说明书附图及具体实施例做进一步的阐述。
[0037]首先,结合现有智能电网系统中对电网数据保护不足的问题,本专利技术是一种基于w事件级本地差分隐私的智能电网数据聚合方法,本专利技术包括预处理阶段,其次根据用电数据相关性对其分组,根据分组情况对连续时刻的隐私预算进行分配,最后对数据扰动处理,网关收到扰动后的噪声值对数据进行聚合计算。
[0038]具体来说,参阅图1所示,一种基于w事件级本地差分隐私的智能电网数据聚合方法,步骤如下:
[0039](1)在初始化阶段,网关需要把需要的参数传递给智能电表,包括有滑动窗口的长度w,隐私预算∈,用户分组的最大长度l,采集数据的时间间隔。
[0040](2)智能电表收集到参数后进行预处理,预处理需要智能电表处的历史数据,通过提出的扰动方法在B
head
和B
tail
中找到误差最小的端点值τ
head
和τ
tail
,将超出阈值的数据截断。假设t时刻智能电表处数据为d
t
,截断的计算过程如下:
[0041][0042](3)在t时刻,结合图2,智能电表处首先需要对用电数据进行相关性判断,判断数据相关的标准是偏差距离,当偏差距离较小时,认为数据是均匀分布的。首先假设数据没有明显变化,可以并入上一时刻的分组,计算临时分组的偏差距离,当偏差距离小于给定的阈值时,认为数据没有明显变化,否则,重新建立一个新的分组。
[0043]为适应用电数据的变化,阈值随时间的变化而变化,本专利技术中使用PID修正阈值,其中将原始数据和扰动数据之间的绝对误差作为反馈误差通过反馈误差PID误差可以计算为:
[0044][0045]PID控制器,由比例、积分、导数组成,为简化计算,只考虑比例、积分,K

和K
i
表示比例增益、积分增益尺度因子,其中K

+K
i
=1。
[0046](4)智能电表根据分组情况选择是否对该时刻分配隐私预算进行扰动处理,如果需要扰动处理,分配隐私预算∈
t
,扰动后发布给网关,如果不需要处理或在隐私预算分配的过程中被置空,直接向网关发布前一个发布时刻的扰动值,具体的扰动计算可以表示为如下:
[0047][0048]关于隐私预算分配的方式,本专利技术提供了隐私预算吸收方法,具体计算过程如下:
[0049]预先设置每个时刻隐私预算∈
t
=∈/w,为满足w事件级本地差分隐私,如果在某一时刻吸收了隐私预算,必须从后续的时间戳中跳过相同数量的时刻,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于w事件级本地差分隐私的智能电网数据聚合方法,其特征在于:包括如下的处理步骤:S1、控制中心发布在聚合过程中所需要的滑动窗口的大小w和每个智能电表处在w长度窗口下的隐私预算ε;S2、预处理阶段:根据每个智能电表存储的历史数据d
history
,对d
history
进行扰动处理,通过最小化误差找到最优的两个阈值τ
head
和τ
tail
,当智能电表处数据过大或过小时,用τ
head
和τ
tail
截断数据,其中,误差定义为:对于每个智能电表,假设每个时刻的用电数据范围在[min,max]之间,d

是值d的估计值,d

的期望平方误差由扰动后的方差和截断的偏差构成,即:E[(d
′‑
d)]=Var[d

]+Bias[d

]2偏差主要由截断造成的绝对误差构成,只有当数据过大或过小被截断后,才会导致偏差的产生,偏差定义如下:由于扰动使用拉普拉斯机制,所以,方差可以定义为:其中,Δ表示数据的敏感度,在本地差分隐私的情况下,Δ=(τ
tail

τ
head
);S3、在每个时间戳上,根据数据的偏差距离对数据变化不大的进行划分若干组,然后比较当前时间戳的值和分组之间的相似性,决定是否对该时刻数据扰动处理;偏差函数用于计算数据和平均值之间的误差,衡量数据的变化性,其中偏差距离定义为:其中,G
t
是当前时刻的临时分组,是前一时刻的分组和当前时刻值的并集;S4、通过步骤S3,对于需要扰动处理的,将该时刻的数据添加拉普拉斯噪声提交给网关,拉普拉斯噪声机制的敏感度由步骤S2确定;否则,向网关提交上一个发布时刻的发布值;S5、网关在收到用户在某一时刻发布的数据,对这一时刻的数据进行聚合计算,将聚合结果发布到控制中心。2.根据权利要求1所述的基于w事件级本地差分隐私的智能电网数据聚合方法,...

【专利技术属性】
技术研发人员:王瑞鲜朱友文张跃
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1