System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于全同态加密算法的电力大数据动态脱敏方法技术_技高网

基于全同态加密算法的电力大数据动态脱敏方法技术

技术编号:40786087 阅读:5 留言:0更新日期:2024-03-28 19:17
本申请涉及数据处理技术领域,提出了基于全同态加密算法的电力大数据动态脱敏方法,包括:获取电力交易大数据集,根据电力交易大数据集获取待隐匿数据集合和隐私保护数据集合,根据电力交易大数据集中不同电力数据样本的待隐匿数据集合和隐私保护数据集合获取隐匿保护增强系数,根据隐匿保护增强系数构建扰动近邻矩阵,根据扰动近邻矩阵计算数据扰动敏感系数,根据数据扰动敏感系数构建扰动敏感管理四叉树,基于扰动敏感管理四叉树计算噪声敏感管理系数,根据噪声敏感管理系数获取电力数据噪声敏感度,基于电力数据噪声敏感度获取电力数据的全同态加密结果。本申请通过电力数据噪声敏感度对电力数据进行全同态加密,提高电力数据的脱敏的质量。

【技术实现步骤摘要】

本申请涉及数据处理,具体涉及基于全同态加密算法的电力大数据动态脱敏方法


技术介绍

1、当前,数据挖掘的需求与日俱增,对各类信息和数据的收集越来越频繁,多样的算法和大数据技术使数据处理的过程既快速又准确,但也带来了对数据隐私保护的需求。随着智能电网的发展,利用发布的电力大数据对电力行业的状态进行数据挖掘和分析已经成为了电力信息化时代的发展潮流,但数据共享带来便利的同时也伴随着隐私泄露的风险,因此电力数据的隐私保护受到了广泛的关注。

2、隐私保护的方式较为广泛,常见的隐私保护方法为k-匿名、l-多样性和t-紧密型等方法,也可以通过全同态加密的方式对数据进行脱敏处理,传统的全同态加密算法对电力大数据进行脱敏处理时,将电力大数据的转化为加密后的密文,同时密文具有加法和乘法同态的属性。目前基于lwe上的全同态加密方案加入了密钥交换技术,使全同态加密方案可以更好的具备乘法和加法同态计算,但每次密文乘法计算后,都要将乘积密文与密钥交换矩阵相乘,从而进行密钥交换得到一个正常维数的密文,极大地影响了计算效率;另外一方面,全同态加密过程中噪声的管理与数据加密的安全性和精度直接相关,若全同态加密的过程里密文中的噪声过大会降低解密的准确性,密文中噪声过小会降低数据加密的安全性;以上这些问题降低了电力大数据进行数据脱敏的效率和精度,进而影响对电力大数据进行脱敏处理的准确性。


技术实现思路

1、本申请提供基于全同态加密算法的电力大数据动态脱敏方法,以解决电力数据脱敏质量差的问题,所采用的技术方案具体如下:

2、本申请一个实施例提供了基于全同态加密算法的电力大数据动态脱敏方法,该方法包括以下步骤:

3、获取电力交易大数据集;

4、将电力交易大数据集中每个电力数据样本的数据划分为待隐匿数据集合和隐私保护数据集合;根据电力交易大数据集中不同电力数据样本之间的待隐匿数据集合和隐私保护数据集合的差异计算隐匿保护增强系数;

5、根据电力交易大数据集中不同电力数据样本之间的隐匿保护增强系数构建每个电力数据样本扰动近邻矩阵;根据电力交易大数据集中每个电力数据样本的扰动近邻矩阵计算数据扰动敏感系数;

6、根据电力交易大数据集中不同电力数据样本之间的数据扰动敏感系数构建扰动敏感管理四叉树,根据扰动敏感管理四叉树计算噪声敏感管理系数;

7、根据噪声敏感管理系数获取电力数据噪声敏感度,基于电力数据噪声敏感度完成对电力数据的脱敏处理。

8、优选的,所述将电力交易大数据集中每个电力数据样本的数据划分为待隐匿数据集合和隐私保护数据集合的方法为:

9、将电力交易大数据集中每个电力数据样本的姓名、联系电话、电表用户号信息均作为待隐匿处理数据信息,将每个电力数据样本对应的所有待隐匿处理数据信息组成的集合作为每个电力数据样本的待隐匿数据集合;将电力交易大数据集中每个电力数据样本的年龄、用电量、账户余额信息均作为待隐私保护数据信息,将每个电力数据样本对应的所有待隐私保护数据信息组成的集合作为每个电力数据样本的隐私保护数据集合。

10、优选的,所述根据电力交易大数据集中不同电力数据样本之间的待隐匿数据集合和隐私保护数据集合的差异计算隐匿保护增强系数的方法为:

11、对于电力交易大数据集中任意两个电力数据样本,将两个电力数据样本之间的待隐匿数据集合的杰卡德系数作为两个电力数据样本的隐匿增强系数;将两个电力数据样本之间的隐私保护数据集合的杰卡德系数作为两个电力数据样本之间的隐私保护系数;

12、将两个电力数据样本之间的隐匿增强系数作为分子,将两个数据样本之间的隐私保护系数与0.01的和作为分母,将分子与分母的比值作为两个数据样本的隐匿保护增强系数。

13、优选的,所述根据电力交易大数据集中不同电力数据样本之间的隐匿保护增强系数构建每个电力数据样本扰动近邻矩阵的方法为:

14、将电力交易大数据集作为输入,采用近邻算法获取电力交易大数据集中每个电力数据样本的预设数量的近邻样本,将每个电力数据样本与对应的预设数量近邻样本组成的集合作为每个电力数据样本的近邻样本集;根据电力交易大数据集中每个电力数据样本的近邻样本集获取扰动近邻序列,基于扰动近邻序列获取每个电力数据样本的扰动近邻矩阵。

15、优选的,所述根据电力交易大数据集中每个电力数据样本的近邻样本集获取扰动近邻序列,基于扰动近邻序列获取每个电力数据样本的扰动近邻矩阵的方法为:

16、对于电力交易大数据集中每个电力数据样本对应的近邻样本集,将近邻样本集中每个元素与其它元素之间的隐匿保护增强系数按照由小到大顺序组成的序列作为近邻样本集中每个元素的扰动近邻序列,将所述扰动近邻序列作为矩阵中的一行元素,将近邻样本集对应的所有扰动近邻序列组成的矩阵作为每个电力数据样本的扰动近邻矩阵。

17、优选的,所述根据电力交易大数据集中每个电力数据样本的扰动近邻矩阵计算数据扰动敏感系数的方法为:

18、

19、式中,表示电力交易大数据集中第个和第个电力数据样本之间的数据扰动敏感系数;和分别表示电力交易大数据集中第个、第个电力数据样本的扰动近邻矩阵中第行、第行元素组成的向量;表示和之间的余弦相似度;和分别表示电力交易大数据集中第个、第个电力数据样本的扰动近邻矩阵的秩;表示以自然常数为底数的指数函数;表示电力交易大数据集中第个、第个电力数据样本的扰动近邻矩阵的行数。

20、优选的,所述根据电力交易大数据集中不同电力数据样本之间的数据扰动敏感系数构建扰动敏感管理四叉树,根据扰动敏感管理四叉树计算噪声敏感管理系数的方法为:

21、将电力交易大数据集中每个电力数据样本作为一个节点,将电力交易大数据集中不同电力数据样本之间的数据扰动敏感系数作为对应的不同节点之间连线的权重,将电力交易大数据集中所有电力数据样本对应的节点和连线的权重组成的加权无向图作为电力交易大数据集的扰动敏感加权无向图,将扰动敏感加权无向图作为输入,采用聚类算法获取扰动加权无向图的聚类结果,根据电力交易大数据集的扰动敏感加权无向图的聚类结果构建扰动敏感管理四叉树;

22、对于每个扰动敏感管理样本集合的扰动敏感管理四叉树,将扰动敏感管理四叉树中所有根节点对应的统计数量组成的序列作为扰动敏感管理基础数量序列,将每个根节点对应的所有叶节点的数量组成的序列作为扰动敏感管理数量序列;据扰动敏感管理基础数量序列和扰动敏感管理数量序列对每个扰动敏感管理样本集合的噪声敏感影响程度的分析结果确定每个扰动敏感管理样本集合的噪声敏感管理系数。

23、优选的,所述根据电力交易大数据集的扰动敏感加权无向图的聚类结果构建扰动敏感管理四叉树的方法为:

24、对于电力交易大数据集的扰动敏感加权无向图的聚类结果中每个聚类簇,将每个聚类簇中所有节点对应的电力数据样本构成的集合作为一个扰动敏感管理样本集合;对于每个扰动管理样本集合中任意两个电力数据样本,将本文档来自技高网...

【技术保护点】

1.基于全同态加密算法的电力大数据动态脱敏方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的基于全同态加密算法的电力大数据动态脱敏方法,其特征在于,所述将电力交易大数据集中每个电力数据样本的数据划分为待隐匿数据集合和隐私保护数据集合的方法为:

3.根据权利要求1所述的基于全同态加密算法的电力大数据动态脱敏方法,其特征在于,所述根据电力交易大数据集中不同电力数据样本之间的待隐匿数据集合和隐私保护数据集合的差异计算隐匿保护增强系数的方法为:

4.根据权利要求1所述的基于全同态加密算法的电力大数据动态脱敏方法,其特征在于,所述根据电力交易大数据集中不同电力数据样本之间的隐匿保护增强系数构建每个电力数据样本扰动近邻矩阵的方法为:

5.根据权利要求4所述的基于全同态加密算法的电力大数据动态脱敏方法,其特征在于,所述根据电力交易大数据集中每个电力数据样本的近邻样本集获取扰动近邻序列,基于扰动近邻序列获取每个电力数据样本的扰动近邻矩阵的方法为:

6.根据权利要求1所述的基于全同态加密算法的电力大数据动态脱敏方法,其特征在于,所述根据电力交易大数据集中每个电力数据样本的扰动近邻矩阵计算数据扰动敏感系数的方法为:

7.根据权利要求1所述的基于全同态加密算法的电力大数据动态脱敏方法,其特征在于,所述根据电力交易大数据集中不同电力数据样本之间的数据扰动敏感系数构建扰动敏感管理四叉树,根据扰动敏感管理四叉树计算噪声敏感管理系数的方法为:

8.根据权利要求7所述的基于全同态加密算法的电力大数据动态脱敏方法,其特征在于,所述根据电力交易大数据集的扰动敏感加权无向图的聚类结果构建扰动敏感管理四叉树的方法为:

9.根据权利要求7所述的基于全同态加密算法的电力大数据动态脱敏方法,其特征在于,所述据扰动敏感管理基础数量序列和扰动敏感管理数量序列对每个扰动敏感管理样本集合的噪声敏感影响程度的分析结果确定每个扰动敏感管理样本集合的噪声敏感管理系数的方法为:

10.根据权利要求1所述的基于全同态加密算法的电力大数据动态脱敏方法,其特征在于,所述根据噪声敏感管理系数获取电力数据噪声敏感度,基于电力数据噪声敏感度完成对电力数据的脱敏处理的方法为:

...

【技术特征摘要】

1.基于全同态加密算法的电力大数据动态脱敏方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的基于全同态加密算法的电力大数据动态脱敏方法,其特征在于,所述将电力交易大数据集中每个电力数据样本的数据划分为待隐匿数据集合和隐私保护数据集合的方法为:

3.根据权利要求1所述的基于全同态加密算法的电力大数据动态脱敏方法,其特征在于,所述根据电力交易大数据集中不同电力数据样本之间的待隐匿数据集合和隐私保护数据集合的差异计算隐匿保护增强系数的方法为:

4.根据权利要求1所述的基于全同态加密算法的电力大数据动态脱敏方法,其特征在于,所述根据电力交易大数据集中不同电力数据样本之间的隐匿保护增强系数构建每个电力数据样本扰动近邻矩阵的方法为:

5.根据权利要求4所述的基于全同态加密算法的电力大数据动态脱敏方法,其特征在于,所述根据电力交易大数据集中每个电力数据样本的近邻样本集获取扰动近邻序列,基于扰动近邻序列获取每个电力数据样本的扰动近邻矩阵的方法为:

6.根据权利要求1所述的基于全同态加密算法的电力大数据动态脱...

【专利技术属性】
技术研发人员:王世谦郭军利邵志鹏石磊张小建高宇飞黄勇卜飞飞李秋燕王圆圆韩丁华远鹏宋大为贾一博
申请(专利权)人:深圳市福山自动化科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1