一种基于强化学习的隐私保护数据发布方法技术

技术编号:34487542 阅读:9 留言:0更新日期:2022-08-10 09:05
本发明专利技术公开了一种基于强化学习的隐私保护数据发布方法,针对隐私保护操作与数据挖掘操作的串行割裂导致数据效用降低的问题,该方法通过引入深度强化学习,比较贝叶斯网络生成的数据以及集成聚类的数据,迭代地修正贝叶斯网络来达到隐私保护的强度以及数据挖掘的需求。本发明专利技术构造了隐私保护智能体和数据挖掘智能体,通过借助隐私保护和数据挖掘两个智能体之间的博弈,通过修正贝叶斯网络和考察数据的共现性来分析数据的全局分布与局部分布对知识挖掘的影响,不断优化交互中的动作值函数,使得隐私保护强度与数据挖掘需求达到平衡。使得隐私保护强度与数据挖掘需求达到平衡。使得隐私保护强度与数据挖掘需求达到平衡。

【技术实现步骤摘要】
一种基于强化学习的隐私保护数据发布方法


[0001]本专利技术涉及数据安全发布领域,具体涉及一种基于强化学习的隐私保护数据发布方法。

技术介绍

[0002]既有数据发布的隐私保护方法通常仅关注数据的隐私性以及数据的可用性,鲜有对隐私保护后发布的数据如何实现有效地知识挖掘和价值发现进行考量。这种将数据隐私保护与数据挖掘目标割裂的处理方式加重了数据的信息损失,导致数据发布后,用户对数据挖掘的效能低下。因此,如何在隐私保护效果和数据挖掘效能之间达到协同平衡,既能使数据达到隐私保护要求,又能使数据挖掘更有效成为目前亟待解决的难点问题。
[0003]随着数据挖掘算法在隐私保护领域的广泛应用,隐私保护技术不断完善。Ahmed等人提出一种用于隐私保护数据挖掘的深度强学习方法,该方法通过使用删除动态计算的数据来隐藏敏感信息,并在隐私保护和知识挖掘之间寻求平衡,在大型数据集上具有普适性。Cheng等人将非敏感规则、数据损失作为优化目标,从而使数据效用最大化。此外,一些学者还从“隐私定价”的角度对数据挖掘的隐私保护机制进行了一系列研究。Aperjis设计了一种数据发布机制,通过中介获取个体对隐私的重视程度,并获取用户对数据的需求,通过一种定价的方式为用户提供数据;Chen等人提出一种基于强化学习的隐私数据定价方法,该方法构建了基于用户角色的定价模型,并提出一种基于经验矩阵的数据定价策略算法,利用强化学习方法,通过不断地进行数据交互以获得出价经验,实现了数据隐私性与数据交易收益的最大化,但此方法在迭代求解过程中要不断试错,时间开销较大。
[0004]针对数据发布场景下难以平衡隐私保护与数据挖掘之间协同关系的问题,借助集成聚类以及强化学习等算法,将“先隐私保护后数据挖掘”的串行操作模型转化为“隐私保护操作与数据挖掘操作”交互进行的模型,并设计基于强化学习的隐私保护数据发布方法,进而达成隐私保护与数据挖掘的平衡。

技术实现思路

[0005]本专利技术提出了一种基于强化学习的隐私保护数据发布方法(Areinforcement learning

based approach to privacy

preserving data publishing),旨在针对隐私保护导致的数据挖掘效能降低问题,引入深度强化学习的模型,建立隐私保护和数据挖掘两个智能体之间的博弈,进而设计基于强化学习的隐私保护数据发布方法,达到隐私保护与数据挖掘的协同平衡。
[0006]为了解决上述问题,本专利技术首先依据不同角色构建了交互模型,借助贝叶斯网络修正算法和相互独立的聚类算法的集成来分别模拟隐私保护智能体和数据挖掘智能体,将“先隐私保护后数据挖掘”的串行操作过程改进为隐私保护与知识挖掘集成模型的“交替式迭代”训练算法。具体而言,一方面,基于数据重匿名架构,数据拥有者拥有对数据的支配权和对数据进行隐私保护的义务,另一方面,针对数据使用者的角色通过集成算法模拟数据
挖掘需求,并以此构建隐私保护智能和数据挖掘智能体,通过两个智能体间的博弈交互,在交互过程中引入深度强化学习算法,通过不断更新原有的行动策略,以此获得更高的奖励回报,最终使得两者的收益最大化,此时数据隐私性与数据挖掘的效用达到平衡。
[0007]为了达到上述目的,本专利技术采用了下列技术方案:
[0008]1)隐私保护智能体的构建
[0009]隐私保护智能体旨在保护隐私的同时最小化信息损失。将数据转化为贝叶斯网络,并将传统隐私保护方法迁移至贝叶斯网络上,数据的微隐私和泛隐私均得以保护。而依据数据挖掘智能体的需求,隐私保护智能体发布满足需求的数据是通过迭代地修正贝叶斯网络来实现的,修正贝叶斯网络的方式包含两种,分别从结构上和属性概率上修正:第一,通过添加、删除、翻转边可以改变贝叶斯网络结构,从而得到新的数据;第二,通过修改属性节点的概率分布值也可以使贝叶斯网络生成的数据发生改变,从而达到隐私保护要求。本专利技术利用代价函数cost对贝叶斯网络修正与更新过程造成的信息损失进行度量,其定义如下:
[0010]定义1(代价函数)。给定一个贝叶斯网络,记IA
i
为某个节点的第i个信息属性,minT(IA
i
)和maxT(IA
i
)分别为修改该属性的最小值和最大值,而贝叶斯网络生成数据后,minE
a
(IA
i
)和maxE
a
(IA
i
)分别为等价类E
a
中该属性的最小值和最大值,对等价类E
a
中的属性IA
i
修改为值域[minE
a
(IA
i
),maxE
a
(IA
i
)],其信息损失可定义为:
[0011][0012]其中,|E
a
|为该等价类中记录的个数,在等价类E
a
上,所有信息属性修改后的信息损失为:
[0013][0014]显然,对于数据集D,所有信息属性修改后的信息损失为:
[0015][0016]将损失函数做归一化处理后,可以得到贝叶斯网络在经过修正处理后的代价函数为:
[0017][0018]2)数据挖掘智能体
[0019]多个相互独立的聚类算法的集成学习可以很好的模拟数据挖掘的各类需求任务,数据挖掘智能体利用N(N>1)种相互独立的聚类算法分别对数据进行聚类操作,通过分析簇内、簇间的距离,比较聚类结果与隐私保护智能体修正数据之间的差异,来实现与隐私保护智能体的交互。通过引入相似性度量来计算记录之间、记录与簇之间、簇与簇之间的距离;其次,引入共现矩阵来刻画样本聚类的稳定性大小,若多次聚类的结果不低于某个阈值,则认为该簇是符合数据挖掘要求的等价簇。相关定义如下:
[0020](1)相似性度量
[0021]定义2(等价簇)。给定数据集D(X,IA,SA),若对于任意聚类算法,总存在t条记录{x1,x2,...,x
t
},(t≥1),使得数据集D分别聚类为N类,则将聚为的类簇称为等价簇,记为{e1,e2,...,e
N
},对于任意等价簇其组内的记录不可再分,敌
手也无法通过掌握信息属性IA来获取敏感属性SA。
[0022]定义3(记录间距离)。数据集D中任意两条记录x
a
,x
b
在属性取值上差异程度的均值定义为记录间距离,记为dist(x
a
,x
b
),它可以表示一个等价簇内相关记录的相似性。
[0023]两个不同记录的相同信息属性值x
a
(IA
i
)和x
b
(IA
i
)间的差异定义为:
[0024][0025]则两记录间距离表示为:
[0026][0027]定义4(记录到等价簇距离)。对于无法有本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习的隐私保护数据发布方法,其特征在于包括:步骤一、数据拥有者利用贝叶斯生成技术将其所拥有的原数据转化为贝叶斯网络,然后将生成的贝叶斯网络上传至数据中心(数据中心可以是云计算平台等可信且具有强大算力的第三方平台),由于数据中心是作为数据的存储和计算被引入系统平台,数据中心本身并不是数据的使用者,因此,仅将与原数据同分布的贝叶斯网络上传至数据中心,割裂了数据与其所含个体隐私信息之间的映射关系,进而实现对原数据的第一重匿名化保护(这里称之为对数据的内层匿名);步骤二、由数据中心构建隐私保护智能体,通过迭代地修正贝叶斯网络来实现对原数据的第二重匿名(这里称之为对数据的外层匿名),修正贝叶斯网络的方式包含两种,分别从结构上和属性概率上修正:第一,通过添加、删除、翻转边可以改变贝叶斯网络结构,从而得到新的数据;第二,通过修改属性节点的概率分布值也可以使贝叶斯网络生成的数据发生改变,从而达到隐私保护要求;步骤三、由数据中心构建数据挖掘智能体,利用3种独立的聚类算法(k

means、均值漂移、DBSCAN)分别对数据进行聚类操作,通过分析簇内、簇间的距离,比较聚类结果与隐私保护智能体修正数据之间的差异,来实现与隐私保护智能体的交互;步骤四、通过隐私保护和数据挖掘两个智能体之间的交互来获取奖励,不断优化动作值函数,进而同时满足隐私保护和数据挖掘的需求。2.根据权利要求1所述的数据拥有者利用贝叶斯生成技术将其所拥有的原数据转化为贝叶斯网络,其特征在于:步骤一一,对原数据D进行有放回采样,采样比例为θ(0<θ<<1),生成采样数据D
θ
;步骤一二,数据拥有者分别对采样数据D
θ
和原数据D运用基于K2算法的贝叶斯网络结构学习方法生成相应的贝叶斯网络,并使用BIC(Bayesian Information Criterion)指标对两个贝叶斯网络进行打分(评估),分别记为和Score
D
;步骤一三,若则增大采样比例θ,令θ=min(θ+μ,1),并跳转到步骤1.1,其中,η(η>0)为预设的阈值,μ(0<μ<<1)为采样比例增量。3.根据权利要求1所述的由数据中心构建隐私保护智能体,其特征在于:步骤二一,对贝叶斯网络通过添加、删除、翻转边的方式进行单位化修正操作,其中,单位化只是每一轮次只能进行{添加,删除,翻转}操作集中的一项操作;步骤二二,使用代价函数评估对贝叶斯网络进行修正操作前后的信息损失;将隐私保护智能体修正贝叶斯网络的过程以算法1表示,命名为BNM算法,算法的核心过程描述如下:
4.根据权利要求1所述的通过修改属性节点的概率分布值也可以使贝叶斯网络生成的数据发生改变,从而达到隐私保护要求,其特征在于:步骤二一,对贝叶斯网络实施敏感属性值泛化、t

近邻性和

多样性三种隐私保护方式进行单位化修正操作,其中,单位化只是每一轮次只能进行{敏感属性值泛化,t

近邻性,

多样性}操作集中的一项操作;敏感属性值泛化操作:根据数据拥有者对数据属性设置的属性值泛化层次树,将属性值域中待匿名保护的属性叶节点与其同父节点的所有兄弟叶节点聚合为一个属性节点并由其直接父节点进行替换,形成新的叶节点,该叶节点所对应的属性值概率分布继承自参与聚合的所有原叶节点,其值为所有参与聚合节点的概率分布之和;t

近邻保护操作:a)将待匿名保护的属性值域空间中导致信息熵最大化的值分布情况定义为理论基准(其分布值记为X
min
),属性值概率分布最大者定义为待平滑基准(其分布值记为X
max
);b)使用方差进行度量,将定义为平滑操作单位(其中,m为正整数),对理论基准和待平滑基准进行迭代式单位修正,即每一轮次修正使得理论基准和待平滑基准进行迭代式单位修正,即每一轮次修正使得若使得属性各值出现概率与理论基准的方差不高于t则停止迭代,否则跳转执行a);

多样性保护操作:将待隐私保护属性在...

【专利技术属性】
技术研发人员:周志刚白增亮
申请(专利权)人:山西墨丘利科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1