The invention discloses a multi map privacy protection method based on multidimensional sensitive data publishing, which mainly comprises two parts, namely, building the original table data into a multipartite graph form and a privacy protection strategy based on a multipartite map. ID as a node, the corresponding quasi identifiers to label form, each sensitive attribute is represented by a node type, a user has a sensitive attribute there is a side to reflect the correlation between two nodes. For grouping by clustering method, the same group of users as a super node, the correlation degree between attributes and sensitive to the weighted edge to reflect the weights of the edges is the probability of the sensitive attribute values with the group of users, the degree of correlation between the attribute and the attribute of the same kind is represented by the band the weight of the edge, so as to keep the relationship between attributes and the effective protection of the sensitive attributes and their associated privacy.
【技术实现步骤摘要】
基于多维敏感数据发布的多部图隐私保护方法
本专利技术涉及隐私保护
,具体涉及一种基于多维敏感数据发布的多部图隐私保护方法。
技术介绍
当今人类社会已步入信息时代,信息产业也呈现出高速发展的态势。互联网不断深入到政治、经济、文化、医疗及教育等各个领域并产生了大量的数据,而这些数据共享和发布可被用于进行海量数据分析。随着数据挖掘技术的日益发展及广泛应用,这些数据发布在科学研究、群体行为趋势分析,疾病预测以及经营决策和舆情监控等方面,给人们带来了极大的便利,具有重大的社会和经济价值。数据发布技术作为数据共享的一种有效手段,为数据的交换和共享提供了强有力的支持。然而,这些数据往往与个人信息相关,随着信息时代的发展和近年来隐私信息泄露等事件的不断发生引起人们的广泛关注,人们对隐私信息的概念悄然发生变化,对隐私信息的保护也越来越重视。因此,数据发布中的隐私保护问题一经提出就受到了社会和公众的日益重视,在保证信息可用性的同时,如何保护用户的隐私成为了数据分析研究领域的主要瓶颈问题。在现有的隐私保护研究中,大多数的研究主要针对单个敏感属性的数据集。然而在大多重要的实际应用中,往往需要涉及多维敏感属性,并需要对属性与属性之间存在的关联进行分析研究,相比单个敏感属性的数据而言,多维敏感属性数据的隐私保护更具挑战性,主要体现在以下几个方面:(1)数据集中需要保护的隐私信息涉及多维敏感属性,常用的泛化匿名技术会导致过多的信息损失;(2)多维敏感属性数据集中允许出现同一ID存在多条记录的情况,且大多属性域的值的个数并不多,用表数据形式来表示存在大量的数据冗余;(3)敏感属性与 ...
【技术保护点】
基于多维敏感数据发布的多部图隐私保护方法,其特征是,包括如下步骤:步骤1、构建多部图;即先将ID和各维敏感属性用不同类型的节点集来表示;再去掉ID,并以准标识符为ID节点的标签;后根据某个ID的记录所包含的敏感属性值,将不同节点集之间的节点用边连接起来,获得多部图;步骤2、在构建的多部图中,根据各条关系存在的概率作为该相应边的初始概率;步骤3、根据准标识符聚类分组实现匿名;即先根据多维准标识符的综合相似度;再采用基于k‑匿名模型将将相似度最高的k个节点聚类为同一组或采用基于ρ‑不确定性模型将高于设定阈值的节点聚类为同一组;后将该组节点视为一个整体即超级节点,并修改与该超级节点中所有节点的相关边的概率。
【技术特征摘要】
1.基于多维敏感数据发布的多部图隐私保护方法,其特征是,包括如下步骤:步骤1、构建多部图;即先将ID和各维敏感属性用不同类型的节点集来表示;再去掉ID,并以准标识符为ID节点的标签;后根据某个ID的记录所包含的敏感属性值,将不同节点集之间的节点用边连接起来,获得多部图;步骤2、在构建的多部图中,根据各条关系存在的概率作为该相应边的初始概率;步骤3、根据准标识符聚类分组实现匿名;即先根据多维准标识符的综合相似度;再采用基于k-匿名模型将将相似度最高的k个节点聚类为同一组或采用基于ρ-不确定性模型将高于设定阈值的节点聚类为同一组;后将该组节点视为一个整体即超级节点,并修改与该超级节点中所有节点的相关边的概率。2.根据权利要求1所述基于多维敏感数据发布的多部图隐私保护方法,其特征是,步骤1中,准标识符为除了ID之外的非敏感属性。3.根据权利要求1所述基于多维敏感数据发布的多部图隐私保护方法,其特征是,步骤3中,节点v1与v2之间综合相似度Sim(v1,v2)的计算公式如下:其中,xi表示第i个属性的优先因子;li(v1)表示节点v1的第i个属性的值;li(v2)表示节点v2的第i个属性的值;n表示准标识符中...
【专利技术属性】
技术研发人员:王利娥,李先贤,郭亚萌,
申请(专利权)人:广西师范大学,
类型:发明
国别省市:广西,45
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。