本发明专利技术公开一种动态网络多次发布中防止标签邻居攻击的匿名方法,其对每个时刻输入的社会网络数据进行分组,在每次分组时,都把邻居标签相似度最大的节点分到一组,直到所有的带敏感标签的节点分配合适的分组,最后对组内的非敏感标签的个体在匿名社会网络中做隐藏标签处理;分组完成后将生成的分组合并到分组表中,同时对连续发布次数进行判断,仅保证在连续w次发布中,对组内节点的1‑邻居图进行匿名化处理,而超过w次发布时候,则从表内移除t‑w时刻的分组,从而保证数据的可用性和效用性。
【技术实现步骤摘要】
动态网络多次发布中防止标签邻居攻击的匿名方法
本专利技术涉及数据隐私保护
,具体涉及一种动态网络多次发布中防止标签邻居攻击的匿名方法。
技术介绍
社会网络是由许多节点和边构成的一种社会结构,节点通常是指个人或组织,节点之间的连线即边代表个人或组织的相互关系。随着经济的快速发展,社会网络的应用也越来越普及,例如Facebook、LinkinIn等。社会网络中包含着用户有很多的个人信息,例如姓名,性别,年龄,地址,职业。在社会网络图中,属性表示为标签,用户可以选择特定属性信息隐藏,所以标签可以分为敏感和非敏感。最常用且直观的一种匿名方法为简单匿名,即移除能唯一标识用户的显式标识符属性,只保留标签表示属性信息。许多先前的研究已经证实简单匿名不足以保护用户隐私。而现有的研究也仅是基于静态网络设计的通用的隐私保护方法,隐私保护技术集中于研究单次数据发布,而很少是基于动态网络多次发布的用途来设计隐私保护方法。发展变化的社会网络数据动态发布需要动态的隐私保护方法来处理。
技术实现思路
本专利技术所要解决的是现有隐私保护的匿名方法仅是基于静态网而设计,而无法适用于动态网络多次发布的问题,提供一种动态网络多次发布中防止标签邻居攻击的匿名方法。为解决上述问题,本专利技术是通过以下技术方案实现的:动态网络多次发布中防止标签邻居攻击的匿名方法,包括如下步骤:步骤1、设定隐私水平l和时间窗口w,并将分组表GS-Table置为空;步骤2、初始化当前时刻t原始的社会网络数据;即去掉显示的标识属性,改用标签表示;同时,将节点集合按度数排列,得到新的节点集合;步骤3、对带敏感标签的节点根据邻居标签相似度进行分组;步骤3.1、选择新的节点集合中度数最大的带敏感标签的节点,并将该选中的节点从新的节点集合中去除;步骤3.2、计算选中的带敏感标签的节点和新的节点集合中的每个节点的标签相似度,并将该选中的带敏感标签的节点及其标签相似度最相似的节点归为一组,直到该分组中所包含的节点个数达到隐私水平l;步骤3.3、重复步骤3.1-3.2,直至新的节点集合中不再含有带敏感标签的节点;步骤4、完成分组的工作后,将t时刻所生成的分组,合并到分组表GS-Table中;步骤5、判断当前时刻t是否小于等于时间窗口w;如果t≤w,则返回步骤2;如果t>w,则从分组表GS-Table中移除t-w时刻所生成的分组;步骤6、对于分组表GS-Table中的各个分组,对组内所有节点的1-邻居图采用边复制和标签泛化的方法把原始图匿名成同构;步骤7、发布匿名后的社会网络数据。上述步骤1中,将节点集合按度数降序排列,得到新的节点序列。上述方法中,每个时刻t对应一次原始的社会网络数据的更新。上述方法中,隐私水平l的取值范围介于2~30之间。上述方法中,时间窗口w的取值范围介于1~10之间。与现有技术相比,本专利技术具有如下特点:(1)本专利技术在每次分组时,都把邻居标签相似度最大的节点分到一组,直到所有的带敏感标签的节点分配合适的分组,最后对组内的非敏感标签的个体在匿名社会网络中做隐藏标签处理;这样能够保护带敏感标签的节点,使得带敏感标签的节点在匿名前后的改变小,匿名损失最小;(2)本专利技术对w次发布的社会网络进行lw-grouping分组,使之满足动态网络多次发布的匿名要求,t时刻已经分组的节点,t+1时刻不能分到其他组中,这样攻击者就不能通过比对多次发布,使敏感信息泄露;(3)本专利技术建立一个GS-Table表,其仅保证在连续w次发布中,对组内节点的1-邻居图进行匿名化处理,而超过w次发布时候,则从表内移除t-w时刻的分组,从而保证数据的可用性和效用性。附图说明图1为动态网络多次发布中防止标签邻居攻击的匿名方法的原理图。图2为动态网络多次发布中防止标签邻居攻击的匿名方法的流程图。图3为不同时刻输入的社会网络,其中(a)为t=1时刻输入的社会网络G1,(b)为t=2时刻输入的社会网络G2,(c)为t=3时刻输入的社会网络G3。图4为不同时刻匿名后的社会网络,其中(a)为t=2时刻匿名社会网络G2’,(b)为t=3时刻匿名社会网络G3’。具体实施方式本专利技术用到的社会网络数据是带标签的简单无向图,攻击者的背景知识可以是任意节点所在的特定的子图信息,即邻居标签信息。社会网络数据在发布前需要进行初步的匿名处理,即去掉唯一标识节点的显示标识属性,如姓名等,改用标签表示属性信息。发布的图用Gt(Vt;Et;Lt)表示动态网络t时刻的图,其中Vt为节点的集合,表示社会网络中的个人或其他实体;Et表示个体之间的关联,即图中边的集合,表示个人或实体间的关系,如朋友、合作关系;Lt表示个体的标签的集合。本专利技术提出了一个动态网络多次发布隐私模型,即lw-graphic-diversity。该lw-graphic-diversity模型给定一个在时刻t带标签的动态网络Gt(Vt;Vst;Et;Lt)和一个隐私阈值l。其中Vt表示节点的集合;Vst表示带敏感标签的节点的集合;Et表示边的集合;Lt表示个体的标签的集合;Γ表示节点到标签的映射关系,Γ:Vt→Lt。在这个模型中,把节点邻居标签信息作为攻击者的背景知识,个体自身的敏感标签,作为用户需要保护的敏感信息,就是将原始网络Gt转化为局部扰乱的匿名社会网络Gt’,使匿名后的网络在动态发布中满足l-多样性要求。在动态发布的社会网络经过本专利技术的匿名方法处理,能够有效防止攻击者使用背景知识对用户所在的发布的数据中重新定位。参见图1,本专利技术所设计的动态网络多次发布中防止标签邻居攻击的匿名方法,其主要的数据处理过程为:首先是初始化数据,即去掉显示的标识属性,改用标签表示。除此之外,再将节点集合Vt按度数降序排列,得到新的节点序列。接下来是对带敏感标签的节点根据邻居标签相似度进行分组,在此过程中:先选择第一个带敏感标签节点,这里选择当前节点列表中度数最大的敏感节点,此时节点集合Vt中除去已选中的节点。后计算这个节点和Vt中的每个节点的标签相似度,选择最相似的节点放在一组,直到组中节点包含的节点个数达到隐私水平l。再选择下一个带敏感标签的节点,重复以上步骤直到剩下的节点集合V的个数小于l,候选集中的节点表示准备选到组中的带敏感标签的节点集。直到候选节点集合为空,此时所有的敏感标签节点分到邻居标签信息相似度最大的组。但如果存在组g中带标签个体个数小于l,则从组集中移除组gi,并且将组中的节点分到和组中节点有最大标签相似度的其他的组中去。完成分组的工作后,将生成的组集Ct,即t时刻所有gi的集合,合并到GS-Table中去,要保证w时刻内隐私得到保护,对组内节点的1-邻居图通过边复制和标签泛化的方法把原始图匿名成同构,最后发布匿名后的社会网络数据。为解决连续发布动态网络的隐私问题,同时也保证数据效用性,本专利技术建立一个分组表GS-Table,只保证连续w次发布中,对组内节点的1-邻居图进行匿名化处理;而超过w时间,则从表内移除t-w时刻的分组。GS-Table是有组集构成,t=1时刻的组集记为C1,即将带标签节点按照标签相似度进行分组,直到带敏感标签的节点所在候选集为空,分组操作结束。组集中包含的组gi,每个组中包含的是l个带不同标签的节点集,红色标记的是带敏感标签的节点,黑色是本文档来自技高网...
【技术保护点】
动态网络多次发布中防止标签邻居攻击的匿名方法,其特征是,包括如下步骤:步骤1、设定隐私水平l和时间窗口w,并将分组表GS‑Table置为空;步骤2、初始化当前时刻t原始的社会网络数据;即去掉显示的标识属性,改用标签表示;同时,将节点集合按度数排列,得到新的节点集合;步骤3、对带敏感标签的节点根据邻居标签相似度进行分组;步骤3.1、选择新的节点集合中度数最大的带敏感标签的节点,并将该选中的节点从新的节点集合中去除;步骤3.2、计算选中的带敏感标签的节点和新的节点集合中的每个节点的标签相似度,并将该选中的带敏感标签的节点及其标签相似度最相似的节点归为一组,直到该分组中所包含的节点个数达到隐私水平l;步骤3.3、重复步骤3.1‑3.2,直至新的节点集合中不再含有带敏感标签的节点;步骤4、完成分组的工作后,将t时刻所生成的分组,合并到分组表GS‑Table中;步骤5、判断当前时刻t是否小于等于时间窗口w;如果t≤w,则返回步骤2;如果t>w,则从分组表GS‑Table中移除t‑w时刻所生成的分组;步骤6、对于分组表GS‑Table中的各个分组,对组内所有节点的1‑邻居图采用边复制和标签泛化的方法把原始图匿名成同构;步骤7、发布匿名后的社会网络数据。...
【技术特征摘要】
1.动态网络多次发布中防止标签邻居攻击的匿名方法,其特征是,包括如下步骤:步骤1、设定隐私水平l和时间窗口w,并将分组表GS-Table置为空;步骤2、初始化当前时刻t原始的社会网络数据;即去掉显示的标识属性,改用标签表示;同时,将节点集合按度数排列,得到新的节点集合;步骤3、对带敏感标签的节点根据邻居标签相似度进行分组;步骤3.1、选择新的节点集合中度数最大的带敏感标签的节点,并将该选中的节点从新的节点集合中去除;步骤3.2、计算选中的带敏感标签的节点和新的节点集合中的每个节点的标签相似度,并将该选中的带敏感标签的节点及其标签相似度最相似的节点归为一组,直到该分组中所包含的节点个数达到隐私水平l;步骤3.3、重复步骤3.1-3.2,直至新的节点集合中不再含有带敏感标签的节点;步骤4、完成分组的工作后,将t时刻所生成的分组,合并到分组表GS-Table中;步骤5、判...
【专利技术属性】
技术研发人员:刘鹏,胡晓依,唐家琪,傅星珵,郭亚萌,
申请(专利权)人:广西师范大学,
类型:发明
国别省市:广西,45
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。