【技术实现步骤摘要】
本专利技术属于信息隐私保护发布安全领域,具体涉及。
技术介绍
大量医疗信息具有统计分析和病情研究的重要价值,为了满足这些隐私信息共享、科学研究等多方面的需要,必须对这些信息进行隐私保护发布处理。K-匿名是传统表数据领域的一类重要的隐私保护技术,但是这种技术仅适用于静态数据的发布,而且该技术也容易受到攻击。 医疗数据的发布通常具有周期性发布的特点,同时在待发布表中一个个体可能对应多条记录,在发布时应该从个体的角度去考虑其隐私的保护,并且考虑多次发布时发布数据之间的关联性。 医疗数据表属性分为三类:显式标识符(Identifier),指能清楚标识用户身份的属性,为了保护个人信息,常常在数据发布前将这些属性删除或加密;准标识符QI (Quasi Ident ifier),即同时存在于隐私表与外表中,可以利用链接来标识个体信息的一组属性称为准标识符属性;敏感属性SA(Sensitive Attribute),该类属性包含了个体的隐私信息。
技术实现思路
针对传统表数据领域隐私保护技术存在的问题,本专利技术提供,从个体的角度保证了的隐私信息的安全,抵制了表间的链接攻击,在保护隐私的同时最大程度地满足了数据的可用性。 为实现上述目的,本专利技术具体技术方案如下:,包括如下步骤: (I)预处理待发布表T,生成数据表T (QI, GID, ID, SA); (2)初始化发布表作汀+为空匿名表’结构与丁⑷^瓜’瓜^么)相同; (3)判断数据表T(QI,GID,ID,SA)是否为首次发布,如果是首次发布转步骤(4),否则转步骤( ...
【技术保护点】
一种数据周期性发布的隐私保护方法,其特征在于,包括如下步骤:(1)预处理待发布表T,生成数据表T(QI,GID,ID,SA);(2)初始化发布表T*;T*为空匿名表,结构与T(QI,GID,ID,SA)相同;(3)判断数据表T(QI,GID,ID,SA)是否为首次发布,如果是首次发布转步骤(4),否则转步骤(8);(4)设定安全保护参数k、l和ε;(5)对表T(QI,GID,ID,SA)进行泛化发布;(6)元组移回处理;(7)检查表T(QI,GID,ID,SA)记录是否已经全泛化,若未全泛化转步骤(5),否则转步骤(12);(8)计算T*(j‑1)和T(j)中同一个体的SA分组距离;(9)根据SA分组距离将T(j)分成两组T’和T”;(10)基于ε‑分组不变性规则发布T(j);(11)判断T”是否已全泛化;如果完成转步骤(12),否则转步骤(5);(12)数据发布完成,表T*为最终隐私保护发布信息。
【技术特征摘要】
1.一种数据周期性发布的隐私保护方法,其特征在于,包括如下步骤: (1)预处理待发布表T,生成数据表T(QI,GID,ID,SA); (2)初始化发布表T*;T*为空匿名表,结构与T(QI,GID,ID, SA)相同; (3)判断数据表T(QI,GID,ID,SA)是否为首次发布,如果是首次发布转步骤(4),否则转步骤⑶; (4)设定安全保护参数k、I和ε; (5)对表T(QI,GID, ID, SA)进行泛化发布; (6)元组移回处理; (7)检查表T(QI,GID,ID,SA)记录是否已经全泛化,若未全泛化转步骤(5),否则转步骤(12); (8)计算T*(j-1)和T(j)中同一个体的SA分组距离; (9)根据SA分组距离将T(j)分成两组T,和T” ; (10)基于分组不变性规则发布T(j); (11)判断Τ”是否已全泛化;如果完成转步骤(12),否则转步骤(5); (12)数据发布完成,表Τ*为最终隐私保护发布信息。2.如权利要求1所述的一种数据周期性发布的隐私保护方法,其特征在于:步骤(1)中,所述预处理待发布表包括如下步骤: (1.D根据医疗数据属性的分类,对待发布的数据表中属于同一个体的记录进行ID标注,表示为三类属性的表形式T (QI,ID,SA); (1.2)初始化每一个体为一个分组,添加分组标号GID,表示为T(QI,GID, ID, SA); (1.3)合并具有相同QI的分组; (1.4)删除显示标识符。3.如权利要求1所述的一种数据周期性发布的隐私保护方法,其特征在于:步骤(5)中,所述泛化发布包括如下步骤: (5.1)采用自底向上的局部重编码...
【专利技术属性】
技术研发人员:张志祥,金华,华进,韩小祥,朱鹏程,
申请(专利权)人:南通大学杏林学院,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。