【技术实现步骤摘要】
本专利技术涉及计算机
,一种个人行为数据匿名化方法及系统。
技术介绍
随着当今移动技术的飞速发展,移动设备和各类传感器的广泛应用,如手机、手环及在设备上安装的众多应用都会采集到人们生活中的各类数据。这些数据一方面使人们的生活更加便捷,另一方面也使得个人信息更多地被服务商收集,增大了隐私泄露的风险。当前隐私保护的问题逐渐被人们重视,也出现了许多对数据进行匿名化的方法。这些方法主要分为两种,一种在移动端,对传输到服务器的数据进行处理;另一种在服务器端,对收集到的所有数据进行处理。这些方法包括对数据增加噪声、加密、替换、删除属性或者与伪造数据结合等。目前,匿名化的方法会对破坏隐私的一方已知的信息做出限制,这样限制攻击者能力的匿名化方法并不能保证是完全可靠的,另外,有一些对数据的修改也会造成数据实用性降低。
技术实现思路
本专利技术的目的是提供一种个人行为数据匿名化方法及系统,通过对用户行为进行合理的合并和一般化,确保真实信息不会被泄露,也保证了数据的实用性。本专利技术的目的是通过以下技术方案实现的:一种个人行为数据匿名化方法,该方法包括:按照时间顺序对用户行为使用一阶马尔科夫链进行建模,获得各个用户行为c发生的先验概率Pr[Xt=c],Xt表示时刻t发生用户行为c的随机变量;根据已经发生的用户行为集合并结合一阶马尔科夫链模型计算当前时刻t可能发生的用户行为集合;对所述可能发生的 ...
【技术保护点】
一种个人行为数据匿名化方法,其特征在于,该方法包括:按照时间顺序对用户行为使用一阶马尔科夫链进行建模,获得各个用户行为c发生的先验概率Pr[Xt=c],Xt表示时刻t发生用户行为c的随机变量;根据已经发生的用户行为集合并结合一阶马尔科夫链模型计算当前时刻t可能发生的用户行为集合;对所述可能发生的用户行为集合进行划分,获得若干组划分后的集合;划分后的每一组集合中均包含多个子集,再基于下式对每一组集合中的子集进行判断:筛选出所有子集均可公开的集合;其中,s为用户设定的隐私集合S中需要保护的用户行为,δ为隐私保护的程度,其值越小保护程度越高,为包含已经发生的用户行为集合与当前子集的集合;当发生某一真实用户行为时,选择包含该真实用户行为的子集向外发送,实现个人行为数据匿名化。
【技术特征摘要】
1.一种个人行为数据匿名化方法,其特征在于,该方法包括:
按照时间顺序对用户行为使用一阶马尔科夫链进行建模,获得各个用户行为c发生的
先验概率Pr[Xt=c],Xt表示时刻t发生用户行为c的随机变量;
根据已经发生的用户行为集合并结合一阶马尔科夫链模型计算当前时刻t可能发
生的用户行为集合;
对所述可能发生的用户行为集合进行划分,获得若干组划分后的集合;划分后的每
一组集合中均包含多个子集,再基于下式对每一组集合中的子集进行判断:
筛选出所有子集均可公开的集合;其中,s为用户设定
的隐私集合S中需要保护的用户行为,δ为隐私保护的程度,其值越小保护程度越高,
为包含已经发生的用户行为集合与当前子集的集合;
当发生某一真实用户行为时,选择包含该真实用户行为的子集向外发送,实现个人
行为数据匿名化。
2.根据权利要求1所述的方法,其特征在于,所述对所述可能发生的用户行为集合
进行划分,获得若干组划分后的集合,并基于下式进行筛选:
Pr[Xt=s|o′→]-Pr[Xt=s]≤δ,]]>获得所有子集均可公开的集合包括:
枚举所述可能发生的用户行为集合中所有的子集,获得若干组划分后的集合;
再根据隐私行为集合S判断每一子集是否可以公开;其中,满足下式
Pr[Xt=s|o′→]-Pr[Xt=s]≤δ,]]>则表示该子集可以公开;
从所述若干组划分后的集合中,筛选所有子集均可公开的集合;
从所述所有子集均可公开的集合中选择实用性最大的集合;其中,一个子集的实用
性为该子集的先验概率除以子集中用户行为的个数,一个集合的实用性为其子集的实用
性之和。
3.根据权利要求1或2所述的方法,其特征在于,集合中的每一子集中包含一个或多
个用户行为,若包含多个用户行为,则所述多个用户行为至少存在一个相同或相似...
【专利技术属性】
技术研发人员:孙广中,魏燊,周英华,
申请(专利权)人:中国科学技术大学,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。