一种基于频繁项检索的云平台隐私保护方法技术

技术编号：10596663 阅读：195 留言：0更新日期：2014-10-30 09:25

本发明专利技术涉及一种基于频繁项检索的云平台隐私保护方法，该方法包括：根据关联规则算法抽取出数据的频繁项集；通过多关键字并行检索建立频繁项模型库；使用并行分布式排序算法对检索结果排序，找出敏感记录；在云平台上使用聚类算法对敏感记录进行差分隐私保护。本发明专利技术方法根据数据的频繁项的情况，检索出会暴露出用户信息的敏感记录，并针对性的做差分隐私保护。从而避免根据已知的非敏感信息推测出相关敏感信息。本方法只对敏感记录进行保护，未影响到其他信息量，在提高发布数据的效用的同时，减少了数据泄漏风险，保证了云平台上的数据安全。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于频繁项检索的云平台隐私保护方法
本专利技术涉及云安全领域，具体是指一种基于频繁项检索的云平台隐私保护方法。
技术介绍
隐私保护方法是一种伴随着数据应用而提出的，由实际应用所决定的数据保护方法，最先被用于统计领域。一般是通过引入统计模型和概率模型来实现保护在较低应用层次上数据的隐私。对于较高层次的数据应用，主要是用面向数据挖掘的隐私保护技术，根据不同数据挖掘操作的特性来实现对应用上隐私的保护。而各类应用中可以通用的隐私保护方法，一般由基于隐私保护的数据发布技术来实现。目前，面对大数据，在云平台上的数据隐私保护方法，并不能满足对数据保护的需求，无法针对一些攻击模型。随着互联网技术不断的、飞速的发展，数据的共享变得越来越便捷，隐私数据泄露事件越来越多。个人隐私安全得不到保障。现有的大多数隐私保护都是针对保护敏感信息，没有考虑到敏感属性与特定实体的关联，无法阻止由非敏感信息对敏感信息的推测，但对全部信息进行保护又会失去数据本身的效用。为了解决这个问题，需要研究怎样去在提高发布数据的效用的同时，减少数据泄露风险，保障云平台上的数据安全。依据频繁项对数据做差分隐私保护是一种有效的手段。依据频繁项的差分保护是指，根据频繁项的情况，检索出可能会被推测出的敏感记录，然后对这些敏感记录做差分隐私保护，从而保证其他数据的有效性和完整性。在保障数据效用的同时，减少了数据泄露的风险。
技术实现思路
鉴于上述现有技术的不足，本专利技术目的旨在提供一种基于频繁项检索的云平台隐私保护方法，该方法在云计算平台上，通过抽取出数据的频繁项，将可能被推测出的敏感记录检索出来，然后针对性的做数...

【技术保护点】
一种基于频繁项检索的云平台隐私保护方法，其特征在于：(1)根据关联规则算法抽取出数据的频繁项集；(2)通过多关键字并行检索建立频繁项模型库；(3)使用并行分布式排序算法对检索结果排序，找出敏感记录；(4)在云平台上使用聚类算法对敏感记录进行差分隐私保护。

【技术特征摘要】
1.一种基于频繁项检索的云平台隐私保护方法，其特征在于：(1)根据关联规则算法抽取出数据的频繁项集，具体包括：(1-1)根据数据情况和用户需要设定最小支持度和第1项候选集；(1-2)分析原始数据的数据项，构建键值对序列集，通过键值对序列集合第k项候选集的关联，找出频繁k项集；(1-3)对频繁k项集的单表关联，并进行分布式剪枝，得出第k+1项候选集；(1-4)对步骤(1-2)和(1-3)中的作业任务进行组合式链接执行，直到不能找出k+1项候选集；(2)通过多关键字并行检索建立频繁项模型库，包括：在云平台上，使用针对频繁项的多关键字并行检索，根据频繁项集中的各频繁项及其权值，以倒排索引的形式建立频繁项模型库；(3)使用并行分...

【专利技术属性】
技术研发人员：钟珞，杨光，李琳，唐琨皓，
申请(专利权)人：武汉理工大学，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人