【技术实现步骤摘要】
一种基于信念网络的靶向型隐私保护数据发布方法
[0001]本专利技术数据发布领域,具体涉及一种基于信念网络的靶向型隐私保护数据发布方法。
技术介绍
[0002]随着“互联网+”行动计划的稳步实施,将云计算、物联网、人工智能等新型技术与各行各业结合起来,极大地撬动了以“大数据分析、内容咨询服务”为核心的巨量市场。在合作共赢、共享经济的大背景下,产业链上下游企业通过数据共享,分析产品从原料购进到销售的各个环节,能够有效减小产能过剩的风险;不同产业的公司也可以通过信息发布与共享的方式展开多元化产业合作,从而减缓单一领域产品受市场周期变化的冲击。尽管数据融合分析可以为企业提供竞争优势,但据研究机构Gartner对144名全球知名企业首席审计主管的调查显示,随着企业间的信息共享,数据分析的安全风险正在加剧,70%的受访者表示为避免隐私泄露所带来的负面影响,如何保护数据隐私是各方最关注的问题。
[0003]隐私保护的数据发布[1](Privacy
‑
Preserving Data Publishing,简称PPDP)作为数据挖掘技术从数据中安全、合法依规提取知识的必要技术前件,在过去几十年中受到相当大的关注。PPDP可以归约为隐私挖掘与敏感信息匿名化的博弈:假设目标对象T具有一组信息属性和一个敏感属性,其中信息属性值A
I
为可公开属性(又称为信息属性),而敏感属性值A
S
(又称为隐私属性)需要被匿名处理。在数据发布的过程中要求确保没有人可以根据发布的匿名数据以高于阈值 ...
【技术保护点】
【技术特征摘要】
1.一种基于信念网络的靶向型隐私保护数据发布方法,其特征在于,包括以下步骤:步骤1,抗微隐私泄露的信念网络的生成策略:采用对抗式学习架构构建能生成与原数据集同模态数据的信念网络;步骤2,信念网络的层次结构编码:针对信念网络中非敏感属性节点所构成节点集合在信念网络中的相对位置,对其进行纵向编码和横向编码,通过编码来对个节点对信念网络的影响力进行排序;步骤3,基于辨识矩阵的属性筛选:从信念网络采样数据,构建属性节点辨识矩阵,挖掘信念网络中非敏感属性节点所构成节点集合间相对于敏感属性节点概率分布的影响程度,并以此为依据对信念网络中非敏感属性节点所构成节点集合排序,借助辨识矩阵,提出一种以寻求属性差异贡献最大化作为启发式规则的贪心策略;步骤4,(d,l)
‑
privacy隐私保护机制:综合信念网络中非敏感属性节点所构成节点集合排序及其编码信息,选出当前轮次对隐私属性节点数据概率分布影响最大且对全局网络影响最小的信念网络中非敏感属性节点所构成节点集合,并对其使用(d,l)
‑
privacy隐私保护机制进行匿名化保护,其中d表示对原信念网络的单位隐私保护操作次数,l表示所涉修改信息属性的最小个数且l≤d;步骤5,基于n
‑
order多网络融合的隐私保护机制:以多个信念网络的公共节点为基节点集,构建n
‑
order候选节点集,即以基节点集为中心,最短跳数n为半径的圆域节点作为候选节点集元素,然后以该n
‑
order候选节点集为论域,构建相应的信念子网络,并将其替换原信念网络中对应的子网络。2.根据权利要求1所述的一种基于信念网络的靶向型隐私保护数据发布方法,其特征在于,所述步骤1中采用对抗式学习架构构建能生成与原数据集同模态数据的信念网络,具体步骤为:步骤1.1,通过对原数据分别进行抽样,应用基于爬山法的信念网络生成算法形成初代的辨识器J1和生成器G1;步骤1.2,初代辨识器和生成器各自计算其相应信念网络的BIC评分,分别记为J1_BIC、G1_BIC;若W(J1_BIC,G1_BIC)>ε,其中W(*)是对BIC评分设计的统计量,ε为差异阈值,ε>0,或J1_BIC>G1_BIC,则对生成器版本进行更新,通过自举法追加数据样本,以提升其信念网络的表示能力;反之,则以相似的方式更新辨识器的版本;通过对抗式学习迭代地更新辨识器和生成器,直至出现某代生成器G
k
使得其在连续两次对抗学习中有W(J
h
_BIC,G
k
_BIC)≤ε且W(J
h+1
BIC,G
k
BIC)≤ε,终止迭代。3.根据权利要求1所述的一种基于信念网络的靶向型隐私保护数据发布方法,其特征在于,所述步骤2中纵向编码包括两个阶段:自底向上的编码阶段和自顶向下的修正阶段;所述自底向上的编码阶段的具体步骤为:步骤2.1,所有节点的层次结构最初标记为零,从叶节点开始连续标记,并逐步跟踪相应的父节点,在每个轮次中,当子节点的层次结构为q时,父节点的层次结构将标记为q+1;步骤2.2,对于非叶节点仅记录当前最大编码,即若该节点的编码非0,则比较新的编码与原编码,保留大者,若两者相等,则停止对该节点的向上回溯,看叶节点队列是否为空,若为空,则停止;步骤2.3,提取下一个叶节点进行标记,直到叶节点序列为空;
所述自顶向下的修正阶段的具体步骤为:步骤3.1,按层次结构对所有节点进行从大到小的排序,并将所有节点编码初始化为未标记;步骤3.2,提取节点序列中层次结构最大的未标记节点,并将该节点作为在广度上遍历图形的起点,逐级向下广度优先遍历,在每一轮中,当父节点的层次结构为q时,子节点的层次结构将标记为q
‑
1;步骤3.3,将q
old
表示的节点的当前层次结构的数值大小与新派生的节...
【专利技术属性】
技术研发人员:周志刚,白增亮,苗钧重,余翔湛,
申请(专利权)人:山西财经大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。