数据分布图隐私处理方法、装置和电子设备制造方法及图纸

技术编号:23512953 阅读:16 留言:0更新日期:2020-03-18 00:12
本申请公开了一种数据分布图隐私处理方法、装置和电子设备,涉及数据统计技术领域。其中方法包括:获取目标数据桶的敏感度参数,并获取所述目标数据桶的隐私预算参数,其中,所述敏感度参数由用户预先配置;根据所述敏感度参数和所述隐私预算参数,对所述目标数据桶进行差分隐私处理,以得到隐私处理之后的所述目标数据桶。本申请中的一个实施例具有如下有益效果:数据分布图中的每个数据桶的差分隐私处理均与各自的敏感度参数和隐私预算参数相关联,隐私处理之后的每个数据桶的数据均能够体现并符合各自的敏感度和隐私预算,这使得隐私处理之后的每个数据桶的数据可用性较高,数据误差较小。

Privacy processing methods, devices and electronic devices of data distribution map

【技术实现步骤摘要】
数据分布图隐私处理方法、装置和电子设备
本申请涉及数据处理技术,尤其涉及数据统计
,具体涉及一种数据分布图隐私处理方法、装置和电子设备。
技术介绍
在统计学领域通常采用数据分布图,例如直方图(Histogram)来体现数据的分布情况。直方图中可能隐含着某些敏感信息,为了降低信息泄露的风险,在发布直方图之前,通常需要对直方图进行隐私处理。目前,隐私处理的方式一般是直接对直方图的原始数据添加随机噪声,这导致处理之后的直方图的数据存在较大误差,从而导致处理之后的直方图的数据可用性较差。
技术实现思路
本申请提供一种数据分布图隐私处理方法、装置和电子设备,以解决现有数据分布图隐私处理方法中存在的数据误差较大的问题。为了解决上述技术问题,本申请是这样实现的:第一方面,本申请提供了一种数据分布图隐私处理方法,所述数据分布图包括N个数据桶,N大于1,所述方法包括:获取目标数据桶的敏感度参数,并获取所述目标数据桶的隐私预算参数,其中,所述敏感度参数由用户预先配置;根据所述敏感度参数和所述隐私预算参数,对所述目标数据桶进行差分隐私处理,以得到隐私处理之后的所述目标数据桶。可见,数据分布图中的每个数据桶的差分隐私处理均与各自的敏感度参数和隐私预算参数相关联,隐私处理之后的每个数据桶的数据均能够体现并符合各自的敏感度和隐私预算,这使得隐私处理之后的每个数据桶的数据可用性较高,数据误差较小。可选的,所述获取所述目标数据桶的隐私预算参数,包括:根据所述数据分布图的初始全局隐私预算参数,以及所述敏感度参数和所述目标数据桶的数据值,计算所述目标数据桶的隐私预算参数,所述初始全局隐私预算参数由用户预先配置;或者,根据所述目标数据桶的数据可用性参数,以及所述敏感度参数,计算所述目标数据桶的隐私预算参数,所述数据可用性参数由用户预先配置。该实施方式中,用户只需配置诸如敏感度参数、初始全局隐私预算参数或可用性参数等较简单且宏观的参数,数据分布图差分隐私处理装置即可计算出各数据桶的隐私预算参数。可见,本申请可广泛适用于大部分具有差分隐私处理需求的群体,降低了用户在专业性上的要求。可选的,所述根据所述目标数据桶的数据可用性参数,以及所述敏感度参数,计算所述目标数据桶的隐私预算参数,包括:根据所述目标数据桶的数据可用性参数和所述数据可用性参数的概率,以及所述敏感度参数,计算所述目标数据桶的隐私预算参数。该实施方式中,该实施方式中,引入数据可用性参数的概率,使得每个数据桶的数据可用性参数能够在合理的范围内进行调节,从而提高数据桶隐私处理的灵活性。可选的,所述获取所述目标数据桶的隐私预算参数,包括:根据所述数据分布图的初始全局隐私预算参数,以及所述敏感度参数和所述目标数据桶所包含的数据数量,计算所述目标数据桶的第一隐私预算参数,所述初始全局隐私预算参数由用户预先配置;根据所述目标数据桶的数据可用性参数,计算所述目标数据桶的第二隐私预算参数,所述数据可用性参数由用户预先配置;将所述第一隐私预算参数和所述第二隐私预算参数中的最小者作为所述目标数据桶的隐私预算参数。该实施方式中,将第一隐私预算参数和第二隐私预算参数中的最小者作为目标数据桶的隐私预算参数,更多地考虑了目标数据桶的数据安全性,从而使得隐私处理之后的每个数据桶的数据隐私保护强度较高,进而隐私处理之后的数据分布图的整体隐私保护强度也较高。可选的,所述方法还包括:根据所述数据分布图的每个数据桶的隐私预算参数,以及每个数据桶的关系信息,计算所述数据分布图的全局隐私预算值,所述关系信息用于表征第一数据桶与其它数据桶之间的数据集关系;所述第一数据桶与其它数据桶之间的数据集关系包括以下至少一种:所述第一数据桶与第二数据桶的数据相重叠;所述第一数据桶为S个第三数据桶的并集,S大于1;所述第一数据桶为第四数据桶的子集。该实施方式中,在计算数据分布图的全局隐私预算参数时,由于考虑了各数据桶的关系信息,这使得计算出来的全局隐私预算值更加精准,能够更好地体现数据分布图整体的隐私处理程度,使用户更清楚地了解数据分布图真实的隐私预算参数,从而使用户能够更清楚地了解数据分布图的隐私泄露风险。第二方面,本申请提供了一种数据分布图隐私处理装置,所述数据分布图包括N个数据桶,N大于1,所述装置包括:第一获取模块,用于获取目标数据桶的敏感度参数,其中,所述敏感度参数由用户预先配置;第二获取模块,用于获取所述目标数据桶的隐私预算参数;处理模块,用于根据所述敏感度参数和所述隐私预算参数,对所述目标数据桶进行差分隐私处理,以得到隐私处理之后的所述目标数据桶。可选的,所述第二获取模块具体用于:根据所述数据分布图的初始全局隐私预算参数,以及所述敏感度参数和所述目标数据桶的数据值,计算所述目标数据桶的隐私预算参数,所述初始全局隐私预算参数由用户预先配置;或者,根据所述目标数据桶的数据可用性参数,以及所述敏感度参数,计算所述目标数据桶的隐私预算参数,所述数据可用性参数由用户预先配置。可选的,所述第二获取模块具体用于:根据所述目标数据桶的数据可用性参数和所述数据可用性参数的概率,以及所述敏感度参数,计算所述目标数据桶的隐私预算参数。可选的,所述第二获取模块具体用于:根据所述数据分布图的初始全局隐私预算参数,以及所述敏感度参数和所述目标数据桶所包含的数据数量,计算所述目标数据桶的第一隐私预算参数,所述初始全局隐私预算参数由用户预先配置;根据所述目标数据桶的数据可用性参数,计算所述目标数据桶的第二隐私预算参数,所述数据可用性参数由用户预先配置;将所述第一隐私预算参数和所述第二隐私预算参数中的最小者作为所述目标数据桶的隐私预算参数。可选的,所述装置还包括:计算模块,用于根据所述数据分布图的每个数据桶的隐私预算参数,以及每个数据桶的关系信息,计算所述数据分布图的全局隐私预算值,所述关系信息用于表征第一数据桶与其它数据桶之间的数据集关系;所述第一数据桶与其它数据桶之间的数据集关系包括以下至少一种:所述第一数据桶与第二数据桶的数据相重叠;所述第一数据桶为S个第三数据桶的并集,S大于1;所述第一数据桶为第四数据桶的子集。第三方面,本申请提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面中的任一项方法。第四方面,本申请提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行第一方面中的任一项方法。上述申请中的一个实施例具有如下优点或有益效果:通过获取目标数据桶的敏感度参数和隐私预本文档来自技高网...

【技术保护点】
1.一种数据分布图隐私处理方法,所述数据分布图包括N个数据桶,N大于1,其特征在于,所述方法包括:/n获取目标数据桶的敏感度参数,并获取所述目标数据桶的隐私预算参数,其中,所述敏感度参数由用户预先配置;/n根据所述敏感度参数和所述隐私预算参数,对所述目标数据桶进行差分隐私处理,以得到隐私处理之后的所述目标数据桶。/n

【技术特征摘要】
1.一种数据分布图隐私处理方法,所述数据分布图包括N个数据桶,N大于1,其特征在于,所述方法包括:
获取目标数据桶的敏感度参数,并获取所述目标数据桶的隐私预算参数,其中,所述敏感度参数由用户预先配置;
根据所述敏感度参数和所述隐私预算参数,对所述目标数据桶进行差分隐私处理,以得到隐私处理之后的所述目标数据桶。


2.根据权利要求1所述的方法,其特征在于,所述获取所述目标数据桶的隐私预算参数,包括:
根据所述数据分布图的初始全局隐私预算参数,以及所述敏感度参数和所述目标数据桶的数据值,计算所述目标数据桶的隐私预算参数,所述初始全局隐私预算参数由用户预先配置;
或者,
根据所述目标数据桶的数据可用性参数,以及所述敏感度参数,计算所述目标数据桶的隐私预算参数,所述数据可用性参数由用户预先配置。


3.根据权利要求2所述的方法,其特征在于,所述根据所述目标数据桶的数据可用性参数,以及所述敏感度参数,计算所述目标数据桶的隐私预算参数,包括:
根据所述目标数据桶的数据可用性参数和所述数据可用性参数的概率,以及所述敏感度参数,计算所述目标数据桶的隐私预算参数。


4.根据权利要求1所述的方法,其特征在于,所述获取所述目标数据桶的隐私预算参数,包括:
根据所述数据分布图的初始全局隐私预算参数,以及所述敏感度参数和所述目标数据桶所包含的数据数量,计算所述目标数据桶的第一隐私预算参数,所述初始全局隐私预算参数由用户预先配置;
根据所述目标数据桶的数据可用性参数,计算所述目标数据桶的第二隐私预算参数,所述数据可用性参数由用户预先配置;
将所述第一隐私预算参数和所述第二隐私预算参数中的最小者作为所述目标数据桶的隐私预算参数。


5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述数据分布图的每个数据桶的隐私预算参数,以及每个数据桶的关系信息,计算所述数据分布图的全局隐私预算值,所述关系信息用于表征第一数据桶与其它数据桶之间的数据集关系;
所述第一数据桶与其它数据桶之间的数据集关系包括以下至少一种:
所述第一数据桶与第二数据桶的数据相重叠;
所述第一数据桶为S个第三数据桶的并集,S大于1;
所述第一数据桶为第四数据桶的子集。


6.一种数据分布图隐私处理装置,所述数据分布图包括N个数据桶,N大于1,其特征在于,所述装置包括:
第一获取模块,用于获取目标数据桶的敏感度参数,其中,所述敏感度参数由用户预先配置;

【专利技术属性】
技术研发人员:徐坤蒋精华洪爵
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1