一种用于隐私保护的数据均值统计方法及设备技术

技术编号:34713953 阅读:17 留言:0更新日期:2022-08-31 17:55
本发明专利技术实施例提供一种用于隐私保护的数据均值统计方法及设备。所述方法包括:确定N个概率数据,所述N个概率数据被设置为数值不同或部分相同,且每个概率数据的数值位于0到1范围内,其中N等于待处理二进制数据的长度;分别对所述待处理二进制数据的每一位数据以预设概率进行翻转,其中所述预设概率为所述N个概率数据中的一个;将翻转后的所述待处理二进制数据发送至服务端,以供所述服务端对所述待处理二进制数据进行均值统计。本发明专利技术实施例在保证隐私的同时提高了可用性。证隐私的同时提高了可用性。证隐私的同时提高了可用性。

【技术实现步骤摘要】
一种用于隐私保护的数据均值统计方法及设备


[0001]本专利技术实施例涉及互联网
,尤其涉及一种用于隐私保护的数据均值统计方法及设备。

技术介绍

[0002]随着大数据时代的到来,数据挖掘愈来愈盛行,但是数据挖掘当往往会暴露用户的隐私,导致企业信用下降。以往的隐私方法因为需要特殊的攻击假设和一定的背景知识,并不能完全保证隐私信息的安全性。因此近年来以强背景假设和可量化隐私为特性的差分隐私受到学者们广泛研究。在本地差分隐私(Local Differential Privacy,LDP)中,每个用户在将其数据发送到不受信任的一方之前先在本地扰动数据。从这种意义上讲,除了数据所有者之外,没有其他人可以访问原始数据。到目前为止,LDP已被多家主要软件和互联网公司部署在许多实际产品中:苹果提出的CMS/HCMS系统现在已部署在数亿个iOS和macOS设备上运行,执行各种移动数据收集任务,例如在Safari中识别流行的表情符号,流行的健康数据类型。谷歌提出的RAPPOR部署在Google Chrome中,可在Chrome使用情况下收集用户行为数据做统计分析,同时保护隐私。微软也已部署LDP收集遥测数据,用于随时间推移进行均值和直方图估计。
[0003]目前,本地化差分隐私技术主要研究的方向有:扰动机制研究、单值频数发布、多值频数发布、均值发布。扰动机制主要包括随机响应、信息压缩和扭曲一种。随机响应技术的扰动框架简洁、直观,且其扰动程度可直接量化,因此本地化差分隐私下的研究工作大都基于随机响应技术展开,包括针对离散型数据的频数发布和针对连续型数据的均值发布。针对连续型数据的均值发布研究相对较少,经典的有MeanEst和改进版Harmony

Mean,MeanEst的主要思想是将数值型数据二值离散化。但是将数值数据以一定概率映射成两个值,偏离原始值的程度太大。RAPPOR方法在统计连续型数据的均值时,先利用hash函数将其映射成等长的二进制数,然后对每比特以相同的概率翻转。但是因为hash函数映射的结果为256位,通信成本较大。

技术实现思路

[0004]针对现有技术存在的问题,本专利技术实施例提供一种用于隐私保护的数据均值统计方法及设备,对二进制扰动时并非对二进制的每一位以相同概率翻转,翻转的概率和二进制的位数有关,在保证隐私的同时提高了可用性。
[0005]第一方面,本专利技术实施例提供一种用于隐私保护的数据均值统计方法,应用于客户端,包括:
[0006]确定N个概率数据,所述N个概率数据被设置为数值不同或部分相同,且每个概率数据的数值位于0到1范围内,其中N等于待处理二进制数据的长度;
[0007]分别对所述待处理二进制数据的每一位数据以预设概率进行翻转,其中所述预设概率为所述N个概率数据中的一个;
[0008]将翻转后的所述待处理二进制数据发送至服务端,以供所述服务端对所述待处理二进制数据进行均值统计。
[0009]进一步,所述分别对所述待处理二进制数据的每一位数据以预设概率进行翻转,具体包括:
[0010]分别对所述待处理二进制数据的每一位数据以预设概率进行翻转,其中,所述待处理二进制数据从高位到低位的每一位数据对应的预设概率从小到大依次增长。
[0011]进一步,所述分别对所述待处理二进制数据的每一位数据以预设概率进行翻转,具体包括
[0012]分别对所述待处理二进制数据的每一位数据以预设概率进行翻转,其中,所述待处理二进制数据的一个或多个特定位数据的预设概率对应一个或多个特定概率,所述待处理二进制数据的剩余位、从高位到低位的每一位数据对应的预设概率从小到大依次增长。
[0013]进一步,所述待处理二进制数据通过如下方法得到:
[0014]确定一公因子,所述公因子为正整数;
[0015]将数值型数据除以公因子,得到整数商;
[0016]将所述整数商转换为二进制数据,所述二进制数据的位数根据数值型数据的个数确定。
[0017]第二方面,本专利技术实施例提供一种用于隐私保护的数据均值统计方法,应用于服务端,包括:
[0018]接收客户端发送的二进制数据,所述二进制数据是所述客户端对待处理二进制数据的每一位数据以预设概率进行翻转得到的,所述预设概率为N个不同或部分不同的概率数据中的一个,且每个概率数据的数值位于0到1范围内,其中N等于待处理二进制数据的长度;
[0019]基于目标数据位,统计所有待处理二进制数据的所述目标数据位上出现1的频率,作为所述二进制数据目标数据位的均值。
[0020]进一步,所述二进制数据是所述客户端对待处理二进制数据的每一位数据以预设概率进行翻转得到的,具体包括:
[0021]所述二进制数据是所述客户端对待处理二进制数据的每一位数据以预设概率进行翻转得到的,所述待处理二进制数据从高位到低位的每一位数据对应的预设概率从小到大依次增长。
[0022]进一步,所述二进制数据是所述客户端对待处理二进制数据的每一位数据以预设概率进行翻转得到的,具体包括:
[0023]所述二进制数据是所述客户端对待处理二进制数据的每一位数据以预设概率进行翻转得到的,其中,所述待处理二进制数据的一个或多个特定位数据的预设概率对应一个或多个特定概率,所述待处理二进制数据的剩余位、从高位到低位的每一位数据对应的预设概率从小到大依次增长。
[0024]进一步,所述待处理二进制数据通过如下方法得到:
[0025]确定一公因子,所述公因子为正整数;
[0026]将数值型数据除以公因子,得到整数商;
[0027]将所述整数商转换为二进制数据,所述二进制数据的位数根据数值型数据的个数
确定。
[0028]第三方面,本专利技术实施例提供一种电子设备,包括:
[0029]至少一个处理器;以及
[0030]与所述处理器通信连接的至少一个存储器,其中:
[0031]所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行本专利技术实施例第一方面所述用于隐私保护的数据均值统计方法及其任一可选实施例所述的方法,或者执行本专利技术实施例第二方面所述用于隐私保护的数据均值统计方法及其任一可选实施例所述的方法。
[0032]第四方面,本专利技术实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令执行本专利技术实施例第一方面所述用于隐私保护的数据均值统计方法及其任一可选实施例所述的方法,或者执行本专利技术实施例第二方面所述用于隐私保护的数据均值统计方法及其任一可选实施例所述的方法。
[0033]本专利技术实施例提供的用于隐私保护的数据均值统计方法,对二进制扰动时并非对二进制的每一位以相同概率翻转,而是对二进制数据的每一位数据以预设概率翻转,所有的预设概率是不相同的,或者是部分相同部分不相同的,以预设概率翻转后的二进制数据发送至服务端,这样在保证隐私的同时提高了可用性。
附图说明本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于隐私保护的数据均值统计方法,应用于客户端,其特征在于,包括:确定N个概率数据,所述N个概率数据被设置为数值不同或部分相同,且每个概率数据的数值位于0到1范围内,其中N等于待处理二进制数据的长度;分别对所述待处理二进制数据的每一位数据以预设概率进行翻转,其中所述预设概率为所述N个概率数据中的一个;将翻转后的所述待处理二进制数据发送至服务端,以供所述服务端对所述待处理二进制数据进行均值统计。2.根据权利要求1所述的方法,其特征在于,所述分别对所述待处理二进制数据的每一位数据以预设概率进行翻转,具体包括:分别对所述待处理二进制数据的每一位数据以预设概率进行翻转,其中,所述待处理二进制数据从高位到低位的每一位数据对应的预设概率从小到大依次增长。3.根据权利要求1所述的方法,其特征在于,所述分别对所述待处理二进制数据的每一位数据以预设概率进行翻转,具体包括分别对所述待处理二进制数据的每一位数据以预设概率进行翻转,其中,所述待处理二进制数据的一个或多个特定位数据的预设概率对应一个或多个特定概率,所述待处理二进制数据的剩余位、从高位到低位的每一位数据对应的预设概率从小到大依次增长。4.根据权利要求1

3任一项所述的方法,其特征在于,所述待处理二进制数据通过如下方法得到:确定一公因子,所述公因子为正整数;将数值型数据除以公因子,得到整数商;将所述整数商转换为二进制数据,所述二进制数据的位数根据数值型数据的个数确定。5.一种用于隐私保护的数据均值统计方法,应用于服务端,其特征在于,包括:接收客户端发送的二进制数据,所述二进制数据是所述客户端对待处理二进制数据的每一位数据以预设概率进行翻转得到的,所述预设概率为N个不同或部分不同的概率数据中的一个,且每个概率...

【专利技术属性】
技术研发人员:潘宣辰陈诚
申请(专利权)人:武汉安天信息技术有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1