本发明专利技术公开了一种高效的针对标识符不同的隐私集合求交方法。本发明专利技术包括参与方A、参与方B分别与协助方C使用不经意传输技术生成OLE元组;参与方A与所述协助方C利用生成的OLE元组进行交互,使参与方A拿到协助方C中与参与方A本地数据对应的信息;参与方B与协助方C利用生成的OLE元组进行交互,使参与方B拿到协助方C中与参与方B本地数据对应的信息;参与方A、参与方B分别在本地进行计算并发送相关数据进行交互,获取双方隐私集合的交集元素。本发明专利技术的有益效果在于支持针对身份标识符不同进行隐私求交的过程。
【技术实现步骤摘要】
本专利技术属于隐私计算的,具体涉及一种高效的针对标识符不同的隐私集合求交方法。
技术介绍
1、隐私集合求交(psi)是安全多方计算(mpc)中的一种密码学技术,它允许参与计算的双方,在不获取对方额外信息(除交集外的其它信息)的基础上,计算出双方数据的交集,其常见应用场景为,在多家数据厂商联合计算前,找到多家共有的数据样本,并且不暴露每家厂商独有的样本。
2、机器学习中使用到的数据集既可以是来自一个参与方,也可以是来自多个参与方。当数据的特征分布在多个参与方时需要结合这些参与方的数据集进行训练,通常第一步就是要找到共同用户,即求交集用户,之后再执行后续的计算。
3、在现有技术中,隐私集合求交方案在应用到机器学习领域中时,都是基于集合元素是唯一标识用户身份、且标识符相同的前提。
4、然而在现实世界中,不同数据厂商会支持用户使用不同的身份标识符注册登录并存储数据,甚至同一个数据厂商支持多种身份标识符,这就导致了收集到的用户数据的身份标识符是不一样的。
5、现有技术中,采用基于集合元素是唯一标识用户身份、且标识符相同的传统隐私集合求交方案,并不适用于用户使用不同的身份标识符的场景,无法实现相应隐私集合求交的问题。
6、另一方面,在拥有海量数据的第三方的协助下,使用可编程的不经意伪随机函数来完成隐私集合求交,由于大部分计算和通信都集中在协助方这一端,导致相应的开销大且效率低下,无法适应如今数据量巨大及响应速度要求高的实际需求。
技术实现思路p>1、为了克服现有技术存在的缺陷与不足,本专利技术的目的在于提供一种高效的针对标识符不同的隐私集合求交方法,用于实现支持针对身份标识符不同进行隐私求交的过程。
2、为了达到上述目的,本专利技术采用以下技术方案:
3、一种高效的针对标识符不同的隐私集合求交方法,包括参与方a、参与方b、协助方c;
4、包括步骤如下:
5、所述参与方a、所述参与方b分别与所述协助方c使用不经意传输技术生成ole元组;
6、参与方a与所述协助方c利用生成的所述ole元组进行交互,使参与方a拿到协助方c中与参与方a本地数据对应的信息;
7、参与方b与协助方c利用生成的ole元组进行交互,使参与方b拿到协助方c中与参与方b本地数据对应的信息;
8、参与方a、参与方b分别在本地进行计算并发送相关数据进行交互,获取双方隐私集合的交集元素。
9、优选地,参与方a数据集为x={xa},参与方b数据集为y={yb},协助方c数据集为z={{xc,yc)}。
10、进一步地,所述参与方a、参与方b分别与所述协助方c使用不经意传输技术生成ole元组,具体过程包括:
11、参与方a从素数域中选择随机数ra,将随机数ra的比特长度记为σ;参与方a从素数域中选择σ个随机数ρi,i∈[σ];
12、参与方b从素数域中选择随机数rb,且随机数rb≠0,其中
13、参与方a与参与方b共同执行σ次协议;在第i次执行过程中,参与方a输入-ρi与ra·2i-1-ρi,参与方b输入表示rb的第i位,参与方b得到加法份额
14、执行完σ次协议后,参与方a将本地的结果记为参与方b将本地的结果记为
15、进一步地,所述参与方a与所述协助方c利用生成的所述ole元组进行交互,使参与方a拿到协助方c中与参与方a本地数据对应的信息,具体过程包括:
16、参与方a与协助方c共同确定相关参数;
17、参与方a使用布谷鸟哈希,将本地数据集x={xa}中包含的元素映射到哈希表ta中;
18、协助方c使用简单哈希,将本地数据集z={(xc,yc)}中的xc元素映射到哈希表tac中;
19、协助方c针对哈希表ta,c中每个元素计算对应的负载pl,每个元素在哈希表ta,c出现k次,给每个元素计算k个不同的负载pl;
20、参与方a与协助方c通过运行基于ole的比较协议确定共同元素{x};
21、协助方c拿到来自参与方a的{c}之后按照顺序取出c,并且针对哈希表ta,c对应的bin中存放的每个元素计算对应值d,然后将{d}发送给参与方a;
22、参与方a在拿到所有的(d}之后,针对哈希表的每个位置依次进行比较,获取等值对应的{pl};
23、参与方a拿到等值对应的{pl}之后,利用自己的密钥kac对{pl}进行更新。
24、进一步地,所述参与方a与协助方c共同确定的相关参数包括:
25、设定参与方a、参与方b、协助方c各自本地的关键字的比特长度均为σ,设定基于ole的比较协议中的使用到的哈希函数为设定统计安全参数λ,设定哈希表包含的bin的个数α,设定bin的大小β,设定k个哈希函数{h1,…,hk},设定用于存储冲突元素的容器s的大小。
26、进一步地,所述参与方a使用布谷鸟哈希,将本地数据集x={xa}中包含的元素映射到哈希表ta中,具体为:
27、通过计算index=hi(xa),i∈(1,2,…,k}确定元素xa的存放位置,并将该元素放在哈希表ta的第index个bin中,表示为ta[index]=xa;
28、所述协助方c使用简单哈希,将本地数据集z={(xc,yc)}中的xc元素映射到哈希表ta,c中,具体为:
29、通过计算indexk=hk(xc)来确定元素xc的存放位置,表示为ta,c[indexk]=xc,本地数据集中每个元素被放在哈希表ta,c的k个bin中,在ta,c中的bin所包含的元素个数小于β时采用随机数进行填充;
30、元素xc对应的负载plk计算方式为:其中f(kbc,k)表示元素xc出现第k次时对应的prf值;
31、所述参与方a与协助方c通过运行基于ole的比较协议确定共同元素{x},具体为:
32、参与方a针对哈希表ta中每个位置的元素xa计算盲化值c,c=sa-h(xa),然后按照顺序将{c}发送给协助方c;
33、所述参与方a在拿到所有的{d}之后,针对哈希表的每个位置依次进行比较,具体为:
34、比较随机数ra是否与{d}中的某一个值相等,当存在相等的值时参与方a保留d对应的负载plk。
35、进一步地,所述参与方b与协助方c利用生成的ole元组进行交互,使参与方b拿到协助方c中与参与方b本地数据对应的信息,具体过程包括:
36、参与方b使用布谷鸟哈希,将本地数据集y={yb}中包含的元素映射到哈希表tb中;
37、协助方c使用简单哈希,将本地数据集z={(xc,yc)}的yc元素映射到哈希表tb,c中;
38、协助方c针对哈希表tb,c中每个元素计算对应的负载pl,每个元素需要对应k个不同的负载plk;
39、参与方b与协助方c通本文档来自技高网
...
【技术保护点】
1.一种高效的针对标识符不同的隐私集合求交方法,包括参与方A、参与方B、协助方C;
2.根据权利要求1所述的高效的针对标识符不同的隐私集合求交方法,其特征在于,参与方A数据集为X={xA},参与方B数据集为Y={yB},协助方C数据集为Z={(xC,yC)}。
3.根据权利要求2所述的高效的针对标识符不同的隐私集合求交方法,其特征在于,所述参与方A、参与方B分别与协助方C使用不经意传输技术生成OLE元组,具体过程包括:
4.根据权利要求3所述的高效的针对标识符不同的隐私集合求交方法,其特征在于,所述参与方A与所述协助方C利用生成的所述OLE元组进行交互,使参与方A拿到协助方C中与参与方A本地数据对应的信息,具体过程包括:
5.根据权利要求4所述的高效的针对标识符不同的隐私集合求交方法,其特征在于,所述参与方A与协助方C共同确定的相关参数包括:
6.根据权利要求5所述的高效的针对标识符不同的隐私集合求交方法,其特征在于,所述参与方A使用布谷鸟哈希,将本地数据集X={xA}中包含的元素映射到哈希表TA中,具体为:
>7.根据权利要求6所述的高效的针对标识符不同的隐私集合求交方法,其特征在于,所述参与方B与协助方C利用生成的OLE元组进行交互,使参与方B拿到协助方C中与参与方B本地数据对应的信息,具体过程包括:
8.根据权利要求7所述的高效的针对标识符不同的隐私集合求交方法,其特征在于,所述协助方C使用简单哈希,将本地数据集Z={(xC,yC)}的yC元素映射到哈希表TB,C中,具体为:
9.根据权利要求8所述的高效的针对标识符不同的隐私集合求交方法,其特征在于,所述参与方A、参与方B分别在本地进行计算并发送相关数据进行交互,获取双方隐私集合的交集元素,具体过程包括:
10.根据权利要求9所述的高效的针对标识符不同的隐私集合求交方法,其特征在于,所述获取双方隐私集合的交集元素,具体为:
...
【技术特征摘要】
1.一种高效的针对标识符不同的隐私集合求交方法,包括参与方a、参与方b、协助方c;
2.根据权利要求1所述的高效的针对标识符不同的隐私集合求交方法,其特征在于,参与方a数据集为x={xa},参与方b数据集为y={yb},协助方c数据集为z={(xc,yc)}。
3.根据权利要求2所述的高效的针对标识符不同的隐私集合求交方法,其特征在于,所述参与方a、参与方b分别与协助方c使用不经意传输技术生成ole元组,具体过程包括:
4.根据权利要求3所述的高效的针对标识符不同的隐私集合求交方法,其特征在于,所述参与方a与所述协助方c利用生成的所述ole元组进行交互,使参与方a拿到协助方c中与参与方a本地数据对应的信息,具体过程包括:
5.根据权利要求4所述的高效的针对标识符不同的隐私集合求交方法,其特征在于,所述参与方a与协助方c共同确定的相关参数包括:
6.根据权利要求5所述的高效的针对标识符不...
【专利技术属性】
技术研发人员:赖俊祚,张蓉,
申请(专利权)人:暨南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。