System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机,尤其涉及一种基于隐私保护的模糊地址匹配方法及装置。
技术介绍
1、a供应商持有一些商户地址信息,b供应商户也持有一些商户地址信息,双方要确定双方共有的商户,然后针对共有商户开展一些营销活动。
2、a供应商和b供应商要获得共有商户的信息,但又不能向对方暴露非共有商户的信息。传统的隐匿集合求交(psi)技术不能解决这一问题,因为psi是进行精准求交,当双方对某一商户所采集的信息完全一致时,才被认为是共同商户。但实际上,双方的地址信息都是独立采集的,具有一定差异,例如对同一个商店——“万福便利店”,a采集的信息是:xx便利店(xx大厦店),xxx大街1号,而b采集的信息是:xx便利店,xxx大厦一楼。
3、在传统的隐匿集合求交(psi)技术中,由于a和b采集的信息不同,xx便利店不被认为是一个共同的商户,但事实上xx便利店却为同一个商店。
4、为解决psi不能实现模糊匹配问题,本专利技术提出一种基于隐私保护的模糊地址匹配方法及装置。
技术实现思路
1、本专利技术的目的是针对现有技术的缺陷,提供了一种基于隐私保护的模糊地址匹配方法及装置。
2、为了实现以上目的,本专利技术采用以下技术方案:
3、一种基于隐私保护的模糊地址匹配方法,包括:
4、s1.获取第一数据持有方持有的第一地址信息以及第二数据持有方持有的第二地址信息;
5、s2.接收第一数据持有方对第一地址信息进行子抽样处理得到的第
6、s3.接收第一数据持有方和第二数据持有方针对第一地址信息的子样集合和第二地址信息的子样集合中的每个子集运行psi集合求交协议的处理结果;
7、s4.将处理结果分别发送至第一数据持有方和第二数据持有方。
8、进一步的,所述步骤s1中还包括对第一地址信息、第二地址信息均基于大语言模型进行二值化处理,得到二值化后的第一地址信息、二值化后的第二地址信息。
9、进一步的,所述步骤s2中第一地址信息的子样集合、第二地址信息的子样集合的计算方式均为:
10、s21.随机生成多个1024维的0-1随机向量;
11、s22.将二值化后的地址信息分别与步骤s21中的随机向量进行and逻辑运算,得到多个抽样结果;
12、s23.根据多个抽样结果形成地址信息的子样集合。
13、进一步的,所述步骤s3中运行psi集合求交协议的处理结果具体为:筛选第一地址信息的子样集合与第二地址信息的子样集合相同的子抽样,并判断筛选相同的子抽样的数量是否存在大于等于预设阈值,若是,则表示第一地址信息与第二地址信息为同一个地址信息。
14、进一步的,所述步骤s3中判断得到第一地址信息与第二地址信息为同一个地址信息后,还包括:则第一数据持有方将第一地址信息放入第一集合中,第二数据持有方将第二地址信息放入第二集合中。
15、进一步的,所述步骤s4具体为:将第一集合发送至第一数据持有方,将第二集合发送给第二数据持有方。
16、进一步的,还提供一种基于隐私保护的模糊地址匹配装置,用于执行一种基于隐私保护的模糊地址匹配方法,地址匹配装置包括处理器,所述处理器内设置有:
17、获取模块,用于获取第一数据持有方持有的第一地址信息以及第二数据持有方持有的第二地址信息;
18、第一接收模块,用于接收第一数据持有方对第一地址信息进行子抽样处理得到的第一地址信息的子样集合,以及第二数据持有方对第二地址信息进行子抽样处理得到的第二地址信息的子样集合;
19、第二接收模块,用于接收第一数据持有方和第二数据持有方针对第一地址信息的子样集合和第二地址信息的子样集合中的每个子集运行psi集合求交协议的处理结果;
20、发送模块,用于将处理结果分别发送至第一数据持有方和第二数据持有方。
21、进一步的,所述处理器上连接有用于存储数据或指令的存储器。
22、进一步的,所述处理器上连接有用于与外部设备数据传输的传输设备。
23、进一步的,所述处理器上连接有用于与输入或输出信息的输入输出设备。
24、与现有技术相比,本专利技术具有以下有益效果:
25、1、解决了传统psi技术不能对有差异采集的地址信息进行求交的问题
26、2、采用词嵌入和子抽样的技术,没有采用其他复杂的密码学技术,具有效率高效的特点
27、3、双方只得到了所有地址子样的交集和地址的交集,没有获得不在交集中的地址信息,从而保护了双方的隐私。
本文档来自技高网...【技术保护点】
1.一种基于隐私保护的模糊地址匹配方法,其特征在于,包括:
2.根据权利要求1所述的一种基于隐私保护的模糊地址匹配方法,其特征在于,所述步骤S1中还包括对第一地址信息、第二地址信息均基于大语言模型进行二值化处理,得到二值化后的第一地址信息、二值化后的第二地址信息。
3.根据权利要求2所述的一种基于隐私保护的模糊地址匹配方法,其特征在于,所述步骤S2中第一地址信息的子样集合、第二地址信息的子样集合的计算方式均为:
4.根据权利要求3所述的一种基于隐私保护的模糊地址匹配方法,其特征在于,所述步骤S3中运行PSI集合求交协议的处理结果具体为:筛选第一地址信息的子样集合与第二地址信息的子样集合相同的子抽样,并判断筛选相同的子抽样的数量是否存在大于等于预设阈值,若是,则表示第一地址信息与第二地址信息为同一个地址信息。
5.根据权利要求4所述的一种基于隐私保护的模糊地址匹配方法,其特征在于,所述步骤S3中判断得到第一地址信息与第二地址信息为同一个地址信息后,还包括:则第一数据持有方将第一地址信息放入第一集合中,第二数据持有方将第二地址信息放入第
6.根据权利要求5所述的一种基于隐私保护的模糊地址匹配方法,其特征在于,所述步骤S4具体为:将第一集合发送至第一数据持有方,将第二集合发送给第二数据持有方。
7.一种基于隐私保护的模糊地址匹配装置,用于执行权利要求1-6任一项所述的一种基于隐私保护的模糊地址匹配方法,地址匹配装置包括处理器,其特征在于,所述处理器内设置有:
8.根据权利要求7所述的一种基于隐私保护的模糊地址匹配装置,其特征在于,所述处理器上连接有用于存储数据或指令的存储器。
9.根据权利要求7所述的一种基于隐私保护的模糊地址匹配装置,其特征在于,所述处理器上连接有用于与外部设备数据传输的传输设备。
10.根据权利要求7所述的一种基于隐私保护的模糊地址匹配装置,其特征在于,所述处理器上连接有用于与输入或输出信息的输入输出设备。
...【技术特征摘要】
1.一种基于隐私保护的模糊地址匹配方法,其特征在于,包括:
2.根据权利要求1所述的一种基于隐私保护的模糊地址匹配方法,其特征在于,所述步骤s1中还包括对第一地址信息、第二地址信息均基于大语言模型进行二值化处理,得到二值化后的第一地址信息、二值化后的第二地址信息。
3.根据权利要求2所述的一种基于隐私保护的模糊地址匹配方法,其特征在于,所述步骤s2中第一地址信息的子样集合、第二地址信息的子样集合的计算方式均为:
4.根据权利要求3所述的一种基于隐私保护的模糊地址匹配方法,其特征在于,所述步骤s3中运行psi集合求交协议的处理结果具体为:筛选第一地址信息的子样集合与第二地址信息的子样集合相同的子抽样,并判断筛选相同的子抽样的数量是否存在大于等于预设阈值,若是,则表示第一地址信息与第二地址信息为同一个地址信息。
5.根据权利要求4所述的一种基于隐私保护的模糊地址匹配方法,其特征在于,所述步骤s3中判断得到第一地址信息与第二地址信...
【专利技术属性】
技术研发人员:陈昕,马煜翔,吴凡,
申请(专利权)人:蓝象智联杭州科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。