交集数据的生成方法和基于交集数据的联邦模型训练方法技术

技术编号:26304319 阅读:36 留言:0更新日期:2020-11-10 19:59
本发明专利技术涉及大数据领域,提供了一种交集数据生成方法,所述方法包括:接收数据请求终端发送的ID交集请求,所述ID交集请求携带有至少一个用户ID信息;响应于所述ID交集请求;接收所述第二加密数据和所述第三加密数据;将所述第一加密数据、所述第二加密数据和所述第三加密数据输入到预先配置好的交集模型中进行交集处理,以得到交集数据集和非交集数据集;对所述非交集数据集中的每个非交集数据进行特征标签化处理,以生成多个虚拟特征;及将所述交集数据集和所述多个虚拟特征发送到数据请求终端进行联邦训练,并将所述交集数据集和所述多个虚拟特征上传到区块链中。本发明专利技术解决了联邦学习容易造成用户信息的泄露,提高了用户的数据安全性。

【技术实现步骤摘要】
交集数据的生成方法和基于交集数据的联邦模型训练方法
本专利技术实施例涉及数据传输领域,尤其涉及一种交集数据的生成方法和基于交集数据的联邦模型训练方法、系统、计算机设备及计算机可读存储介质。
技术介绍
随着大数据时代的来临,在互联网领域中数据孤岛的问题越来越突出。而联邦学习的出现,在一定程度上为解决互联网领域中数据孤岛的问题起到了至关重要的作用。目前,联邦学习主要是通过对用户ID的进行交集匹配,并在匹配成功后,通过交集部分ID用户的完成联邦学习,从而解决数据孤岛问题。但是容易造成用户的非交集部分信息的泄露,存在一定的安全隐患。因此,如何可以安全可靠的保证用户信息的不泄露情况下进行联邦学习成为了当前要解决的技术问题之一。
技术实现思路
有鉴于此,有必要提供一种交集数据的生成方法和基于交集数据的联邦模型训练方法、系统、计算机设备及计算机可读存储介质,以解决当前联邦学习容易造成用户信息的泄露等技术问题。为实现上述目的,本专利技术实施例提供了一种交集数据的生成方法,所述方法步骤包括:接收数据请求终端发送的ID交集请求,所述ID交集请求携带有至少一个用户ID信息;响应于所述ID交集请求,并根据所述用户ID信息返回第一加密数据,以使所述数据请求终端根据所述第一加密数据返回第二加密数据和第三加密数据;接收所述第二加密数据和所述第三加密数据;将所述第一加密数据、所述第二加密数据和所述第三加密数据输入到预先配置好的交集模型中进行交集处理,以得到交集数据集和非交集数据集;对所述非交集数据集中的每个非交集数据进行特征标签化处理,以生成多个虚拟特征;及将所述交集数据集和所述多个虚拟特征发送到数据请求终端进行联邦训练。示例性的,所述根据所述用户ID信息返回第一加密数据,包括;根据所述用户ID信息获取与所述用户ID信息对应的目标用户信息;及对所述目标用户信息进行加密处理,以得到第一加密数据。示例性的,所述用户ID信息包括第一ID信息;所述根据所述用户ID信息获取与所述用户ID信息对应的目标用户信息,包括;根据预设的格式转换规则对所述第一ID信息进行格式转换,以得到所述第一ID信息对应的第二ID信息;及根据所述第二ID信息获取与所述用户ID信息对应的目标用户信息。示例性的,还包括配置所述格式转换规则的步骤:预先获取所述数据请求终端提供的多个第一ID信息,其中,每个用户ID信息携带有该用户的用户身份信息;根据所述用户身份信息确定所述每个第一ID信息对应的第二ID信息;根据每个第一ID信息和该第一ID信息对应的第二ID信息,配置所述格式转换规则。示例性的,还包括:将所述多个时间序列数据上传到区块链中。为实现上述目的,本专利技术实施例还提供了一种基于交集数据的联邦模型训练方法,用于数据请求终端,所述方法包括:向数据提供终端发送ID交集请求,以使所述数据提供终端根据所述ID交集请求携带的用户ID信息返回第一加密数据;接收所述第一加密数据;对所述第一加密数据进行加密处理,以得到第二加密数据;获取与所述用户ID信息对应的本地用户信息,并对所述本地用户信息进行加密处理,以得到第三加密数据;将所述第二加密数据和所述第三加密数据发送到所述数据提供终端,以使所述数据提供终端返回对应的交集数据集和多个虚拟特征;及将所述交集数据集和所述多个虚拟特征作为联邦训练样本,对预先配置的预训练联邦模型中进行训练,以得到目标联邦模型。示例性的,还包括:将所述交集数据集和多个虚拟特征上传到区块链中。为实现上述目的,本专利技术实施例还提供了一种交集数据的生成系统,包括:接收请求模块,用于接收数据请求终端发送的ID交集请求,所述ID交集请求携带有至少一个用户ID信息;响应请求模块,用于响应于所述ID交集请求,并根据所述用户ID信息返回第一加密数据,以使所述数据请求终端根据所述第一加密数据返回第二加密数据和第三加密数据;接收数据模块,用于接收所述第二加密数据和所述第三加密数据;交集处理模块,用于将所述第一加密数据、所述第二加密数据和所述第三加密数据输入到预先配置好的交集模型中进行交集处理,以得到交集数据集和非交集数据集;标签处理模块,用于对所述非交集数据集中的每个非交集数据进行特征标签化处理,以生成多个虚拟特征;及发送数据模块,用于将所述交集数据集和所述多个虚拟特征发送到数据请求终端。为实现上述目的,本专利技术实施例还提供了一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被处理器执行时实现如上述的交集数据的生成方法或基于交集数据的联邦模型训练方法的步骤。为实现上述目的,本专利技术实施例还提供了一种计算机可读存储介质所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行如上述的交集数据的生成方法或基于交集数据的联邦模型训练方法的步骤。本专利技术实施例提供的交集数据的生成方法和基于交集数据的联邦模型训练方法、系统、计算机设备及计算机可读存储介质,通过对用户信息的非交集数据进行特征标签化处理,解决了联邦学习容易造成用户信息的泄露,提高了用户的数据安全性。附图说明图1为本专利技术实施例一中交集数据的生成方法的流程示意图。图2为本专利技术实施例二中基于交集数据的联邦模型训练方法的流程示意图。图3为本专利技术交集数据的生成系统实施例三的程序模块示意图。图4为本专利技术基于交集数据的联邦模型训练系统实施例四的程序模块示意图。图5为本专利技术计算机设备实施例三的硬件结构示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在本专利技术中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本专利技术要求的保护范围之内。实施例一参阅图1,示出了本专利技术实施例之交集数据的生成方法的步骤流程图。可以理解,本方法实施例中的流程图不用于对执行步骤的顺序进行限定。下面以数据提供终端为执行主体进行示例性描述,所述数据提供终端为数据提供端,可以对数据进行加密操作。具体如下。步骤S100,接收数据请求终端发本文档来自技高网...

【技术保护点】
1.一种交集数据的生成方法,其特征在于,包括:/n接收数据请求终端发送的ID交集请求,所述ID交集请求携带有至少一个用户ID信息;/n响应于所述ID交集请求,并根据所述用户ID信息返回第一加密数据,以使所述数据请求终端根据所述第一加密数据返回第二加密数据和第三加密数据;/n接收所述第二加密数据和所述第三加密数据;/n将所述第一加密数据、所述第二加密数据和所述第三加密数据输入到预先配置好的交集模型中进行交集处理,以得到交集数据集和非交集数据集;/n对所述非交集数据集中的每个非交集数据进行特征标签化处理,以生成多个虚拟特征;及/n将所述交集数据集和所述多个虚拟特征发送到数据请求终端进行联邦训练。/n

【技术特征摘要】
1.一种交集数据的生成方法,其特征在于,包括:
接收数据请求终端发送的ID交集请求,所述ID交集请求携带有至少一个用户ID信息;
响应于所述ID交集请求,并根据所述用户ID信息返回第一加密数据,以使所述数据请求终端根据所述第一加密数据返回第二加密数据和第三加密数据;
接收所述第二加密数据和所述第三加密数据;
将所述第一加密数据、所述第二加密数据和所述第三加密数据输入到预先配置好的交集模型中进行交集处理,以得到交集数据集和非交集数据集;
对所述非交集数据集中的每个非交集数据进行特征标签化处理,以生成多个虚拟特征;及
将所述交集数据集和所述多个虚拟特征发送到数据请求终端进行联邦训练。


2.如权利要求1所述的交集数据的生成方法,其特征在于,所述根据所述用户ID信息返回第一加密数据,包括;
根据所述用户ID信息获取与所述用户ID信息对应的目标用户信息;及
对所述目标用户信息进行加密处理,以得到第一加密数据。


3.如权利要求2所述的交集数据的生成方法,其特征在于,所述用户ID信息包括第一ID信息;
所述根据所述用户ID信息获取与所述用户ID信息对应的目标用户信息,包括;
根据预设的格式转换规则对所述第一ID信息进行格式转换,以得到所述第一ID信息对应的第二ID信息;及
根据所述第二ID信息获取与所述用户ID信息对应的目标用户信息。


4.如权利要求3所述的交集数据的生成方法,其特征在于,还包括配置所述格式转换规则的步骤:
预先获取所述数据请求终端提供的多个第一ID信息,其中,每个用户ID信息携带有该用户的用户身份信息;
根据所述用户身份信息确定所述每个第一ID信息对应的第二ID信息;
根据每个第一ID信息和该第一ID信息对应的第二ID信息,配置所述格式转换规则。


5.如权利要求1所述的交集数据的生成方法,其特征在于,还包括:将所述多个时间序列数据上传到区块链中。


6.一种基于交集数据的联邦模型训练方法,其特征在于,用于数据请求终端,所述方法包括:
向数据提供终端发送ID交...

【专利技术属性】
技术研发人员:周学立张茜凌海挺蔡满天刘丽扬
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1