纵向树模型训练方法、业务数据处理方法、系统以及装置制造方法及图纸

技术编号:39328049 阅读:19 留言:0更新日期:2023-11-12 16:05
本申请实施例公开了一种纵向树模型的训练方法、业务处理方法、系统以及装置。首先,第一业务设备根据加密标签获取树模型的第一节点在第一业务设备中对应的多个样本切割策略的密态增益值,然后,根据第一业务设备中对应的多个样本切割策略的密态增益值,获取本地最优切割策略标识密态向量,本地最优切割策略标识密态向量用于指示第一最优样本切割策略,第一最优样本切割策略是多个样本切割策略中的最优样本切割策略。再然后,向第二业务设备发送第一最优样本切割策略的密态增益值。接下来,接收第二业务设备发送的选择向量。最后,根据选择向量、本地最优切割策略标识密态向量得到第一切割结果。通过本方案可以能够更好的保护数据隐私。护数据隐私。护数据隐私。

【技术实现步骤摘要】
纵向树模型训练方法、业务数据处理方法、系统以及装置


[0001]本申请涉及人工智能
,具体涉及一种纵向树模型训练方法、业务数据处理方法、系统以及装置。

技术介绍

[0002]随着各行各业逐渐加强数据隐私保护的大趋势下,联邦学习,一种可以在保护数据隐私的情况下协同多方数据建立机器学习的技术,成为了各企业/行业间合作的关键之一。如今,纵向场景下,纵向树模型已经广泛地在纵向联邦场景下,成为了金融、风控领域的常用且强力的算法之一。
[0003]如何在纵向树模型的训练阶段以及应用纵向树模型的推理阶段保证多方数据隐私是一个值得关注的问题。

技术实现思路

[0004]本申请提供一种纵向树模型训练方法、业务数据处理方法、系统以及装置,能够更好的保护数据隐私。
[0005]为达到上述目的,本申请实施例提供如下技术方案:
[0006]第一方面,本申请的实施例提供了一种纵向树模型的训练方法,包括:第二业务设备根据训练样本的标签获取树模型的第一节点在第二业务设备中对应的多个样本切割策略的增益值。其中训练样本可以是业务数据,业务数据可以包括与用户有关的数据或者是与网络有关的数据,具体的可能是业务设备在运行过程中产生的数据,比如日志。再比如,可能是业务设备基于用户的操作而产生的数据,比如基于用户的语音输入操作,产生的语音数据,基于用户的文本输入操作,产生的文本数据,基于用户的拍摄操作,产生的图像数据等等。第二业务设备根据第二业务设备中对应的多个样本切割策略的增益值,从第二业务设备中对应的多个样本切割策略中获取第二最优样本切割策略。第二业务设备接收第一业务设备发送的第一最优样本切割策略的密态增益值。第二业务设备根据第二最优样本切割策略的增益值和第一最优样本切割策略的密态增益值,获取选择向量,选择向量用于指示第二最优样本切割策略的增益值和第一最优样本切割策略的密态增益值之间的比较结果。所述第二业务设备根据所述选择向量和所述第一最优样本分割策略得到第二切割结果,所述第二切割结果指示将所述第一节点当前在所述第二业务设备中管理的训练样本进行样本集合划分为子训练样本集合的方式;所述第二业务设备从所述第一业务设备中获取第一切割结果;所述第二业务设备根据所述第二切割结果和所述第一切割结果获取所述第一节点的最终样本切割策略。第二业务设备进行最优切割策略选择时(或者说确定某一个节点的最优切割策略时),不需要(同时第二业务设备也不能)解密其他参与方(第一业务设备)的每一个样本切割策略对应的具体的增益值,保护了各方的数据安全。同时各个无标签方(第一业务设备)不需要将其本地所有切割策略的密文增益值全部发送给有标签方(第二业务设备),只需要发送最优切割策略对应的密文的增益值,极大的减少了通信量。
[0007]在第一方面的一种可能的实施方式中,方法还包括:第二业务设备广播第二业务设备的同态公钥。第二业务设备接收第一业务设备广播的第一业务设备的同态公钥。第二业务设备根据获取到的全部同态公钥生成公共公钥。第二业务设备根据公共公钥对标签进行同态加密,以获取加密标签。第二业务设备向第一业务设备发送加密标签,加密标签用于第一业务设备获取第一最优样本切割策略的增益值。在第一方面的一种可能的实施方式中,方法还包括:第二业务设备向第一业务设备发送选择向量,选择向量用于第一业务设备获取第一切割结果。
[0008]在第一方面的一种可能的实施方式中,方法还包括:第二业务设备获取第二节点的最终样本切割策略,第二节点是第一节点的子节点。
[0009]第二方面,本申请的实施例提供了一种纵向树模型的训练方法,包括:第一业务设备根据加密标签获取树模型的第一节点在所述第一业务设备中对应的多个样本切割策略的密态增益值;所述第一业务设备根据所述第一业务设备中对应的多个样本切割策略的密态增益值,获取本地最优切割策略标识密态向量,所述本地最优切割策略标识密态向量用于指示第一最优样本切割策略,所述第一最优样本切割策略是所述多个样本切割策略中的最优样本切割策略;所述第一业务设备向第二业务设备发送所述第一最优样本切割策略的密态增益值;所述第一业务设备接收所述第二业务设备发送的选择向量,所述选择向量用于指示第二最优样本切割策略的增益值和所述第一最优样本切割策略的密态增益值之间的比较结果;所述第一业务设备根据所述选择向量、所述本地最优切割策略标识密态向量得到第一切割结果,所述第一切割结果指示将所述第一节点当前在所述第一业务设备中管理的训练样本集合划分为子训练样本集合的方式。
[0010]在第二方面的一种可能的实施方式中,方法还包括:第一业务设备从第二业务设备接收加密标签。
[0011]在第二方面的一种可能的实施方式中,所述第一业务设备向所述第二业务设备发送所述第一切割结果,以使所述第二业务设备根据第二切割结果和所述第一切割结果获取所述第一节点的最终样本切割策略。
[0012]在第二方面的一种可能的实施方式中,方法还包括:第一业务设备广播第一业务设备的同态公钥,以使第二业务设备利用第二业务设备的同态公钥和第一业务设备的同态公钥生成公共公钥,公共公钥用于对训练样本的标签进行同态加密以获取加密标签。
[0013]在第二方面的一种可能的实施方式中,方法还包括:第一业务设备获取第二节点的最终样本切割策略,第二节点是第一节点的子节点。
[0014]第三方面,本申请的实施例提供了一种业务处理的方法,包括:推理设备对待查询业务的标识ID进行编码,得到编码向量。推理设备对编码向量进行同态加密,得到密文查询向量。推理设备根据ID、获取待查询业务在推理设备中对应的数据,并基于数据、推理设备获取的树模型的第一节点在推理设备中对应的多个样本切割策略以及第一节点对应的选择向量获取第一推理结果,选择向量用于推理设备或者辅助推理设备获取本地获取的最优样本分割策略是否为第一节点的最终样本切割策略。推理设备向辅助推理设备发送密文查询向量,以使辅助推理设备根据密文查询向量获取待查询业务在辅助推理设备中对应的密文数据,并基于密文数据、辅助推理设备获取的第一节点在辅助推理设备中对应的多个样本切割策略和选择向量获取第二推理结果。推理设备接收辅助推理设备发送的第二推理结
果。推理设备根据第一推理结果和第二推理结果获取第一节点对待查询业务的推理结果。在推理时,发起推理方不需要明文的发送自己的查询索引,可以按照密文的形式发送查询,进行隐匿的模型推理。本申请实施例提供的方案能够更好的保护各个参与方的数据隐私。
[0015]第四方面,本申请的实施例提供了一种业务处理的方法,包括:辅助推理设备接收密文查询向量,密文查询向量是推理设备对编码向量进行同态加密后获取的,编码向量是推理设备对待查询业务的标识ID进行编码后获取的。辅助推理设备根据密文查询向量获取待查询业务在辅助推理设备中对应的密文数据,并基于密文数据、辅助推理设备获取的第一节点在辅助推理设备中对应的多个样本切割策略和选择向量获取第二推理结果。辅助推理设备接收向推理设备发送第二推理结果,以使推理设备根据第一推理结果和第二推理结果获取本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种纵向树模型的训练方法,其特征在于,包括:第一业务设备根据加密标签获取树模型的第一节点在所述第一业务设备中对应的多个样本切割策略的密态增益值;所述第一业务设备根据所述第一业务设备中对应的多个样本切割策略的密态增益值,获取本地最优切割策略标识密态向量,所述本地最优切割策略标识密态向量用于指示第一最优样本切割策略,所述第一最优样本切割策略是所述多个样本切割策略中的最优样本切割策略;所述第一业务设备向第二业务设备发送所述第一最优样本切割策略的密态增益值;所述第一业务设备接收所述第二业务设备发送的选择向量,所述选择向量用于指示第二最优样本切割策略的增益值和所述第一最优样本切割策略的密态增益值之间的比较结果;所述第一业务设备根据所述选择向量、所述本地最优切割策略标识密态向量得到第一切割结果,所述第一切割结果指示将所述第一节点当前在所述第一业务设备中管理的训练样本集合划分为子训练样本集合的方式。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:所述第一业务设备从所述第二业务设备接收加密标签。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:所述第一业务设备向所述第二业务设备发送所述第一切割结果,以使所述第二业务设备根据第二切割结果和所述第一切割结果获取所述第一节点的最终样本切割策略。4.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:所述第一业务设备广播所述第一业务设备的同态公钥,以使第二业务设备利用所述第二业务设备的同态公钥和所述第一业务设备的同态公钥生成公共公钥,所述公共公钥用于对训练样本的标签进行同态加密以获取所述加密标签。5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:所述第一业务设备获取第二节点的最终样本切割策略,所述第二节点是所述第一节点的子节点。6.一种纵向树模型的训练方法,其特征在于,包括:第二业务设备根据训练样本的标签获取树模型的第一节点在所述第二业务设备中对应的多个样本切割策略的增益值;所述第二业务设备根据所述第二业务设备中对应的多个样本切割策略的增益值,获取第二最优样本切割策略,所述第二最优样本切割策略是所述多个样本切割策略中的最优样本切割策略;所述第二业务设备接收第一业务设备发送的所述第一最优样本切割策略的密态增益值;所述第二业务设备根据所述第二最优样本切割策略的增益值和所述第一最优样本切割策略的密态增益值,获取选择向量,所述选择向量用于指示所述第二最优样本切割策略的增益值和所述第一最优样本切割策略的密态增益值之间的比较结果;所述第二业务设备根据所述选择向量和所述第一最优样本分割策略得到第二切割结果,所述第二切割结果指示将所述第一节点当前在所述第二业务设备中管理的训练样本进
行样本集合划分为子训练样本集合的方式;所述第二业务设备从所述第一业务设备中获取第一切割结果;所述第二业务设备根据所述第二切割结果和所述第一切割结果获取所述第一节点的最终样本切割策略。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:所述第二业务设备广播所述第二业务设备的同态公钥;所述第二业务设备接收第一业务设备广播的所述第一业务设备的同态公钥;所述第二业务设备根据获取到的全部同态公钥生成公共公钥;所述第二业务设备根据所述公共公钥对所述标签进行同态加密,以获取加密标签;所述第二业务设备向所述第一业务设备发送所述加密标签,所述加密标签用于所述第一业务设备获取所述第一最优样本切割策略的增益值。8.根据权利要求6或7所述的方法,其特征在于,所述方法还包括:所述第二业务设备向所述第一业务设备发送所述选择向量,所述选择向量用于所述第一业务设备获取所述第一切割结果。9.根据权利要求6至8任一项所述的方法,其特征在于,所述方法还包括:所述第二业务设备获取第二节点的最终样本切...

【专利技术属性】
技术研发人员:邵云峰李秉帅郑青
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1