基于隐私保护的联邦学习、虚拟对象分配方法和装置制造方法及图纸

技术编号:25042792 阅读:25 留言:0更新日期:2020-07-29 05:33
本说明书实施例公开了一种基于隐私保护的联邦学习、虚拟对象分配方法和装置,在联邦学习方法中,参与纵向联邦学习的第一设备(代表网络应用公司)和第二设备(代表第三方支付平台)分别基于本地用户样本对本地模型进行训练,得到本地模型参数并发送至协调者;协调者对收到的本地模型参数数进行整合,得到全局模型参数并发送至第一设备和第二设备;第一设备和第二设备分别基于全局模型参数更新本地模型,并在不满足训练结束条件时再次进行训练;在满足件时,协调者基于最后一次更新的本地模型确定预测模型,预测模型用于预测目标用户向网络应用公司付款的意向参数,意向参数用于确定是否向目标用户分配虚拟对象。

【技术实现步骤摘要】
基于隐私保护的联邦学习、虚拟对象分配方法和装置
本申请涉及计算机
,尤其涉及一种基于隐私保护的联邦学习、虚拟对象分配方法和装置。
技术介绍
随着互联网及计算机技术的发展,能够为用户提供产品或服务的网络应用(Application,APP)越来越多,例如,能够为用户提供阅读服务的在线读书APP,可供用户听音乐的在线音乐APP,能够供用户休闲娱乐的游戏APP,以及可供用户购物的电商APP,等等。这些网络应用为用户提供的产品或服务往往是收费的(如用户需要充值或支付才能获取),且常常通过第三方支付平台来收款。对于这些网络应用来说,能够获得更高的成交总额(GrossMerchandiseVolume,GMV),为更多的用户提供有偿产品或服务,是其始终追求的目标。对于第三方支付平台来说,能有更多的用户选择自己进行支付扩大自己的市场份额,也是其一直努力的方向。支付成功率是影响GMA的关键因素,因此提升支付成功率对这些网络应用来说很重要。同时,对第三方支付平台来说,帮助这些网络应用提升支付成功率也很重要,这不仅可以帮助网络应用公司提高收益,还可以让网络应用公司将自身作为首推的收款工具,扩大自己的市场份额,达到双赢的目的。对于这类收费的网络应用而言,用户的犹豫程度往往较高,而支付意向参数往往较低,支付成功率也相对较低。为了提升用户使用第三方支付平台向这类网络应用付款的成功率,第三方支付应用和网络应用会根据预先训练好的虚拟对象分配模型,向用户发放一些有价值的虚拟对象,如优惠券、红包、话费、充值券以及虚拟能量等,以吸引用户进行支付。但是,由于第三方支付平台和网络应用的预算有限,无法对所有用户都发放有价值的虚拟对象。因此,如何将有价值的虚拟对象分配给合适的用户显得尤为重要。
技术实现思路
本说明书实施例提供了一种基于隐私保护的基于隐私保护的联邦学习、虚拟对象分配方法和装置,以将虚拟对象分配给合适的用户。为解决上述技术问题,本说明书实施例是这样实现的:第一方面,提出了一种基于隐私保护的联邦学习方法,包括:纵向联邦学习中的参与者设备基于本地用户样本对本地模型进行训练,得到本地模型参数并发送至协调者,其中,所述参与者设备包括第一设备和第二设备,所述第一设备是网络应用公司的设备,所述第二设备是第三方支付平台的设备,所述第一设备中的本地模型为第一模型,所述第二设备中的本地模型为第二模型;所述协调者对接收到的本地模型参数数进行整合,得到全局模型参数并发送至所述参与者设备,其中,所述本地模型参数包括第一模型参数和第二模型参数,所述第一模型参数是所述第一设备基于所述网络应用公司的本地用户样本对所述第一模型训练得到的,所述第二模型参数是所述第二设备基于所述第三方支付平台的本地用户样本对所述第二模型训练得到的,参与训练的所述网络应用公司的本地用户样本和所述第三方支付平台的本地用户样本是对齐的;所述参与者设备基于所述全局模型参数更新本地模型,并在不满足预设训练结束条件时,再次基于本地用户样本对更新后的本地模型进行训练;在满足预设训练结束条件时,所述协调者基于最后一次更新的本地模型确定预测模型,所述预测模型用于预测目标用户向所述网络应用公司付款的意向参数,所述意向参数用于确定是否向所述目标用户分配虚拟对象。第二方面,提出了一种基于隐私保护的联邦学习方法,应用于纵向联邦学习中的协调者,包括:接收参与者设备发送的本地模型参数,其中,所述参与者设备包括第一设备和第二设备,所述第一设备是网络应用公司的设备,所述第二设备是第三方支付平台的设备,所述第一设备的本地模型为第一模型,所述第二设备的本地模型为第二模型;对接收到的本地模型参数数进行整合,得到全局模型参数并发送至所述参与者设备,以使所述参与者设备更新本地模型,其中,所述本地模型参数包括第一模型参数和第二模型参数,所述第一模型参数是所述第一设备基于所述网络应用公司的本地用户样本对所述第一模型训练得到的,所述第二模型参数是所述第二设备基于所述第三方支付平台的本地用户样本对所述第二模型训练得到的,参与训练的所述网络应用公司的本地用户样本和所述第三方支付平台的本地用户样本是对齐的;在不满足预设训练结束条件时,再次接收纵向联邦学习中的参与者设备发送的本地模型参数;在满足预设训练结束条件时,基于最后一次更新的本地模型确定预测模型,所述预测模型用于预测目标用户向所述网络应用公司付款的意向参数,所述意向参数用于确定是否向所述目标用户分配虚拟对象。第三方面,提出了一种基于隐私保护的联邦学习方法,应用于第一设备,包括:基于网络应用公司的本地用户样本对第一模型进行训练,得到第一模型参数并发送至纵向联邦学习中的协调者,以使所述协调者对所述第一模型参数和第二模型参数进行整合得到全局模型参数,其中,所述第二模型参数是第二设备基于第三方支付平台的本地用户样本对第二模型进行训练得到的,参与训练的所述网络应用公司的本地用户样本和所述第三方支付平台的本地用户样本是对齐的;接收所述协调者发送的所述全局模型参数,并基于所述全局模型参数更新所述第一模型;在不满足预设训练结束条件时,再次基于网络应用公司的本地用户样本对更新后的第一模型进行训练;在满足预设训练结束条件时,将最后一次更新的第一模型发送至所述协调者,以使所述协调者将最后一次更新的第一模型和第二模型确定为预测模型,所述预测模型用于预测目标用户向所述网络应用公司付款的意向参数,所述意向参数用于确定是否向所述目标用户分配虚拟对象。第四方面,提出了一种基于隐私保护的联邦学习方法,应用于第二设备,包括:基于第三方支付平台的本地用户样本对第二模型进行训练,得到第二模型参数并发送至纵向联邦学习中的协调者,以使所述协调者对第一模型参数和所述第二模型参数进行整合得到全局模型参数,其中,所述第一模型参数是第一设备基于网络应用公司的本地用户样本对第一模型进行训练得到的,参与训练的所述网络应用公司的本地用户样本和所述第三方支付平台的本地用户样本是对齐的;接收所述协调者发送的所述全局模型参数,并基于所述全局模型参数更新所述第二模型;在不满足预设训练结束条件时,再次基于第三方支付平台的本地用户样本对更新后的第二模型进行训练;在满足预设训练结束条件时,将最后一次更新的第二模型发送至所述协调者,以使所述协调者将最后一次更新的第一模型和第二模型确定为预测模型,所述预测模型用于预测目标用户向所述网络应用公司付款的意向参数,所述意向参数用于确定是否向所述目标用户分配虚拟对象。第五方面,提出了一种虚拟对象分配方法,包括:当监测到目标用户在网络应用中发起支付行为时,调用纵向联邦学习中的参与者设备,以使所述参与者设备基于所述目标用户的本地特征数据和本地模型,预测所述目标用户向所述网络应用的公司付款的本地意向参数,其中,所述参与者设备包括第一设备和第二设备,所述第一设备是所述网络应用的公司的设备,所述第二设备是第三方支付平台的设备,所述第一设备中的本地模型本文档来自技高网
...

【技术保护点】
1.一种基于隐私保护的联邦学习方法,包括:/n纵向联邦学习中的参与者设备基于本地用户样本对本地模型进行训练,得到本地模型参数并发送至协调者,其中,所述参与者设备包括第一设备和第二设备,所述第一设备是网络应用公司的设备,所述第二设备是第三方支付平台的设备,所述第一设备中的本地模型为第一模型,所述第二设备中的本地模型为第二模型;/n所述协调者对接收到的本地模型参数数进行整合,得到全局模型参数并发送至所述参与者设备,其中,所述本地模型参数包括第一模型参数和第二模型参数,所述第一模型参数是所述第一设备基于所述网络应用公司的本地用户样本对所述第一模型训练得到的,所述第二模型参数是所述第二设备基于所述第三方支付平台的本地用户样本对所述第二模型训练得到的,参与训练的所述网络应用公司的本地用户样本和所述第三方支付平台的本地用户样本是对齐的;/n所述参与者设备基于所述全局模型参数更新本地模型,并在不满足预设训练结束条件时,再次基于本地用户样本对更新后的本地模型进行训练;/n在满足预设训练结束条件时,所述协调者基于最后一次更新的本地模型确定预测模型,所述预测模型用于预测目标用户向所述网络应用公司付款的意向参数,所述意向参数用于确定是否向所述目标用户分配虚拟对象。/n...

【技术特征摘要】
1.一种基于隐私保护的联邦学习方法,包括:
纵向联邦学习中的参与者设备基于本地用户样本对本地模型进行训练,得到本地模型参数并发送至协调者,其中,所述参与者设备包括第一设备和第二设备,所述第一设备是网络应用公司的设备,所述第二设备是第三方支付平台的设备,所述第一设备中的本地模型为第一模型,所述第二设备中的本地模型为第二模型;
所述协调者对接收到的本地模型参数数进行整合,得到全局模型参数并发送至所述参与者设备,其中,所述本地模型参数包括第一模型参数和第二模型参数,所述第一模型参数是所述第一设备基于所述网络应用公司的本地用户样本对所述第一模型训练得到的,所述第二模型参数是所述第二设备基于所述第三方支付平台的本地用户样本对所述第二模型训练得到的,参与训练的所述网络应用公司的本地用户样本和所述第三方支付平台的本地用户样本是对齐的;
所述参与者设备基于所述全局模型参数更新本地模型,并在不满足预设训练结束条件时,再次基于本地用户样本对更新后的本地模型进行训练;
在满足预设训练结束条件时,所述协调者基于最后一次更新的本地模型确定预测模型,所述预测模型用于预测目标用户向所述网络应用公司付款的意向参数,所述意向参数用于确定是否向所述目标用户分配虚拟对象。


2.根据权利要求1所述的方法,在纵向联邦学习中的参与者设备基于本地用户样本对本地模型进行训练之前,还包括:
所述协调者向所述参与者设备部署初始本地模型,其中,向所述第一设备部署的初始本地模型为初始第一模型,向所述第二的设备部署的初始本地模型为初始第二模型。


3.根据权利要求1所述的方法,在纵向联邦学习中的参与者设备基于本地用户样本对本地模型进行训练之前,还包括:
所述协调者基于预设加密样本对齐技术,对参与纵向联邦学习的所述网络应用公司的本地用户样本和所述第三方支付平台的本地用户样本进行对齐。


4.根据权利要求3所述的方法,其中,基于预设加密用户对齐技术,对参与纵向联邦学习的所述网络应用公司的本地用户样本和所述第三方支付平台的本地用户样本进行对齐,包括:
基于预设对称加密算法生成第一秘钥对,并将所述第一秘钥对中的公钥发送至所述第一设备和所述第二设备;
接收所述第一设备发送的第一加密用户ID列表和所述第二设备发送的第二加密用户ID列表,其中,所述第一加密用户ID列表是所述第一设备使用所述公钥对所述网络应用公司的本地用户ID列表加密后得到的,所述第二加密用户ID列表是所述第二设备使用所述公钥对所述第三方支付平台的本地用户ID列表加密后得到的;
基于所述第一秘钥对中的私钥,对所述第一加密用户ID列表和所述第二加密用户ID列表分别进行解密,得到第一用户ID列表和第二用户ID列表;
确定所述第一用户ID列表和所述第二用户ID列表中相同的用户ID,得到第三用户ID列表;
将所述第三用户ID列表分别发送至所述第一设备和所述第二设备,以使所述第一设备和所述第二设备分别基于所述第三用户ID列表中的用户ID对应的本地用户样本进行训练。


5.根据权利要求4所述的方法,
所述预设对称加密算法为RSA加密算法。


6.根据权利要求3-5任一项所述的方法,在纵向联邦学习中的参与者设备基于本地用户样本对本地模型进行训练之前,还包括:
所述第一设备代表所述网络应用公司清洗出预设时段内所述第三用户ID列表中的用户在所述网络应用中形成的特征和标签,以作为所述第一设备训练第一模型时采用的本地用户样本和标签;
所述第二设备代表所述第三方支付平台清洗出所述预设时段内所述第三用户ID列表中的用户在所述第三方支付平台中形成的特征,以作为所述第二设备训练第二模型时采用的本地用户样本。


7.根据权利要求6所述的方法,
所述第一设备代表所述网络应用公司清洗出的特征包括支付行为特征,及标签包括支付是否成功;
所述第二设备代表所述第三方支付平台清洗出的特征包括基础特征和支付特征,其中,所述基础特征包括性别、年龄、所在城市和职业,所述支付特征包括支付频次、单次最大支付金额、单次最小支付金额、所支付的订单类型和支付成功率。


8.根据权利要求1所述的方法,所述参与者设备向所述协调者发送的本地模型参数为加密模型参数,在所述参与者设备将本地模型参数并发送至所述协调者之前,还包括:
所述协调者向所述参与者设备发送第二秘钥对中的公钥;
所述参与者设备之间使用所述公钥对本地训练过程中产生的中间结果进行加密并交互,其中,加密后的中间结果用于所述参与者设备确定所述本地模型参数。


9.根据权利要求8所述的方法,其中,所述参与者设备之间使用所述公钥对本地训练过程中产生的中间结果进行加密并交互,包括:
所述第一设备使用所述公钥对本地训练过程中产生的中间结果进行加密,得到第一加密中间结果并发送至所述第二设备,所述第一加密中间结果用于所述第二设备确定所述第二模型参数;
所述第二设备使用所述公钥对本地训练过程中产生的中间结果进行加密,得到第二加密中间结果并发送至所述第一设备,所述第二加密中间结果用于所述第一设备确定所述第一模型参数。


10.根据权利要求9所述的方法,
所述第一加密中间结果为使用所述公钥加密的所述第一模型在本次训练中针对用户样本的预测值,所述第一加密中间结果用于所述第二设备确定用户样本对应的残差,该残差用于所述第二设备确定所述第二模型参数,且所述第二模型参数为加密梯度;
所述第二加密中间结果为使用所述公钥加密的所述第二模型在本次训练中针对用户样本的预测值,所述第二加密中间结果用于所述第一设备确定用户样本对应的残差,该残差用于所述第一设备确定所述第一模型参数,且所述第一模型参数为加密梯度。


11.根据权利要求8-10任一项所述的方法,其中,所述协调者对所述本地模型参数进行整合,得到全局模型参数,包括:
所述协调者使用所述第二秘钥对中的私钥对所述第一模型参数进行解密,得到针对所述第一模型的第一解密参数;
所述协调者使用所述第二秘钥对中的私钥对所述第二模型参数进行解密,得到针对所述第二模型的第二解密参数;
将所述第一解密参数和所述第二解密参数组合为所述全局模型参数。


12.根据权利要求11所述的方法,其中,所述参与者设备基于所述全局模型参数更新本地模型,包括:
所述第一设备基于所述全局模型参数中的所述第一解密参数更新所述第一模型;
所述第二设备基于所述全局模型参数中的所述第二解密参数更新所述第二模型。


13.根据权利要求1所述的方法,其中,所述协调者基于最后一次更新的本地模型确定预测模型,包括:
所述协调者将最后一次更新的第一模型和第二模型,确定为预测模型。


14.根据权利要求1所述的方法,其中,
所述预设训练结束条件包括下述至少一种:
训练次数达到预设次数;
所述本地模型的损失函数收敛。


15.一种基于隐私保护的联邦学习方法,应用于纵向联邦学习中的协调者,包括:
接收参与者设备发送的本地模型参数,其中,所述参与者设备包括第一设备和第二设备,所述第一设备是网络应用公司的设备,所述第二设备是第三方支付平台的设备,所述第一设备的本地模型为第一模型,所述第二设备的本地模型为第二模型;
对接收到的本地模型参数数进行整合,得到全局模型参数并发送至所述参与者设备,以使所述参与者设备更新本地模型,其中,所述本地模型参数包括第一模型参数和第二模型参数,所述第一模型参数是所述第一设备基于所述网络应用公司的本地用户样本对所述第一模型训练得到的,所述第二模型参数是所述第二设备基于所述第三方支付平台的本地用户样本对所述第二模型训练得到的,参与训练的所述网络应用公司的本地用户样本和所述第三方支付平台的本地用户样本是对齐的;
在不满足预设训练结束条件时,再次接收纵向联邦学习中的参与者设备发送的本地模型参数;
在满足预设训练结束条件时,基于最后一次更新的本地模型确定预测模型,所述预测模型用于预测目标用户向所述网络应用公司付款的意向参数,所述意向参数用于确定是否向所述目标用户分配虚拟对象。


16.一种基于隐私保护的联邦学习方法,应用于第一设备,包括:
基于网络应用公司的本地用户样本对第一模型进行训练,得到第一模型参数并发送至纵向联邦学习中的协调者,以使所述协调者对所述第一模型参数和第二模型参数进行整合得到全局模型参数,其中,所述第二模型参数是第二设备基于第三方支付平台的本地用户样本对第二模型进行训练得到的,参与训练的所述网络应用公司的本地用户样本和所述第三方支付平台的本地用户样本是对齐的;
接收所述协调者发送的所述全局模型参数,并基于所述全局模型参数更新所述第一模型;
在不满足预设训练结束条件时,再次基于网络应用公司的本地用户样本对更新后的第一模型进行训练;
在满足预设训练结束条件时,将最后一次更新的第一模型发送至所述协调者,以使所述协调者将最后一次更新的第一模型和第二模型确定为预测模型,所述预测模型用于预测目标用户向所述网络应用公司付款的意向参数,所述意向参数用于确定是否向所述目标用户分配虚拟对象。


17.一种基于隐私保护的联邦学习方法,应用于第二设备,包括:
基于第三方支付平台的本地用户样本对第二模型进行训练,得到第二模型参数并发送至纵向联邦学习中的协调者,以使所述协调者对第一模型参数和所述第二模型参数进行整合得到全局模型参数,其中,所述第一模型参数是第一设备基于网络应用公司的本地用户样本对第一模型进行训练得到的,参与训练的所述网络应用公司的本地用户样本和所述第三方支付平台的本地用户样本是对齐的;
接收所述协调者发送的所述全局模型参数,并基于所述全局模型参数更新所述第二模型;
在不满足预设训练结束条件时,再次基于第三方支付平台的本地用户样本对更新后的第二模型进行训练;
在满足预设训练结束条件时,将最后一次更新的第二模型发送至所述协调者,以使所述协调者将最后一次更新的第一模型和第二模型确定为预测模型,所述预测模型用于预测目标用户向所述网络应用公司付款的意向参数,所述意向参数用于确定是否向所述目标用户分配虚拟对象。


18.一种虚拟对象分配方法,包括:
当监测到目标用户在网络应用中发起支付行为时,调用纵向联邦学习中的参与者设备,以使所述参与者设备基于所述目标用户的本地特征数据和本地模型,预测所述目标用户向所述网络应用的公司付款的本地意向参数,其中,所述参与者设备包括第一设备和第二设备,所述第一设备是所述网络应用的公司的设备,所述第二设备是第三方支付平台的设备,所述第一设备中的本地模型为第一模型,所述第二设备中的本地模型为第二模型,所述第一模型和所述第二模型是基于权利要求1-14所述的联邦学习方法训练得到的预测模型;
接收所述参与者设备发送的本地意向参数并整合得到全局意向参数,其中,所述本地意向参数包括第一意向参数和第二意向参数,所述第一意向参数是所述第一设备基于所述目标用户在所述网络应用中形成的特征数据和所述第一模型预测得到的,所述第二意向参数是所述第二设备基于所述目标用户在所述第三方支付平台中形成的特征数据和所述第二模型预测得到的;
基于所述全局意向参数,确定是...

【专利技术属性】
技术研发人员:杨哲
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1