一种特定指标下的联邦学习激励方法技术

技术编号：33045665 阅读：24 留言：0更新日期：2022-04-15 09:29

本发明专利技术提供了一种特定指标下的两阶段联邦学习激励方法，包括如下步骤：接受平台服务器发布的平台模型精度提升任务指标；根据平台服务器发布的模型精度提升目标制定学习策略；基于上述学习策略训练获取平台服务器的总奖励额；获得平台服务器基于对平台模型精度值提升贡献占比分配的奖励额。本发明专利技术提出的一种在特定模型精度指标下的两阶段联邦学习激励机制，可以更加同实际相结合，降低了不必要的成本浪费，而且从数据质量与数据数量的角度设计的激励机制更加全面、科学，系统性地提高了联邦学习的训练效率。邦学习的训练效率。邦学习的训练效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种特定指标下的联邦学习激励方法

[0001]本专利技术提供一种特定指标下的联邦学习激励方法，属于分布式机器学习领域，具体提供了一种特定指标下的联邦学习激励方法。

技术介绍

[0002]随着机器学习技术的不断发展，数据安全已经成为一个不可避免的问题，而联合学习作为一种新的分布式机器学习模型可以很好地解决数据隐私问题。基本的联合学习模型解决了数据隐私问题，但像人群感知、这样的技术还存在另一个问题，即数据岛和平台服务器之间的协作变得低效。因此，设计适当的激励机制，使每个参与者和社会的利益最大化，是普遍的做法。
[0003]联邦学习激励机制的主要研究方向有Stackelberg博弈、拍卖、契约理论、Shapley值、强化学习、区块链等。其中，Stackelberg博弈可以很好地构建联合学习各相关主体之间的关系，即平台服务器与数据岛之间的关系描述为主从博弈之间的关系。然而，目前的研究主要集中在理论上构建的指标不确定条件下的复杂激励机制。但在现实中，训练模型的精度可能只满足具体指标的要求。即出现未结合现实情况，仅以得出理论最优解为目的，而忽略了实际操作过程中的模型精度冗余问题，可能会导致成本增加问题；未有效将数据质量和数据数量作为激励机制的依据。

技术实现思路

[0004]鉴于上述问题，本专利技术提供了一种特定指标下的联邦学习激励方法，适用于平台服务器与多个数据孤岛间协作，包括如下步骤，
[0005]S1：接受平台服务器发布的平台模型精度提升任务指标；
[0006]S2：根据平台服务器发...

【技术保护点】

【技术特征摘要】
1.一种特定指标下的联邦学习激励方法，适用于平台服务器与多个数据孤岛间协作，其特征在于：包括如下步骤，S1：接受平台服务器发布的平台模型精度提升任务指标；S2：根据平台服务器发布的模型精度提升目标制定学习策略；S3：基于上述学习策略训练获取平台服务器的总奖励额；S4：获得平台服务器基于对平台模型精度值提升贡献占比分配的奖励额。2.如权利要求1所述的一种特定指标下的联邦学习激励方法，其特征在于：步骤S2中，数据孤岛基于自身效用最大化制定学习策略，具体步骤如下，1)建立数据孤岛的效用模型：U
i
＝R
i
‑
C
i
，i∈(1，...，N)，
ꢀꢀꢀꢀ
(1)设定C
i
＝v
i
a
i
+μ
i
q
i
，Δθ
i
＝σlog
κ
(q
i a
i
)；其中，U
i
为数据孤岛i的效用，R
i
表示数据孤岛i获得的奖励，C
i
表示数据孤岛i的训练成本，Δθ
i
表示数据孤岛i对模型训练精度的提升值，a
i
为数据数量，q
i
为数据质量，v
i
为数据孤岛i的数据计算、存储成本综合参数，μ
i
为数据孤岛i的数据处理成本参数，κ＞1为训练参数，σ为精度参数；2)基于数据孤岛效用最大化，针对上述效用模型建立目标函数：其中，数据孤岛i的决策变量为其参与训练的数据集数...

【专利技术属性】
技术研发人员：王丽霞，王大维，王南，高强，刘晓强，教传铭，曲睿婷，胡非，张福良，张戈，
申请(专利权)人：国家电网有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人