一种个性化聚合的联邦学习方法技术

技术编号：39289772 阅读：14 留言：0更新日期：2023-11-07 10:58

本发明专利技术公开了一种个性化聚合的联邦学习方法，包括：1）平台侧构造拥有IID数据集的虚拟客户端；2）平台侧初始化全局模型参数；3）平台侧将全局模型参数发送至各客户端及虚拟客户端；4）各客户端及虚拟客户端进行本地训练，此过程确保数据不出本地，训练完成后将更新后的模型参数发送至平台；5）平台接收来自各客户端及虚拟客户端的模型参数，聚合时个性化地为虚拟客户端分配权重，剩余的数个客户端再正常聚合；6）重复所述步骤3至步骤5，直至全局模型收敛。本发明专利技术提出的个性化聚合的联邦学习方法，通过虚拟客户端保留IID数据，在聚合时虚拟客户端个性化参与聚合，可以在保证平台侧不共享数据的前提下，提高模型在Non

全部详细技术资料下载

【技术实现步骤摘要】
一种个性化聚合的联邦学习方法

[0001]本专利技术涉及一种个性化聚合的联邦学习方法，属于信息安全领域。

技术介绍

[0002]在信息安全领域，联邦学习在过去的几年中发展迅速，作为一种范式，可以在数据不出本地的前提下，完成一些需要联合执行的任务，从而有效保护各方的数据隐私。
[0003]但在实际应用中，仍然存在一些问题，比如大多数企业的数据规模有限、数据质量参差不齐，也就是数据非独立同分布Non
‑
IID问题，会降低联合模型的泛化能力。为了解决Non
‑
IID问题，可以共享一些数据集，从而提高各客户端的数据质量，如FedShare模型。
[0004]在实际应用场景下，多客户端共同完成一个训练任务，此时担任平台角色的也是其中一个客户端，但平台上的数据也是本地的，如果直接共享给其他客户端，会更容易受到恶意攻击，无法保护自己的数据安全。

技术实现思路

[0005]针对联邦学习中的Non
‑
IID数据导致的泛化能力弱的问题，本专利技术的目的是提出一种个性化聚合的联邦学习方法，通过虚拟客户端保留IID数据，在聚合时虚拟客户端个性化参与聚合，可以在保证平台侧不共享数据的前提下，提高模型在Non
‑
IID场景下的精度。
[0006]实现本专利技术目的的具体技术方案是：
[0007]一种个性化聚合的联邦学习方法，该方法包括以下具体步骤：
[0008]1)平台侧构造拥有IID数据集的虚拟客户端；
[0...

【技术保护点】

【技术特征摘要】
1.一种个性化聚合的联邦学习方法，其特征在于，该方法包括以下具体步骤：1)平台侧构造拥有IID数据集的虚拟客户端；2)平台侧初始化全局模型参数；3)平台侧将全局模型参数发送至各客户端及虚拟客户端；4)各客户端及虚拟客户端进行本地训练；5)平台接收来自各客户端及虚拟客户端的模型参数，聚合时个性化地为虚拟客户端分配权重，剩余的数个客户端再正常聚合；6)重复所述步骤3)至步骤5)，直至全局模型收敛。2.根据权利要求1所述的一种个性化聚合的联邦学习方法，其特征在于，所述平台侧构造拥有IID数据集的虚拟客户端，具体包括，平台侧构造一个虚拟客户端，该虚拟客户端将IID数据集作为本地数据，该数据集保留在平台，不会被共享；该虚拟客户端搭建本地模型，能够接收来自平台的全局模型参数；该虚拟客户端经过本地训练后，将训练后的本地模型参数传回给平台侧。3.根据权利要求1所述的个性化聚合的联邦学习方法，其特征在于，所述各客户端及虚拟客户端进行本地训练，具体包括，其中各客户端上拥有自己的数据集，这些数据...

【专利技术属性】
技术研发人员：何道敬，朱珊珊，杜润萌，张民，
申请(专利权)人：上海境山科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人