联邦学习系统中共享数据的方法、装置、设备及介质制造方法及图纸

技术编号：31607742 阅读：50 留言：0更新日期：2021-12-29 18:34

本申请提供了一种联邦学习系统中共享数据的方法，其中，联邦学习系统包括第一设备和至少一个第二设备，该方法包括：第一设备获取至少一个第二设备的反馈信息，然后第一设备根据至少一个第二设备的反馈信息更新至少一个第二设备的训练数据。如此考虑了第二设备的差异，采用差异化方式下发共享数据，使得第二设备能够根据更新后的训练数据进行针对性训练，提高了模型预测精度和模型训练效率。提高了模型预测精度和模型训练效率。提高了模型预测精度和模型训练效率。

全部详细技术资料下载

【技术实现步骤摘要】
联邦学习系统中共享数据的方法、装置、设备及介质

[0001]本申请涉及人工智能(artificial intelligence，AI)领域，尤其涉及一种联邦学习系统中共享数据的方法、装置、设备以及计算机可读存储介质。

技术介绍

[0002]联邦学习(federated learning，FL)是为了解决机器学习中存在的数据孤岛以及隐私保护问题而提出的一种新算法。该算法提供了一种联邦学习系统。联邦学习系统通常包括中心设备以及边缘设备。每个边缘设备持有自己的数据集，边缘设备之间的数据集互相隔离。各个边缘设备使用自己的数据集进行模型训练，并将梯度上传至中心设备，中心设备聚合各个边缘设备的梯度进行模型更新并将更新后的模型重新下发至各个边缘设备。
[0003]现有机器学习任务一般默认数据遵循独立同分布的假设。在联邦学习中，不同边缘设备之间的数据极有可能不满足该假设。为了解决联邦学习中数据分布影响联邦学习效果的问题，业界提出了一些共享数据的方法。具体地，在训练初始阶段，对参与联邦学习的每个边缘设备，从共享数据集中随机采样部分数据，分发给各个边缘设备。边缘设备基于共享数据与私有数据，进行模型训练。
[0004]然而，基于上述方法训练所得模型的预测精度以及模型训练效率仍然难以满足业务需求。

技术实现思路

[0005]本申请提供了一种联邦学习系统中共享数据的方法，该方法根据至少一个第二设备的反馈信息针对性地更新至少一个第二设备的训练数据，基于更新后的训练数据进行模型训练可以提高模型训练效率以及模型预测精...

【技术保护点】

【技术特征摘要】
1.一种联邦学习系统中共享数据的方法，其特征在于，所述联邦学习系统包括第一设备和至少一个第二设备，所述方法包括：所述第一设备获取所述至少一个第二设备的反馈信息；所述第一设备根据所述至少一个第二设备的反馈信息更新所述至少一个第二设备的训练数据。2.根据权利要求1所述的方法，其特征在于，所述第一设备根据所述至少一个第二设备的反馈信息更新所述至少一个第二设备的训练数据，包括：所述第一设备根据所述至少一个第二设备的目标数据更新所述至少一个第二设备的训练数据，所述至少一个第二设备的目标数据为所述第一设备的共享数据集中与所述至少一个第二设备的反馈信息匹配的数据。3.根据权利要求1或2所述的方法，其特征在于，所述第一设备根据所述至少一个第二设备的反馈信息更新所述至少一个第二设备的训练数据，包括：所述至少一个第二设备的反馈信息满足预设条件时，所述第一设备根据所述至少一个第二设备的反馈信息更新所述至少一个第二设备的训练数据。4.根据权利要求1至3任一项所述的方法，其特征在于，所述反馈信息包括所述第二设备的配置信息或所述第二设备训练的模型的属性信息。5.根据权利要求4所述的方法，其特征在于，所述模型的属性信息包括模型构建参数；所述第一设备根据所述至少一个第二设备的反馈信息更新所述至少一个第二设备的训练数据，包括：所述第一设备根据所述模型构建参数构建所述至少一个第二设备训练的模型对应的模型副本；所述第一设备通过所述模型副本对共享数据集中的样本数据进行预测，获得预测错误的样本数据；所述第一设备根据预测错误的样本数据更新所述至少一个第二设备的训练数据。6.根据权利要求4或5所述的方法，其特征在于，所述配置信息包括算力、通信状态、存储容量、空闲状态中的一种或多种，所述模型的属性信息包括模型性能和模型精度中的一种或多种；所述第一设备根据所述至少一个第二设备的反馈信息更新所述至少一个第二设备的训练数据，包括：所述第一设备根据所述算力、所述通信状态、所述存储容量、所述空闲状态、所述模型性能和所述模型精度中的一种或多种确定所述至少一个第二设备对应的训练数据的数量；所述第一设备根据所述至少一个第二设备对应的训练数据的数量，更新所述至少一个第二设备的训练数据。7.根据权利要求1至6任一项所述的方法，其特征在于，所述第一设备根据所述至少一个第二设备的反馈信息更新所述至少一个第二设备的训练数据，包括：所述第一设备向所述至少一个第二设备发送第一标识，所述至少一个第二设备的训练数据在更新后包括所述至少一个第二设备根据所述第一标识获取的数据。8.根据权利要求1至7任一项所述的方法，其特征在于，所述第一设备记录有第二标识，
所述第二标识包括所述至少一个第二设备持有的数据的标识；所述第一设备根据所述至少一个第二设备的反馈信息更新所述至少一个第二设备的训练数据，包括：所述第一设备根据所述第二标识以及所述至少一个第二设备的反馈信息，通过增量更新方式更新所述至少一个第二设备的训练数据。9.一种联邦学习系统中共享数据的方法，其特征在于，所述联邦学习系统包括第一设备和至少一个第二设备，所述方法包括：所述至少一个第二设备生成所述至少一个第二设备的反馈信息；所述至少一个第二设备向所述第一设备发送所述反馈信息，所述反馈信息用于所述第一设备更新所述至少一个第二设备的训练数据。10.根据权利要求9所述的方法，其特征在于，所述方法还包括：所述至少一个第二设备接收所述第一设备发送的目标数据，所述目标数据为所述第一设备的共享数据集中与所述至少一个第二设备的反馈信息匹配的数据。11.根据权利要求9所述的方法，其特征在于，所述方法还包括：所述至少一个第二设备接收所述第一设备发送的目标数据的标识，所述目标数据为所述第一设备的共享数据集中与所述至少一个第二设备的反馈信息匹配的数据；所述至少一个第二设备根据所述目标数据的标识获取所述目标数据。12.根据权利要求10或11所述的方法，其特征...

【专利技术属性】
技术研发人员：宁伟康，廖振生，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人