一种半异步联邦学习方法及系统技术方案

技术编号：35072377 阅读：14 留言：0更新日期：2022-09-28 11:35

本发明专利技术涉及人工智能数据挖掘分类以及安全人工智能技术领域，提供了一种半异步联邦学习方法及系统，包括：在某一轮次开始时，选择若干个客户端参与当前轮次的训练，为每个客户端分配学习率，并将当前轮次的服务器模型和时间戳发送给选择的客户端，以使选择的客户端采用本地数据集对服务器模型进行优化，得到客户端模型并返回；周期性地对某一轮次客户端返回的客户端模型进行分组后，依次进行组内聚合和组间聚合，对服务器模型进行更新，得到下一轮次的服务器模型。有效地解决了现有异步联邦学习算法存在的通信瓶颈的问题，并实现了众包工人的隐私保护。的隐私保护。的隐私保护。

全部详细技术资料下载

【技术实现步骤摘要】
一种半异步联邦学习方法及系统

[0001]本专利技术属于人工智能数据挖掘分类以及安全人工智能
，尤其涉及一种半异步联邦学习方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息，不必然构成在先技术。
[0003]众包是一种流行且相对经济的计算范式，旨在利用人的智慧来解决计算机难以处理的问题，例如，实体对齐和文本情感分析。然而，现在大多数的众包平台需要利用工人的隐私信息来进行任务的分配和执行，这可能会导致工人隐私信息的严重泄露，进而阻碍众包项目的实施和普及。由于联邦学习在保护数据隐私安全上的有效性，提出了使用联邦学习技术来实现众包工人的隐私保护，并称之为联邦众包，在联邦众包中，众包工人将收集到的数据保留在本地并使用本地设备进行模型训练，然后众包服务器将训练好的客户端模型进行聚合得到共享的服务器模型，从而实现隐私保护并且保证众包项目高质量完成。
[0004]但是，由于工人所持的设备在计算能力、网络资源以及数据量上的差异性，所以各个工人的设备完成模型训练并上传的时间也大相径庭，并且各个客户端因为所处环境不同导致数据分布具有非独立同分布(Non
‑
i.i.d.)的特性，如何在这种客户端设备和数据方面多异构场景下实现高效、稳定且有效的模型协同训练是当前将联邦学习应用到众包中亟待解决的难点。
[0005]目前，针对客户端设备响应时间差距较大的问题的解决方法有：采用完全异步的通信模式，即客户端完成训练之后就立即对服务器模型进行更新而无需等待其他速度...

【技术保护点】

【技术特征摘要】
1.一种半异步联邦学习方法，其特征在于，包括：在某一轮次开始时，选择若干个客户端参与当前轮次的训练，为每个客户端分配学习率，并将当前轮次的服务器模型和时间戳发送给选择的客户端，以使选择的客户端采用本地数据集对服务器模型进行优化，得到客户端模型并返回；周期性地对某一轮次客户端返回的客户端模型进行分组后，依次进行组内聚合和组间聚合，对服务器模型进行更新，得到下一轮次的服务器模型。2.如权利要求1所述的一种半异步联邦学习方法，其特征在于，根据每个客户端的平均训练时间，为每个客户端分配学习率。3.如权利要求1所述的一种半异步联邦学习方法，其特征在于，所述客户端对服务器模型进行优化时，通过添加正则约束项的损失函数以及分配的学习率，使用梯度下降算法进行优化。4.如权利要求1所述的一种半异步联邦学习方法，其特征在于，将在同一轮次接收到服务器模型的客户端分为一组。5.如权利要求1所述的一种半异步联邦学习方法，其特征在于，所述组内聚合表示为：其中，是第i组中的客户端c返回的客户端模型，为第t轮次第i组的组模型，表示客户端c的本地数据集中的样本数目，表示在第i轮次接收到服务器模型并在第t轮次中将客户端模型返回的客户端集合。6.如权利要求1所述的一种半异步联邦学习方法，其特征在于，所述组间聚合表示为：其中，α是超参数，表示客户端c的本地数据集中的样本数目，表示在第i轮次接...

【专利技术属性】
技术研发人员：余国先，康祥平，王峻，郭伟，崔立真，
申请(专利权)人：山东大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人