System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种信息年龄敏感的联邦学习客户端选择方法技术_技高网

一种信息年龄敏感的联邦学习客户端选择方法技术

技术编号:44291664 阅读:8 留言:0更新日期:2025-02-14 22:25
本发明专利技术属于机器学习技术领域,公开了一种信息年龄敏感的联邦学习客户端选择方法,包括联邦学习系统,联邦学习系统包括以下步骤:S01:服务器将上一轮训练得到的全局模型发送给所有客户端,并选择在这一轮中需要收集新鲜数据的客户端子集,并支付给他们相应的报酬;S02:客户端进行本地模型的训练,在服务器发送的全局模型的基础上,通过随机梯度下降法训练本地模型,然后将得到的模型上传给服务器;S03:服务器在收集到所有客户端的本地模型后,对它们进行加权聚合得到这一轮的全局模型,并将其发还给每个客户端以进行下一轮的训练;该方法有效地通过选择方法提高了训练得到的模型的时效性,且保证了不超过预算限制。

【技术实现步骤摘要】

本专利技术属于机器学习,具体地涉及一种信息年龄敏感的联邦学习客户端选择方法


技术介绍

1、联邦学习是近年来新兴的一种分布式机器学习范式,它可以在客户端不上传其本地数据的情况下,让众多客户端协同训练,从而获得性能良好的机器学习模型。在大多数现有的联邦学习研究中,每个客户端都被假定预先拥有一个数据集,并在每一轮的学习过程中始终使用相同的数据集来训练其本地模型。然而,在数据驱动的联邦学习场景中,客户端需要去特定的地点收集数据来构建其用于模型训练的本地数据集。数据驱动且信息年龄敏感的联邦学习系统可以应用于多种场景,包括但不限于金融市场分析、网络安全、智能交通系统和智慧城市等。这些地点的数据会随着时间的推移不断产生,数据的分布可能会随时间发生偏移。在这种情况下,如果客户端一直使用陈旧的数据集进行训练,可能会导致得到的模型无法泛化到最新的数据上。因而,服务器希望客户端们使用尽可能新鲜的数据集来参与联邦学习的训练。

2、在客户端收集数据的过程中,客户端们将不可避免地花费一些额外的成本,例如数据收集设备的设备维护和管理成本等,而且收集的数据集越新鲜,所要求付出的成本一般来说也会越高。在数据驱动的联邦学习场景中,客户端的数量是非常庞大的,而服务器的预算通常是有限的,不可能在每一轮的联邦学习中让所有的客户端都去收集新鲜的数据。但是,如果为了节约预算而只让少部分的客户端去收集新鲜数据,就会导致大部分参与联邦学习的客户端都是使用陈旧的数据集进行训练,从而使得到的模型的表现较差。同时,每一轮如何选择需要收集新鲜数据的客户端都会影响之后轮次的客户端的选择,这是因为客户端数据集的信息年龄会随着联邦学习的进行而增加,直到它被服务器选中去收集新鲜的数据。以上问题都为数据驱动且信息年龄敏感的联邦学习系统带来了极大的挑战。

3、因此,如何在预算有限的情况下设计客户端选择算法来最大化全局模型的效用对于考虑数据新鲜度的联邦学习系统至关重要。


技术实现思路

1、针对上述存在的技术问题,本专利技术目的是:提供了一种信息年龄敏感的联邦学习客户端选择方法,该方法有效地通过选择方法提高了训练得到的模型的时效性,且保证了不超过预算限制。

2、本专利技术的技术方案是:

3、一种信息年龄敏感的联邦学习客户端选择方法,包括联邦学习系统,所述联邦学习系统包括两个组成部分:服务器和客户端,考虑数据新鲜度的情况下进行联邦学习,且引入信息年龄指标来衡量数据新鲜度,数据的信息年龄是来自客户端收集此数据以来经过的时间;

4、联邦学习系统包括以下步骤:

5、s01:服务器将上一轮训练得到的全局模型发送给所有客户端,并选择在这一轮中需要收集新鲜数据的客户端子集,并支付给他们相应的报酬;

6、s02:客户端进行本地模型的训练,在服务器发送的全局模型的基础上,通过随机梯度下降法训练本地模型,然后将得到的模型上传给服务器;

7、s03:服务器在收集到所有客户端的本地模型后,对它们进行加权聚合得到这一轮的全局模型,并将其发还给每个客户端以进行下一轮的训练。

8、优选的,客户端i在第t轮的本地数据集最近一次更新的轮数为,那么其信息年龄即为当前轮数和该轮数的差值,即,如果每一轮客户端被服务器选中,则该客户端的信息年龄变为0,否则信息年龄加1。

9、优选的,每一轮服务器选择客户端更新数据的总预算有限,且只能选择部分客户端,令表示服务器选择客户端的策略;系统优化目标定义为如下问题p1:

10、

11、其中,表示t轮之后的全局模型,表示最优的全局损失,表示在第t轮中是否选择客户端i,如果是则为1,否则为0,下一个约束条件示客户端信息年龄的动态变化,最后一个约束条件是预算限制。

12、优选的,每一轮中服务器根据客户端的信息年龄等参数计算惠特尔指数,并根据这个指数选择客户端。

13、优选的,客户端的惠特尔指数计算公式如下:

14、

15、其中为系统参数。

16、优选的,所述步骤s02中,客户端使用小批量随机梯度下降法进行本地模型的更新,公式如下:

17、

18、其中,是在执行第𝑘步小批量随机梯度下降法时从采样的数据,是第t轮中的学习率,是客户端i在第t轮中的损失函数。同时,为服务器发送的上一轮的全局模型,为客户端i在第t轮完成训练得到的本地模型。

19、优选的,所述步骤s03中,服务器将接收到的所有客户端的本地模型进行加权聚合,公式如下:

20、

21、其中为客户端i本地数据集的大小,n为所有客户端本地数据集大小之和。

22、与现有技术相比,本专利技术的优点是:

23、(1)本专利技术提供了一种信息年龄敏感的联邦学习客户端选择方法,通过每轮选择合适的客户端更新其本地数据集来保证本地训练模型的时效性,它不仅能够同时保证服务器每一轮支付给被选中客户端报酬不超过预算,还能尽可能满足服务器对于客户端本地数据新鲜度的要求,得到时效性更高更适用当前数据分布的全局模型。

24、(2) 基于强化学习理论,将客户端选择问题建模为具有约束条件的动态多臂赌博机模型,每个客户端对应一个动态摇臂,服务器选择一个客户端对应摇下相应的摇臂,通过拉格朗日对偶法和马尔可夫决策过程理论对问题进行求解,得到惠特尔指数的公式,并基于此设计了客户端选择方法。同时,本专利技术考虑了客户端本地数据集的时效性,能够更加契合实际应用。

本文档来自技高网...

【技术保护点】

1.一种信息年龄敏感的联邦学习客户端选择方法,其特征在于,包括联邦学习系统,所述联邦学习系统包括两个组成部分:服务器和客户端,考虑数据新鲜度的情况下进行联邦学习,且引入信息年龄指标来衡量数据新鲜度,数据的信息年龄是来自客户端收集此数据以来经过的时间;

2.根据权利要求1所述的信息年龄敏感的联邦学习客户端选择方法,其特征在于,客户端i在第t轮的本地数据集最近一次更新的轮数为,那么其信息年龄即为当前轮数和该轮数的差值,即,如果每一轮客户端被服务器选中,则该客户端的信息年龄变为0,否则信息年龄加1。

3.根据权利要求1所述的信息年龄敏感的联邦学习客户端选择方法,其特征在于,每一轮服务器选择客户端更新数据的总预算有限,且只能选择部分客户端,令表示服务器选择客户端的策略;系统优化目标定义为如下问题P1:

4.根据权利要求1所述的信息年龄敏感的联邦学习客户端选择方法,其特征在于,每一轮中服务器根据客户端的信息年龄等参数计算惠特尔指数,并根据这个指数选择客户端。

5.根据权利要求4所述的信息年龄敏感的联邦学习客户端选择方法,其特征在于,客户端的惠特尔指数计算公式如下:

6.根据权利要求1所述的信息年龄敏感的联邦学习客户端选择方法,其特征在于,所述步骤S02中,客户端使用小批量随机梯度下降法进行本地模型的更新,公式如下:

7.根据权利要求1所述的信息年龄敏感的联邦学习客户端选择方法,其特征在于,

...

【技术特征摘要】

1.一种信息年龄敏感的联邦学习客户端选择方法,其特征在于,包括联邦学习系统,所述联邦学习系统包括两个组成部分:服务器和客户端,考虑数据新鲜度的情况下进行联邦学习,且引入信息年龄指标来衡量数据新鲜度,数据的信息年龄是来自客户端收集此数据以来经过的时间;

2.根据权利要求1所述的信息年龄敏感的联邦学习客户端选择方法,其特征在于,客户端i在第t轮的本地数据集最近一次更新的轮数为,那么其信息年龄即为当前轮数和该轮数的差值,即,如果每一轮客户端被服务器选中,则该客户端的信息年龄变为0,否则信息年龄加1。

3.根据权利要求1所述的信息年龄敏感的联邦学习客户端选择方法,其特征在于,每一轮服务器选择客户端更新数据的总预算...

【专利技术属性】
技术研发人员:徐殷肖明军吴晨
申请(专利权)人:中国科学技术大学苏州高等研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1