基于梯度记忆的车联网联邦学习分层知识安全迁移方法技术

技术编号:33531615 阅读:16 留言:0更新日期:2022-05-19 02:03
本发明专利技术涉及一种基于梯度记忆的车联网联邦学习分层知识安全迁移方法,该方法包括以下步骤:步骤1:采用层次聚类算法对多个客户端进行聚类,获取多个独立同分布的集群,以实现将多个数据异质化的客户端合并为独立同分布的集群;步骤2:建立基于分层集群架构的车联网联邦学习模型;步骤3:采用基于梯度记忆的知识迁移联邦学习算法进行不同集群之间的知识迁移,以缓解分层集群架构中进行知识迁移的灾难性遗忘问题,与现有技术相比,本发明专利技术具有减轻灾难性遗忘的问题以及有效地提高模型收敛速度和模型精度等优点。和模型精度等优点。和模型精度等优点。

【技术实现步骤摘要】
基于梯度记忆的车联网联邦学习分层知识安全迁移方法


[0001]本专利技术涉及车联网联邦学习
,尤其是涉及一种基于梯度记忆的车联网联邦学习分层知识安全迁移方法。

技术介绍

[0002]随着数据量的不断增长、计算硬件性能的提高以及深度神经网络的发展,车联网、自动驾驶等近年来取得了长足的进步,大多数人工智能解决方案都是集中式的,用户将他们收集的所有数据传输到中央数据服务器或云端,但这会带来隐私问题、延迟和带宽限制,相比之下,分布式架构是一种更加隐私保护和高效的选择,联邦学习(FL)是一种新兴的分布式机器学习模式,它允许参与学习的各方在参数服务器的协调下进行合作训练,在FL中,本地客户端从中央参数服务器下载全局模型,再分别使用自己的数据集进行本地训练,然后将更新的模型参数而不是敏感的原始数据上传到服务器,中央服务器使用联邦学习等技术聚合这些模型权重参数,以获得更有效的全局机器学习模型,然后将聚合后的参数重新分发给本地客户端,用于下一次全局训练迭代.重复该过程直到全局模型达到收敛。
[0003]为了简化研究条件,通常会认为数据遵从独立同分布的假设,但是在现实世界中客户节点往往是以非独立同分布的方式产生和收集数据,这不符合常用的独立同分布假设,并在异构数据建模和训练过程的模型收敛分析方面提出了挑战,当对非独立同分布的数据采用原始的加权聚合算法如联邦聚合时,全局学习模型收敛到一个与真实目标函数不一致的驻点,从而导致了低的模型精度,为了解决这些问题并提高收敛效率,本专利技术采用层次聚类算法将非独立同分布数据根据数据间的相似度转换为多个独立同分布数据聚类,相同数据分布的客户节点会合并在一个集群并分配特定的任务,每个小集群分别代表一个小规模的联邦系统,这样一个大型分独立同分布联邦学习系统就被划分为多个小型独立同分布系统,然而不同的集群彼此分离,它们之间不允许进行有益的知识转移。
[0004]在这种情况下,本专利技术提出了一个分层架构,允许不同层级间的集群交换它们的知识,然而当一个集群在执行自己任务的过程后同时想要获取其他集群的知识时,从其他任务中获取的知识会对当前模型的参数产生修改使得更新了的模型对于过去训练任务的知识发生丢失,这样的问题被称为灾难性遗忘,持续学习提出了各种缓解灾难性遗忘的解决方案,收到持续学习的启发,本专利技术采用梯度记忆存储过去的样本并约束训练梯度的更新方向,以保持对所有任务的良好预测,在传统的FL中,单个中央服务器与容纳异构数据的所有客户端进行通信,为了提高收敛效率和模型性能,集群FL将不同的客户端划分为独立同分布的聚类,但这些集群之间彼此分离,为了进一步使得隔离的集群之间达到知识迁移的目标,本专利技术将参与者根据相似度划分为不同层次集群,并提出了一种基于梯度记忆的多阶段模型训练机制,以实现分层集群之间的有益知识转移。

技术实现思路

[0005]本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种基于梯度记忆
的车联网联邦学习分层知识安全迁移方法。
[0006]本专利技术的目的可以通过以下技术方案来实现:
[0007]一种基于梯度记忆的车联网联邦学习分层知识安全迁移方法,该方法包括以下步骤:
[0008]步骤1:采用层次聚类算法对多个客户端进行聚类,获取多个独立同分布的集群,以实现将多个数据异质化的客户端合并为独立同分布的集群;
[0009]步骤2:建立基于分层集群架构的车联网联邦学习模型;
[0010]步骤3:采用基于梯度记忆的知识迁移联邦学习算法进行不同集群之间的知识迁移,以缓解分层集群架构中进行知识迁移的灾难性遗忘问题。
[0011]所述的步骤1中,层次聚类算法通过计算客户端之间的数据相似度将多个客户端进行聚类,自下而上不断将多个单一的集群聚合成为多个大的集群,即将非独立同分布下的客户端划分为独立同分布的集群,且分别位于不同的层级中,形成树状的分层集群结构,采用层次聚类算法对多个客户端进行聚类的过程具体包括以下步骤:
[0012]步骤101:将数据集分配至各个客户端,每个客户端对应一个数据集,即本地数据集;
[0013]步骤102:初始时每个客户端的数据集分别作为单一的集群,计算每个单一的集群之间的距离,并得到距离矩阵D;
[0014]步骤103:遍历距离矩阵D,获取距离矩阵D中的最小距离,并得到最小距离的两个集群的编号;
[0015]步骤104:将最小距离的两个单一的集群聚类为一个新的集群,并基于Lance

Williams法更新距离矩阵D,即删除这两个集群对应的行和列,并将根据新的集群计算得到的距离插入距离矩阵D中;
[0016]步骤105:当一个集群包含多个客户端时,采用平均连接,即选择两个集群之间距离的平均值作为集群之间的距离;
[0017]步骤106:返回步骤103,直至最终的距离矩阵D中的最小距离大于规定的距离门限。
[0018]所述的步骤102中,给定两个客户端的数据集d1和数据集d2,两个客户端的数据集d1和数据集d2之间距离的计算公式为:
[0019][0020]其中,为根据耦合数据相似度定义的耦合属性值相似度,d
1h
和d
2h
分别为数据集d1和数据集d2中的第h个样本,n为样本的数量。
[0021]所述的步骤101中,距离矩阵D的表达式为:
[0022][0023]其中,D
qr
为第q个客户端的数据集d
q
和第r个客户端的数据集d
r
之间的距离。
[0024]所述的车联网联邦学习模型的分层集群架构具体为:
[0025]设有多个层级,按照学习顺序在层级中分配集群,同一层级为独立同分布下的客户端形成的集群,且不同层级之间的客户端的本地数据集是非独立同分布的,每个层级分别包括多个相同数据分布的客户端和一个中央参数服务器,形成一个车联网联邦学习子系统,中央参数服务器将模型和数据集分别分配至每个客户端,即每个客户端对应一个特定的本地模型和本地数据集,中央参数服务器对各个客户端协作训练进行协调。
[0026]所述的步骤3中,基于梯度记忆的知识迁移联邦学习算法引入梯度记忆,梯度记忆存储多个过去训练任务中的样本,即过去样本,采用基于梯度记忆的模型更新策略在最小化当前训练任务中的损失函数的同时要求过去训练任务中的损失函数不再增加,以实现在当前训练任务中梯度有方向地更新,进而保证全局模型在所有训练任务上的预测性能,采用基于梯度记忆的知识迁移联邦学习算法进行不同集群之间的知识迁移的过程具体包括以下步骤:
[0027]步骤301:令r1,r2,

,r
t
分别为集群C1,C2,

,C
t
提交的请求,请求r
k
为执行除了当前训练任务T
k
之外的k

1个过去训练任务T1,T2,

,T
k
‑1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于梯度记忆的车联网联邦学习分层知识安全迁移方法,其特征在于,该方法包括以下步骤:步骤1:采用层次聚类算法对多个客户端进行聚类,获取多个独立同分布的集群,以实现将多个数据异质化的客户端合并为独立同分布的集群;步骤2:建立基于分层集群架构的车联网联邦学习模型;步骤3:采用基于梯度记忆的知识迁移联邦学习算法进行不同集群之间的知识迁移,以缓解分层集群架构中进行知识迁移的灾难性遗忘问题。2.根据权利要求1所述的一种基于梯度记忆的车联网联邦学习分层知识安全迁移方法,其特征在于,所述的步骤1中,层次聚类算法通过计算客户端之间的数据相似度将多个客户端进行聚类,自下而上不断将多个单一的集群聚合成为多个大的集群,即将非独立同分布下的客户端划分为独立同分布的集群,且分别位于不同的层级中,形成树状的分层集群结构,采用层次聚类算法对多个客户端进行聚类的过程具体包括以下步骤:步骤101:将数据集分配至各个客户端,每个客户端对应一个数据集,即本地数据集;步骤102:初始时每个客户端的数据集分别作为单一的集群,计算每个单一的集群之间的距离,并得到距离矩阵D;步骤103:遍历距离矩阵D,获取距离矩阵D中的最小距离,并得到最小距离的两个集群的编号;步骤104:将最小距离的两个单一的集群聚类为一个新的集群,并基于Lance

Williams法更新距离矩阵D,即删除这两个集群对应的行和列,并将根据新的集群计算得到的距离插入距离矩阵D中;步骤105:当一个集群包含多个客户端时,采用平均连接,即选择两个集群之间距离的平均值作为集群之间的距离;步骤106:返回步骤103,直至最终的距离矩阵D中的最小距离大于规定的距离门限。3.根据权利要求2所述的一种基于梯度记忆的车联网联邦学习分层知识安全迁移方法,其特征在于,所述的步骤102中,给定两个客户端的数据集d1和数据集d2,两个客户端的数据集d1和数据集d2之间距离的计算公式为:其中,为根据耦合数据相似度定义的耦合属性值相似度,d
1h
和d
2h
分别为数据集d1和数据集d2中的第h个样本,n为样本的数量。4.根据权利要求2所述的一种基于梯度记忆的车联网联邦学习分层知识安全迁移方法,其特征在于,所述的步骤101中,距离矩阵D的表达式为:其中,D
qr
为第q个客户端的数据集d
q
和第r个客户端的数据集d
r
之间的距离。5.根据权利要求1所述的一种基于梯度记忆的车联网联邦学习分层知识安全迁移方法,其特征在于,所述的车联网联邦学习模型的分层集群架构具体为:
车联网联邦学习模型设有多个层级,按照学习顺序在层级中分配集群,同一层级为独立同分布下的客户端形成的集群,且不同层级之间的客户端的本地数据集是非独立同分布的,每个层级分别包括多个相同数据分布的客户端和一个中央参数服务器,形成一个车联网联邦学习子系统,中央参数服务器将模型和数据集分别分配至每个客户端,即每个客户端对应一个特定的本地模型和本地数据集,中央参数服务器对各个客户端协作训练进行协调。6.根据权利要求1所述的一种基于梯度记忆的车联网联邦学习分层知识安全迁移方法,其特征在于,所述的步骤3中,基于梯度记忆的知识迁移联邦学习算法引入梯度记忆,梯度记忆存储多个过去训练任务中的样本,即过去样本,采用基于梯度记忆的模型更新策略在最小化当前训练任务中的损失函数的同时要求过去训练任务中的损失函数不再增加,以实现在当前训练任务中梯度有方向地更新,进而保证全局模型在所有训练任务上的预测性能,采用基于梯度记忆的知识迁移联邦学习算法进行不同集群之间的知识迁移的过程具体包括以下步骤:步骤301:令r1,r2,

,r
t
分别为集群C1,C2,

,C
t
提交的请求,请求r
k
为执行除了当前训练任务T
k
之外的k

1个过去训练任务T1,T2,

【专利技术属性】
技术研发人员:李高磊伍军佟光辉李建华殷承良于娜娜胡勇庆
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1