基于梯度记忆的车联网联邦学习分层知识安全迁移方法技术

技术编号：33531615 阅读：16 留言：0更新日期：2022-05-19 02:03

本发明专利技术涉及一种基于梯度记忆的车联网联邦学习分层知识安全迁移方法，该方法包括以下步骤：步骤1：采用层次聚类算法对多个客户端进行聚类，获取多个独立同分布的集群，以实现将多个数据异质化的客户端合并为独立同分布的集群；步骤2：建立基于分层集群架构的车联网联邦学习模型；步骤3：采用基于梯度记忆的知识迁移联邦学习算法进行不同集群之间的知识迁移，以缓解分层集群架构中进行知识迁移的灾难性遗忘问题，与现有技术相比，本发明专利技术具有减轻灾难性遗忘的问题以及有效地提高模型收敛速度和模型精度等优点。和模型精度等优点。和模型精度等优点。

全部详细技术资料下载

【技术实现步骤摘要】
基于梯度记忆的车联网联邦学习分层知识安全迁移方法

[0001]本专利技术涉及车联网联邦学习
，尤其是涉及一种基于梯度记忆的车联网联邦学习分层知识安全迁移方法。

技术介绍

[0002]随着数据量的不断增长、计算硬件性能的提高以及深度神经网络的发展，车联网、自动驾驶等近年来取得了长足的进步，大多数人工智能解决方案都是集中式的，用户将他们收集的所有数据传输到中央数据服务器或云端，但这会带来隐私问题、延迟和带宽限制，相比之下，分布式架构是一种更加隐私保护和高效的选择，联邦学习(FL)是一种新兴的分布式机器学习模式，它允许参与学习的各方在参数服务器的协调下进行合作训练，在FL中，本地客户端从中央参数服务器下载全局模型，再分别使用自己的数据集进行本地训练，然后将更新的模型参数而不是敏感的原始数据上传到服务器，中央服务器使用联邦学习等技术聚合这些模型权重参数，以获得更有效的全局机器学习模型，然后将聚合后的参数重新分发给本地客户端，用于下一次全局训练迭代.重复该过程直到全局模型达到收敛。
[0003]为了简化研究条件，通常会认为数据遵从独立同分布的假设，但是在现实世界中客户节点往往是以非独立同分布的方式产生和收集数据，这不符合常用的独立同分布假设，并在异构数据建模和训练过程的模型收敛分析方面提出了挑战，当对非独立同分布的数据采用原始的加权聚合算法如联邦聚合时，全局学习模型收敛到一个与真实目标函数不一致的驻点，从而导致了低的模型精度，为了解决这些问题并提高收敛效率，本专利技术采用层次聚类算法将非独立同分布数据根据数据间的...

【技术保护点】

【技术特征摘要】
1.一种基于梯度记忆的车联网联邦学习分层知识安全迁移方法，其特征在于，该方法包括以下步骤：步骤1：采用层次聚类算法对多个客户端进行聚类，获取多个独立同分布的集群，以实现将多个数据异质化的客户端合并为独立同分布的集群；步骤2：建立基于分层集群架构的车联网联邦学习模型；步骤3：采用基于梯度记忆的知识迁移联邦学习算法进行不同集群之间的知识迁移，以缓解分层集群架构中进行知识迁移的灾难性遗忘问题。2.根据权利要求1所述的一种基于梯度记忆的车联网联邦学习分层知识安全迁移方法，其特征在于，所述的步骤1中，层次聚类算法通过计算客户端之间的数据相似度将多个客户端进行聚类，自下而上不断将多个单一的集群聚合成为多个大的集群，即将非独立同分布下的客户端划分为独立同分布的集群，且分别位于不同的层级中，形成树状的分层集群结构，采用层次聚类算法对多个客户端进行聚类的过程具体包括以下步骤：步骤101：将数据集分配至各个客户端，每个客户端对应一个数据集，即本地数据集；步骤102：初始时每个客户端的数据集分别作为单一的集群，计算每个单一的集群之间的距离，并得到距离矩阵D；步骤103：遍历距离矩阵D，获取距离矩阵D中的最小距离，并得到最小距离的两个集群的编号；步骤104：将最小距离的两个单一的集群聚类为一个新的集群，并基于Lance
‑
Williams法更新距离矩阵D，即删除这两个集群对应的行和列，并将根据新的集群计算得到的距离插入距离矩阵D中；步骤105：当一个集群包含多个客户端时，采用平均连接，即选择两个集群之间距离的平均值作为集群之间的距离；步骤106：返回步骤103，直至最终的距离矩阵D中的最小距离大于规定的距离门限。3.根据权利要求2所述的一种基于梯度记忆的车联网联邦学习分层知识安全迁移方法，其特征在于，所述的步骤102中，给定两个客户端的数据集d1和数据集d2，两个客户端的数据集d1和数据集d2之间距离的计算公式为：其中，为根据耦合数据相似度定义的耦合属性值相似度，d
1h
和d
2h
分别为数据集d1和数据集d2中的第h个样本，n为样本的数量。4.根据权利要求2所述的一种基于梯度记忆的车联网联邦学习分层知识安全迁移方法，其特征在于，所述的步骤101中，距离矩阵D的表达式为：其中，D
qr
为第q个客户端的数据集d
q
和第r个客户端的数据集d
r
之间的距离。5.根据权利要求1所述的一种基于梯度记忆的车联网联邦学习分层知识安全迁移方法，其特征在于，所述的车联网联邦学习模型的分层集群架构具体为：
车联网联邦学习模型设有多个层级，按照学习顺序在层级中分配集群，同一层级为独立同分布下的客户端形成的集群，且不同层级之间的客户端的本地数据集是非独立同分布的，每个层级分别包括多个相同数据分布的客户端和一个中央参数服务器，形成一个车联网联邦学习子系统，中央参数服务器将模型和数据集分别分配至每个客户端，即每个客户端对应一个特定的本地模型和本地数据集，中央参数服务器对各个客户端协作训练进行协调。6.根据权利要求1所述的一种基于梯度记忆的车联网联邦学习分层知识安全迁移方法，其特征在于，所述的步骤3中，基于梯度记忆的知识迁移联邦学习算法引入梯度记忆，梯度记忆存储多个过去训练任务中的样本，即过去样本，采用基于梯度记忆的模型更新策略在最小化当前训练任务中的损失函数的同时要求过去训练任务中的损失函数不再增加，以实现在当前训练任务中梯度有方向地更新，进而保证全局模型在所有训练任务上的预测性能，采用基于梯度记忆的知识迁移联邦学习算法进行不同集群之间的知识迁移的过程具体包括以下步骤：步骤301：令r1,r2,
…
,r
t
分别为集群C1,C2,
…
,C
t
提交的请求，请求r
k
为执行除了当前训练任务T
k
之外的k
‑
1个过去训练任务T1,T2,
…

【专利技术属性】
技术研发人员：李高磊，伍军，佟光辉，李建华，殷承良，于娜娜，胡勇庆，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人