一种基于信号博弈的车辆编队异步联邦学习方法技术

技术编号：39996695 阅读：17 留言：0更新日期：2024-01-09 02:50

本发明专利技术公开了一种基于信号博弈的车辆编队异步联邦学习方法，包括：对车辆按照位置信息进行分组，获得车辆编队；服务器向车联网设备发送学习任务，并接收车辆编队发送的参与信号；服务器基于信号博弈的第一策略对所述参与信号进行识别以判断车辆编队是否为积极状态；若服务器判断车辆编队为积极状态，将全局模型发送给车辆编队；服务器接收车辆编队使用本地数据集训练完成的局部模型，基于所述局部模型以异步的方式对全局模型进行聚合。本发明专利技术能够实现在不完全信息的条件准确选择积极参与者，同时通过异步聚合方式降低通信开销，提高训练的效率，将二者结合能够提高模型训练的质量。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及电数字数据处理领域。具体而言，涉及一种基于信号博弈的车辆编队异步联邦学习方法。

技术介绍

1、随着技术的发展，智能网联汽车（intelligent connected vehicle，icv）引起了人们的广泛关注。在icv中，大量的传感器数据需要在中央服务器的配合下进行处理，为驾驶员提供舒适的驾驶体验。由于这些传感器数据包含敏感信息，如速度、加速度等，很容易被编辑、伪造和窃取，所以在将传感器数据传输到中央服务器的过程中存在着安全和隐私问题。联邦学习通过icv在本地用私有数据进行训练本地模型，并且上传本地模型参数的方式解决了上述问题。同时，它还为解决关于分布式数据的机器学习问题提供了一种高效的通信方式。由于联邦学习的上述优势，它已被广泛用于一些icv应用，如车辆协同定位和交通流预测。

2、然而，昂贵的训练开销和来自单一icv的非独立分布（non-independent andidentically distributed，non-iid）数据仍然是车联网中大规模应用联邦学习需要解决的难题。具体来说，由于参与训练的传感器数据具有不同的分布，这种non-iid数据会导致全局模型聚合的偏差，降低模型精度。在通信开销方面，传统的同步联邦学习方法需要等待所有节点上传模型后再进行聚合，这大大增加了时间开销。此外，每个icv需要与中心服务器进行多轮交互，这在大规模车辆场景下不可避免地产生了大量的通信开销，从而降低了训练过程的效率。

3、此外，在现实世界中，有一些恶意的参与者可能会扰乱整个模型训练。因此，有必

技术实现思路

1、本专利技术正是基于现有技术的上述需求而提出的，本专利技术要解决的技术问题是提供一种基于信号博弈的车辆编队异步联邦学习方法以实现在不完全信息的条件准确选择积极参与者，同时通过异步聚合方式降低通信开销，提高训练的效率，将二者结合能够提高模型训练的质量。

2、为了解决上述问题，本专利技术是采用如下技术方案实现的：

3、提供一种基于信号博弈的车辆编队异步联邦学习方法，包括：对车辆按照位置信息进行分组，获得车辆编队；服务器向车联网设备发送学习任务，并接收车辆编队发送的参与信号；服务器基于信号博弈的第一策略对所述参与信号进行识别以判断车辆编队是否为积极状态，包括：以服务器和车辆编队为局中人构建博弈模型；对所述博弈模型求解得到完美贝叶斯均衡的第一策略，所述第一策略包括四个解空间上的博弈均衡；根据所述第一策略确定车辆编队的状态，包括：根据和，确定高报酬的边界值和低报酬的边界值，其中， m h表示接收到的第一报酬提议信号， m l表示接收到的第二报酬提议信号，所述第一报酬提议信号比所述第二报酬提议信号高， d表示接收恶意车辆编队之后恢复到之前的全局聚合模型的成本， e s表示接收恶意车辆编队的训练后的本地模型的影响， e p表示服务器接收积极车辆编队的训练后的本地模型的影响；确定先验信念 μ，并根据高报酬的边界值和低报酬的边界值确定先验信念所属解空间，所述先验信念 μ包括在接收到 m h时服务器认为车辆编队为积极类型的先验信念 μ h和在接收到 m l时服务器认为车辆编队为积极类型的先验信念 μ l；在对应的解空间内，通过比较 m h- m l与 f、 m h与 e s- d， m l与 e s- d，与 γ、 m l与c( θ p)- f、 m l与c( θ p)、 m h与c( θ p)+ f、 m l与 e p、 m h与 e p、 γ与 μ h、 γ与 μ l的大小关系，确定车辆编队的均衡解，其中， f表示恶意车辆编队的伪装成本， γ表示车辆编队属于积极类型的概率值，c( θ p)表示积极车辆编队的训练开销；若服务器判断车辆编队为积极状态，将全局模型发送给车辆编队；服务器接收车辆编队使用本地数据集训练完成的局部模型，基于所述局部模型以异步的方式对全局模型进行聚合。

4、可选地，所述以服务器和车辆编队为局中人构建博弈模型，包括：构建服务器与车辆编队之间的信号博弈模型；其中，n表示局中人集合，，，，，，表示博弈双方的类型集合，表示服务器的类型集合，表示车辆编队的类型集合， θ h表示服务器的类型， θ p表示车辆编队的积极类型， θ s表示车辆本文档来自技高网...

【技术保护点】

1.一种基于信号博弈的车辆编队异步联邦学习方法，其特征在于，包括：

2.根据权利要求1所述的一种基于信号博弈的车辆编队异步联邦学习方法，其特征在于，所述以服务器和车辆编队为局中人构建博弈模型，包括：

3.根据权利要求2所述的一种基于信号博弈的车辆编队异步联邦学习方法，其特征在于，所述报酬集合包括：当A=θp，B=mh，C=πa时，Ur=Ep-mh，Uv=mh-C(θp)；当A=θp，B=ml，C=πa时，Ur=Ep-ml，Uv=ml-C(θp)；当A=θp，B=mh||ml，C=πr时，Ur=0，Uv=0；当A=θs，B=mh，C=πa时，Ur=Es-mh-D，Uv=mh-C(θp)-F；当A=θs，B=mh，C=πr时，Ur=0，Uv=-F；当A=θs，B=ml，C=πa时，Ur=Es-ml-D，Uv=ml-C(θS)；当A=θs，B=ml，C=πr时，Ur=0，Uv=0，其中，C(θS)表示恶意车辆编队的训练开销，A为车辆编队的类型，B为服务器接收的车辆编队的报酬提议，C为服务器的决策。

4.根据权利要求3所述的一种基于信号博弈的车辆编队异

5.根据权利要求4所述的一种基于信号博弈的车辆编队异步联邦学习方法，其特征在于，所述第一策略包括四个解空间上的博弈均衡，包括：

6.根据权利要求5所述的一种基于信号博弈的车辆编队异步联邦学习方法，其特征在于，根据博弈均衡修正先验信念μ，包括：

7.根据权利要求4所述的一种基于信号博弈的车辆编队异步联邦学习方法，其特征在于，局部模型基于训练公式获得；其中，wr-1表示车辆编队接收的服务器上一轮的全局模型，为强凸函数，为局部损失函数，ρ为超参数，Dp表示编队内车辆数据集的总和。

8.根据权利要求7所述的一种基于信号博弈的车辆编队异步联邦学习方法，其特征在于，所述服务器接收车辆编队使用本地数据集训练完成的局部模型，基于所述局部模型以异步的方式对全局模型进行聚合，其公式包括：

9.根据权利要求8所述的一种基于信号博弈的车辆编队异步联邦学习方法，其特征在于，车辆编队利用本地数据集对所述全局模型进行训练，获得局部模型，包括：车辆编队利用随机梯度下降方法以寻找局部最优解，基于Mini-batch梯度下降方法以控制训练样本的数量。

10.根据权利要求1所述的一种基于信号博弈的车辆编队异步联邦学习方法，其特征在于，若服务器判断车辆编队不是积极状态，则服务器无视该车辆编队，等待其他车辆编队的参与信号。

...

【技术特征摘要】

1.一种基于信号博弈的车辆编队异步联邦学习方法，其特征在于，包括：

2.根据权利要求1所述的一种基于信号博弈的车辆编队异步联邦学习方法，其特征在于，所述以服务器和车辆编队为局中人构建博弈模型，包括：

3.根据权利要求2所述的一种基于信号博弈的车辆编队异步联邦学习方法，其特征在于，所述报酬集合包括：当a=θp，b=mh，c=πa时，ur=ep-mh，uv=mh-c(θp)；当a=θp，b=ml，c=πa时，ur=ep-ml，uv=ml-c(θp)；当a=θp，b=mh||ml，c=πr时，ur=0，uv=0；当a=θs，b=mh，c=πa时，ur=es-mh-d，uv=mh-c(θp)-f；当a=θs，b=mh，c=πr时，ur=0，uv=-f；当a=θs，b=ml，c=πa时，ur=es-ml-d，uv=ml-c(θs)；当a=θs，b=ml，c=πr时，ur=0，uv=0，其中，c(θs)表示恶意车辆编队的训练开销，a为车辆编队的类型，b为服务器接收的车辆编队的报酬提议，c为服务器的决策。

4.根据权利要求3所述的一种基于信号博弈的车辆编队异步联邦学习方法，其特征在于，

5.根据权利要求4所述的一种基于信号博弈的车辆编队异步联邦学习...

【专利技术属性】
技术研发人员：于海洋，梁育豪，赵亚楠，杨阳，任毅龙，崔志勇，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人