System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及车联网,尤其是指一种车联网联邦半监督学习方法及系统。
技术介绍
1、5g基站、人工智能、新能源汽车充电桩等新型基础设施的建设大力推动了车联网产业的发展。在车联网中,智能网联汽车通过车载传感与控制系统及信息终端设备实现与人、车、路、云等的信息交换与共享,从而实现智能辅助驾驶。现代汽车智能化程度的不断提高,高性能计算与移动通信模块的加入,使得车联网在原有的交通管理应用上更进一步,车路协同、自动驾驶和车载物流等一系列依托于新兴人工智能技术的车联网应用应运而生。
2、车联网与人工智能的结合的基础在于车辆作为智能终端会生成数据,进而通过这些数据能够产生特定的人工智能模型以投入实际的应用。自动驾驶创建模型所需的数据是大量的且分散的,在车辆网络中,这些数据不均衡的分布在广泛的车辆终端设备中,针对这个问题,在传统的数据中心化的模型部署架构以外,分布式的模型学习和部署方式也逐步发展起来。并且随着近年来数据隐私与安全意识观念的提升,数据隐私安全相关的法律法规逐步完善,对于车辆智能终端个人数据的获取方式也日益成为信息安全的重要考量。
3、近年来,基于隐私安全的分布式车联网人工智能学习框架已逐渐引起国内外研究人员的关注,已开展利用联邦学习等方法进行分布式学习的相关研究,针对分布式的车辆终端数据,传统的数据中心化学习有着较高的传输带宽成本以及数据隐私泄露的问题,数据分布式的学习为车联网的场景提供了潜在的解决方案。
4、联邦学习以其分布式的学习范式以及保护隐私安全的前提,得到了国内外研究人员的广泛关注,并逐
5、哈尔滨工业大学的zhou等人提出利用联邦学习(federated learning,fl)作为分布式学习框架,针对车联网中的车辆本地数据,使每部车辆终端各自在本地利用本地数据学习本地模型,进而将本地模型上传至路边单元(roadside unit,rsu),路边单元作为服务器进行本地模型的聚合,并将聚合后的全局模型下发各个车辆客户端进行下一次本地模型学习。
6、意大利米兰理工大学的luca等人考虑到通常用于解决自动驾驶汽车任务的深度学习架构上的联邦学习,提出了一种模块化方法,其中联邦学习过程在可变数量的机器学习模型层上启用,一定程度上减少了模型的复杂度,优化了整体的学习时间。
7、加拿大西安大略大学的manias等人讨论了在车联网(internet of vehicles,iov)和智能交通系统(intelligent transportation system,its)中使用联邦学习的应用和优势。随着5g网络、网络功能虚拟化(network function virtualization,nfv)和边缘计算等技术的发展,智能交通系统能够实现低延迟、高带宽和实时数据处理。但在数据隐私、系统复杂性和模型性能等方面存在挑战。为了应对这些问题,研究人员提出使用联邦学习,这是一种分布式的机器学习方法,能够在保护数据隐私的同时,提高系统的恢复能力和效率。通过案例研究展示了联邦学习在its中的潜在应用,如路边单元智能化、nfv编排、车辆智能预测维护等,并指出其在未来5g及超越网络中的广泛应用前景。
8、香港科技大学的jin等人综述了在fl中利用未标注数据的现状和潜力,指出fl作为一种隐私保护的分布式学习方法,虽然已经在一些领域取得了广泛应用,但许多现有的应用依赖于自动标注的数据,难以适用于需要人工标注的大规模数据集。研究人员认为,fl急需开发利用未标注数据的技术,以应对跨设备和跨组织场景中标注数据匮乏的问题。同时,韩国科学技术研究所的jeong等人提出了两种联邦半监督场景,标签在客户端和标签在服务器两种场景,使得联邦学习能够更贴合真实场景中的数据分布特征,进一步利用无标签数据。
9、悉尼科技大学的zhang等人提出了使用联邦半监督学习进行交通模式识别(transpor-tation mode identification,tmi)的问题,尤其关注隐私保护和数据不足的情况下实现高效的众包数据训练,提出了一种新颖的半监督学习框架,结合深度学习和联邦学习技术,在不依赖大量标注数据的情况下,通过一致性更新和平均教师模型来提升模型性能,并有效保护用户隐私。
10、但是,现有技术中对基于无标签数据的车联网联邦半监督学习模型,在训练时需要消耗较多的计算资源和时间,不利于模型的快速训练和更新,无法满足智能驾驶系统的实时性和适应性需求。
技术实现思路
1、为此,本专利技术所要解决的技术问题在于克服现有技术中无标签数据的车联网联邦半监督学习模型,在训练时需要消耗较多的计算资源和时间,不利于模型的快速训练和更新,无法满足智能驾驶系统的实时性和适应性需求。
2、为解决上述技术问题,本专利技术提供了一种车联网联邦半监督学习方法,包括:
3、服务器端利用有标签数据训练监督模型,将完成训练的监督模型作为初始全局模型;
4、在每次迭代中,每个车辆客户端下载当前的全局模型作为初始本地模型,利用本地无标签样本数据训练初始本地模型,并采用伪标签选择法对初始本地模型的训练进行优化,得到完成训练的本地模型;所有车辆客户端将完成训练的本地模型上传至服务器;服务器端对所有完成训练的本地模型进行聚合,得到聚合本地模型;服务器端利用有标签数据训练监督模型,得到完成训练的监督模型;服务器端将聚合本地模型和完成训练的监督模型聚合为全局模型,进行下一次迭代;
5、达到预设最大迭代次数后,输出目标全局模型;
6、服务器端向车辆客户端发布目标全局模型。
7、优选地,车辆客户端训练本地模型的目标函数为:
8、
9、其中,表示第k个车辆客户端第t+1次迭代的初始本地模型,表示初始本地模型的目标损失函数,表示初始本地模型的输出,πi(xu)和πj(xu)分别表示对无标签样本数据xu进行第i种和第j种数据增强处理,λ1和λ2均表示权重系数,表示无标签样本数据xu的伪标签,ce(·)表示交叉熵函数。
10、优选地,采用基于softmax层置信度和不确定性的伪标签选择法对本地模型的训练进行优化,包括:
11、将无标签样本数据经过多种数据增强后输入初始本地模型,再将初始本地模型softmax层输出的多个置信度进行累加,基于softmax层置信度阈值策略得到初步伪标签;
12、基于无标签样本数据的多个置信度计算该无标签样本数据的置信度不确定性;
13、当无标签样本数据的置信度不确定性小于等于确定性阈值时,将其初步伪标签作为伪标签。
14、优选地,将初始本地模型softmax层输出的多个置信度进行累加,基于softmax层置信度阈值策略得到初步伪标签,公式为:
15、
16、其中,表示初步伪标签,i表示对数据增强的次数,πi(xu)表示对无标签样本数据xu进行第i种数据增强处理,表示第k个车辆客户端第本文档来自技高网...
【技术保护点】
1.一种车联网联邦半监督学习方法,其特征在于,包括:
2.根据权利要求1所述的一种车联网联邦半监督学习方法,其特征在,车辆客户端训练本地模型的目标函数为:
3.根据权利要求1所述的一种车联网联邦半监督学习方法,其特征在于,采用基于Softmax层置信度和不确定性的伪标签选择法对本地模型的训练进行优化,包括:
4.根据权利要求3所述的一种车联网联邦半监督学习方法,其特征在于,将初始本地模型Softmax层输出的多个置信度进行累加,基于Softmax层置信度阈值策略得到初步伪标签,公式为:
5.根据权利要求4所述的一种车联网联邦半监督学习方法,其特征在于,基于无标签样本数据的多个置信度计算该无标签样本数据的置信度不确定性,公式为:
6.根据权利要求5所述的一种车联网联邦半监督学习方法,其特征在于,当无标签样本数据的置信度不确定性小于等于确定性阈值时,将其初步伪标签作为伪标签,公式为:
7.根据权利要求1所述的一种车联网联邦半监督学习方法,其特征在于,服务器端训练监督模型的目标函数为:
8.根据权利要求
9.根据权利要求1所述的一种车联网联邦半监督学习方法,其特征在于,服务器端将聚合本地模型和完成训练的监督模型聚合为全局模型,公式为:
10.一种车联网联邦半监督学习系统,其特征在于,包括:
...【技术特征摘要】
1.一种车联网联邦半监督学习方法,其特征在于,包括:
2.根据权利要求1所述的一种车联网联邦半监督学习方法,其特征在,车辆客户端训练本地模型的目标函数为:
3.根据权利要求1所述的一种车联网联邦半监督学习方法,其特征在于,采用基于softmax层置信度和不确定性的伪标签选择法对本地模型的训练进行优化,包括:
4.根据权利要求3所述的一种车联网联邦半监督学习方法,其特征在于,将初始本地模型softmax层输出的多个置信度进行累加,基于softmax层置信度阈值策略得到初步伪标签,公式为:
5.根据权利要求4所述的一种车联网联邦半监督学习方法,其特征在于,基于无标签样本数据的多个置信度计算该无标签样本数据的置信度...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。