System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于车道间隙注意力特征的自动驾驶分层自主决策规划方法及系统技术方案_技高网

基于车道间隙注意力特征的自动驾驶分层自主决策规划方法及系统技术方案

技术编号:45004315 阅读:7 留言:0更新日期:2025-04-15 17:19
本发明专利技术公开了一种基于车道间隙注意力特征的自动驾驶分层自主决策规划方法及系统,包括:采集车辆手动驾驶仿真场景下的BEV图像以及对应的车道间隙图像,构建训练集;基于鸟瞰图特征的车道间隙分割与注意力特征提取,基于各无人车的动作决策和车辆运动过程,采用CILQR优化器更新车辆参考线,调整目标速度,进行车辆运动规划。通过学习车道间隙注意力提升对场景的理解,进一步实现安全高效的自主决策与规划。

【技术实现步骤摘要】

本专利技术属于智能车辆,尤其涉及一种基于车道间隙注意力特征的自动驾驶分层自主决策规划方法及系统


技术介绍

1、在过去的十年中,自动驾驶汽车(autonomous vehicle)技术取得了显著的进展,成为全球技术研发的热点之一。随着城市交通环境的日益复杂,传统的基于规则的自动驾驶决策方法逐渐暴露出其局限性,难以应对各种动态和不确定的驾驶场景,包括:

2、鲁棒性不足:传统的基于规则或模型的决策方法在遇到复杂和动态变化的交通环境时,往往表现出鲁棒性不足。例如,在处理突发状况或非标准交通行为时,这些方法可能无法做出适应性调整。

3、泛化能力有限:许多现有方法在不同场景之间的泛化能力有限。它们可能在训练环境中表现良好,但在未见过的场景中,性能可能显著下降。

4、场景理解不足:许多方法缺乏对驾驶场景的深层次理解,特别是在识别和预测其他交通参与者的意图方面。这可能导致在复杂交通场景中做出不安全或不高效的决策。

5、强化学习作为一种能够通过试错学习最佳策略的人工智能方法,开始在自动驾驶领域展现出巨大潜力。特别是在复杂的城市场景中,车辆需要在不同的车道间隙中进行灵活应对,以实现安全和高效的驾驶。传统方法往往难以在多变的交通状况下保持高效,而基于强化学习的决策方法则能够通过不断学习和优化,在多样化的驾驶环境中表现出色,但是强化学习虽通过试错学习展现应用潜力,却因场景理解不足导致泛化受限。

6、因此,研究一种更为智能和灵活的决策规划方法显得尤为重要。


技术实现思路

1、为解决上述问题,本专利技术提供一种基于车道间隙注意力特征的自动驾驶分层自主决策规划方法及系统,提升对场景的理解,进一步实现安全高效的自主决策与规划。

2、实现本专利技术目的的技术解决方案为:

3、一种基于车道间隙注意力特征的自动驾驶分层自主决策规划方法,包括:

4、步骤1,采集车辆手动驾驶仿真场景下的bev图像以及对应的车道间隙图像,构建训练集;

5、步骤2,通过训练集对图像分割网络进行训练,通过训练好的图像分割网络获取车道间隙特征,将车道间隙特征和bev图像进行组合,得到扩展特征;

6、步骤3,通过交叉注意力网络将扩展特征和主车状态特征进行交叉注意力操作,获取多维综合特征;

7、步骤4,基于多维综合特征,采用训练好的强化学习算法网络得到各无人车的动作决策;

8、步骤5,基于各无人车的动作决策和车辆运动过程,采用cilqr优化器更新车辆参考线,调整目标速度,进行车辆运动规划,并将优化结果反馈至仿真环境,进而更新强化学习网络的经验回收池。

9、进一步地,所述图像分割网络的输入为归一化的bev图像特征维度为3×h×w,所述车道间隙提取网络包括多层卷积的上采样及下采样结构,其中上、下采样层均采用两层卷机结构,共三次上采样与下采样,输出的车道间隙特征维度为1×h×w,其中,h和w表示图像的高和宽。

10、进一步地,所述步骤3具体包括:交叉注意力网络接收主车状态特征作为查询query,扩展特征作为键key和值value,通过计算查询和键之间的相似性生成注意力权重,采用计算出的注意力权重对值value进行加权求和,从而生成输出将扩展特征与交叉注意力特征组合,获取多维综合特征其中,所述主车状态特征包括速度、加速度、航向角和车轮转角。

11、进一步地,所述多维综合特征采用卷积网络提取特征,主车状态特征通过多层感知机提取特征,两个特征进行拼接,作为强化学习算法网络的输入,所述强化学习算法网络输出的动作决策为离散动作,包括向左换道、保持车道、向右换道路、加速和减速,为cilqr优化器的输入。

12、进一步地,所述强化学习算法网络通过均方差损失函数训练更新,所述均方差损失函数通过∑rt构建,rt为自动驾驶车辆对应的奖励值。

13、进一步地,所述奖励值rt为:

14、

15、其中,v表示车辆当前速度,vmax为车辆最高速度,τ为速度奖励比率。

16、进一步地,所述强化学习算法网络将意图决策过程用一个元组:m(s,a,p,r,γ)表示,其中,状态空间s用于描述当前车辆的驾驶状态和环境状态,动作空间a表示车辆上层决策指令,表示为下一时刻决策目标的状态;r表示奖励函数,对安全驾驶和完成任务进行奖励,对碰撞进行惩罚;γ是对未来奖励的折扣因子。

17、进一步地,所述车辆运动过程为:

18、

19、s.t.xk+1=f(xk,uk),k=0,1,…,n-1

20、x0=xstart

21、

22、umin<uk<umax,k=1,2,…,n-1

23、其中,φ(xn)表示xn状态下的代价函数,lk表示k时刻的动作代价函数,f(xk,uk)为状态更新模型,xk表示k时刻车辆状态,x0、xstart为车辆初始状态,uk表示k时刻车辆的控制输入,umin、umax为设定的最小值和最大值;为障碍物碰撞约束,其中,表示第j个障碍物在k时刻的状态。

24、进一步地,所述动作代价函数包括车辆控制代价和车辆状态代价,其中,

25、所述车辆控制代价为:

26、

27、其中,wacc、wsteer分别表示加速度和转角代价参数;

28、所述车辆状态代价包括速度跟随代价与参考线跟随代价所述速度跟随代价为:

29、

30、其中,xk为k时刻车辆状态量,vr为参考速度,wvel为速度跟随代价参数;

31、所述参考线跟随代价为:

32、

33、其中,refk表示为轨迹点xk到目标车道参考线的投影点,dis(xk,refk)为距离函数,wref为参考线跟随代价参数。

34、一种基于车道间隙注意力特征的自动驾驶分层自主决策规划系统,包括:

35、车道间隙分割与注意力特征提取单元,包括数据采集单元和图像特征分割单元,所述数据采集单元,采集车辆手动驾驶场景下的bev图像以及对应的车道间隙图像,构建训练集;所述图像特征分割单元,通过训练集对图像分割网络进行训练,通过训练好的图像分割网络获取车道间隙特征,将车道间隙特征和bev图像进行组合,得到扩展特征,通过交叉注意力网络将扩展特征和主车状态特征进行交叉注意力操作,获取多维综合特征;

36、上层行为决策单元,基于多维综合特征,采用训练好的强化学习算法网络得到各无人车的动作决策;

37、下层轨迹规划单元,采用cilqr优化器更新车辆参考线,调整目标速度,进行车辆运动规划,并将优化数据反馈至数据采集单元,用于更新强化学习算法网络。

38、与现有技术相比,本专利技术的有益效果为:

39、1、本专利技术提供一种基于车道间隙注意力特征的自动驾驶分层自主决策规划方法,该方法共包括三个方面,基于bev特征本文档来自技高网...

【技术保护点】

1.一种基于车道间隙注意力特征的自动驾驶分层自主决策规划方法,其特征在于,包括:

2.根据权利要求1所述的一种基于车道间隙注意力特征的自动驾驶分层自主决策规划方法,其特征在于,所述图像分割网络的输入为归一化的BEV图像特征维度为3×h×w,所述车道间隙提取网络包括多层卷积的上采样及下采样结构,其中上、下采样层均采用两层卷机结构,共三次上采样与下采样,输出的车道间隙特征维度为1×h×w,其中,h和w表示图像的高和宽。

3.根据权利要求1所述的一种基于车道间隙注意力特征的自动驾驶分层自主决策规划方法,其特征在于,所述步骤3具体包括:交叉注意力网络接收主车状态特征作为查询Query,扩展特征作为键Key和值Value,通过计算查询和键之间的相似性生成注意力权重,采用计算出的注意力权重对值Value进行加权求和,从而生成输出将扩展特征与交叉注意力特征组合,获取多维综合特征其中,所述主车状态特征包括速度、加速度、航向角和车轮转角。

4.根据权利要求1所述的一种基于车道间隙注意力特征的自动驾驶分层自主决策规划方法,其特征在于,所述多维综合特征采用卷积网络提取特征,主车状态特征通过多层感知机提取特征,两个特征进行拼接,作为强化学习算法网络的输入,所述强化学习算法网络输出的动作决策为离散动作,包括向左换道、保持车道、向右换道、加速和减速,为CILQR优化器的输入。

5.根据权利要求4所述的一种基于车道间隙注意力特征的自动驾驶分层自主决策规划方法,其特征在于,所述强化学习算法网络通过均方差损失函数训练更新,所述均方差损失函数通过∑Rt构建,Rt为自动驾驶车辆对应的奖励值。

6.根据权利要求4所述的一种基于车道间隙注意力特征的自动驾驶分层自主决策规划方法,其特征在于,所述奖励值Rt为:

7.根据权利要求6所述的一种基于车道间隙注意力特征的自动驾驶分层自主决策规划方法,其特征在于,所述强化学习算法网络将意图决策过程用一个元组:M(S,A,P,r,γ)表示,其中,状态空间S用于描述当前车辆的驾驶状态和环境状态,动作空间A表示车辆上层决策指令,表示为下一时刻决策目标的状态;r表示奖励函数,对安全驾驶和完成任务进行奖励,对碰撞进行惩罚;γ是对未来奖励的折扣因子。

8.根据权利要求1所述的一种基于车道间隙注意力特征的自动驾驶分层自主决策规划方法,其特征在于,所述车辆运动过程为:

9.根据权利要求8所述的一种基于车道间隙注意力特征的自动驾驶分层自主决策规划方法,其特征在于,所述动作代价函数包括车辆控制代价和车辆状态代价,其中,

10.一种实现权利要求1-9任一所述方法的自动驾驶分层自主决策规划系统,其特征在于,包括:

...

【技术特征摘要】

1.一种基于车道间隙注意力特征的自动驾驶分层自主决策规划方法,其特征在于,包括:

2.根据权利要求1所述的一种基于车道间隙注意力特征的自动驾驶分层自主决策规划方法,其特征在于,所述图像分割网络的输入为归一化的bev图像特征维度为3×h×w,所述车道间隙提取网络包括多层卷积的上采样及下采样结构,其中上、下采样层均采用两层卷机结构,共三次上采样与下采样,输出的车道间隙特征维度为1×h×w,其中,h和w表示图像的高和宽。

3.根据权利要求1所述的一种基于车道间隙注意力特征的自动驾驶分层自主决策规划方法,其特征在于,所述步骤3具体包括:交叉注意力网络接收主车状态特征作为查询query,扩展特征作为键key和值value,通过计算查询和键之间的相似性生成注意力权重,采用计算出的注意力权重对值value进行加权求和,从而生成输出将扩展特征与交叉注意力特征组合,获取多维综合特征其中,所述主车状态特征包括速度、加速度、航向角和车轮转角。

4.根据权利要求1所述的一种基于车道间隙注意力特征的自动驾驶分层自主决策规划方法,其特征在于,所述多维综合特征采用卷积网络提取特征,主车状态特征通过多层感知机提取特征,两个特征进行拼接,作为强化学习算法网络的输入,所述强化学习算法网络输出的动作决策为离散动作,包括向左换道、保持车道、向右换道、加...

【专利技术属性】
技术研发人员:陈思园杨力何流汪进文黄琦龙
申请(专利权)人:南京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1