当前位置: 首页 > 专利查询>长安大学专利>正文

一种自动驾驶车辆换道轨迹规划方法及系统技术方案

技术编号:34431173 阅读:30 留言:0更新日期:2022-08-06 16:08
本发明专利技术公开了一种自动驾驶车辆换道轨迹规划方法及系统,方法过程包括:获取车辆信息;根据所述车辆信息、换道车辆与周围车辆的博弈换道决策模型、考虑安全性和时效性的博弈收益函数并利用博弈收益矩阵求解当前时刻换道车辆的最优换道决策;根据所述最优换道决策,以降低燃油消耗和提高驾驶效率为目标,并利用基于深度强化学习的自动驾驶车辆换道轨迹规划模型,得到整个换道过程最优的序贯加速度决策信息;利用车辆横纵向离散化运动学模型,通过所述加速度决策信息计算出换道过程中每个时间点换道车辆的车辆状态,根进一步得出换道车辆的换道轨迹。本发明专利技术在考虑安全性、高效性、舒适性和燃油经济性的情况下,完成对自动驾驶车辆的换道轨迹规划。辆的换道轨迹规划。辆的换道轨迹规划。

【技术实现步骤摘要】
一种自动驾驶车辆换道轨迹规划方法及系统


[0001]本专利技术属于车辆控制决策
,涉及一种自动驾驶车辆换道轨迹规划方法及系统。

技术介绍

[0002]近年来,自动驾驶车辆在改善交通安全、提高能源效率和减轻交通拥堵方面具有巨大潜力,备受学术界和工业界的关注。换道是车辆驾驶过程中的一项基本任务,对车辆的安全行驶起着非常重要的作用,目前的换道轨迹规划方法存在复杂性高,数据依赖性强等问题,随着车辆智能化水平的提高,兼顾安全与交通效能的车辆换道轨迹规划逐渐成为自动驾驶车辆研究的热点之一。

技术实现思路

[0003]为解决现有技术中存在的问题,本专利技术的目的在于提供一种自动驾驶车辆换道轨迹规划方法及系统,在考虑安全性、高效性、舒适性和燃油经济性的情况下,完成对自动驾驶车辆的换道轨迹规划。
[0004]为了达到上述目的,本专利技术提供如下技术方案:
[0005]一种自动驾驶车辆换道轨迹规划方法,包括如下过程:
[0006]获取车辆信息:所述车辆信息包括:换道车辆的速度、加速度和位置信息,以及周围车辆的速度、加速度和位置信息;
[0007]根据所述车辆信息、换道车辆与周围车辆的博弈换道决策模型、考虑安全性和时效性的博弈收益函数并利用博弈收益矩阵求解当前时刻换道车辆的最优换道决策;
[0008]根据所述最优换道决策,以降低燃油消耗和提高驾驶效率为目标,并利用基于深度强化学习的自动驾驶车辆换道轨迹规划模型,得到整个换道过程最优的序贯加速度决策信息;
[0009]利用车辆横纵向离散化运动学模型,通过所述最优的序贯加速度决策信息计算出换道过程中每个时间点换道车辆的车辆状态,根据换道车辆的车辆状态得出换道车辆的换道轨迹。
[0010]优选的,所述车辆横纵向离散化运动学模型的建立过程包括:
[0011]在XOY平面直角坐标系中,以X轴方向为车辆纵向行驶的方向,以Y轴方向为车辆的横向行驶方向,解耦车辆运动学模型,并以Δt为采样时间进行离散化,得到所述纵横向分离的离散化车辆运动学模型及约束条件如下:
[0012]v
xt
=v
x(t

1)
+a
xt
Δt
[0013]v
yt
=v
y(t

1)
+a
yt
Δt
[0014][0015][0016]0<v
xt
<v
x,max
,0<v
yt
<v
y,max
[0017][0018]其中,v
xt
和v
yt
分别表示t时刻车辆的纵向速度和横向速度;v
x(t

1)
和v
y(t

1)
分别表示t

1时刻车辆的纵向速度和横向速度;t

1时刻为t时刻上一时刻;x
t
和y
t
分别表示t时刻车辆的纵坐标和横坐标;x
(t

1)
和y
(t

1)
分别表示t

1时刻车辆的纵坐标和横坐标;纵向加速度a
xt
和横向加速度a
yt
由每个时间步Δt中车辆与算法交互得到,v
x,max
和v
y,max
分别是纵向速度的最大值和横向速度的最大值,x
max
和y
max
分别是纵向位置的最大值和横向位置的最大值,t
f
为换道的完成时间;
[0019]通过运动学模型得到下一时刻车辆的位置和速度,直到车辆到达换道目标位置或驶离车道时终止状态结束。
[0020]优选的,换道车辆与周围车辆的博弈换道决策模型如下:
[0021]博弈的参与者为换道车辆M、目标车道跟随车辆F
d
和目标车道前车L
d
,换道车辆M的策略集为Φ1={m1,m2},其中m1表示换道,m2表示不换道;目标车道跟随车辆F
d
和目标车道前车L
d
的策略集为Φ2={d
i1
,d
i2
},i={F
d
,L
d
},其中d
i1
表示车辆i允许换道,d
i2
表示车辆i拒绝换道。
[0022]优选的,考虑安全性和时效性的博弈收益函数如下:
[0023]R
M
,R
D
=α1*R
safe
+α2*R
time
.
[0024]其中,R
safe
和R
time
分别表示决策车辆考虑安全性和时效性所获得的收益;α1和α2均为权重系数,α1+α2=1,代表不同驾驶因素的重要程度;
[0025][0026][0027]P
min
=v
Mx

v
Ldx
)t
f
[0028][0029][0030]其中,v
Mx
和v
Mx
分别表示换道车辆的纵向速度和目标车道前车的纵向速度,P
head
为当前时刻两车的车头间距,a
Mx
和a
Ldx
为换道车辆和目标车道前车的纵向加速度;P
min
为当前状态下所需的最小安全距离;t0表示保持原状态下达到目的地所需的时间,x
target
为换道目标点的纵向坐标;t
f
表示换道的完成时间,由轨迹规划部分得出。
[0031]优选的,所述博弈收益矩阵如表1:
[0032]表1
[0033][0034]其中,R
M
表示当前策略下换道车辆可得到的博弈收益,R
D
表示当前策略下目标车道车辆可得到的博弈收益;
[0035]换道车辆与目标车道前车和跟随车分别进行博弈,得到四种博弈结果分别为:换道车辆进行换道,目标车道车辆允许换道;换道车辆进行换道,目标车道车辆拒绝换道;换道车辆不换道,目标车道车辆允许换道;换道车辆不换道,目标车道车辆拒绝换道;只有换道车辆选择换道策略,且目标车道前车和跟随车都做出允许换道的策略时,执行换道。
[0036]优选的,求解当前时刻换道车辆的最优换道决策的过程包括:
[0037]如果博弈矩阵中存在某一纯策略(d
in
,m
n
),i={F
d
,L
d
},n=1,2使得下式成立,则称(d
in
,m
n
)本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自动驾驶车辆换道轨迹规划方法,其特征在于,包括如下过程:获取车辆信息:所述车辆信息包括:换道车辆的速度、加速度和位置信息,以及周围车辆的速度、加速度和位置信息;根据所述车辆信息、换道车辆与周围车辆的博弈换道决策模型、考虑安全性和时效性的博弈收益函数并利用博弈收益矩阵求解当前时刻换道车辆的最优换道决策;根据所述最优换道决策,以降低燃油消耗和提高驾驶效率为目标,并利用基于深度强化学习的自动驾驶车辆换道轨迹规划模型,得到整个换道过程最优的序贯加速度决策信息;利用车辆横纵向离散化运动学模型,通过所述最优的序贯加速度决策信息计算出换道过程中每个时间点换道车辆的车辆状态,根据换道车辆的车辆状态得出换道车辆的换道轨迹。2.根据权利要求1所述的一种自动驾驶车辆换道轨迹规划方法,其特征在于,所述车辆横纵向离散化运动学模型的建立过程包括:在XOY平面直角坐标系中,以X轴方向为车辆纵向行驶的方向,以Y轴方向为车辆的横向行驶方向,解耦车辆运动学模型,并以Δt为采样时间进行离散化,得到所述纵横向分离的离散化车辆运动学模型及约束条件如下:v
xt
=v
x(t

1)
+a
xt
Δtv
yt
=v
y(t

1)
+a
yt
ΔtΔt0<v
xt
<v
x,max
,0<v
yt
<v
y,max
其中,v
xt
和v
yt
分别表示t时刻车辆的纵向速度和横向速度;v
x(t

1)
和v
y(t

1)
分别表示t

1时刻车辆的纵向速度和横向速度;t

1时刻为t时刻上一时刻;x
t
和y
t
分别表示t时刻车辆的纵坐标和横坐标;x
(t

1)
和y
(t

1)
分别表示t

1时刻车辆的纵坐标和横坐标;纵向加速度a
xt
和横向加速度a
yt
由每个时间步Δt中车辆与算法交互得到,v
x,max
和v
y,max
分别是纵向速度的最大值和横向速度的最大值,x
max
和y
max
分别是纵向位置的最大值和横向位置的最大值,t
f
为换道的完成时间;通过运动学模型得到下一时刻车辆的位置和速度,直到车辆到达换道目标位置或驶离车道时终止状态结束。3.根据权利要求1所述的一种自动驾驶车辆换道轨迹规划方法,其特征在于,换道车辆与周围车辆的博弈换道决策模型如下:博弈的参与者为换道车辆M、目标车道跟随车辆F
d
和目标车道前车L
d
,换道车辆M的策略集为Φ1={m1,m2},其中m1表示换道,m2表示不换道;目标车道跟随车辆F
d
和目标车道前车L
d
的策略集为Φ2={d
i1
,d
i2
},i={F
d
,L
d
},其中d
i1
表示车辆i允许换道,d
i2
表示拒绝换道。4.根据权利要求1所述的一种自动驾驶车辆换道轨迹规划方法,其特征在于,考虑安全性和时效性的博弈收益函数如下:
R
M
,R
D
=α1*R
safe
+α2*R
time
.其中,R
safe
和R
time
分别表示决策车辆考虑安全性和时效性所获得的收益;α1和α2均为权重系数,α1+α2=1,代表不同驾驶因素的重要程度;表不同驾驶因素的重要程度;表不同驾驶因素的重要程度;表不同驾驶因素的重要程度;表不同驾驶因素的重要程度;其中,v
Mx
和v
Mx
分别表示换道车辆的纵向速度和目标车道前车的纵向速度,P
head
为当前时刻两车的车头间距,a
Mx
和为换道车辆和目标车道前车的纵向加速度;P
min
为当前状态下所需的最小安全距离;t0表示保持原状态下达到目的地所需的时间,x
target
为换道目标点的纵向坐标;t
f
表示换道的完成时间,由轨迹规划部分得出。5.根据权利要求1所述的一种自动驾驶车辆换道轨迹规划方法,其特征在于,所述博弈收益矩阵如表1:表1其中,R
M
表示当前策略下换道车辆可得到的博弈收益,R
D
表示当前策略下目标车道车辆可得到的博弈收益;换道车辆与目标车道前车和跟随车分别进行博弈,得到四种博弈结果分别为:换道车辆进行换道,目标车道车辆允许换道;换道车辆进行换道,目标车道车辆拒绝换道;换道车辆不换道,目标车道车辆允许换道;换道车辆不换道,目标车道车辆拒绝换道;只有换道车辆选择换道策略,且目标车道前车和跟随车都做出允许换道的策略时,执行换道。6.根据权利要求5所述的一种自动驾驶车辆换道轨迹规划方法,其特征在于,求解当前时刻换道车辆的最优换道决策的过程包括:如果博弈矩阵中存在某一纯策略(d
in
,m
n
),i={F
d
...

【专利技术属性】
技术研发人员:景首才惠飞赵祥模冯耀
申请(专利权)人:长安大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1