考虑道路坡度影响的近端策略优化经济性跟车控制方法技术

技术编号：39754448 阅读：34 留言：0更新日期：2023-12-17 23:53

本发明专利技术公开了一种考虑道路坡度影响的近端策略优化经济性跟车控制方法，包括：搭建近端策略优化网络模型；根据道路的坡度特征

全部详细技术资料下载

【技术实现步骤摘要】
考虑道路坡度影响的近端策略优化经济性跟车控制方法

[0001]本专利技术属于自动驾驶
，涉及一种自动驾驶车辆跟车驾驶控制方法，具体涉及一种考虑道路坡度影响的近端策略优化经济性跟车控制方法
。

技术介绍

[0002]车辆的跟随驾驶是出现频率很高的驾驶情况，而且是自动驾驶领域研究的热点之一
。
在提高驾驶舒适性
、
缓解交通路况压力和降低交通事故发生率等方面都有着出众的能力
。
[0003]目前已有众多基于模型的传统控制算法在车辆跟随问题中发挥了优秀的表现
。
首先比例
‑
积分
‑
微分
(PID)
控制器可以根据自车与前车的速度差
、
相对距离以及自车瞬时速度与两车相对距离之间的关系切换不同的驾驶策略，基于
PID
的跟车控制器不仅优于人工驾驶，并且有着良好的瞬时响应性能
。
在此基础上，例如基于粒子群等的优化算法被用来对
PID
控制器的参数针对不同的目标进行优化，使得
PID
控制器在不同的交通工况中的驾驶性能得到了不同程度的提升
。
模型预测控制理论在此领域也得到了广泛的应用，其可以实现针对行驶安全性
、
乘坐舒适性
、
燃油经济性等多目标设计控制策略，利用滚动优化的方式，使得被控车辆符合多个约束条件的限制，同时可以考虑到驾驶员风格等个性化驾驶需求实现车辆跟随行...

【技术保护点】

【技术特征摘要】
1.
一种考虑道路坡度影响的近端策略优化经济性跟车控制方法，其特征在于，包括以下步骤：步骤一
、
搭建近端策略优化网络模型；步骤二
、
根据道路的坡度特征
、
跟车间距
、
两车速度等信息设计奖励函数；步骤三
、
利用
Carla/Python
联合仿真平台对步骤一搭建的近端策略优化网络模型进行训练，在训练时，被控车辆在仿真环境中不断根据当前的
PPO
策略分布做出动作，与环境进行交互，依据步骤二设计的奖励函数对做出的动作进行评价；步骤四
、
对网络模型的参数进行更新优化，直至达到预设的训练步数后输出训练的考虑坡度影响的经济性跟随驾驶策略
。2.
如权利要求1所述的一种考虑道路坡度影响的近端策略优化经济性跟车控制方法，其特征在于，所述步骤二包括：
S21.
设计速度奖励函数
r
v
；
S22.
设计距离奖励函数
r
h
；
S23.
设计能耗奖励函数
r
o
；
S24.
设计碰撞奖励函数
r
c
与终点奖励函数
r
end
；
S25.
总奖励函数
r
为上述的各项奖励函数之和，即：
r
＝
r
v
+r
h
+r
o
+r
c
+r
end
。3.
如权利要求2所述的一种考虑道路坡度影响的近端策略优化经济性跟车控制方法，其特征在于，所述步骤
S21
包括：将可变安全距离设置为不触发自动紧急制动系统的跟车距离，其计算公式为：
.
上式中，
v
代表被控车辆的瞬时速度；
v
p
代表前车的瞬时速度；
d
safe
代表安全距离；
T
react
代表了容许
AEB
系统反应的时间；
a
h,bmax
和
a
p,bmax
分别代表了主车和前车的最大制动减速度，
max
代表选择括号中两个参数中最大的一项；为了引导被控车辆具有与前车接近的速度，设置速度奖励
r
v
：
4.
如权利要求2所述的一种考虑道路坡度影响的近端策略优化经济性跟车控制方法，其特征在于，所述步骤
S22
包括：为了令主车具有跟随前车的能力，将车头时距
THW
与奖励函数进行融合，车头时距的计算方法及距离奖励函数
r
h
如下所示：
r
h
＝
10|
θ
|e
‑
THW
上式中，
v
代表被控车辆的瞬时速度，
d
代表两车之间的实时间距；
θ
代表道路的坡度
。5.
如权利要求2所述的一种考虑道路坡度影响的近端策略优化经济性跟车控制方法，其特征在于，所述步骤
S23
包括：
为了令主车具有经济性跟随行驶的能力，将
VT
‑
Micro
油耗估计模型融合进奖励函数，
VT
‑
Micro
油耗估计模型的计算公式为：上式中，
o
代表被控车辆行驶时的瞬时能量消耗，
a
n
(t)
和
v
n
(t)
分别代表车辆行驶时的瞬时加速度和速度，
K
ij
(a
n
(t))
是与车辆瞬时加速度正负相关的系数；能耗奖励函数
r
o
...

【专利技术属性】
技术研发人员：刘奇芳，孙大朕，陈浩文，李东子，杨翰宇，
申请(专利权)人：吉林大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人