一种基于蒙特卡洛树搜索的自动驾驶纵向决策方法技术

技术编号：37961141 阅读：10 留言：0更新日期：2023-06-30 09:36

本申请涉及自动驾驶领域，提供了一种在采样后ST图上进行蒙特卡洛树搜索的自动驾驶纵向决策方法。包括：构建神经网络并训练，将训练好的神经网络部署到决策方法中，决策过程中得到的神经网络推理结果是si＝p(ti)的离散函数；在采样后的ST图中基于神经网络得到的先验知识(si＝p(ti)离散函数)进行蒙特卡洛树搜索，以得到最优的N条轨迹；依据得到的最优轨迹得出纵向决策。本申请对比于动态规划搜索方式，在一定程度上能够减少耗时，提高决策鲁棒性，且可以得到多组纵向决策，适用于多线程/多进程架构。进程架构。进程架构。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于蒙特卡洛树搜索的自动驾驶纵向决策方法

[0001]本专利技术涉及自动驾驶领域，尤其涉及一种基于蒙特卡洛树搜索的自动驾驶纵向决策方法。

技术介绍

[0002]随着汽车智能化和辅助驾驶技术的发展，自动驾驶作为辅助驾驶的高级阶段，俨然成为未来解决人们出行问题的重要手段，已经成为全球新一轮研究重点和热点。尤其是近年来，自动驾驶技术蓬勃发展，在人类交通发展史上取得了里程碑式的进步。
[0003]目前，自动驾驶的技术架构主要分为环境感知定位，决策规划和执行控制三个主要模块。其中，决策规划模块相当于自动驾驶的大脑，接收来自环境感知定位的一系列数据和障碍物信息后做出相应的决策，纵向决策是决策规划模块中比较重要的部分，用以计算出与障碍物之间的交互行为(超车，停止，让行，强行等)，即在上层规定的搜索域(所有的静态交规决策，部分动态障碍物决策)和搜索目标(目标速度)下，将不确定性问题(障碍物行为不确定性，预测本身的不确定性)确定化，对搜索域内每个障碍物做出纵向的交互决策(不交互，时间上的交互形式和参数，空间上的交互形式和参数)，在将纵向决策转化为纵向规划可理解的可解的、凸的定义域和目标函数。纵观自动驾驶全局，纵向决策在路径决策之后，运动规划，运动控制之前。
[0004]如今自动驾驶系统中的纵向决策模块一般采用的是在采样后的ST图(station
‑
time graph)上进行动态规划(dynamic programming，DP)搜索后得出一条最优轨迹，之后根据此轨迹与障碍物ST图的位置关系确定交...

【技术保护点】

【技术特征摘要】
1.一种基于蒙特卡洛树搜索的自动驾驶纵向决策方法，其特征在于，包括以下步骤：步骤一：构建人工神经网络并对其训练，以将训练好模型的的推理结果应用于蒙特卡洛树搜索中UCB公式的改进。步骤二：在采样后的ST图中基于神经网络得到的先验知识(即s
i
＝p(t
i
)离散函数)进行蒙特卡洛树搜索，以得到最优的N条轨迹。步骤三：基于蒙特卡洛树搜索生成的N条最优轨迹，确定纵向决策。2.根据权利要求1所述的方法，其特征在于，所述的构建人工神经网络并对其训练，以将训练好模型的推理结果应用于蒙特卡洛树搜索中UCB公式的改进包括：所述的人工神经网络包括输入层，隐藏层，输出层；输入层为对采样后ST图进行降维处理后并且加上自动驾驶车辆速度的(n+1)维向量；隐藏层用于对表示采样、降维后ST图和自动驾驶车辆速度的(n+1)维向量特征的提取和处理；输出层为经过神经网络推理后的预估轨迹，即s
i
＝p(t
i
)。所述对蒙特卡洛树搜索中UCB公式的改进包括：利用神经网络推理得到的s
i
＝p(t
i
)的离散函数，对UCB公式进行改进，记为UCB
g
，UCB
g
公式具体如下所示：其中C、D、σ为可调参数，xi为所有经过当前节点轨迹代价总和的均值，ni为当前节点被探索过的次数，N为其父节点被探索过的次数。g(s；p(t),σ)为数学期...

【专利技术属性】
技术研发人员：李增宝，董未名，张羽，
申请(专利权)人：郑州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人