车辆轨迹预测方法技术

技术编号:39714578 阅读:7 留言:0更新日期:2023-12-17 23:22
本发明专利技术涉及自动驾驶技术领域,具体提供一种车辆轨迹预测方法

【技术实现步骤摘要】
车辆轨迹预测方法、控制装置、可读存储介质及车辆


[0001]本专利技术涉及自动驾驶
,具体提供一种车辆轨迹预测方法

控制装置

可读存储介质及车辆


技术介绍

[0002]自动驾驶系统中,规划控制功能可以接收感知层输入的周围环境信息,形成运动轨迹及执行器需要的控制输入

[0003]随着驾驶场景指数级别的膨胀出现,自动驾驶功能需要具备与障碍物场景进行复杂交互的能力

而传统的
rule

based(
基于规则的
)

PNC(PlanningandControl
,规划与控制
)
算法在新的场景交互大量涌现时面临着迭代困难的问题

[0004]相应地,本领域需要一种新的车辆控制方案来解决上述问题


技术实现思路

[0005]为了克服上述缺陷,提出了本专利技术,以提供解决或至少部分地解决如何有效应对现有的高复杂度的交通场景交互以及规划控制过程迭代困难的问题

[0006]在第一方面,本专利技术提供一种车辆轨迹预测方法,其特征在于,所述方法包括:
[0007]根据当前时刻所述车辆的静态环境感知结果和交通参与者感知结果,获取当前时刻所述车辆的所处环境中每个交通参与者的多个场景交互结果;其中,所述场景交互结果表示所述交通参与者的不同的交互意图;
[0008]根据所有交通参与者的场景交互结果,获取初始的交互场景;其中,所述交互场景为不同的交通参与者在对应时刻的交互意图分布;
[0009]根据初始的交互场景和所述车辆的自车驾驶决策进行交互场景推演,获得最优交互场景演变特征;
[0010]根据所述最优交互场景演变特征和所述车辆的状态,获取所述车辆的最优行驶轨迹

[0011]在上述车辆轨迹预测方法的一个技术方案中,所述根据初始的交互场景和所述车辆的自车驾驶决策进行交互场景推演,获得最优交互场景演变特征,包括:
[0012]根据所述初始的交互场景和所述车辆的自车驾驶决策,获取未来连续多个时刻的交互场景;
[0013]根据多个所述交互场景,获取所述最优交互场景演变特征

[0014]在上述车辆轨迹预测方法的一个技术方案中,所述根据初始的交互场景和所述车辆的自车驾驶决策,获取未来连续多个时刻的交互场景,包括:
[0015]针对每个时刻,根据所述上一时刻的交互场景和所述车辆的自车驾驶决策,获取当前时刻的多个交互场景;
[0016]根据所述交互场景的场景价值,获取当前时刻场景价值最大的交互场景,作为当前时刻的最终的交互场景,从而获得未来连续多个时刻的交互场景

[0017]在上述车辆轨迹预测方法的一个技术方案中,所述方法还包括根据以下步骤确定所述交互场景的场景价值:
[0018]通过训练好的预设的博弈价值网络,获取所述交互场景的价值;
[0019]其中,训练好的所述博弈价值网络是根据标注的人类驾驶行为数据进行训练获得,训练好的所述博弈价值网络对符合人类驾驶行为的交互场景赋予更高的场景价值

[0020]在上述车辆轨迹预测方法的一个技术方案中,所述根据多个所述交互场景,获取所述最优交互场景演变特征,包括:
[0021]根据多个所述交互场景,获取每个交互场景的语义决策空间和可行域凸空间;其中,所述语义决策空间包括场景价值最高的交互场景中交通参与者的交互意图;所述可行域凸空间为所述交互意图的时间和空间的约束条件;
[0022]将所述语义决策空间和所述可行域凸空间作为所述最优交互场景演变特征

[0023]在上述车辆轨迹预测方法的一个技术方案中,所述根据所述最优交互场景演变特征和所述车辆的状态,获取所述车辆的最优行驶轨迹,包括:
[0024]根据所述最优交互场景演变特征,分别对所述语义决策空间中包含的每种交互意图进行对应的交互意图编码,并获取所述交互意图对应的奖励函数;
[0025]根据多种交互意图以及每种交互意图的奖励函数,获取交互总奖励函数;
[0026]基于所述交互总奖励函数和所述车辆的状态,在所述可行域凸空间中获取所述车辆的最优行驶轨迹

[0027]在上述车辆轨迹预测方法的一个技术方案中,所述根据所述最优交互场景演变特征,分别对所述语义决策空间中包含的每种交互意图进行对应的交互意图编码,包括:
[0028]根据所述最优交互场景演变特征,进行时空联合特征嵌入,获得时空联合特征嵌入结果;所述时空联合特征嵌入是指将所述语义决策空间中交通参与者的时间特征和空间特征在可行域凸空间中进行特征嵌入编码;
[0029]根据所述时空联合特征嵌入结果,分别对每种所述交互意图进行对应的交互意图编码,以获取交互编码结果

[0030]在上述车辆轨迹预测方法的一个技术方案中,所述获取所述交互意图对应的奖励函数,包括:
[0031]根据人类驾驶行为数据,在所述可行域凸空间中对所述奖励函数进行训练,以使所述奖励函数对应的自车驾驶决策与所述人类驾驶行为数据之间的差异最小化,从而获得所述交互意图对应的奖励函数

[0032]在上述车辆轨迹预测方法的一个技术方案中,所述根据当前时刻所述车辆的静态环境感知结果和交通参与者感知结果,获取当前时刻所述车辆的所处环境中每个交通参与者的多个场景交互结果,包括:
[0033]根据所述静态环境感知结果和所述交通参与者感知结果进行注意力交互编码,获得交互编码特征;
[0034]对所述交互编码特征进行注意力解码,获取注意力解码结果;
[0035]根据所述注意力解码结果,获取所述多个场景交互结果

[0036]在上述车辆轨迹预测方法的一个技术方案中,所述根据所述静态环境感知结果和所述交通参与者感知结果进行注意力交互编码,获得交互编码特征,包括:
[0037]将不同的交通参与者的所述交通参与者感知结果进行注意力交互,获取交通参与者交互特征;
[0038]将所述交通参与者交互特征与时间特征进行融合,获得交通参与者融合特征;
[0039]将所述交通参与者融合特征和所述静态环境感知结果进行注意力交互,获取所述交互编码特征

[0040]在第二方面,提供一种控制装置,该控制装置包括至少一个处理器和至少一个存储装置,所述存储装置适于存储多条程序代码,所述程序代码适于由所述处理器加载并运行以执行上述车辆轨迹预测方法的技术方案中任一项技术方案所述的车辆轨迹预测方法

[0041]在第三方面,提供一种计算机可读存储介质,该计算机可读存储介质其中存储有多条程序代码,所述程序代码适于由处理器加载并运行以执行上述车辆轨迹预测方法的技术方案中任一项技术方案所述的车辆轨迹预测方法

...

【技术保护点】

【技术特征摘要】
1.
一种车辆轨迹预测方法,其特征在于,所述方法包括:根据当前时刻所述车辆的静态环境感知结果和交通参与者感知结果,获取当前时刻所述车辆的所处环境中每个交通参与者的多个场景交互结果;其中,所述场景交互结果表示所述交通参与者的不同的交互意图;根据所有交通参与者的场景交互结果,获取初始的交互场景;其中,所述交互场景为不同的交通参与者在对应时刻的交互意图分布;根据初始的交互场景和所述车辆的自车驾驶决策进行交互场景推演,获得最优交互场景演变特征;根据所述最优交互场景演变特征和所述车辆的状态,获取所述车辆的最优行驶轨迹
。2.
根据权利要求1所述的车辆轨迹预测方法,其特征在于,所述根据初始的交互场景和所述车辆的自车驾驶决策进行交互场景推演,获得最优交互场景演变特征,包括:根据所述初始的交互场景和所述车辆的自车驾驶决策,获取未来连续多个时刻的交互场景;根据多个所述交互场景,获取所述最优交互场景演变特征
。3.
根据权利要求2所述的车辆轨迹预测方法,其特征在于,所述根据初始的交互场景和所述车辆的自车驾驶决策,获取未来连续多个时刻的交互场景,包括:针对每个时刻,根据所述上一时刻的交互场景和所述车辆的自车驾驶决策,获取当前时刻的多个交互场景;根据所述交互场景的场景价值,获取当前时刻场景价值最大的交互场景,作为当前时刻的最终的交互场景,从而获得未来连续多个时刻的交互场景
。4.
根据权利要求3所述的车辆轨迹预测方法,其特征在于,所述方法还包括根据以下步骤确定所述交互场景的场景价值:通过训练好的预设的博弈价值网络,获取所述交互场景的价值;其中,训练好的所述博弈价值网络是根据标注的人类驾驶行为数据进行训练获得,训练好的所述博弈价值网络对符合人类驾驶行为的交互场景赋予更高的场景价值
。5.
根据权利要求4所述的车辆轨迹预测方法,其特征在于,所述根据多个所述交互场景,获取所述最优交互场景演变特征,包括:根据多个所述交互场景,获取每个交互场景的语义决策空间和可行域凸空间;其中,所述语义决策空间包括场景价值最高的交互场景中交通参与者的交互意图;所述可行域凸空间为所述交互意图的时间和空间的约束条件;将所述语义决策空间和所述可行域凸空间作为所述最优交互场景演变特征
。6.
根据权利要求5所述的车辆...

【专利技术属性】
技术研发人员:樊昊阳秦海龙任少卿马静远孙钢郑少华李秋逸付骁鑫
申请(专利权)人:安徽蔚来智驾科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1