【技术实现步骤摘要】
无人车的驾驶决策方法、装置及无人车
[0001]本公开涉及人工智能
,具体涉及自动驾驶
,尤其涉及无人车的驾驶决策方法、装置、电子设备、存储介质、计算机程序产品以及无人车,可用于自动驾驶场景下。
技术介绍
[0002]目前,在车辆的交互场景下,自动驾驶车辆一般通过预测他车轨迹进行让车、超车判定,这种方式对博弈交互场景中他车行为的不确定性处理能力较弱,难以保证驾驶过程的安全性和舒适性。
技术实现思路
[0003]本公开提供了一种无人车的驾驶决策方法、装置、电子设备、存储介质、计算机程序产品以及无人车。
[0004]根据第一方面,提供了一种无人车的驾驶决策方法,包括:确定目标无人车和目标无人车周围的交通参与者之间的当前状态信息;基于当前状态信息,模拟推演目标无人车和交通参与者之间的交互过程,得到合作博弈树;根据合作博弈树,确定目标无人车的决策指令。
[0005]根据第二方面,提供了一种无人车的驾驶决策装置,包括:第一确定单元,被配置成确定目标无人车和目标无人车周围的交通参与者之间的当前状态信息;得到单元,被配置成基于当前状态信息,模拟推演目标无人车和交通参与者之间的交互过程,得到合作博弈树;第二确定单元,被配置成根据合作博弈树,确定目标无人车的决策指令。
[0006]根据第三方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面任 ...
【技术保护点】
【技术特征摘要】
1.一种无人车的驾驶决策方法,包括:确定目标无人车和所述目标无人车周围的交通参与者之间的当前状态信息;基于所述当前状态信息,模拟推演所述目标无人车和所述交通参与者之间的交互过程,得到合作博弈树;根据所述合作博弈树,确定所述目标无人车的决策指令。2.根据权利要求1所述的方法,其中,所述基于所述当前状态信息,模拟推演所述目标无人车和所述交通参与者之间的交互过程,得到合作博弈树,包括:基于所述当前状态信息,对所述目标无人车的运行信息和所述交通参与者的运行信息进行蒙特卡洛采样,以模拟推演所述目标无人车和所述交通参与者之间的交互过程,得到所述合作博弈树。3.根据权利要求2所述的方法,其中,所述基于所述当前状态信息,对所述目标无人车的运行信息和所述交通参与者的运行信息进行蒙特卡洛采样,以模拟推演所述目标无人车和所述交通参与者之间的交互过程,得到所述合作博弈树,包括:基于所述当前状态信息,采用置信区间上界算法,对所述目标无人车的运行信息和所述交通参与者的运行信息进行蒙特卡洛采样,以模拟推演所述目标无人车和所述交通参与者之间的交互过程,得到所述合作博弈树。4.根据权利要求3所述的方法,其中,所述基于所述当前状态信息,采用置信区间上界算法,对所述目标无人车的运行信息和所述交通参与者的运行信息进行蒙特卡洛采样,以模拟推演所述目标无人车和所述交通参与者之间的交互过程,得到所述合作博弈树,包括:以所述当前状态信息为所述合作博弈树中的根结点,从所述根结点的子结点开始,循环执行如下结点扩展操作,以得到所述合作博弈树:响应于确定当前结点是叶子结点,且已经推演过所述目标无人车和所述交通参与者之间,始于当前结点所表征的状态信息,止于预设结束状态信息的交替运行过程,在当前结点所表征的状态信息的基础上,根据所述目标无人车和所述交通参与者之间的多种交互操作,得到当前结点的子结点,其中,子结点表征父结点所对应的状态信息预设时间步长后的更新后状态信息;将当前结点的子结点添加至所述合作博弈树;将当前结点的子结点中的第一目标子结点,确定为下一次结点扩展操作的当前结点。5.根据权利要求4所述的方法,其中,所述结点扩展操作还包括:响应于确定当前结点不是叶子结点,根据当前结点的子结点的置信区间上界值,从当前结点的子结点中确定出第二目标子结点,作为下一次结点扩展操作的当前结点。6.根据权利要求4所述的方法,其中,所述结点扩展操作还包括:响应于确定当前结点是叶子结点,且当前结点未被推演过,推演所述目标无人车和所述交通参与者之间,始于当前结点所表征的状态信息,止于所述预设结束状态信息的交替运行过程;根据所述交替运行过程,更新当前结点对应的推演路径上的结点的置信区间上界值,其中,所述推演路径表征基于当前结点向上追溯父结点,直至追溯到根结点的子结点而得到的路径信息。7.根据权利要求1
‑
6中任一项所述的方法,其中,所述根据所述合作博弈树,确定所述
目标无人车的决策指令,包括:根据所述合作博弈树中各结点对应的状态信息和推演路径,确定各结点对应的效用信息;根据各结点对应的效用信息,确定所述目标无人车的决策指令。8.根据权利要求7所述的方法,其中,所述根据各结点对应的效用信息,确定所述目标无人车的决策指令,包括:根据各结点对应的效用信息和推演路径,确定所述合作博弈树中,表征所述目标无人车在当前状态信息下的决策动作的结点的期望效用;根据所述期望效用,确定所述目标无人车的决策指令。9.一种无人车的驾驶决策装置,包括:第一确定单元,被配置成确定目标无人车和所述目标无人车周围的交通参与者之间的当前状态信息;得到单元,被配置成基于...
【专利技术属性】
技术研发人员:柳长春,李一贤,张宇杰,赵昊玮,彭亮,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。