无人车的驾驶决策方法、装置及无人车制造方法及图纸

技术编号:35496935 阅读:26 留言:0更新日期:2022-11-05 16:56
本公开提供了一种无人车的驾驶决策方法、装置、电子设备、存储介质及程序产品,涉及人工智能技术领域,具体涉及自动驾驶技术领域。具体实现方案为:确定目标无人车和目标无人车周围的交通参与者之间的当前状态信息;基于当前状态信息,模拟推演目标无人车和交通参与者之间的交互过程,得到合作博弈树;根据合作博弈树,确定目标无人车的决策指令。本公开解决了交通博弈交互场景中,其他的交通参与者的行为预测问题和自车的行为决策问题,保证了无人车的安全性和舒适性。的安全性和舒适性。的安全性和舒适性。

【技术实现步骤摘要】
无人车的驾驶决策方法、装置及无人车


[0001]本公开涉及人工智能
,具体涉及自动驾驶
,尤其涉及无人车的驾驶决策方法、装置、电子设备、存储介质、计算机程序产品以及无人车,可用于自动驾驶场景下。

技术介绍

[0002]目前,在车辆的交互场景下,自动驾驶车辆一般通过预测他车轨迹进行让车、超车判定,这种方式对博弈交互场景中他车行为的不确定性处理能力较弱,难以保证驾驶过程的安全性和舒适性。

技术实现思路

[0003]本公开提供了一种无人车的驾驶决策方法、装置、电子设备、存储介质、计算机程序产品以及无人车。
[0004]根据第一方面,提供了一种无人车的驾驶决策方法,包括:确定目标无人车和目标无人车周围的交通参与者之间的当前状态信息;基于当前状态信息,模拟推演目标无人车和交通参与者之间的交互过程,得到合作博弈树;根据合作博弈树,确定目标无人车的决策指令。
[0005]根据第二方面,提供了一种无人车的驾驶决策装置,包括:第一确定单元,被配置成确定目标无人车和目标无人车周围的交通参与者之间的当前状态信息;得到单元,被配置成基于当前状态信息,模拟推演目标无人车和交通参与者之间的交互过程,得到合作博弈树;第二确定单元,被配置成根据合作博弈树,确定目标无人车的决策指令。
[0006]根据第三方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面任一实现方式描述的方法。
[0007]根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面任一实现方式描述的方法。
[0008]根据第五方面,提供了一种计算机程序产品,包括:计算机程序,计算机程序在被处理器执行时实现如第一方面任一实现方式描述的方法。
[0009]根据第六方面,提供了一种无人车,包括:如第三方面描述的电子设备。
[0010]根据本公开的技术,提供了一种无人车的驾驶决策方法,基于目标无人车和周围的交通参与者之间的当前状态信息,模拟推演目标无人车和交通参与者之间的交互过程,得到合作博弈树,以根据合作博弈树确定无人车的决策指令,解决了交通博弈交互场景中,其他的交通参与者的行为预测问题和自车的行为决策问题,保证了无人车的安全性和舒适性。
[0011]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0012]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0013]图1是根据本公开的一个实施例可以应用于其中的示例性系统架构图;
[0014]图2是根据本公开的无人车的驾驶决策方法的一个实施例的流程图;
[0015]图3是根据本实施例的无人车的驾驶决策方法的应用场景的示意图;
[0016]图4是根据本实施例的基于置信区间上界算法的蒙特卡洛采样方式构建合作博弈树的流程图;
[0017]图5是根据本公开的无人车的驾驶决策方法的又一个实施例的流程图;
[0018]图6是根据本公开的无人车的驾驶决策装置的一个实施例的结构图;
[0019]图7是适于用来实现本公开实施例的计算机系统的结构示意图。
具体实施方式
[0020]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0021]本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
[0022]图1示出了可以应用本公开的无人车的驾驶决策方法及装置的示例性架构100。
[0023]如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。终端设备101、102、103之间通信连接构成拓扑网络,网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0024]终端设备101、102、103可以是支持网络连接从而进行数据交互和数据处理的硬件设备或软件。当终端设备101、102、103为硬件时,其可以是支持网络连接,信息获取、交互、显示、处理等功能的各种电子设备,包括但不限于车载电脑、智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成例如用来提供分布式服务的多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
[0025]服务器105可以是提供各种服务的服务器,例如,根据终端设备101、102、103提供的环境图像、位置等信息,确定目标无人车和周围的交通参与者之间的当前状态信息,进而推演得到合作博弈树,以确定目标无人车的决策指令的后台处理服务器。作为示例,服务器105可以是云端服务器。
[0026]需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务的软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
[0027]还需要说明的是,本公开的实施例所提供的无人车的驾驶决策方法可以由服务器执行,也可以由终端设备执行,还可以由服务器和终端设备彼此配合执行。相应地,无人车
的驾驶决策装置包括的各个部分(例如各个单元)可以全部设置于服务器中,也可以全部设置于终端设备中,还可以分别设置于服务器和终端设备中。
[0028]应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。当无人车的驾驶决策方法运行于其上的电子设备不需要与其他电子设备进行数据传输时,该系统架构可以仅包括无人车的驾驶决策方法运行于其上的电子设备(例如服务器或终端设备)。
[0029]请参考图2,图2为本公开实施例提供的一种无人车的驾驶决策方法的流程图,其中,流程200包括以下步骤:
[0030]步骤201,确定目标无人车和目标无人车周围的交通参与者之间的当前状态信息。
[0031]本实施例中,无人车的驾驶决策方法的执行主体(例如,图1中的终端设备或服务器)可以确定目标无人车和目标无人车周围的交通参与者之间的当前状态信息。
[0032]本实施例中,可以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种无人车的驾驶决策方法,包括:确定目标无人车和所述目标无人车周围的交通参与者之间的当前状态信息;基于所述当前状态信息,模拟推演所述目标无人车和所述交通参与者之间的交互过程,得到合作博弈树;根据所述合作博弈树,确定所述目标无人车的决策指令。2.根据权利要求1所述的方法,其中,所述基于所述当前状态信息,模拟推演所述目标无人车和所述交通参与者之间的交互过程,得到合作博弈树,包括:基于所述当前状态信息,对所述目标无人车的运行信息和所述交通参与者的运行信息进行蒙特卡洛采样,以模拟推演所述目标无人车和所述交通参与者之间的交互过程,得到所述合作博弈树。3.根据权利要求2所述的方法,其中,所述基于所述当前状态信息,对所述目标无人车的运行信息和所述交通参与者的运行信息进行蒙特卡洛采样,以模拟推演所述目标无人车和所述交通参与者之间的交互过程,得到所述合作博弈树,包括:基于所述当前状态信息,采用置信区间上界算法,对所述目标无人车的运行信息和所述交通参与者的运行信息进行蒙特卡洛采样,以模拟推演所述目标无人车和所述交通参与者之间的交互过程,得到所述合作博弈树。4.根据权利要求3所述的方法,其中,所述基于所述当前状态信息,采用置信区间上界算法,对所述目标无人车的运行信息和所述交通参与者的运行信息进行蒙特卡洛采样,以模拟推演所述目标无人车和所述交通参与者之间的交互过程,得到所述合作博弈树,包括:以所述当前状态信息为所述合作博弈树中的根结点,从所述根结点的子结点开始,循环执行如下结点扩展操作,以得到所述合作博弈树:响应于确定当前结点是叶子结点,且已经推演过所述目标无人车和所述交通参与者之间,始于当前结点所表征的状态信息,止于预设结束状态信息的交替运行过程,在当前结点所表征的状态信息的基础上,根据所述目标无人车和所述交通参与者之间的多种交互操作,得到当前结点的子结点,其中,子结点表征父结点所对应的状态信息预设时间步长后的更新后状态信息;将当前结点的子结点添加至所述合作博弈树;将当前结点的子结点中的第一目标子结点,确定为下一次结点扩展操作的当前结点。5.根据权利要求4所述的方法,其中,所述结点扩展操作还包括:响应于确定当前结点不是叶子结点,根据当前结点的子结点的置信区间上界值,从当前结点的子结点中确定出第二目标子结点,作为下一次结点扩展操作的当前结点。6.根据权利要求4所述的方法,其中,所述结点扩展操作还包括:响应于确定当前结点是叶子结点,且当前结点未被推演过,推演所述目标无人车和所述交通参与者之间,始于当前结点所表征的状态信息,止于所述预设结束状态信息的交替运行过程;根据所述交替运行过程,更新当前结点对应的推演路径上的结点的置信区间上界值,其中,所述推演路径表征基于当前结点向上追溯父结点,直至追溯到根结点的子结点而得到的路径信息。7.根据权利要求1

6中任一项所述的方法,其中,所述根据所述合作博弈树,确定所述
目标无人车的决策指令,包括:根据所述合作博弈树中各结点对应的状态信息和推演路径,确定各结点对应的效用信息;根据各结点对应的效用信息,确定所述目标无人车的决策指令。8.根据权利要求7所述的方法,其中,所述根据各结点对应的效用信息,确定所述目标无人车的决策指令,包括:根据各结点对应的效用信息和推演路径,确定所述合作博弈树中,表征所述目标无人车在当前状态信息下的决策动作的结点的期望效用;根据所述期望效用,确定所述目标无人车的决策指令。9.一种无人车的驾驶决策装置,包括:第一确定单元,被配置成确定目标无人车和所述目标无人车周围的交通参与者之间的当前状态信息;得到单元,被配置成基于...

【专利技术属性】
技术研发人员:柳长春李一贤张宇杰赵昊玮彭亮
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1