本公开提供了一种基于车路协同的信号管控方法、相关装置及程序产品,涉及车路协同、智能体、信号管控等技术领域,可应用于智慧交通场景。该方法包括:将管控网络内的交通信号灯、智能车和处于导航模式下的地图应用,分别作为第一智能体、第二智能体和第三智能体,各类型的智能体均预设有与其所属类型对应的应执行动作;获取管控网络内当前的通行状态参数集;基于随机博弈思想和预设的以管控网络内的全部人、全部车辆的总通行时长最少的奖励函数,在各智能体对应的各应执行动作中确定与通行状态参数集对应的目标应执行动作;将各智能体的目标应执行动作下发给相应的各智能体。应用该方案可以使管控网络内各对象的总通行时长最短。最短。最短。
【技术实现步骤摘要】
基于车路协同的信号管控方法、相关装置及程序产品
[0001]本公开涉及数据处理
,具体涉及车路协同、智能体、信号管控等
,可应用于智慧交通场景,尤其涉及一种基于车路协同的信号管控方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
技术介绍
[0002]交通拥堵是一个日益严重的问题,它继续困扰着城市地区,给出行的公众和整个社会带来负面影响。
[0003]随着越来越多的人涌向城市地区,这些负面影响只会随着时间的推移而增加。缓解拥堵将带来巨大的经济、环境和社会效益。交叉路口的信号灯控制效果差是导致城市交通拥堵最常见的问题之一,因此交通信号控制在城市交通管理中起着至关重要的作用。
技术实现思路
[0004]本公开实施例提出了一种基于车路协同的信号管控方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
[0005]第一方面,本公开实施例提出了一种基于车路协同的信号管控方法,包括:将管控网络内的交通信号灯、智能车和处于导航模式下的地图应用,分别作为第一智能体、第二智能体和第三智能体,各类型的智能体均预设有与其所属类型对应的应执行动作,各类型的应执行动作均用于降低总通行时长;获取管控网络内当前的通行状态参数集;基于随机博弈思想和预设的奖励函数,在各智能体对应的各应执行动作中确定与通行状态参数集对应的目标应执行动作,奖励函数为:管控网络内的全部人、全部车辆的总通行时长最少;将各智能体的目标应执行动作下发给相应的各智能体,以使各智能体执行接收到的目标应执行动作。
[0006]第二方面,本公开实施例提出了一种基于车路协同的信号管控装置,包括:智能体封装单元,被配置成将管控网络内的交通信号灯、智能车和处于导航模式下的地图应用,分别作为第一智能体、第二智能体和第三智能体,各类型的智能体均预设有与其所属类型对应的应执行动作,各类型的应执行动作均用于降低总通行时长;通行状态参数集获取单元,被配置成获取管控网络内当前的通行状态参数集;目标应执行动作确定单元,被配置成基于随机博弈思想和预设的奖励函数,在各智能体对应的各应执行动作中确定与通行状态参数集对应的目标应执行动作,奖励函数为:管控网络内的全部人、全部车辆的总通行时长最少;目标应执行动作下发单元,被配置成将各智能体的目标应执行动作下发给相应的各智能体,以使各智能体执行接收到的目标应执行动作。
[0007]第三方面,本公开实施例提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器执行时能够实现如第一方面中任一实现方式描述的基于车路协同的信号管控方法。
[0008]第四方面,本公开实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行时能够实现如第一方面中任一实现方式描述的基于车路协同的信号管控方法。
[0009]第五方面,本公开实施例提供了一种包括计算机程序的计算机程序产品,该计算机程序在被处理器执行时能够实现如第一方面中任一实现方式描述的基于车路协同的信号管控方法。
[0010]本公开提供的基于车路协同的信号管控的方案,在当前已经能够通过高速通信网络获取车、路各方足够信息的前提下,旨在利用随机博弈思想,通过在将智能车、路口信号灯、处于导航模式下的地图应用作为不同智能体,并以设计的科学合理的奖励函数来指导确定每个智能体在当前通行状态下最优的应执行动作,进而使每个智能体通过执行目标应执行动作来共同使得总通行时间最短。
[0011]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0012]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
[0013]图1是本公开可以应用于其中的示例性系统架构;
[0014]图2为本公开实施例提供的一种基于车路协同的信号管控方法的流程图;
[0015]图3为本公开实施例提供的另一种基于车路协同的信号管控方法的流程图;
[0016]图4为本公开实施例提供的一种确定目标应执行动作的方法的流程图;
[0017]图5为本公开实施例提供的一种基于车路协同的信号管控装置的结构框图;
[0018]图6为本公开实施例提供的一种适用于执行基于车路协同的信号管控方法的电子设备的结构示意图。
具体实施方式
[0019]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
[0020]本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
[0021]图1示出了可以应用本公开的基于车路协同的信号管控方法、装置、电子设备及计算机可读存储介质的实施例的示例性系统架构100。
[0022]如图1所示,系统架构100可以包括交通信号灯101、智能车102、安装有可以提供导航功能的地图应用的导航设备103,网络104和服务器105。网络104用以在交通信号灯101、智能车102、导航设备103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0023]用户可以使用交通信号灯101、智能车102、导航设备103通过网络104与服务器105交互,以接收或发送消息等。交通信号灯101、智能车102、导航设备103和服务器105上可以安装有各种用于实现两者之间进行信息通讯的应用,例如状态信息传输类应用、交通管控类应用、即时通讯类应用等。
[0024]导航设备103可以表现为软件,也可以表现为硬件。当导航设备103为硬件时,可以是具有导航功能的各种电子设备,包括但不限于智能手机、平板电脑、车载终端、膝上型便携计算机和台式计算机等等;当导航设备103为软件时,可以安装在上述所列举的电子设备中,其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块,在此不做具体限定。
[0025]服务器105可以是硬件,也可以是软件。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器;服务器为软件时,可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块,在此不做具体限定。
[0026]服务器105通过内置的各种应用可以提供各种服务,以可以提供交通管控类服务的交通管控类应用为例,服务器105在本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于车路协同的信号管控方法,包括:将管控网络内的交通信号灯、智能车和处于导航模式下的地图应用,分别作为第一智能体、第二智能体和第三智能体,各类型的智能体均预设有与其所属类型对应的应执行动作,各类型的应执行动作均用于降低总通行时长;获取所述管控网络内当前的通行状态参数集;基于随机博弈思想和预设的奖励函数,在各所述智能体对应的各应执行动作中确定与所述通行状态参数集对应的目标应执行动作,所述奖励函数为:所述管控网络内的全部人、全部车辆的总通行时长最少;将各所述智能体的目标应执行动作下发给相应的各智能体,以使各所述智能体执行接收到的目标应执行动作。2.根据权利要求1所述的方法,还包括:将在第一预设时刻变换信号灯的状态,设置为由所述交通信号灯充当的第一智能体的应执行动作,所述状态包括:信号灯的颜色和/或指示方向。3.根据权利要求1所述的方法,还包括:将在第二预设时刻的行驶参数,设置为由所述智能车充当的第二智能体的应执行动作,所述行驶参数包括:行驶速度和行驶方向。4.根据权利要求1所述的方法,还包括:将在第三预设时刻变更原定导航线路至新导航线路,设置为由所述地图应用充当的第三智能体的应执行动作,所述新导航新路为在当前的通行状态参数集所表征的通行状态下能够使总通行时长更短的导航线路。5.根据权利要求1所述的方法,其中,所述通行状态参数集包括以下至少一项:队列长度、等待时长,车流量、车辆延误时间、车辆速度和车辆位置、信号灯当前状态、所述信号灯当前状态的持续时间。6.根据权利要求1所述的方法,其中,所述第一智能体、所述第二智能体和所述第三智能体之间,预先通过通信学习的方式进行多智能体的强化学习。7.根据权利要求1
‑
6任一项所述的方法,其中,所述基于随机博弈思想和预设的奖励函数,在各所述智能体对应的各应执行动作中确定与所述通行状态参数集对应的目标应执行动作,包括:根据所述通行状态参数集中包含的各项通行状态参数,确定通行状态;基于所述随机博弈思想和所述奖励函数,通过无模型的方式确定与所述通行状态对应的各所述智能体的各候选应执行动作的奖励程度;将使所述管控网络内的各所述智能体的奖励程度之和最小的候选应执行动作,确定为与相应智能体的目标应执行动作。8.一种基于车路协同的信号管控装置,包括:智能体封装单元,被配置成将管控网络内的交通信号灯、智能车和处于导航模式下的地图应用,分别作为第一智能体、第二智能体和第三智能体,各类型的智能体均预设有与其所属类型对应的应执行动作,各类型的应执行动作均用于降低总通行时长;通行状态参数集获取单元,被配置成获取所述管控网络内当前的通行状态参数集;目标应执行动作确定单元,被配置成基于随机博弈思想和预设的奖励函数,...
【专利技术属性】
技术研发人员:黄际洲,孙一博,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。