机器人调度奖励方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36511803 阅读:26 留言:0更新日期:2023-02-01 15:40
本申请提供一种机器人调度奖励方法、装置、电子设备及存储介质。该方法包括:获取预设时间间隔内的业务请求,根据业务请求生成调度任务,并确定地图信息;根据调度任务,对地图信息执行节点化操作,得到调度任务对应的主节点,对主节点进行划分得到子节点;依据预定的调度奖励计算方式,计算相邻子节点以及相邻主节点之间的调度收益奖励值;根据机器人的位置信息、状态信息以及主节点,生成机器人对应的调度行驶路径;依据相邻子节点以及相邻主节点之间的调度收益奖励值,确定每个调度行驶路径对应的总调度收益奖励值。本申请提升机器人调度系统的调度能力,提升机器人的调度效率,提升机器人的智能化服务水平。升机器人的智能化服务水平。升机器人的智能化服务水平。

【技术实现步骤摘要】
机器人调度奖励方法、装置、电子设备及存储介质


[0001]本申请涉及机器人
,尤其涉及一种机器人调度奖励方法、装置、电子设备及存储介质。

技术介绍

[0002]随着数字化和智能化技术在各个领域的深入发展,更多的智能化设备在酒店、商场、写字楼等场景下得到广泛应用。智能机器人作为智能化设备中使用频率较高的一种设备,能够实现酒店客户提供诸如送物、迎宾、巡游等服务。利用酒店机器人提供送物服务,不仅降低酒店工作人员的劳动量,而且提升酒店的智能化服务水平。
[0003]在商用机器人的调度场景中,例如酒店、楼宇等场景下提供服务的机器人,机器人在执行调度任务时,在机器人的行驶过程中,通常需要借助垂直运力,比如电梯等的帮助,并且还可能经过场地内的一些闸机。因此,商用机器人的调度并非简单的在两点之间做平移运动,随着调度需求以及机器人数量的增加,需要在一定的空间区域内为机器人找到最优的调度方案。目前,现有的机器人调度系统无法通过奖励的方式实现机器人的调度,因此,无法得到全局最优的调度方案,降低机器人调度系统的调度能力。

技术实现思路

[0004]有鉴于此,本申请实施例提供了一种机器人调度奖励方法、装置、电子设备及存储介质,以解决现有技术存在的现有的机器人调度系统无法通过奖励的方式实现机器人的调度,因此,无法得到全局最优的调度方案,降低机器人调度系统的调度能力的问题。
[0005]本申请实施例的第一方面,提供了一种机器人调度奖励方法,包括:获取预设时间间隔内的业务请求,根据业务请求生成调度任务,并确定调度任务对应场景的地图信息;根据调度任务,对地图信息执行节点化操作,得到调度任务对应的主节点,并对主节点进行划分得到子节点;依据预定的调度奖励计算方式,计算相邻子节点以及相邻主节点之间的调度收益奖励值;响应于调度触发请求,获取当前时刻机器人的位置信息和状态信息,根据机器人的位置信息、状态信息以及主节点,生成机器人对应的调度行驶路径;依据相邻子节点以及相邻主节点之间的调度收益奖励值,确定每个调度行驶路径对应的总调度收益奖励值。
[0006]本申请实施例的第二方面,提供了一种机器人调度奖励装置,包括:获取模块,被配置为获取预设时间间隔内的业务请求,根据业务请求生成调度任务,并确定调度任务对应场景的地图信息;划分模块,被配置为根据调度任务,对地图信息执行节点化操作,得到调度任务对应的主节点,并对主节点进行划分得到子节点;计算模块,被配置为依据预定的调度奖励计算方式,计算相邻子节点以及相邻主节点之间的调度收益奖励值;生成模块,被配置为响应于调度触发请求,获取当前时刻机器人的位置信息和状态信息,根据机器人的位置信息、状态信息以及主节点,生成机器人对应的调度行驶路径;确定模块,被配置为依据相邻子节点以及相邻主节点之间的调度收益奖励值,确定每个调度行驶路径对应的总调
度收益奖励值。
[0007]本申请实施例的第三方面,提供了一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现上述方法的步骤。
[0008]本申请实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
[0009]本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:通过获取预设时间间隔内的业务请求,根据业务请求生成调度任务,并确定调度任务对应场景的地图信息;根据调度任务,对地图信息执行节点化操作,得到调度任务对应的主节点,并对主节点进行划分得到子节点;依据预定的调度奖励计算方式,计算相邻子节点以及相邻主节点之间的调度收益奖励值;响应于调度触发请求,获取当前时刻机器人的位置信息和状态信息,根据机器人的位置信息、状态信息以及主节点,生成机器人对应的调度行驶路径;依据相邻子节点以及相邻主节点之间的调度收益奖励值,确定每个调度行驶路径对应的总调度收益奖励值。本申请能够通过调度收益奖励计算的方式,为执行调度任务的机器人确定最优的调度行驶路径,提升机器人调度系统的调度能力,提升机器人的调度效率,提升机器人的智能化服务水平。
附图说明
[0010]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0011]图1是本申请实施例提供的机器人调度奖励方法的流程示意图;图2是本申请实施例提供的机器人调度奖励装置的结构示意图;图3是本申请实施例提供的电子设备的结构示意图。
具体实施方式
[0012]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
[0013]本申请实施例是以酒店应用场景为例,并以酒店中的机器人的任务调度为例进行详细描述,但是应当理解的是,本申请实施例不限于酒店应用场景,也不限于对酒店机器人的远程任务调度,其他任何对机器人进行远程调度的场景均适用于本方案,例如物流场景下的机器人调度,楼宇场景下的机器人调度等。
[0014]下面结合具体实施例对本申请技术方案进行详细说明。
[0015]图1是本申请实施例提供的机器人调度奖励方法的流程示意图。图1的机器人调度奖励方法可以由机器人调度系统来执行。如图1所示,该机器人调度奖励方法具体可以包括:S101,获取预设时间间隔内的业务请求,根据业务请求生成调度任务,并确定调度
任务对应场景的地图信息;S102,根据调度任务,对地图信息执行节点化操作,得到调度任务对应的主节点,并对主节点进行划分得到子节点;S103,依据预定的调度奖励计算方式,计算相邻子节点以及相邻主节点之间的调度收益奖励值;S104,响应于调度触发请求,获取当前时刻机器人的位置信息和状态信息,根据机器人的位置信息、状态信息以及主节点,生成机器人对应的调度行驶路径;S105,依据相邻子节点以及相邻主节点之间的调度收益奖励值,确定每个调度行驶路径对应的总调度收益奖励值。
[0016]具体地,本申请实施例的调度收益奖励值是指机器人调度系统根据调度任务,在虚拟的场景地图中模拟机器人在主节点以及中间节点之间的行走路径,根据机器人在相同的历史时间段内在该路径上的相邻节点之间的通行速度来计算得到的奖励值,其中,调度收益奖励值越高说明机器人沿该行走路径执行调度任务可以达到更优的结果。本申请通过调度收益奖励值来衡量机器人行走路径的优劣,当执行调度任务的所有机器人的行走路径的调度收益奖励值总和最大时,便得到了最优的调度方案。
[0017]在一些实施例中,获取预设时间间隔内的业务请求,根据业务请求生成调度任务,并确定调度任务对应场本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种机器人调度奖励方法,其特征在于,包括:获取预设时间间隔内的业务请求,根据所述业务请求生成调度任务,并确定所述调度任务对应场景的地图信息;根据所述调度任务,对所述地图信息执行节点化操作,得到所述调度任务对应的主节点,并对所述主节点进行划分得到子节点;依据预定的调度奖励计算方式,计算相邻子节点以及相邻主节点之间的调度收益奖励值;响应于调度触发请求,获取当前时刻机器人的位置信息和状态信息,根据所述机器人的位置信息、状态信息以及所述主节点,生成所述机器人对应的调度行驶路径;依据所述相邻子节点以及相邻主节点之间的调度收益奖励值,确定每个所述调度行驶路径对应的总调度收益奖励值。2.根据权利要求1所述的方法,其特征在于,所述获取预设时间间隔内的业务请求,根据所述业务请求生成调度任务,并确定所述调度任务对应场景的地图信息,包括:在每个所述时间间隔内,接收用户端发送的业务请求,根据所述业务请求生成调度任务,依据所述调度任务,从预先存储的地图中获取所述调度任务对应场景的地图信息;其中,所述业务请求包括送物请求,所述送物请求中包含物品信息、支付信息、时间信息和目的位置信息。3.根据权利要求2所述的方法,其特征在于,所述根据所述调度任务,对所述地图信息执行节点化操作,得到所述调度任务对应的主节点,并对所述主节点进行划分得到子节点,包括:根据所述调度任务中的起始位置信息和目的位置信息,对所述地图信息执行节点化操作,以便将地图节点化成若干个主节点,按照预设的距离或时间,对相邻主节点之间进行节点划分,得到相邻主节点之间的子节点;其中,所述主节点包括起始节点、目的节点和中间节点,所述中间节点包括电梯节点和闸机节点。4.根据权利要求1所述的方法,其特征在于,所述依据预定的调度奖励计算方式,计算相邻子节点以及相邻主节点之间的调度收益奖励值,包括:获取历史相同时间段内的机器人在所述相邻主节点及所述相邻子节点之间的历史环境平均速度和历史通行时间,基于所述历史环境平均速度以及所述历史通行时间计算所述相邻主节点及所述相邻子节点对应的调度收益奖励值;其中,所述历史环境平均速度用于表征历史相同时间段内机器人在所述相邻主节点及所述相邻子节点的区域的拥堵程度。5.根据权利要求4所述的方法,其特征在于,利用以下公式计算所述相邻主节点及所述相邻子节点对...

【专利技术属性】
技术研发人员:龚汉越支涛
申请(专利权)人:北京云迹科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1