System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及机器人,尤其涉及一种搜救环境下的快速搜寻路径规划方法及装置。
技术介绍
1、随着人工智能和机器人领域的发展,无人车、无人机的应用领域越来越广泛,并且开始代替人们在恶劣的环境下完成一些复杂的工作,将无人车、无人机等用于灾难后的搜救是近几年国内外研究的热点话题。
2、无人车也称为机器人,机器人在执行搜救任务时要进行路径规划,传统的路径规划算法有基于搜索的(如a,a*)方法和基于采样的(rrt,prm)方法,可以规划出从起点到终点的无碰撞路径;然而此类算法不能充分考虑环境的信息,为了使机器人能更好地执行复杂任务,必须要使它们更加智能,更能模仿人类的行为。强化学习是一种机器学习方法,在强化学习中,智能体根据环境的状态选择动作,并从环境中获得奖励或惩罚,通过不断的试错学习来改进自己的决策策略,以获得更好的长期回报;通过对状态、奖励、动作等进行建模,可以训练机器人执行复杂的任务;然而该方法也有着很大的缺点,如需要通过智能体与环境的交互学习,需要大量的交互数据,这在有些任务中是非常昂贵和耗时的。
3、现有的机器人在搜救任务中虽然可实现路径的规划,但是现有的路径规划算法需要机器人在已知环境地图或者对工作环境熟悉的情况下进行工作,这限制了其在未知陌生环境下的工作能力,从而现有的机器人在搜救任务中,在未知环境下无法完成搜救工作。因此,在未知环境下如何使机器人完成全自主边探索边建图的搜寻工作,提高机器人在搜救环境中的适应能力是亟待解决的技术问题。
技术实现思路
1、
2、本专利技术的一个方面,提供了一种搜救环境下的快速搜寻路径规划方法,所述方法包括:
3、确定搜救区域,将所述搜救区域划分为多个栅格,构建各所述栅格对应的pomdp七元组信息,所述pomdp七元组信息包括有限状态集合、有限动作集合、状态转移矩阵、奖励、有限观测集合、观察概率以及折扣系数;
4、实时获取搜救机器人的当前位置信息以及所述搜救机器人的周边地图环境信息,基于所述搜救机器人的当前位置信息确定所述搜救机器人当前所在栅格,基于所述当前所在栅格对应的pomdp七元组信息通过部分可观察马尔可夫决策算法确定所述搜救机器人下一步的目标栅格;
5、基于所述搜救机器人下一步的目标栅格以及所述搜救机器人的周边地图环境信息确定所述搜救机器人的搜寻路径。
6、在本专利技术的一些实施例中,构建各所述栅格对应的pomdp七元组信息,包括:
7、确定各所述栅格对应的搜救优先级,基于所述栅格对应的搜救优先级确定所述状态集合;
8、确定所述栅格的相邻栅格,基于所述相邻栅格确定所述有限动作集合;
9、基于所述栅格中是否存在被困人员确定所述栅格对应的有限观测集合。
10、在本专利技术的一些实施例中,基于所述当前所在栅格对应的pomdp七元组信息通过部分可观察马尔可夫决策算法确定所述搜救机器人下一步的目标栅格,包括:
11、基于获取到的所述搜救机器人的周边地图环境信息确定可通行区域;
12、基于所述当前所在栅格对应的pomdp七元组信息和所述可通行区域通过部分可观察马尔可夫决策算法确定所述搜救机器人下一步的目标栅格。
13、在本专利技术的一些实施例中,基于获取到的所述搜救机器人的周边地图环境信息确定可通行区域,包括:
14、获取各栅格的中心点,将各所述中心点作为各边界点;
15、基于所述周边地图环境信息确定边界点之间的连接关系,所述连接关系为连通、非连通或未知;
16、基于所述边界点之间的连接关系确定可通行区域。
17、在本专利技术的一些实施例中,实时获取搜救机器人的当前位置信息以及所述搜救机器人的周边地图环境信息,包括:
18、基于即时定位与地图构建方法实时获取搜救机器人的当前位置信息以及所述搜救机器人的周边地图环境信息。
19、在本专利技术的一些实施例中,基于所述搜救机器人下一步的目标栅格以及所述搜救机器人的周边地图环境信息确定所述搜救机器人的搜寻路径,包括:
20、基于所述搜救机器人下一步的目标栅格以及所述搜救机器人的周边地图环境信息通过机器人自主导航算法确定所述搜救机器人的搜寻路径。
21、在本专利技术的一些实施例中,所述搜救机器人为多个,多个所述搜救机器人均与共同信息处理节点通信,且多个所述搜救机器人之间共享当前位置信息、周边地图环境信息以及搜寻路径。
22、在本专利技术的一些实施例中,多个所述搜救机器人之间共享当前位置信息、周边地图环境信息以及搜寻路径,包括:
23、获取各所述搜救机器人对应的当前位置信息、周边地图环境信息以及搜寻路径;
24、将各所述搜救机器人对应的当前位置信息、周边地图环境信息以及搜寻路径基于所述共同信息处理节点进行融合得到融合信息;
25、将所述融合信息发送至各所述搜救机器人。
26、根据本专利技术的另一方面,还公开了一种搜救环境下的快速搜寻路径规划系统,所述系统包括处理器、存储器及存储在存储器上的计算机程序,所述处理器用于执行所述计算机程序,当所述计算机程序被执行时该系统实现如上任一实施例所述方法的步骤。
27、根据本专利技术的再一方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上任一实施例所述方法的步骤。
28、本专利技术上述实施例公开的搜救环境下的快速搜寻路径规划方法及装置,首先将搜救环境进行网格划分,再对各网格进行pomdp七元组信息构建,从而基于部分可观察马尔可夫决策算法计算出搜救机器人下一步奖励最大的动作;并且在搜救过程中,采用边建图边探索的方法,完成搜寻路径的规划。该方法能够在环境部分可知和地图未知的情况下实现全自主边探索边建图的搜寻操作,提高了机器人在搜救环境中的适应能力。
29、另外,本申请中的快速搜寻路径规划方法可以使用多个搜救机器人协同工作,并且多个搜救机器人共享当前位置信息、周边地图环境信息以及搜寻路径,该方法进一步的提高了搜救效率,减少了搜救时间。
30、本专利技术的附加优点、目的,以及特征将在下面的描述中将部分地加以阐述,且将对于本领域普通技术人员在研究下文后部分地变得明显,或者可以根据本专利技术的实践而获知。本专利技术的目的和其它优点可以通过在说明书以及附图中具体指出的结构实现到并获得。
31、本领域技术人员将会理解的是,能够用本专利技术实现的目的和优点不限于以上具体所述,并且根据以下详细说明将更清楚地理解本专利技术能够实现的上述和其他目的。
本文档来自技高网...【技术保护点】
1.一种搜救环境下的快速搜寻路径规划方法,其特征在于,所述方法包括:
2.根据权利要求1所述的搜救环境下的快速搜寻路径规划方法,其特征在于,构建各所述栅格对应的POMDP七元组信息,包括:
3.根据权利要求1所述的搜救环境下的快速搜寻路径规划方法,其特征在于,基于所述当前所在栅格对应的POMDP七元组信息通过部分可观察马尔可夫决策算法确定所述搜救机器人下一步的目标栅格,包括:
4.根据权利要求3所述的搜救环境下的快速搜寻路径规划方法,其特征在于,基于获取到的所述搜救机器人的周边地图环境信息确定可通行区域,包括:
5.根据权利要求1所述的搜救环境下的快速搜寻路径规划方法,其特征在于,实时获取搜救机器人的当前位置信息以及所述搜救机器人的周边地图环境信息,包括:
6.根据权利要求1所述的搜救环境下的快速搜寻路径规划方法,其特征在于,基于所述搜救机器人下一步的目标栅格以及所述搜救机器人的周边地图环境信息确定所述搜救机器人的搜寻路径,包括:
7.根据权利要求1至6中任一项所述的搜救环境下的快速搜寻路径规划方法,其特征在
8.根据权利要求7所述的搜救环境下的快速搜寻路径规划方法,其特征在于,多个所述搜救机器人之间共享当前位置信息、周边地图环境信息以及搜寻路径,包括:
9.一种搜救环境下的快速搜寻路径规划系统,所述系统包括处理器、存储器及存储在存储器上的计算机程序,其特征在于,所述处理器用于执行所述计算机程序,当所述计算机程序被执行时该系统实现如权利要求1至8中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至8中任一项所述方法的步骤。
...【技术特征摘要】
1.一种搜救环境下的快速搜寻路径规划方法,其特征在于,所述方法包括:
2.根据权利要求1所述的搜救环境下的快速搜寻路径规划方法,其特征在于,构建各所述栅格对应的pomdp七元组信息,包括:
3.根据权利要求1所述的搜救环境下的快速搜寻路径规划方法,其特征在于,基于所述当前所在栅格对应的pomdp七元组信息通过部分可观察马尔可夫决策算法确定所述搜救机器人下一步的目标栅格,包括:
4.根据权利要求3所述的搜救环境下的快速搜寻路径规划方法,其特征在于,基于获取到的所述搜救机器人的周边地图环境信息确定可通行区域,包括:
5.根据权利要求1所述的搜救环境下的快速搜寻路径规划方法,其特征在于,实时获取搜救机器人的当前位置信息以及所述搜救机器人的周边地图环境信息,包括:
6.根据权利要求1所述的搜救环境下的快速搜寻路径规划方法,其特征在于,基于所述搜救机器人下一步的目标栅格以及所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。