一种具有自修复功能的服务机器人路径规划系统及其方法技术方案

技术编号：43693375 阅读：35 留言：0更新日期：2024-12-18 21:10

本发明专利技术为机器人路径规划领域，公开了一种具有自修复功能的服务机器人路径规划系统及其方法。所述语音识别模块，进行语音活动检测和转录，实现对自然语言命令的准确理解；所述对象识别模块，进行对象检测和分类，并能同时接受文本输入以提供识别提示，增强机器人在环境中的感知能力；所述任务规划模块，将自然语言命令转换为可执行格式，并通过执行技能函数的组合，实现复杂任务的自动化执行；所述语义映射模块，将环境信息集成到3D语义地图中，进行图像和文本编码，为机器人的有自修复功能的任务规划提供了丰富的语义信息。本发明专利技术实现了在动态和庞大的服务环境中的高效路径规划和任务执行。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于机器人路径规划，具体涉及一种具有自修复功能的服务机器人路径规划系统及其方法。

技术介绍

1、在机器人技术的迅猛发展中，移动机器人领域展现出了极快的增长势头，尤其是服务型移动机器人，近年来备受关注。服务型机器人作为与人类及其他机器人协同工作的伙伴，在酒店、医院、餐厅、家庭及养老院等多种场合发挥着自动化任务执行的关键作用。

2、在服务型机器人的核心技术中，导航系统和路径规划模块显得尤为重要。这些系统赋予了机器人自主运行的能力，使它们能够在较少或没有人类干预的情况下，完成从源到目的地的自主移动。路径规划系统作为导航系统的重要组成部分，负责确定最优路径，确保机器人高效、安全地完成任务。

3、然而，服务环境的动态性和复杂性给路径规划带来了诸多挑战。静态路径规划模块虽然能够根据初始环境信息规划路径，但无法识别或适应环境的变化。因此，动态路径规划模块的应用成为了解决这一问题的关键。动态路径规划模块能够实时检测环境变化，并据此调整路径规划，确保机器人在变化的环境中仍能保持高效运行。

4、近年来，人工智能技术的发展为动态路径规划提供了新的解决方案。特别是机器学习和强化学习等技术的应用，使得路径规划系统具备了更强的适应性和动态性。强化学习算法通过与环境进行交互，学习如何在不同状态下做出最优决策，从而实现了对环境的动态适应。这种基于强化学习的路径规划系统，不仅提高了机器人的自主性，还使其能够应对长期的环境变化。

5、然而，尽管取得了这些进展，通用服务机器人系统在面对复杂任务和动态环境时仍面

技术实现思路

1、本专利技术提供一种具有自修复功能的服务机器人路径规划系统，通过有效地结合有自修复功能的语音识别、对象识别、有自修复功能的任务规划和语义映射，实现了在动态和庞大的服务环境中的高效路径规划和任务执行。

2、本专利技术提供一种具有自修复功能的服务机器人路径规划方法，用于执行复杂的路径规划。

3、本专利技术通过以下技术方案实现：

4、一种具有自修复功能的服务机器人路径规划系统，所述系统使用具有自修复功能的rl框架；

5、所述具有自修复功能的rl框架具体包括语音识别模块、对象识别模块、任务规划模块、语义映射模块和路径规划器；

6、所述对象识别模块，进行对象检测和分类，并能同时接受文本输入以提供识别提示，增强机器人在环境中的感知能力；

7、所述语义映射模块，将环境信息集成到3d语义地图中，进行图像和文本编码，为机器人的有自修复功能的任务规划提供了丰富的语义信息；

8、所述语音识别模块，进行语音活动检测以及将自然语言命令转换为可执行格式，实现对自然语言命令的准确理解；

9、所述任务规划模块，通过gpt形成llm大语言模型；

10、所述路径规划器，基于q-learning的自修复的rl算法将环境信息与llm大语言模型相结合，输出可执行的路径规划方案。

11、进一步的，所述路径规划器的训练参数包括状态、动作和奖励；

12、所述状态具体为，状态表示为s∈s，其中s是代理的当前状态，即代理所有可能状态的一个子集；在的工作中，s是拓扑地图中所有节点的集合；在任何给定的时间，代理即机器人将处于其中一个节点，即环境中的某个位；

13、所述动作具体为，动作表示为a∈a，其中a是代理采取的行动以到达下一个状态；由于的代理是一个移动机器人，a是机器人在二维平面上的所有基本运动集合，a＝{left,right,forward,backward}；

14、所述奖励具体为，奖励是根据状态-动作反馈给予代理的；当达到期望的目标g时，给予最高的正面奖励，其中g∈g且当到达任何已知的位置或访问过的位置时，给予较小的负面奖励；当到达未知状态u时，给予最高的负面奖励；未知位置是指环境中不在拓扑地图上的任何位置。

15、进一步的，所述路径规划器的奖励函数为，

16、

17、其中，r(s,a)是状态动作对(s,a)的奖励；s是代理的当前状态；g是期望的目标；u的未知状态；s是拓扑地图中所有节点的集合；g是所希望到达的目标节点的集合。

18、进一步的，基于具有自修复功能的rl框架的训练参数进行强化学习，具体为，

19、训练按回合进行，在每一回合中，代理将采取多个离散步骤，在每一个步骤中，一个动作使代理的状态发生变化，对于这样的转换，将给予奖励，并且代理根据贝尔曼方程更新q值；一个回合将根据代理的当前状态s终止，强化学习代理的目标是在每个回合中获得更多的奖励；

20、在训练过程中，代理使用下一状态表和q表来学习有效地到达期望的目标；下一状态表是代理用来在给定当前状态-动作对的情况下转换状态的查找表；表中包含所有的状态作为行元素和所有的动作作为列元素；表的组成部分是基于状态-动作对的下一个状态；q表用于更新特定状态-动作对的q值；该表用于评估贝尔曼方程。

21、进一步的，在机器人的行动当前状态s的终止条件为，

22、

23、其中，g是期望的目标；u的未知状态；total states为步数达到全部状态的变量；otherwise为继续行动。

24、进一步的，所述rl框架的自修复功能通过自恢复机制来实现包括不足信息的恢复m1，具体为，在信息不足的情况下，用于规划的缺失信息将通过规划模块具有的常识和与人交谈获取的附加信息来补充。

25、进一步的，所述rl框架的自修复功能通过自恢复机制来实现包括不正确计划生成的恢复m2，具体为，在不正确计划生成的情况下，就命令识别和计划生成开发的解决方案。

26、进一步的，所述rl框架的自修复功能通过自恢复机制来实现包括计划执行失败的恢复m3，具体为，在计划执行失败的情况下，失败通过技能和计划进行恢复。

27、进一步的，所述路径规划器的q-learning的自修复的rl算法具体包括以下步骤，

28、步骤s1：初始化q值表和下一个状态表next_state_table；

29、步骤s2：初始化超参数学习率α、折扣因子γ、探索率ε及总训练集数episode_count；

30、步骤s3：判断当前训练集episode_count是否≥episode，若是，则进行步骤s4，若否，则进行步骤s15；

31、步骤s4：随机选择初始状态s；

32、步骤s5：判断初始状态s是不是终止状态，若是，则进行步骤s6，若否则进行步骤s14；

33、步骤s6：生成0-1之间的随机数；

34、步骤s7：判断随机数是否＜探索率ε，若是，则选择最大q值的动作a，若本文档来自技高网...

【技术保护点】

1.一种具有自修复功能的服务机器人路径规划系统，其特征在于，所述系统使用具有自修复功能的RL框架；

2.根据权利要求1所述一种具有自修复功能的服务机器人路径规划系统，其特征在于，所述路径规划器的训练参数包括状态、动作和奖励；

3.根据权利要求2所述一种具有自修复功能的服务机器人路径规划系统，其特征在于，所述路径规划器的奖励函数为，

4.根据权利要求2所述一种具有自修复功能的服务机器人路径规划系统，其特征在于，基于具有自修复功能的RL框架的训练参数进行强化学习，具体为，

5.根据权利要求4所述一种具有自修复功能的服务机器人路径规划系统，其特征在于，在机器人的行动当前状态s的终止条件为，

6.根据权利要求5所述一种具有自修复功能的服务机器人路径规划系统，其特征在于，所述RL框架的自修复功能通过自恢复机制来实现包括不足信息的恢复M1，具体为，在信息不足的情况下，用于规划的缺失信息将通过规划模块具有的常识和与人交谈获取的附加信息来补充。

7.根据权利要求6所述一种具有自修复功能的服务机器人路径规划系统，其特征在于，所

8.根据权利要求7所述一种具有自修复功能的服务机器人路径规划系统，其特征在于，所述RL框架的自修复功能通过自恢复机制来实现包括计划执行失败的恢复M3，具体为，在计划执行失败的情况下，失败通过技能和计划进行恢复。

9.根据权利要求8所述一种具有自修复功能的服务机器人路径规划系统，其特征在于，所述路径规划器的Q-Learning的自修复的RL算法具体包括以下步骤，

10.一种具有自修复功能的服务机器人路径规划方法，其特征在于，所述规划方法包括以下步骤，

...

【技术特征摘要】

1.一种具有自修复功能的服务机器人路径规划系统，其特征在于，所述系统使用具有自修复功能的rl框架；

2.根据权利要求1所述一种具有自修复功能的服务机器人路径规划系统，其特征在于，所述路径规划器的训练参数包括状态、动作和奖励；

3.根据权利要求2所述一种具有自修复功能的服务机器人路径规划系统，其特征在于，所述路径规划器的奖励函数为，

4.根据权利要求2所述一种具有自修复功能的服务机器人路径规划系统，其特征在于，基于具有自修复功能的rl框架的训练参数进行强化学习，具体为，

5.根据权利要求4所述一种具有自修复功能的服务机器人路径规划系统，其特征在于，在机器人的行动当前状态s的终止条件为，

6.根据权利要求5所述一种具有自修复功能的服务机器人路径规划系统，其特征在于，所述rl框架的自修复功能通过自恢复机制来实现包括不足信息的恢复m1，具体为，在信息不...

【专利技术属性】
技术研发人员：梁伟，鲁明丽，钟珊，吴小叶，蔡欣怡，赵敏，金涛，张恩侨，马建业，
申请(专利权)人：常熟理工学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人