当前位置: 首页 > 专利查询>山东芯辰人工智能科技有限公司山东正晨科技股份有限公司专利>正文

基于深度强化学习的人群感知导航方法及系统技术方案

技术编号：38094005 阅读：31 留言：0更新日期：2023-07-06 09:07

本发明专利技术涉及导航技术领域，提供了基于深度强化学习的人群感知导航方法及系统，包括：获取当前时刻的机器人状态、行人的可观测状态和静态障碍的传感数据；将当前时刻的机器人状态、行人的可观测状态和静态障碍的传感数据，输入局部规划算法，得到下一个时刻的机器人状态、行人的可观测状态和静态障碍的传感数据，将得到的下一个时刻的机器人状态、行人的可观测状态和静态障碍的传感数据，输入值网络模型，得到状态价值，并结合不同动作下当前时刻收到的奖励，选择当前时刻的动作。解决了在有静态障碍的人口环境中安全且符合社会要求的机器人导航问题。机器人导航问题。机器人导航问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度强化学习的人群感知导航方法及系统

[0001]本专利技术属于导航
，尤其涉及基于深度强化学习的人群感知导航方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息，不必然构成在先技术。
[0003]随着移动机器人领域的快速发展，自主机器人的应用场景逐渐从孤立的静态空间扩展到餐厅、商场、医院等人机共存的环境。在这些人群场景中，人类频繁地改变自己的运动状态，包括移动方向、速度、加速度等，以避免与附近的人类和障碍物发生碰撞。这些随机的人类运动使得机器人在公共环境中的导航更加复杂。到目前为止，在自然公共环境中安全和符合社会要求的导航仍然具有挑战性。
[0004]传统方法通过精心设计的规则来解决导航问题。这些方法通常考虑机器人动力学，并且在静态或其他确定性导航环境中已经显示出了明显的优势。然而，这类方法在人口稠密的场景下容易受人类行为的随机性影响，从而导致机器人陷入振荡或停止状态而无法找到可行路径的冻结机器人问题(frozen Robot Problem,FRP)。在过去几年里，深度强化学习技术(Deep Reinforcement Learning,DRL)在解决社会导航问题上取得了重大进展。这些方法探索了神经网络在动态环境中用于机器人导航的使用，隐式编码人类之间的交互和合作。然而，随着静态障碍物复杂性的增加，当前的模型性能将会明显下降。其次，目前的模型在提取环境中的行人特征时，没有充分考虑静态障碍物对行人重要性分配的影响。此外，大多数强化学习方法都忽略了机器人...

【技术保护点】

【技术特征摘要】
1.基于深度强化学习的人群感知导航方法，其特征在于，包括：获取当前时刻的机器人状态、行人的可观测状态和静态障碍的传感数据；将当前时刻的机器人状态、行人的可观测状态和静态障碍的传感数据，输入局部规划算法，得到下一个时刻的机器人状态、行人的可观测状态和静态障碍的传感数据，将得到的下一个时刻的机器人状态、行人的可观测状态和静态障碍的传感数据，输入值网络模型，得到状态价值，并结合不同动作下当前时刻收到的奖励，选择当前时刻的动作。2.如权利要求1所述的基于深度强化学习的人群感知导航方法，其特征在于，所述机器人状态包括：从机器人位置到目标点的距离、机器人速度、机器人的预期运动速度、机器人的运动方向和机器人对静态障碍物的传感数据。3.如权利要求1所述的基于深度强化学习的人群感知导航方法，其特征在于，所述行人的可观测状态包括：行人位置、行人速度和从行人位置到机器人位置的距离。4.如权利要求1所述的基于深度强化学习的人群感知导航方法，其特征在于，使用动作掩蔽机制将意图点集合分成了有效局部目标点集和无效局部目标点集；所述有效局部目标点集包括在局部规划算法求解的目标点中；所述无效局部目标点集为落在静态障碍物中的点以及局部规划算法求解失败的点。5.如权利要求1所述的基于深度强化学习的人群感知导航方法，其特征在于，所述奖励采用将位置惩罚纳入的奖励函数计算得到。6.如权利要求1...

【专利技术属性】
技术研发人员：周风余，冯震，薛秉鑫，尹磊，史鲁川，赵云，丁笑迎，
申请(专利权)人：山东芯辰人工智能科技有限公司山东正晨科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人