System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种月面微小机器人运动的智能决策方法及装置制造方法及图纸_技高网

一种月面微小机器人运动的智能决策方法及装置制造方法及图纸

技术编号:44654276 阅读:6 留言:0更新日期:2025-03-17 18:45
本发明专利技术提供了一种月面微小机器人运动的智能决策方法及装置,涉及强化学习技术,其中方法包括:获取月面微小机器人拍摄的当前图像和满足拍摄要求的目标图像;将当前图像和目标图像输入训练好的智能决策模型中,输出得到使机器人移动到拍摄与目标图像最相似的图像的位置的动作决策;其中,智能决策模型是通过训练样本集对预设的动作决策网络训练得到的,训练样本集包括训练目标图像和训练初始图像,训练目标图像是机器人在任意第一位置对待拍摄目标拍摄得到的,训练初始图像是机器人在以第一位置为圆心的圆形区域内任意第二位置拍摄得到的。本方案能够用于计算资源严重受限的星载计算环境中,使月面微小机器人可以自动做出决策。

【技术实现步骤摘要】

本专利技术涉及深度学习,特别涉及一种月面微小机器人运动的智能决策方法及装置


技术介绍

1、在地外探测场景中利用月面微小机器人对合作目标拍照时,为了在短时间拍摄一张合作目标在图像中间区域且构图合适的照片,需要根据视觉信息调整机器人的位置和姿态,再利用机器人上固定安装的相机进行拍摄。

2、相关技术中,传统的视觉伺服方法需要手动选取特征,且计算量巨大,这就造成其难以适应计算资源严重受限的星载计算环境,进而导致月面微小机器人无法根据图像信息自动调整其拍照位置和姿态。

3、基于此,目前亟需一种月面微小机器人运动的智能决策方法及装置来解决上述技术问题。


技术实现思路

1、本专利技术实施例提供了一种月面微小机器人运动的智能决策方法及装置,能够根据视觉图像信息自动进行运动决策。

2、第一方面,本专利技术实施例提供了一种月面微小机器人运动的智能决策方法,包括:

3、获取月面微小机器人拍摄的当前图像和满足拍摄要求的目标图像;

4、将所述当前图像和所述目标图像输入训练好的智能决策模型中,输出得到使机器人移动到拍摄与目标图像最相似的图像的位置的动作决策;其中,所述智能决策模型是通过训练样本集对预设的动作决策网络训练得到的,所述训练样本集包括训练目标图像和训练初始图像,所述训练目标图像是机器人在任意第一位置对待拍摄目标拍摄得到的,所述训练初始图像是机器人在以第一位置为圆心的圆形区域内任意第二位置拍摄得到的。

5、第二方面,本专利技术实施例还提供了一种月面微小机器人运动的智能决策装置,包括:

6、获取模块,用于获取月面微小机器人拍摄的当前图像和满足拍摄要求的目标图像;

7、决策模块,用于将所述当前图像和所述目标图像输入训练好的智能决策模型中,输出得到使机器人移动到拍摄与目标图像最相似的图像的位置的动作决策;其中,所述智能决策模型是通过训练样本集对预设的动作决策网络训练得到的,所述训练样本集包括训练目标图像和训练初始图像,所述训练目标图像是机器人在任意第一位置对待拍摄目标拍摄得到的,所述训练初始图像是机器人在以第一位置为圆心的圆形区域内任意第二位置拍摄得到的。

8、第三方面,本专利技术实施例还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时,实现本说明书任一实施例所述的方法。

9、第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行本说明书任一实施例所述的方法。

10、本专利技术实施例提供了一种月面微小机器人运动的智能决策方法及装置,采用深度强化学习的方法,构建智能决策网络模型,根据由视觉图像特征构成的训练集,对构建的神经网络开展学习训练,最终使训练好的神经网络能够自主规划机器人在不确定环境中的运动动作。该方法无需对环境进行精确建模,能够用于地外未知环境,并且计算量小,可以用于计算资源严重受限的星载计算环境中,使月面微小机器人可以自动做出决策,无需人工操控。

本文档来自技高网...

【技术保护点】

1.一种月面微小机器人运动的智能决策方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述智能决策模型是通过如下方式训练得到的:

3.根据权利要求2所述的方法,其特征在于,所述状态空间通过如下方式设置:

4.根据权利要求2所述的方法,其特征在于,所述动作空间通过如下方式设置:根据月面微小机器人的运动方式建立所述动作空间;其中,所述动作空间包括机器人所有的一维离散动作,以及用于表征所述一维离散动作的动作决策值,所述一维离散动作包括前进运动、后退运动、左前运动、右前运动、左后运动和右后运动。

5.根据权利要求2所述的方法,其特征在于,所述奖励函数包括可见性奖励、任务完成奖励、总步数奖励和单步相似性奖励,其中:

6.根据权利要求5所述的方法,其特征在于,所述最新图像中是否包含待拍摄目标通过如下方式确定:

7.根据权利要求2所述的方法,其特征在于,所述利用强化学习算法对输入了训练样本集的动作决策网络和价值网络进行训练,得到所述智能决策模型,包括:

8.一种月面微小机器人运动的智能决策装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-7中任一项所述的方法。

10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-7中任一项所述的方法。

...

【技术特征摘要】

1.一种月面微小机器人运动的智能决策方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述智能决策模型是通过如下方式训练得到的:

3.根据权利要求2所述的方法,其特征在于,所述状态空间通过如下方式设置:

4.根据权利要求2所述的方法,其特征在于,所述动作空间通过如下方式设置:根据月面微小机器人的运动方式建立所述动作空间;其中,所述动作空间包括机器人所有的一维离散动作,以及用于表征所述一维离散动作的动作决策值,所述一维离散动作包括前进运动、后退运动、左前运动、右前运动、左后运动和右后运动。

5.根据权利要求2所述的方法,其特征在于,所述奖励函数包括可见性奖励、任务完成奖励、总步数奖励和单步相似性奖励...

【专利技术属性】
技术研发人员:黄煌谢心如李谋张聪张玲俊刘磊杨孟飞
申请(专利权)人:北京控制工程研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1