本发明专利技术涉及机械臂控制技术领域,提供了一种机械臂路径规划方法、装置、电子设备及存储介质,通过获取空间坐标系下的第一起点位姿和第一终点位姿,并获取障碍物位置信息;根据空间坐标系下的第一起点位姿和第一终点位姿,通过运动学逆解算计算关节坐标系下对应的第二起点位姿和第二终点位姿;以每个关节为一个智能体,以关节的角度为智能体的状态集,以{
【技术实现步骤摘要】
机械臂路径规划方法、装置、电子设备及存储介质
[0001]本专利技术涉及机械臂控制
,尤其涉及一种机械臂路径规划方法、装置、电子设备及存储介质。
技术介绍
[0002]机械臂路径规划技术是机械臂控制技术中的一个重要环节,进行机械臂路径规划的主要目的是使机械臂能够无碰撞地从指定的起点到达指定的终点。现有的人工规划路径的方法,通常仅能够满足简单工作环境的使用要求,自动化程度低。现有的基于空间坐标的自动规划路径的方法在规划路径的时候,每次规划出一个候选的路径点时,均需要进行逆运动学解算以验证是否发生碰撞、是否处于奇异点(无法明确的逆向转化为机器人各个关节轴的旋转角度的坐标点,即在机器人工作空间中的逆运动学无解的点)、是否具有多解状态等,计算量大,且规划得到的路径有时候只是基于坐标的角度看是平滑的,但在相邻路径点处机械臂关节轴的旋转角度变化大(即关节空间变化大),导致机械臂运行不平稳,存在安全隐患。
技术实现思路
[0003]鉴于上述现有技术的不足之处,本申请实施例的目的在于提供一种机械臂路径规划方法、装置、电子设备及存储介质,能够避免机械臂沿规划的路径运行时关节状态发生突变,从而保证机械臂运行的平稳性,并能够避免奇异解和多解问题。
[0004]第一方面,本申请实施例提供一种机械臂路径规划方法,包括步骤:A1.获取空间坐标系下的第一起点位姿和第一终点位姿,并获取障碍物位置信息;A2.根据所述空间坐标系下的第一起点位姿和第一终点位姿,通过运动学逆解算计算关节坐标系下对应的第二起点位姿和第二终点位姿;A3.以每个关节为一个智能体,以关节的角度为智能体的状态集,以{
‑
θ,θ,0}为智能体的动作集,根据预设的碰撞检测规则和奖惩机制,利用多智能体强化学习算法生成从第二起点位姿到达第二终点位姿的路径;其中,θ为各关节的预设的最小运动步长。
[0005]本申请实施例的机械臂路径规划方法,以机械臂的每个关节为一个智能体,用多智能体强化学习算法直接从关节空间进行路径规划,得到的路径点位置信息是关节坐标系的坐标,即直接得到机械臂各关节的角度,避免由空间坐标通过逆运动学解算计算各关节角度而导致的奇异解和多解问题,也避免了相邻路径点的机械臂关节角度出现突变的情况,从而保证机械臂运行的平稳性。
[0006]优选地,所述奖惩机制为:若机械臂达到第二终点位姿,且不发生碰撞,则将奖励设置为N1,并标记为任务结束,结束回合;N1为预设值;机械臂在达到第二终点位姿前,每一次仿真移动都有N2的惩罚;N2为预设值;
机械臂在达到第二终点位姿前,若一次仿真移动后,关节坐标系下的位姿与所述第二终点位姿的欧氏距离变小,则得到N3的奖励;若机械臂在运动过程中与障碍物发生碰撞或机械臂自身发生碰撞,则得到
‑
N1的惩罚,并标记为任务结束,结束回合。
[0007]优选地,所述多智能体强化学习算法为多智能体深度确定性策略梯度算法。
[0008]优选地,所述碰撞检测规则为基于包围盒的碰撞检测算法的碰撞检测规则。
[0009]第二方面,本申请实施例提供一种机械臂路径规划装置,包括:获取模块,用于获取空间坐标系下的第一起点位姿和第一终点位姿,并获取障碍物位置信息;计算模块,用于根据所述空间坐标系下的第一起点位姿和第一终点位姿,通过运动学逆解算计算关节坐标系下对应的第二起点位姿和第二终点位姿;规划模块,用于以每个关节为一个智能体,以关节的角度为智能体的状态集,以{
‑
θ,θ,0}为智能体的动作集,根据预设的碰撞检测规则和奖惩机制,利用多智能体强化学习算法生成从第二起点位姿到达第二终点位姿的路径;其中,θ为各关节的预设的最小运动步长。
[0010]优选地,所述奖惩机制为:若机械臂达到第二终点位姿,且不发生碰撞,则将奖励设置为N1,并标记为任务结束,结束回合;N1为预设值;机械臂在达到第二终点位姿前,每一次仿真移动都有N2的惩罚;N2为预设值;机械臂在达到第二终点位姿前,若一次仿真移动后,关节坐标系下的位姿与所述第二终点位姿的欧氏距离变小,则得到N3的奖励;若机械臂在运动过程中与障碍物发生碰撞或机械臂自身发生碰撞,则得到
‑
N1的惩罚,并标记为任务结束,结束回合。
[0011]优选地,所述多智能体强化学习算法为多智能体深度确定性策略梯度算法。
[0012]优选地,所述碰撞检测规则为基于包围盒的碰撞检测算法的碰撞检测规则。
[0013]第三方面,本申请实施例提供一种电子设备,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器通过调用所述存储器中存储的所述计算机程序,用于执行如所述的机械臂路径规划方法的步骤。
[0014]第四方面,本申请实施例提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时运行如所述的机械臂路径规划方法的步骤。
[0015]有益效果:本申请实施例提供的机械臂路径规划方法、装置、电子设备及存储介质,通过获取空间坐标系下的第一起点位姿和第一终点位姿,并获取障碍物位置信息;根据所述空间坐标系下的第一起点位姿和第一终点位姿,通过运动学逆解算计算关节坐标系下对应的第二起点位姿和第二终点位姿;以每个关节为一个智能体,以关节的角度为智能体的状态集,以{
‑
θ,θ,0}为智能体的动作集,根据预设的碰撞检测规则和奖惩机制,利用多智能体强化学习算法生成从第二起点位姿到达第二终点位姿的路径;其中,θ为各关节的预设的最小运动步长;从而,得到的路径点位置信息是关节坐标系的坐标,避免由空间坐标通过逆运动学解算计算各关节角度而导致的奇异解和多解问题,也避免了相邻路径点的机械臂关节角度出
现突变的情况,从而保证机械臂运行的平稳性。
附图说明
[0016]图1为本申请实施例提供的机械臂路径规划方法的流程图。
[0017]图2为本申请实施例提供的机械臂路径规划装置的结构示意图。
[0018]图3为本申请实施例提供的电子设备的结构示意图。
具体实施方式
[0019]下面详细描述本专利技术的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。
[0020]在本专利技术的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种机械臂路径规划方法,其特征在于,包括步骤:A1.获取空间坐标系下的第一起点位姿和第一终点位姿,并获取障碍物位置信息;A2.根据所述空间坐标系下的第一起点位姿和第一终点位姿,通过运动学逆解算计算关节坐标系下对应的第二起点位姿和第二终点位姿;A3.以每个关节为一个智能体,以关节的角度为智能体的状态集,以{
‑
θ,θ,0}为智能体的动作集,根据预设的碰撞检测规则和奖惩机制,利用多智能体强化学习算法生成从第二起点位姿到达第二终点位姿的路径;其中,θ为各关节的预设的最小运动步长。2.根据权利要求1所述的机械臂路径规划方法,其特征在于,所述奖惩机制为:若机械臂达到第二终点位姿,且不发生碰撞,则将奖励设置为N1,并标记为任务结束,结束回合;N1为预设值;机械臂在达到第二终点位姿前,每一次仿真移动都有N2的惩罚;N2为预设值;机械臂在达到第二终点位姿前,若一次仿真移动后,关节坐标系下的位姿与所述第二终点位姿的欧氏距离变小,则得到N3的奖励;若机械臂在运动过程中与障碍物发生碰撞或机械臂自身发生碰撞,则得到
‑
N1的惩罚,并标记为任务结束,结束回合。3.根据权利要求1所述的机械臂路径规划方法,其特征在于,所述多智能体强化学习算法为多智能体深度确定性策略梯度算法。4.根据权利要求1所述的机械臂路径规划方法,其特征在于,所述碰撞检测规则为基于包围盒的碰撞检测算法的碰撞检测规则。5.一种机械臂路径规划装置,其特征在于,包括:获取模块,用于获取空间坐标系下的第一起点位姿和第一终点位姿,并获取障碍物位置信息;计算模块,用于根据所述空间坐标系下的第一起点位姿和第一终点位姿,通过运动学逆解算计算关节坐...
【专利技术属性】
技术研发人员:张校志,钟泽邦,吴宇君,陈良煜,
申请(专利权)人:季华实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。