【技术实现步骤摘要】
一种双臂机器人在轨装配的柔顺控制方法及装置
[0001]本专利技术涉及空间双臂机器人柔顺控制
,特别涉及一种双臂机器人在轨装配的柔顺控制方法及装置
。
技术介绍
[0002]随着地面机器人技术的广泛应用和航天技术的快速发展,将机器人应用于空间在轨服务体现出了极大的优势和效益
。
与单臂机器人系统相比,双臂机器人的协同操作使其可以处理更加多元的操作任务,同时系统的负载能力强,适用于大惯量物体或挠性物体的操作,因此将双臂机器人应用于空间在轨服务具有重要意义
。
[0003]目前,单纯的运动规划和位置控制无法实现涉及力位协调的双臂协同操作,因此,需要采用柔顺控制方法,以确保双臂机器人在整个在轨服务过程中目标物体不发生滑落或对系统造成不可逆的损坏
。
[0004]相关技术中,柔顺控制方法均采用运动规划和阻抗控制器分离的框架,当目标物体的位置发生变化时,往往需要重新规划路径,导致在轨装配效率低下;此外,该框架中的阻抗控制器的参数在操作过程中基本保持不变,算法的适应性和鲁棒性较差,使得双臂操作的灵活性较差
。
[0005]基于此,目前亟待需要一种双臂机器人在轨装配的柔顺控制方法及装置来解决双臂机器人在轨装配时的效率低下和灵活性较差的技术问题
。
技术实现思路
[0006]为了解决双臂机器人在轨装配时效率低下和灵活性较差的技术问题,本专利技术实施例提供了一种双臂机器人在轨装配的柔顺控制方法及装置
。
[0007]第 ...
【技术保护点】
【技术特征摘要】
1.
一种双臂机器人在轨装配的柔顺控制方法,其特征在于,包括:获取双臂机器人当前的运动状态;将所述双臂机器人当前的运动状态输入到预先训练好的目标模型中,得到当前目标物体的期望轨迹和与当前环境相适应的阻抗控制模型的控制参数;其中,所述目标模型是通过双机械臂的运动状态
、
双机械臂的操作力状态和目标物体的运动状态作为训练样本对预设的神经网络训练得到的;基于当前目标物体的期望轨迹
、
所述阻抗控制模型的控制参数以及预设的双环阻抗控制模型,得到与当前环境相适应的双机械臂的期望关节角,以作为所述双机械臂的控制指令,实现所述双臂机器人的柔顺控制
。2.
根据权利要求1所述的方法,其特征在于,所述双机械臂的运动状态包括双机械臂的关节角度
、
关节角速度
、
双机械臂末端执行器的位姿和速度;所述双机械臂的操作力状态包括双机械臂末端的六维力信息和目标物体质心所受到的环境外力;所述目标物体的运动状态包括目标物体质心的位姿
。3.
根据权利要求1所述的方法,其特征在于,所述预设的神经网络包括依次连接的
LSTM
网络模块
、MLP
网络模块
、
深度强化学习网络模块和经验回放池模块
。4.
根据权利要求3所述的方法,其特征在于,所述目标模型是通过如下方式训练得到的:按照预设频率获取环境状态量;其中,所述环境状态量包括双机械臂的操作力状态
、
双机械臂的运动状态和目标物体的运动状态;将所述双机械臂的操作力状态输入所述
LSTM
网络模块中,得到带有时间序列的双机械臂的操作力状态;利用所述
MLP
网络模块对所述双机械臂的操作力状态进行特征提取,得到当前时刻双机械臂力状态的特征向量;将所述双机械臂力状态的特征向量
、
所述双机械臂的运动状态和所述目标物体的运动状态作为所述深度强化学习网络模块的输入状态向量;设置智能体的环境奖励函数,利用所述深度强化学习网络模块训练智能体,得到目标物体的 输出动作;其中,所述目标物体的输出动作包括目标物体质心的位置变化量和阻抗控制模型的控制参数;将获取得到的环境状态量
、
所述目标物体的输出动作
、
执行该动作获得的环境奖励值以及执行该动作后的环境状态量存入所述经验回放池模块中,得到经验数据;利用所述经验数据对当前的神经网络进行更新,直至算法进入收敛状态,得到所述目标模型
。5.
根据权利要求1所述的方法,其特征在于,所述预设的双环阻抗模型包括外环阻抗模型和内环阻抗模型;其中, 所述外环阻抗模型为:所述外环阻抗模型为:,,
式中,是目标物体的实际轨迹和期望轨迹之间的轨迹误差,是目标物体轨迹误差的一阶导数,是目标物体轨迹误差的二阶导数,是环境施加在目标物体上的外力,
、
和分别为外环阻抗模型的期...
【专利技术属性】
技术研发人员:刘磊,曹钰雪,谢心如,刘乃龙,徐拴锋,张强,张涛,
申请(专利权)人:北京控制工程研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。