一种用于大型部件协作搬运的多机器人导航方法技术

技术编号:37356823 阅读:14 留言:0更新日期:2023-04-27 07:06
本发明专利技术公开了一种用于大型部件协作搬运的多机器人导航方法,包括步骤:S1、获取多机器人运动的起点位置s0=(p

【技术实现步骤摘要】
一种用于大型部件协作搬运的多机器人导航方法


[0001]本专利技术属于移动机器人
,具体涉及一种多机器人编队协作搬运大型部件的导航方法。

技术介绍

[0002]大型装备的生产和运输过程中,通常需要搬运大型部件。大型部件搬运系统大量应用于船舶制造、大型飞机制造、混凝土管桩生产等多个领域。现有的大型部件搬运设备主要由吊装设备和顶升平移机构成。大型部件由吊装设备吊装,由顶升平移机构搬运,因此现有的搬运过程路径较为固定。当运送起点或者终点发生变化时,需要重新铺设轨道,造成效率低、成本高的问题。另一种可行的方案是采用多机器人协作搬运的方式,采用多个机器人共同支承一个目标对象,通过机器人之间的协同运动控制来保证组群移动的一致性,实现目标对象的移动。多机器人协作搬运的导航与避障一般采用电磁感应、激光、或者视觉的方式设置引导路径的方式去实现,但当环境发生改变时需要重新铺设导引路径,效率比较低下。此外,还有一种方式是通过传统的单机器人导航与避障算法获取导航路径,再通过算法解算出多机器人的位姿,但是此种方法一方面较为复杂,另一方面存在单机器人的导航路径在多机器人时无法适用的情况,即多机器人在协作搬运时,每个机器人之间的位置与运动存在约束,单机器人可以通过的路径在多机器人时可能无法通过。

技术实现思路

[0003]专利技术目的:针对现有技术中存在的问题,本专利技术提供一种用于大型部件协作搬运的多机器人导航方法,该方法能够根据环境和多机器人之间的距离约束获取多机器人编队的导航路径和姿态。
[0004]技术方案:本专利技术采用如下技术方案:
[0005]一种用于大型部件协作搬运的多机器人导航方法,包括步骤:
[0006]S1、获取多机器人运动的起点位置s0=(p
x0
,p
y0
)、终点位置s
g
=(g
x
,g
y
)和运动场景中的障碍物信息s
o
;所述障碍物信息s
o
=[(o
x1
,o
y1
),(o
x1
,o
y1
),

,(o
xN
,o
yN
)];(o
xn
,o
yn
)表示障碍物边缘采样点坐标,1≤n≤N,N表示障碍物边缘采样点总数;
[0007]S2、根据所需搬运物体形状设计多机器人编队的队形,并获取各机器人之间的相对位置约束;
[0008]S3、建立深度神经网络,所述深度神经网络的输入为多机器人编队的状态,输出为多机器人编队的执行动作;
[0009]所述多机器人编队的状态S为:S=[s
g
,s
r
,s
o
],其中s
r
=[(p
x
,p
y
),v
x
,v
y
,arc]为多机器人编队的运动参数,其中位置参数(p
x
,p
y
)为多机器人编队参考点的位置,速度参数v
x
,v
y
分别为多机器人编队参考点在x方向和y方向的速度,姿态参数arc为多机器人编队以参考点为中心的旋转弧度;所述多机器人编队参考点为多机器人编队的几何中心;
[0010]所述深度神经网络包括Actor网络和Critic网络,其中Actor网络的输入为多机器
人编队的状态S,输出为多机器人编队的执行动作act;所述Critic网络的输入为多机器人编队的状态S和动作act,输出为评价值value;
[0011]S4、使用PPO算法对所述深度神经网络进行训练;
[0012]S5、将多机器人编队的状态输入训练好的Actor网络,得到每一步的执行动作,根据多机器人编队的当前运动参数和执行动作act计算下一时刻的运动参数,进而得到多机器人编队从起点到终点的导航路径。
[0013]进一步地,所述深度神经网络中,Actor网络包括4个隐含层和一个输出层,4个隐含层中的神经元个数分别为128,256,256,64,激活函数都为tanh函数,输出层包含6个输出节点,分别代表动作空间中不同动作的概率;选择其中概率值最大的作为执行动作act;
[0014]Critic网络包括4个隐含层和一个输出层,4个隐含层中的神经元个数分别为128,256,256,64,激活函数都为tanh函数,输出层包含1个输出节点,表示评价值value。
[0015]进一步地,所述动作空间包含六种动作,动作1代表多机器人编队向左运动,动作2代表多机器人编队向上运动,动作3代表多机器人编队向右运动,动作4代表多机器人编队向下运动,动作5代表多机器人编队左旋调整姿态,动作6代表多机器人编队右旋调整姿态。
[0016]进一步地,所述步骤S4具体包括:
[0017]S41、随机初始化Actor网络和Critic网络的参数;令迭代次数m=1;
[0018]S42、令t=0,多机器人编队从起点s0出发,初始化多机器人编队的运动参数;
[0019]S43、根据当前状态由Actor网络得到执行动作计算t+1时刻多机器人编队的状态并根据计算当前的原始奖励计算当前的原始奖励表示第m次迭代中t时刻多机器人编队的状态;
[0020]根据判断多机器人编队是否到达终点或与障碍物碰撞;如果多机器人编队没有到达终点,也没有与障碍物碰撞,令t=t+1,再次执行步骤S43,直至多机器人编队到达终点或与障碍物碰撞;
[0021]S44、记录本次迭代的轨迹其中Tm表示第m次迭代中多机器人编队运动时长为Tm即到达终点或与障碍物碰撞;
[0022]计算本次迭代中每一时刻的折扣奖励,t时刻的折扣奖励为:γ为折扣系数;
[0023]S45、通过随机梯度下降法优化Actor网络的取值,优化的目标函数为最大化每一时刻的折扣奖励;
[0024]优化Critic网络的权值,优化的目标函数为最小化Critic网络输出的value值与每一时刻的折扣奖励之间的误差;
[0025]S46、令m=m+1,跳转至步骤S42进行下一次迭代;直至两次迭代之间折扣奖励的变化小于预设值ε。
[0026]进一步地,步骤S43中计算t+1时刻多机器人编队的状态的具体步骤为:
[0027](1)当执行动作为运动方向调整时,如果时刻t与t+1之间的时间间隔

T大于机器人编队速度的调整时间τ,t+1时刻多机器人编队参考点的速度为执行后的速度,t+1
时刻多机器人编队参考点的位置为:
[0028][0029][0030]其中a为预设的加速度,分别为第m次迭代中t时刻多机器人编队参考点在x方向和y方向的速度;
[0031]如果时刻t与t+1之间的时间间隔

T小于机器人编队速度的调整时间τ,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于大型部件协作搬运的多机器人导航方法,其特征在于,包括步骤:S1、获取多机器人运动的起点位置s0=(p
x0
,p
y0
)、终点位置s
g
=(g
x
,g
y
)和运动场景中的障碍物信息s
o
;所述障碍物信息s
o
=[(o
x1
,o
y1
),(o
x1
,o
y1
),

,(o
xN
,o
yN
)];(o
xn
,o
yn
)表示障碍物边缘采样点坐标,1≤n≤N,N表示障碍物边缘采样点总数;S2、根据所需搬运物体形状设计多机器人编队的队形,并获取各机器人之间的相对位置约束;S3、建立深度神经网络,所述深度神经网络的输入为多机器人编队的状态,输出为多机器人编队的执行动作;所述多机器人编队的状态S为:S=[s
g
,s
r
,s
o
],其中s
r
=[(px,py),v
x
,v
y
,arc]为多机器人编队的运动参数,其中位置参数(p
x
,p
y
)为多机器人编队参考点的位置,速度参数v
x
,v
y
分别为多机器人编队参考点在x方向和y方向的速度,姿态参数arc为多机器人编队以参考点为中心的旋转弧度;所述多机器人编队参考点为多机器人编队的几何中心;所述深度神经网络包括Actor网络和Critic网络,其中Actor网络的输入为多机器人编队的状态S,输出为多机器人编队的执行动作act;所述Critic网络的输入为多机器人编队的状态S和动作act,输出为评价值value;S4、使用PPO算法对所述深度神经网络进行训练;S5、将多机器人编队的状态输入训练好的Actor网络,得到每一步的执行动作,根据多机器人编队的当前运动参数和执行动作act计算下一时刻的运动参数,进而得到多机器人编队从起点到终点的导航路径。2.根据权利要求1所述的多机器人导航方法,其特征在于,所述深度神经网络中,Actor网络包括4个隐含层和一个输出层,4个隐含层中的神经元个数分别为128,256,256,64,激活函数都为tanh函数,输出层包含6个输出节点,分别代表动作空间中不同动作的概率;选择其中概率值最大的作为执行动作act;Critic网络包括4个隐含层和一个输出层,4个隐含层中的神经元个数分别为128,256,256,64,激活函数都为tanh函数,输出层包含1个输出节点,表示评价值value。3.根据权利要求2所述的多机器人导航方法,其特征在于,所述动作空间包含六种动作,动作1代表多机器人编队向左运动,动作2代表多机器人编队向上运动,动作3代表多机器人编队向右运动,动作4代表多机器人编队向下运动,动作5代表多机器人编队左旋调整姿态,动作6代表多机器人编队右旋调整姿态。4.根据权利要求1所述的多机器人导航方法,其特征在于,所述步骤S4具体包括:S41、随机初始化Actor网络和Critic网络的参数;令迭代次数m=1;S42、令t=0,多机器人编队从起点s0出发,初始化多机器人编队的运动参数;S43、根据当前状态由Actor网络得到执行动作计算t+1时刻多机器人编队的状态并根据计算当前的原始奖励计算当...

【专利技术属性】
技术研发人员:孙雪莹魏逸飞张强齐亮张永韡叶树霞暴琳李长江
申请(专利权)人:江苏科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1