System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于机器人控制,具体涉及一种机械臂抓取大型薄板时的运动轨迹平稳控制方法及系统。
技术介绍
1、在现代自动化技术的快速发展背景下,机器人作为关键执行设备,被广泛应用于制造、装配、仓储、物流等各个领域。机械臂的抓取运动是其重要功能之一,尤其是在处理形状复杂、重量不一的物体时,其运动轨迹的平稳性直接影响到抓取的效率和精度。例如,在通过机械臂抓取和处理大型薄板材料的过程中,由于薄板材料通常具有较大的表面积和较轻的质量,在高速运动状态下更容易受到气流、振动及重心变化等因素的影响,这导致抓取过程中的轨迹控制变得尤为复杂和挑战性。
2、传统的机器人控制方法虽然在一定程度上能够实现物体的抓取,但在面对动态环境和不确定性因素时,常常出现轨迹抖动、偏离或抓取失败的情况,无法满足在高速移动时对抓取精度和稳定性的要求,从而可能导致薄板的偏移、变形或损毁。此外,在高速抓取运动时,机械臂的惯性和外部干扰也会导致稳定性不足,进一步影响操作的安全性和可靠性。随着人工智能和深度学习技术的发展,运用智能控制算法对机械臂进行实时轨迹优化已成为研究的热点,为实现更加智能化和高效化的抓取控制提供了新的机遇,但是在面对复杂和动态的作业环境时,仍然难以实现高效、准确的轨迹规划和控制。
3、因此,需要一种高效的抓取运动轨迹平稳控制方法,提升机械臂在复杂作业环境下的适应性,实现机械臂在抓取大型薄板进行高速运动时的轨迹平稳控制。
技术实现思路
1、有鉴于此,本专利技术提出了一种机械臂抓取大型薄板时的
2、本专利技术第一方面,公开了一种机械臂抓取大型薄板时的运动轨迹平稳控制方法,所述方法包括:
3、通过摄像头和传感器实时采集机械臂和薄板周边的环境数据,创建作业环境模型;
4、基于所述作业环境模型初始化机械臂的运动路径,将所述运动路径表示为图结构并输入预训练的图神经网络模型,通过预训练的图神经网络模型规划机械臂的运动路径,得到当前作业环境模型下的规划路径;
5、通过多个智能体协同执行机械臂的控制任务,并采用多智能体强化学习策略进行控制决策优化,使机械臂按照所述规划路径运动。
6、在以上技术方案的基础上,优选的,所述基于所述作业环境模型初始化机械臂的运动路径,将所述运动路径表示为图结构并输入预训练的图神经网络模型,通过预训练的图神经网络模型规划机械臂的运动路径,得到当前作业环境模型下的规划路径具体包括:
7、提取作业环境模型中的关键路径节点,通过混合的强化学习策略生成初始运动轨迹;
8、将所述初始运动轨迹表示为图结构,将所述图结构输入预训练的图神经网络模型,输出当前作业环境模型下的规划路径;
9、当作业环境模型发生变化时,将所述规划路径表示为图结构,通过预训练的图神经网络模型重新规划机械臂的运动路径,更新当前作业环境模型下的规划路径。
10、在以上技术方案的基础上,优选的,所述混合的强化学习策略采用基于价值的强化学习算法与基于策略的强化学习算法加权融合的方式得到。
11、在以上技术方案的基础上,优选的,所述通过预训练的图神经网络模型规划机械臂的运动路径的过程中,图结构的节点更新计算公式如下:
12、hp(l+1)=aggregate({hq(l),epq|q∈n(p)})
13、其中,hq(l)表示节点q在第k个网络层的特征向量,hp(l+1)表示节点p在第l+1个网络层的特征向量,epq表示节点p和邻居节点q之间的边特征,n(p)表示节点p的邻居节点集合;aggregate(·)为aggregate聚合函数。
14、在以上技术方案的基础上,优选的,所述采用多智能体强化学习策略进行控制决策优化的决策目标函数为:
15、
16、其中,j(π1,π2,…,πi,…,πn)为决策目标函数,i=1,2,…,n,n为智能体总数,πi表示第i个智能体的决策,r∈(0,1)为折扣因子,用于权衡未来奖励的重要性;t=0,1,…,t,t为预设的决策周期,ri(st,at,i)是第i个智能体在时间步t的奖励函数,st是在时间步t的状态,at,i是第i个智能体在时间步t的动作。
17、在以上技术方案的基础上,优选的,所述方法还包括:
18、采用分布式计算架构进行机械臂的运动路径优化;
19、其中,所述分布式计算架构的每个计算节点独立执行深度强化学习算法进行机械臂的运动路径优化,每个计算节点的目标函数为:
20、
21、其中,jk(θ)是第k个计算节点的目标函数,表示在第k个计算节点上由共享参数θ定义的策略,τ是一个目标运动轨迹,r(st,at)是t时刻机械臂在状态st时执行动作at所对应的奖励;表示在策略下,沿着目标运动轨迹τ所获得的总奖励的期望;
22、所述分布式计算架构通过全局协调器更新共享参数θ,整合各个计算节点的运动路径优化结果,得到优化后的规划路径;所述更新共享参数θ的公式为:
23、
24、其中,θ′为更新后的共享参数,α是学习率,用于控制更新的步长,是目标函数jk(θ)对共享参数θ的梯度。
25、在以上技术方案的基础上,优选的,所述方法还包括:
26、采用量子退火算法求解运动路径优化中的组合优化问题。
27、本专利技术第二方面,公开了一种机械臂抓取大型薄板时的运动轨迹平稳控制系统,所述系统包括:
28、环境采集模块:用于通过摄像头和传感器实时采集机械臂和薄板周边的环境数据,创建作业环境模型;
29、路径规划模块:用于基于所述作业环境模型初始化机械臂的运动路径,将所述运动路径表示为图结构并输入预训练的图神经网络模型,通过预训练的图神经网络模型规划机械臂的运动路径,得到当前作业环境模型下的规划路径;
30、轨迹控制模块:用于通过多个智能体协同执行机械臂的控制任务,并采用多智能体强化学习策略进行控制决策优化,使机械臂按照所述规划路径运动。本专利技术第三方面,公开一种电子设备,包括:至少一个处理器、至少一个存储器、通信接口和总线;
31、其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
32、所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以实现如本专利技术第一方面所述的方法。
33、本专利技术第四方面,公开一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使计算机实现如本专利技术第一方面所述的方法。
34、本专利技术相对于现有技术具有以下有益效果:
35、1)本专利技术实时采集机械臂和薄板周边的环境数据,创建作业环境模型;基于作业环境模型何预训练的图神经网络模型规划机械臂的运动路径,得到当前作业环境模型下的规划路本文档来自技高网...
【技术保护点】
1.一种机械臂抓取大型薄板时的运动轨迹平稳控制方法,其特征在于,所述方法包括:
2.根据权利要求1所述的机械臂抓取大型薄板时的运动轨迹平稳控制方法,其特征在于,所述基于所述作业环境模型初始化机械臂的运动路径,将所述运动路径表示为图结构并输入预训练的图神经网络模型,通过预训练的图神经网络模型规划机械臂的运动路径,得到当前作业环境模型下的规划路径具体包括:
3.根据权利要求2所述的机械臂抓取大型薄板时的运动轨迹平稳控制方法,其特征在于,所述混合的强化学习策略采用基于价值的强化学习算法与基于策略的强化学习算法加权融合的方式得到。
4.根据权利要求1所述的机械臂抓取大型薄板时的运动轨迹平稳控制方法,其特征在于,所述通过预训练的图神经网络模型规划机械臂的运动路径的过程中,图结构的节点更新计算公式如下:
5.根据权利要求1所述的机械臂抓取大型薄板时的运动轨迹平稳控制方法,其特征在于,所述采用多智能体强化学习策略进行控制决策优化的决策目标函数为:
6.根据权利要求1所述的机械臂抓取大型薄板时的运动轨迹平稳控制方法,其特征在于,所述方法
7.根据权利要求6所述的机械臂抓取大型薄板时的运动轨迹平稳控制方法,其特征在于,所述方法还包括:
8.一种机械臂抓取大型薄板时的运动轨迹平稳控制系统,其特征在于,所述系统包括:
9.一种电子设备,其特征在于,包括:至少一个处理器、至少一个存储器、通信接口和总线;
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机指令,所述计算机指令使计算机实现如权利要求1~7任一项所述的方法。
...【技术特征摘要】
1.一种机械臂抓取大型薄板时的运动轨迹平稳控制方法,其特征在于,所述方法包括:
2.根据权利要求1所述的机械臂抓取大型薄板时的运动轨迹平稳控制方法,其特征在于,所述基于所述作业环境模型初始化机械臂的运动路径,将所述运动路径表示为图结构并输入预训练的图神经网络模型,通过预训练的图神经网络模型规划机械臂的运动路径,得到当前作业环境模型下的规划路径具体包括:
3.根据权利要求2所述的机械臂抓取大型薄板时的运动轨迹平稳控制方法,其特征在于,所述混合的强化学习策略采用基于价值的强化学习算法与基于策略的强化学习算法加权融合的方式得到。
4.根据权利要求1所述的机械臂抓取大型薄板时的运动轨迹平稳控制方法,其特征在于,所述通过预训练的图神经网络模型规划机械臂的运动路径的过程中,图结构的节点更新计算公...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。