一种基于学习与预测的齿轮在线快速装配方法组成比例

技术编号:25296240 阅读:17 留言:0更新日期:2020-08-18 22:12
一种基于学习与预测的齿轮在线快速装配方法属于机器人智能装配技术领域。该方法建立了装配特征与机器人动作之间关系,形成接触状态‑机器人动作对数据类型,利用少量离线数据建立离线装配数据库,利用基于高斯过程回归的在线齿轮装配预测算法进行机器人动作预测,同时进行表现评估,如果表现效果未达到要求,则利用基于改进粒子群优化算法的在线装配参数学习算法调整机器人装配参数并更新机器人装配数据库,从而完成机器人自动齿轮装配任务。本发明专利技术解决了采用传统示教方式效率低、前期工作量大的问题,也解决了采用深度强化学习方式成本高、单次装配时间长、部署困难等不足,提高了齿轮装配任务的效率和准确率。

【技术实现步骤摘要】
一种基于学习与预测的齿轮在线快速装配方法
本专利技术属于工业机器人智能装配
,涉及到一种基于学习与预测的齿轮在线快速装配方法。
技术介绍
近年来,机器人被广泛地应用在工业生产、医疗等领域,然而传统的机器人装配方式往往示教或者离线学习的方式来完成机器人装配任务。这种方式前期需要大量的手工设计或者离线实验。但是这种方式存在效率比较低,泛化性差等问题。随着人工智能领域的发展,一些基于深度强化学习的方式被用于机器人装配。在专利技术专利CN108161934A中,清华大学徐静、曾志民等公开了“一种利用深度强化学习实现机器人多轴孔装配的方法。其采用深度强化学习的方法,通过机器人与环境交互的方式不断训练网络到达机器人自动装配的目的。再次基础上,大连理工大学王永青、庹桂本等在专利技术专利CN110666793A中公开了一种基于深度强化学习实现机器人方形零件装配的方法,其将机器人装配任务马尔科夫化,构建深度强化学习神经网络,对构建的深度强化学习网络进行训练和迁移,实现机器人自动化装配的任务。但是上述方法适用范围十分有限,首先需要大量数据来不断训练神经网络,而且每次进行机器人装配任务时运算时间很长,难以满足生产节拍的要去。其次,其需要借助较高精度的视觉传感器和具有较强运算能力的计算机,成本较高。最后,无论是轴孔装配还是方形装配,工件相对比较简单,上述方法难以应用在齿轮装配任务中。因此上述方法实际部署在装配生产线上比较困难。
技术实现思路
本专利技术主要解决的问题是克服上述方法的不足,针对目前齿轮装配任务中,传统齿轮装配方法装配效率低,深度强化学习方式单次预测时间长、成本高、部署困难等问题。本专利技术提供一种基于学习与预测的齿轮在线快速装配方法。本专利技术基于机器学习方法,建立了装配特征与机器人动作之间关系,形成接触状态-机器人动作对数据类型,利用少量离线数据建立离线装配数据库,在齿轮装配平台实验过程中,利用基于高斯过程回归的在线齿轮装配预测算法进行机器人动作预测,同时进行表现评估,如果表现效果未达到要求,则利用基于改进粒子群优化算法的在线装配参数学习算法调整机器人装配参数并更新机器人装配数据库,从而完成机器人自动齿轮装配任务。为了达到上述目的,本专利技术的技术方案为:一种基于学习与预测的齿轮在线快速装配方法,包括以下步骤:步骤1:建立装配特征与机器人动作之间的接触状态-动作对;采用压装时的压入力和压装机末端执行器的位移作为机器人的装配特征CS,采用在工具坐标系的机器人末端执行器的位姿表示机器人动作RM,在i时刻的接触状态-机器人动作对为:ti=[fx,fy,fz,d,x,y,z,α,β,γ](1)i=1,2,...,k(2)其中,fx,fy,fz为压装机获得的压入力;d为压装机末端执行器的位移;x,y,z,α,β,γ为机器人末端执行器位姿,分别为沿X轴,Y轴,Z轴方向的坐标以及绕X轴,Y轴,Z轴方向的坐标。步骤2:构建装配经验数据库,在齿轮装配平台进行少量离线装配试验,以获取到的少量数据为初始的训练集,并根据训练集建立初始装配经验数据库,进行离线初始学习,获得初始离线装配参数数据集。步骤3:构建基于高斯过程回归的在线齿轮装配预测算法;在装配平台,利用初始装配参数数据集,根据当前齿轮接触状态,利用高斯过程回归算法预测合适的机器人末端执行器的动作,高斯过程回归模型将接触状态x与机器人动作y之间的关系视作高斯过程f,f(x)是由其均值函数m(x)和协方差函数K(x,x')决定的:m(x)=E(f(x))(3)K(x,x')=E[(f(x)-m(x))(f(x')-m(x'))](4)其中,x和x'为n维输入向量;f(x),f(x')分别为以x和x'为输入的高斯过程回归函数;m(x),m(x')分别为以x为输入的高斯过程中的均值和以x'为输入的高斯过程中的均值。对于一个模型y=f(x)+ω,而ω~N(0,σ2)的联合分布,N是高斯过程白噪声,把独立的白噪声考虑到f(x),则可建立标准高斯过程回归的模型:其中,x*和X分别是装配经验数据库中的当前接触状态和先验接触状态;K(X,X')为n阶正定协方差矩阵;K(X,x*),K(x*,X)为先验接触状态与当前接触状态之间的协方差;K(x*,x*)为当前接触状态自身的协方差;In为n阶单位矩阵;σn为高斯过程回归中的超参数。为了减少上述公式中高维空间的计算困难,这里采用常用的高斯核函数作为核函数:其中,x和x'为n维输入向量;γ为高斯核函数中的超参数;并以{σn,γ}作为装配参数。通过推导其条件分布,可以得出机器人动作对的后验分布函数为:f*|X,y,x*~N(μ*,σ*)(7)其中,μ*表示机器人动作预测值的均值;σ*表示机器人动作预测值的方差;具体公式如下所示:μ*=K(x*,X)[K(X,X')+σ2nIn]-1y(8)σ*=K(x*,x*)-K(x*,X)*[K(X,X')+σ2nIn]-1*K(X,x*)(9)步骤4:装配表现评估;据步骤3算法所预测的机器人动作均值执行装配动作,并按照下式进行装配表现评估。其中,y表示本次装配的装配时间;为装配经验数据库中装配时间的均值。如果当前齿轮与花键轴之间的装配表现满足装配需求,则根据目前的装配参数进行预测,并将当前装配数据加入到步骤2构建的装配经验数据库中,结束本次装配。否则,进入步骤5;步骤5:构建一种基于生成对抗的粒子群优化算法的装配参数调整算法;首先,为了调整步骤3构建的高斯过程回归算法中的超参数,采用随机分布的方式初始化粒子群,并引入了一个判别器和一个生成器,通过一个判别模型来引导生成器模型中的策略选择。所述粒子群优化算法的参数调整算法由两部分组成:判别器G和生成器D。所述判别器则根据高斯过程模型的预测效果来评价粒子群的优劣,并采用独热码进行编码。所述生成器用于获取装配参数的分布,生成不同装配参数更新策略。其次,粒子群优化算法的装配参数利用生成器根据粒子的优劣性与独热码,形成不同的装配参数更新策略,对于失败种群进行探索,加强其全局搜索能力,对于优胜种群进行开发,加强其局部搜索能力。最后,根据步骤1中构建的接触状态-机器人动作对,采用粒子群优化算法的装配参数调整算法重新搜索生成合适的装配参数,更新装配参数数据集,并返回步骤3。本专利技术的效果和益处是:本专利技术能够有效地解决了手工装配和离线装配生产效率低,泛化性差、质量一致性差等问题,将机器学习方法引入到齿轮装配任务中,在线学习与调整机器人装配参数,形成装配经验数据库,最终完成了齿轮装配任务。另外,本专利技术能在少量训练数据以及较低的成本下有效提高齿轮装配成功率并减少单次装配时间,相较于传统方法具有更高的装配效率和准确率。附图说明图1为本专利技术实施例中提供的基于学习与预测的齿轮在线快速装配方法的流程图;图2为齿轮装配任务;图3为本文档来自技高网...

【技术保护点】
1.一种基于学习与预测的齿轮在线快速装配方法,其特征在于,包括以下步骤:/n步骤1:建立装配特征与机器人动作之间的接触状态-动作对;/n采用压装时的压入力和压装机末端执行器的位移作为机器人的装配特征CS,采用在工具坐标系的机器人末端执行器的位姿表示机器人动作RM,在i时刻的接触状态-机器人动作对为:/nt

【技术特征摘要】
1.一种基于学习与预测的齿轮在线快速装配方法,其特征在于,包括以下步骤:
步骤1:建立装配特征与机器人动作之间的接触状态-动作对;
采用压装时的压入力和压装机末端执行器的位移作为机器人的装配特征CS,采用在工具坐标系的机器人末端执行器的位姿表示机器人动作RM,在i时刻的接触状态-机器人动作对为:
ti=[fx,fy,fz,d,x,y,z,α,β,γ](1)
i=1,2,...,k(2)
其中,fx,fy,fz为压装机获得的压入力;d为压装机末端执行器的位移;x,y,z,α,β,γ为机器人末端执行器位姿;
步骤2:构建装配经验数据库,在齿轮装配平台进行离线装配试验,以获取到的数据为初始的训练集,并根据训练集建立初始装配经验数据库,进行离线初始学习,获得初始离线装配参数数据集;
步骤3:构建基于高斯过程回归的在线齿轮装配预测算法;
在装配平台利用初始装配参数数据集,根据当前齿轮接触状态,采用高斯过程回归算法预测合适的机器人末端执行器的动作,高斯过程回归模型将接触状态x与机器人动作y之间的关系视作高斯过程f,f(x)是由其均值函数m(x)和协方差函数K(x,x')决定的:
m(x)=E(f(x))(3)
K(x,x')=E[(f(x)-m(x))(f(x')-m(x'))](4)
其中,x和x'为n维输入向量;f(x),f(x')分别为以x和x'为输入的高斯过程回归函数;m(x),m(x')分别为以x为输入的高斯过程中的均值和以x'为输入的高斯过程中的均值;
对于一个模型y=f(x)+ω,而ω~N(0,σ2)的联合分布,N是高斯过程白噪声,将独立的白噪声考虑到f(x),则可建立标准高斯过程回归的模型:



其中,x*和X分别是装配经验数据库中的当前接触状态和先验接触状态;K(X,X')为n阶正定协方差矩阵;K(X,x*),K(x*,X)为先验接触状态与当前接触状态之间的协方差;K(x*,x*)为当前接触状态自身的协方差;In为n...

【专利技术属性】
技术研发人员:刘冬丛明袁利恒
申请(专利权)人:大连理工大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1