一种基于视觉生成的机械臂自动组装方法技术

技术编号:37645964 阅读:12 留言:0更新日期:2023-05-25 10:12
本发明专利技术公开了一种基于视觉生成的机械臂自动组装方法,属于机械臂自动组装技术领域,具体步骤为:从工程图源中获取工程图和对应的3D工程图,构建循环生成对抗网络训练集;将循环生成对抗网络训练集进行训练,得到循环生成对抗网络;从目标工程图源中获取目标工程图,并输入到循环生成对抗网络中,生成3D标准工程图;在模拟环境中利用强化学习近端策略优化算法进行策略优化,得到策略函数π(

【技术实现步骤摘要】
一种基于视觉生成的机械臂自动组装方法


[0001]本专利技术涉及机械臂自动组装
,具体为一种基于视觉生成的机械臂自动组装方法。

技术介绍

[0002]机械臂是机械人
中得到最广泛实际应用的自动化机械装置,手臂是机器人执行机构中重要的部件,作用是将被抓取的工件运送到给定的位置。机械臂是指高精度,多输入多输出、高度非线性、强耦合的复杂系统,其通常由以下几部分组成:运动元件,导向装置,手臂等。手臂的结构、工作范围、灵活性、承载能力和定位精度都直接影响机器手臂的工作性能。
[0003]机械臂在产业自动化的应用相当广泛,主要使用在人工无法进行或者会耗费较多时间来做的工作,在精度与耐用性上可以减少人为的不可预知的问题。机械臂是机械人
中得到最广泛实际应用的自动化机械装置,在工业制造、医学治疗、娱乐服务、军事、半导体制造以及太空探索等领域都能见到它的身影。
[0004]目前最常用的对机械臂进行控制的方法是基于指令的机械臂控制,为了让机械臂完成相应的任务,需要向机械臂发送一系列的指令,机械臂需要根据接收到的指令,精确地定位到三维(或二维)空间上的某一点进行作业。但基于预设的指令的机械臂控制,需要有经验的工作人员花费大量精力进行重新地校准、设计、调整且缺乏灵活性,且对于机械臂的执行缺乏一定的灵活性。强化学习也逐渐地应用于机械臂控制领域,但存在准确率低,并且没有可解释性,很难通过人工进行修正的问题。
[0005]因此,如何提高机械臂自动控制的准确性,提高机械臂控制的灵活性,提高机械臂指令修正的灵活性就变得尤其重要。

技术实现思路

[0006]本专利技术的目的在于提供一种基于视觉生成的机械臂自动组装方法,通过将指令控制和深度学习相结合的方法来解决上述
技术介绍
中提出的机械臂自动控制的准确性低,指令修正、机械臂控制灵活性差的问题。
[0007]为了解决上述技术问题,本专利技术提供如下技术方案:一种基于视觉生成的机械臂自动组装方法,包括:
[0008]从工程图源中获取工程图和对应的3D工程图,构建循环生成对抗网络训练集;
[0009]将循环生成对抗网络训练集进行训练,得到循环生成对抗网络;
[0010]从目标工程图源中获取目标工程图,将目标工程图输入到循环生成对抗网络中,生成3D标准工程图;
[0011]在模拟环境中利用强化学习近端策略优化算法进行策略优化,得到策略函数π(
·

[0012]基于3D标准工程图、目标图像和策略函数π(
·
,通过策略模型生成控制指令,机械
臂执行控制指令,直至目标图像与3D标准工程图的相似度高于阈值α时,结束执行进程。
[0013]所述目标工程图源是指由根据目标任务绘制成的工程图组成的数据库;
[0014]所述工程图可以通过手绘、软件等方式进行绘制,工程图不限于格式,颜色可以是多样的;所述工程图源是由许多工程图和对应的3D工程图构成的图源库,所述循环生成对抗网络训练集里包含一张工程图和一张对应的3D工程图。
[0015]根据上述技术方案,所述循环生成对抗网络构建的步骤为:
[0016]输入循环生成对抗网络训练集,生成器1根据工程图输出模拟的3D工程图,鉴别器1对3D工程图和模拟的3D工程图进行区别鉴别;
[0017]生成器2根据3D工程图输出模拟的工程图,鉴别器2对工程图和模拟工程图进行区别鉴别;
[0018]生成器1和鉴别器1不断对抗,生成器2和鉴别器2也不断对抗,直至生成与3D工程图无法区分的模拟3D工程图。
[0019]利用生成器和鉴别器不断对抗使得生成的3D工程图的精准度不断提高,为强化学习提供了更加精准的3D标准工程图。
[0020]根据上述技术方案,所述目标图像为机械臂上单目摄像头捕获的图像。
[0021]根据上述技术方案,所述策略模型建立的步骤为:
[0022]确定环境状态s
t
和动作状态a
t

[0023]根据策略函数π(
·
,环境状态s
t
选择一个动作状态a
t
与未知环境进行交互,每交互一次得到一个奖赏r
t
与环境的下一个状态s
t+1
,经过长期累积得到奖赏函数
[0024]对奖赏函数J(π)进行求导,利用梯度下降算法来优化策略函数,得到策略模型a
t
=π(s
t
),该模型可以针对当前的状态输出需要执行的动作;
[0025]其中,γ∈[0,1]为一个常数折扣因子,t表示时间,T表示总时间。
[0026]根据上述技术方案,所述环境状态s
t
包括机械臂上单目摄像头捕获的待组装物体的RGB图像和已经完成组装的RGB图像。
[0027]根据上述技术方案,所述动作状态a
t
是一个三维向量,包括操作动作、旋转的角度和偏移;操作动作包括移动、抓取、旋转等,偏移由X,Y,Z三坐标组成。
[0028]根据上述技术方案,所述奖赏函数获得步骤为:
[0029]利用预训练的VGG模型对3D标准工程图进行处理,得到3D标准工程图RGB特征向量;
[0030]利用预训练的VGG模型对机械臂上单目摄像头捕获的目标图像进行处理,得到目标图像RGB特征向量;
[0031]对3D标准工程图RGB特征向量和目标图像RGB特征向量进行相似度计算,得到奖赏函数。
[0032]所述预训练的VGG模型主要用于图像分类,取该神经网络模型的倒数第二层的特征输出,可以用该特征对图像进行一个压缩的表示。
[0033]根据上述技术方案,所述相似度计算表示为对3D标准工程图RGB特征向量和目标图像RGB特征向量进行均方误差计算;
[0034]所述均方误差计算公式为:
[0035][0036]其中,A,B分别代表结果图像与生成的3D图像的特征向量,i代表特征向量的每隔一位置,A
i
代表向量中每个位置对应的具体值,利用特征图的均方误差,可以让目标图像与生成的3D标准工程图之间尽可能接近,提高控制指令的精准度。
[0037]与现有技术相比,本专利技术所达到的有益效果是:
[0038]1、本专利技术设置循环生成对抗网络,通过输入工程图自动生成更精准的3D标准工程图,以3D标准工程图为标准下达指令,也就是3D标准工程图的精准度越高,下达的控制指令越精准,且具有较好的可解释性,同时可以方便地通过人工对中间过程进行修正。
[0039]2、本专利技术利用强化学习和循环生成对抗网络,实现可解释、端到端、可迁移的机械臂控制方法,仅需要输入简单的工程图,利用循环生成对抗网络生成3D标准工程图,强化学习的方法生成机械臂控制指令,进而实现对机械臂进行自动控制,无需对机械臂进行逐步的调试、设计,使得机械臂自动控制更加灵活。
附图说明
[0040]附图用来本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于视觉生成的机械臂自动组装方法,其特征在于:包括从工程图源中获取工程图和对应的3D工程图,构建循环生成对抗网络训练集;将循环生成对抗网络训练集进行训练,得到循环生成对抗网络;从目标工程图源中获取目标工程图,将目标工程图输入到循环生成对抗网络中,生成3D标准工程图;在模拟环境中利用强化学习近端策略优化算法进行策略优化,得到策略函数π(
·
);基于3D标准工程图、目标图像和策略函数π(
·
),通过策略模型生成控制指令,机械臂执行控制指令,直至目标图像与3D标准工程图的相似度高于阈值α时,结束执行进程。2.根据权利要求1所述的一种基于视觉生成的机械臂自动组装方法,其特征在于:所述循环生成对抗网络构建的步骤为:输入循环生成对抗网络训练集,生成器1根据工程图输出模拟的3D工程图,鉴别器1对3D工程图和模拟的3D工程图进行区别鉴别;生成器2根据3D工程图输出模拟的工程图,鉴别器2对工程图和模拟工程图进行区别鉴别;生成器1和鉴别器1不断对抗,生成器2和鉴别器2也不断对抗,直至生成与3D工程图无法区分的模拟3D工程图。3.根据权利要求1所述的一种基于视觉生成的机械臂自动组装方法,其特征在于:所述目标图像为机械臂上单目摄像头捕获的图像。4.根据权利要求1所述的一种基于视觉生成的机械臂自动组装方法,其特征在于:所述策略模型建立的步骤为:确定环境状态s
t
和动作状态a
t
;根据策略函数π(
·
),环境状态s
t
选择一个动作状态a
t
与未知环境进...

【专利技术属性】
技术研发人员:张伯雷马泽森王圣元张景涛邹程萱周剑
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1