一种基于行为克隆和协同性系数的三体协同搬运方法及系统技术方案

技术编号:38215022 阅读:9 留言:0更新日期:2023-07-25 11:23
本发明专利技术公开了一种基于行为克隆和协同性系数的三体协同搬运方法及系统,该方法包括:根据搬运状态,将搬运任务划分为各个搬运阶段,包括抬升阶段、放下阶段、加速阶段、匀速阶段、减速阶段、转弯阶段;针对不同的搬运阶段,虚拟人通过感知设备学习人类搬运习惯,并反馈到行为克隆鼓励策略算法更新机器人搬运策略,同时通过平滑函数调整机器人行为,使得人机协作进入稳定状态。本发明专利技术在传统的人机协作任务中加入可交互、多途径感知信息、智能平衡人机行为差异、智能决策的虚拟人,运用行为克隆网络使机器人在不同阶段做出与人相近的行为动作,通过协同性系数调整算法使人机行为达成一致,使得系统进入稳态,有效提高了任务协作效率。率。率。

【技术实现步骤摘要】
一种基于行为克隆和协同性系数的三体协同搬运方法及系统


[0001]本专利技术属于人机协作
,具体涉及一种基于行为克隆和协同性系数的三体协同搬运方法及系统。

技术介绍

[0002]如今,随着元宇宙兴起,人工智能、大数据、移动互联网等新一代信息技术快速发展和普及应用,融合虚拟现实、增强现实、深度学习、语义理解、语音识别等多种 AI 技术的数字虚拟人正成为人工智能应用最广泛、最有发展潜力的领域之一。
[0003]在搬运、避障等人机协作(HRC)领域,当任务较为复杂,机器人和人类感知信息的差异性可能会导致人类在完成某一具体任务时出现和机器人决策的相悖行为。以搬运过程为例,人会不可避免地对搬运任务额外地克服机器人决策差异而做功。
[0004]因此,本专利技术在整个协同系统中加入虚拟人角色,构成人

虚拟人

机器人协同(HVRC)系统,因其感知信息的全面性,结合数字孪生技术,用以平衡人机认知差异,作出智能决策,实时调整机器人行为以提高协同效率。

技术实现思路

[0005]专利技术目的:本专利技术在传统的人机协作系统上加入虚拟人,旨在弥补人机协作在应对复杂情形时的低效性,这种低效性主要来自于人和机器人由于对环境感知的差异导致的决策差异,主要体现在人机在参与搬运过程中的不协调性,从而导致协同过程中人的舒适度降低。
[0006]技术方案:为实现上述目的,本专利技术提供一种基于行为克隆和协同性系数的三体协同搬运方法,包括以下步骤:
[0007]为了研究整个协同搬运过程,首先将整个搬运过程分为几个特定阶段,如抬升、放下、加速、减速、匀速、转弯等,对每个阶段单独研究。
[0008]针对不同的搬运阶段,虚拟人虚拟人通过感知设备学习人类搬运习惯,并反馈到行为克隆鼓励策略算法更新机器人搬运策略,同时通过平滑函数调整机器人行为,使得人机协作进入稳定状态;
[0009]所述行为克隆鼓励策略算法的目标函数定义为:
[0010] ;
[0011]其中表示搬运阶段,表示人类搬运行为,是机器人搬运策略,为损失函数,通过最小化目标函数更新机器人搬运策略。
[0012]进一步地,所述搬运阶段的判断通过以下任意一种或多种方式结合实现:
[0013]①
虚拟人对人类行为意图的识别(如语音交互、手势识别等);
[0014]②
虚拟人对环境感知参数的分析。
[0015]进一步地,所述机器人搬运策略定义为:,其中表示机器人控制参数,包括以下任意一种或多种参数:抬升高度(针对抬升或放下阶段)、加速度(针对加速或减速阶段)、平均速度(针对匀速阶段)、路径曲率、拐弯速度(针对转弯阶段)。
[0016]进一步地,在机器人搬运策略的执行过程中,进一步通过平滑函数调整机器人控制参数的偏差值,实现控制参数的平滑调整,使得协同性系数,所述平滑函数定义为:
[0017] ;
[0018]其中为控制参数的初始偏差值,令得出预计调整时间:
[0019] ;
[0020]其中为阈值。
[0021]进一步地,所述协同性系数定义为:
[0022];
[0023]其中根据机器人控制参数和实际感知参数确定,实际感知参数包括以下任意一种或多种参数:抬升高度、力传感器数据、平均速度、路径曲率、拐弯速度。
[0024]进一步地,在搬运过程中,虚拟人根据环境感知模块得到的点云地图,构建二维平面栅格地图,由此进行路径规划。
[0025]进一步地,所述路径规划方法具体包括:
[0026]1)已知搬运起始点和终点,使用A*算法计算出初始路径;
[0027]2)在初始路径的基础上,应用三角形顶点筛查法进行路径优化。
[0028]进一步地,所述三角形顶点筛查法具体包括:
[0029]假设初始路径上的三个连续节点,即:起始节点、中间节点、以及末端节点构成三角形,且障碍物坐标为,则作如下限定:
[0030] ;
[0031]其中,S是最小安全距离,若(表示、之间的路径可避开障碍物),则去除节点,直接连接节点和作为新的路径(两点之间直线最短),否则从节点沿着节点方向逐单位栅格距离进行试探(沿

方向找最短路径),即:将更新为,,,其中为单位栅格距离,更新后重新计算并进行下一轮判断,重复以上过程,最终得到最少节点数和最短路径。
[0032]此外,本专利技术还提供了一种基于行为克隆和协同性系数的三体协同搬运系统,包括虚拟人、机器人、真人三个参与主体和多源感知模块,该系统利用上述三体协同搬运方法执行人机协作搬运任务,其中虚拟人为分布式云端智能体。
[0033]进一步的,所述多源感知模块包括:
[0034]环境感知模块,用于采集地图信息;
[0035]行为意图识别模块,用于获取真人行为和意图。
[0036]有益效果:本专利技术在传统的人机协作任务中加入可交互、多途径感知信息、智能平衡人机行为差异、智能决策的虚拟人,运用行为克隆网络使机器人在不同阶段做出与人相近的行为动作,通过协同性系数调整算法(即平滑函数)使人机行为达成一致,使得系统进入稳态,有效提高了任务协作效率。
附图说明
[0037]图1是本专利技术实施例中的三体协同搬运系统框图;
[0038]图2是本专利技术实施例中路径优化的原理图;
[0039]图3是本专利技术实施例中所构建的有限自动状态机示意图;
[0040]图4是本专利技术实施例中的人机协同控制流程图。
具体实施方式
[0041]以下结合附图和具体的实施例对本专利技术作进一步详细说明。根据下面的说明,本专利技术的优点和特征将更清楚。
[0042]如图1所示,本实施例所涉及的三体协同搬运系统包括真人、虚拟人和机器人三个参与主体,搬运对象为桌子。具体地,人机协作方式为:搬运人与机器人分别位于桌子两端,合作进行桌子的抬升和移动,在人机合作过程中,虚拟人通过行为克隆鼓励策略网络对人的搬运习惯进行学习优化,从而根据特定阶段更新机器人控制策略,抬升在实际搬运过程
中通过协同性系数调整算法进一步缩小人机意图差异。
[0043]此外,系统由以下模块组成:环境感知模块、行为意图识别模块、协同控制决策模块、学习优化模块。其中,环境感知模块用于对场景建模以及对环境中物体添加语义信息,行为意图识别模块用于人类意图识别与交互,协同控制决策模块基于以上两个模块完成搬运任务的初始规划和动态调整,做出最优决策,同时通过学习优化模块提升人机协同程度。
[0044]所述虚拟人依托于可展示其形象、路径规划信息以及收音和播报功能的便携终端上,其感知信息的途径是系统中所有信息感知途径的集合,包括场景中获取全局物体位置信息以及轮廓大小信息的固定采集相机(即环境感知模块),搬运过程中采集真人行为意图信息的力传感器、加速度传感器、人类交互指令(语音指令)集以及摄像头等(即行为意图识别模块)。
[0045本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于行为克隆和协同性系数的三体协同搬运方法,其特征在于,包括以下步骤:步骤1:根据搬运状态,将搬运任务划分为各个搬运阶段,包括抬升阶段、放下阶段、加速阶段、匀速阶段、减速阶段、转弯阶段;步骤2:针对不同的搬运阶段,虚拟人通过感知设备学习人类搬运习惯,并反馈到行为克隆鼓励策略算法更新机器人搬运策略,同时通过平滑函数调整机器人行为,使得人机协作进入稳定状态;所述行为克隆鼓励策略算法的目标函数定义为:;其中表示搬运阶段,表示人类搬运行为,是机器人搬运策略,为损失函数,通过最小化目标函数更新机器人搬运策略。2.根据权利要求1所述的三体协同搬运方法,其特征在于,所述搬运阶段的判断通过以下任意一种或多种方式结合实现:

虚拟人对人类行为意图的识别;

虚拟人对环境感知参数的分析。3.根据权利要求1所述的三体协同搬运方法,其特征在于,所述机器人搬运策略定义为:,其中表示机器人控制参数,包括以下任意一种或多种参数:抬升高度、加速度、平均速度、路径曲率、拐弯速度。4.根据权利要求3所述的三体协同搬运方法,其特征在于,在机器人搬运策略的执行过程中,进一步通过平滑函数调整机器人控制参数的偏差值,使得协同性系数,所述平滑函数定义为:;其中为控制参数的初始偏差值,令得出预计调整时间:;其中为阈值。5.根据权利要求4所述的三体协同搬运方法,其特征在于,所述协同性系数定义为:;其中根据机器人控制参数和实际感知参数确定,实际感...

【专利技术属性】
技术研发人员:李新德钱玉航吕志伟
申请(专利权)人:南京泛美利机器人科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1