【技术实现步骤摘要】
一种基于生成对抗模仿学习的操作人员运动技能训练方法
[0001]本专利技术属于技能训练领域,具体涉及一种基于生成对抗模仿学习的操作人员运动技能训练方法。
技术介绍
[0002]随着遥操作技术的发展,基于遥操作开发出的产品在医疗等领域获得了广泛应用。但此类设备需要较高的技能水平才能掌握,技能水平不足的操作员在操作时容易出现事故,因此需要针对新手操作员精心设计学习策略。2018年Mahya Shahbazi提出了专家在环的遥操作训练框架,允许专家在操纵控制台完成实际任务的同时训练学员,且能够保证系统的稳定性和安全性。但G.Ganesh指出,双向触觉反馈是提高技能水平的关键因素,与水平相当的同伴进行互动比与专家的进行互动能更快地提高技能水平。Mahya Shahbazi的框架仅在学员端施加触觉反馈,无法实现学员与专家的双向互动。但如果在此框架上添加专家端的触觉反馈,可能会威胁到系统的安全性。
技术实现思路
[0003]本专利技术的目的是提供一种基于生成对抗模仿学习的操作人员运动技能训练方法,以解决遥操作任务中操作人员技能水平提升较慢的问题。
[0004]本专利技术采用以下技术方案:一种基于生成对抗模仿学习的操作人员运动技能训练方法,基于一专家在环的遥操作训练框架,所述专家在环的遥操作训练框架包括专家和学员,通过在学员端施加引导力,在遥操作设备上模拟出专家对学员教导;在所述专家在环的遥操作训练框架中引入一训练者,所述训练者用于采用生成对抗模仿学习对其操作进行模仿;
[0005]其中,训练过程包 ...
【技术保护点】
【技术特征摘要】
1.一种基于生成对抗模仿学习的操作人员运动技能训练方法,其特征在于,基于一专家在环的遥操作训练框架,所述专家在环的遥操作训练框架包括专家和学员,通过在学员端施加引导力,在遥操作设备上模拟出专家对学员教导;在所述专家在环的遥操作训练框架中引入一训练者,所述训练者用于采用生成对抗模仿学习对其操作进行模仿;其中,训练过程包括以下步骤:步骤一、建立学员训练数据库;步骤二、基于训练数据库训练智能体来模拟操作员的行为;步骤三、基于训练好的智能体,设计学员运动技能训练方法。2.如权利要求1所述的一种基于生成对抗模仿学习的操作人员运动技能训练方法,其特征在于,所述步骤一建立学员训练数据库的具体方法为:所述训练者和所述学员共同在Mahya Shahbazi的框架下操作,均受到引导力作用,期间收集操作员轨迹x
m
、学员轨迹x
t
、正确轨迹x
e
和引导刚度k形成学员训练数据库。3.如权利要求2所述的一种基于生成对抗模仿学习的操作人员运动技能训练方法,其特征在于,所述步骤二基于训练数据库训练智能体来模拟操作员的行为的具体方法为:对步骤一中得到的学员训练数据库进行处理,得到操作员轨迹和正确轨迹的差值Δ
me
(t)=x
m
(t)
‑
x
e
(t),操作员轨迹和学员轨迹的差值Δ
mt
(t)=x
m
(t)
‑
x
t
(t);令状态s
t
=(Δ
mt
(t),k(t)),动作a
t
=Δ
me
(t);将所述学员训练...
【专利技术属性】
技术研发人员:黄攀峰,武曦,刘正雄,马志强,常海涛,刘星,
申请(专利权)人:西北工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。