一种模块化机器人系统的非零和博弈神经-最优控制方法技术方案

技术编号：29212490 阅读：27 留言：0更新日期：2021-07-10 00:49

本发明专利技术提出了一种模块化机器人系统的非零和博弈神经

全部详细技术资料下载

【技术实现步骤摘要】
一种模块化机器人系统的非零和博弈神经
‑
最优控制方法

[0001]本专利技术涉及不确定环境下补偿
‑
评判结构的模块化机器人非零和博弈神经
‑
最优控制方法，属于机器人控制算法领域。

技术介绍

[0002]模块化机器人由电源、处理系统、执行器和传感器等模块组成。这些模块组合满足不同构形的标准机电接口来适应复杂工作环境的各种任务要求，基于上述优点，模块化机器人经常应用于不确定环境中，例如人机交互、外界碰撞等。此外，在不确定环境下，模块化机器人需要兼顾控制精度和功耗的合适控制系统。
[0003]最优控制作为控制理论的重要组成部分，其研究的核心问题是对于一个给定的被控系统，选择合适的控制策略使系统的某些性能指标达到最优。对于模块化机器人系统，获取其最优控制策略则需要求解耦合的哈密顿
‑
雅克比方程，而该方程是一类非线性偏微分方程，难以用解析方法求得最优解。自适应动态规划方法是一种解决非线性系统最优控制问题的强有力工具，在自适应动态规划系统中，神经网络被设计用来近似性能指标函数并估计哈密顿
‑
雅克比方程的解。
[0004]对于不确定环境下的非线性系统，尤其是模块化机器人系统，通过设计补偿
‑
评判结构的非零和神经
‑
最优控制，并结合通过求解耦合的哈密顿
‑
雅克比方程得到非零和最优控制律，运用到动力学模型，获得关节位置变量。

技术实现思路

[0005]本专利技术...

【技术保护点】

【技术特征摘要】
1.一种模块化机器人系统的非零和博弈神经
‑
最优控制方法，其特征是，首先建立模块化机器人系统动力学模型，通过对模块化机器人关节子系统间的耦合交联项的分析，然后构建代价函数与耦合的HJ方程，最后采用神经网络对代价函数进行近似，从而得到本发明所提出的补偿
‑
评判结构的非零和博弈神经
‑
最优控制律。2.根据权利要求1所述的一种模块化机器人系统的非零和博弈神经
‑
最优控制方法，该方法包括以下步骤：Step1，建立模块化机器人系统动力学模型如下：上式中，下标i代表第i个模块，I
mi
是转动轴的转动惯量，γ
i
是齿轮传动比，θ
i
，和分别是关节位置，速度和加速度，是关节摩擦项，是关节子系统间的耦合交联项，τ
is
是关节输出转矩，τ
i
是电机输出转矩；令g
i
＝(I
im
γ
i
)
‑1∈R
+
，定义状态向量控制输入u
i
＝τ
i
；重新改写式(1)中第i个子系统的动力学模型可以得到：其中，表示动力学模型中的已精确建模和估计的部分，是模型不确定项，包括摩擦模型误差和关节子系统间的耦合力矩交联项以及不确定环境项；定义系统的状态向量控制输入u
i
＝τ
i
；Step2，构建代价函数为：其中，s(e(τ))定义为为滤波误差，且e＝x1‑
x
d
和分别代表关节的位置和速度跟踪误差，x
d
与分别是期望的位置和速度，α
e
为确定常数，U
i
(s,u1,...,u
n
)为效用函数，和是确定的正常数矩阵；定义哈密顿方程如下：其中，为代价函数J
i
(s)的梯度，为计算辅助项，为期望的加速度；定义如下最优代价函数：
已知在最优控制设计下，J
i*
(s,u1,...,u
n
)满足如下耦合的HJ方程：令满足式(14)的分散最优控制律定义为如下形式：其中，u
i1
是鲁棒控制律，是最优补偿控制律。定义鲁棒控制律u
i1
为：u
i1
＝...

【专利技术属性】
技术研发人员：张振国，刘克平，董博，朱新野，马冰，王悦西，杨宏韬，李岩，
申请(专利权)人：长春工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人