一种基于ADP的水下摇臂系统的控制方法及系统技术方案

技术编号:33466779 阅读:20 留言:0更新日期:2022-05-19 00:45
本发明专利技术公开了自动控制技术领域的一种基于ADP的水下摇臂系统的控制方法及系统,水下摇臂系统的控制方法包括:建立考虑了水中阻力的水下摇臂系统模型;建立水下摇臂系统模型的能量最优性能指标函数;基于能量最优性能指标函数构建水下摇臂系统的神经网络模型;基于ADP算法求解水下摇臂系统的神经网络模型,获得水下摇臂系统的能量最优控制策略。本发明专利技术使得水下摇臂小范围运动复位时消耗更少的能量。得水下摇臂小范围运动复位时消耗更少的能量。得水下摇臂小范围运动复位时消耗更少的能量。

【技术实现步骤摘要】
一种基于ADP的水下摇臂系统的控制方法及系统


[0001]本专利技术属于自动控制
,具体涉及一种基于ADP的水下摇臂系统的控制方法及系统。

技术介绍

[0002]随着工业自动化的需求增大以及当代控制技术的发展完善,经常要求在保证控制系统稳定性的同时还需要控制过程与结果的最优性。由于现实生活中的非线性系统的复杂性、不确定性,一直以来人们都在寻找一种近似简化的结构来解决非线性仿射系统的最优控制。基于神经网络的自适应动态规划方法(Adaptive Dynamic Programming,ADP)是其中一个重要的研究方向。ADP是一种用近似方法求解系统最优控制问题的算法。
[0003]ADP可以很好的克服求解非线性系统最优控制问题中的计算困难。各种在线ADP和离线ADP算法被提出,用于解决某些非线性系统的模型部分未知、时变性、耦合性等问题。
[0004]摇臂被广泛的运用于工业生产与生活中,简化的摇臂系统是一个非线性仿射系统。当摇臂在水下工作,水中的阻力不能忽略时,阻力会影响摇臂的工作,增加电机的能量消耗。大多实际运用中,摇臂的定位复位采用简单的PID控制。其不足在于仅仅关注了控制的准确性,没有关注控制过程中的能量消耗,粗犷的控制也造成了很多能量浪费。

技术实现思路

[0005]为解决现有技术中的不足,本专利技术提供一种基于ADP的水下摇臂系统的控制方法及系统,使得水下摇臂小范围运动复位时消耗更少的能量。
[0006]为达到上述目的,本专利技术所采用的技术方案是:
[0007]第一方面,提供一种水下摇臂系统的控制方法,包括:建立考虑了水中阻力的水下摇臂系统模型;建立水下摇臂系统模型的能量最优控制函数;基于能量最优控制函数构建水下摇臂系统的神经网络模型;基于ADP算法求解水下摇臂系统的神经网络模型,获得水下摇臂系统的能量最优控制策略。
[0008]进一步地,所述考虑了水中阻力的水下摇臂系统模型为:
[0009][0010]其中,x(t)表示系统状态,由角度和角速度组成;u(t)表示控制输入,g(x(t))表示控制非线性函数,f(x(t))表示反映水下摇臂系统模型的非线性函数,表示系统状态变化率。
[0011]进一步地,所述能量最优控制函数为:
[0012][0013]其中,u
*
(x)表示最优控制,R为一个正定矩阵,表示性能指标函数对系统状态的偏导数。
[0014]进一步地,所述水下摇臂系统的神经网络模型为:
[0015][0016]其中,表示激活函数,w
j
表示输出层的权重,w
L
表示权重向量,φ
L
(x)表示激活函数的向量。
[0017]进一步地,所述基于ADP算法求解水下摇臂系统的神经网络模型,获得水下摇臂系统的能量最优控制策略,包括:基于设计的策略迭代方法、权值收敛方案实现ADP算法求解水下摇臂系统的神经网络模型,获得水下摇臂系统的能量最优控制策略。
[0018]进一步地,所述策略迭代方法,包括:
[0019]策略评估:
[0020][0021]其中,x(t+T)表示在t+T时刻的状态量,Q和R均为正定矩阵;
[0022]策略改进:
[0023][0024]其中,表示φ
L
(x)对系统状态的偏导数。
[0025]进一步地,所述权值收敛方案,包括:运用窗口最小二乘法实现权重向量w
L
的收敛,使得(w
L
)
T
φ
L
(x)近似于最优性能指标函数;选取窗口长度为n是大于1的自然数,令
[0026][0027]其中,t=kT,p=k

n+1,k是自然数,运用最小二乘算法可以求得更新的权值矩阵,
[0028][0029]当t≤0时,有h
t
=0,r
t
=0。
[0030]进一步地,所述实现ADP算法,包括:在设计算法时,令x1,x2∈(

1,1),权值初始值w
L
=[0;0;2],选取激活函数选取数据窗口长度为20,选取迭代时间间隔T=0.1,迭代次数上限设置在1000,计算出前后两步迭代的误差ε=||w
L

w

L
||,当ε≤1
×
10
‑8时停止迭代;选取五组不同初始值同时进行,保证最小二乘算法可实现。
[0031]第二方面,提供一种水下摇臂系统的控制系统,包括:第一模块,用于建立考虑了水中阻力的水下摇臂系统模型;第二模块,用于建立水下摇臂系统模型的能量最优控制函数;第三模块,用于基于能量最优控制函数构建水下摇臂系统的神经网络模型;第四模块,用于基于ADP算法求解水下摇臂系统的神经网络模型,获得水下摇臂系统的能量最优控制策略。
[0032]与现有技术相比,本专利技术所达到的有益效果:
[0033](1)本专利技术通过建立考虑了水中阻力的水下摇臂系统模型及其能量最优性能指标函数;基于能量最优性能指标函数构建水下摇臂系统的神经网络模型;基于ADP算法求解水下摇臂系统的神经网络模型,获得水下摇臂系统的能量最优控制策略,使得水下摇臂小范围运动复位时消耗更少的能量;
[0034](2)本专利技术对摇臂系统的建模加入水的阻力(空气中也可理解为空气阻力),更加具有一般性;
[0035](3)本专利技术设计的ADP算法,考虑了系统的能量最优控制问题,实际应用会中比一般系统更加节约能源;
[0036](4)本专利技术运用窗口最小二乘的方法,实现参数的快速收敛的同时控制住了计算量,并且可以适应系统参数的缓慢变化。
附图说明
[0037]图1是本专利技术实施例中简单摇杆的结构图;
[0038]图2是本专利技术实施例中使用的ADP控制方法的结构图;
[0039]图3是本专利技术实施例中仿真得到的最优控制策略的曲线图;
[0040]图4是本专利技术实施例中取得的最优控制策略下的系统状态收敛图。
具体实施方式
[0041]下面结合附图对本专利技术作进一步描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。
[0042]实施例一:
[0043]一种基于ADP的水下摇臂系统的控制方法,包括:建立考虑了水中阻力的水下摇臂系统模型;建立水下摇臂系统模型的能量最优控制函数;基于能量最优控制函数构建水下摇臂系统的神经网络模型;基于ADP算法求解水下摇臂系统的神经网络模型,获得水下摇臂系统的能量最优控制策略。
[0044]步骤一:建立考虑了水中阻力的水下摇臂系统模型。
[0045]如图1所示的摇杆实例,如果考虑水中阻力的话,根据机理建模可以得到方程:
[0046][0047]其中,q摇杆离开水平位置的角度,M是摇臂的质量,L是重心距离,J是转动惯量,u是输入转矩本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种水下摇臂系统的控制方法,其特征在于,包括:建立考虑了水中阻力的水下摇臂系统模型;建立水下摇臂系统模型的能量最优控制函数;基于能量最优控制函数构建水下摇臂系统的神经网络模型;基于ADP算法求解水下摇臂系统的神经网络模型,获得水下摇臂系统的能量最优控制策略。2.根据权利要求1所述的一种水下摇臂系统的控制方法,其特征在于,所述考虑了水中阻力的水下摇臂系统模型为:其中,x(t)表示系统状态,由角度和角速度组成;u(t)表示输入转矩,g(x(t))表示控制非线性函数,f(x(t))表示反映水下摇臂系统模型的非线性函数,表示系统状态变化率。3.根据权利要求1所述的一种水下摇臂系统的控制方法,其特征在于,所述能量最优控制函数为:其中,u
*
(x)表示最优控制,R为一个正定矩阵,表示性能指标函数对系统状态的偏导数。4.根据权利要求1所述的一种水下摇臂系统的控制方法,其特征在于,所述水下摇臂系统的神经网络模型为:其中,表示激活函数,w
j
表示输出层的权重,w
L
表示权重向量,φ
L
(x)表示激活函数的向量。5.根据权利要求1所述的一种水下摇臂系统的控制方法,其特征在于,所述基于ADP算法求解水下摇臂系统的神经网络模型,获得水下摇臂系统的能量最优控制策略,包括:基于设计的策略迭代方法、权值收敛方案实现ADP算法求解水下摇臂系统的神经网络模型,获得水下摇臂系统的能量最优控制策略。6.根据权利要求5所述的一种水下摇臂系统的控制方法,其特征在于,所述策略迭代方法,包括:策略评估:其中,x(t+T)表示在t+T时刻的状态量,Q和R均为正定矩阵;策略改进:
其中,表示φ...

【专利技术属性】
技术研发人员:叶倩
申请(专利权)人:无锡职业技术学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1