一种带有非重复扰动的直流电机迭代学习控制优化方法技术

技术编号：44433276 阅读：5 留言：0更新日期：2025-02-28 18:44

本发明专利技术公开了一种带有非重复扰动的直流电机迭代学习控制优化方法，涉及直流电机控制技术领域，该方法利用深度Koopman算子将非线性系统的标称模型提升至高维线性空间，得到非线性系统的高维状态空间模型描述，然后将该状态空间模型转化为线性重复过程模型的形式，利用二维迭代学习控制方法得到高维空间内系统收敛的线性矩阵不等式条件，进而让智能体分别在带有模型失配的高维状态空间模型迭代学习控制和带有非重复不确定性非线性系统下进行训练，最后再应用于实际系统。该方法所得到的控制律增益可以更好地适配原非线性系统，设计深度强化学习算法对非重复扰动进行补偿，基本实现对期望输出的零误差跟踪。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及直流电机控制，尤其是一种带有非重复扰动的直流电机迭代学习控制优化方法。

技术介绍

1、迭代学习控制ilc是一种专门针对批次过程的控制方法，它能够利用历史批次信息、当前批次的部分信息并与期望输出进行对比来修正上一批次控制信号，使系统实际输出在试错中调整，不断接近期望输出。

2、实际的直流电机控制过程基本都是非线性的，如何获取非线性直流电机的迭代学习控制器增益成为了迭代学习控制应用于实际工业生产过程的难点。同时，考虑在实际生产工况下，由于系统环境变化、零件磨损、老化等跟随时间和批次同时变化的未知扰动存在，容易导致迭代学习控制系统的性能出现恶化。因此，对于具有非重复不确定扰动的非线性直流电机系统，如何获取迭代学习控制器增益，并补偿非重复扰动是一项具有现实意义的研究。

3、现有的解决方案主要包括动态迭代线性化和补偿迭代学习控制两种方法。动态迭代线性化是根据系统历史批次信息对系统进行线性化处理并获得控制器增益的方法。控制算法简单易懂，但其部分无关性参数较多，且难以调节。不仅如此，在非重复不确定扰动下其控制效果难以保证。补偿迭代学习控制方法如神经网络、强化学习等补偿控制方法均是针对非重复不确定性，其获得迭代学习控制器增益还是依靠稳态点附近线性化来完成。

技术实现思路

1、本专利技术的目的是解决带有非重复不确定扰动的非线性直流电机的轨迹跟踪问题，提出了一种带有非重复扰动的直流电机迭代学习控制优化方法，该方法中设计了koopman算子网络对非线性系统进行线性化

2、一种带有非重复扰动的直流电机迭代学习控制优化方法，包括如下步骤：

3、第一步、建立直流电机驱动单杆系统的动态模型，包括：

4、直流电机驱动单杆系统为直流电机通过齿轮驱动单个刚性连杆，在刚性连杆的一侧安装一个光电编码器来测量连杆的角度位置；系统的动态模型由下述二阶微分方程式表示：

5、

6、其中，分别表示直流电机的惯性系数、阻尼系数和角度，j1、b1、θ1分别表示刚性连杆的惯性系数、阻尼系数和角度；n0表示齿轮齿数比，u表示力矩，m表示刚性连杆质量，g为重力加速度，l表示刚性连杆质心到转动轴的长度；

7、通过欧拉近似法对系统(1)进行离散采样，电机角度及其微分为状态刚性连杆角速度为输出力矩为输入u(t)；由此，将式(1)转换为状态方程形式：

8、

9、其中，

10、

11、f(·)代表系统中与状态向量有关的向量函数，且维数与其它向量相匹配；h为采样时间间隔，t＝0,1,2,...,t表示对应的第t个采样点，t为系统开始运行到结束当前批次的采样点长度,x0表示系统的初始状态,d(k,t)为同时与时间和批次有关的非重复不确定性扰动；

12、第二步、构建基于koopman算子的深度神经网络数据驱动模型，包括：

13、针对无外部控制输入的动态非线性系统：

14、x(t+1)＝f(x(t)) (3)

15、函数f:是一个非线性函数，koopman算子的定义为：

16、

17、其中，函数ψ:rn→r称为koopman本征函数，是由符号代表的提升函数空间，rn表示n维向量空间，n为x(t)的维数；koopman算子作用于本征函数ψ，在函数空间上对其进行变换，使得变换结果通过模态ν得到下一时刻的状态值；但(4)式中的koopman算子是一个无穷维线性算子，在实际运用过程中将一个有限维算子近似代替(4)式中的koopman算子，近似的koopman算子定义为：

18、

19、其中μi表示此线性算子的第i个特征值，i＝1,2,…,n，n＞＞n；ψi表示第i个特征值对应的本征函数；

20、通过模态ν将处于提升空间的由本征函数构成的状态向量ψ映射回原状态空间

21、

22、其中，νi表示第i个模态，基于式(5)和式(6)，得到基于koopman理论框架图1及其表示的非线性动力学系统：

23、

24、对于受控系统，可以将koopman理论推广到受控非线性系统；首先，针对(2)的标称系统，将其状态向量扩展为：

25、

26、扩展状态向量为原状态向量与输入向量的拼接，则下一时刻的扩展状态向量为：

27、

28、其中，为前向时移算子，定义本征函数为如下扩展形式：

29、φi(x(t),u(t))＝ψi(x(t))+ζ(u(t)) (10)

30、其中，ζ:rr→rr表示线性变换，rr表示r维向量空间，r为输入向量u(t)的维数；ψi为x(t)的第i个本征函数，φi为扩展状态向量x(t)的第i个本征函数；定义扩展状态向量下的koopman算子为：

31、

32、其中，koopman提升函数为：

33、

34、定义(10)式koopman算子的有限维近似为：

35、

36、其中，且n＞＞n；令：

37、ψ(x(t))＝[ψ1(x(t)) ψ2(x(t)) … ψn(x(t))]t

38、则式(13)化简为：

39、

40、其中a∈rn×n，由矩阵的前n行n列组成，b∈rn×r，由矩阵的前n行的n+1列到n+r列组成，在利用提升函数将低维空间提升至高维空间后，保留原状态变量以保证高维状态变量的连续性，因此定义新的提升状态向量：

41、χ(t)＝[xt(t) ψt(x(t))]t

42、则式(14)化简为：

43、

44、其中，a*∈r(n+n)×(n+n)，b*∈r(n+n)×1，c*∈rm×(n+n)，m为输出变量y(t)的维数；将作为新的koopman算子，则得到提升空间内的线性koopman模型如式(15)所示；根据式(15)所示系统结构，创建系统(2)的基于koopman的神经网络数据驱动模型如图2所示，该数据驱动模型主要包括数据缓冲区和深度koopman算子网络；数据缓冲区的数据依时间序列随机采样控制量得到大量批次的非线性系统输入输出信息；深度koopman算子网络中，通过用多层神经网络代替提升函数以及用单层神经网络代替koopman算子实现对原系统的升维和预测；

45、第三步、建立基于koopman算子的深度神经网络的损失函数，包括：

46、为了利用深度神经网络的高表达性、鲁棒性，利用神经网络nen(x|w)代替本征函数ψ(x(t))，使用深度学习的方式求解nen(x|w)的权重参数w和koopman算子根据系统工况和实际环境条件选定初始状态，随机平均采样控制量，得到k个本文档来自技高网...

【技术保护点】

1.一种带有非重复扰动的直流电机迭代学习控制优化方法，其特征在于，所述方法包括：

2.根据权利要求1所述的一种带有非重复扰动的直流电机迭代学习控制优化方法，其特征在于，从三个方面建立损失函数Li包括：

3.根据权利要求1所述的一种带有非重复扰动的直流电机迭代学习控制优化方法，其特征在于，式(24)不等式成立的证明过程包括：

【技术特征摘要】

1.一种带有非重复扰动的直流电机迭代学习控制优化方法，其特征在于，所述方法包括：

2.根据权利要求1所述的一种带有非重复扰动的直流电机迭代学习控制优化方法，其特征...

【专利技术属性】
技术研发人员：陶洪峰，黄远，
申请(专利权)人：江南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人