一种多阶段迭代学习控制方法及介质技术

技术编号:38848569 阅读:14 留言:0更新日期:2023-09-17 09:58
本发明专利技术涉及多阶段迭代学习控制方法,包括:S1,针对被控制的控制系统,设置相对于系统输出的目标跟踪轨迹以及预期的跟踪精度;S2,设置当前迭代批次对应的控制系统的状态变量的初始值;S3,获取当前迭代批次中各个离散时间点的系统输出,并计算当前迭代批次各个离散时间点的系统跟踪误差;S4,根据当前迭代批次各个离散时间点的系统跟踪误差的大小,基于所述系统跟踪误差的比例项更新下一迭代批次的系统输入,或者基于所述系统跟踪误差的分数阶项更新下一迭代批次的系统输入;S5,返回S2继续执行,直至当前迭代批次的每一个离散时间点的系统跟踪误差小于所述预期的跟踪精度。本方案可实现收敛速度的大幅提升。案可实现收敛速度的大幅提升。案可实现收敛速度的大幅提升。

【技术实现步骤摘要】
一种多阶段迭代学习控制方法及介质


[0001]本专利技术涉及自动控制
,特别是关于一种多阶段迭代学习控制方法及计算机可读存储介质。

技术介绍

[0002]在实际的生产实践中,许多(被)控制系统都是在有限的时间内完成一次运行,并且不断地进行重复。例如,对于汽车生产中的机械臂,其完成一辆汽车的组装就是完成了控制系统的一次运行,后续的组装就是对第一辆车生产过程的不断重复。
[0003]传统技术对控制系统进行控制,基本都是通过反馈的思想,利用控制系统当前的信息,对控制系统进行控制。这些控制方法都忽略了历史信息的作用,直到迭代学习控制算法被提出,迭代学习控制方法,可以通过对历史信息进行学习,来改善控制效果,使得控制系统可以精准完成目标控制任务。
[0004]目前,迭代学习控制方法最广泛的应用形式为比例型控制律。其具有形式简单,便于使用,跟踪精度高等优点。然而,本申请的专利技术人在研究中发现,比例型控制律正是由于简单的线性形式,在跟踪误差较小的时候,收敛速度减慢,从而限制了其应用,而在实际的生产实践中,无法让控制系统进行无穷多次的迭代,因而就需要迭代学习控制算法具有更快速的收敛速度。

技术实现思路

[0005]针对上述问题,本申请的目的是提供一种多阶段迭代学习控制方法,不仅实现高精度的跟踪,同时实现收敛速度的大幅提升,从而可以提升工业生产实践的控制系统的工作效能。
[0006]为实现上述目的,本申请采取以下技术方案:
[0007]第一方面,本申请提供一种多阶段迭代学习控制方法,所述方法包括:
[0008]S1,针对被控制的控制系统,设置相对于系统输出的目标跟踪轨迹以及预期的跟踪精度;
[0009]S2,从第一个迭代批次起,设置当前迭代批次对应的控制系统的状态变量的初始值;
[0010]S3,根据当前迭代批次的状态变量的初始值,以及当前迭代批次的系统输入,获取当前迭代批次中各个离散时间点的系统输出,并根据所述当前迭代批次中各个离散时间点的系统输出和所述目标跟踪轨迹,计算当前迭代批次各个离散时间点的系统跟踪误差;
[0011]S4,根据当前迭代批次各个离散时间点的系统跟踪误差的大小,基于所述系统跟踪误差的比例项更新下一迭代批次的系统输入,或者基于所述系统跟踪误差的分数阶项更新下一迭代批次的系统输入;
[0012]S5,返回S2继续执行,直至当前迭代批次的每一个离散时间点的系统跟踪误差小于所述预期的跟踪精度。
[0013]在本申请的一种实现方式中,所述被控制的控制系统,为整数阶离散单入单出线性系统,具体描述为:
[0014][0015]其中,是控制系统的状态变量,是控制系统的系统输入,是系统输出,是系统矩阵,k为迭代批次的标号,t=0,1,

,T,为各个迭代批次中的离散时间点。
[0016]在本申请的一种实现方式中,所述设置当前迭代批次对应的控制系统的状态变量的初始值,包括:
[0017]对于控制系统的每个迭代批次,设置状态变量的初始值为相同值。
[0018]在本申请的一种实现方式中,所述当前迭代批次各个离散时间点的系统跟踪误差为e
k
(t)=y
d
(t)

y
k
(t),
[0019]其中,目标跟踪轨迹为y
d
(t),t=1,2,...,T;y
k
(t)为当前迭代批次的系统输出。
[0020]在本申请的一种实现方式中,所述基于所述系统跟踪误差的比例项更新下一迭代批次的系统输入,包括:
[0021]采用公式
[0022]u
k+1
(t)=u
k
(t)+βe
k
(t+1),
[0023]更新下一迭代批次的系统输入;
[0024]其中,β为预设的学习增益。
[0025]在本申请的一种实现方式中,所述基于所述系统跟踪误差的分数阶项更新下一迭代批次的系统输入,包括:
[0026]采用公式
[0027]u
k+1
(t)=u
k
(t)+α|e
k
(t+1)|
γ
sgn(e
k
(t+1)),
[0028]更新下一迭代批次的系统输入;
[0029]其中,α为预设的学习增益;0<γ<1,为分数阶微分的阶数;sgn(x)为符号函数。
[0030]在本申请的一种实现方式中,对于所述控制系统,若cb的值已知,则对当前批次的跟踪误差e
k
(t)的值进行判断,若|e
k
(t)|∈[0,x1]∪[x2,∞)则使用步骤S4中所给的比例型控制律生成下一批次的控制输入;若|e
k
(t)|∈(x1,x2),则使用步骤S4中所给的分数阶控制律生成下一批次的控制输入,其中,
[0031][0032]在本申请的一种实现方式中,对于所述控制系统,若cb的值未知,但cb的界已知,即则对当前批次的跟踪误差e
k
(t)的值进行判断,若(t)的值进行判断,若则使用步骤S4中所给的比例型控制律生成下一批次的控制输入;若则使用步骤S4中所给的比例型控制律生成下一批次的控制输入;若则使用步骤S4中所给的分数阶控制律生成下一批次的控制输入,其中,为满足如下条件的任一数值:
[0033][0034]在本申请的一种实现方式中,所述控制系统在不超过K个迭代批次后,达到预期的跟踪精度;所述K不超过50。
[0035]第二方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述第一方面所述的多阶段迭代学习控制方法。
[0036]本专利技术由于采取以上技术方案,其具有以下优点:本专利技术申请方案中,先针对被控系统,设置系统输出的目标跟踪轨迹以及预期的跟踪精度,再从第一个迭代批次起,设置当前迭代批次对应的控制系统的状态变量的初始值,并根据当前迭代批次的状态变量的初始值,以及当前迭代批次的系统输入,获取当前迭代批次中各个离散时间点的系统输出,并计算当前迭代批次各个离散时间点的系统跟踪误差,然后根据系统跟踪误差的大小,基于系统跟踪误差的比例项更新下一迭代批次的系统输入,或者基于系统跟踪误差的分数阶项更新下一迭代批次的系统输入,从而再次获得新的系统输出,不断循环迭代,直至迭代批次中的每一个离散时间点的系统跟踪误差小于预期的跟踪精度,从而相比于现有技术,可以实现收敛速度的大幅提升,提升工业生产的效能。
附图说明
[0037]图1为根据本专利技术一个实施例的在系统信息已知的情况下,对整数阶离散线性系统使用多阶段迭代学习控制方法的框图;
[0038]图2为根据本专利技术一个实施例的在系统信息未知的情况下,对整数阶离散线性系统使用多阶段迭代学习控制方法的框图;
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多阶段迭代学习控制方法,其特征在于,所述方法包括:S1,针对被控制的控制系统,设置相对于系统输出的目标跟踪轨迹以及预期的跟踪精度;S2,从第一个迭代批次起,设置当前迭代批次对应的控制系统的状态变量的初始值;S3,根据当前迭代批次的状态变量的初始值,以及当前迭代批次的系统输入,获取当前迭代批次中各个离散时间点的系统输出,并根据所述当前迭代批次中各个离散时间点的系统输出和所述目标跟踪轨迹,计算当前迭代批次各个离散时间点的系统跟踪误差;S4,根据当前迭代批次各个离散时间点的系统跟踪误差的大小,基于所述系统跟踪误差的比例项更新下一迭代批次的系统输入,或者基于所述系统跟踪误差的分数阶项更新下一迭代批次的系统输入;S5,返回S2继续执行,直至当前迭代批次的每一个离散时间点的系统跟踪误差小于所述预期的跟踪精度。2.根据权利要求1所述的多阶段迭代学习控制方法,其特征在于,所述被控制的控制系统,为整数阶离散单入单出线性系统,具体描述为:其中,是控制系统的状态变量,是控制系统的系统输入,是系统输出,是系统矩阵,k为迭代批次的标号,t=0,1,

,T,为各个迭代批次中的离散时间点;所述当前迭代批次各个离散时间点的系统跟踪误差为e
k
(t)=y
d
(t)

y
k
(t),其中,目标跟踪轨迹为y
d
(t),t=1,2,...,T;y
k
(t)为当前迭代批次的系统输出。3.根据权利要求2所述的多阶段迭代学习控制方法,其特征在于,所述基于所述系统跟踪误差的比例项更新下一迭代批次的系统输入,包括:采用公式u
k+1
(t)=u
k
(t)+βe
k

【专利技术属性】
技术研发人员:沈栋李子涵
申请(专利权)人:中国人民大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1