复杂系统预设时间协同优化方法技术方案

技术编号：42682266 阅读：4 留言：0更新日期：2024-09-10 12:31

本申请公开了一种复杂系统预设时间协同优化方法，涉及智能体控制技术领域，主要目的在于现有制定的跟随者智能体控制输入数据的适用性低下，进而导致多智能体系统的输出不同步的问题。包括：获取跟随者智能体系统状态；基于第一预设算法求解反馈控制增益矩阵，第一预设算法包括线性二次调节器优化算法以及强化学习策略迭代算法；基于第二预设算法求解前馈控制增益矩阵，第二预设算法包括自适应算法以及构建输出调节器方程的算法；构建分布式观测器估计领导者智能体系统状态；将跟随者智能体系统状态与反馈控制增益矩阵的乘积以及领导者智能体系统状态与前馈控制增益矩阵的乘积之和确定为跟随者智能体控制输入数据。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及智能体控制，特别是涉及一种复杂系统预设时间协同优化方法。

技术介绍

1、近年来，随着多智能体系统在编队同步控制领域的广泛应用，其协同输出调节问题显得尤为重要。在协同输出调节问题中，主要目标是使得多智能体系统中的领导者智能体的输出与跟随者智能体的输出相同，从而达到多智能体系统同步控制的目的。为了达到多智能体系统同步控制的目的，需要对跟随者智能体的控制输入数据进行确定。

2、目前，现有针对跟随者智能体的控制输入数据，通常是在知晓领导者智能体的系统状态、动力学矩阵以及跟随者智能体的动力学矩阵的情况下进行确定的。

3、然而，在多智能体系统实际控制过程中，由于领导者智能体的参数未知、测量不准确、环境扰动等原因，会导致领导者智能体的系统状态、动力学矩阵难以获得；并且由于物理系统难以建立准确的模型、实际的场景中存在大量不可测量的扰动等原因，导致随者智能体的动力学矩阵也未知，导致制定的跟随者智能体控制输入数据的适用性低下，进而导致多智能体系统的输出不同步。

技术实现思路

1、有鉴于此，本申请提供一种复杂系统预设时间协同优化方法，主要目的在于现有制定的跟随者智能体控制输入数据的适用性低下，进而导致多智能体系统的输出不同步的问题。

2、依据本申请一个方面，提供了一种复杂系统预设时间协同优化方法，包括：

3、获取跟随者智能体系统状态；

4、基于第一预设算法求解反馈控制增益矩阵，所述第一预设算法包括线性二次调节器优化算法以及强化学习策略迭代算法；

5、基于第二预设算法求解前馈控制增益矩阵，所述第二预设算法包括自适应算法以及构建输出调节器方程的算法；

6、构建分布式观测器估计领导者智能体系统状态；

7、将所述跟随者智能体系统状态与所述反馈控制增益矩阵的乘积以及所述领导者智能体系统状态与所述前馈控制增益矩阵的乘积之和确定为跟随者智能体控制输入数据。

8、优选的，所述方法还包括：

9、基于tbg函数构建时变增益方程

10、，

11、其中，表示时间，表示时基发生器，表示时基发生器的导数，表示参数，；

12、基于更新跟随者智能体状态误差函数，以在预设时间内使得所述领导者智能体的输出与所述跟随者智能体的输出相同。

13、优选的，当所述跟随者智能体的动力学矩阵已知时，所述基于预设算法求解反馈控制增益矩阵，具体包括：

14、基于线性二次调节器优化算法求解反馈控制增益矩阵，具体包括：

15、基于公式求解反馈控制增益矩阵，其中，表示反馈控制增益矩阵，表示加权矩阵，表示代数黎卡提方程的唯一解，表示加权矩阵，表示状态转移矩阵，表示输入矩阵。

16、优选的，当所述跟随者智能体的动力学矩阵未知时，所述基于预设算法求解反馈控制增益矩阵，具体包括：

17、基于强化学习策略迭代算法求解反馈控制增益矩阵，具体包括：

18、获取所述跟随者智能体的历史系统状态以及历史控制输入数据；

19、基于所述历史系统状态以及所述历史控制输入数据，求解方程

20、，

21、其中，、、表示西尔维斯特矩阵；

22、当达到迭代停止准则时，得到反馈控制增益矩阵。

23、优选的，当所述领导者智能体的动力学矩阵未知时，所述基于第二预设算法求解前馈控制增益矩阵，具体包括：

24、基于自适应算法求解调节器方程的解，其中，表示调节器方程解的形式，表示参数，，，满足，满足；

25、基于公式计算前馈控制增益矩阵，其中，表示前馈控制增益矩阵。

26、优选的，当所述领导者智能体的动力学矩阵已知时，所述基于第二预设算法求解前馈控制增益矩阵，具体包括：

27、基于输出调节器方程

28、

29、

30、求解调节器方程的解，其中，表示状态转移矩阵，表示输入矩阵，表示外部扰动输入矩阵，表示领导者智能体动力学矩阵。

31、基于公式计算前馈控制增益矩阵。

32、依据本申请另一个方面，提供了一种复杂系统预设时间协同优化装置，包括：

33、跟随者智能体系统状态获取模块，用于获取跟随者智能体系统状态；

34、反馈控制增益矩阵求解模块，用于基于第一预设算法求解反馈控制增益矩阵，所述第一预设算法包括线性二次调节器优化算法以及强化学习策略迭代算法；

35、前馈控制增益矩阵求解模块，用于基于第二预设算法求解前馈控制增益矩阵，所述第二预设算法包括自适应算法以及构建输出调节器方程的算法；

36、分布式观测器构建模块，用于构建分布式观测器估计领导者智能体系统状态；

37、跟随者智能体控制输入数据确定模块，用于将所述跟随者智能体系统状态与所述反馈控制增益矩阵的乘积以及所述领导者智能体系统状态与所述前馈控制增益矩阵的乘积之和确定为跟随者智能体控制输入数据。

38、优选的，所述装置还包括：

39、时变增益方程构建模块，用于基于tbg函数构建时变增益方程

40、，

41、其中，表示时间，表示时基发生器，表示时基发生器的导数，表示参数，；

42、跟随者智能体状态误差函数更新模块，用于基于更新跟随者智能体状态误差函数，以在预设时间内使得所述领导者智能体的输出与所述跟随者智能体的输出相同。

43、优选的，当所述跟随者智能体的动力学矩阵已知时，所述反馈控制增益矩阵求解模块，具体用于：

44、基于线性二次调节器优化算法求解反馈控制增益矩阵，具体包括：

45、基于公式求解反馈控制增益矩阵，其中，表示反馈控制增益矩阵，表示加权矩阵，表示代数黎卡提方程的唯一解，表示加权矩阵，表示状态转移矩阵，表示输入矩阵。

46、优选的，当所述跟随者智能体的动力学矩阵未知时，所述反馈控制增益矩阵求解模块，具体用于：

47、基于强化学习策略迭代算法求解反馈控制增益矩阵，具体包括：

48、获取所述跟随者智能体的历史系统状态以及历史控制输入数据；

49、基于所述历史系统状态以及所述历史控制输入数据，求解方程

50、，

51、其中，、、表示西尔维斯特矩阵；

52、当达到迭代停止准则时，得到反馈控制增益矩阵。

53、优选的，当所述领导者智能体的动力学矩阵未知时，所述前馈控制增益矩阵求解模块，具体用于：

54、基于自适应算法求解调节器方程的解，其中，表示调节器方程解的形式，表示参数，，，满足，满足；

55、基于公式计算前馈控制增益矩阵，其中，表示前馈控制增益矩阵。

56、优选的，当所述领导者智能体的动力学矩阵已知时，所述前馈控制增益矩阵求解模块，具体用于：

57、基于输出调节器方程

58、<本文档来自技高网...

【技术保护点】

1.一种复杂系统预设时间协同优化方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

3.根据权利要求1所述的方法，其特征在于，当所述跟随者智能体的动力学矩阵已知时，所述基于第一预设算法求解反馈控制增益矩阵，具体包括：

4.根据权利要求1所述的方法，其特征在于，当所述跟随者智能体的动力学矩阵未知时，所述基于第一预设算法求解反馈控制增益矩阵，具体包括：

5.根据权利要求3或4所述的方法，其特征在于，当所述领导者智能体的动力学矩阵未知时，所述基于第二预设算法求解前馈控制增益矩阵，具体包括：

6.根据权利要求3或4所述的方法，其特征在于，当所述领导者智能体的动力学矩阵已知时，所述基于第二预设算法求解前馈控制增益矩阵，具体包括：

7.一种复杂系统预设时间协同优化装置，其特征在于，包括：

8.根据权利要求7所述的装置，其特征在于，所述装置还包括：

9.一种存储介质，所述存储介质中存储有至少一条可执行指令，其特征在于，所述可执行指令使处理器执行如权利要求1-6中任一

10.一种终端，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

...

【技术特征摘要】

1.一种复杂系统预设时间协同优化方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

3.根据权利要求1所述的方法，其特征在于，当所述跟随者智能体的动力学矩阵已知时，所述基于第一预设算法求解反馈控制增益矩阵，具体包括：

4.根据权利要求1所述的方法，其特征在于，当所述跟随者智能体的动力学矩阵未知时，所述基于第一预设算法求解反馈控制增益矩阵，具体包括：

5.根据权利要求3或4所述的方法，其特征在于，当所述领导者智能体的动力学矩阵未知时，所述基于第二预设算法求解前馈控制增益矩阵，具体包括：

6.根据...

【专利技术属性】
技术研发人员：杨涛，王冰洁，徐磊，王天媛，朱璟璨，
申请(专利权)人：东北大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人