多智能体系统的二分共识控制律确定方法、装置、设备及存储介质制造方法及图纸

技术编号：28204312 阅读：26 留言：0更新日期：2021-04-24 14:30

本发明专利技术适用于计算机技术领域，提供了一种多智能体系统的二分共识控制值确定方法、装置、设备及存储介质，所述二分共识控制值确定方法包括：确定系统状态方程以及多智能体系统中代理节点之间的权值邻接矩阵，与代理节点之间的合作关系与竞争关系相关；按照预设的计算规则依次确定相邻节点二分共识控制误差、系统值函数以及二分共识控制函数；按照预设的更新规则更新系统值以及二分共识控制值，直至满足迭代结束条件，并确定最优二分共识控制值。本发明专利技术提供的二分共识控制值确定方法，引入了与代理节点之间关系相关的权值邻接矩阵，充分考虑了代理节点之间竞争关系，有效解决了现有技术没有充分考虑、研究竞争关系带来的不确定性的技术问题。的技术问题。的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
多智能体系统的二分共识控制律确定方法、装置、设备及存储介质

[0001]本专利技术属于计算机
，尤其涉及一种多智能体系统的二分共识控制值确定方法、装置、设备及存储介质。

技术介绍

[0002]近年来，多智能体系统共识在工程中得到广泛应用，使之成为非常热门的研究方向，例如分布式最优共识控制，跟踪共识控制等。多智能体系统是在同一个环境中由多个信息交互的智能体组成的系统，可以解决单智能体系统无法解决的问题，应用范围更广泛。
[0003]而在现有的针对多智能体系统的研究中，都是仅仅考虑到智能体与智能体之间存在的合作关系，并在此基础上研究其共识控制，但在实际应用中，有限的资源必然会导致多智能体系统中代理节点之间产生竞争作用，竞争作用会带来负面的影响，导致系统的不稳定性，而现有技术没有充分考虑、研究竞争关系带来的不确定性，导致最终确定出的共识控制实际效果不够理想。

技术实现思路

[0004]本专利技术实施例的目的在于提供一种多智能体系统的二分共识控制值确定方法，旨在解决现有的多智能体系统中共识控制技术还存在的没有充分考虑、研究竞争关系带来的不确定性，导致最终确定出的共识控制实际效果不够理想的技术问题。
[0005]本专利技术实施例是这样实现的，一种多智能体系统的二分共识控制值确定方法，包括：
[0006]确定多智能体系统的系统状态方程以及多智能体系统中代理节点之间的权值邻接矩阵；所述多智能体系统由一个领导者代理节点以及多个跟随者代理节点组成；所述权值邻接矩...

【技术保护点】

【技术特征摘要】
1.一种多智能体系统的二分共识控制值确定方法，其特征在于，包括：确定多智能体系统的系统状态方程以及多智能体系统中代理节点之间的权值邻接矩阵；所述多智能体系统由一个领导者代理节点以及多个跟随者代理节点组成；所述权值邻接矩阵与代理节点之间的关系相关；所述代理节点之间的关系包括合作关系与竞争关系；根据所述系统状态方程、所述权值邻接矩阵并按照预设的计算规则确定相邻节点二分共识控制误差；根据所述相邻节点二分共识控制误差确定系统值函数以及二分共识控制函数；确定初始化的二分共识控制值并按照预设的更新规则依次更新系统值以及二分共识控制值直至满足预设的迭代结束条件，并将当前二分共识控制值确定为最优二分共识控制值；所述预设的更新规则中包括相邻节点二分共识控制误差、系统值函数以及二分共识控制函数。2.根据权利要求1所述的二分共识控制值确定方法，其特征在于，根据所述系统状态方程、所述权值邻接矩阵并按照预设的计算规则确定相邻节点二分共识控制误差的步骤之后，还包括：根据预设的变量对所述相邻节点二分共识控制误差进行时延消除处理，生成无时延状态下多智能体系统的相邻节点二分共识控制误差。3.根据权利要求1所述的二分共识控制值确定方法，其特征在于，所述确定初始化的二分共识控制值并按照预设的更新规则依次更新系统值以及二分共识控制值直至满足预设的迭代结束条件，并将当前二分共识控制值确定为最优二分共识控制值的步骤，具体包括：确定初始化的二分共识控制值；根据二分共识控制值以及所述系统值函数更新系统值；根据更新后的系统值以及二分共识控制函数更新二分共识控制值；判断更新后的系统值与更新前的系统值之间的差值是否小于预设的收敛阈值；当判断否时，返回至所述根据二分共识控制值以及所述系统值函数更新系统值的步骤；当判断是时，将更新后的二分共识控制值确定为最优二分共识控制值。4.根据权利要求1所述的多智能体系统的二分共识控制值确定方法，其特征在于，所述系统值函数以及二分共识控制函数是基于actor
‑
critic神经网络确定的；所述确定初始化的二分共识控制值并按照预设的更新规则依次更新系统值以及二分共识控制值直至满足预设的迭代结束条件，并将当前二分共识控制值确定为最优二分共识控制值的步骤，具体包括：确定初始化的actor
‑
critic神经网络的权值矩阵；所述actor
‑
critic神经网络的权值矩阵包括actor神经网络的权值矩阵以及critic神经网络的权值矩阵；根据critic神经网络的权值矩阵计算系统值；根据actor神经网络的权值矩阵计算二分共识控制值；根据所述系统值以及预设的critic神经网络误差计算规则确定critic神经网络的误差值；所述预设的critic神经网络误差计算规则与当前二分共识控制值有关；根据所述critic神经网络的误差值更新所述critic神经网络的权值矩阵以及系统值；根据所述二分共识控制值以及预设的actor神经网络误差计算规则确定actor神经网
络的误...

【专利技术属性】
技术研发人员：马慧，张静，宿浩，李婉青，张赟，姜雪娜，周瀚阁，
申请(专利权)人：中国海洋大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人