多智能体系统的二分共识控制律确定方法、装置、设备及存储介质制造方法及图纸

技术编号:28204312 阅读:26 留言:0更新日期:2021-04-24 14:30
本发明专利技术适用于计算机技术领域,提供了一种多智能体系统的二分共识控制值确定方法、装置、设备及存储介质,所述二分共识控制值确定方法包括:确定系统状态方程以及多智能体系统中代理节点之间的权值邻接矩阵,与代理节点之间的合作关系与竞争关系相关;按照预设的计算规则依次确定相邻节点二分共识控制误差、系统值函数以及二分共识控制函数;按照预设的更新规则更新系统值以及二分共识控制值,直至满足迭代结束条件,并确定最优二分共识控制值。本发明专利技术提供的二分共识控制值确定方法,引入了与代理节点之间关系相关的权值邻接矩阵,充分考虑了代理节点之间竞争关系,有效解决了现有技术没有充分考虑、研究竞争关系带来的不确定性的技术问题。的技术问题。的技术问题。

【技术实现步骤摘要】
多智能体系统的二分共识控制律确定方法、装置、设备及存储介质


[0001]本专利技术属于计算机
,尤其涉及一种多智能体系统的二分共识控制 值确定方法、装置、设备及存储介质。

技术介绍

[0002]近年来,多智能体系统共识在工程中得到广泛应用,使之成为非常热门的 研究方向,例如分布式最优共识控制,跟踪共识控制等。多智能体系统是在同 一个环境中由多个信息交互的智能体组成的系统,可以解决单智能体系统无法 解决的问题,应用范围更广泛。
[0003]而在现有的针对多智能体系统的研究中,都是仅仅考虑到智能体与智能体 之间存在的合作关系,并在此基础上研究其共识控制,但在实际应用中,有限 的资源必然会导致多智能体系统中代理节点之间产生竞争作用,竞争作用会带 来负面的影响,导致系统的不稳定性,而现有技术没有充分考虑、研究竞争关 系带来的不确定性,导致最终确定出的共识控制实际效果不够理想。

技术实现思路

[0004]本专利技术实施例的目的在于提供一种多智能体系统的二分共识控制值确定方 法,旨在解决现有的多智能体系统中共识控制技术还存在的没有充分考虑、研 究竞争关系带来的不确定性,导致最终确定出的共识控制实际效果不够理想的 技术问题。
[0005]本专利技术实施例是这样实现的,一种多智能体系统的二分共识控制值确定方 法,包括:
[0006]确定多智能体系统的系统状态方程以及多智能体系统中代理节点之间的权 值邻接矩阵;所述多智能体系统由一个领导者代理节点以及多个跟随者代理节 点组成;所述权值邻接矩阵与代理节点之间的关系相关;所述代理节点之间的 关系包括合作关系与竞争关系;
[0007]根据所述系统状态方程、所述权值邻接矩阵并按照预设的计算规则确定相 邻节点二分共识控制误差;
[0008]根据所述相邻节点二分共识控制误差确定系统值函数以及二分共识控制函 数;
[0009]确定初始化的二分共识控制值并按照预设的更新规则依次更新系统值以及 二分共识控制值直至满足预设的迭代结束条件,并将当前二分共识控制值确定 为最优二分共识控制值;所述预设的更新规则中包括相邻节点二分共识控制误 差、系统值函数以及二分共识控制函数。
[0010]本专利技术实施例的另一目的在于提供一种多智能体系统的二分共识控制值确 定装置,包括:
[0011]系统状态方程确定单元,用于确定多智能体系统的系统状态方程以及多智 能体
系统中代理节点之间的权值邻接矩阵;所述多智能体系统由一个领导者代 理节点以及多个跟随者代理节点组成;所述权值邻接矩阵与代理节点之间的关 系相关;所述代理节点之间的关系包括合作关系与竞争关系;
[0012]二分共识控制误差确定单元,用于根据所述系统状态方程、所述权值邻接 矩阵并按照预设的计算规则确定相邻节点二分共识控制误差;
[0013]系统值函数与二分共识控制函数确定单元,用于根据所述相邻节点二分共 识控制误差确定系统值函数以及二分共识控制函数;
[0014]迭代优化单元,用于确定初始化的二分共识控制值并按照预设的更新规则 依次更新系统值以及二分共识控制值直至满足预设的迭代结束条件,并将当前 二分共识控制值确定为最优二分共识控制值;所述预设的更新规则中包括相邻 节点二分共识控制误差、系统值函数以及二分共识控制函数。
[0015]本专利技术实施例的另一目的在于提供一种计算机设备,包括存储器和处理器, 所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得 所述处理器执行如上述所述多智能体系统的二分共识控制值确定方法的步骤。
[0016]本专利技术实施例的另一目的在于提供一种计算机可读存储介质,所述计算机 可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所 述处理器执行如上述所述多智能体系统的二分共识控制值确定方法的步骤。
[0017]本专利技术实施例提供的一种多智能体系统的二分共识控制值确定方法,通过 构建由一个领导者代理节点以及多个跟随者代理节点组成的多智能体系统的系 统状态方程,然后根据代理节点之间的合作关系与竞争关系来确定权值邻接矩 阵,使得权值邻接矩阵包含了代理节点之间的合作关系与竞争关系,同时配合 后续数据处理过程:按照预设的计算规则依次计算相邻节点二分共识控制误差 以及系统值函数和二分共识控制函数,然后按照预设的迭代更新规则对系统值 以及二分共识控制值进行迭代更新,直至满足预设的迭代结束条件,最终所确 定的当前二分共识控制值考虑到了代理节点之间竞争关系,有效解决了现有技 术没有充分考虑、研究竞争关系带来的不确定性的技术问题。此外,本专利技术还 进一步具体公开了适用于考虑到竞争关系的多智能体系统中二分共识控制值的 计算规则以及迭代更新规则。
附图说明
[0018]图1为本专利技术实施例提供的一种多智能体系统的二分共识控制值确定方法 的步骤流程图;
[0019]图2为本专利技术实施例提供的另一种多智能体系统的二分共识控制值确定方 法的步骤流程图;
[0020]图3为本专利技术实施例提供的一种更新二分共识控制值的步骤流程图;
[0021]图4为本专利技术实施例提供的另一种更新二分共识控制值的步骤流程图;
[0022]图5为本专利技术实施例提供的实验过程中各代理节点的参数随迭代次数的变 化规律。
[0023]图6为本专利技术实施例提供的一种多智能体系统的二分共识控制值确定装置 的结构示意图;
[0024]图7为本专利技术实施例提供的一种执行二分共识控制值确定方法的计算机装 置的结构示意图。
具体实施方式
[0025]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实 施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅 仅用以解释本专利技术,并不用于限定本专利技术。
[0026]可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描 述各种元件,但除非特别说明,这些元件不受这些术语限制。这些术语仅用于 将第一个元件与另一个元件区分。举例来说,在不脱离本申请的范围的情况下, 可以将第一xx脚本称为第二xx脚本,且类似地,可将第二xx脚本称为第一xx 脚本。
[0027]本专利技术为解决现有的多智能体系统中因没有考虑到代理节点之间的竞争作 用,从而导致最终确定出的共识控制实际效果不够理想的技术问题,利用有向 图构建由一个领导者代理节点以及多个跟随者代理节点组成的多智能体系统的 系统状态方程,然后根据代理节点之间的合作关系与竞争关系来确定权值邻接 矩阵,使得权值邻接矩阵同时包含了代理节点之间的合作关系与竞争关系,同 时配合后续的数据处理过程,使得最终确定的当前二分共识控制值考虑到了代 理节点之间竞争关系,从而解决了现有技术没有充分考虑、研究竞争关系带来 的不确定性的技术问题。此外,本专利技术还进一步具体提供了适用于考虑了竞争 关系的多智能体系统的二分共识控制值确定方法中后续数据处理过程的具体处 理规则,详述如下。
[0028]如图1所示,为本专利技术实施例提供的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多智能体系统的二分共识控制值确定方法,其特征在于,包括:确定多智能体系统的系统状态方程以及多智能体系统中代理节点之间的权值邻接矩阵;所述多智能体系统由一个领导者代理节点以及多个跟随者代理节点组成;所述权值邻接矩阵与代理节点之间的关系相关;所述代理节点之间的关系包括合作关系与竞争关系;根据所述系统状态方程、所述权值邻接矩阵并按照预设的计算规则确定相邻节点二分共识控制误差;根据所述相邻节点二分共识控制误差确定系统值函数以及二分共识控制函数;确定初始化的二分共识控制值并按照预设的更新规则依次更新系统值以及二分共识控制值直至满足预设的迭代结束条件,并将当前二分共识控制值确定为最优二分共识控制值;所述预设的更新规则中包括相邻节点二分共识控制误差、系统值函数以及二分共识控制函数。2.根据权利要求1所述的二分共识控制值确定方法,其特征在于,根据所述系统状态方程、所述权值邻接矩阵并按照预设的计算规则确定相邻节点二分共识控制误差的步骤之后,还包括:根据预设的变量对所述相邻节点二分共识控制误差进行时延消除处理,生成无时延状态下多智能体系统的相邻节点二分共识控制误差。3.根据权利要求1所述的二分共识控制值确定方法,其特征在于,所述确定初始化的二分共识控制值并按照预设的更新规则依次更新系统值以及二分共识控制值直至满足预设的迭代结束条件,并将当前二分共识控制值确定为最优二分共识控制值的步骤,具体包括:确定初始化的二分共识控制值;根据二分共识控制值以及所述系统值函数更新系统值;根据更新后的系统值以及二分共识控制函数更新二分共识控制值;判断更新后的系统值与更新前的系统值之间的差值是否小于预设的收敛阈值;当判断否时,返回至所述根据二分共识控制值以及所述系统值函数更新系统值的步骤;当判断是时,将更新后的二分共识控制值确定为最优二分共识控制值。4.根据权利要求1所述的多智能体系统的二分共识控制值确定方法,其特征在于,所述系统值函数以及二分共识控制函数是基于actor

critic神经网络确定的;所述确定初始化的二分共识控制值并按照预设的更新规则依次更新系统值以及二分共识控制值直至满足预设的迭代结束条件,并将当前二分共识控制值确定为最优二分共识控制值的步骤,具体包括:确定初始化的actor

critic神经网络的权值矩阵;所述actor

critic神经网络的权值矩阵包括actor神经网络的权值矩阵以及critic神经网络的权值矩阵;根据critic神经网络的权值矩阵计算系统值;根据actor神经网络的权值矩阵计算二分共识控制值;根据所述系统值以及预设的critic神经网络误差计算规则确定critic神经网络的误差值;所述预设的critic神经网络误差计算规则与当前二分共识控制值有关;根据所述critic神经网络的误差值更新所述critic神经网络的权值矩阵以及系统值;根据所述二分共识控制值以及预设的actor神经网络误差计算规则确定actor神经网
络的误...

【专利技术属性】
技术研发人员:马慧张静宿浩李婉青张赟姜雪娜周瀚阁
申请(专利权)人:中国海洋大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1