一种多智能体协同调控编队方法技术

技术编号:21121857 阅读:75 留言:0更新日期:2019-05-16 10:58
本发明专利技术提供一种多智能体协同调控编队方法,包括多智能体系统完成编队初始化后进行编队,完成节点之间信息交互;各跟随节点从接收信息中解调出两跳内邻居节点时隙表信息,完成分布式组网的网络维护,解调出两跳内邻居节点三阶状态信息,基于预测机制完成对于时延状态信息的二阶信息的修正,将预测结果作为节点实时状态,完成对于两跳内邻居节点状态信息更新;将更新后的两跳内邻居节点状态信息输入一致性调控机制中,基于两跳邻居节点状态信息完成节点控制输出的更新,将控制输出结果输入跟随节点的动力系统作为跟随节点的加速度;循环执行编队过程,直至任务结束。该方法能够有效对抗网络环境下信息交互时延约束,保证无人系统的编队实现。

A Multi-Agent Cooperative Control Formation Method

【技术实现步骤摘要】
一种多智能体协同调控编队方法
本专利技术属于网络化控制
,更具体地,涉及一种多智能体协同调控编队方法。
技术介绍
多智能体协同控制理论是多智能体集群系统编队控制的基础,其主要任务是智能体节点的运动协调。在基于一致性理论的调控机制领域中,智能体节点与系统内的节点进行信息交互,基于交互结果与期望编队目标完成对于节点自身的控制输出更新,进而实现期望编队。多智能体实现期望编队是执行后续任务的基础。可以说,多智能体协同调控技术的性能直接影响到整个系统的整体表现。作为人类作战的替身,主要由无人机、无人战车和机器人等组成的空地一体化无人编队将成为未来战场的新主体,其具有分散突防集中打击、纵深同时打击、高可靠度和冗余度、广域侦查、协同作战、作战范围大且精度高等功能特点。针对战场环境下地形复杂,变化时空跨度、电波传输受限、电磁干扰严重、拓扑快变等不确定因素,传统的多智能体系统的集中式控制方式因其抗损毁能力差,可拓展能力弱,对恶劣网络条件的鲁棒性差的缺陷难以适应复杂的战场环境。因此,未来的多智能体协同调控一定是基于具有更强抗损毁能力与可拓展性的分布式自主组网架构之上的。基于分布式无中心网络的协同调控系统中,智能体节点必须面临组网环境下带来的信息交互约束,即网络环境中的时延,误码等因素。多智能体调控系统在网络环境下能否实现在有限时间内向期望编队的收敛取决于多智能体协同调控机制的收敛性能与鲁棒性能。此外,战场环境下的分布式组网系统具有频谱资源紧张,节点密度大的特征,为了避免传输碰撞造成资源浪费,因此一般采用选举预约的资源调度方式,在选举预约的调度方式中,帧结构与调度周期的设计是与多智能体协同系统的控制机制相关的。因此多智能体的自主组网与任务调控协同技术设计是多智能体协同编队的核心问题。给出编队系统中多智能体系统的一般模型:多智能体系统中存在的节点数量为N,给定xi∈Rm,vi∈Rm分别对应第i个智能体节点的空间状态,速度状态,ui∈Rm对应第i个智能体节点的控制输出,节点间存在组网架构和对应连通拓扑。同时在真实物理环境中,系统总是离散的获取系统状态。则类似的给出无人机群二阶离散动态方程:νi[k+1]=νi[k]+Tμi[k]在多智能体编队的协同调控领域中,基于一致性理论的控制机制设计是学界的重点研究领域。基于一致性的领航跟随者调控机制一般形式如下:其中,h为交互周期;β为控制输出增益;γ为速度差向量/位置差向量权重比例系数;aij=1为节点j与节点i间存在通信链路;x*∈Rm为领航者空间状态;v*∈Rm为领航者速度状态。在以上调控机制中,智能体节点与系统内的邻居节点完成信息交互,将节点间的空间状态特征与期望编队目标的差值与速度状态的差值作为控制输入决定节点的控制输出使系统内的节点通过控制加速度实现向期望编队的收敛。在控制层面,学界对于调控机制的系统稳定性,收敛速度,收敛精度等问题进行了详尽建模与分析。智能体节点间的信息交互不可避免的会涉及到网络传输的问题,近几年,学界的研究重点转向了网络环境下组网性能参数(时延、误码、吞吐量等)约束下的多智能体调控机制的设计与性能分析,与传统控制机制相比,引入组网约束参数的调控机制分析更契合真实环境,具有更强的研究价值和实用价值。以引入网络时延的调控系统为例,引入时延参数的基于一致性的调控机制一般形式如下:其中,h为交互周期;m为信息交互时延;β为控制输出增益;γ为速度差向量/位置差向量权重比例系数;aij=1表示节点j与节点i间存在通信链路;x*∈Rm为领航者空间状态;v*∈Rm为领航者速度状态。组网环境下,智能体节点接收到的邻居节点的信息是存在时延的,节点接收的信息与其实时信息间存在差值,网络时延会影响调控系统的稳定性能与系统的收敛性能。针对网络环境下节点接受信息与实时信息间存在差值引起的系统稳定性能与收敛性能受到影响问题,为了对抗网络时延,基于节点的离散运动模型,控制学界提出了以预测机制为代表的增强调控机制对网络时延鲁棒性的相关算法。基于预测机制,节点使用接收到的邻居节点过去的三阶状态信息完成对于邻居节点一个交互调度周期后的二阶实时信息的预测,进而减小接收信息与实时信息的差值,从而增强调控机制对网络时延的鲁棒性,完成向期望编队的收敛。面向组网约束的调控机制分析与基于预测机制的优化理论尚未建立合理的模型,控制学界对于网络时延参数存在不合理的假设,譬如认为网络时延具有周期性,网络时延大于一个交互周期等,同时没有建立网络时延参数与控制系统参数的关系,而网络时延是与系统拓扑与系统业务量等参数相关的,基于控制系统参数的网络时延模型的建立与引入工作十分重要。进一步的,调控机制只考虑了网络参数约束对控制系统的影响,尚未建立基于分布式网络模型的调控机制的具体形式的针对性设计。在分布式组网中,基于选举预约的调度协议能够有效的避免传输碰撞造成的资源浪费,选举预约的组网调度中,组网节点需要维护两跳范围内邻居节点的时隙表(节点接收发送信息的时间规划)来完成组网维护与资源调度。调度周期为选举预约的控制时隙与传输信息的数据时隙组成。控制时隙包括NENT(MeshNetworkEntry):新节点网络接入消息;MSH-NCFG(MeshNetworkConfiguration):网络配置消息;MSH-DSCH(MeshDistributedScheduling):分布式调度消息。其中MSH-DSCH包含时隙表的交互。在控制时隙内节点通过选举机制进行资源调度,在数据时隙内基于控制时隙的预约时隙进行数据传输。因此在分布式组网中,拓扑跳数等效为对应跳数交互周期的时延,同时节点需要周期性的使用广播的形式维护两跳邻居范围内的节点调度状态。这对于控制系统时延模型的建立与控制机制的设计存在重要影响。因此,为了实现未来战场环境下空天地多智能体一体化编队自主协同作战的目标,需要提供一种能够对抗网络环境下信息交互时延的多智能体系统调控方法。
技术实现思路
本专利技术的目的在于提供一种多智能体协同调控编队方法,能够有效对抗网络环境下信息交互时延约束,进而保证复杂战场环境下空天地一体化无人系统的编队实现。为达到上述目的,本专利技术采用下述技术方案:一种多智能体协同调控编队方法,该方法适用的多智能体系统由领航节点和跟随节点构成,包括如下步骤:一、多智能体系统接收编队指令,完成编队初始化过程;二、多智能体系统开始进行编队,完成节点之间信息交互,所述信息包括自身与一跳邻居节点时隙表及状态信息;三、各跟随节点从接收信息中解调出两跳内邻居节点时隙表信息,完成分布式组网的网络维护,解调出两跳内邻居节点三阶状态信息,基于预测机制完成对于时延状态信息的二阶信息的修正,将预测结果作为节点实时状态,完成对于两跳内邻居节点状态信息更新;四、将更新后的两跳内邻居节点状态信息输入一致性调控机制中,基于两跳邻居节点状态信息完成节点控制输出的更新,将控制输出结果输入跟随节点的动力系统作为跟随节点的加速度;五、循环执行编队过程,直至任务结束。进一步地,本专利技术所述步骤三中所述预测机制如下:其中,h表示交互周期,k表示迭代次数,xi表示节点的位置,vi表示节点的速度,ui表示节点的加速度,表示节点位置预测值,表示节点速度预测值。进一步地,本专利技术所述步骤四中一致性调控机本文档来自技高网
...

【技术保护点】
1.一种多智能体协同调控编队方法,该方法适用的多智能体系统由领航节点和跟随节点构成,其特征在于,包括如下步骤:一、多智能体系统接收编队指令,完成编队初始化过程;二、多智能体系统开始进行编队,完成节点之间信息交互,所述信息包括自身与一跳邻居节点时隙表及状态信息;三、各跟随节点从接收信息中解调出时隙表,完成分布式组网的网络维护,解调出两跳内邻居节点三阶状态信息,基于预测机制完成对于时延状态信息的二阶信息的修正,将预测结果作为节点实时状态,完成对于两跳内邻居节点状态信息更新;四、将更新后的两跳内邻居节点状态信息输入一致性调控机制中,基于两跳邻居节点状态信息完成节点控制输出的更新,将控制输出结果输入跟随节点的动力系统作为跟随节点的加速度;五、循环执行编队过程,直至任务结束。

【技术特征摘要】
1.一种多智能体协同调控编队方法,该方法适用的多智能体系统由领航节点和跟随节点构成,其特征在于,包括如下步骤:一、多智能体系统接收编队指令,完成编队初始化过程;二、多智能体系统开始进行编队,完成节点之间信息交互,所述信息包括自身与一跳邻居节点时隙表及状态信息;三、各跟随节点从接收信息中解调出时隙表,完成分布式组网的网络维护,解调出两跳内邻居节点三阶状态信息,基于预测机制完成对于时延状态信息的二阶信息的修正,将预测结果作为节点实时状态,完成对于两跳内邻居节点状态信息更新;四、将更新后的两跳内邻居节点状态信息输入一致性调控机制中,基于两跳邻居节点状态信息完成节点控制输出的更新,将控制输出结果输入跟随节点的动力系统作为跟随节点的加速度;五、循环执行编队过程,直至任务结束。2.根据权利要求1所述多智能体协同调控编队方法,其特征在于,所述步骤三中所述预测机制如下:其中,h表示交互周期,k表示迭代次数,xi表示节点的位置,vi表示节点的速度,...

【专利技术属性】
技术研发人员:李旭李钢洋荆涛杨明强
申请(专利权)人:北京交通大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1