当前位置: 首页 > 专利查询>清华大学专利>正文

多智能体对抗仿真方法、装置、电子设备及存储介质制造方法及图纸

技术编号:32858852 阅读:18 留言:0更新日期:2022-03-30 19:34
本申请涉及多智能体仿真技术领域,特别涉及一种多智能体对抗仿真方法、装置、电子设备及存储介质,其中,方法包括:获取对抗场景参数;基于所述对抗场景参数生成初始场景,其中,所述初始场景包含智能体交互机制,并根据场景的智能体个数分配操控装置;开始仿真后,根据操控指令操控至少一个智能体进行交互,并采集当前场景态势数据;在所述至少一个智能体中的追逃方与攻防方之间的对抗结束后,判定仿真结束,以预设文件格式导出所述当前场景态势数据。由此,解决了相关技术中多智能体对抗仿真无法满足充分研究多智能体行为的需求等问题。无法满足充分研究多智能体行为的需求等问题。无法满足充分研究多智能体行为的需求等问题。

【技术实现步骤摘要】
多智能体对抗仿真方法、装置、电子设备及存储介质


[0001]本申请涉及多智能体仿真
,特别涉及一种多智能体对抗仿真方法、装置、电子设备及存储介质。

技术介绍

[0002]多智能体对抗行为仿真是近年来的一项关键技术,在智能网联汽车、智能交通、智能军事等领域都有广泛应用,尤其是在涉及多智能间交互的研究中扮演重要角色,例如多车在交通场景中的协同、博弈,军事场景中的攻击、防御等。随着当前单体智能水平迅速提升,多智能体间的交互行为成为了一项重要的课题,希望机器能够学习人类智慧并最终实现对人类智能的超越。因此,目前对多智能体对抗行为仿真平台的需求也大幅上升。
[0003]在对智能体行为的研究中,越来越多的学者开始引入“态势”这一因素。态势是由当前智能体所处的环境综合形成的,包含各个智能体的行为、环境变化以及各种高阶数据,在交通常见的态势有行车风险、道路流量等,而在军事中态势则有阵地归属、攻击能量等。然而当前多智能体对抗仿真无法满足充分研究多智能体行为的需求。

技术实现思路

[0004]本申请提供一种多智能体对抗仿真方法、装置、电子设备及存储介质,以解决相关技术中多智能体对抗仿真无法满足充分研究多智能体行为的需求等问题。
[0005]本申请第一方面实施例提供一种多智能体对抗仿真方法,包括以下步骤:获取对抗场景参数;基于所述对抗场景参数生成初始场景,其中,所述初始场景包含智能体交互机制,并根据场景的智能体个数分配操控装置;开始仿真后,根据操控指令操控至少一个智能体进行交互,并采集当前场景态势数据;在所述至少一个智能体中的追逃方与攻防方之间的对抗结束后,判定仿真结束,以预设文件格式导出所述当前场景态势数据。
[0006]进一步地,所述当前场景态势数据包括基于攻击方式计算的攻击能量、更新的智能体状态信息和智能体轨迹数据中的一项或多项。
[0007]进一步地,所述对抗场景参数包括两方对抗的单元数量、地图场景大小和态势分析网格大小中的一项或多项。
[0008]进一步地,所述基于所述对抗场景参数生成初始场景,包括:设置每个智能体的属性,并确定智能体交互机制。
[0009]进一步地,在采集所述当前场景态势数据之后,还包括:每个预设时长保存所述当前场景态势数据。
[0010]本申请第二方面实施例提供一种多智能体对抗仿真装置,包括:获取模块,用于获取对抗场景参数;生成模块,用于基于所述对抗场景参数生成初始场景,其中,所述初始场景包含智能体交互机制,并根据场景的智能体个数分配操控装置;交互模块,用于开始仿真后,根据操控指令操控至少一个智能体进行交互,并采集当前场景态势数据;导出模块,用于在所述至少一个智能体中的追逃方与攻防方之间的对抗结束后,判定仿真结束,以预设
文件格式导出所述当前场景态势数据。
[0011]进一步地,所述当前场景态势数据包括基于攻击方式计算的攻击能量、更新的智能体状态信息和智能体轨迹数据中的一项或多项。
[0012]进一步地,所述对抗场景参数包括两方对抗的单元数量、地图场景大小和态势分析网格大小中的一项或多项。
[0013]进一步地,所述生成模块用于设置每个智能体的属性,并确定智能体交互机制。
[0014]进一步地,还包括:保存模块,用于在采集所述当前场景态势数据之后,每个预设时长保存所述当前场景态势数据。
[0015]本申请第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的多智能体对抗仿真方法。
[0016]本申请第四方面实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上述实施例所述的多智能体对抗仿真方法。
[0017]由此,本申请至少具有如下有益效果:
[0018]设计了智能体对抗仿真的流程,能够根据实际需求自定义例如智能体数量、场地大小等对抗参数,同时引入了对抗态势计算,能够记录智能体对抗时产生的多种态势,支撑后续复杂决策算法的开发,从而可以实现实时的量化态势分析,同时提供可由人操控智能体的接口,以便研究智能体之间的合作、对抗过程。解决了相关技术中多智能体对抗仿真无法满足充分研究多智能体行为的需求等问题。
[0019]本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
[0020]本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0021]图1为根据本申请实施例提供的多智能体对抗仿真方法的流程示意图;
[0022]图2为根据本申请一个实施例提供的多智能体对抗仿真方法的流程示意图;
[0023]图3为根据本申请实施例提供的智能体与其毁伤幅员示意图;
[0024]图4为根据本申请实施例提供的攻击态势热图;
[0025]图5为根据本申请实施例提供的时序样本的特征和标签示意图;
[0026]图6为根据本申请实施例提供的对抗仿真平台中的样例示意图;
[0027]图7为根据本申请实施例提供的单帧态势数据经过可视化后的示意图;
[0028]图8为根据本申请实施例提供的智能体一段时间内的位移示意图;
[0029]图9为根据本申请实施例提供的智能体位置预测示意图;
[0030]图10为根据本申请实施例提供的多智能体对抗仿真装置的方框示意图;
[0031]图11为根据本申请实施例提供的电子设备的方框示意图。
具体实施方式
[0032]下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
[0033]相关技术中多智能体对抗仿真平台无法满足充分研究多智能体行为的需求,尤其是缺乏态势相关的模块。这些仿真平台主要存在以下问题:
[0034](1)基于特定游戏规则进行细化设定,泛用性差,与实际环境相差较远;
[0035](2)多智能体行为颗粒度粗,无法精准地反馈多智能体单步行为之间的细节,难以支撑分析与量化研究;
[0036](3)对计算机环境的依赖性强,在使用前需要下载大量相关依赖环境并适配系统;
[0037](3)接口封闭性强,无法随需求调用所需要的数据。
[0038]相关技术中的多智能体对抗仿真平台如下:
[0039]第一、以庙算
·
智胜为代表的以兵棋推演为模板的平台,该类平台以兵棋机制为核心流程,是一种正反双反的回合制仿真,单步时一方能够采取攻击、防守、移动等行为。该类平台虽然使用简单,通过在线网站即可使用,并且提供人机对抗模式,然而由于基于兵棋流程,回合制行为不符合现实实际,同时单步颗粒度过大本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多智能体对抗仿真方法,其特征在于,包括以下步骤:获取对抗场景参数;基于所述对抗场景参数生成初始场景,其中,所述初始场景包含智能体交互机制,并根据场景的智能体个数分配操控装置;开始仿真后,根据操控指令操控至少一个智能体进行交互,并采集当前场景态势数据;以及在所述至少一个智能体中的追逃方与攻防方之间的对抗结束后,判定仿真结束,以预设文件格式导出所述当前场景态势数据。2.根据权利要求1所述的方法,其特征在于,所述当前场景态势数据包括基于攻击方式计算的攻击能量、更新的智能体状态信息和智能体轨迹数据中的一项或多项。3.根据权利要求1所述的方法,其特征在于,所述对抗场景参数包括两方对抗的单元数量、地图场景大小和态势分析网格大小中的一项或多项。4.根据权利要求1所述的方法,其特征在于,所述基于所述对抗场景参数生成初始场景,包括:设置每个智能体的属性,并确定智能体交互机制。5.根据权利要求1

4任一项所述的方法,其特征在于,在采集所述当前场景态势数据之后,还包括:每个预设时长保存所述当前场景态势数据。6.一种多智能体对抗仿真装置,其特征在于,包括:获取模块,用于获取对抗场景参数;生成模块,用于基于所述对抗场景参数生成初始场景,其中,所述初始场景包含智能体交互机制,并根据场景的智能体个数分配操控装置;交互模块,用于开...

【专利技术属性】
技术研发人员:王建强王裕宁姜竣凯黄荷叶王嘉昊
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1