兵棋系统智能体训练方法、装置、存储介质及电子设备制造方法及图纸

技术编号：41792301 阅读：1 留言：0更新日期：2024-06-24 20:18

本申请公开了一种兵棋系统智能体训练方法、装置、存储介质及电子设备，其中方法包括：基于目标元数据创建异构兵棋系统中待训练智能体的数据源模板，并生成目标元数据的数据通信协议、数据接入指引和交互服务框架；基于数据源模板、数据通信协议、数据接入指引和交互服务框架获取目标元数据；将目标元数据作为待训练智能体的训练样本，对待训练智能体进行训练；其中，数据通信协议和数据接入指引用于定义目标元数据的获取规则；交互服务框架用于定义目标元数据的传输通道以及定义目标元数据在传输过程中的映射规则。本申请提供的方法和装置，可以将目标元数据的数据结果保持一致，提高了智能体的训练效率和训练准确度。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机术领域，具体而言，涉及一种兵棋系统智能体训练方法、装置、存储介质及电子设备。

技术介绍

1、传统异构兵棋系统通常依赖于多个异构数据源，如地理环境、气候气象、战场情报和实时传感器数据等，以获取全面的军事信息。然而，这些数据源的元数据通常以不同的格式和结构存在，导致异构兵棋系统在训练智能体时面临挑战。

2、因此，如何得到标准化的元数据，从而提高兵棋系统中智能体的训练效率成为业界亟待解决的技术问题。

技术实现思路

1、本申请提供一种兵棋系统智能体训练方法、装置、存储介质及电子设备，用以解决现有技术中如何得到标准化的元数据，从而提高兵棋系统中智能体的训练效率的技术问题。

2、第一方面，本申请提供了一种兵棋系统智能体训练方法，包括：

3、基于目标元数据创建异构兵棋系统中待训练智能体的数据源模板，并生成所述目标元数据的数据通信协议、数据接入指引和交互服务框架；

4、基于所述数据源模板、所述数据通信协议、所述数据接入指引和所述交互服务框架获取所述目标元数据；

5、将所述目标元数据作为所述待训练智能体的训练样本，对所述待训练智能体进行训练；

6、其中，所述数据通信协议和所述数据接入指引用于定义所述目标元数据的获取规则；所述交互服务框架用于定义所述目标元数据的传输通道以及定义所述目标元数据在传输过程中的映射规则。

7、在一些实施例中，所述基于目标元数据创建异构兵棋系统中待训练智能体的数据源模板，包括：

8、基于可视化配置界面设置初始数据源模板；

9、基于所述目标元数据的标签在所述初始数据源模版中配置各个目标元数据的标签字段，得到所述数据源模板；

10、其中，所述目标元数据包括标准元数据和自定义元数据；所述标准元数据为能够从所述异构兵棋系统直接得到的元数据；所述自定义元数据为基于设定算法对所述标准元数据进行运算得到的元数据。

11、在一些实施例中，所述获取所述目标元数据之后，还包括：

12、基于可视化配置界面设置所述待训练智能体的决策指令集，并生成所述决策指令集的指令交互框架，使得所述异构兵棋系统基于所述决策指令交互框架执行所述待训练智能体输出的待执行决策指令集；

13、其中，所述决策指令集用于确定所述异构兵棋系统的执行动作；所述指令交互框架用于定义所述决策指令集中各个决策指令的传输、解析和映射和的规则；所述指令交互框架包括指令交互通信协议、指令交互解析器、指令交互结构映射和指令交互指引。

14、在一些实施例中，所述对所述待训练智能体进行训练包括：

15、基于选择的神经网络和学习算法构建初始待训练智能体，对所述初始待训练智能体进行训练；

16、在所述初始待训练智能体的训练过程中，基于线上编辑器或线下编辑器对所述初始待训练智能体的基础框架代码进行编辑。

17、在一些实施例中，所述将所述目标元数据作为所述待训练智能体的训练样本，对所述待训练智能体进行训练，包括：

18、将所述目标元数据作为当前训练样本；

19、对所述当前训练样本进行数据处理；所述数据处理包括数据清洗和数据结构转换；

20、将数据处理后的所述当前训练样本输入至所述待训练智能体，得到所述待训练智能体输出的待执行决策指令集；

21、将所述待执行决策指令集发送至所述异构兵棋系统，得到所述异构兵棋系统执行所述待执行决策指令集后生成的元数据；

22、基于所述生成的元数据对所述当前训练样本进行更新，直至所述待训练智能体的训练结果符合预设训练条件，结束所述训练。

23、在一些实施例中，所述结束所述训练之后，还包括：

24、定义所述待训练智能体的输入接口和所述待训练智能体的输出接口；

25、其中，所述输入接口用于接收当前元数据，所述输出接口用于将所述待训练智能体生成的待执行决策指令发送至所述异构兵棋系统。

26、第二方面，本申请提供了一种兵棋系统智能体训练装置，包括：

27、生成模块，用于基于目标元数据创建异构兵棋系统中待训练智能体的数据源模板，并生成所述目标元数据的数据通信协议、数据接入指引和交互服务框架；

28、获取模块，用于基于所述数据源模板、所述数据通信协议、所述数据接入指引和所述交互服务框架获取所述目标元数据；

29、训练模块，用于将所述目标元数据作为所述待训练智能体的训练样本，对所述待训练智能体进行训练；

30、其中，所述数据通信协议和所述数据接入指引用于定义所述目标元数据的获取规则；所述交互服务框架用于定义所述目标元数据的传输通道以及定义所述目标元数据在传输过程中的映射规则。

31、第三方面，本申请提供了一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述的方法。

32、第四方面，本申请提供了一种电子设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行所述程序时实现上述的方法。

33、第五方面，本专利技术还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述方法。

34、本申请提供的兵棋系统智能体训练方法、装置、存储介质及电子设备，通过生成目标元数据的数据通信协议、数据接入指引和交互服务框架，根据数据通信协议、数据接入指引和交互服务框架定义目标元数据的接入标准，确保获取的不同数据源的目标元数据的数据标准保持一致性，可以得到相同数据结构的目标元数据，将标准的目标元数据输入待训练智能体中对待训练智能体进行训练，使得待训练智能体在训练过程中能够更好地识别目标元数据并进行学习和决策，提高了智能体的训练效率和训练准确度。

本文档来自技高网...

【技术保护点】

1.一种兵棋系统智能体训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的兵棋系统智能体训练方法，其特征在于，所述基于目标元数据创建异构兵棋系统中待训练智能体的数据源模板，包括：

3.根据权利要求1所述的兵棋系统智能体训练方法，其特征在于，所述获取所述目标元数据之后，还包括：

4.根据权利要求1所述的兵棋系统智能体训练方法，其特征在于，所述对所述待训练智能体进行训练包括：

5.根据权利要求1所述的兵棋系统智能体训练方法，其特征在于，所述将所述目标元数据作为所述待训练智能体的训练样本，对所述待训练智能体进行训练，包括：

6.根据权利要求5所述的兵棋系统智能体训练方法，其特征在于，所述结束所述训练之后，还包括：

7.一种兵棋系统智能体训练装置，其特征在于，包括：

8.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的兵棋系统智能体训练方法。

9.一种电子设备，包括存储器和处理器，其特征在于，所述存储器中存储

10.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的兵棋系统智能体训练方法。

...

【技术特征摘要】

1.一种兵棋系统智能体训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的兵棋系统智能体训练方法，其特征在于，所述基于目标元数据创建异构兵棋系统中待训练智能体的数据源模板，包括：

3.根据权利要求1所述的兵棋系统智能体训练方法，其特征在于，所述获取所述目标元数据之后，还包括：

4.根据权利要求1所述的兵棋系统智能体训练方法，其特征在于，所述对所述待训练智能体进行训练包括：

6.根据权利要求5所述的兵棋系统...

【专利技术属性】
技术研发人员：胡睿，祁文豪，赵斌，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人