System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及人工智能,尤其涉及一种基于人工智能技术的未知电磁数据处理方法和装置。
技术介绍
1、智能体博弈过程通常会涉及时序决策任务,由于高度随机的环境转移和延迟的奖赏,非常有挑战性。近些年来,大量的模仿学习工作发现,在实验上,生成对抗式模仿学习算法的效果比行为克隆算法要好。然而,这个现象背后的理论解释还没有被完全理解。行为克隆算法的主要问题是复合误差:由于马尔科夫决策过程的特点,单步的误差会随着决策步数累加。虽然,已有一些工作研究在有限长度的马尔科夫决策过程上的误差累计问题,在无限长度的马尔科夫决策过程的误差累计问题的理论分析依旧缺乏。另外,关于生成对抗式模仿学习算法为什么比行为克隆算法表现更好的理论分析需要进一步研究。因此,提供一种基于人工智能技术的未知电磁数据处理方法和装置,以通过大量学习专家策略和模仿策略的价值差异,提高最优策略生成的准确性,进而提高电磁频谱策略生成效率和可靠性。
技术实现思路
1、本专利技术所要解决的技术问题在于,提供一种基于人工智能技术的未知电磁数据处理方法和装置有利于通过大量学习专家策略和模仿策略的价值差异,提高最优策略生成的准确性,进而提高电磁频谱策略生成效率和可靠性。
2、为了解决上述技术问题,本专利技术实施例第一方面公开了一种数据处理方法,所述方法包括:
3、获取待处理电磁信息;
4、对所述待处理电磁信息进行策略生成处理,得到初始频谱策略信息;所述初始频谱策略信息包括m个第一频谱策略信息;
5、对
6、本专利技术实施例第二方面公开了一种数据处理装置,装置包括:
7、获取模块,用于获取待处理电磁信息;
8、第一处理模块,用于对所述待处理电磁信息进行策略生成处理,得到初始频谱策略信息;所述初始频谱策略信息包括m个第一频谱策略信息;
9、第二处理模块,用于对所述初始频谱策略信息进行博弈筛选处理,得到目标频谱策略信息。
10、本专利技术第三方面公开了另一种数据处理装置,所述装置包括:
11、存储有可执行程序代码的存储器;
12、与所述存储器耦合的处理器;
13、所述处理器调用所述存储器中存储的所述可执行程序代码,执行本专利技术实施例第一方面公开的数据处理方法中的部分或全部步骤。
14、本专利技术第四方面公开了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令被调用时,用于执行本专利技术实施例第一方面公开的数据处理方法中的部分或全部步骤。
本文档来自技高网...【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的数据处理方法,其特征在于,所述对所述初始频谱策略信息进行博弈筛选处理,得到目标频谱策略信息,包括:
3.根据权利要求2所述的数据处理方法,其特征在于,所述对所述初始频谱策略信息进行映射处理,得到映射策略信息,包括:
4.根据权利要求3所述的数据处理方法,其特征在于,所述基于该第一频谱策略信息和所述目标映射模糊信息,确定出该第一频谱策略信息对应的第二频谱策略信息,包括:
5.根据权利要求2所述的数据处理方法,其特征在于,所述对所述映射策略信息进行计算处理,得到目标频谱策略信息,包括:
6.根据权利要求1所述的数据处理方法,其特征在于,所述对所述待处理电磁信息进行策略生成处理,得到初始频谱策略信息,包括:
7.根据权利要求6所述的数据处理方法,其特征在于,所述策略生成模型包括第一连接模块、第二连接模块、第三连接模块、第四连接模块、第五连接模块、第六连接模块、第一激活模块、第二激活模块、第三激活模块、第四激活模块、第五激活模块、第六激活模块、
8.一种数据处理装置,其特征在于,所述装置包括:
9.一种数据处理装置,其特征在于,所述装置包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令被调用时,用于执行如权利要求1-7任一项所述的数据处理方法。
...【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的数据处理方法,其特征在于,所述对所述初始频谱策略信息进行博弈筛选处理,得到目标频谱策略信息,包括:
3.根据权利要求2所述的数据处理方法,其特征在于,所述对所述初始频谱策略信息进行映射处理,得到映射策略信息,包括:
4.根据权利要求3所述的数据处理方法,其特征在于,所述基于该第一频谱策略信息和所述目标映射模糊信息,确定出该第一频谱策略信息对应的第二频谱策略信息,包括:
5.根据权利要求2所述的数据处理方法,其特征在于,所述对所述映射策略信息进行计算处理,得到目标频谱策略信息,包括:
6.根据权利要求1所述的数据处理方法,其特征在于,所述对所述待处理电...
【专利技术属性】
技术研发人员:许鲁彦,杨健,张琳,张树森,
申请(专利权)人:中国人民解放军军事科学院系统工程研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。