推演数据生成及行动方案推演系统、方法及装置制造方法及图纸

技术编号:27937675 阅读:32 留言:0更新日期:2021-04-02 14:18
本发明专利技术属于控制系统领域,具体涉及推演数据生成及行动方案推演系统、方法及装置。旨在解决现有的推演方法构建搜索树过大,推演生成行动方案效率不足的问题;本发明专利技术通过基于场景空间、环境规则构建抽象棋盘,基于任务执行单位的当前位置和抽象棋盘,通过预设的最大长度限制生成可到达性关系表,基于所述可到达性关系表生成决策轨迹,基于所述决策轨迹选择主路径任务执行单位执行所述主路径并更新抽象棋盘,基于更新的抽象棋盘生成反制路径,重复决策区构建单元生成反制路径直至无法生成新的反制路径,完成推演。通过设计了决策区取代搜索,减小了搜索树的大小,使问题在计算上易于处理,降低了问题设置的维数,提高了行动方案的推演速度。

【技术实现步骤摘要】
推演数据生成及行动方案推演系统、方法及装置
本专利技术属于控制系统领域,具体涉及一种推演数据生成及行动方案推演系统、方法及装置。
技术介绍
通过构建一种形式语言的层次结构,来表达主体的状态、系统的网络以及寻找获胜策略的过程。该方法是一种建立大规模多智能体系统知识表示和推理数学模型的方法。包括用于多智能体复杂系统知识表示和推理的语法工具。该方法已被发展成为针对某类复杂系统的通用方法。该方法通过将复杂系统分解为动态交互子系统的层次结构,为减少不同复杂问题中的搜索提供了强大的工具。该快速推演方法极大地减小了搜索树的大小,从而使问题在计算上易于处理。提供了高级专家搜索启发式的形式化和抽象。从本质上讲,这些启发式方法通过构建策略来取代搜索。形式化的专家策略为问题设置提供了高效的算法,这些问题设置的维数可能比专家制定策略的维数大得多。此外,这些正式的策略可以解决专家所设想的领域之外的不同问题领域的问题。对于某些类型的问题,这些专家策略产生了可证明的最优解决方案。为了将启发式正式化,该方法使用了形式语言理论,即以及抽象板上的某些几何结构。由于涉及到语言学和几何学,这种方法被称为语言几何学。该方法本质上是离散的,但也可用于控制由普通或偏微分方程描述的连续过程。
技术实现思路
为了解决现有技术中的上述问题,即为了解决现有的推演方法构建搜索树过大,推演生成行动方案效率不足的问题,本专利技术提出了一种推演数据生成及行动方案推演系统,所述系统包括:抽象棋盘构建模块和对抗策略生成模块;抽象棋盘构建模块,配置为基于场景空间、环境规则构建抽象棋盘;对抗策略生成模块,包括决策轨迹生成单元和决策区构建单元;所述决策轨迹生成子模块,配置为基于任务执行单位的当前位置和抽象棋盘,通过预设最大长度限制生成可到达性关系表,基于所述可到达性关系表生成决策轨迹,基于所述决策轨迹选择主路径;所述决策区构建子模块,配置为任务执行单位执行所述主路径并更新抽象棋盘,基于更新的抽象棋盘生成反制路径,重复决策区构建单元生成反制路径直至无法生成新的反制路径,完成推演。在一些优选的实施方式中,所述抽象棋盘构建模块包括,空间划分子模块、环境规则子模块和抽象棋盘构建子模块;所述空间划分子模块,配置为通过方格或六边形将空间划分开并进行坐标标注生成物理空间模型,所述物理空间模型包括物理空间坐标系;所述环境规则子模块,基于所述物理空间模型,增加预设的环境规则生成环境空间模型;所述预设的环境规则包括地形要素、是否视野受限、是否可以进行机动和是否可以实施决策;所述抽象棋盘构建子模块,基于所述环境空间模型,添加抽象单元生成抽象棋盘;所述抽象单位包括:任务执行单位、单位属性、单位位置、移动规则、攻击规则和侦查规则。在一些优选的实施方式中,所述推演系统还包括搜索语言转化模块:所述搜索语言转化模块包括区域语言生成子模块、翻译子模块和搜索语言生成子模块;所述区域语言生成子模块,配置为将所述主路径和反制路径通过空间表和时间表的方式在所述抽象棋盘中记录,生成区域语言;所述空间表表示为三维数组,轨迹经过的位置为1,未经过的位置为0;所述时间表表示为三维数组,每个位置处的值代表所述路径上的任务执行单位到达此点的时间其中出发点为起始时间;所述翻译子模块,配置为调用区域语法将所述区域语言转化为翻译语言;所述搜索语言生成子模块,配置为将所述翻译语言转化为搜索语言。在一些优选的实施方式中,所述决策轨迹生成子模块,包括:路径延伸单元和路径选择单元;令迭代步数k=1;所述路径延伸单元,配置为基于任务执行单位的当前位置节点lk生成可到达性关系表,基于所述可到达性关系表,任务执行单位基于所述可到达性关系表模拟向前运动一步,生成新位置节点lk+1;所述路径选择单元,若k<M,M为预设的最大长度限制,令k=k+1,重复路径延伸单元生成新位置节点lk+1,直至达到目标位置,所选取的位置节点组成决策轨迹,所述目标位置为根据任务预设的;若k=M,所述新位置节点lk+1在本步迭代中不再选取,令k=k-1,重复路径延伸单元的功能生成另一新位置节点l′k+1,若k再次变为1,则搜索结束。在一些优选的实施方式中,所述决策区构建子模块,包括路径生成单元;其中,所述路径生成单元,包括合理性判断子单元和主路径生成子单元;所述合理性判断子单元,配置为通过预设的第一判定规则和第二判定规则判定目标节点是否合理,若同时满足第一判定规则和第二判定规则认为目标节点合理;所述预设的第一判定规则为:若所述任务执行单位到达目标节点的时间小于预设的合理时间阈值,则认为所述目标节点符合第一判定规则;所述预设的第二判定规则为:若所述目标节点具有确定的单位信息,且所述单位信息与任务执行单位一致,则认为所述目标节点符合第二判定规则;所述主路径生成子单元,配置为将目标节点合理的决策轨迹设定为主路径;若存在多条满足目标节点合理的决策轨迹,则通过预设的主路径选择条件选取其中一条决策轨迹作为主路径,所述主路径选择条件包括:任务执行单位至目标节点路径最短或轨迹不经过敌方单位视野范围;令N=1,所述主路径为第0次反制轨迹。在一些优选的实施方式中,所述决策区构建子模块,在完成所述路径生成单元后还包括第N次反制任务生成单元、第N+1次反制任务生成单元和迭代推演单元;所述第N次反制任务生成单元,配置为基于第N-1次反制任务更新所述抽象棋盘,第N次反制任务执行单位为敌方单位,目标节点为所述第N-1次反制轨迹上任一点,起始点为所述第N次反制任务执行单位当前位置节点,通过如决策轨迹生成子模块所述的步骤生成的主路径作为第N次反制轨迹,基于所述反制轨迹生成第N次反制任务;所述第N+1次反制任务生成单元,配置为基于所述和第N次反制任务更新所述抽象棋盘,并记录第N次反制任务的轨迹和时间表信息,生成第N+1次反制抽象棋盘,第N+1次反制任务执行单位为未执行的友方单位,目标节点为第N次反制轨迹上任一点,起始点为第N+1次反制执行单位当前位置节点,通过如决策轨迹生成子模块所述的步骤生成的主路径作为第N+1次反制轨迹,基于所述反制轨迹生成第N+1次反制任务;所述迭代推演单元,配置为令N=N+2,重复第N次反制任务生成单元和第N+1次反制任务生成单元生成反制任务路径并记录路径信息和时间表信息生成运动方案,直至我方或敌方任一方无法生成反制任务;所述多方案生成单元,配置为重复所述第N次反制任务生成单元-迭代推演单元生成方案的区域语言表示,直至将每个反制轨迹的每个点都设定为目标节点生成反制轨迹,生成运动方案集合。在一些优选的实施方式中,所述决策轨迹的构成元素包括任务执行单位、起始节点、目标节点、最大距离和决策轨迹数量中的一个或多个。在一些优选的实施方式中,所述决策区的构成元素包括可执行区域、友方单位、敌方单位、路径和单位信息。在一些优选的实施方式中,所述任务执行单位至目标节点路径最短,其判断方法本文档来自技高网...

【技术保护点】
1.一种推演数据生成及行动方案推演系统,其特征在于,所述系统包括:抽象棋盘构建模块和对抗策略生成模块;/n所述抽象棋盘构建模块,配置为基于场景空间、环境规则构建抽象棋盘;/n所述对抗策略生成模块,包括决策轨迹生成子模块和决策区构建子模块;/n所述决策轨迹生成子模块,配置为基于任务执行单位的当前位置和抽象棋盘,通过预设的最大长度限制生成可到达性关系表,基于所述可到达性关系表生成决策轨迹,基于所述决策轨迹选择主路径;/n所述决策区构建子模块,配置为任务执行单位执行所述主路径并更新抽象棋盘,基于更新的抽象棋盘生成反制路径,重复决策区构建单元生成反制路径直至无法生成新的反制路径,完成推演。/n

【技术特征摘要】
1.一种推演数据生成及行动方案推演系统,其特征在于,所述系统包括:抽象棋盘构建模块和对抗策略生成模块;
所述抽象棋盘构建模块,配置为基于场景空间、环境规则构建抽象棋盘;
所述对抗策略生成模块,包括决策轨迹生成子模块和决策区构建子模块;
所述决策轨迹生成子模块,配置为基于任务执行单位的当前位置和抽象棋盘,通过预设的最大长度限制生成可到达性关系表,基于所述可到达性关系表生成决策轨迹,基于所述决策轨迹选择主路径;
所述决策区构建子模块,配置为任务执行单位执行所述主路径并更新抽象棋盘,基于更新的抽象棋盘生成反制路径,重复决策区构建单元生成反制路径直至无法生成新的反制路径,完成推演。


2.根据权利要求1所述的推演数据生成及行动方案推演系统,其特征在于,所述推演系统还包括搜索语言转化模块:
所述搜索语言转化模块包括区域语言生成子模块、翻译子模块和搜索语言生成子模块;
所述区域语言生成子模块,配置为将所述主路径和反制路径通过空间表和时间表的方式在所述抽象棋盘中记录,生成区域语言;所述空间表表示为三维数组,轨迹经过的位置为1,未经过的位置为0;所述时间表表示为三维数组,每个位置处的值代表所述路径上的任务执行单位到达此点的时间,其中出发点为起始时间;
所述翻译子模块,配置为调用区域语法将所述区域语言转化为翻译语言;
所述搜索语言生成子模块,配置为将所述翻译语言转化为搜索语言。


3.根据权利要求2所述的推演数据生成及行动方案推演系统,其特征在于,所述抽象棋盘构建模块包括空间划分子模块、环境规则子模块和抽象棋盘构建子模块;
所述空间划分子模块,配置为通过方格或六边形将空间划分开并进行坐标标注生成物理空间模型,所述物理空间模型包括物理空间坐标系;
所述环境规则子模块,基于所述物理空间模型,增加预设的环境规则生成环境空间模型;所述预设的环境规则包括地形要素、是否视野受限、是否可以进行机动和是否可以实施决策;
所述抽象棋盘构建子模块,基于所述环境空间模型,添加抽象单位信息生成抽象棋盘;所述抽象单位信息包括:任务执行单位、单位属性、单位位置、移动规则、攻击规则和侦查规则。


4.根据权利要求3所述的推演数据生成及行动方案推演系统,其特征在于,所述决策轨迹生成子模块,包括路径延伸单元和路径选择单元;
令迭代步数k=1;
所述路径延伸单元,配置为基于任务执行单位的当前位置节点lk生成可到达性关系表,基于所述可到达性关系表,任务执行单位基于所述可到达性关系表模拟向前运动一步,生成新位置节点lk+1;
所述路径选择单元,若k<M,M为预设的最大长度限制,令k=k+1,重复路径延伸单元生成新位置节点lk+1,直至达到目标位置,所选取的位置节点组成决策轨迹,所述目标位置为根据任务预设的;若k=M,或所在路径无法到达所述目标位置节点,所述新位置节点lk+1在本步迭代中不再选取,令k=k-1,重复路径延伸单元的功能生成另一新位置节点l′k+1,若k再次变为1,则搜索结束。


5.根据权利要求4所述的推演数据生成及行动方案推演系统,其特征在于,所述决策区构建子模块,包括路径生成单元;
所述路径生成单元,包括合理性判断子单元和主路径生成子单元;
所述合理性判断子单元,配置为通过预设的第一判定规则和第二判定规则判定目标节点是否合理,若同时满足第一判定规则和第二判定规则认为目标节点合理;所述预设的第一判定规则为:若所述任务执行单位到达目标节点的时间小于预设的合理时间阈值,则认为所述目标节点符合第一判定规则;所述预设的第二判定规则为:若所述目标节点具有确定的单位信息,且所述单位信息与任务执行单位一致,则认为所述目标节点符合第二判定规则;
所述主路径生成子单元,配置为将目标节点合理的决策轨迹设定为主路径;若存在多条满足目标节点合理的决策轨迹,则通过预设...

【专利技术属性】
技术研发人员:范国梁董宗宽李大鹏
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1