用于无人机空中对抗的决策系统及方法技术方案

技术编号:18524948 阅读:60 留言:0更新日期:2018-07-25 12:21
本发明专利技术提供一种用于无人机空中对抗的决策系统及方法,属于无人机领域。决策方法包括:步骤S10:获取在预定时间段内蓝方无人机的第一状态和红方无人机的第二状态;步骤S20:采用LSTM网络根据第一状态预测蓝方无人机在未来预定时刻的第一预测状态;步骤S30:从与红方无人机相关联的机动动作库中选取机动动作;步骤S40:根据红方无人机的当前状态和选取的机动动作计算红方无人机在执行机动动作后的未来预定时刻的第二预测状态;步骤S50:根据第二预测状态与第一预测状态计算在未来预定时刻蓝方无人机对红方无人机的威胁系数;步骤S60:重复步骤S30至步骤S50直到计算出所述威胁系数;步骤S70:选取最小威胁系数;步骤S80:输出与最小威胁系数对应的机动动作。

【技术实现步骤摘要】
用于无人机空中对抗的决策系统及方法
本专利技术涉及无人机领域,具体地涉及一种用于无人机空中对抗的决策系统及方法。
技术介绍
对于空中对抗领域的无人机决策方法主要包括两种:一是基于当前态势进行决策的方法。在此类中,分为两种情形。一种是在完全信息下,依据当前态势进行决策的空战决策方法,例如完全信息静态博弈,微分对策,影响图等。一种是不完全信息下,例如使用模糊理论,区间灰数,区间数层次分析法等方法将对不完全信息下的威胁或者攻击效能进行评估继而做出决策的空战决策方法。二是基于未来态势或态势变化趋势的决策方法。依据当前态势对未来态势进行预测,可以更好的掌握战场态势的发展,该类方法通过对当前态势和未来态势的评估来进行决策。基于态势预测和推理进行决策现也有许多的方法,例如:①滚动时域,②动态贝叶斯网络,③模糊动态博弈,④证据网络等。但是,这两种方法均存在缺陷。第一类方法中,建立在完全信息条件下的决策方法无法解决信息不完全下的机动决策问题。第一类方法中,无论是完全信息条件下还是不完全信息条件下,都是依据当前态势进行机动决策,在决策中也不考虑敌方机动,不能把握战场变化趋势和未来威胁态势变化,具有局限性。第二类方法中,虽然在决策过程中考虑战场变化趋势,试图对未来态势进行推断,但是依然具有局限性:①滚动时域控制中,选择合适的值函数非常关键。对于简单的最优控制问题,可从相对应的HJB偏微分方程求得,但此问题的HJB方程实际上难以求解,使用近似值函数。近似值函数中,需要构建战术优势值。在构建战术优势值的过程中,需要构建敌方运动状态方程,并且已知敌方加速度,不能适用敌方机动完全未知的条件。②贝叶斯网络是概率论与图论的有机结合,所以贝叶斯网络在解决不确定性问题方面有着天然的优势。近年来贝叶斯网络已经成为不确定性研究领域的一大热门,因此有方法采用贝叶斯模型,或者动态贝叶斯网络模型对战场不确定性信息进行预测与评估。但是贝叶斯模型需要一定的先验知识,制定先验概率和条件概率。③模糊动态博弈方法需要已知敌我双方的策略集。④证据网络方法需要结合知识库及专家的先验知识构建评价函数。由此可见,第二类方法也都无法解决在敌方机动策略完全未知的情况下基于战场态势预测和推理的决策问题,即在敌方机动完全未知,没有先验规则的情况上,以上的方法都无法适用。
技术实现思路
本专利技术的目的是提供一种用于无人机空中对抗的决策系统及方法,该决策系统及方法在无人机模拟对抗时能够根据蓝方无人机的状态判断并输出红方无人机的机动动作。为了实现上述目的,本专利技术实施方式提供一种用于无人机空中对抗的决策方法,该决策方法可以包括:步骤S10:获取在预定时间段内蓝方无人机的第一状态和红方无人机的第二状态;步骤S20:采用长短期记忆(LongShort-TermMemory,LSTM)网络根据第一状态预测蓝方无人机在未来预定时刻的第一预测状态;步骤S30:从与红方无人机相关联的机动动作库中选取未被使用的机动动作;步骤S40:根据红方无人机的当前状态和选取的机动动作计算红方无人机在执行机动动作后的未来预定时刻的第二预测状态;步骤S50:根据第二预测状态与第一预测状态计算在未来预定时刻蓝方无人机对红方无人机的威胁系数;步骤S60:重复步骤S30至步骤S50直到计算出所述机动动作库中的所有机动动作对应的威胁系数;步骤S70:从所有威胁系数中选取最小威胁系数;步骤S80:输出与所述最小威胁系数对应的机动动作。可选地,所述红方的第一状态和蓝方的第二状态可以包括:位置信息、速度、俯仰角和偏航角,所述预定时间段包括从过去的预定时刻至当前时刻的时间区间。可选地,所述位置信息包括第一坐标值、第二坐标值和第三坐标值,所述采用LSTM网络根据所述第一状态预测所述蓝方无人机在未来预定时刻的第一预测状态包括:采用六个独立且结构相同的所述LSTM网络分别对所述第一状态的第一坐标值、所述第一状态的第二坐标值和所述第一状态的第三坐标值、所述第一状态的速度、所述第一状态的俯仰角和所述第一状态的偏航角进行预测,以生成预测的第一状态的第一坐标值、预测的第一状态的第二坐标值、预测的第一状态的第三坐标值、预测的第一状态的第一预测速度、预测的第一状态的第一预测俯仰角和预测的第一状态的第一预测偏航角;关联所述预测的第一状态的第一坐标值、预测的第一状态的第二坐标值、预测的第一状态的第三坐标值、预测的第一状态的第一预测速度、预测的第一状态的第一预测俯仰角和预测的第一状态的第一预测偏航角以生成所述第一预测状态。可选地,LSTM网络的输入数据可以为一维时间序列数据,方向可以为单向,层数可以为2层;所述LSTM网络可以采用衰减的学习速率,所述学习速率的初始值可以为1.0,所述学习速率的衰减值可以为0.5,LSTM网络的细胞单元的数量可以为100个,激活函数可以为双曲正切函数,所述LSTM网络还可以包括:用于防止过度拟合的退出层,所述退出层的保留节点数为0.8,所述LSTM网络采用均方误差的计算方式计算误差,确定权重参数的迭代更新方式采用RMSprop算法。本专利技术的另一方面还提供一种用于无人机空中对抗的决策系统,该决策系统可以包括:雷达,设置在红方无人机上;处理器,被配置成用于执行下列步骤:步骤S10:通过所述雷达获取蓝方无人机在预定时间段内的第一状态,通过所述红方无人机接收所述红方无人机在预定时间段内的第二状态;步骤S20:采用长短期记忆LSTM网络根据所述第一状态预测所述蓝方无人机在未来预定时刻的第一预测状态;步骤S30:从与所述红方无人机相关联的机动动作库中选取未被使用的机动动作;步骤S40:根据所述红方无人机的当前状态和选取的机动动作计算所述红方无人机在执行所述机动动作后的所述未来预定时刻的第二预测状态;步骤S50:根据所述第二预测状态与所述第一预测状态计算在所述未来预定时刻所述蓝方无人机对所述红方无人机的威胁系数;步骤S60:重复步骤S30至步骤S50直到计算出所述机动动作库中的所有机动动作对应的威胁系数;步骤S70:从所有威胁系数中选取最小威胁系数;步骤S80:输出与所述最小威胁系数对应的机动动作。可选地,所述红方的第一状态和蓝方的第二状态可以包括:位置信息、速度、俯仰角和偏航角,所述预定时间段包括从过去的预定时刻至当前时刻的时间区间。可选地,所述位置信息包括第一坐标值、第二坐标值和第三坐标值,所述处理器进一步被配置成:采用六个独立且结构相同的所述LSTM网络分别对所述第一状态的第一坐标值、所述第一状态的第二坐标值和所述第一状态的第三坐标值、所述第一状态的速度、所述第一状态的俯仰角和所述第一状态的偏航角进行预测,以生成预测的第一状态的第一坐标值、预测的第一状态的第二坐标值、预测的第一状态的第三坐标值、预测的第一状态的第一预测速度、预测的第一状态的第一预测俯仰角和预测的第一状态的第一预测偏航角;关联所述预测的第一状态的第一坐标值、预测的第一状态的第二坐标值、预测的第一状态的第三坐标值、预测的第一状态的第一预测速度、预测的第一状态的第一预测俯仰角和预测的第一状态的第一预测偏航角以生成所述第一预测状态。可选地,所述LSTM网络的输入数据可以为一维时间序列数据,方向可以为单向,层数可以为2层;所述LSTM网络可以采用衰减的学习速率,所述本文档来自技高网
...

【技术保护点】
1.一种用于无人机空中对抗的决策方法,其特征在于,包括:步骤S10:获取在预定时间段内蓝方无人机的第一状态和红方无人机的第二状态;步骤S20:采用长短期记忆LSTM网络根据所述第一状态预测所述蓝方无人机在未来预定时刻的第一预测状态;步骤S30:从与所述红方无人机相关联的机动动作库中选取未被使用的机动动作;步骤S40:根据所述红方无人机的当前状态和选取的机动动作计算所述红方无人机在执行所述机动动作后的所述未来预定时刻的第二预测状态;步骤S50:根据所述第二预测状态与所述第一预测状态计算在所述未来预定时刻所述蓝方无人机对所述红方无人机的威胁系数;步骤S60:重复步骤S30至步骤S50直到计算出所述机动动作库中的所有机动动作对应的威胁系数;步骤S70:从所有威胁系数中选取最小威胁系数;步骤S80:输出与所述最小威胁系数对应的机动动作。

【技术特征摘要】
1.一种用于无人机空中对抗的决策方法,其特征在于,包括:步骤S10:获取在预定时间段内蓝方无人机的第一状态和红方无人机的第二状态;步骤S20:采用长短期记忆LSTM网络根据所述第一状态预测所述蓝方无人机在未来预定时刻的第一预测状态;步骤S30:从与所述红方无人机相关联的机动动作库中选取未被使用的机动动作;步骤S40:根据所述红方无人机的当前状态和选取的机动动作计算所述红方无人机在执行所述机动动作后的所述未来预定时刻的第二预测状态;步骤S50:根据所述第二预测状态与所述第一预测状态计算在所述未来预定时刻所述蓝方无人机对所述红方无人机的威胁系数;步骤S60:重复步骤S30至步骤S50直到计算出所述机动动作库中的所有机动动作对应的威胁系数;步骤S70:从所有威胁系数中选取最小威胁系数;步骤S80:输出与所述最小威胁系数对应的机动动作。2.根据权利要求1所述的决策方法,其特征在于,所述红方的第一状态和蓝方的第二状态包括:位置信息、速度、俯仰角和偏航角,所述预定时间段包括从过去的预定时刻至当前时刻的时间区间。3.根据权利要求2所述的决策方法,其特征在于,所述位置信息包括第一坐标值、第二坐标值和第三坐标值,所述采用长短期记忆LSTM网络根据所述第一状态预测所述蓝方无人机在未来预定时刻的第一预测状态包括:采用六个独立且结构相同的所述LSTM网络分别对所述第一状态的第一坐标值、所述第一状态的第二坐标值和所述第一状态的第三坐标值、所述第一状态的速度、所述第一状态的俯仰角和所述第一状态的偏航角进行预测,以生成预测的第一状态的第一坐标值、预测的第一状态的第二坐标值、预测的第一状态的第三坐标值、预测的第一状态的第一预测速度、预测的第一状态的第一预测俯仰角和预测的第一状态的第一预测偏航角;关联所述预测的第一状态的第一坐标值、预测的第一状态的第二坐标值、预测的第一状态的第三坐标值、预测的第一状态的第一预测速度、预测的第一状态的第一预测俯仰角和预测的第一状态的第一预测偏航角以生成所述第一预测状态。4.根据权利要求3所述的决策方法,其特征在于,所述LSTM网络的输入数据为一维时间序列数据,方向为单向,层数为2层;所述LSTM网络采用衰减的学习速率,所述学习速率的初始值为1.0,所述学习速率的衰减值为0.5,所述LSTM网络的细胞单元的数量为100个,激活函数为双曲正切函数,所述LSTM网络还包括:用于防止过度拟合的退出层,所述退出层的保留节点数为0.8,所述LSTM网络采用均方误差的计算方式计算误差,确定权重参数的迭代更新方式采用RMSprop算法。5.一种用于无人机空中对抗...

【专利技术属性】
技术研发人员:胡笑旋郭君马华伟夏维罗贺张任驰
申请(专利权)人:合肥工业大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1