System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及雷达抗干扰和分布式仿真系统,特别涉及一种主瓣干扰下雷达组网主被动联合跟踪调度方法及装置。
技术介绍
1、随着雷达技术的不断发展,现代雷达已具备丰富的资源调度能力,能够灵活改变工作模式、波形参数,同时完成搜索、跟踪、抗干扰等任务。电子干扰已成为雷达面临的重要威胁,通过“软杀伤”手段限制雷达的探测效能,甚至利用主瓣干扰使雷达探测失效,通常,可以通过提高雷达的功率孔径积和加强信号抗干扰处理来减轻电子干扰的影响;然而,目前单个雷达节点的物理规模已接近极限,需要通过组网协同技术实现多雷达任务分配和协同处理,以最大限度地利用雷达探测资源,提高系统对抗主瓣干扰能力。
2、关于多雷达协同资源调度近年得到了广泛的关注和深入的研究,主要目的是在多雷达协同处理的基础上,通过资源管理达到整体性能最优的目的包括提高目标跟踪精度、增加目标跟踪容量、降低波束截获概率等。随着人工智能技术的发展,深度学习方法也被应用于雷达波形生成、时间资源管理、探测任务调度等雷达资源管理任务。具体地,现有技术可采用深度确定性策略梯度(deep deterministic policy gradient,ddpg)的强化学习模型实现多雷达对单目标跟踪,长期跟踪精度优于每一步进行优化求解的结果;此外,现有技术也可利用深度强化学习在雷达与通信共存的拥挤频谱环境中调整波形频谱参数,以提高检测性能。
3、由于对抗抗主瓣干扰技术得到的高度关注,近年有很多通过雷达资源调度实现抗干扰的研究,包括利用深度神经网络进行干扰感知、策略学习、博弈对抗等方法,且现有技术
4、然而,上报干扰指向线的雷达常常由人工经验选取,无法达到系统最优的性能,容易导致主瓣干扰下雷达组网协同探测系统跟踪性能下降,难以合理规划主瓣压制干扰环境下的多雷达任务分配,亟待解决。
技术实现思路
1、本申请提供一种主瓣干扰下雷达组网主被动联合跟踪调度方法及装置,以解决现有技术无法达到系统最优的性能,容易导致主瓣干扰下雷达组网协同探测系统跟踪性能下降,难以合理规划主瓣压制干扰环境下的多雷达任务分配等问题。
2、本申请第一方面实施例提供一种主瓣干扰下雷达组网主被动联合跟踪调度方法,包括以下步骤:确定主瓣干扰突防场景下组网探测系统中每个相控阵雷达的工作模式,并构建所述工作模式对应的主动量测模型或被动定位模型,其中,所述工作模式包括主动探测模式和被动探测模式;根据所述主动量测模型和所述被动定位模型确定所述每个相控阵雷达的工作模式向量和所述每个相控阵雷达对待测目标的驻留时间变量,以通过所述工作模式向量和所述驻留时间变量建立联合跟踪调度评价函数;构建所述组网探测系统对应的强化学习智能体,并通过预设近端策略优化算法训练所述强化学习智能体,以利用训练后的强化学习智能体确定所述每个相控阵雷达的目标工作模式,且通过预设的凸优化求解策略求解所述联合跟踪调度评价函数,以得到所述每个相控阵雷达对所述待测目标的驻留时间。
3、可选地,在本申请的一个实施例中,所述确定主瓣干扰突防场景下组网探测系统中每个相控阵雷达的工作模式,并构建所述工作模式对应的主动量测模型或被动定位模型,其中,所述工作模式包括主动探测模式和被动探测模式,包括:当相控阵雷达处于所述主动探测模式时,获取所述相控阵雷达对所述待测目标的径向距离和角度信息,并根据所述径向距离和所述角度信息构建所述主动量测模型;当所述相控阵雷达处于所述被动探测模式时,获取所述相控阵雷达的干扰源指向线信息,并根据所述干扰源指向线信息构建所述被动定位模型。
4、可选地,在本申请的一个实施例中,所述通过所述工作模式向量和所述驻留时间变量建立联合跟踪调度评价函数,包括:确定第k个探测周期内所述待测目标的状态转移矩阵和状态转移噪声,并根据所述待测目标的状态转移矩阵、状态转移噪声和第k-1个探测周期内待测目标的量测结果,估算第k个探测周期内所述待测目标的状态向量,其中,k为正整数;基于所述状态转移噪声的协方差矩阵、所述状态转移矩阵和第k-1个探测周期内的状态向量,计算所述待测目标的先验信息费舍尔信息矩阵;计算所述每个相控阵雷达在所述第k个探测周期内对所述待测目标的雷达量测雅可比矩阵,以基于所述雷达量测雅可比矩阵,计算所述待测目标的主动跟踪费舍尔信息矩阵;计算所述每个相控阵雷达的量测噪声和所述量测噪声对应的协方差矩阵,并基于所述被动定位模型和所述量测噪声对应的协方差矩阵,计算所述待测目标的被动跟踪费舍尔信息矩阵;基于所述先验信息费舍尔信息矩阵、所述被动跟踪费舍尔信息矩阵和所述主动跟踪费舍尔信息矩阵,计算在所述第k个探测周期内所述待测目标的贝叶斯信息矩阵;根据所述第k个探测周期内所述贝叶斯信息矩阵计算所述待测目标的贝叶斯克拉美罗界,以通过所述贝叶斯克拉美罗界、所述工作模式向量和所述驻留时间变量建立所述联合跟踪调度评价函数。
5、可选地,在本申请的一个实施例中,所述构建所述组网探测系统对应的强化学习智能体,包括:基于预设的马尔可夫决策策略,确定马尔可夫决策过程中第m步对应的所述强化学习智能体的稳定状态,其中,所述稳定状态包括所述相控阵雷达的雷达位置、所述待测目标的状态向量、所述待测目标的先验信息矩阵主元、所述待测目标中干扰目标的被动测量误差和第m步对应的相控阵雷达的独热向量,其中,m为正整数;通过所述相控阵雷达的雷达编码、所述工作模式和所述第m步的预测误差确定所述强化学习智能体的动态状态,并根据所述稳定状态和所述动态状态建立所述强化学习智能体的状态空间;根据所述相控阵雷达的工作模式确定所述强化学习智能体的动作空间;基于所述第m步的预测误差、第m-1步的预测误差和预设放缩超参数,构建所述强化学习智能体的奖励函数。
6、可选地,在本申请的一个实施例中,所述通过预设近端策略优化算法训练所述强化学习智能体,包括:通过预设的全链接网络构建所述预设近端策略优化算法,并随机生成目标训练环境,以利用所述目标训练环境训练所述预设近端策略优化算法,其中,所述目标训练环境包括随机生成的在所述相控阵雷达的覆盖范围内所述待测目标的初始状态和干扰强度;基于所述目标训练环境和训练后的预设近端策略优化算法,训练所述强化学习智能体。
7、可选地,在本申请的一个实施例中,所述联合跟踪调度评价函数的数学表达式为:
8、
9、其中,∈k为第k个探测周期内所述每个相控阵雷达的工作模式向量;τq,k为所述第k个探测周期内所述每个相控阵雷达对所述待测目标q的驻留时间变量;m表示相控阵雷达数量。
10、本申请第二方面实施例提供一种主瓣干扰下雷达组网主被动联本文档来自技高网...
【技术保护点】
1.一种主瓣干扰下雷达组网主被动联合跟踪调度方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述确定主瓣干扰突防场景下组网探测系统中每个相控阵雷达的工作模式,并构建所述工作模式对应的主动量测模型或被动定位模型,其中,所述工作模式包括主动探测模式和被动探测模式,包括:
3.根据权利要求2所述的方法,其特征在于,所述通过所述工作模式向量和所述驻留时间变量建立联合跟踪调度评价函数,包括:
4.根据权利要求3所述的方法,其特征在于,所述构建所述组网探测系统对应的强化学习智能体,包括:
5.根据权利要求4所述的方法,其特征在于,所述通过预设近端策略优化算法训练所述强化学习智能体,包括:
6.根据权利要求1所述的方法,其特征在于,所述联合跟踪调度评价函数的数学表达式为:
7.一种主瓣干扰下雷达组网主被动联合跟踪调度装置,其特征在于,包括:
8.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-6任一项所述的主瓣干扰下雷达组网主被动联合跟踪调度方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被执行,以用于实现如权利要求1-6任一项所述的主瓣干扰下雷达组网主被动联合跟踪调度方法。
...【技术特征摘要】
1.一种主瓣干扰下雷达组网主被动联合跟踪调度方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述确定主瓣干扰突防场景下组网探测系统中每个相控阵雷达的工作模式,并构建所述工作模式对应的主动量测模型或被动定位模型,其中,所述工作模式包括主动探测模式和被动探测模式,包括:
3.根据权利要求2所述的方法,其特征在于,所述通过所述工作模式向量和所述驻留时间变量建立联合跟踪调度评价函数,包括:
4.根据权利要求3所述的方法,其特征在于,所述构建所述组网探测系统对应的强化学习智能体,包括:
5.根据权利要求4所述的方法,其特征在于,所述通过预设近端策略优化算法训练所述强化学习智能体,包括:
6.根据权利要求1所述的方法,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。