一种基于混合森林的雷达数据实时处理方法及系统技术方案

技术编号:35028840 阅读:29 留言:0更新日期:2022-09-24 23:01
本发明专利技术一种基于混合森林的雷达数据实时处理方法及系统,方法包括:通过Bagging算法根据训练数据集进行循环采样操作,以得到混合森林框架中各分支的抽中样本集合X

【技术实现步骤摘要】
一种基于混合森林的雷达数据实时处理方法及系统


[0001]本专利技术涉及雷达数据处理技术,更具体涉及一种基于混合森林的雷达数据实时处理方法及系统。

技术介绍

[0002]随着我国应用雷达数量日益增加,同时应军事和民用需求,雷达跟踪数据检测越来越频繁,目前所使用的人工监视的方式完成雷达跟踪数据采集处理,在应对24小时监测时,变得不切实际。同时,目前国内测控与传感器数据接收的地面跟踪接收系统大部分都是数据维度较大,数据对比不便,耗费大量的精力和时间,不利于设备实时监控和故障的快速解决。现代大数据和人工智能技术的发展,为该问题提供了一个科学有效的解决方法,但尚存在一定的局限性:1.跟踪的实时有效数据包括任务数据和装备状态数据,整合后单个样本维度较高;2.正常跟踪的样本数据量远大于异常样本,处理难度大。
[0003]现阶段的雷达实时数据处理,仍然需要大量的专家经验,采用人工处理的方法,对海量的数据进行处理,尤其在面对24小时雷达跟踪时,现阶段的处理方式,需要消耗大量的人力。在军事系统,军用雷达跟踪接收系统,实时记录测数据和当前设备状态时,信息全面、记录密度大,常需要人工分析。记录的数据维度较大,数据对比不便,耗费大量的精力和时间,不利于雷达跟踪和故障的快速解决。
[0004]申请号为201810489421.3的现有专利技术专利《一种雷达有源干扰的识别方法及系统》对接收到的有源干扰进行变分模态分解,得到不同的模态分量;计算每个固有模态分量相应的矩形积分双谱,组合成特征参量;通过随机森林分类器实现雷达有源干扰方式的识别。由该现有专利的说明书中可知,该专利技术方案为采用随机森林的生成及决策树的生长得到随机森林分类器,以进行雷达干扰信号的识别,该现有专利的技术方案与本申请存在显著区别,同时,该现有申请并未公开本申请的混合降维矩阵等具体技术特征,此外,该现有专利主要应用场景为识别排除雷达干扰,可知该现有专利的应用场景以及解决的技术问题与本申请迥异,亦无法达到本申请的技术效果。
[0005]综上,现有技术存在数据量庞大和依赖人工操作导致雷达效率低及精准度不高的技术问题。

技术实现思路

[0006]本专利技术所要解决的技术问题在于如何解决现有技术数据量庞大和依赖人工操作导致雷达效率低及精准度不高的技术问题。
[0007]本专利技术是采用以下技术方案解决上述技术问题的:一种基于混合森林的雷达数据实时处理方法包括:
[0008]S1、获取训练数据集、训练样本标签集、集成模型分支数量及特征选择率,通过Bagging算法根据训练数据集进行循环采样操作,以得到混合森林框架中各分支的抽中样本集合X
s
和异常样本集合X
u
,对所述抽中样本集合X
s
和所述异常样本集合X
u
进行样本特征
转换,以得到分支特征拓展矩阵,利用PCA算法处理所述抽中样本集合X
s
,以得到分支旋转矩阵,通过降维混合矩阵处理得到新分支训练数据集,利用所述新分支训练数据集训练各支分类器,以得到经训练的混合森林;
[0009]S2、向模型输入预置测试样本集,以确定所述混合降维矩阵,并通过对应的特征选择矩阵、特征拓展矩阵及选择矩阵处理所述测试样本集中的测试数据,以所述各支分类器分类样本,对分类结果投票,以票数最多的分类结果作为最终模型预测结果;
[0010]S3、向所述混合森林输入跟踪历史数据集,据以定期训练所述混合森林,以生成新混合降维矩阵,以经训练的所述混合森林判定每秒跟踪数据及跟踪状态中的异常样本,据以识别异常任务跟踪弧段,以进行故障报警并处理故障。
[0011]本专利技术对混合森林模型进行训练,得到最新的混合降维矩阵,在预测阶段,对混合降维矩阵处理测试数据集,预测其中各样本的类别标签,依据众数原则的投票模型选择取得票数多的类别作为各样本的投票结果。该方法能够根据前期采集数据,智能化对采集的数据规范化处理,即可实现海量数据的规范和筛选,节约大量的时间,实现雷达跟踪的快速解决。本专利技术利用混合森林的提高模型各分支间多样性的特点,同时利用模型分支的异常跟踪样本和未选择弱特征来提高各基分类器对数据中有用信息的可挖掘性,从而提升模型的分类精度和对异常跟踪情况的识别能力。
[0012]在更具体的技术方案中,所述步骤S1包括:
[0013]S11、基于所述树的特征选择算法,利用预置逻辑构造模型的所述特征选择矩阵;
[0014]S12、通过Bagging算法得到分支的所述抽中样本集合X
s
和所述异常样本集合X
u

[0015]S13、根据所述抽中样本集合X
s
和所述异常样本集合X
u
,以预置逻辑处理得到分支的所述特征拓展矩阵A
a

[0016]S14、以下述逻辑处理计算样本和之间的余弦相似度
[0017][0018],其中,d∈{1,......,n},n为数据集中样本的维度,代表抽中样本集里的第i个样本的第d个特征,代表异常样本集里的第j个样本的第d个特征,且i∈{1,...,N},j∈{1,...,U};
[0019]S15、以下述逻辑将所述余弦相似度添加至所述所述特征拓展矩阵A
a
的第i行第j列:
[0020][0021]S16、将主成分分析算法PCA应用于所述特征选择矩阵和所述特征拓展矩阵处理后的数据集[X
s
*(I

A
s
),A
a
]上,经过训练得到主成分的系数R1,...,R
m

[0022]S17、选择因子构成所述主成分分析算法PCA所生成的选择矩阵:
[0023][0024],其中,是第i(i={1,2,...,m})个旋转系数里的第j(j={1,2,...,p})个旋转因子。
[0025]S18、经过旋转矩阵的特征转换后,所得到的最终的数据集预处理结果为:
[0026]X
f
=[X
s
*A
s
,[X
s
*(I

A
s
),A
a
]A
r
][0027]S19、根据所述最终的数据集预处理结果训练得到所述分支分类器T
i

[0028]本专利技术在训练阶段,对混合森林模型进行训练,得到最新的混合降维矩阵。混合森林保留了传统集成模型的特征选择与样本重采样的过程,而对未被选择的特征和被标志为跟踪异常的样本在各分支中并未直接使用,而是通过生成新特征的方法来保证模型各分支之间的差异性。同时提出通过样本特征化转换过程(SFTP),将异常跟踪样本转化为拓展特征的方法,提高模型对异常样本的敏感性。
[0029]在更具体的技术方案中,所述步骤S11包括:
[0030]S111、通过所述训练数据集生成极本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于混合森林的雷达数据实时处理方法,其特征在于,所述方法包括:S1、获取训练数据集、训练样本标签集、集成模型分支数量及特征选择率,通过Bagging算法根据训练数据集进行循环采样操作,以得到混合森林框架中各分支的抽中样本集合X
s
和异常样本集合X
u
,对所述抽中样本集合X
s
和所述异常样本集合X
u
进行样本特征转换,以得到分支特征拓展矩阵,利用PCA算法处理所述抽中样本集合X
s
,以得到分支旋转矩阵,通过降维混合矩阵处理得到新分支训练数据集,利用所述新分支训练数据集训练各支分类器,以得到经训练的混合森林;S2、向模型输入预置测试样本集,以确定所述混合降维矩阵,并通过对应的特征选择矩阵、特征拓展矩阵及选择矩阵处理所述测试样本集中的测试数据,以所述各支分类器分类样本,对分类结果投票,以票数最多的分类结果作为最终模型预测结果;S3、向所述混合森林输入跟踪历史数据集,据以定期训练所述混合森林,以生成新混合降维矩阵,以经训练的所述混合森林判定每秒跟踪数据及跟踪状态中的异常样本,据以识别异常任务跟踪弧段,以进行故障报警并处理故障。2.根据权利要求1所述的一种基于混合森林的雷达数据实时处理方法,其特征在于,所述步骤S1包括:S11、基于所述树的特征选择算法,利用预置逻辑构造模型的所述特征选择矩阵;S12、通过Bagging算法得到分支的所述抽中样本集合X
s
和所述异常样本集合X
u
;S13、根据所述抽中样本集合X
s
和所述异常样本集合X
u
,以预置逻辑处理得到分支的所述特征拓展矩阵A
a
;S14、以下述逻辑处理计算样本和之间的余弦相似度之间的余弦相似度其中,d∈{1,......,n},n为数据集中样本的维度,代表抽中样本集里的第i个样本的第d个特征,代表异常样本集里的第j个样本的第d个特征,且i∈{1,...,N},j∈{1,...,U};S15、以下述逻辑将所述余弦相似度添加至所述所述特征拓展矩阵A
a
的第i行第j列:S16、将主成分分析算法PCA应用于所述特征选择矩阵和所述特征拓展矩阵处理后的数据集[X
s
*(I

A
s
),A
a
]上,经过训练得到主成分的系数R1,...,R
m
;S17、选择因子构成所述主成分分析算法PCA所生成的选择矩阵:
其中,是第i(i={1,2,...,m})个旋转系数里的第j(j={1,2,...,p})个旋转因子。S18、经过旋转矩阵的特征转换后,所得到的最终的数据集预处理结果为:X
f
=[X
s
*A
s
,[X
s
*(I

A
s
),A
a
]A
r
]S19、根据所述最终的数据集预处理结果训练得到所述分支分类器T
i
。3.根据权利要求2所述的一种基于混合森林的雷达数据实时处理方法,其特征在于,所述步骤S11包括:S111、通过所述训练数据集生成极端随机森林;S121、计算每个特征的平均重要性值作为该特征强弱的度量指标;S131、选择具有较高平均重要性的特征作为特征子集供训练分类器。4.根据权利要求2所述的一种基于混合森林的雷达数据实时处理方法,其特征在于,所述步骤S12包括:S121、利用Bagging算法重采样所述训练数据集,据以产生抽中的样本集合和未被抽中的样本集合;S122、对于抽中集合中的每个样本,计算其与异常样本集合中每个样本的相似度作为每个被选中样本的拓展特征。5.根...

【专利技术属性】
技术研发人员:陈欣鹏宋彬杰杨小龙张翊王瑞杰兴龙陈永明郑立峰于雨
申请(专利权)人:中国人民解放军陆军炮兵防空兵学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1