一种基于数据回放的情报分析增量学习方法技术

技术编号:34788871 阅读:38 留言:0更新日期:2022-09-03 19:51
本发明专利技术提供一种基于数据回放的情报分析增量学习方法,属于情报分析领域。本发明专利技术面向提升深度学习模型对因事态发展而不断得到的新情报进行高效学习、避免模型因为学习了新的情报而导致遗忘历史情报信息的需求,针对现有增量学习方法无法做到与专家知识进行有效融合的不足,研究基于改进生成对抗网络的数据生成技术,突破了数据生成的多样性与真实性瓶颈,为增量学习提供高质量的数据样本。本发明专利技术研究深度学习网络的增量学习方法,重点突破目标复杂的动态变化实时数据,通过基于数据回放的增量学习等方法将出现的实时数据信息及时更新到深度网络模型中,达到为情报研判人员进行决策提供支持效果。行决策提供支持效果。行决策提供支持效果。

【技术实现步骤摘要】
一种基于数据回放的情报分析增量学习方法


[0001]本专利技术属于情报分析领域,特别涉及一种基于数据回放的情报分析增量学习方法。

技术介绍

[0002]海空目标处于复杂的动态环境下,数据量往往是逐渐增加的。已训练完成的模型如果在新的样本上继续训练会面临灾难性遗忘的问题,即在新数据上训练后,模型中原有历史情报数据的特征会被很快破坏掉,相当于又在扩充后的样本集上对整个模型进行了重新训练,无法很好的保留之前学习到的特征。如果可以做到既保留对海空目标历史信息中特征的学习,又能及时对最新的情报进行学习,那将极大的帮助情报研判人员进行决策。
[0003]基于回放的增量学习的基本思想就是在训练新任务时,一部分具有代表性的旧数据会被保留并用于模型复习曾经学到的旧知识,因此要保留旧任务的哪部分数据,以及如何利用旧数据与新数据一起训练模型,是需要考虑的主要问题,当任务种类不断增多时,要么训练成本会变高,要么代表样本的代表性会减弱,同时在实际生产环境中,这种方法还可能存在数据隐私泄露的问题。

技术实现思路

[0004]为此,本专利技术提供一种基于数据回放的情报分析增量学习方法,面向提升深度学习模型对因事态发展而不断得到的新情报进行高效学习、避免模型因为学习了新的情报而导致遗忘历史情报信息的需求,针对现有增量学习方法无法做到与专家知识进行有效融合的不足,研究基于改进生成对抗网络的数据生成技术,突破数据生成的多样性与真实性瓶颈,为增量学习提供高质量的数据样本。
[0005]本专利技术采用的技术方案为:一种基于数据回放的情报分析增量学习方法,包含以下步骤:(1)基于人工干预调节聚类算法中相关参数,并利用调节后的聚类算法从待训练机器学习模型的样本集中筛选出代表性样本;(2)通过人工二次介入,对代表性样本再次进行筛选;(3)构建生成对抗网络模型,使用步骤(2)中二次筛选后数据训练模型,使生成对抗网络模型学习二次筛选后数据的分布特征;(4)当有新增数据需要训练时,使用步骤(3)中训练好的生成对抗网络模型生成与新增数据相同数量的旧知识数据,将新增数据与生成的旧知识数据共同送入待训练机器学习模型进行训练,实现情报分析的增量学习。
[0006]进一步的,步骤(2)具体包括如下步骤:(201)根据专家经验,对代表性样本所具有特征的唯一性进行评分并排序;(202)根据不同样本特征生成对应标签;(203)通过预训练的方式确定每种标签最终保留的样本数量。
[0007]进一步的,步骤(3)具体包括如下步骤:(301)建立基于DenseNet的生成器,利用生成器生成与二次筛选数据具有相近分布的仿真样本数据;(302)建立基于空间变换网络的增强器,利用增强器对仿真样本数据进行特征变换和特征保留级联操作,增加细节和语义信息;(303)建立基于残差网络的判别器,利用判别器计算增加了细节和语义信息的仿真样本数据与二次筛选数据间误差,并通过误差反向传播的方式调整生成器和增强器的参数,得到训练好的生成对抗网络模型。
[0008]进一步的,步骤(4)具体包括如下步骤:(401)当有新增数据需要训练时,使用训练好的生成器生成与真实数据相同数量且具有相近分布的仿真样本数据,使用训练好的增强器对生成的仿真样本数据进行特征变换和特征保留级联操作,增加细节和语义信息,得到最终的生成数据;(402)将新增数据与最终的生成数据进行随机排序,共同送入待训练机器学习模型进行训练,实现情报分析的增量学习。
[0009]本专利技术的有益效果:(1)本专利技术通过将人的经验与知识与数据驱动的算法结合,弥补了单一数据驱动方法带来的不足,使回放结果可解释性更强、更容易获取作战人员信任;(2)本专利技术通过改进的生成对抗网络模型,将旧数据中知识通过模型参数的方式储存,从而避免了基于回放的方法潜在的数据隐私问题,同时改进模型提升了生成数据的质量,保证了模型兼顾新旧知识的学习。
附图说明
[0010]图1为本专利技术实施例中基于数据回放的情报分析增量学习方法流程示意图;图2为本专利技术实施例中改进生成对抗网络的训练过程示意图。
具体实施方式
[0011]下面结合附图对本专利技术的具体实施方式进行描述,以便本领域的技术人员更好地理解本专利技术。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本专利技术的主要内容时,这些描述在这里将被忽略。
[0012]图1是本专利技术基于数据回放的情报分析增量学习方法一种具体实施下的原理流程框架图。
[0013]在本实施例中,如图1所示基于数据回放的情报分析增量学习方法包括以下步骤:(1)基于人工干预调节聚类算法中相关参数,并利用调节后的聚类算法从待训练机器学习模型的样本集中筛选出代表性样本;具体包括如下步骤:(101)从待训练机器学习模型的样本集中随机选取k个样本作为簇中心,k为设定值;(102)计算所有样本到各簇中心距离;(103)对每一个样本,将其划分到与其距离最近的簇中心所在簇中;(104)对于新的簇计算各簇的新的簇中心;
(105)重复步骤(102)~(104),直到簇中心不再发生变化,此时以各簇中心及距离各簇中心最近的20个样本为代表性样本。
[0014](2)通过人工二次介入,对代表性样本再次进行筛选;具体包括如下步骤:(201)根据专家经验,对代表性样本所具有特征的唯一性进行评分并排序;(202)根据不同样本特征生成对应标签;(203)通过预训练的方式确定每种标签最终保留的样本数量。
[0015](3)构建生成对抗网络模型,使用步骤(2)中二次筛选后数据训练模型,使生成对抗网络模型学习二次筛选后数据的分布特征;如图2所示,具体包括如下步骤:(301)建立基于DenseNet的生成器,利用生成器生成与二次筛选数据具有相近分布的仿真样本数据;(302)建立基于空间变换网络的增强器,利用增强器对仿真样本数据进行特征变换和特征保留级联操作,增加细节和语义信息;(303)建立基于残差网络的判别器,利用判别器计算增加了细节和语义信息的仿真样本数据与二次筛选数据间误差,并通过误差反向传播的方式调整生成器和增强器的参数,得到训练好的生成对抗网络模型。
[0016](4)当有新增数据需要训练时,使用步骤(3)中训练好的生成对抗网络模型生成与新增数据相同数量的旧知识数据,将新增数据与生成的旧知识数据共同送入待训练机器学习模型进行训练,实现情报分析的增量学习。具体包括如下步骤:(401)当有新增数据需要训练时,使用训练好的生成器生成与真实数据相同数量且具有相近分布的仿真样本数据,使用训练好的增强器对生成的仿真样本数据进行特征变换和特征保留级联操作,增加细节和语义信息,得到最终的生成数据;(402)将新增数据与最终的生成数据进行随机排序,共同送入待训练机器学习模型进行训练,实现情报分析的增量学习。
[0017]最后应说明的是:以上所述实施例,仅为本专利技术的具体实施方式,用以说明本专利技术的技术方案,而非对其限制,本专利技术的保护范围并不局限于此,尽管参照前述实施例对本专利技术进行了详细的说明,本领域的普通技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数据回放的情报分析增量学习方法,其特征在于,包含以下步骤:(1)基于人工干预调节聚类算法中相关参数,并利用调节后的聚类算法从待训练机器学习模型的样本集中筛选出代表性样本;(2)通过人工二次介入,对代表性样本再次进行筛选;(3)构建生成对抗网络模型,使用步骤(2)中二次筛选后数据训练模型,使生成对抗网络模型学习二次筛选后数据的分布特征;(4)当有新增数据需要训练时,使用步骤(3)中训练好的生成对抗网络模型生成与新增数据相同数量的旧知识数据,将新增数据与生成的旧知识数据共同送入待训练机器学习模型进行训练,实现情报分析的增量学习。2.根据权利要求1所述的一种基于数据回放的情报分析增量学习方法,其特征在于,步骤(2)具体包括如下步骤:(201)根据专家经验,对代表性样本所具有特征的唯一性进行评分并排序;(202)根据不同样本特征生成对应标签;(203)通过预训练的方式确定每种标签最终保留的样本数量。3.根据权利要求1所述的一种基于数据回放的情报分析增量学习方法,其...

【专利技术属性】
技术研发人员:姚晨刘敬一孟楠陈金勇
申请(专利权)人:中国电子科技集团公司第五十四研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1