一种基于知识蒸馏的连续学习目标检测方法和系统技术方案

技术编号：41532658 阅读：20 留言：0更新日期：2024-06-03 23:09

本发明专利技术提供了一种基于知识蒸馏的连续学习目标检测方法和系统，所述方法包括：基于训练数据集中的图片和旧类别标签对神经网络进行训练，得到教师模型，并获取训练过程中的教师模型过程特征向量；基于训练数据集中的图片、新类别标签和教师模型过程特征向量对神经网络进行训练，得到学生模型，并获取学生模型训练损失；基于教师模型过程特征向量中的三个信息和各自对应的掩码获取特征蒸馏损失；基于学生模型训练损失和特征蒸馏损失获取经过知识蒸馏的损失；基于经过知识蒸馏的损失对学生模型进行训练，得到更新后的学生模型；利用更新后的学生模型实现目标检测。本发明专利技术能够解决现有技术中目标检测方法准确率低的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机视觉、连续学习，尤其涉及一种基于知识蒸馏的连续学习目标检测方法和系统。

技术介绍

1、生物视觉系统可以不断获取、整合和优化知识，其学习模式是序贯进行的。相比之下，目前目标检测模型需要预先准备好完整数据集进行训练学习，然后才能用于推理。这种学习范式假设了数据的分布是固定不变的，然而真实世界的数据则是连续动态数据流，其分布是非平稳的。这就使得当前的检测模型无法适应实际环境中的数据流和业务需求。

2、针对上述问题，神经网络需要从动态数据流中增量式连续学习。其关键难点是：(1)旧知识的灾难性遗忘问题。在学习新的类别时，模型根据新类别的数据更新模型参数后，其在先前学习的类别上性能通常会急剧下降，因此产生了对于先前学习类别的遗忘。(2)新知识的泛化性问题。当从同一类别的新数据中学习时，新数据可能会以不可预见的方式改变该类别的数据分布，从而影响该类别学习的准确性。因此，连续学习的主要任务是解决模型的稳定性与可塑性的问题，这需要神经网络防止忘记先前学习的知识，同时保持学习新知识的能力。

3、知识蒸馏是实现连续学习的一种最具前景的方法，其将知识从先前任务训练的模型中提取到新任务训练的模型中，以巩固先前学习的知识。在以往的研究中，知识蒸馏被广泛应用于图像分类任务中，而连续学习目标检测任务的研究成果则较少。同时，检测任务的高度复杂性也增加了连续学习目标检测任务的难度。

4、当前的特征蒸馏方法存在新旧任务知识类别不一致，导致知识混乱，学生模型会学习到教师模型中无用或错误的知识，导致学生模型在新任务

技术实现思路

1、本专利技术提供了一种基于知识蒸馏的连续学习目标检测方法和系统，能够解决现有技术中目标检测方法准确率低的技术问题。

2、根据本专利技术的一方面，提供了一种基于知识蒸馏的连续学习目标检测方法，所述方法包括：

3、基于训练数据集中的图片和旧类别标签对神经网络进行训练，得到教师模型，并获取训练过程中的教师模型过程特征向量，其中，教师模型过程特征向量包括教师模型中的目标信息，教师模型中正确的背景信息，教师模型中错误的背景信息；

4、基于训练数据集中的图片、新类别标签和教师模型过程特征向量对神经网络进行训练，得到学生模型，并获取学生模型训练损失；

5、基于教师模型过程特征向量中的三个信息和各自对应的掩码获取特征蒸馏损失；

6、基于学生模型训练损失和特征蒸馏损失获取经过知识蒸馏的损失；

7、基于经过知识蒸馏的损失对学生模型进行训练，得到更新后的学生模型；

8、利用更新后的学生模型实现目标检测。

9、优选的，通过下式获取特征蒸馏损失：

10、

11、式中，lfeature(fs,ft)为特征蒸馏损失，为教师模型最终特征向量，为学生模型最终特征向量，为教师模型过程特征向量，为学生模型过程特征向量，mfgi,j为教师模型中的目标信息的掩码，mbgi,j为教师模型中正确的背景信息的掩码，α、β分别为第一、第二超参系数，hrnew、wrnew分别为新类别目标框rnew的长和宽，h、w分别为过程特征向量的长和宽，i,j为像素点的位置坐标。

12、优选的，通过下式获取教师模型过程特征向量中的三个信息和各自对应的掩码：

13、

14、

15、

16、式中，mfgi,j为教师模型中的目标信息的掩码，分别为旧类别目标框rold的长和宽，mnewi,j为教师模型中错误的背景信息的掩码，分别为新类别目标框rnew的长和宽，mbgi,j为教师模型中正确的背景信息的掩码，nbg为所有不属于旧类别目标框rold也不属于新类别目标框rnew的区域的像素总数。

17、优选的，通过下式获取经过知识蒸馏的损失：

18、l′s＝lfeature(fs,ft)+ls；

19、式中，l′s为经过知识蒸馏的损失，ls为学生模型训练损失。

20、优选的，基于训练数据集中的图片和旧类别标签对神经网络进行训练，得到教师模型，并获取训练过程中的教师模型过程特征向量包括：

21、利用教师模型骨干网络从训练数据集中的图片和旧类别标签中提取教师模型深层图像特征和教师模型浅层图像特征，并对教师模型深层图像特征和教师模型浅层图像特征进行拼接，得到教师模型多尺度特征图；

22、教师模型编码器基于教师模型多尺度特征图获取教师模型过程特征向量；

23、教师模型解码器基于教师模型过程特征向量获取教师模型最终特征向量；

24、教师模型分类子网格基于教师模型最终特征向量得到教师模型分类软标签；

25、教师模型回归子网格基于教师模型最终特征向量得到教师模型回归软标签；

26、教师模型激活函数基于教师模型分类软标签得到教师模型类别标签，基于教师模型回归软标签得到教师模型定位标签，从而完成对神经网络进行训练，得到教师模型。

27、优选的，基于训练数据集中的图片、新类别标签和教师模型过程特征向量对神经网络进行训练，得到学生模型包括：

28、利用学生模型骨干网络从训练数据集中的图片和新类别标签中提取学生模型深层图像特征和学生模型浅层图像特征，并对学生模型深层图像特征和学生模型浅层图像特征进行拼接，得到学生模型多尺度特征图；

29、学生模型编码器基于学生模型多尺度特征图和教师模型过程特征向量获取学生模型过程特征向量；

30、学生模型解码器基于学生模型过程特征向量获取学生模型最终特征向量；

31、学生模型分类子网格基于学生模型最终特征向量得到学生模型分类软标签；

32、学生模型回归子网格基于学生模型最终特征向量得到学生模型回归软标签；

33、学生模型激活函数基于学生模型分类软标签得到学生模型类别标签，基于学生模型回归软标签得到学生模型定位标签，从而完成对神经网络进行训练，得到学生模型。

34、根据本专利技术的另一方面，提供了一种基于知识蒸馏的连续学习目标检测系统，所述系统包括网络构建模块、知识蒸馏模块和图像目标检测模块；

35、所述网络构建模块用于基于训练数据集中的图片和旧类别标签对神经网络进行训练，得到教师模型，并获取训练过程中的教师模型过程特征向量，其中，教师模型过程特征向量包括教师模型中的目标信息，教师模型中正确的背景信息，教师模型中错误的背景信息；

36、所述知识蒸馏模块用于基于训练数据集中的图片、新类别标签和教师模型过程特征向量对神经网络进行训练，得到学生模型，并获取学生模型训练损失；用于基于教师模型过程特征向量中的三个信息和各自对应的掩码获取特征蒸馏损失；用于基于学生模型训练损失和特征蒸馏损失获取经过知识蒸馏的损失；还用于基于经过知识蒸馏的损失对学本文档来自技高网...

【技术保护点】

1.一种基于知识蒸馏的连续学习目标检测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，通过下式获取特征蒸馏损失：

3.根据权利要求1或2所述的方法，其特征在于，通过下式获取教师模型过程特征向量中的三个信息和各自对应的掩码：

4.根据权利要求1-3中任一所述的方法，其特征在于，通过下式获取经过知识蒸馏的损失：

5.根据权利要求1所述的方法，其特征在于，基于训练数据集中的图片和旧类别标签对神经网络进行训练，得到教师模型，并获取训练过程中的教师模型过程特征向量包括：

6.根据权利要求1所述的方法，其特征在于，基于训练数据集中的图片、新类别标签和教师模型过程特征向量对神经网络进行训练，得到学生模型包括：

7.一种基于知识蒸馏的连续学习目标检测系统，其特征在于，所述系统包括网络构建模块、知识蒸馏模块和图像目标检测模块；

8.一种计算机设备，其特征在于，包括存储器、处理器及存储在存储器上并可在处理器上运行的基于知识蒸馏的连续学习目标检测程序，所述处理器执行所述基于知识蒸馏的连续学习

...

【技术特征摘要】

1.一种基于知识蒸馏的连续学习目标检测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，通过下式获取特征蒸馏损失：

3.根据权利要求1或2所述的方法，其特征在于，通过下式获取教师模型过程特征向量中的三个信息和各自对应的掩码：

4.根据权利要求1-3中任一所述的方法，其特征在于，通过下式获取经过知识蒸馏的损失：

5.根据权利要求1所述的方法，其特征在于，基于训练数据集中的图片和旧类别标签对神经网络进行训练，得到教师模型，并获取训练过程中的教师模...

【专利技术属性】
技术研发人员：马喆，康梦雪，张金鹏，黄旭辉，
申请(专利权)人：航天科工集团智能科技研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人