【技术实现步骤摘要】
一种对象检测框的确定方法、装置、存储介质及电子装置
[0001]本专利技术实施例涉及通信领域,具体而言,涉及一种对象检测框的确定方法、装置、存储介质及电子装置。
技术介绍
[0002]近年来深度学习快速发展,基于卷积神经网络(CNN)的模型结构已经在视觉领域取得了显著的成果,出现了多样的视觉任务,其中目标检测是最常见的视觉任务之一,目标检测利用边界框绘制出目标的位置并标注出类别信息,解决了同一图像的多目标定位和识别的问题。
[0003]为了满足实际生活和工业生产的需求,目标检测模型依然面临参数量大,推理速度慢和难以部署到边缘设备等问题。针对此类问题和挑战,提出了模型量化、模型剪枝和知识蒸馏等模型优化方法,其中模型量化是一种将浮点计算转化为低比特定点计算的技术,可以有效的降低模型计算复杂度。模型剪枝通过剔除模型结构中的冗余连接,能够有效的降低模型复杂度和模型参数量。知识蒸馏通过引入老师模型,监督诱导学生模型学习老师模型的特征分布,实现了知识迁移,增强了学生网络性能和泛化能力。
[0004]然而,模型量化和模型剪枝处理之后的模型通常需要定制化的硬件来适配加速,训练和部署过程复杂,知识蒸馏是一种高效的端到端学习模型优化方法,学生模型学习老师模型的特征分布,增强了学生模型的性能和泛化能力。然而,以往关于知识蒸馏的研究大多专注于分类,目标检测方面的知识蒸馏方法研究很少。检测相对于分类做知识蒸馏的难点:(1)检测需要更加关注局部特征和信息,不像分类只关注全局信息,因此检测需要关注每个像素点,这样带来的问题就是前景 ...
【技术保护点】
【技术特征摘要】
1.一种对象检测框的确定方法,其特征在于,包括:利用目标网络模型中包括的多个目标老师模型对目标图像进行处理,以确定每个所述目标老师模型输出的目标图像特征,其中,所述每个所述目标老师模型输出的所述目标图像特征不同;融合每个所述目标老师模型输出的目标图像特征,以得到第一融合特征;将所述第一融合特征输入至所述目标网络模型中包括的目标学生模型中,以确定所述目标图像中包括的对象的目标检测框;所述目标网络模型是通过如下方式训练得到的:获取多组训练数据,其中,多组所述训练数据中的每组所述训练数据均包括训练图像以及所述训练图像中的对象的标签检测框的第一位置信息;通过多组所述训练数据训练初始网络模型中包括的多个初始老师模型,得到多个所述目标老师模型;基于所述目标老师模型输出的所述训练图像的训练特征训练所述初始网络模型中包括的初始学生模型,以得到所述目标学生模型;将训练完成的包括所述目标学生模型以及多个所述目标老师模型的初始网络模型确定为所述目标网络模型;基于所述目标老师模型输出的所述训练图像的训练特征训练所述初始网络模型中包括的初始学生模型,以得到所述目标学生模型包括:重复执行以下操作,直到所述初始网络模型的第二损失值小于第二预定损失值:将每组所述训练数据中包括的训练图像输入至每个所述目标老师模型,以得到每个所述目标老师模型按照不同的采样倍率提取到的所述训练图像的不同层级的第二训练特征;将每个所述目标老师模型提取到的同一层级的所述第二训练特征进行融合,得到不同层级的第三融合特征;将输入至所述目标老师模型中的所述训练图像输入至所述初始学生模型,以得到所述初始学生模型按照不同的采样倍率提取到的所述训练图像的不同层级的第三训练特征;将不同层级的所述第三融合特征输入至初始学生模型中,以确定相同层级的所述第三融合特征与所述第三训练特征的训练误差;基于所述训练误差确定所述初始网络模型的所述第二损失值;在所述第二损失值大于第二预定损失值的情况下,基于所述第二损失值更新所述初始学生模型的网络参数。2.根据权利要求1所述的方法,其特征在于,通过多组所述训练数据训练初始网络模型中包括的多个初始老师模型,得到多个所述目标老师模型包括:重复执行以下操作,直到所述初始网络模型的第一损失值小于第一预定损失值:将每组所述训练数据中包括的训练图像输入至每个所述初始老师模型,以得到每个所述初始老师模型按照不同的采样倍率提取到的所述训练图像的不同层级的第一训练特征;将每个所述初始老师模型提取到的同一层级的所述第一训练特征进行融合,得到不同层级的第二融合特征;基于所述第二融合特征确定所述训练图像的预测检测框的第二位置信息;基于所述第一位置信息以及所述第二位置信息确定所述第一损失值;在所述第一损失值大于第一预定损失值的情况下,更新每个所述初始老师模型的第一网络参数。3.根据权利要求1所述的方法,其特征在于,将不同层级的所述第三融合特征输入至初始学生模型中,以确定相同层级的所述第三融合特征与所述第三训练特征的训练误差包括:确定所述第三融合特征与所述第三训练特征之间的空间注意力误差;
确定所述第三融合特征与所述第三训练特征之间的通道注意力误差;确定所述第三融合特征与所述第三训练特征之间的关联性误差;将所述空间注意力误差、所述通...
【专利技术属性】
技术研发人员:倪华健,安超,杨德城,林亦宁,赵之健,姚唐仁,
申请(专利权)人:杭州闪马智擎科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。