一种目标检测的优化方法及设备技术

技术编号:30770056 阅读:104 留言:0更新日期:2021-11-10 12:37
本公开公开了一种目标检测的优化方法及设备,用于在提高目标检测准确度的同时避免引入更多的模型参数,从而保证目标检测的速度不降低。该方法包括:将包含对象的图像输入到训练好的目标检测模型进行检测,确定所述对象在所述图像中的坐标以及所述对象的类别;其中,所述目标检测模型包含多个深度卷积的网络层,所述目标检测模型是利用第一训练样本集进行训练得到待优化模型后,利用最优剪枝方案对所述待优化模型中的模型参数进行修剪处理,利用第二训练样本集对修剪处理后的待优化模型进行训练得到的,其中所述最优剪枝方案是从不同的剪枝方法和剪枝率确定的各个剪枝方案中筛选得到的。选得到的。选得到的。

【技术实现步骤摘要】
一种目标检测的优化方法及设备


[0001]本公开涉及目标检测
,特别涉及一种目标检测的优化方法及设备。

技术介绍

[0002]目标检测是图像处理和计算机视觉学科的重要分支,也是智能监控系统的核心部分,同时目标检测也是身份识别领域基础性的算法,对后续的人脸识别、步态识别、人群计数等任务起着至关重要的作用。
[0003]目标检测具体是指找出图像中所有感兴趣的物体,包括物体定位和物体分类两个子任务,能够同时确定物体的类别和位置。目标检测模型的主要性能指标是检测准确度和速度,其中准确度主要考虑物体的定位以及分类准确度。
[0004]传统的目标检测模型为了提高检测速度,通常采用轻量网络进行检测,但是轻量网络为了保证检测速度通常设置较少的模型参数,而模型参数少便意味着检测准确度降低,无法解决在提高准确度的同时避免引入更多的模型参数的问题。

技术实现思路

[0005]本公开提供一种目标检测的优化方法及设备,用于在提高目标检测准确度的同时避免引入更多的模型参数,从而保证目标检测的速度不降低。
[0006]第一方面,本公开实施例提供的一种目标检测的优化方法,包括:
[0007]将包含对象的图像输入到训练好的目标检测模型进行检测,确定所述对象在所述图像中的坐标以及所述对象的类别;
[0008]其中,所述目标检测模型包含多个深度卷积的网络层,所述目标检测模型是利用第一训练样本集进行训练得到待优化模型后,利用最优剪枝方案对所述待优化模型中的模型参数进行修剪处理,利用第二训练样本集对修剪处理后的待优化模型进行训练得到的,其中所述最优剪枝方案是从不同的剪枝方法和剪枝率确定的各个剪枝方案中筛选得到的。
[0009]本实施例提供的目标检测模型,通过多个深度卷积的网络层编码图像更多的空间信息,提高目标检测模型的准确度,同时,通过多个剪枝方案对目标检测模型中的模型参数进行修剪处理,大幅降低目标检测模型的模型参数,提高目标检测模型的速度。
[0010]作为一种可选的实施方式,所述将包含对象的图像输入到训练好的目标检测模型进行检测之前,还包括:
[0011]对获取的包含对象的视频流进行解码,得到三通道RGB格式的包含对象的各帧图像;或,
[0012]对获取的包含对象的未处理图像进行格式转换,得到RGB格式的包含对象的图像。
[0013]作为一种可选的实施方式,所述将包含对象的图像输入到训练好的目标检测模型进行检测之前,还包括:
[0014]在保证所述图像的原始比例不变的条件下,对所述图像的尺寸进行归一化处理,得到预设尺寸的图像。
[0015]作为一种可选的实施方式,所述将包含对象的图像输入到训练好的目标检测模型进行检测,确定所述对象在所述图像中的坐标以及所述对象的类别,包括:
[0016]将包含对象的图像输入到训练好的目标检测模型进行检测,得到所述图像中所述对象的各个候选框的坐标以及各个所述候选框对应的类别的置信度;
[0017]从各个所述候选框中筛选出置信度大于阈值的各个优选候选框;
[0018]根据所述各个优选候选框的坐标确定所述对象在所述图像中的坐标,根据所述各个优选候选框对应的类别确定所述对象的类别。
[0019]作为一种可选的实施方式,所述根据所述各个优选候选框的坐标确定所述对象在所述图像中的坐标,根据所述各个优选候选框对应的类别确定所述对象的类别,包括:
[0020]根据非极大值抑制NMS方法,从所述各个优选候选框中筛选出最优候选框;
[0021]将所述最优候选框的坐标确定为所述对象在所述图像中的坐标,将所述最优候选框对应的类别确定为所述对象的类别。
[0022]作为一种可选的实施方式,若将包含对象的图像的尺寸进行归一化处理后输入到训练好的目标检测模型进行检测,则将所述最优候选框的坐标确定为所述对象在所述图像中的坐标之前,还包括:
[0023]将所述最优候选框的坐标转换到所述归一化处理前的所述图像的坐标系中,将转换后得到的坐标确定为所述最优候选框的坐标。
[0024]作为一种可选的实施方式,所述目标检测模型包括骨干网络、颈网络以及头网络,其中:
[0025]所述骨干网络用于提取所述图像的特征,所述骨干网络包括多个深度卷积的网络层和多个单位卷积的网络层,其中所述深度卷积的网络层对称分布在骨干网络的头部和尾部,所述单位卷积的网络层分布在所述骨干网络的中部;
[0026]所述颈网络用于对所述骨干网络提取的特征进行特征融合,得到融合的特征图;
[0027]所述头网络用于对所述融合的特征图中的对象进行检测,得到所述对象在所述图像中的坐标以及所述对象的类别。
[0028]作为一种可选的实施方式,所述第二训练样本集中训练样本的数据量小于第一训练样本集中训练样本的数据量。
[0029]作为一种可选的实施方式,所述剪枝方法包括块剪枝、结构化剪枝、非结构化剪枝中的至少一种。
[0030]作为一种可选的实施方式,所述利用最优剪枝方案对所述待优化模型中的模型参数进行修剪处理,包括:
[0031]利用所述最优剪枝方案,对所述待优化模型中的至少一个网络层对应的模型参数进行修剪处理。
[0032]作为一种可选的实施方式,通过如下方式确定所述最优剪枝方案:
[0033]基于不同的剪枝方法和剪枝率,确定各个剪枝方案;
[0034]根据贝叶斯优化对各个剪枝方案对应的待优化模型的性能分别进行评估,得到各个待优化模型的评估性能;
[0035]从各个评估性能中确定最优评估性能对应的最优剪枝方案。
[0036]作为一种可选的实施方式,所述根据贝叶斯优化对各个剪枝方案对应的待优化模
型的性能分别进行评估,得到各个待优化模型的评估性能,包括:
[0037]根据贝叶斯优化对各个剪枝方案分别对应的待优化模型的性能进行初始评估,得到各个待优化模型的初始评估性能;
[0038]按预设迭代次数,根据所述待优化模型服从的高斯过程的均值的梯度对性能的影响程度,对各个剪枝方案进行筛选,并对筛选后的各个剪枝方案对应的待优化模型的性能进行重新评估;
[0039]根据最后一次迭代完成后得到的各个剪枝方案对应的评估性能,确定各个待优化模型的评估性能。
[0040]作为一种可选的实施方式,所述根据所述待优化模型服从的高斯过程的均值的梯度对性能的影响程度,对各个剪枝方案进行筛选,包括:
[0041]将所述梯度变换为梯度概率;
[0042]通过将梯度概率大于第一阈值的待优化模型的剪枝方案,替换为梯度概率小于第二阈值的待优化模型的剪枝方案,对各个剪枝方案进行筛选,其中所述第一阈值大于所述第二阈值。
[0043]作为一种可选的实施方式,还包括:
[0044]确定所述目标检测模型中各个网络层的计算量;
[0045]利用图形处理器GPU处理所述计算量高于数据阈值的网络层的数据,利用中央处理器CPU处理本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种优化的目标检测方法,其中,该方法包括:将包含对象的图像输入到训练好的目标检测模型进行检测,确定所述对象在所述图像中的坐标以及所述对象的类别;其中,所述目标检测模型包含多个深度卷积的网络层,所述目标检测模型是利用第一训练样本集进行训练得到待优化模型后,利用最优剪枝方案对所述待优化模型中的模型参数进行修剪处理,利用第二训练样本集对修剪处理后的待优化模型进行训练得到的,其中所述最优剪枝方案是从不同的剪枝方法和剪枝率确定的各个剪枝方案中筛选得到的。2.根据权利要求1所述的方法,其中,所述将包含对象的图像输入到训练好的目标检测模型进行检测之前,还包括:对获取的包含对象的视频流进行解码,得到三通道RGB格式的包含对象的各帧图像;或,对获取的包含对象的未处理图像进行格式转换,得到RGB格式的包含对象的图像。3.根据权利要求1所述的方法,其中,所述将包含对象的图像输入到训练好的目标检测模型进行检测之前,还包括:在保证所述图像的原始比例不变的条件下,对所述图像的尺寸进行归一化处理,得到预设尺寸的图像。4.根据权利要求1所述的方法,其中,所述将包含对象的图像输入到训练好的目标检测模型进行检测,确定所述对象在所述图像中的坐标以及所述对象的类别,包括:将包含对象的图像输入到训练好的目标检测模型进行检测,得到所述图像中所述对象的各个候选框的坐标以及各个所述候选框对应的类别的置信度;从各个所述候选框中筛选出置信度大于阈值的各个优选候选框;根据所述各个优选候选框的坐标确定所述对象在所述图像中的坐标,根据所述各个优选候选框对应的类别确定所述对象的类别。5.根据权利要求4所述的方法,其中,所述根据所述各个优选候选框的坐标确定所述对象在所述图像中的坐标,根据所述各个优选候选框对应的类别确定所述对象的类别,包括:根据非极大值抑制NMS方法,从所述各个优选候选框中筛选出最优候选框;将所述最优候选框的坐标确定为所述对象在所述图像中的坐标,将所述最优候选框对应的类别确定为所述对象的类别。6.根据权利要求5所述的方法,其中,若将包含对象的图像的尺寸进行归一化处理后输入到训练好的目标检测模型进行检测,则将所述最优候选框的坐标确定为所述对象在所述图像中的坐标之前,还包括:将所述最优候选框的坐标转换到所述归一化处理前的所述图像的坐标系中,将转换后得到的坐标确定为所述最优候选框的坐标。7.根据权利要求1~6任一所述的方法,其中,所述目标检测模型包括骨干网络、颈网络以及头网络,其中:所述骨干网络用于提取所述图像的特征,所述骨干网络包括多个深度卷积的网络层和多个单位卷积的网络层,其中所述深度卷积的网络层对称分布在骨干网络的头部和尾部,所述单位卷积的网络层分布在所述骨干网络的中部;所述颈网络用于对所述骨干网络提取的特征进行特征融合,得到融合的特征图;
所述头网络用于对所述融合的特征图中的对象进行检测,得到所述对象在所述图像中的坐标以及所述对象的类别。8.根据权利要求1所述的方法,其中,所述第二训练样本集中训练样本的数据量小于第一训练样本集中训练样本的数据量。9.根据权利要求1所述...

【专利技术属性】
技术研发人员:祖春山胡伟阳
申请(专利权)人:京东方科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1