目标检测方法、装置、设备、存储介质及计算机程序产品制造方法及图纸

技术编号:31834301 阅读:11 留言:0更新日期:2022-01-12 13:12
本公开提供了一种目标检测方法、装置、设备、存储介质及计算机程序产品,涉及图像处理技术领域。该方法包括:获取目标图像,其中,目标图像中包含:一个或多个目标物体;基于预先训练好的物体中心热力图模型,确定目标图像中每个目标物体的中心位置;在目标图像中每个目标物体的中心位置处,生成每个目标物体的个体掩膜;以及根据目标图像中每个目标物体的个体掩膜,确定目标图像中每个目标物体的边界框,其中,每个目标物体的边界框为覆盖每个目标物体对应个体掩膜的最小矩形框。本公开能够提高目标检测的准确度。目标检测的准确度。目标检测的准确度。

【技术实现步骤摘要】
目标检测方法、装置、设备、存储介质及计算机程序产品


[0001]本公开涉及图像处理
,尤其涉及一种目标检测方法、装置、设备、存储介质及计算机程序产品。

技术介绍

[0002]目标检测,是计算机视觉领域的基础任务之一,车辆追踪、行人重识别等很多高层任务都需要基于目标检测来实现。目标检测是一种在图像中寻找目标物体(即感兴趣物体),并对其进行类别预测与位置定位的技术。目标检测通常涉及分类与定位两个任务,其中,分类任务基本采用深度卷积神经网络来实现,定位任务则使用回归方法来预测图像中目标物体的边界框(即包含目标物体的最小矩形框)。
[0003]回归方法对连续变量的预测十分有效,但其十分依赖于深度神经网络的拟合能力,缺少与物体空间对齐的特征学习,而图像中目标物体的定位,与物体的空间特征信息高度相关,因此,相关技术中使用回归方法对物体进行定位的目标检测器,忽略了物体的空间特征信息,导致检测准确度比较低下。
[0004]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]本公开提供一种目标检测方法、装置、设备、存储介质及计算机程序产品,至少在一定程度上克服相关技术中提供的目标检测方法存在检测准确度比较低下的技术问题。
[0006]本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
[0007]根据本公开的一个方面,提供一种目标检测方法,包括:获取目标图像,其中,目标图像中包含:一个或多个目标物体;基于预先训练好的物体中心热力图模型,确定目标图像中每个目标物体的中心位置;在目标图像中每个目标物体的中心位置处,生成每个目标物体的个体掩膜;以及根据目标图像中每个目标物体的个体掩膜,确定目标图像中每个目标物体的边界框,其中,每个目标物体的边界框为覆盖每个目标物体对应个体掩膜的最小矩形框。
[0008]在本公开的一个实施例中,上述物体中心热力图模型为特征金字塔网络模型,基于预先训练好的物体中心热力图模型,确定目标图像中每个目标物体的中心位置具体包括:将目标图像输入至预先训练好的特征金字塔网络模型中,输出每个特征层的物体中心热力图,其中,每个特征层的物体中心热力图对应不同分辨率的目标图像;根据每个特征层对应的物体中心热力图,确定一个或多个目标物体的候选位置;将各个目标物体的候选位置映射至原始分辨率的目标图像中,得到目标图像中各个目标物体的中心位置。
[0009]在本公开的一个实施例中,在目标图像中每个目标物体的中心位置处,生成每个目标物体的个体掩膜,包括:在目标图像中每个目标物体的中心位置处,提取每个目标物体
的个体特征;将每个目标物体的个体特征,与目标图像中每个像素点的像素特征进行相似度计算,得到每个像素点与每个目标物体的相似度;根据每个像素点与每个目标物体的相似度,在目标图像中生成每个目标物体的个体掩膜。
[0010]在本公开的一个实施例中,将每个目标物体的个体特征,与目标图像中每个像素点的像素特征进行相似度计算,得到每个像素点与每个目标物体的相似度,包括:将每个目标物体的个体特征,分离成第一通道特征、第二通道特征和第三通道特征;根据每个目标物体的第一通道特征和第二通道特征,将每个像素点的像素特征转换到每个目标物体的隐空间中,得到每个像素点转换后的像素特征;将每个目标物体的第三通道特征与每个像素点转换后的像素特征进行相似度计算,得到每个像素点与每个目标物体的相似度。
[0011]在本公开的一个实施例中,在将每个目标物体的个体特征,与目标图像中每个像素点的像素特征进行相似度计算,得到每个像素点与每个目标物体的相似度之前,方法还包括:获取目标图像的特征图;从目标图像的特征图中提取每个像素点的像素特征。
[0012]在本公开的一个实施例中,根据目标图像中每个目标物体的个体掩膜,确定目标图像中每个目标物体的边界框,包括:使用双线性插值方法,对每个目标物体的个体掩膜进行向上采样,将每个目标物体的个体掩膜放大到输入图像的分辨率,得到每个目标物体的二维掩膜图;对每个目标物体的二维掩膜图,分别沿水平方向和垂直方向进行最大池化处理,得到每个目标物体的水平掩膜图和垂直掩膜图;对每个目标物体的水平掩膜图和垂直掩膜图进行一阶差分处理,得到每个目标物体的差分图,其中,差分图用于表征每个像素点属于各个目标物体边界的概率;根据每个像素点的坐标位置以及每个像素点属于各个目标物体的概率,确定每个目标物体的边界框。
[0013]在本公开的一个实施例中,根据每个像素点的坐标位置以及每个像素点属于各个目标物体的概率,确定每个目标物体的边界框,包括:以每个目标物体的中心位置为中心,获取每个目标物体中心位置上下左右四个方向上预设数量的像素点的坐标位置;根据每个像素点属于各个目标物体的概率,对每个目标物体中心位置上下左右四个方向上预设数量的像素点的坐标位置进行加权求和,得到每个目标物体边界框四个顶点的坐标位置;根据每个目标物体边界框四个顶点的坐标位置,确定每个目标物体的边界框。
[0014]根据本公开的另一个方面,还提供了一种目标检测装置,包括:图像获取模块,用于获取目标图像,其中,目标图像中包含:一个或多个目标物体;物体中心位置预测模块,用于基于预先训练好的物体中心热力图模型,确定目标图像中每个目标物体的中心位置;个体掩膜生成模块,用于在目标图像中每个目标物体的中心位置处,生成每个目标物体的个体掩膜;和物体边界框确定模块,用于根据目标图像中每个目标物体的个体掩膜,确定目标图像中每个目标物体的边界框,其中,每个目标物体的边界框为覆盖每个目标物体对应个体掩膜的最小矩形框。
[0015]根据本公开的另一个方面,还提供了一种电子设备,包括:处理器;以及存储器,用于存储处理器的可执行指令;其中,处理器配置为经由执行可执行指令来执行上述任意一项的目标检测方法。
[0016]根据本公开的另一个方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任意一项的目标检测方法。
[0017]根据本公开的另一个方面,还提供了一种计算机程序产品或计算机程序,该计算
机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行任意一项的目标检测方法。
[0018]本公开的实施例所提供的目标检测方法、装置、电子设备及计算机可读存储介质,利用预先训练好的物体中心热力图模型,对图像中各个物体的中心位置进行预测,在预测得到各个物体的中心位置后,在各个物体的中心位置处生成各个物体的个体掩膜,进而将覆盖每个物体对应个体掩膜的最小矩形框确定为每个物体的边界框。本公开实施例中,由于个体掩膜保留了像素级的物体边界信息,能够获得更加准确的物体边界框,从而有助于目标检测准确度的提高。
[0019]应当理解本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标检测方法,其特征在于,包括:获取目标图像,其中,所述目标图像中包含:一个或多个目标物体;基于预先训练好的物体中心热力图模型,确定所述目标图像中每个目标物体的中心位置;在所述目标图像中每个目标物体的中心位置处,生成每个目标物体的个体掩膜;以及根据所述目标图像中每个目标物体的个体掩膜,确定所述目标图像中每个目标物体的边界框,其中,每个目标物体的边界框为覆盖每个目标物体对应个体掩膜的最小矩形框。2.根据权利要求1所述的目标检测方法,其特征在于,所述物体中心热力图模型为特征金字塔网络模型;所述基于预先训练好的物体中心热力图模型确定所述目标图像中每个目标物体的中心位置包括:将所述目标图像输入至预先训练好的特征金字塔网络模型中,输出每个特征层的物体中心热力图,其中,每个特征层的物体中心热力图对应不同分辨率的目标图像;根据每个特征层对应的物体中心热力图,确定一个或多个目标物体的候选位置;将各个目标物体的候选位置映射至原始分辨率的目标图像中,得到所述目标图像中各个目标物体的中心位置。3.根据权利要求1所述的目标检测方法,其特征在于,在所述目标图像中每个目标物体的中心位置处,生成每个目标物体的个体掩膜,包括:在所述目标图像中每个目标物体的中心位置处,提取每个目标物体的个体特征;将每个目标物体的个体特征,与所述目标图像中每个像素点的像素特征进行相似度计算,得到每个像素点与每个目标物体的相似度;根据每个像素点与每个目标物体的相似度,在所述目标图像中生成每个目标物体的个体掩膜。4.根据权利要求3所述的目标检测方法,其特征在于,将每个目标物体的个体特征,与所述目标图像中每个像素点的像素特征进行相似度计算,得到每个像素点与每个目标物体的相似度,包括:将每个目标物体的个体特征,分离成第一通道特征、第二通道特征和第三通道特征;根据每个目标物体的第一通道特征和第二通道特征,将每个像素点的像素特征转换到每个目标物体的隐空间中,得到每个像素点转换后的像素特征;将每个目标物体的第三通道特征与每个像素点转换后的像素特征进行相似度计算,得到每个像素点与每个目标物体的相似度。5.根据权利要求1至4任一项所述的目标检测方法,其特征在于,根据所述目标图像中每个目标物体的个体掩膜,确定所述目标图像中每个目标物体的边界框,包括:使用双线性插值方法,对每...

【专利技术属性】
技术研发人员:厉吉华王晓莲蒋鹏李一霖
申请(专利权)人:北京多维视通技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1