基于动态阈值的目标检测方法、装置、设备及存储介质制造方法及图纸

技术编号:37251778 阅读:15 留言:0更新日期:2023-04-20 23:29
本申请提供一种基于动态阈值的目标检测方法、装置、设备及存储介质。该方法包括:将待检测图像输入到目标检测网络中,利用目标检测网络的主干网络对待检测图像进行处理得到第一特征图;将第一特征图输入预定的动态阈值预测分支,利用动态阈值预测分支融合分类分支与回归分支的信息,对待检测图像的预测框对应的动态阈值进行预测;基于动态阈值对预测框进行排序,并按照排序结果进行遍历,当后续预测框与当前预测框的交并比高于后续预测框的动态阈值时,将后续预测框去除,将遍历后剩余的预测框作为目标检测结果。本申请可以动态调节非极大抑制的阈值,避免目标出现漏检,提高目标检测的准确性。检测的准确性。检测的准确性。

【技术实现步骤摘要】
基于动态阈值的目标检测方法、装置、设备及存储介质


[0001]本申请涉及计算机
,尤其涉及一种基于动态阈值的目标检测方法、装置、设备及存储介质。

技术介绍

[0002]非极大抑制(NMS)是主流多目标检测算法的通用后处理技术。一般地,基于深度学习的目标检测网络,会在图像上密集输出许多检测框及其分数。非极大抑制技术会基于分数对检测框排序,根据检测框之间的交并比,剔除同一个目标上的重叠检测框,使一个目标保留一个得分最高的检测框,以此来降低预测的重叠。
[0003]现有的目标检测算法中,无论使用NMS还是改进后的soft

NMS,NMS的阈值都是固定的,这将会导致图像中实际重叠的目标发生漏检测的问题,即现有的目标检测算法中的NMS技术容易导致目标漏检,且对于密集场景和遮挡场景存在检测不准确的问题。

技术实现思路

[0004]有鉴于此,本申请实施例提供了一种基于动态阈值的目标检测方法、装置、设备及存储介质,以解决现有技术存在的目标存在漏检,且对于密集场景和遮挡场景存在检测不准确的问题。
[0005]本申请实施例的第一方面,提供了一种基于动态阈值的目标检测方法,包括:将待检测图像输入到目标检测网络中,利用目标检测网络的主干网络对待检测图像进行处理得到第一特征图;将第一特征图输入预定的动态阈值预测分支,利用动态阈值预测分支融合分类分支与回归分支的信息,对待检测图像的预测框对应的动态阈值进行预测;基于动态阈值对预测框进行排序,并按照排序结果进行遍历,当后续预测框与当前预测框的交并比高于后续预测框的动态阈值时,将后续预测框去除,将遍历后剩余的预测框作为目标检测结果。
[0006]本申请实施例的第二方面,提供了一种基于动态阈值的目标检测装置,包括:输入模块,被配置为将待检测图像输入到目标检测网络中,利用目标检测网络的主干网络对待检测图像进行处理得到第一特征图;预测模块,被配置为将第一特征图输入预定的动态阈值预测分支,利用动态阈值预测分支融合分类分支与回归分支的信息,对待检测图像的预测框对应的动态阈值进行预测;遍历模块,被配置为基于动态阈值对预测框进行排序,并按照排序结果进行遍历,当后续预测框与当前预测框的交并比高于后续预测框的动态阈值时,将后续预测框去除,将遍历后剩余的预测框作为目标检测结果。
[0007]本申请实施例的第三方面,提供了一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现上述方法的步骤。
[0008]本申请实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
[0009]本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
[0010]通过将待检测图像输入到目标检测网络中,利用目标检测网络的主干网络对待检测图像进行处理得到第一特征图;将第一特征图输入预定的动态阈值预测分支,利用动态阈值预测分支融合分类分支与回归分支的信息,对待检测图像的预测框对应的动态阈值进行预测;基于动态阈值对预测框进行排序,并按照排序结果进行遍历,当后续预测框与当前预测框的交并比高于后续预测框的动态阈值时,将后续预测框去除,将遍历后剩余的预测框作为目标检测结果。本申请可以动态调节非极大抑制的阈值,能够从根本上解决密集场景和遮挡场景存在的目标漏检测以及检测不准确的问题。
附图说明
[0011]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0012]图1是本申请实施例提供的基于动态阈值的目标检测方法的流程示意图;
[0013]图2是本申请实施例提供的动态阈值预测分支的结构示意图;
[0014]图3是本申请实施例提供的基于动态阈值的目标检测装置的结构示意图;
[0015]图4是本申请实施例提供的电子设备的结构示意图。
具体实施方式
[0016]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
[0017]如
技术介绍
所述内容,非极大抑制(NMS)是主流多目标检测算法的通用后处理技术。一般地,基于深度学习的目标检测网络,会在图像上密集输出许多检测框及其分数。非极大抑制技术会基于分数对检测框排序,根据检测框之间的交并比,剔除同一个目标上的重叠检测框,使一个目标保留一个得分最高的检测框,以此来降低预测的重叠。
[0018]然而,现有的非极大抑制算法的问题在于采取一刀切的阈值(固定阈值),这将会导致图像中实际重叠的目标发生漏检测的问题,比如使用固定阈值0.5,即将所有交并比大于0.5的检测框都去掉,那么实际场景如果真实出现交并比大于0.5的情况,就会发生错误。因此,现有的目标检测算法中的非极大抑制处理技术容易导致目标漏检,且对于密集场景和遮挡场景存在检测不准确的问题。
[0019]有鉴于此,本申请实施例为解决上述问题,提供了一种基于动态阈值的目标检测方法,本申请通过在目标检测网络的检测过程中,使用动态阈值预测分支来融合分类分支与回归分支的信息,对待检测图像的预测框的动态阈值进行预测,并根据预测框的动态阈值进行非极大抑制处理。另外,本申请提出的网络架构和伪标签计算技术,来保证动态阈值的可训练化,实现动态化的阈值调整,可以根据图片局部密集信息来动态调节阈值,解决密集场景和遮挡场景的漏检问题。
[0020]下面结合附图以及具体实施例对本申请技术方案的内容进行详细描述。
[0021]图1是本申请实施例提供的基于动态阈值的目标检测方法的流程示意图。图1的基于动态阈值的目标检测方法可以由服务器执行。如图1所示,该基于动态阈值的目标检测方法具体可以包括:
[0022]S101,将待检测图像输入到目标检测网络中,利用目标检测网络的主干网络对待检测图像进行处理得到第一特征图;
[0023]S102,将第一特征图输入预定的动态阈值预测分支,利用动态阈值预测分支融合分类分支与回归分支的信息,对待检测图像的预测框对应的动态阈值进行预测;
[0024]S103,基于动态阈值对预测框进行排序,并按照排序结果进行遍历,当后续预测框与当前预测框的交并比高于后续预测框的动态阈值时,将后续预测框去除,将遍历后剩余的预测框作为目标检测结果。
[0025]具体地,本申请的目标检测网络可以是基于主流的目标检测网络进行改进后的神经网络,目前主流的目标检测网络中一般包含主干网络和检测头,检测头包括分类分支和回归分支,本申请通过增加动态阈值预测本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于动态阈值的目标检测方法,其特征在于,包括:将待检测图像输入到目标检测网络中,利用所述目标检测网络的主干网络对所述待检测图像进行处理得到第一特征图;将所述第一特征图输入预定的动态阈值预测分支,利用所述动态阈值预测分支融合分类分支与回归分支的信息,对所述待检测图像的预测框对应的动态阈值进行预测;基于所述动态阈值对所述预测框进行排序,并按照排序结果进行遍历,当后续预测框与当前预测框的交并比高于所述后续预测框的动态阈值时,将所述后续预测框去除,将遍历后剩余的预测框作为目标检测结果。2.根据权利要求1所述的方法,其特征在于,所述利用所述动态阈值预测分支融合分类分支与回归分支的信息,对所述待检测图像的预测框对应的动态阈值进行预测,包括:将所述第一特征图与所述分类分支输出的特征图进行融合,经过卷积处理后得到第二特征图,以及直接对所述第一特征图进行卷积处理,得到第三特征图;将所述第二特征图与所述第三特征图进行堆叠,并经过卷积处理后得到第四特征图;将所述第四特征图与所述回归分支输出的特征图进行融合,经过卷积处理后得到第五特征图,以及直接对所述第四特征图进行卷积处理,得到第六特征图;将所述第五特征图与所述第六特征图进行堆叠,并经过卷积处理后得到第七特征图;将所述第七特征图进行卷积处理,得到所述待检测图像中每个预测框对应的动态阈值。3.根据权利要求1所述的方法,其特征在于,所述对所述待检测图像的预测框对应的动态阈值进行预测之后,所述方法还包括:根据预先设置的锚框,确定每个所述锚框对应的第一动态阈值伪标签,并将所述锚框所对应的目标框的最大重叠值作为所述锚框的第二动态阈值伪标签;利用所述动态阈值预测分支对所述锚框的动态阈值进行预测,基于所述第一动态阈值伪标签、所述第二动态阈值伪标签以及所述锚框的动态阈值建立损失函数,利用所述损失函数对所述目标检测网络进行训练。4.根据权利要求3所述的方法,其特征在于,所述根据预先设置的锚框,确定每个所述锚框对应的第一动态阈值伪标签,包括:根据预先设置的所述锚框以及目标框与所述锚框的映射关系,确定每个所述目标框对应的生成池;将训练图像输入到所...

【专利技术属性】
技术研发人员:请求不公布姓名
申请(专利权)人:深圳须弥云图空间科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1