System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 应用扩散检测模型的目标检测方法技术_技高网
当前位置: 首页 > 专利查询>厦门大学专利>正文

应用扩散检测模型的目标检测方法技术

技术编号:41110379 阅读:6 留言:0更新日期:2024-04-25 14:03
本发明专利技术公开一种应用扩散检测模型的目标检测方法,可实现扩散检测模型精度的提升,其包括:1、获取输入图像,通过图像特征提取器提取输入图像的图像特征图;2、获取低维真值框,通过边界框编码器将低维真值框编码,从低维空间映射到高维空间,获取高维真值框;3、根据扩散检测模型添加噪声的规则对高维真值框逐步添加高斯噪声,获取高维噪声框;4、通过边界框解码器将高维噪声框解码,从高维空间映射回编码前的低维空间,获取低维噪声框;5、利用低维噪声框从图像特征提取器提取到的图像特征图中截取RoI特征,将截取的RoI特征与低维噪声框一起输入检测头中并进行回归和分类,预测对应低维真值框的位置和目标类别。

【技术实现步骤摘要】

本专利技术涉及目标检测,特别是指一种应用扩散检测模型的目标检测方法


技术介绍

1、目标检测是计算机视觉领域的重要任务,旨在识别图像中的物体并确定其位置。传统的目标检测算法主要依赖手工特征提取,计算量大且不稳定。随着深度学习的兴起,基于深度学习的目标检测算法逐渐成为研究热点。然而,现有的目标检测算法仍面临一些挑战,如物体的不同外观、形状和姿态,以及光照、遮挡等因素的干扰。目前,扩散模型在图像生成领域取得了显著的效果,通过去噪扩散过程可以将随机噪声逐渐转化为清晰图像。受此启发,将扩散模型应用于目标检测领域成为一种新的尝试。

2、diffusiondet模型初步尝试将扩散模型应用于目标检测任务,将目标检测建模为从噪声框到目标框的去噪扩散过程。具体而言,在训练阶段,目标框从真值框扩散到随机分布,模型学习如何逆转这种向真值框添加噪声的过程;在推理阶段,模型以渐进的方式将一组随机生成的目标框细化为输出结果。尽管diffusiondet模型展现出了卓越的性能,但它忽略了扩散模型通常用于图像生成任务上,图像生成任务中扩散的主体通常是维度较高的图像,而diffusiondet模型中的扩散主体是维度较低的检测框,这使得diffusiondet模型在扩散过程中所能容纳的信息有限,无法充分发挥扩散模型的优势,限制了其性能的进一步提升。此外,diffusiondet模型在检测阶段采用多个检测头简单串联的结构,没有考虑区域相关特征的作用。

3、因此,如何提供一种基于框编码的扩散检测模型,实现扩散检测模型精度的提升,成为一个亟待解决的技术问题。


技术实现思路

1、本专利技术的目的在于提供一种应用扩散检测模型的目标检测方法,解决现有技术中存在的问题,实现扩散检测模型精度的提升。

2、为了达成上述目的,本专利技术的解决方案是:

3、一种应用扩散检测模型的目标检测方法,包括以下步骤:

4、步骤1、获取输入图像,通过图像特征提取器提取输入图像的图像特征图;

5、步骤2、获取低维真值框,通过边界框编码器将低维真值框编码,从低维空间映射到高维空间,获取高维真值框;

6、步骤3、根据扩散检测模型添加噪声的规则对高维真值框逐步添加高斯噪声,获取高维噪声框;

7、步骤4、通过边界框解码器将高维噪声框解码,从高维空间映射回编码前的低维空间,获取低维噪声框;

8、步骤5、利用低维噪声框从图像特征提取器提取到的图像特征图中截取roi特征,将截取的roi特征与低维噪声框一起输入检测头中并进行回归和分类,预测对应低维真值框的位置和目标类别;

9、所述检测头是级联结构,由4个级联的阶段组成,每个阶段接受图像特征图以及噪声框、预测框其一作为输入,并输出预测框,最后一个检测头还输出预测类别;在每个阶段中,首先利用roialign操作为图像特征图/噪声框/预测框提取roi特征,然后基于提取到的roi特征生成预测框;最后一个阶段中提取的roi特征还要额外与其他阶段中提取到的roi特征进行加权融合后再用于预测框回归和分类结果。

10、所述步骤1中,所述图像特征图通过resnet模型或者res2net模型进行提取。

11、所述步骤2还包括,获取低维真值框后,若输入图像的低维真值框数量少于指定值,则通过填充与输入图像尺寸大小相同的框的方式将扩散检测模型的检测框数量填充至指定值。

12、所述步骤2中,所述边界框编码器通过多层感知机进行实现。

13、所述步骤3具体为,根据给定的时间步步长和noise schedule,利用重参数化技巧,采样时间步步长内任意一个时间步的样本。

14、所述步骤4中,所述边界框解码器通过多层感知机进行实现。

15、所述步骤4还包括,推理时先生成与训练时的高维噪声框维度相同的高维随机框,将高维空间的高维随机框通过边界解码器解码到低维空间。

16、采用上述技术方案后,本专利技术具有以下技术效果:

17、本专利技术通过引入边界框编码器和边界框解码器,有助于提升低维真值框扩散过程中捕获信息的能力,加快低维真值框扩散到高斯分布的过程;通过在检测头的最后一个阶段中融合其他阶段的roi特征,有助于合理利用区域相关信息,提升预测准确率。

本文档来自技高网...

【技术保护点】

1.一种应用扩散检测模型的目标检测方法,其特征在于包括以下步骤:

2.如权利要求1所述的应用扩散检测模型的目标检测方法,其特征在于:

3.如权利要求1所述的应用扩散检测模型的目标检测方法,其特征在于:

4.如权利要求1或3所述的应用扩散检测模型的目标检测方法,其特征在于:

5.如权利要求1所述的应用扩散检测模型的目标检测方法,其特征在于:

6.如权利要求1所述的应用扩散检测模型的目标检测方法,其特征在于:

7.如权利要求1或4所述的应用扩散检测模型的目标检测方法,其特征在于:

【技术特征摘要】

1.一种应用扩散检测模型的目标检测方法,其特征在于包括以下步骤:

2.如权利要求1所述的应用扩散检测模型的目标检测方法,其特征在于:

3.如权利要求1所述的应用扩散检测模型的目标检测方法,其特征在于:

4.如权利要求1或3所述的应用扩散检测...

【专利技术属性】
技术研发人员:曹刘娟罗耀钦
申请(专利权)人:厦门大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1