一种基于交并比损失函数的目标检测方法及系统技术方案

技术编号：39714090 阅读：17 留言：0更新日期：2023-12-17 23:22

本发明专利技术提供了一种基于交并比损失函数的目标检测方法及系统，包括：对输入图像提取语义特征；通过图像候选框生成器对提取的语义特征生成目标候选框；将生成的候选框与真值计算交并比；通过最大化交并比的方式用梯度下降法更新网络参数，输出物体准确的检测框

全部详细技术资料下载

【技术实现步骤摘要】
一种基于交并比损失函数的目标检测方法及系统

[0001]本专利技术涉及目标检测领域，具体地，涉及一种基于交并比损失函数的目标检测方法及系统
。

技术介绍

[0002]目标检测是计算机视觉任务中尤为重要的一部分，广泛运用在人脸识别
、
医学图像
、
行人检测
、
自动驾驶等领域
。
主流的目标检测网络可以被分为一阶段目标检测网络和二阶段目标检测网络两个部分
。
其中，一阶段网络不生成候选框，直接通过输入图像得到输出的目标种类和位置
。
二阶段网络首先通过候选框生成网络生成若干数量的候选框，再对候选框进行分类和位置回归，最后通过非极大值抑制算法得到最后的检测框的位置和类别
。
二阶段主流的网络包括
2016
年
Ross Girshick
等提出的
Faster R
‑
CNN
网络，
2018
年
Zhaowei Cai
等提出的级联的
Cascade R
‑
CNN
网络
。
[0003]二阶段目标检测网络主要由特征提取网络
、
候选框生成网络
、
分类和定位网络三个部分组成
。
其中，特征提取网络主要由卷积网络或者
Transformer
网络组成
。2015
年，
K...

【技术保护点】

【技术特征摘要】
1.
一种基于交并比损失函数的目标检测方法，其特征在于，包括：对输入图像提取语义特征；通过图像候选框生成器将所述语义特征生成目标候选框；将所述目标候选框与真值计算交并比；通过最大化所述交并比的方式，用梯度下降法更新网络参数，输出最终的目标候选框
。2.
根据权利要求1所述的一种基于交并比损失函数的目标检测方法，其特征在于，采用深度为
101
的残差网络提取图像的语义特征
。3.
根据权利要求1所述的一种基于交并比损失函数的目标检测方法，其特征在于，所述图像候选框生成器在所述语义特征图的每一个点生成包含多种尺度大小的
、
多种长宽比的多个候选框
。4.
根据权利要求3所述的一种基于交并比损失函数的目标检测方法，其特征在于，所述多种尺度为
1282、2562、5122
，所述多种长宽比为
1:1、1:2、2:1
；
{1282,2562,5122}
×
{1:1,1:2,2:1}
共形成9个候选框
。5.
根据权利要求1所述的一种基于交并比损失函数的目标检测方法，其特征在于，通过计算所有所述候选框与所有真值框的交并比，选择交并比最高的作为对应的真值框
。6.
根据权利要求1所述的一种基于交并比损失函数的目标检测方法，其特征在于，所述通过最大化所述交并比的方式，用梯度下降法更新网络参数，输出最终的目标候选框，包括：构建总损失函数，所述总损失函数为
smooth
L1
损失函数
、
交叉熵损失函数和交并比损失函数的和；最小化所述总损失函数，并通过梯度下降法更新用于提取语义特征和生成目标候选框的网络的权重参数；用更新所述权重参数后的提取语义特征和生成目标候选框的网络作用于待测图像，输出最终目标候选框
。7.
根据权利要求6所述的一种基于交并比损失函数的目标检测方法，其...

【专利技术属性】
技术研发人员：乔宇，张希文，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人