一种在图像中实现多形状目标检测的方法及系统技术方案

技术编号:34751505 阅读:17 留言:0更新日期:2022-08-31 18:47
本发明专利技术公开了一种在图像中实现多形状目标检测的方法及系统,涉及目标检测技术领域,解决了现有非极大值抑制方法存在的耗时长、效率低的技术问题。本发明专利技术包括如下步骤:S10、确定第一阈值、第二阈值;S20、将待目标检测的图片输入目标检测模型,得到模型输出的候选框集合;S30、为每个候选框建立最小外接正矩形,存入候选框集合中;S40、通过第一阈值、第二阈值以及候选框对应的最小外接正矩形对候选框进行去重,得到去重后的候选框。本发明专利技术通过建立多边形候选框的最小外接正矩形来对候选框进行去重,排除了大量重叠程度不高的候选框,避免了许多冗余的计算,耗时小、效率高。效率高。效率高。

【技术实现步骤摘要】
一种在图像中实现多形状目标检测的方法及系统


[0001]本专利技术涉及目标检测
,尤其涉及一种在图像中实现多形状目标检测的方法及系统。

技术介绍

[0002]在目标检测中,需要对图像中的目标进行分割与识别,如香烟陈列图像中对不同目标对象香烟的识别,不同现实场景中对人体的识别等,使用深度学习进行目标检测是图像识别中至关重要的步骤。目标检测通常在同一目标的位置上会产生大量的候选框,这些候选框相互之间可能会有重叠,而且目标框会出现倾斜等不标准的情况,此时我们需要利用非极大值抑制找到最佳的目标边界框,消除冗余的边界框。
[0003]一般的非极大值抑制方法都是针对边界框为正矩形进行设计的,核心操作是通过计算任意两两边界框之间的IoU(Intersection over Union,即两个边界框的交集部分除以它们的并集),将重合程度超过一定阈值的边界框进行去除。由于计算正矩形IoU十分简单,所有整个处理过程耗时较短(毫秒级别),但是应用到多边形的时候,由于计算多边形IoU复杂度是正矩形IoU的上千倍,因而会导致整体耗时明显增多,超出可接受的范围(秒级别)。
[0004]一般的非极大值抑制方法流程为:(1) 将所有边界框按照置信度进行降序排列。
[0005](2) 选择置信度最高的边界框添加到最终输出列表中,将其从边界框列表中删除。
[0006](3) 逐个计算置信度最高的边界框与其它边界框的IoU,删除IoU大于阈值的边界框。
[0007]重复上述步骤,直至边界框列表为空。
[0008]上述方法计算耗时主要集中在步骤(3),因此,本专利技术针对多边形非极大值抑制提出了一种高效的处理方法。

技术实现思路

[0009]本专利技术要解决的技术问题在于,针对现有技术的上述缺陷,提供一种在图像中实现多形状目标检测的方法及系统。
[0010]本专利技术解决其技术问题所采用的技术方案是:根据本专利技术的一方面,提供一种在图像中实现多形状目标检测的方法,其特征在于,包括以下步骤:S10、确定第一阈值、第二阈值;S20、将待目标检测的图片输入目标检测模型,得到模型输出的候选框集合;所述候选框集合中的所有候选框为多边形;S30、为每个所述候选框构建最小外接正矩形,存入所述候选框集合中;S40、通过所述第一阈值、第二阈值以及所述候选框对应的所述最小外接正矩形对
所述候选框进行去重,得到去重后的候选框;对去重后的所述候选框进行输出。
[0011]进一步地,步骤S10中,所述第一阈值U1的计算公式为:U1=Ratio
×
Threshold;其中,Threshold为指定的多边形的IOU值,Ratio为筛选比例;所述第二阈值U2计算公式为:U2=Threshold。
[0012]进一步地,所述筛选比例Ratio的确定步骤如下:S100、准备目标场景的测试数据集合,初始化一个空集合Ratio_list以及预期准确率d;S101、使用所述目标检测模型对所述测试数据集中的图片进行推理,得到模型输出的多边形框集合;S102、对所述多边形框集合中每一个多边形框建立最小外接正矩形;S103、分别计算两两所述多边形框的IOU值Iou1以及两两所述多边形框对应的两个最小外接正矩形的IOU值Iou2;S104、依次判断Iou1是否为零;每次Iou1不为零时,计算Iou1/ Iou2的比值,并将计算的Iou1/ Iou2的比值放入所述空集合Ratio_list中;S105、统计所述空集合Ratio_list的元素个数m,将所述空集合Ratio_list的元素进行降序排列;从排列后的所述空集合Ratio_list由前往后数,第n位对应的Iou1/ Iou2的比值即为Ratio。
[0013]进一步地,n的计算公式为:n=round(m
×
d);其中,round为四舍五入函数,d的取值范围为0

1。
[0014]进一步地,步骤S40包括如下步骤:S400、初始化一个空列表keep;所述空列表keep用于保存去除重复框后的所述候选框;S401、从所述候选框集合中选择置信度最高的所述候选框作为当前框,将其移入所述空列表;S402、依次计算剩余所述候选框的最小外接正矩形与所述当前框的最小外接正矩形的IOU值Iou3;S403、Iou3是否大于或等于所述第一阈值;如是,执行步骤S404;否则,执行步骤S407;S404、计算大于或等于第一阈值对应的所述候选框与所述当前框的IOU值Iou4;S405、Iou4是否大于或等于所述第二阈值;如是,执行步骤S406;否则,执行步骤S407;S406、将与所述当前框计算的IOU值Iou4大于或等于所述第二阈值的其他所述候选框从所述候选框集合中删除;S407、所述候选框集合是否为空集合;如是,执行步骤S408;否则,返回S401;S408、所述空列表keep保存的所述候选框即为去除重复框后的所述候选框,输出所述空列表keep中的所述候选框。
[0015]进一步地,IOU值Iou的计算公式如下:Iou=area0/(area1+ area2
‑ꢀ
area0);其中,area0为2个所述候选框重合部分的面积,area1为其中一个所述候选框的面积,area2为另一个所述候选框的面积;或,area0为2个所述候选框的最小外接正矩形重合部分的面积,area1为其中一个所述候选框的最小外接正矩形的面积,area2为另一个所述候选框的最小外接正矩形的面积。
[0016]进一步地,步骤S30中,每个所述候选框按照如下步骤构建其最小外接正矩形:S300、获取所述候选框的顶点坐标中X轴的最小值Xmin与最大值Xmax;S301、获取所述候选框的顶点坐标中Y轴的最小值Ymin与最大值Ymax;S302、建立坐标点(Xmin,Ymin)、(Xmax,Ymin)、(Xmax,Ymax)、(Xmin,Ymax),将建立坐标点依次连接形成所述候选框的最小外接正矩形。
[0017]进一步地,所述目标检测模型为yolo、faster

rcnn或centerNet。
[0018]根据本专利技术的另一方面,还提供了一种在图像中实现多形状目标检测的系统,包括计算机可读的存储介质,所述存储介质上存储有计算机程序,所述计算机程序被执行时实现上文所述的在图像中实现多形状目标检测的方法。
[0019]进一步地,在图像中实现多形状目标检测的系统还包括处理器以及输出终端;所述处理器与所述存储介质连接,用于执行所述存储介质存储的计算机程序,以使所述处理器执行如上文所述的一种在图像中实现多形状目标检测的方法;所述输出终端与所述处理器连接,用于将采用如上文所述的一种在图像中实现多形状目标检测的方法去重后的候选框进行输出。
[0020]实施本专利技术在图像中实现多形状目标检测方法及系统的技术方案,具有如下优点或有益效果:(1)本专利技术在多边形候选框的IOU值之前通过候选框的最小外接正矩形的IOU值进行一次过滤,排除本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种在图像中实现多形状目标检测的方法,其特征在于,包括以下步骤:S10、确定第一阈值、第二阈值;S20、将待目标检测的图片输入目标检测模型,得到模型输出的候选框集合;所述候选框集合中的所有候选框为多边形;S30、为每个所述候选框构建最小外接正矩形,存入所述候选框集合中;S40、通过所述第一阈值、第二阈值以及所述候选框对应的所述最小外接正矩形对所述候选框进行去重,得到去重后的候选框;对去重后的所述候选框进行输出。2.根据权利要求1所述的一种在图像中实现多形状目标检测的方法,其特征在于,步骤S10中,所述第一阈值U1的计算公式为:U1=Ratio
×
Threshold;其中,Threshold为指定的多边形的IOU值,Ratio为筛选比例;所述第二阈值U2计算公式为:U2=Threshold。3.根据权利要求2所述的一种在图像中实现多形状目标检测的方法,其特征在于,所述筛选比例Ratio的确定步骤如下:S100、准备目标场景的测试数据集合,初始化一个空集合Ratio_list以及预期准确率d;S101、使用所述目标检测模型对所述测试数据集中的图片进行推理,得到模型输出的多边形框集合;S102、对所述多边形框集合中每一个多边形框建立最小外接正矩形;S103、分别计算两两所述多边形框的IOU值Iou1以及两两所述多边形框对应的两个最小外接正矩形的IOU值Iou2;S104、依次判断Iou1是否为零;每次Iou1不为零时,计算Iou1/ Iou2的比值,并将计算的Iou1/ Iou2的比值放入所述空集合Ratio_list中;S105、统计所述空集合Ratio_list的元素个数m,将所述空集合Ratio_list的元素进行降序排列;从排列后的所述空集合Ratio_list由前往后数,第n位对应的Iou1/ Iou2的比值即为Ratio。4.根据权利要求3所述的一种在图像中实现多形状目标检测的方法,其特征在于,n的计算公式为:n=round(m
×
d);其中,round为四舍五入函数,d的取值范围为0

1。5.根据权利要求1所述的一种在图像中实现多形状目标检测的方法,其特征在于,步骤S40包括如下步骤:S400、初始化一个空列表keep;所述空列表keep用于保存去除重复框后的所述候选框;S401、从所述候选框集合中选择置信度最高的所述候选框作为当前框,将其移入所述空列表;S402、依次计算剩余所述候选框的最小外接正矩形与所述当前框的最小外接正矩形的IOU值Iou3;S403、Iou3是否大于或等于所述第一阈值;如是,执行步骤S404;否则,执行步骤S407;<...

【专利技术属性】
技术研发人员:龙涛杨恒阮仕海赵月月
申请(专利权)人:深圳爱莫科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1