一种面向开放场景的目标检测方法和系统技术方案

技术编号：40913330 阅读：26 留言：0更新日期：2024-04-18 14:41

本发明专利技术提出了一种面向开放场景的目标检测方法和系统，对图像进行编码和解码，得到图像中物体的位置信息和类别信息，所述位置信息包含物体的边界框，根据边界框内物体的特征值得到物体置信度，物体置信度所对应的边界框作为伪标签，将伪标签和候选框进行I OU计算，所述候选框通过对图像进行处理得到，根据IOU计算结果、物体置信度和类别信息构建损失函数，通过调整IOU计算结果的权重与物体置信度的权重进行训练，训练损失收敛后得到检测模型，通过检测模型实现目标检测。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于数据处理领域，特别是一种面向开放场景的目标检测方法和系统。

技术介绍

1、开放场景目标检测要求模型在检测过程中不仅需要检测出已知种类的物体，还需要检测出未知种类的物体，即模型没有学习过的物体。并将所有检测出的未知物体都识别为未知类，以便后续对这些未知物体的标注。

2、现有的开放场景目标检测方法主要基于faster rcnn的检测框架，通过类不可知的rpn给出物体可能存在的区域，然后将这些区域进行识别和位置调整。采用rpn的预测框输出作为一个未知目标标注的选择，将预测框中物体置信度分数高且与真实标签(gt)无重叠的top-k个预测框直接归类为未知目标，将其特征加入到未知列表的特征队列中。这种方式的缺陷主要是未知物体预测准确度极低，该方法为了弥补这种简答直接的预测方法，又使用了基于能量的分类器，能够学习输入特征与标签之间的匹配程度，用来识别未知目标，但是，在这个分类器学习能量分布阶段，存在数据泄露，存在未知物体实例。

技术实现思路

0、
技术实现思路
：

1、本专利技术要解决未知物体会对已知物体检测产生影响，导致预测不准确的问题。

2、本专利技术提出一种面向开放场景的目标检测方法和系统。

3、一种面向开放场景的目标检测方法，包括：

4、步骤1，对图像进行编码和解码，得到图像中物体的位置信息和类别信息，所述位置信息包含物体的边界框；

5、步骤2，根据边界框内物体的特征值得到物体置信度，物体置信度所对应的边界

6、步骤3，根据iou计算结果、物体置信度和类别信息构建损失函数，通过调整iou计算结果的权重与物体置信度的权重进行训练，训练损失收敛后得到检测模型；

7、步骤4，通过检测模型实现目标检测。

8、优选的，所述步骤1中，编码和解码方式为：对图像提取多尺度特征，对特征赋予位置编码，将多尺度特征和位置编码输入编码器进行编码，得到语义特征和位置查询，将语义特征和位置查询输入解码器，经过计算互注意力和自注意力，解码得到位置信息。

9、优选的，所述步骤2中，根据边界框内特征值之和与面积之比得到物体置信度。

10、优选的，所述步骤2中，生成候选框的方法为：a、计算图像中所有像素点的颜色直方图和纹理直方图；b、计算所有相邻区域之间的相似度得分，使用颜色直方图和纹理直方图的加权和作为相似度度量；c、将相似度得分较高的相邻区域合并成更大的区域；d、重复步骤b和步骤c，直到合并成一个区域，其包括多个候选区域；e、对所有候选区域计算其外接矩形框，并按照大小排序，得到多个候选框。

11、优选的，所述步骤3中，根据第i个伪标签分别和所有的候选框计算iou，取其中的最大值作为iou计算结果。

12、优选的，当训练损失变小，增大物体置信度权重，减小iou计算结果权重；当训练损失变大，反向调整。

13、优选的，通过增量的形式和归一化的形式调整物体置信度权重和iou计算结果的权重。

14、优选的，通过非线性激活函数计算权重的调整值，当训练损失的变化大于等于0并且小于等于1时，表示训练损失变大；当训练损失的变化大于1时，表示训练损失变小。

15、优选的，所述步骤2中，取k个未与真实标签匹配的边界框作为伪标签，k为正整数。

16、一种面向开放场景的目标检测系统，用于实现所述的面向开放场景的目标检测方法，包括：

17、检测模块，包括编码器、定位解码器和识别解码器；编码器用于对特征进行多尺度建模和上下文信息整合；定位解码器用于将编码特征进行解码，得到位置信息；识别解码器用于将编码特征结合定位解码器输出的位置信息进行解码，使得识别过程能够利用位置信息；

18、自适应伪标签选择模块，包括模型驱动的伪标签模块、输入驱动的伪标签模块和自适应权重模块；模型驱动的伪标签模块根据定位解码器解码计算的边界框内特征点元素数值之和与面积之比生成物体置信度，按照物体置信度进行排序，取k个作为伪标签；输入驱动的伪标签模块采用选择性搜索的方法，根据图片的先验知识，生成物体框；自适应权重模块，将伪标签和物体框进行iou计算，与伪标签对应的物体置信度按权重计算损失，根据损失的变化，对权重进行调整。

19、本专利技术同现有技术相比具有以下优点及效果：

20、本专利技术的自适应伪标签选择机制，提高了伪标签的鲁棒性，防止模型朝着错误的方向学习，增强了模型对未知物体的探索能力。

21、本专利技术采用定位和识别级联的检测结构：通过使用定位解码器和识别解码器，对解码过程进行解耦处理，将物体的位置信息和类别信息解耦。两个解码器通过级联的方式相连，定位解码器的定位过程不会受到复杂的类别信息的影响，提高定位能力，而识别解码器的识别过程又可以借助定位的结果。

本文档来自技高网...

【技术保护点】

1.一种面向开放场景的目标检测方法，其特征在于，包括：

2.根据权利要求1所述的面向开放场景的目标检测方法，其特征在于，所述步骤1中，编码和解码方式为：对图像提取多尺度特征，对特征赋予位置编码，将多尺度特征和位置编码输入编码器进行编码，得到语义特征和位置查询，将语义特征和位置查询输入解码器，经过计算互注意力和自注意力，解码得到位置信息。

3.根据权利要求1所述的面向开放场景的目标检测方法，其特征在于，所述步骤2中，根据边界框内特征值之和与面积之比得到物体置信度。

4.根据权利要求1所述的面向开放场景的目标检测方法，其特征在于，所述步骤2中，生成候选框的方法为：a、计算图像中所有像素点的颜色直方图和纹理直方图；b、计算所有相邻区域之间的相似度得分，使用颜色直方图和纹理直方图的加权和作为相似度度量；c、将相似度得分较高的相邻区域合并成更大的区域；d、重复步骤b和步骤c，直到合并成一个区域，其包括多个候选区域；e、对所有候选区域计算其外接矩形框，并按照大小排序，得到多个候选框。

5.根据权利要求1所述的面向开放场景的目标检测方法，其特征在

6.根据权利要求1所述的面向开放场景的目标检测方法，其特征在于，当训练损失变小，增大物体置信度权重，减小IOU计算结果权重；当训练损失变大，减小物体置信度权重，增大IOU计算结果权重。

7.根据权利要求1所述的面向开放场景的目标检测方法，其特征在于，通过增量的形式和归一化的形式调整物体置信度权重和IOU计算结果的权重。

8.根据权利要求6所述的面向开放场景的目标检测方法，其特征在于，通过非线性激活函数计算权重的调整值，当训练损失的变化大于等于0并且小于等于1时，表示训练损失变大；当训练损失的变化大于1时，表示训练损失变小。

9.根据权利要求1所述的面向开放场景的目标检测方法，其特征在于，所述步骤2中，取k个未与真实标签匹配的边界框作为伪标签，k为正整数。

10.一种面向开放场景的目标检测系统，用于实现权利要求1-9任一所述的面向开放场景的目标检测方法，其特征在于，包括：

...

【技术特征摘要】

1.一种面向开放场景的目标检测方法，其特征在于，包括：

3.根据权利要求1所述的面向开放场景的目标检测方法，其特征在于，所述步骤2中，根据边界框内特征值之和与面积之比得到物体置信度。

5.根据权利要求1所述的面向开放场...

【专利技术属性】
技术研发人员：马帅磊，王越峰，魏颖，李宏，
申请(专利权)人：绍兴市北大信息技术科创中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人