对象检测方法、对象检测设备以及其非暂时性存储媒体技术

技术编号：41445217 阅读：19 留言：0更新日期：2024-05-28 20:36

本公开提供了一种对象检测方法，包含：获得在源域中的且具有第一图像风格的多个对象标注图像的集合；获得在目标域中且具有第二图像风格的多个对象标注图像的少数集合；获得在目标域中且具有第二图像风格的多个未标注图像的多数集合；执行图像风格转换以生成具有第二图像风格的对象标注图像的转换集合；生成用于具有第二图像风格的多个未标注图像的多数集合的对象标注，以从多个未标注图像的多数集合改变为多个标注图像的多数集合；以及执行主动域适应，以生成对象检测模型。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及一种用于使用多个深度卷积神经层检测一个或多个对象的对象检测方法、一种使用所述方法的对象检测设备以及一种其非暂时性存储媒体。

技术介绍

1、在自主车辆的发展中，可靠和高效的对象检测已成为近来年的重点努力方向。执行对象检测的一种方式是依赖深度卷积神经网络(deep convolution neural network；dnn)架构，其中大量可调权重可通过完全监督的模型训练来估计。然而，典型的训练方案可能需要大量手动标记的数据集，这可能会引起跨不同数据域的模型适应效率低下。数据域可包含各种各样的域，例如作为不同的传感器模式、不同的记录区、不同的天气状况、不同的色调(与一天中的时间相关联)、不同的传感器视野、不同的传感器布局等的结果的域。

2、图1示出用于训练的跨不同数据域的数据集的实例。在图1中，图像101和图像102具有与不同的白天和夜晚状况相关联的不同色调。此外，图像103和图像104与不同物距的和捕获角度相关联。一般来说，域转换可在源域到目标域之间进行。举例来说，图像101和图像103可为源域图像，且图像102和图像104可为目标域图像。源域和目标域基本上是具有独特图像风格的图像，具有不同的变化形式、内容和/或特征。因此，不同的图像风格可视为不同的天气、一天中的不同时间、不同的环境、不同的传感器布局等。

3、通过保守的模型训练，dnn架构有望在已包含于对应训练/验证数据集(此包含手动标记的数据和增强的数据)内部的各种数据域下表现良好。这可通过考虑将建模为dnn架构的条件变化来实现。在dnn架构中

4、准备目标域的详尽标记数据集将需要大量资源，这可能会妨碍dnn架构的适应尝试。举例来说，标记器标注驾驶场景(例如城市景观数据集)的图像的平均消耗时间可能长达约90分钟。出于这个原因，域适应技术可能是一个适当的解决方案，其将知识从现有域特定模型转换到目标域，而无需像保守的学习方法中假设的那样利用目标域的全部所需标记数据集。

5、与保守的方法相反，主动域适应是具有少数的标记数据集的非典型的监督学习，根据其对于对应模型训练的重要性谨慎地策划。通过缩减不重要的数据，可识别典型的数据标记，以去除标记不必要的数据并在模型训练期间使用所述数据的任何尝试。可基于特征多样性来提供对数据重要性的确定，所述特征多样性通过基于特征式距离而保持目标数据标记的较大多样性来强调数据重要性。然而，选择具有距源数据标记较远的特征空间分布的目标数据标记可能对产生一些后果，包含离群值数据或偏差模型。偏差模型的一个实例是无法检测到目标图像内的高置信度但错误的对象。此外，对特征空间内的数据标记进行调查以获取其特征多样性的距离可能不是最有效的方法。

技术实现思路

1、因此，本公开涉及一种用于使用多个深度卷积神经网络(dnn)层检测一个或多个对象的对象检测方法、一种使用所述方法的对象检测设备以及其非暂时性存储媒体。

2、根据示例性实施例，本公开的对象检测方法包含：获得在源域中且具有第一图像风格的多个对象标注图像的集合；获得在目标域中且具有第二图像风格的多个对象标注图像的少数集合；获得在目标域中且具有第二图像风格的多个未标注图像的多数集合；通过将源域中的多个对象标注图像从具有第一图像风格转换为具有第二图像风格来执行从源域到目标域的图像风格转换，以生成具有第二图像风格的对象标注图像的转换集合；基于具有第二图像风格的对象标注图像的转换集合和具有第二图像风格的多个对象标注图像的少数集合而生成用于具有第二图像风格的多个未标注图像的多数集合的对象标注，以从多个未标注图像的多数集合改变为多个标注图像的多数集合；以及通过适应多个对象标注图像的少数集合、对象标注图像的转换集合以及多个标注图像的多数集合来执行主动域适应，从而生成对象检测模型。

3、在示例性实施例中，本公开涉及一种对象检测设备。本公开的对象检测设备包含：存储装置；以及处理器，电连接到储存装置且至少配置成：获得在源域中且具有第一图像风格的多个对象标注图像的集合；获得在目标域中且具有第二图像风格的多个对象标注图像的少数集合；获得在目标域中且具有第二图像风格的多个未标注图像的多数集合；通过将源域中的多个对象标注图像从具有第一图像风格转换为具有第二图像风格来执行从源域到目标域的图像风格转换，以生成具有第二图像风格的对象标注图像的转换集合；基于具有第二图像风格的对象标注图像的转换集合和具有第二图像风格的多个对象标注图像的少数集合而生成用于具有第二图像风格的多个未标注图像的多数集合的对象标注，以从多个未标注图像的多数集合改变为多个标注图像的多数集合；以及通过适应多个对象标注图像的少数集合、对象标注图像的转换集合以及多个标注图像的多数集合来执行主动域适应，从而生成对象检测模型。

4、在示例性实施例中，本公开涉及一种非暂时性存储媒体，存储加载到计算机的处理器中的计算机可读程序以控制计算机执行功能，所述功能包含不限于：获得在源域中且具有第一图像风格的多个对象标注图像的集合；获得在目标域中且具有第二图像风格的多个对象标注图像的少数集合；获得在目标域中且具有第二图像风格的多个未标注图像的多数集合；通过将源域中的多个对象标注图像从具有第一图像风格转换为具有第二图像风格来执行从源域到目标域的图像风格转换，以生成具有第二图像风格的对象标注图像的转换集合；基于具有第二图像风格的对象标注图像的转换集合和具有第二图像风格的多个对象标注图像的少数集合而生成用于具有第二图像风格的多个未标注图像的多数集合的对象标注，以从多个未标注图像的多数集合改变为多个标注图像的多数集合；以及通过适应多个对象标注图像的少数集合、对象标注图像的转换集合以及多个标注图像的多数集合来执行主动域适应，从而生成对象检测模型。

5、然而，应理解，本公开内容可并不限定于本公开的所有方面和实施例，且因此不希望用任何方式加以限制或约束。此外，本公开将包含对于本领域的技术人员来说显而易见的改进和修改。

本文档来自技高网...

【技术保护点】

1.一种对象检测方法，用于使用多个深度卷积神经层检测一或多个对象，所述方法包括：

2.根据权利要求1所述的对象检测方法，进一步包括：

3.根据权利要求2所述的对象检测方法，其中，所述对象标注为二维标记，所述二维标记为指示目标图像的对象已被分类的二维边界框或透视诱发的二维边界框或二维点。

4.根据权利要求1所述的对象检测方法，其中，执行所述图像风格转换包括：

5.根据权利要求2所述的对象检测方法，其中，基于所述对象检测模型执行所述所捕获图像的所述所检测对象的所述分类包括：

6.根据权利要求4所述的对象检测方法，其中，构建所述多个深度卷积神经层进一步包括：

7.根据权利要求6所述的对象检测方法，其中，构建所述多个深度卷积神经层进一步包括：

8.根据权利要求6所述的对象检测方法，其中，在所述源域中的所述多个对象标注图像的所述集合具有与在所述目标域中的所述多个对象标注图像的所述少数集合加上在所述目标域中的所述多个未标注图像的所述多数集合不同的数量。

9.根据权利要求6所述的对象检测方法，其中，

10.根据权利要求4所述的对象检测方法，其中，所述执行从所述源域到所述目标域的所述图像风格转换包括：

11.根据权利要求10所述的对象检测方法，进一步包括：

12.根据权利要求11所述的对象检测方法，进一步包括：

13.根据权利要求11所述的对象检测方法，进一步包括：

14.根据权利要求1所述的对象检测方法，进一步包括：

15.根据权利要求2所述的对象检测方法，进一步包括：

16.根据权利要求14所述的对象检测方法，对所述多个对象标注图像的所述少数集合和对象标注图像的所述转换集合执行数据增强，从而在所述监督训练期间向伪标记器引入一定程度的泛化。

17.根据权利要求15所述的对象检测方法，进一步包括：

18.根据权利要求15所述的对象检测方法，其中，所述骨干架构配置成提取多尺度分辨率下的特征，且端层分支配置成连接所述多尺度特征，以生成所述对象标注的预测回归。

19.一种对象检测设备，包括：

20.一种非暂时性存储媒体，存储媒体存储加载到计算机的处理器中的计算机可读程序以控制所述计算机执行功能，所述功能包括：

...

【技术特征摘要】

1.一种对象检测方法，用于使用多个深度卷积神经层检测一或多个对象，所述方法包括：

2.根据权利要求1所述的对象检测方法，进一步包括：

4.根据权利要求1所述的对象检测方法，其中，执行所述图像风格转换包括：

5.根据权利要求2所述的对象检测方法，其中，基于所述对象检测模型执行所述所捕获图像的所述所检测对象的所述分类包括：

6.根据权利要求4所述的对象检测方法，其中，构建所述多个深度卷积神经层进一步包括：

7.根据权利要求6所述的对象检测方法，其中，构建所述多个深度卷积神经层进一步包括：

9.根据权利要求6所述的对象检测方法，其中，响应于在所述源域中的所述多个对象标注图像的所述集合具有与在所述目标域中的所述多个对象标注图像的所述少数集合加上在所述目标域中的所述多个未标注图像的所述多数集...

【专利技术属性】
技术研发人员：蒋泗得，
申请(专利权)人：财团法人工业技术研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人