目标检测方法及装置、存储介质及电子装置制造方法及图纸

技术编号：40180064 阅读：5 留言：0更新日期：2024-01-26 23:46

本发明专利技术公开了一种目标检测方法及装置、存储介质及电子装置，其中，上述方法包括：通过等变主干网络对目标图像进行处理，得到所述目标图像的旋转等变特征；通过所述旋转等变特征生成旋转鲁棒原型，并根据所述旋转鲁棒原型对所述旋转等变特征进行增强处理，得到增强后的旋转等变特征，其中，所述增强处理包括稳定增强处理和语义增强处理；根据所述增强后的旋转等变特征对所述目标图像进行目标检测。采用上述技术方案，解决了直接使用等变主干网络确定的图像的旋转等变特征对图像进行目标检测，导致目标检测效果较差的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术实施例涉及计算机领域，具体而言，涉及一种目标检测方法及装置、存储介质及电子装置。

技术介绍

1、作为计算机视觉的基础任务之一，可见光遥感目标检测是一种利用可见光遥感数据(如卫星影像、航空影像等)来识别和定位地表上的特定目标或物体的技术。这些目标可能包括建筑物、车辆、道路、农田、水体等。可见光遥感目标检测在许多领域具有广泛的应用，如城市规划、环境监测、灾害管理、农业和国防等。

2、遥感目标的检测通常使用旋转框来包围目标，这就涉及到预测目标朝向的问题，传统的检测算法使用卷积神经网络(convolutional neural network，简称为cnn)为基础。然而cnn对于旋转等变不具备鲁棒性，对于物体朝向的编码是受限的。近期有方法使用等变cnn来编码物体的朝向特征，但随着网络深度的加深，计算本身的数值不稳定导致了这些网络中的方向编码通常是不稳定和噪声较大的，影响了检测性能。

3、在可见光学遥感领域，传统检测方法与自然图像中传统目标检测方法是基本一致的。早期研究中，首先使用候选区域提取算法提取高可信度的图像子区域，后应用手工设计的算法提取相应区域的特征，最终将获取得到的特征送入检测器进行最后的分类与回归。

4、近些年随着机器学习的发展，特别是深度学习，目标检测效果有了一个显著的提升。深度检测器可以分为两类：双阶段和单阶段。双阶段检测器在第一阶段首先生成一组感兴趣区域(rois)，并在第二阶段中执行感兴趣区域边界框的回归和对象分类。单阶段检测器如：yolo和ssd，直接对目标进行位置回归

5、遥感图像中的物体通常以任意方向出现，水平框通常被用在通用目标检测方法中定位目标，在这种情况下通常会出现严重的错位：一个水平锚框包含了多个目标实例。一些方法采用具有不同角度，尺度和长宽比的旋转锚框来缓解这个问题，但同时也涉及到与锚框相关的大量计算出现(例如边界框的变化，与真实值的匹配等)大量预设锚框容易造成内存冗余的出现。一部分人提出roi transformer结构将水平rois转化为旋转rois，这种结构减少了大量的预设锚框并且缓解了错误匹配的问题。然而此结构需要预测将水平rois转换为旋转rois的额外参数，引入了额外的roi计算操作。带来了一定计算上的复杂性。还有一部分人区别于使用旋转框，提出使用水平滑动顶点的方式表示旋转框，可以准确地定位旋转目标。但这种表示方法下的roi特征仍然是水平的，并且存在错误匹配的问题。最近提出的r3det从相应锚框的五个位置(如，中心点和角点)对特征进行采样并进行相加，以重新编码位置信息。

6、redet网络是一个两阶段网络，基于roi transformer改进而来。其使用e2cnn库重新写了resnet50，得到等变resnet50(re-resnet50)。等变主干网络能够提取旋转等变特征，在第二阶段，使用channel alignment对通道进行重排获取旋转不变特征，基于旋转不变特征进行最终的定位和分类。但在redet中re-resnet50并不能够提取足够精确的旋转等变特征，且由于网络结构的原因，会在个别通道引入噪声，严重影响检测头对目标的识别。例如图1所示，(a)为传统cnn检测的效果图，(b)为使用re-resnet50检测的效果图，个别通道存在巨量的背景噪声或存在抑制目标特征响应的情况。

7、针对相关技术中，直接使用等变主干网络确定的图像的旋转等变特征对图像进行目标检测，导致目标检测效果较差的问题，目前尚未提出有效的解决方案。

技术实现思路

1、本专利技术实施例提供了一种目标检测方法及装置、存储介质及电子装置，以至少解决直接使用等变主干网络确定的图像的旋转等变特征对图像进行目标检测，导致目标检测效果较差的问题。

2、根据本专利技术的一个实施例，提供了一种目标检测方法，包括：通过等变主干网络对目标图像进行处理，得到所述目标图像的旋转等变特征；通过所述旋转等变特征生成旋转鲁棒原型，并根据所述旋转鲁棒原型对所述旋转等变特征进行增强处理，得到增强后的旋转等变特征，其中，所述增强处理包括稳定增强处理和语义增强处理；根据所述增强后的旋转等变特征对所述目标图像进行目标检测。

3、在一个示例性的实施例中，通过所述旋转等变特征生成旋转鲁棒原型，包括：按照所述目标图像的旋转等变特征的通道数对所述旋转等变特征进行划分，得到k个子旋转等变特征，其中，所述k为正整数、且所述k允许被所述目标图像的旋转等变特征的通道数整除；对所述k个子旋转等变特征进行聚合操作，得到所述旋转鲁棒原型。

4、在一个示例性的实施例中，对所述k个子旋转等变特征进行聚合操作，得到所述旋转鲁棒原型，包括：将所述k个子旋转等变特征相加，得到所述旋转鲁棒原型。

5、在一个示例性的实施例中，根据所述旋转鲁棒原型对所述旋转等变特征进行增强处理，得到增强后的旋转等变特征，包括：根据所述旋转鲁棒原型分别对所述k个子旋转等变特征中的每个子旋转等变特征进行增强处理，得到k个增强后的子旋转等变特征；将所述k个增强后的子旋转等变特征进行拼接，得到所述增强后的旋转等变特征。

6、在一个示例性的实施例中，根据所述旋转鲁棒原型分别对所述k个子旋转等变特征中的每个子旋转等变特征进行增强处理，包括：通过以下方式对所述k个子旋转等变特征中的第i个子旋转等变特征进行增强处理，以对每个子旋转等变特征进行增强处理，其中，所述i为大于等于1，小于等于k的正整数：将所述旋转鲁棒原型进行卷积，并将卷积后的旋转鲁棒原型与所述第i个子旋转等变特征进行拼接，得到第一特征；将所述第一特征进行卷积，并将卷积后的所述第一特征与所述第i个子旋转等变特征进行相加，得到第二特征；通过激活函数对所述第二特征进行处理，得到第i个增强后的子旋转等变特征。

7、在一个示例性的实施例中，根据所述增强后的旋转等变特征对所述目标图像进行目标检测，包括：在使用一阶段探测器对所述目标图像进行目标检测的情况下，直接基于所述增强后的旋转等变特征进行对象分类和位置回归，得到目标检测结果。

8、在一个示例性的实施例中，根据所述增强后的旋转等变特征对所述目标图像进行目标检测，包括：在使用二阶段探测器对所述目标图像进行目标检测的情况下，通过区域生成网络，利用所述增强后的旋转等变特征生成一组感兴趣区域；根据所述旋转等变特征对所述一组感兴趣区域进行对象分类和位置回归，得到目标检测结果；或者根据所述增强后的旋转等变特征对所述一组感兴趣区域进行对象分类和位置回归，得到目标检测结果。

9、根据本专利技术的另一个实施例，还提供了一种目标检测装置，包括：第一处本文档来自技高网...

【技术保护点】

1.一种目标检测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，通过所述旋转等变特征生成旋转鲁棒原型，包括：

3.根据权利要求2所述的方法，其特征在于，对所述K个子旋转等变特征进行聚合操作，得到所述旋转鲁棒原型，包括：

4.根据权利要求2所述的方法，其特征在于，根据所述旋转鲁棒原型对所述旋转等变特征进行增强处理，得到增强后的旋转等变特征，包括：

5.根据权利要求4所述的方法，其特征在于，根据所述旋转鲁棒原型分别对所述K个子旋转等变特征中的每个子旋转等变特征进行增强处理，包括：

6.根据权利要求1所述的方法，其特征在于，根据所述增强后的旋转等变特征对所述目标图像进行目标检测，包括：

7.根据权利要求1所述的方法，其特征在于，根据所述增强后的旋转等变特征对所述目标图像进行目标检测，包括：

8.一种目标检测装置，其特征在于，包括：

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，其中，所述计算机程序被处理器执行时实现所述权利要求1至7任一项中所述的方法的步骤。

10.一种电子装置，包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现所述权利要求1至7任一项中所述的方法的步骤。

...

【技术特征摘要】

1.一种目标检测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，通过所述旋转等变特征生成旋转鲁棒原型，包括：

3.根据权利要求2所述的方法，其特征在于，对所述k个子旋转等变特征进行聚合操作，得到所述旋转鲁棒原型，包括：

4.根据权利要求2所述的方法，其特征在于，根据所述旋转鲁棒原型对所述旋转等变特征进行增强处理，得到增强后的旋转等变特征，包括：

5.根据权利要求4所述的方法，其特征在于，根据所述旋转鲁棒原型分别对所述k个子旋转等变特征中的每个子旋转等变特征进行增强处理，包括：

6.根据权利要求1所述的方法，其特征在于，根据...

【专利技术属性】
技术研发人员：高山，王朝伟，邵典，郭广乾，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人