一种基于并联交互架构模型实现多维度特征融合的目标检测方法技术

技术编号：36564053 阅读：37 留言：0更新日期：2023-02-04 17:19

本发明专利技术公开了一种基于并联交互架构模型实现多维度特征融合的目标检测方法，包括以下步骤：数据获取与处理，搭建模型训练环境、将数据集中的数据送入搭建好的模型中训练以及最终模型的验证与检测，本发明专利技术解决了传统目标检测任务中收敛速度慢、训练耗时长等难题，提高了目标检测任务的检测精度和检测速度。了目标检测任务的检测精度和检测速度。了目标检测任务的检测精度和检测速度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于并联交互架构模型实现多维度特征融合的目标检测方法

[0001]本专利技术属于计算机视觉中的目标检测领域，具体提出一种基于并联交互架构模型实现特征融合的目标检测方法。

技术介绍

[0002]目标检测是计算机视觉领域长久以来不可忽视的一项基本任务，它的主要目的是预测图像中实例的位置和类别。作为包括实例分割和目标跟踪在内诸多视觉任务的基础，目标检测在图像视觉领域有着非常重要的研究意义。而随着近年来自动驾驶和工业缺陷检测等实用领域热度的上升，工业界对目标检测的关注也越来越多。目标检测的核心挑战是如何使检测网络从输入特征中充分学习到图像的空间信息和语义信息，以及如何由这些信息精准地定位和分类实例。目标检测器需要强大的特征融合能力和足够的空间敏感度，传统的深度学习检测模型大多基于卷积神经网络(CNN)。CNN利用卷积操作充分融合图像中的局部特征，灵敏的局部空间感知能力使CNN成为最适合目标检测任务的网络之一；但同时CNN具有一定局限性，它在全局空间上的特征融合能力有所欠缺。基于CNN的传统目标检测模型通常根据如何定位物体分为anchor
‑
based和anchor
‑
free；前者利用anchor来预测潜在物体，而后者通常基于中心点检测物体。Anchor
‑
based模型又根据检测步骤可分为one
‑
stage和two
‑
stage；前者的经典模型有YOLO系列、SSD、RetinaNet等，后者则以R
‑
CNN系...

【技术保护点】

【技术特征摘要】
1.一种基于并联交互架构模型实现多维度特征融合的目标检测方法，其特征在于，包括以下步骤：步骤1：准备模型训练所需COCO2017数据集；在服务器中配置COCO2017数据集，按照要求格式放入训练文件夹；步骤2：在mmdetection框架下搭建模型，配置训练所需PyTorch深度学习环境；步骤3：设置好训练超参数，将数据集输入到并联交互架构端到端目标检测模型中进行训练；步骤4：模型将输入图像送入ResNet50中进行特征提取，输出多尺度特征图feature map，接着由多尺度特征图构建3D特征采样空间；步骤5：生成一组包含内容向量和位置向量的预测向量object queries，对每个object query而言，object query通过前馈神经网络生成采样偏移，以其位置向量作为初始坐标，结合采样偏移生成模型初始采样点；步骤6：以初始采样点和其在采样空间的八个邻点构成一个局部采样窗口，对窗口内的点进行插值，得到窗口特征，接着铺平窗口；步骤7：得到的特征矩阵送入特征融合网络CFFN，CFFN由一个单向并联交互结构(PSUI)和一个组间自注意力层构成，这层实现对特征在空间和通道维度上的充分融合；步骤8：充分融合后的特征送入AdaptiveMixing解码层进行特征解耦；步骤9：解码层的最终输出依次通过两个前馈神经网络FFN分别更新object query的内容向量和位置向量，其内容向量和位置向量再经过两个FFN预测待检测目标的类别与位置；步骤10：模型训练完毕后，可以验证其精度，也可以用训练好的模型文件根据输入的测试图片生成检测框，检测出测试图片中待检测物体的类别和位置。2.根据权利要求1所述的一种基于并联交互架构模型实现多维度特征融合的目标检测方法，其特征在于，所述步骤4：本目标检测模型用经典CNN骨干网络ResNet50对输入的图像进行特征预提取，得到四个不同尺度的特征图，若输入的图像维度为则输出多尺度特征图分别为出多尺度特征图分别为其中此外在构建3D特征空间时，各个尺度特征图的通道数归一到统一值d
feat
，上述D
i
为第i层特征图的特征通道数，H0、W0为输入图像高度与宽度。3.根据权利要求1所述的一种基于并联交互架构模型实现多维度特征融合的目标检测方法，其特征在于，所述步骤5：预测向量object query由内容向量和位置向量两部分组成,其中内容向量表示object query的初始坐标(x,y,z,r)，其中r为长宽比。4.根据权利要求1所述的一种基于并联交互架构模型实现多维度特征融合的目标检测方法，其特征在于，所述步骤6：在特征采样空间中取来自步骤5中的初始采样点的八个邻点和初始采样点本身...

【专利技术属性】
技术研发人员：杜松林，谢昊，
申请(专利权)人：东南大学深圳研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人