System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于计算机视觉领域,具体涉及一种基于多模型嵌入的复杂场景目标智能检测方法。
技术介绍
1、目标检测是一种与计算机视觉和图像处理相关的计算机技术,用于检测数字图像和视频中某一类语义对象(如人、建筑物或汽车)的实例,目标检测的研究领域包括多类别检测、边缘检测、突出目标检测、姿势检测、场景文本检测、人脸检测、行人检测等。目标检测作为场景理解的重要组成部分,广泛应用于现代生活的许多领域,如安全领域、军事领域、交通领域、医疗领域和生活领域等。
2、伴随深度学习的发展,目标检测在计算机视觉中的应用也越来越广泛,它的技术也在逐步趋向成熟。在导致目标检测技术快速发展的诸多因素和努力中,值得注意的贡献应该归因于深度卷积神经网络和计算能力的发展。目前,深度学习模型已广泛应用于计算机视觉的整个领域,包括通用目标检测和特定领域目标检测。大多数最先进的物体检测器利用深度学习网络作为其骨干和检测网络,分别从输入图像(或视频)中提取特征,进行分类和定位。
3、然而,现有的目标检测方法在检测一般目标上能起到不错的效果,但是在存在多种类型目标上,特别是在尺度变化很大,或者目标尺度特别小的情况,比如航拍的数据集就更多的存在尺度特别小的情况,同时在不同背景干扰情况下对目标的识别也存在很大的挑战。
技术实现思路
1、针对现有技术存在的不足,本专利技术提出了一种基于多模型嵌入的复杂场景目标智能检测方法,该方法包括:获取待检测的图像,将其输入到训练好的多模型嵌入目标智能检测模型中,得到目标检
2、多模型嵌入目标智能检测模型的训练过程包括:
3、s1:获取训练图像数据并对其进行预处理,得到预处理好的图像数据;
4、s2:将预处理好的图像数据输入到backbone模块进行处理,每种类别的图像均得到4种不同尺度的特征图;
5、s3:采用改进的neck模块对4种不同尺度的特征图进行处理,得到得到4种融合特征图;
6、s4:将4种融合特征图输入到检测头中进行处理,得到目标检测结果;
7、s5:计算模型总损失并根据模型总损失调整模型参数,得到训练好的多模型嵌入目标智能检测模型。
8、优选的,所述backbone模块由focus模块、4个conv模块、3个c3模块、aspp-ds模块和skattention注意力机制组成。
9、进一步的,所述aspp-ds模块为将aspp模块中的传统卷积替换为深度可分离卷积,并增加aspp模块中扩展卷积的范围后形成的网络模块。
10、优选的,所述改进的neck模块由3个cfe upsample模块和3个cfe downsample模块组成,cfe upsample模块由gsconv模块、upsample模块、concat模块和transformer模块组成,cfe downsample模块由gsconv模块、concat模块和transformer模块组成。
11、优选的,所述检测头包括4个耦合头,每个耦合头均添加有transformer编码块。
12、优选的,计算模型总损失的公式为:
13、
14、其中,表示模型总损失,iou表示预测框和gt框的iou值,ρ2()表示计算欧式距离,b表示预测框的中心点,bgt表示gt框的中心点,c表示包含预测框和gt框的最小矩形的对角线长度。
15、本专利技术的有益效果为:本专利技术在主干网络中采用设计和修改的aspp-ds模块取代了第8层的原始sppf模块,主要包括用深度可分离卷积代替aspp模块中的正则卷积,并增加aspp模块的扩展规模。在主干的最后一层引入了skattention注意力机制。在传统的颈部层网络中,将原来的3层结构修改为4层结构,对应随后的4个检测头。还使用gsconv和transformer来捕获粗细粒度的特征,其中gsconv表现对细粒度的特征提取,transformer表现对粗粒度的特征提取。在输出层中,将传统的检测头解耦为新的检测头。解耦头采用transformer编码块,形成transformer解耦头(tdh)。由于网络末端的特征图分辨率较低,在低分辨率特征图上应用tdh可以减少昂贵的计算和内存开销。此外,本专利技术采用用更高效的soft nms算法取代传统nms算法,并将损失函数从普通iou损失修改为diou_loss损失,以提高整体性能;与现有技术相比,本专利技术能够实现粗细粒度特征的提取,检测精度高;能应对不同类别的复杂场景干扰,模型的泛化性能更强;能够对不同尺度的目标采用自适应大小的检测头,对目标进行多尺度智能检测。
本文档来自技高网...【技术保护点】
1.一种基于多模型嵌入的复杂场景目标智能检测方法,其特征在于,包括:获取待检测的图像,将其输入到训练好的多模型嵌入目标智能检测模型中,得到目标检测结果;
2.根据权利要求1所述的一种基于多模型嵌入的复杂场景目标智能检测方法,其特征在于,对训练图像数据进行预处理的过程包括:
3.根据权利要求1所述的一种基于多模型嵌入的复杂场景目标智能检测方法,其特征在于,所述Backbone模块由Focus模块、4个Conv模块、3个C3模块、ASPP-DS模块和SKAttention注意力机制组成。
4.根据权利要求3所述的一种基于多模型嵌入的复杂场景目标智能检测方法,其特征在于,所述ASPP-DS模块为将ASPP模块中的传统卷积替换为深度可分离卷积,并增加ASPP模块中扩展卷积的范围后形成的网络模块。
5.根据权利要求1所述的一种基于多模型嵌入的复杂场景目标智能检测方法,其特征在于,所述改进的Neck模块由3个CFE upsample模块和3个CFE downsample模块组成,CFEupsample模块由GSConv模块、upsample模块
6.根据权利要求1所述的一种基于多模型嵌入的复杂场景目标智能检测方法,其特征在于,所述检测头包括4个耦合头,每个耦合头均添加有Transformer编码块。
7.根据权利要求1所述的一种基于多模型嵌入的复杂场景目标智能检测方法,其特征在于,计算模型总损失的公式为:
...【技术特征摘要】
1.一种基于多模型嵌入的复杂场景目标智能检测方法,其特征在于,包括:获取待检测的图像,将其输入到训练好的多模型嵌入目标智能检测模型中,得到目标检测结果;
2.根据权利要求1所述的一种基于多模型嵌入的复杂场景目标智能检测方法,其特征在于,对训练图像数据进行预处理的过程包括:
3.根据权利要求1所述的一种基于多模型嵌入的复杂场景目标智能检测方法,其特征在于,所述backbone模块由focus模块、4个conv模块、3个c3模块、aspp-ds模块和skattention注意力机制组成。
4.根据权利要求3所述的一种基于多模型嵌入的复杂场景目标智能检测方法,其特征在于,所述aspp-ds模块为将aspp模块中的传统卷积替换为深度可分离卷积,并增加aspp模块中扩展卷积的范围后形...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。