一种基于多池化融合通道注意力的目标检测方法及其应用技术

技术编号：36574104 阅读：28 留言：0更新日期：2023-02-04 17:31

本发明专利技术提供一种基于多池化融合通道注意力的目标检测方法及其应用，包括步骤1，准备图像数据集用于测试和训练，使用训练集的数据来训练模型，用测试集上的误差作为最终模型在应对现实场景时的泛化误差；步骤2，构建基于目标检测的多池化融合通道注意力网络；步骤3，使用训练集图像对多池化融合通道注意力网络模型进行训练；步骤4，使用步骤3训练好的网络模型对测试集图像进行目标检测。本发明专利技术在不显着增加参数量和计算量的情况下，大大提高了特征提取的效果，增加了重要特征信息的聚焦度，从而使得目标检测网络取得了更佳的性能。使得目标检测网络取得了更佳的性能。使得目标检测网络取得了更佳的性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多池化融合通道注意力的目标检测方法及其应用

[0001]本专利技术属于目标检测
，具体涉及一种基于多池化融合通道注意力的目标检测方法及其应用。

技术介绍

[0002]在深度学习的发展背景下，卷积神经网络已经得到越来越多的人认同，应用也越来越普遍。基于深度学习的目标检测算法利用卷积神经网络（CNN）自动选取特征，然后再将特征输入到检测器中对目标分类和定位。
[0003]在神经网络学习中，一般而言模型的参数越多，则模型的表达能力越强，模型所存储的信息量也越大，但这会带来信息过载的问题。通过引入注意力机制，在众多的输入信息中聚焦于对当前任务更为关键的信息，降低对其他信息的关注度，甚至过滤掉无关信息，就可以解决信息过载问题，并提高任务处理的效率和准确性。
[0004]近年来，注意力机制广泛用于不同的深度学习任务，例如目标检测、语义分割和姿态估计。注意力分为软注意力和硬注意力。软注意力机制分为三个注意域：空间域、通道域和混合域。空间域是指图像中相应的空间变换。通道域直接将信息集中在全局通道中。混合域包含通道注意力和空间注意力。为了让网络将更多的注意力集中在显著目标周围的区域，本专利技术提出了多池化融合通道注意力模块来处理提取的特征图。

技术实现思路

[0005]针对现有技术存在的问题，本专利技术提供一种基于多池化融合通道注意力的目标检测方法，在不过度增加模型参数数量的情况下提高网络的特征表达能力。本专利技术为解决现有技术中存在的问题采用的技术方案如下：一种基于多池化融合通道注意力的...

【技术保护点】

【技术特征摘要】
1.一种基于多池化融合通道注意力的目标检测方法，其特征在于，包括以下步骤：步骤1，准备图像数据集用于测试和训练，所述图像数据集包括训练集和测试集，使用训练集的数据训练模型，将测试集上的误差作为最终模型在应对现实场景时的泛化误差；步骤2，构建基于目标检测的多池化融合通道注意力网络；步骤3，使用训练集图像对多池化融合通道注意力网络模型进行训练；步骤4，使用步骤3训练好的网络模型对测试集图像进行目标检测。2.如权利要求1所述的一种基于多池化融合通道注意力的目标检测方法，其特征在于：所述图像数据集的80%作为训练集，20%作为测试集。3.如权利要求1所述的一种基于多池化融合通道注意力的目标检测方法，其特征在于：所述步骤1中将图像数据集中所有图像的尺寸调整到512
×
512mm像素大小进行多尺度训练，采用数据增强对图像数据集进行一系列操作，包括：随机翻转，padding填充，随机裁剪，归一化处理，图像失真处理。4.如权利要求1所述的一种基于多池化融合通道注意力的目标检测方法，其特征在于：所述步骤2中构建基于目标检测的多池化融合通道注意力网络包括两个阶段：第一阶段：执行池化、卷积操作，对输入特征图进行重塑，第一阶段的输入为，其中M为原始输入特征图，C、H和W是通道、高度和宽度，首先，将特征图M分为两个分支：分别进行普通全局池化和全局协方差池化，普通全局池化中，同时使用平均池化和最大池化来聚合空间信息，生成两个可选的空间上下文描述符，平均池化对特征图上的每个像素均有反馈，最大池化只在特征图中响应最大的地方有梯度反馈；然后使用逐元素求和组合特征向量，以减少参数数量，使用1*1卷积来减少特征图的通道数，得到，其中C'是C的一半，公式表示为：（1）其中M为原始输入特征图，Avg()表示平均池化，Max()表示最大池化，f()表示1*1卷积，M2为普通全局池化分支生成的阶段性特征图；所述全局协方差池化包括计算特征图的协方差矩阵，选择能代...

【专利技术属性】
技术研发人员：王改华，曹清程，甘鑫，翟乾宇，
申请(专利权)人：湖北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人