一种基于注意力机制的图像检测方法技术

技术编号:29938638 阅读:24 留言:0更新日期:2021-09-04 19:19
本发明专利技术公开了一种基于注意力机制的图像检测方法,可以通过注意力机制确定图片中感兴趣的区域,包括:采集图像,获取需要测试的图像数据集;将图像分成独立不重复的验证集和测试集;对验证集和测试集中的图像进行特征提取,获取需要的特征信息;基于Darknet53网络模型增加由通道注意力模块和空间注意力模块构成的SCSE模块,得到测试图像的模型;将验证集内的图像特征作为输入模型参数;将测试集内的图像特征作为输入模型参数;将测试集内图像的特征输入,获取相应的测试结果。本实验可以提高图片检测的精度,同时也能够提升检测的效率,提高资源的利用率。提高资源的利用率。

【技术实现步骤摘要】
一种基于注意力机制的图像检测方法


[0001]本专利技术是一种基于注意力机制的图片特征检测方法,涉及深度学习,涉及目标检测技术。

技术介绍

[0002]自从深度神经网络算法首次在ImageNet数据集上大放异彩,物体检测领域逐渐开始利用深度学习来做研究。随后各种结构的深度模型被提出,数据集的准确率一再被刷新。实际上,深度学习模型在分类任务上将传统的方法远远地甩在身后。图像分类上明显的提升也带动了检测领域的快速发展。目标检测是检测领域的一种,目前已广泛的应用于交通监控、人机交互、精确制导等各个领域。目标检测方法可大概分为四种,基于模板匹配的方法,基于知识的方法,基于遥感图像分类技术(OBIA)的方法以及机器学习方法。基于使用的模板类型,模板匹配方法可被进一步的分为固定模板匹配和可变模板匹配方法两大类,其主要步骤包括模板生成和相似度度量。而基于知识的目标检测方法则通过使用先验知识如几何信息和纹理信息将目标检测问题转化为一个假设检验问题。基于遥感图像分类技术(OBIA)的方法主要包括图像分割和目标分类两个步骤,其中如何选择合适的分割尺度是影响目标检测效果的关键因素。
[0003]但是,在我们对图片进行相关的特征检测时,以往的检测方法容易受到图片内容的影响,对图片重要部分的特征进行提取与检测的精度不高,从而影响对图像的分析、匹配。

技术实现思路

[0004]本专利技术为了解决现有技术中存在的问题,提供一种。
[0005]为了达到上述目的,本专利技术提出的技术方案为:一种基于注意力机制的图像检测方法,包括如下步骤:
[0006]步骤1、获取目标数据集图像的信息,并作为图像样本;
[0007]步骤2、对目标数据集图像样本进行划分验证集和测试集;
[0008]步骤3、对目标数据集图像所划分的验证集和测试集进行特征提取,分别获得验证集和测试集内各图像的特征;
[0009]步骤4、在Darknet53网络模型中增加SCSE模块,并对模型进行训练得到图像检测模型;将验证集内图像的特征输入SCSE模块得到空间注意力特征,将空间注意力特征输入到接下来的卷积模块进行操作,并通过对图像检测模型验证,获取图片检测模型的参数;将测试集内图像的特征输入带参数的图片检测模型中,获取检测结果。
[0010]对上述技术方案的进一步设计为:所述步骤1中对目标数据集图像用检测工具进行标注,将图像的格式转化为检测需要的尺寸,进而获取图片检测后的信息。
[0011]所述步骤2中采用随机抽样的方式按验证集80%、测试集20%的比例将目标数据集图像样本划分为独立的验证集和测试集。
[0012]所述Darknet53网络包括53层卷积层,在网络的第26层卷积层后,添加SCSE模块。
[0013]本专利技术的有益效果为:
[0014]本专利技术由Darknet网络对数据集进训练,得到一个高效的训练结果,由此可以对图片内容进行快速定位,比以往的方法更高效,节省了大量时间;本专利技术在网络模型中加入注意力模块SCSE,可以更好的对图像中信息进行定位,提高检测精度;加入注意力模块SCSE,使得输出不同层的特征图更精确,优化了输出数据,使定位和分类的准确性得到提高,而且能够帮助模型对图像关键部分的检测并减少背景因素对检测产生的干扰影响,提升图片检测的精度,同时也能够提升检测的效率,提高资源的利用率。
附图说明
[0015]图1本专利技术目标检测的训练流程图;
[0016]图2本专利技术增加注意力机制SCSE模块的简易图;
[0017]图3本专利技术注意力机制SCSE与卷积层融合的示意图;
[0018]图4本专利技术Darknet53模型添加SCSE模块的示意图;
[0019]图5本专利技术未增加与增加SCSE模块的测试效果对比图;
[0020]图6本专利技术未增加与增加SCSE模块的实验数据分析对比图。
具体实施方式
[0021]下面结合附图以及具体实施例对本专利技术进行详细说明。
[0022]实施例
[0023]本专利技术基于Ubuntu18.04.4LTS环境下工作,以PyTorch为框架进行,主要参数有:初始学习率为0.01,最终学习率为0.0005;动量参数为0.937,权重系数为0.0005,训练阈值为0.2,imagesize为608
×
608,epoch为400。
[0024]本专利技术采用的技术方案为:一种基于基于注意力机制改进的目标算法,包括以下几个步骤:
[0025]步骤1、获取目标数据集图像的信息,并作为图像样本;
[0026]本实施例的图像数据集是通过网络收集得到,所收集的数据集图片均来自于生活中的场景,然后利用目标检测标注工具进行标注,将图片格式化为一定的图片尺寸,数据集各种生活场景组成。
[0027]步骤2、对目标数据集图像样本进行划分验证集和测试集;
[0028]所选取图像样本的划分,采用随机抽样法将广告图像数据按验证集80%,测试集20%的比例划分为独立的验证集和测试集
[0029]步骤3、对目标数据集图像所划分的验证集和测试集进行特征提取,分别获得验证集和测试集内各图像的特征;
[0030]步骤4、在Darknet53网络模型中增加SCSE模块,并对模型进行训练得到图像检测模型;将验证集内图像的特征输入SCSE模块得到空间注意力特征,并通过对图像检测模型验证,通过对模型的运行,最后通过结果,获取图片检测模型的参数;将测试集内图像的特征输入带参数的图片检测模型中,获取检测结果,验证模型性能;
[0031]Darknet53一共53层卷积,除去最后一个全连接层,总共52个卷积用于当做主体网
络。Darknet53共降维5次,通过采取上采样和下采样,可以达到多尺度融合预测;本专利技术在此基础上引进了SCSE(Concurrent Spatial and Squeeze and Channel Excitation)模块,SCSE模块的简易图如图2所示,SCSE模块表示卷积模块的注意力机制,主要是一种结合了空间(spatial)和通道(channel)的注意力机制模块,学习了通道之间的相关性,筛选出了针对通道的注意力。此外,通过了解要强调或抑制的信息有助于网络内的信息流动。主要网络架构很简单,一个是通道注意力模块,另一个是空间注意力模块,SCSE就是集成了通道注意力模块和空间注意力模块。在整体的网络结束后,也就是第26层卷积层后,添加SCSE模块,如图3和图4所示。SCSE的大致工作流程是:SCSE就是将SSE(Spatial Squeeze and Channel Excitation)和CSE(Channel Squeeze and Spatial Excitation)相加起来。
[0032]下面分别对于SCE和SSE模块工作流程进行介绍:
[0033]CSE的工作流程:将特征图通过平均池化层(global average pooling)从[C,H本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制的图像检测方法,其特征在于,包括如下步骤:步骤1、获取目标数据集图像的信息,并作为图像样本;步骤2、对目标数据集图像样本进行划分验证集和测试集;步骤3、对目标数据集图像所划分的验证集和测试集进行特征提取,分别获得验证集和测试集内各图像的特征;步骤4、在Darknet53网络模型中增加SCSE模块,并对模型进行训练得到图像检测模型;将验证集内图像的特征输入SCSE模块得到空间注意力特征,将空间注意力特征输入到接下来的卷积模块中进行操作,并通过对图像检测模型验证,获取图片检测模型的参数;将测试集内图像的特征输入带参数的...

【专利技术属性】
技术研发人员:宋公飞王明邓壮壮卢峥松王瑞绅张子梦汪海洋徐宝珍
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1