本发明专利技术公开了一种智能弹药识别方法,所述方法包括:获取待识别图像;将所述待识别图像输入预设目标识别模型中,得到待识别图像对应的位置信息;根据对应的位置信息计算出检测框,并框出识别目标;其中,所述目标识别模型基于YOLOv5的网络结构训练得到的,所述YOLOv5的网络包括CABlock通道注意力模块,所述CABlock通道注意力模块用于对学习到的特征进行通道方向的整合,本发明专利技术针对YOLOv5在小目标检测领域的缺陷,在原始YOLOv5特征提取后加入了通道注意力模块,用来对学习到的特征进行通道方向的整合以便学习到小目标的边界特征,解决了原有YOLOv5使用的Anchor
【技术实现步骤摘要】
一种智能弹药识别方法
[0001]本专利技术涉及一种智能弹药识别方法,属于目标检测
技术介绍
[0002]目标检测是计算机视觉和数字图像处理的一个热门方向,广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域,通过计算机视觉减少对人力资本的消耗,具有重要的现实意义。因此,目标检测也就成为了近年来理论和应用的研究热点,它是图像处理和计算机视觉学科的重要分支,也是智能监控系统的核心部分。
技术实现思路
[0003]本专利技术的目的在于提供一种智能弹药识别方法,以解决现有技术yolov5方法在目标检测中识别不准确的缺陷。
[0004]一种智能弹药识别方法,所述方法包括:
[0005]获取待识别图像;
[0006]将所述待识别图像输入预设目标识别模型中,得到待识别图像对应的位置信息;
[0007]根据所述待识别图像对应的位置信息计算出检测框,并框出识别目标;其中,所述目标识别模型基于YOLOv5的网络结构训练得到的,所述YOLOv5的网络包括CABlock通道注意力模块,所述CABlock通道注意力模块用于对学习到的特征进行通道方向的整合。
[0008]进一步地,所述目标识别模型的训练方法包括:
[0009]构建初始目标识别模型;
[0010]获取图像数据集,对所述图像数据集进行标注得到训练集;
[0011]采用所述训练集对所述初始目标识别模型进行训练,得到所述目标识别模型。
[0012]进一步地,所述获取图像数据集的方法包括:
[0013]拍摄目标物在不同位置摆放的图像,使用labelme工具,对所拍的图像进行标注,得到图像数据集。
[0014]进一步地,采用旋转目标标注策略对所述图像进行标注,所述标注的文件包括目标物体的位置和类别信息。
[0015]进一步地,所述YOLOv5网络结构还包括Input网络、Backbone主干网络和Neck网络,所述Input网络用于对输入的图像进行Mosaic数据增强,所述Backbone主干网络对输入的图像进行特权提取得到一个特征图,所述Neck网络将提取到的不同尺度的特征图进行特征融合。
[0016]进一步地,所述Neck网络包括PANet和SPP结构,能够将13x13、26x26、52x52三个不同尺度的特征图进行融合。
[0017]进一步地,所述YOLOv5网络结构包括CSPDarknet53网络,所述CSPDarknet53网络中包含了52个卷积层,每层卷积层对输入的特征图进行卷积运算,并输出一个新的特征图。
[0018]进一步地,将所述待识别图像输入预设目标识别模型中包括:采用Opencv工具调
整输入图像的尺寸大小,并将调整后的图像进行数据增强。
[0019]进一步地,所述采用Opencv工具调整输入图像的尺寸大小的步骤包括:
[0020]从原始图像中随机裁剪一部分区域,并将其调整为目标大小;
[0021]对原始图像进行随机缩放,以增加数据样本的多样性;
[0022]对原始图像进行随机旋转,以增加数据样本的多样性;
[0023]对原始图像进行随机水平或垂直翻转,以增加数据样本的多样性。
[0024]进一步地,所述CABlock通道注意力模块采用全局平均池化实现整个空间特征编码为一个全局特征,然后使用激活函数和门控机制学习每个通道之间的非线性关系,非线性关系表示为:
[0025]s=F
ex
(z,W)=σ(g(z,W))=σ(W2ReLU(W1z))
[0026]其中,s:表示输出的特征图,其形状为[B,C,H,W],其中B表示batch size,C表示通道数,H表示特征图的高,W表示特征图的宽;F
ex
表示CABlock通道注意力模块中的特征提取函数,用于将输入特征图z提取出特征;z表示输入的特征图,其形状与输出特征图相同,即[B,C,H,W],W表示CABlock通道注意力模块中学习到的参数由两个部分组成:W1和W2,W1表示用于z的线性变换的权重矩阵,其形状为[K,C],其中K为全局特征的通道数,C'为输入特征图的通道数,因此W1的转置矩阵可以被看作是一个卷积核,用于对输入特征图进行卷积操作,W2表示用于学习每个通道之间非线性关系的权重矩阵,其形状为[C,C'],其中C为输入和输出特征图的通道数,C'为一个超参数,ReLU表示修正线性单元,σ表示sigmoid函数,用于将输出特征图的值压缩到[0,1]的范围内;g:表示门控函数,用于学习每个通道之间的非线性关系,其具体形式为:g(z,W)=ReLU(W1z),r是一个超参数。
[0027]与现有技术相比,本专利技术所达到的有益效果:
[0028]本专利技术针对YOLOv5在小目标检测领域的缺陷,在原始YOLOv5特征提取后加入了通道注意力模块,用来对学习到的特征进行通道方向的整合以便学习到小目标的边界特征,解决了原有YOLOv5使用的Anchor
‑
based方法生成目标候选框不准确的问题,使目标候选框的大小和位置精确地匹配目标,大大降低检测误差。
附图说明
[0029]图1是本专利技术改进后的模型框架图;
[0030]图2是本专利技术通道注意力模块;
[0031]图3是本专利技术训练集示意图;
[0032]图4是本专利技术识别数据图。
具体实施方式
[0033]为使本专利技术实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本专利技术。
[0034]如图1
‑
图2所示,公开了一种智能弹药识别方法,所述方法包括:
[0035]步骤1、获取待识别图像;
[0036]步骤2、将所述待识别图像输入预设目标识别模型中,得到待识别图像对应的位置
信息;
[0037]步骤3、根据对应的位置信息计算出检测框,并框出识别目标;其中,所述目标识别模型基于YOLOv5的网络结构训练得到的,所述YOLOv5的网络包括CABlock通道注意力模块,所述CABlock通道注意力模块用于对学习到的特征进行通道方向的整合。
[0038]在本实施例中,所述目标识别模型的训练方法具体步骤如下:
[0039]第1步,构建初始目标识别模型;
[0040]第2步,获取图像数据集,对所述图像数据集进行标注得到训练集;
[0041]21、首先将10颗7.62mm步枪弹,5颗58mm步枪弹和5颗9mm手枪弹摆放在长20cm宽15cm的白色托盘中,再用良田高拍仪拍摄约300张子弹在不同位置摆放的图片。接着使用labelme工具,对所拍图像进行标注,采用旋转目标标注策略,即四点标注法,如图2中所示为标注好的训练集图片之一。标注文件包含目标物体的位置和类别信息,将数据集该为训练集、验证集和测试集。
[0042]22、YOLOv5的输入图像大小是416x416。本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种智能弹药识别方法,其特征在于,所述方法包括:获取待识别图像;将所述待识别图像输入预设目标识别模型中,得到待识别图像对应的位置信息;根据所述待识别图像对应的位置信息计算出检测框,并框出识别目标;其中,所述目标识别模型基于YOLOv5的网络结构训练得到的,所述YOLOv5的网络包括CABlock通道注意力模块,所述CABlock通道注意力模块用于对学习到的特征进行通道方向的整合。2.根据权利要求1所述的智能弹药识别方法,其特征在于,所述目标识别模型的训练方法包括:构建初始目标识别模型;获取图像数据集,对所述图像数据集进行标注得到训练集;采用所述训练集对所述初始目标识别模型进行训练,得到所述目标识别模型。3.根据权利要求2所述的智能弹药识别方法,其特征在于,所述获取图像数据集的方法包括:拍摄目标物在不同位置摆放的图像,使用labelme工具,对所拍的图像进行标注,得到图像数据集。4.根据权利要求3所述的智能弹药识别方法,其特征在于,采用旋转目标标注策略对所述图像进行标注,所述标注的文件包括目标物体的位置和类别信息。5.根据权利要求1所述的智能弹药识别方法,其特征在于,所述YOLOv5网络结构还包括Input网络、Backbone主干网络和Neck网络,所述Input网络用于对输入的图像进行Mosaic数据增强,所述Backbone主干网络对输入的图像进行特权提取得到一个特征图,所述Neck网络将提取到的不同尺度的特征图进行特征融合。6.根据权利要求5所述的智能弹药识别方法,其特征在于,所述Neck网络包括PANet和SPP结构,能够将13x13、26x26、52x52三个不同尺度的特征图进行融合。7.根据权利要求1所述的智能弹药识别方法,其特征在于,所述YOLOv5网络结构包括CSPDarknet53网络,所述CSPDarknet53网络中包含了52个卷积层,每层卷积层对输入的特征图进行卷积运算,并输出一个新的特征图。8.根据权利要求1所述的智能弹药识别方法,其特征...
【专利技术属性】
技术研发人员:白志远,孙玉宝,
申请(专利权)人:南京信息工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。