基于双向注意力机制增强YOLOV5的目标检测方法技术

技术编号：32910629 阅读：59 留言：0更新日期：2022-04-07 12:01

本发明专利技术属于机器视觉领域，公开了基于双向注意力机制的YOLOV5的目标检测方法，将数据集按比例分为训练数据集和测试数据集；对训练数据集的图片归一化为固定大小的图片；将归一化后的图片先输入到增加输出层的骨干网络，再经过双向注意力机制模块后，在使用改进的损失函数计算的YOLOv5网络中训练和测试；将归一化后的实时数据图片输入到改进后的YOLOv5网络中，输出目标检测结果。本发明专利技术提高了对目标的检测能力，解决网络对特征差异不敏感的问题，解决训练过程目标框回归不稳定的问题，保证了anchor框和目标框之间的长宽比的一致性。anchor框和目标框之间的长宽比的一致性。anchor框和目标框之间的长宽比的一致性。

全部详细技术资料下载

【技术实现步骤摘要】
基于双向注意力机制增强YOLO V5的目标检测方法

[0001]本专利技术属于机器视觉、目标识别
，尤其涉及基于双向注意力机制增强YOLO V5的目标检测方法。

技术介绍

[0002]近年来，基于深度学习的目标检测算法在检测效果方面取得了很大的突破，同传统方法相比检测性能有着质的飞跃。深度学习目标检测算法根据设计思想的不同可以分成两大类，分别是一阶段方法(One
‑
stage)，与二阶段方法(Two
‑
stage)算法，二阶段方法算法将检测过程分成两大部，首先生成待检测区域，然后基于此进行目标检测。随后出现的Fast
‑
RCNN、Mask
‑
RCNN与Faster
‑
RCNN，使检测精度不断提高，但速度相对较慢。一阶段方法算法直接产生物体的类别概率和位置坐标，单次检测就得到最终的检测结果，典型的算法有YOLO、SSD、DSSD，性能最为突出的就是YOLO V5，其核心思想是将目标检测看做回归问题求解，通过图片的全部像素点直接得到检测框，检测速度快是其最大特点，缺点在于检测小目标物体时会出现漏检误检的问题，并不完全适用于小目标检测。

技术实现思路

[0003]有鉴于此，本专利技术提出了一种改进的基于双向注意力机制增强YOLO V5目标检测算法，通过改进算法的网络结构、加入双向注意力机制和浅层特征输出层，以及优化模型损失函数的方法，使改进后的算法更加适用于小目标检测。
[0004]针对网络结构加强对低层...

【技术保护点】

【技术特征摘要】
1.基于双向注意力机制增强YOLO V5的目标检测方法，其特征在于，所述方法应用于基于双向注意力机制增强YOLOv5网络，所述基于双向注意力机制增强YOLOv5网络在YOLOv5网络的骨干网络增加输出层和双向注意力机制模块，所述方法包括以下步骤：将数据集按比例分为训练数据集和测试数据集；对训练数据集的图片归一化为固定大小的图片；将归一化后的图片先输入到增加输出层的骨干网络，再经过双向注意力机制模块后，在使用改进的损失函数计算的YOLOv5网络中训练和测试；将归一化后的实时数据图片输入到训练好的基于双向注意力机制增强YOLOv5网络中，输出目标检测结果。2.根据权利要求1所述的基于双向注意力机制增强YOLO V5的目标检测方法，其特征在于，所述改进的损失函数如下：其中:A为预测框，B为真实框；A
ctr
为预测框中心点坐标，B
ctr
为真实框中心点坐标，ρ(.)是欧式距离计算；C为A、B最小包围框的对角线长度，IoU为交并比损失函数；是欧式距离计算；C为A、B最小包围框的对角线长度，IoU为交并比损失函数；w
gt
和h
gt
分别表示真实框的宽和高；w和h分别表示预测框的宽和高。3.根据权利要求1所述的基于双向注意力机制增强YOLO V5的目标检测方法，其特征在于，所述基于双向注意力机制增强YOLOv5网络在YOLOv5网络的Backbone部分的第一个残差组件CSP后引出浅层特征，在骨干网络提取特征后在Neck部分中对原网络增加第一输出层，所述第一输出层输出特征大小为160
×
160
×
255。4.根据权利要求1所述的基于双向注意力机制增强YOLO V5的目标检测方法，其特征在于，所述基于双向注意力机制增强YOLOv5网络在YOLOv5网络的Backbone部分中，在最后一个残差组件CSP后增加双向注意力特征加强模块，特征图经...

【专利技术属性】
技术研发人员：张媛，倪鹏，杨金龙，刘佳，朱志鑫，
申请(专利权)人：江苏省特种设备安全监督检验研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人