基于YOLOV5优化的任意角度图像垃圾检测方法技术

技术编号:39411398 阅读:17 留言:0更新日期:2023-11-19 16:03
本发明专利技术公开一种基于YOLOV5优化的任意角度图像垃圾检测方法,首先收集垃圾图像数据集完成初始数据集标注。然后基于原始数据集数据增强处理,得到新的数据集。数据扩增和增加场景多样性能提高模型的精度和应用的泛化能力。接着针对YOLOV5模型进行改进,通过修改网络检测头,增加角度预测分支,实现图像任意角度垃圾目标的准确定位。并通过优化YOLOV5的特征提取网络和特征连接网络,并增加坐标注意力机制模块,提高模型的特征学习能力。本申请可针对垃圾目标生成任意角度的检测框,使生成的检测框与物体实际位置覆盖更精确,有利于模型的实际应用。际应用。际应用。

【技术实现步骤摘要】
基于YOLOV5优化的任意角度图像垃圾检测方法


[0001]本专利技术涉及计算机视觉与智能垃圾检测分拣领域,更具体地,涉及一种基于YOLOV5优化的任意角度图像垃圾检测方法。

技术介绍

[0002]目前,垃圾清扫和分拣主要依靠人工进行,垃圾存在大量细菌,对作业人员身体健康造成较大影响。近年来,图像智能识别和人工智能技术快速发展,将图像检测技术应用在垃圾种类识别和位置识别上,然后结合机器手或者机器人,从而完成垃圾物体的智能自动分拣,极大提高垃圾清理的效率,降低人力成本和城市污染。
[0003]现有技术公开了一种基于深度学习的垃圾检测分类与推断方法,涉及计算机图像处理
使用联合的深度学习、卷积神经网络和推断映射的方法,实现根据垃圾目标检测的图片数据集中的垃圾图片,进行垃圾位置检测、垃圾种类分类与垃圾物理性质推断的技术。但是该方案只能生成水平或垂直的标准角度垃圾检测框。而在实际自然场景下,垃圾目标的角度多样复杂。如果只能生成标准角度的检测框,当图像中垃圾目标与水平方向存在角度时,检测框无法精确反映垃圾物体的具体位置和方向,不利于机器手的精准识别和分拣。同时现有检测网络性能和检测精度一般,存在一定的优化空间。

技术实现思路

[0004]本专利技术提供一种基于YOLOV5优化的任意角度图像垃圾检测方法,实现针对自然场景下,垃圾物体图像任意角度的检测。
[0005]为解决上述技术问题,本专利技术的技术方案如下:
[0006]一种基于YOLOV5优化的任意角度图像垃圾检测方法,包括以下步骤:
[0007]S1:通过拍摄采集、爬虫等获取多源的垃圾图像数据集并进行数据标注,所述数据标注包括物体框长边与横坐标顺时针角度值,其中角度值范围为[0
°
,180
°
),并且通过标签平滑算法对标签样式进行优化,提高模型训练效果;;
[0008]S2:对获取的垃圾图像数据集进行数据增强和数据扩充处理,得到增强数据集;
[0009]S3:修改YOLOV5的网络检测头,添加角度预测卷积网络分支,所述角度预测卷积网络分支用于对图像中物体的角度进行预测,并且优化YOLOV5的特征提取网络、特征连接网络及损失函数,得到YOLOV5优化模型;
[0010]S4:将含数据标注的增强数据集输入至所述YOLOV5优化模型进行训练学习,得到训练好的YOLOV5优化模型;
[0011]S5:利用训练好的YOLOV5优化模型进行任意角度垃圾的检测识别并预测垃圾的角度。
[0012]优选地,所述步骤S1中通过拍摄采集、爬虫等获取多源的垃圾图像数据集。
[0013]优选地,所述步骤S1对标注物体框长边与横坐标顺时针角度值时,对于长宽比较大的垃圾种类,采用角度平滑方法对标签进行处理:
[0014][0015]式中,x表示角度标签值,b为常数,用于控制角度平滑的峰值位置,a为平滑函数的峰值,式子中,l和s表示物体框的长边长度和短边长度,对于长宽比小于5的物体框的角度标签不做处理,对于大于5的进行高斯函数处理,处理后使得g(x)在样本真实角度标签值位置取得最高值,而且一定的近邻范围内进行递减,超过近邻范围则趋向0;近邻范围和平滑幅度由长宽比的值控制且最大不超过8。
[0016]优选地,所述步骤S1中数据标注还包括图像中的物体类别、物体中心坐标、物体框长边长度和物体框短边长度。
[0017]优选地,所述步骤S2中对获取的垃圾图像数据集进行数据增强和数据扩充处理,具体为:
[0018]对获取的垃圾图像数据集通过角度变换、翻转等进行数据扩充及多样化,并使用“椒盐噪声”对垃圾图像进行处理。
[0019]优选地,所述步骤S3中修改YOLOV5的网络检测头,添加角度预测卷积网络分支,具体为:
[0020]在YOLOV5的3个网络检测头中添加卷积神经网络分支,所述添加的卷积神经网络的卷积核通道数为角度类别数,即180,修改后的每个卷积神经网络的尺寸为:(256,na*(nc+5+n_angle),1,1),(512,na*(nc+5+n_angle),1,1),(1024,na*(nc+5+n_angle),1,1),其中,na为每个检测头输出的检测框数量,nc表示检测的类别数目,n_angle表示预测的角度种类。
[0021]优选地,所述步骤S3中优化YOLOV5的特征提取网络,具体为:
[0022]对特征提取网络中的BottleneckCSP模块进行优化,所述BottleneckCSP模块由Bottleneck模块的堆叠连接得到,对BottleneckCSP模块进行优化具体为:
[0023]将BottleneckCSP模块的中间层的Bottleneck模块的特征图层,与最后一层的Bottleneck模块的特征图层进行汇聚,得到优化后的BottleneckCSP模块,命名为HD

BottleneckCSP模块。
[0024]优选地,所述步骤S3中优化YOLOV5的特征连接网络,具体为:
[0025]在YOLOV5中各网络检测头之间的连接增加浅层网络中的特征图和基于坐标注意力机制的CA

Attention模块。
[0026]优选地,所述步骤S3中优化YOLOV5的损失函数,具体为:
[0027]目标框回归损失计算公式:
[0028]loss
giou
=1

GIOU(A,B)
[0029]置信度损失函数和类别损失函数计算公式:
[0030][0031][0032]其中,和表示第i个格子的第j个预测框对应存在目标或不存在目标,λ
noobj
为权重系数;和c
i
表示是否存在目标的真实值和预测值,取值均为0或者1;和p
i
(c)分别表示目标类别真实值和预测结果;
[0033]角度损失函数:
[0034][0035]式子中,a表示角度标签,angles表示角度的取值范围,从0
°
~180
°
,表示先对角度标签a进行g(x)平滑函数进行处理,并转化为角度值概率,p
i
(a)则表示预测为角度a的概率;
[0036]分别为四个损失函数设置权重值,得到最终的损失函数计算式子:
[0037]Loss=0.1*loss(giou)+loss(obj)+0.5*loss(cls)+0.8*loss(angle)。
[0038]优选地,所述步骤S4中将含数据标注的增强数据集输入至所述YOLOV5优化模型进行训练学习前,还进行以下步骤:
[0039]提取YOLOV5优化模型的Backbone网络部分,建立分类模型,在不含标注框的大规模垃圾图像分类数据集上进行预训练,得到预训练权重,并在YOLOV5优化模型训练时将预训练权重加载进YOLOV5优化模型的Backbone网络部分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于YOLOV5优化的任意角度图像垃圾检测方法,其特征在于,包括以下步骤:S1:通过拍摄采集、爬虫等获取多源的垃圾图像数据集并进行数据标注,所述数据标注包括物体框长边与横坐标顺时针角度值,其中角度值范围为[0
°
,180
°
)并且通过标签平滑算法对标签样式进行优化;S2:对获取的垃圾图像数据集进行数据增强和数据扩充处理,得到增强数据集;S3:修改YOLOV5的网络检测头,添加角度预测卷积网络分支,所述角度预测卷积网络分支用于对图像中物体的角度进行预测,并且优化YOLOV5的特征提取网络、特征连接网络及损失函数,得到YOLOV5优化模型;S4:将含数据标注的增强数据集输入至所述YOLOV5优化模型进行训练学习,得到训练好的YOLOV5优化模型;S5:利用训练好的YOLOV5优化模型进行任意角度垃圾的检测识别并预测垃圾的角度。2.根据权利要求1所述的基于YOLOV5优化的任意角度图像垃圾检测方法,其特征在于,所述步骤S1对标注物体框长边与横坐标顺时针角度值时,对于长宽比较大的垃圾种类,采用角度平滑方法对标签进行处理:式中,x表示角度标签值,b为常数,用于控制角度平滑的峰值位置,a为平滑函数的峰值,式子中,l和s表示物体框的长边长度和短边长度,对于长宽比小于5的物体框的角度标签不做处理,对于大于5的进行高斯函数处理,处理后使得g(x)在样本真实角度标签值位置取得最高值,而且一定的近邻范围内进行递减,超过近邻范围则趋向0;近邻范围和平滑幅度由长宽比的值控制且最大不超过8。3.根据权利要求1所述的基于YOLOV5优化的任意角度图像垃圾检测方法,其特征在于,所述步骤S1中数据标注还包括图像中的物体类别、物体中心坐标、物体框长边长度和物体框短边长度。4.根据权利要求1所述的基于YOLOV5优化的任意角度图像垃圾检测方法,其特征在于,所述步骤S2中对获取的垃圾图像数据集进行数据增强和数据扩充处理,具体为:对获取的垃圾图像数据集通过角度变换、翻转等进行数据扩充及多样化,并使用“椒盐噪声”对垃圾图像进行处理。5.根据权利要求1所述的基于YOLOV5优化的任意角度图像垃圾检测方法,其特征在于,所述步骤S3中修改YOLOV5的网络检测头,添加角度预测卷积网络分支,具体为:在YOLOV5的3个网络检测头中添加卷积神经网络分支,所述添加的卷积神经网络的卷积核通道数为角度类别数,即180,修改后的每个卷积神经网络的尺寸为:(256,na*(nc+5+n_angle),1,1),(512,na*(nc+5+n_angle),1,1),(1024,na*(nc+5+n_angle),1,1),其中,na为每个检测头输出的检测框数量,nc表示检测的类别数目,n_angle表示预测的角度种类。6.根据权利要求1所述的基于YOLOV5优化的任意角度图像垃圾检测方法,其特征在于,所述步骤S3中优化YOLOV5的特征提取网络,具体为:对特征提取网络中的BottleneckCSP模块进行优化,所述BottleneckCSP模块由
Bottl...

【专利技术属性】
技术研发人员:杨伟志赵小蕾
申请(专利权)人:广州新华学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1