当前位置: 首页 > 专利查询>重庆大学专利>正文

一种药包检测计数方法技术

技术编号:38464932 阅读:5 留言:0更新日期:2023-08-11 14:41
本发明专利技术涉及一种基于改进的YOLOv5的药包检测计数方法,它包括S1获取原始图像数据集,对原始图像数据集中的图像做弱化非目标区域WNA数据增强处理,构建增强后的数据集;S2构建改进的YOLOv5s模型,利用增强后的数据集训练改进的YOLOv5s模型得到训练好的YOLOv5s模型;S3网络剪枝将训练好的YOLOv5s模型进行轻量化处理得到最优模型;S4将一张待预测原始图片输入最优模型,输出为一张有多个检测框的图片,每个检测框对应一个置信度,将图片中低于置信度阈值的检测框被删掉后,再将图片输入NMS方法处理后,输出最终检测图,该检测图中检测框的数量即为药包的数量。的数量即为药包的数量。的数量即为药包的数量。

【技术实现步骤摘要】
一种药包检测计数方法


[0001]本专利技术涉及目标检查方法,特别涉及一种基于改进的YOLOv5的药包检测计数方法。

技术介绍

[0002]传统的目标检测算法由区域建议、特征提取和区域分类边框回归三个阶段组成,区域建议是指找出输入图像中可能存在目标的区域,即感兴趣区域(RegionsofInterest,ROI)。由于目标可能以任意尺寸出现在图像任意位置,因此,传统方法大多使用不同尺度的滑动窗口遍历图像获得ROI区域。特征提取阶段常用尺度不变特征变换等方法提取ROI区域为特征向量。最后采用预训练的分类器检测ROI区域中物体的类别。
[0003]传统的目标检测算法在特征提取阶段往往依赖先验知识,具有一定的局限性。2012年起,卷积神经网络以其强大的特征提取能力进入研究人员的视野,由此产生一大批丰富的研究成果,其中,以卷积神经网络为基础的深度学习目标检测算法尤为显著。在此后多年的发展过程中逐渐形成了两大类别的目标检测方法:两阶段检测方法和一阶段检测方法。
[0004]两阶段检测方法基于提议的候选框,首先产生区域候选框,然后提取每个候选框的特征,最后产生位置框并检测类别,这种检测方法精度高但速度较慢。
[0005]一阶段检测方法是基于检测框的回归,即在产生候选框的同时对候选框进行分类和回归,对比两阶段检测方法,检测速度更快但精度有所下降。Zhu等人提出YOLOv5算法,YOLOv5算法是典型的一阶段检测方法,相比YOLOv4,YOLOv5加入了自适应图片缩放,使算法适用于任意尺寸输入的图像,同时在网络骨架部分将CSPDarkNet替换为CSP结构,加强了网络特征融合的能力。
[0006]目标检测计数的方法主要分为三类,分别是基于检测的方法、基于回归的方法和基于密度图的方法。其中,基于检测的方法主要有传统的基于HOG的检测器或基于深度学习的检测器,如YOLO或RCNN。这类方法的缺点是易受遮挡的影响。基于回归的方法是指从原始图像中捕获部分特征,使用机器学习模型来映射特征和计数数量之间的关系,由于传统图像处理、机器学习难以捕获有效特征,使得计数结果精度不高而逐渐被深度学习方法所取代。基于密度图的方法是目前目标检测计数的主流方法,不仅能给出目标数量,还能反映目标的密度分布情况。

技术实现思路

[0007]针对现有技术存在的上述问题,本专利技术要解决的技术问题是如何对药包进行准确计数。
[0008]为解决上述技术问题,本专利技术采用如下技术方案:一种药包检测计数方法,包括如下步骤:
[0009]S1:获取原始图像数据集,对原始图像数据集中的图像做弱化非目标区域WNA数据
增强处理,构建增强后的数据集;
[0010]S2:构建改进的YOLOv5s模型,利用增强后的数据集训练改进的YOLOv5s模型得到训练好的YOLOv5s模型;
[0011]S3:网络剪枝将训练好的YOLOv5s模型进行轻量化处理得到最优模型;
[0012]S4:将一张待预测原始图片输入最优模型,输出为一张有多个检测框的图片,每个检测框对应一个置信度,将图片中低于置信度阈值的检测框被删掉后,再将图片输入NMS方法处理后,输出最终检测图,该最终检测图中检测框的数量即为药包的数量。
[0013]作为优选,所述S1中构建增强后的数据集的过程如下:
[0014]WNA数据增强包含目标区域提取和弱化非目标区域两部分;其中,目标区域提取采用现有数字图像处理方法,弱化非目标区域是指将非目标区域像素置为原像素值乘一个的随机值α,目标区域保持原像素值不变。公式如下:
[0015][0016]其中,P(i,j)表示图像中(i,j)位置的像素值,σ表示目标区域,α∈[0,1]为随机值。
[0017]作为优选,所述S2中改进的YOLOv5s模型为主干网络在最后一层CBS+SPP+C3之前插入CBS+C3模块,同时将主干输出40
×
40
×
512、20
×
20
×
1024、10
×
10
×
2048的特征图连接到加强特征提取网络FPN,舍弃80
×
80
×
256特征图的输出。
[0018]作为优选,所述S3中网络剪枝将训练好的YOLOv5s模型进行轻量化的过程如下:
[0019]在YOLOv5模型中,每个卷积后都将进行批量标准化处理,使卷积后的输出值更加稳定。根据BN层模型公式:
[0020][0021]其中,ε为一个接近0的正值,为了防止方差σ
B
为0产生无效计算,为中间变量,无实际含义,z
in
和z
out
为BN层的输入和输出,μ
B
和σ
B
是当前小批量B上输入激活的平均值和标准差,γ和β是BN层的权重和偏差。每个通道输出z
out
和系数γ正相关,将其选为网络剪枝的缩放因子,当γ趋近于0时,输出也非常小,通过给γ添加L1正则化约束并作用于损失函数:
[0022][0023]其中,x,W,y,Γ分别表示神经网络输入向量、神经网络权重矩阵、理想输出向量、网络中所有BN层权重的集合;
[0024]L为稀疏训练损失函数,l(f(x,W),y)为正常训练损失函数,g(γ)=|γ|为L1正则化约束,λ为正则化系数,当进行反向传播时,每个通道将有两个连续的缩放因子γ,经过稀疏化训练后,删除所有输入输出连接以及相应的权重来修剪γ接近0的通道;通过后续微调过程补偿网络精度损失;最后经过反复多次迭代获得紧凑模型。
[0025]作为优选,所述S4中将图片输入NMS方法处理的步骤如下:
[0026]S4

1:对所有检测框按置信度降序排序;
[0027]S4

2:选出置信度最高的检测框,确认其为正确检测框,并计算正确检测框与其他
检测框的iou:
[0028][0029]其中,iou(a,b
c
)为检测框a与检测框b
c
的iou值,a为正确检测框,b
c
为第c个检测框,C为删除低于置信度阈值的检测框后图片中剩下的检测框数量;
[0030]S4

3:根据S4

2中计算的所有iou(a,b
c
),删除iou(a,b
c
)值大于NMS阈值的检测框,直到处理完所有检测框。
[0031]作为优选,所述NMS阈值选取步骤如下:
[0032]Step 1:使用LabelImg标注工具标注独立药包,仅标注药包1、2、3,Ω=(ω
i
)
n
表示n张原始图片组成的集合,ω
i
表示第i张图片,定义σ
i
=(θ
ij
)
m
表示ω...

【技术保护点】

【技术特征摘要】
1.一种药包检测计数方法,其特征在于,包括如下步骤:S1:获取原始图像数据集,对原始图像数据集中的图像做弱化非目标区域WNA数据增强处理,构建增强后的数据集;S2:构建改进的YOLOv5s模型,利用增强后的数据集训练改进的YOLOv5s模型得到训练好的YOLOv5s模型;S3:网络剪枝将训练好的YOLOv5s模型进行轻量化处理得到最优模型;S4:将一张待预测原始图片输入最优模型,输出为一张有多个检测框的图片,每个检测框对应一个置信度,将图片中低于置信度阈值的检测框被删掉后,再将图片输入NMS方法处理后,输出最终检测图,该最终检测图中检测框的数量即为药包的数量。2.如权利要求2所述的一种药包检测计数方法,其特征在于:所述S1中构建增强后的数据集的过程如下:WNA数据增强包含目标区域提取和弱化非目标区域两部分;其中,目标区域提取采用现有数字图像处理方法,弱化非目标区域是指将非目标区域像素置为原像素值乘一个的随机值α,目标区域保持原像素值不变,公式如下:其中,P(i,j)表示图像中(i,j)位置的像素值,σ表示目标区域,α∈[0,1]为随机值。3.如权利要求2所述的一种药包检测计数方法,其特征在于:所述S2中改进的YOLOv5s模型为主干网络在最后一层CBS+SPP+C3之前插入CBS+C3模块,同时将主干输出40
×
40
×
512、20
×
20
×
1024、10
×
10
×
2048的特征图连接到加强特征提取网络FPN,舍弃80
×
80
×
256特征图的输出。4.如权利要求3所述的一种药包检测计数方法,其特征在于:所述S3中网络剪枝将训练好的YOLOv5s模型进行轻量化的过程如下:在YOLOv5模型中,每个卷积后都将进行批量标准化处理,使卷积后的输出值更加稳定,根据BN层模型公式:其中,ε为一个接近0的正值,为了防止方差σ
B
为0产生无效计算,为中间变量,无实际含义,z
in
和z
out
为BN层的输入和输出,μ
B
和σ
B
是当前小批量B上输入激活的平均值和标准差,γ和β是BN层的权重和偏差,每个通道输出z
out
和系数γ正相关,将其选为网络剪枝的缩放因子,当γ趋近于0时,输出也非常小,通过给γ添加L1正则化约束并作用于损失函数:其中,x,W,y,Γ分别表示神经网络输入向量、神经网络权重矩阵、理想输出向量、网络中所有BN层权重的集合;L为稀疏训练损失函数,l(f(x,W),y)为正常训练损失函数,g(γ)=|γ|为L1正则化约束,λ为正则化系数,当进行反向传播时,每个通道将有两个连...

【专利技术属性】
技术研发人员:宋永端沈志熙王小清李涛
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1