一种药包检测计数方法技术

技术编号：38464932 阅读：5 留言：0更新日期：2023-08-11 14:41

本发明专利技术涉及一种基于改进的YOLOv5的药包检测计数方法，它包括S1获取原始图像数据集，对原始图像数据集中的图像做弱化非目标区域WNA数据增强处理，构建增强后的数据集；S2构建改进的YOLOv5s模型，利用增强后的数据集训练改进的YOLOv5s模型得到训练好的YOLOv5s模型；S3网络剪枝将训练好的YOLOv5s模型进行轻量化处理得到最优模型；S4将一张待预测原始图片输入最优模型，输出为一张有多个检测框的图片，每个检测框对应一个置信度，将图片中低于置信度阈值的检测框被删掉后，再将图片输入NMS方法处理后，输出最终检测图，该检测图中检测框的数量即为药包的数量。的数量即为药包的数量。的数量即为药包的数量。

全部详细技术资料下载

【技术实现步骤摘要】
一种药包检测计数方法

[0001]本专利技术涉及目标检查方法，特别涉及一种基于改进的YOLOv5的药包检测计数方法。

技术介绍

[0002]传统的目标检测算法由区域建议、特征提取和区域分类边框回归三个阶段组成，区域建议是指找出输入图像中可能存在目标的区域，即感兴趣区域(RegionsofInterest,ROI)。由于目标可能以任意尺寸出现在图像任意位置，因此，传统方法大多使用不同尺度的滑动窗口遍历图像获得ROI区域。特征提取阶段常用尺度不变特征变换等方法提取ROI区域为特征向量。最后采用预训练的分类器检测ROI区域中物体的类别。
[0003]传统的目标检测算法在特征提取阶段往往依赖先验知识，具有一定的局限性。2012年起，卷积神经网络以其强大的特征提取能力进入研究人员的视野，由此产生一大批丰富的研究成果，其中，以卷积神经网络为基础的深度学习目标检测算法尤为显著。在此后多年的发展过程中逐渐形成了两大类别的目标检测方法：两阶段检测方法和一阶段检测方法。
[0004]两阶段检测方法基于提议的候选框，首先产生区域候选框，然后提取每个候选框的特征，最后产生位置框并检测类别，这种检测方法精度高但速度较慢。
[0005]一阶段检测方法是基于检测框的回归，即在产生候选框的同时对候选框进行分类和回归，对比两阶段检测方法，检测速度更快但精度有所下降。Zhu等人提出YOLOv5算法，YOLOv5算法是典型的一阶段检测方法，相比YOLOv4，YOLOv5加入了自适应图片缩放，使算法适用于任意尺寸输入的图像，同时在网

【技术保护点】

【技术特征摘要】
1.一种药包检测计数方法，其特征在于，包括如下步骤：S1：获取原始图像数据集，对原始图像数据集中的图像做弱化非目标区域WNA数据增强处理，构建增强后的数据集；S2：构建改进的YOLOv5s模型，利用增强后的数据集训练改进的YOLOv5s模型得到训练好的YOLOv5s模型；S3：网络剪枝将训练好的YOLOv5s模型进行轻量化处理得到最优模型；S4：将一张待预测原始图片输入最优模型，输出为一张有多个检测框的图片，每个检测框对应一个置信度，将图片中低于置信度阈值的检测框被删掉后，再将图片输入NMS方法处理后，输出最终检测图，该最终检测图中检测框的数量即为药包的数量。2.如权利要求2所述的一种药包检测计数方法，其特征在于：所述S1中构建增强后的数据集的过程如下：WNA数据增强包含目标区域提取和弱化非目标区域两部分；其中，目标区域提取采用现有数字图像处理方法，弱化非目标区域是指将非目标区域像素置为原像素值乘一个的随机值α，目标区域保持原像素值不变，公式如下：其中，P(i,j)表示图像中(i,j)位置的像素值，σ表示目标区域，α∈[0,1]为随机值。3.如权利要求2所述的一种药包检测计数方法，其特征在于：所述S2中改进的YOLOv5s模型为主干网络在最后一层CBS+SPP+C3之前插入CBS+C3模块，同时将主干输出40
×
40
×
512、20
×
20
×
1024、10
×
10
×
2048的特征图连接到加强特征提取网络FPN，舍弃80
×
80
×
256特征图的输出。4.如权利要求3所述的一种药包检测计数方法，其特征在于：所述S3中网络剪枝将训练好的YOLOv5s模型进行轻量化的过程如下：在YOLOv5模型中，每个卷积后都将进行批量标准化处理，使卷积后的输出值更加稳定，根据BN层模型公式：其中，ε为一个接近0的正值，为了防止方差σ
B
为0产生无效计算，为中间变量，无实际含义，z
in
和z
out
为BN层的输入和输出，μ
B
和σ
B
是当前小批量B上输入激活的平均值和标准差，γ和β是BN层的权重和偏差，每个通道输出z
out
和系数γ正相关，将其选为网络剪枝的缩放因子，当γ趋近于0时，输出也非常小，通过给γ添加L1正则化约束并作用于损失函数：其中，x，W，y，Γ分别表示神经网络输入向量、神经网络权重矩阵、理想输出向量、网络中所有BN层权重的集合；L为稀疏训练损失函数，l(f(x,W),y)为正常训练损失函数，g(γ)＝|γ|为L1正则化约束，λ为正则化系数，当进行反向传播时，每个通道将有两个连...

【专利技术属性】
技术研发人员：宋永端，沈志熙，王小清，李涛，
申请(专利权)人：重庆大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人