一种基于改进YOLOV5模型的纸质药盒钢印字符识别方法技术

技术编号：38323613 阅读：15 留言：0更新日期：2023-07-29 09:05

本发明专利技术公开了一种基于改进YOLOV5模型的纸质药盒钢印字符的识别方法，方法包括：使用图像采集设备采集药盒的钢印字符图像；对图像进行图像增强等预处理并且对识别区域打上标签；输入至改进的YOLOV5模型中进行训练，得到训练完成的YOLOV5模型；改进的YOLOV5模型包括：在YOLOV5的骨干网络中添加高效位置注意力机制CA(Coordinateattention)使得模型网络能够关注大范围的位置信息又不会带来过多的计算量，有助于模型性能提升以及更好地定位和识别目标；用SimSPPF替换SPPF快速池化层，提升训练速度；针对密集的小目标，在模型内额外使用了一个更小的先验框并且相应的增加了一个更小的检测头；将待识别的数据集输入处理，得到最终的预测结果。最终的预测结果。最终的预测结果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于改进YOLOV5模型的纸质药盒钢印字符识别方法

[0001]本专利技术涉及药盒目标识别领域，特别涉及一种基于改进YOLOV5模型的纸质药盒钢印字符识别方法。

技术介绍

[0002]钢印字符是各类药盒、食品、机器铭牌、工业材料上经常出现的字符，主要包括有出厂编号、生产日期、工作条件等信息。相较于喷墨字符、印刷字符等方式，钢印字符的过程相对简单，并且不易受环境污染、不易受物理磨损、不会随时间而脱落等影响字符的可读性，对药盒来说，最重要的就是产品的生产日期以及使用期限，所以很多药盒会选择钢印字符。而钢印的准确性是保证消费者能在规定时限内使用药品必要条件，故识别药盒上的钢印字符是关键一环。
[0003]起初的生产厂商流水生产线上，通常依靠雇佣劳动力识别的方式来检测产品的钢印字符。这种检测方式不仅速度较慢，而且因为人的主观能动性，每个人对字符清晰度的判断并不一样，漏检、错检率较高，并且雇佣劳动力需要花费较大的成本。另外随着生活科技的发展，依靠机器来识别钢印字符的情况逐渐崭露头角，OCR文字识别、模板匹配识别等手段逐渐丰富，在选择印刷字符、喷墨字符等方式的厂商中，因为生产日期、使用期限等字符的清晰度较高，且和背景颜色相差明显，易于一般的图像处理手段进行字符识别。但对于钢印字符这种目标和背景颜色相近，对比并不明显，另外相机获取在流水线上较快移动的药盒图像时会出现对焦不准等情况，导致获得的图像不清晰，不利于传统图像处理进行识别。由于背景光线等环境的影响，并且识别目标不在一个平面上，会进一步加大钢印字符识别的难度，获得...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOV5模型的纸质药盒钢印字符识别方法，其特征在于，包括如下步骤：S1、使用相机获取清晰以及模糊纸质药盒的钢印字符图像，经过图像增强扩充图像后，对其进行人工标注类别制作成YOLO格式的数据集；S2、按照比例将所述数据集划分为验证集、训练集和测试集；S3、根据实际运行的计算机内存、显卡和显存的配置信息对参数batch_size、workers和Epoch进行设置；S4、载入预训练模型，随机初始化网络权重，将数据集输入至改进的YOLOV5模型中进行训练；S5、所述YOLOV5模型由Backbone网络、Neck网络、Head网络组成；所述Backbone网络对所述数据集进行特征提取，所述Neck网络双塔结构采样进一步提取特征，所述Head网络利用提取的特征通过网格的anchor的不同尺寸的特征上进行目标预测；S6、网络训练一轮得到的训练预测图对先验框进行调整得到预测框，再和目标的真实框计算IoU，表示预测框和真实框的交并比，根据目标回归函数CIoU得到的定位损失，然后将分类损失、置信度损失、定位损失加权获得网络的总损失；S7、将损失反向传播至改进的YOLOV5模型中，依靠SGD随机梯度下降法更新网络权重参数，获得新的权重模型；S8、经过S3)中设定的Epoch值，重复步骤S4)
‑
S7)，每一轮更新的网络模型参数，作为下一轮的预训练模型开始新一轮训练；根据每一轮获得的指标信息；最终得到一个设定训练轮数内的最佳模型；S9、将测试集中的待测图像输入至步骤S8)的最佳模型中训练，输出所得的预测框，根据NMS极大值抑制，依据每个类别的标签对所有预测框进行分组，并将组中的置信度对其进行从大到小的排序，获得得分最高的矩形框，然后遍历剩余的矩形框并计算与得分最高的矩形框的交集与并集的比值，如果大于预设阈值，则将其移除，然后对剩余的检测框不断进行上述操作，直至得到最终的预测框，实现药盒钢印字符的识别；得到最终的预测框，实现药盒钢印字符的识别。2.根据权利要求1所述的一种基于改进YOLOV5模型的纸质药盒钢印字符识别方法，其特征在于：步骤S1)中的图像增强扩充数据集方式包括：图像对比度、图像模糊、图像加噪、图像缩放和图像旋转。3.根据权利要求2所述的一种基于改进YOLOV5模型的纸质药盒钢印字符识别方法，其特征在于：使用在线网页工具MakeSence对获得的图像进行标注，预先设定好所需识别的类别，用矩形框对所需识别的生产日期进行框选，打上相应的类别标签，对所有图像完成标签后输出YOLO标签的TXT格式，标记内容分别为类别(class)，归一化后的矩形中心xy坐标(x_center，y_center)以及矩形的宽度(...

【专利技术属性】
技术研发人员：王俊茹，黄杨乐天，刘宜胜，向忠，
申请(专利权)人：浙江理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人