金属零件表面文本检测方法和系统技术方案

技术编号：29491129 阅读：18 留言：0更新日期：2021-07-30 19:03

本发明专利技术提供了一种金属零件表面文本检测方法和系统，包括：预处理步骤：识别金属表面字符图像，对金属表面字符图像进行图像增强，得到预处理图像；前景特征聚焦步骤：基于预处理图像，通过深度卷积网络高亮文本区域的图像特征，得到显著图；多尺度矫正步骤：利用显著图的像素信息过滤金字塔网络不同层级的背景文本框，通过修正特征网络对被选中的文本框进行评估和预测，得到修正文本框；后处理步骤：计算修正文本框的实例分数，结合预测分数，应用非极大值抑制算法得到最终文本框位置。本发明专利技术解决了金属属性和工业环境导致的背景复杂的文本检测问题，实现了金属零件字符图像自动分割，输出高精度文本定位框，提高了检测精度。

全部详细技术资料下载

【技术实现步骤摘要】
金属零件表面文本检测方法和系统
本专利技术涉及文本检测
，具体地，涉及一种金属零件表面文本检测方法和系统。
技术介绍
文本信息作为信息时代关键一环，应用在网络电子信息、文本印刷、交通标志和产品商标等等，在科技时代起着越来越重要的作用，因此对于光学字符识别(OCR)的研究，在智能自动化、信息处理、AI等领域发挥着重要作用。企业资源计划的业务场景中孵化的光学字符识别(OCR)应用程序已受到广泛关注，例如手势识别，包装印刷识别和金属表面字符识别。其中，在许多工业场景中，金属零件的跟踪是最具挑战性的。直接金属零件标识技术是零件产品标识的主要手段，是指在制造和生产零部件时，直接把已确定的零部件信息打印在产品本身，主要包含激光雕刻、针孔打标和喷墨标识三种方式。OCR技术对金属零件表面字符标识的研究和分析，可以在各类机器的加工生产线上快速识别零件型号，生产信息和生产商等信息，防止人工因识别疲劳导致错误的发生，提高生产效率。现有的文本检测方法主要研究自然场景复杂性的影响，然而由于金属零件表面字符数据集较难收集，而且在金属零件文本检测领域，存在着金属表面强反光、金属质地差异较大、字符排列不一、前景和背景对比度较差以及金属纹理背景复杂等问题，导致文本检测框定位不够精准，这对应用金属零件追踪的字符识别是困难的。专利文献CN110222680A(申请号：CN201910416098.1)公开了一种城市生活垃圾物品外包装文本检测方法：采集城市垃圾物品外包装的图像数据集，并对图像数据集中的每个图像的文本区域进行标注...

【技术保护点】
1.一种金属零件表面文本检测方法，其特征在于，包括：/n预处理步骤：识别金属表面字符图像，对金属表面字符图像进行图像增强，得到预处理图像；/n前景特征聚焦步骤：基于预处理图像，通过深度卷积网络高亮文本区域的图像特征，得到显著图；/n多尺度矫正步骤：利用显著图的像素信息过滤金字塔网络不同层级的背景文本框，通过修正特征网络对被选中的文本框进行评估和预测，得到修正文本框；/n后处理步骤：计算修正文本框的实例分数，结合预测分数，应用非极大值抑制算法得到最终文本框位置。/n

【技术特征摘要】
1.一种金属零件表面文本检测方法，其特征在于，包括：
预处理步骤：识别金属表面字符图像，对金属表面字符图像进行图像增强，得到预处理图像；
前景特征聚焦步骤：基于预处理图像，通过深度卷积网络高亮文本区域的图像特征，得到显著图；
多尺度矫正步骤：利用显著图的像素信息过滤金字塔网络不同层级的背景文本框，通过修正特征网络对被选中的文本框进行评估和预测，得到修正文本框；
后处理步骤：计算修正文本框的实例分数，结合预测分数，应用非极大值抑制算法得到最终文本框位置。

2.根据权利要求1所述的金属零件表面文本检测方法，其特征在于，所述预处理步骤包括：
图像增强步骤：基于RGB图像自适应直方图均衡增强金属表面字符图像的局部对比度，同时采用拉普拉斯算子锐化金属表面字符图像，保留高频信息和高亮文本字符细节，得到预处理图像。

3.根据权利要求1所述的金属零件表面文本检测方法，其特征在于，所述前景特征聚焦步骤包括：
语义分割步骤：将金属表面字符图像送入多层次卷积网络，设置平行卷积结构和通道注意力机制融合高层次特征，增加自适应算子凸显低层次特征前景和背景的差值，并合并高层次特征和低层次特征得到显著图；
前景聚焦步骤：将显著图与带有标签信息的掩码图进行比较，为对比度和辨识度低于预设阈值的区域设置分割阈值获取更多的前景文本特征。

4.根据权利要求1所述的金属零件表面文本检测方法，其特征在于，所述多尺度矫正步骤包括：
多边形选择步骤：对显著图进行图像二值化处理，并将二值化结果作为掩码过滤不同层次的卷积网络生成的文本框和排除背景区域文本框，刷选得到多尺度的建议文本框；
位置矫正步骤：应用ROI池化模型对建议文本框编码到固定形状，提取ROI区域特征，送入分类和回归网络得到修正文本框。

5.根据权利要求1所述的金属零件表面文本检测方法，其特征在于，所述后处理步骤包括：
重新打分步骤：根据二值化后的显著图计算修正文本框的实例得分，并结合修正文本框的预测得分，对每一个修正文本框重新评估分值；
非极大值抑制步骤：应用NMS方法滤除重复的文本框，得到最终的文本框位置。

【专利技术属性】
技术研发人员：谷朝臣，官同坤，王臻，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人