一种基于轮廓的数字字符识别方法技术

技术编号:25523137 阅读:22 留言:0更新日期:2020-09-04 17:13
本发明专利技术提出了一种基于轮廓的数字字符识别方法,对待识别字符的目标数字图像进行预处理,包括灰度化处理和二值化处理;找最大外部闭合轮廓,勾选出感兴区域以去除杂乱的边缘背景的干扰,取得数字感兴区域;对选中的感兴数字区域进行自动的垂直分割和水平分割处理,获取并记录包含数字的最小区域以及各个数字字符的横纵轴的起始坐标和终点坐标位置;根据获取的数据坐标信息分割出理想感兴数字区域以及各个单一的数字区域;利用各个数字不同的轮廓特征进行数字识别并计算组合。本发明专利技术不需要大量的模板数据训练集的采集或者神经网络算法的学习训练,改良了普通的模板匹配法的等数据处理复杂、效率低下运算速度慢等特点。

【技术实现步骤摘要】
一种基于轮廓的数字字符识别方法
本专利技术属于计量检测
,具体为一种基于轮廓的数字字符识别方法。
技术介绍
目前计算机视觉技术快速发展,许多场景的人为读数耗时耗力,需要实现机器的自动化处理,如车牌识别,速度实时记录,车速检测等。目前数字最常用的识别方法有基于模板匹配的方法和基于神经网络的方法。模板匹配演变出基本的模板匹配法,以及以此衍生的SVM训练集等方法。模板匹配法大多统计了字符的轮廓、投影、网格等特征,遍历图像数据集进行匹配,会因为特征数据维数太大而使识别效率低、耗时较长且对于相似的字符识别能力较差;神经网络对于设计网络结构以及选择网络,硬件要求较高,不能用一般的ARM板开发,不利用开发与迁移,适用性较差;对于SVM训练集的方法,准确率较高,训练需要大量的训练子集,操作复杂,对于一些特定场合,不易操作学习,时间性也具有一定时延性,不利用一些要求响应速度处理较高的场合。
技术实现思路
本专利技术的目的在于提出了一种基于轮廓的数字字符识别方法。实现本专利技术目的的技术解决方案为:一种基于轮廓的数字字符识别方法,具体步骤为:步骤1:对待识别字符的目标数字图像进行预处理;步骤2:确定最大外部闭合轮廓;步骤3:对步骤2获得的最大外部闭合轮廓图像进行感兴区域分割,获取数字字符坐标;步骤4:根据获取的坐标信息分割各个单独数字;步骤5:根据数字轮廓特征进行识别,获得真实数字。优选地,对待识别字符的目标数字图像进行预处理的具体方法为:进行灰度化处理、自适应中值滤波、灰度化处理、二值化处理后获得二值化图像。优选地,对步骤2获得的最大外部闭合轮廓图像进行感兴区域分割,获取数字字符坐标的具体方法为:利用二值化图像的像素分布做投影分布图像;对其分别进行垂直分割和水平分割处理,获取一张以第一个数字的横纵轴坐标和最后一个数字的横纵轴临界点坐标为边界来进行水平、垂直分割获得OCR图像,并存储各个数字字符的二维图像起始坐标和终点坐标。优选地,根据获取的坐标信息分割各个单独数字的具体方法为:根据各个数字字符的二维图像起始坐标和终点坐标对图像进行垂直切割和水平切割,获得各个单独数字。本专利技术与现有技术相比,具有一下优点:(1)本专利技术无需训练数据集的采集与训练,操作简单,运算处理简单快捷,对环境要求不高,便于各类场合的数字字符的测量;(2)本专利技术无需归一化以及遍历模板库的复杂处理,处理简单,数据维度较小,识别效率较高。下面结合附图对本专利技术作进一步详细描述。附图说明图1是本专利技术经过灰度二值化处理后的图像。图2是本专利技术轮廓处理获取图像中感兴区域并在其中填充白色像素点的A图层的处理效果图。图3是本专利技术A图层拷贝到原图中以获得感兴区域的处理效果图。图4是本专利技术经过水平垂直分割后的处理效果图。图5是本专利技术经过每个字符独立分割后的图像并轮廓化处理的图像。图6是本专利技术的流程图。具体实施方式一种基于轮廓的数字字符识别方法,具体步骤为:步骤1:对待识别字符的目标数字图像进行预处理,具体方法为:对待识别字符的目标数字图像分别进行常规图像处理,分别进行灰度化处理、自适应中值滤波、灰度化处理、二值化处理后获得二值化图像。步骤2:确定最大外部闭合轮廓,具体方法为:利用图像的轮廓特性,寻找图像的最大外部闭合轮廓。可能由于一些特殊的拍摄情况,数字显示屏幕并不能完全成像在图像中,对图像的上下左右四周各增扩4个像素的白像素点来获得封闭的最大的外部轮廓信息;首先新建一个与原图相同尺寸的黑色的A图层,然后在A图层上,将最大轮廓里面的空间用白色像素填充。之后将原图利用图像复制函数叠加到A图层上,就可以获得最大轮廓内的所有像素点信息,去除了周围杂乱点图像信息的干扰。步骤3:对步骤2获得的最大外部闭合轮廓图像进行感兴趣区域分割。即对包含所有感兴趣区域的最小区域以及单个数字的提取。具体方法为:利用二值化图像生成黑白像素分布特征直方图,并根据像素的分布直方图中的间隔变换特征以及变化率等作为辨识条件获得第一个数字以及最后一个数字的横纵轴的临界点坐标,然后利用坐标对原图分别进行垂直分割和水平分割处理,来获取一张包含所有数字的感兴趣数字图像大区域以及各个数字字符的二维图像起始坐标和终点坐标位置。步骤4:根据划分获取的坐标信息分割各个单独数字。具体方法为:主要利用步骤3所获得的单个数字字符的包围矩的四个点坐标对图像进行垂直切割和水平切割并依次存储在函数容器中待用。其中要考虑特定情况的是有些数字带有小数点显示,需要加入每个数字的右小角区域扫描,结合如圆检测以及小轮廓检测等来准确实现小数点的准确判断。步骤5:根据数字轮廓特征进行识别,获得真实数字。具体方法为:首先介于数字的右小角可能对轮廓的判断的影响,对轮廓先进行筛选。筛选后根据轮廓的特征来进行数字的判断。对于轮廓个数为1的应该为数字1、2、3、5、7,轮廓个数为2的是数字0、4、6、9,轮廓个数为3的仅为8。对于轮廓的1的数字:利用数字像素的纵横比来确定数字1,利用像素的分布特点(计算白像素点在特定的行列范围的个数)和轮廓重心分布来区别数字2、3和7,数字3为近似对称分布以及重心特点来判断;对于轮廓为2的数字:先检测是否含有角点的三角形的区域来判断数字4,继而利用轮廓重心和像素分布特点来判定数字0、6和9;对于轮廓个数为3的可以直接判断得出。最后将识别的数字组合与可能包含的小数点一并处理并输出。本文档来自技高网...

【技术保护点】
1.一种基于轮廓的数字字符识别方法,其特征在于,具体步骤为:/n步骤1:对待识别字符的目标数字图像进行预处理;/n步骤2:确定最大外部闭合轮廓;/n步骤3:对步骤2获得的最大外部闭合轮廓图像进行感兴区域分割,获取数字字符坐标;/n步骤4:根据获取的坐标信息分割各个单独数字;/n步骤5:根据数字轮廓特征进行识别,获得真实数字。/n

【技术特征摘要】
1.一种基于轮廓的数字字符识别方法,其特征在于,具体步骤为:
步骤1:对待识别字符的目标数字图像进行预处理;
步骤2:确定最大外部闭合轮廓;
步骤3:对步骤2获得的最大外部闭合轮廓图像进行感兴区域分割,获取数字字符坐标;
步骤4:根据获取的坐标信息分割各个单独数字;
步骤5:根据数字轮廓特征进行识别,获得真实数字。


2.根据权利要求1所述的基于轮廓的数字字符识别方法,其特征在于,对待识别字符的目标数字图像进行预处理的具体方法为:
进行灰度化处理、自适应中值滤波、灰度化处理、二值化处理后获得二值化图像。


3.根据权利要...

【专利技术属性】
技术研发人员:房红兵饶子东
申请(专利权)人:南京理工大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1