字符识别方法技术

技术编号:8594254 阅读:168 留言:0更新日期:2013-04-18 07:32
本发明专利技术涉及一种该字符识别方法,其包括:步骤1:读入字符图像;步骤2:图像预处理;步骤3:字符切割;步骤4:边缘提取;运用边缘检测算子检测出字符的边缘点;步骤5:特征提取,每一字符的每一边缘点的特征都用该字符其他边缘点到该边缘点的距离表达,用特征向量(P1k,P2k…PMk)表示;步骤6:特征处理,将特征向量(P1k,P2k…PMk)映射到一个矩阵T中,使得所有字符的特征向量维度相同;步骤7,模板匹配识别。由于字符的每一边缘点的特征都用该字符其他边缘点到该边缘点的距离表达,从整个字符保证了特征的全局性,扩大了不同字符间特征的差异,从而提高了字符识别率。

【技术实现步骤摘要】

本专利技术属于光学字符识别领域,涉及一种光学字符识别法。
技术介绍
在字符识别过程,字符特征提取是至关重要的一步。特征提取可以看作对原始字符关键信息的抽取,所以特征要尽可能的体现不同字符间的差异,换句话说,不同类字符特征之间的距离要尽可能大。如果特征选取不当,无论选择什么样的分类器也无法达到很好的识别率。识别一个字符通常是提取字符的边缘或者提取字符的骨架,然后再在边缘或者骨架上再提取特征。现有方法在描述边缘或者骨架上的点时,仅仅是考虑到当前点本身的信息。如用(X,y, f (X,y))作为边缘或者骨架上的一点P的特征,其中X,y表示点P坐标,f(x, y)表示亮度值,这样提取出来的特征具有局部性,如果两个字符局部形态相近(如Q和O),那么这两个字符提取出来的特征具有很大的相似性,这样就不利于区分这两个字符,导致系统识别率下降。因此,提供一种新的特征提取方法,用另外一个思路来描述字符边缘或者骨架上的点,扩大字符特征的差异,从而提高字符的识别率,非常重要。
技术实现思路
本专利技术的目的在于提供一种,通过扩大不同字符间特征的差异,提高字符识别率。该包括步骤1:读入字符图像;步骤2 图像预处理;步骤3:字符切割;步骤4 :边缘提取;运用边缘检测算子检测出字符的边缘点;步骤5 :特征提取,每一字符的每一边缘点的特征都用该字符其他边缘点到该边缘点的距离表达,用特征向量(Plk,P2k…Put)表示,因此每一字符的特征向量用矩阵(P21 Pn …Pm )

【技术保护点】
一种字符识别方法,包括:步骤1:读入字符图像;步骤2:图像预处理;步骤3:字符切割;步骤4:边缘提取,运用边缘检测算子检测出字符的边缘点;步骤5:特征提取,每一字符的每一边缘点的特征都用该字符其他边缘点到该边缘点的距离表达,用特征向量(P1k,P2k…PMk)表示,因此每一字符的特征向量用矩阵表示;步骤6:特征处理,将特征向量(P1k,P2k…PMk)映射到一个矩阵T中,使得所有字符的特征向量维度相同,其中步骤7:模板匹配,假设待识别字符Θ的边缘中有X1,X2…XM共M个点,一个标准字符模板Δ中有Y1,Y2…YN共N个点,点Xi与标准字符模板Δ中点Yj的距离用如下算式计算:Dij≡D(Xi,Yj)=Σm=1uΣn=1v(Ti(m,n)-Tj(m,n))2;记:Diπ(i)=minDij,表示标准字符模板Δ中的点Yπ(i)是点Xi的最佳匹配点;待识别字符Θ到标准字符模板Δ的总距离为:如果共有Γ个标准字符模板,则分别计算待识别字符Θ到每一标准字符模板的总距离,总距离最小的为待识别的结果。FDA00002728229800011.jpg,FDA00002728229800012.jpg,FDA00002728229800014.jpg...

【技术特征摘要】
1.一种字符识别方法,包括步骤1:读入字符图像;步骤2:图像预处理;步骤3 :字符切割;步骤4 :边缘提取,运用边缘检测算子检测出字符的边缘点;步骤5 :特征提取,每一字符的每一边缘点的特征都用该字符其他边缘点到该边缘点的距离表达,用特征向量(Plk,P2k…PMk)表示,因此每一字符的特征向量用矩阵2.如权利要求1所述的字符识别方法,其特征在于,步骤6中将特征向量(Plk,P2k-PMk) 映射到一个矩阵T中的步骤具体包括步骤61,设字符边缘上的任意一点的特征向量的一个分量Pij = (Iij, Θ Jj), Iij e [O, L],Θ u e ...

【专利技术属性】
技术研发人员:梁添才王锟王卫锋刘思伟
申请(专利权)人:广州广电运通金融电子股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1