字符的识别方法技术

技术编号:2937025 阅读:172 留言:0更新日期:2012-04-11 18:40
一种字符识别方法包括有对每个确定字符图形轮廓的象素指定一多元预定定向码的步骤。而后,已经指定有定向码字符图形被细分成多元格网区域,在该情况中,按照本发明专利技术,字符图形并不直接细分成格网区域,而是将字符图形先细分成第一多元子区域,然后再将第一多元子区域中至少部分区域结合,将第一多元子区域转变成数目上少于第一多元子区域的第二多元子区域。这种字符图形的两步细分过提在吸收如手写字符的字符图形变形所引起的波动是先进的。(*该技术在2007年保护过期,可自由使用*)

【技术实现步骤摘要】
一般地讲,本专利技术涉及一图形的识别方法和系统,特别而言,是涉及一种将未知的输入字符同已寄存好的已知字符进行比较而对字符进行识别的方法和系统。更准确地说,本专利技术涉及一种适用于字符识别方法和系统的字符细分方法。进一步而言,本专利技术涉及一种使用多层定向码直方图技术的字符识别方法。包括将一字符图形细分成多元格网区域的步骤和将每一格网区域中的字符图形的特征量集中处理的步骤的一字符识别方法已公知。然而,在将字符图形细分成格网区域的细分点的情况中,容易将字符畸变,以使得利用固定的细分点对于如同手写的中文字符进行识别的识别率趋于严重地变劣。为防止这种由字符图形畸变而引起的字符识别率的劣变,已经提出过使用可变细分点的字符图形的细分方法,例如日本已转让于本申请的受让人的第59-202823申请,根据这种使用可变细分点的方法,用以细分一字符图形成为格网区的细分点被可变地确定,以使预定的字符图形的特征量在细分格网中等同分布。进一步,另一指定给本申请的受让人的日本专利申请59-202825,在该申请中公开了一种采用如同可变图形细分方法和对每一细分格网区域的字符图形的特征量进行集合处理而进行字符识别的方法。利用这种可变字符图形细分方法,与固定细分方法相比较,其字符识别率受到字符图形变化的影响较小,以此而获得对于手写或相类似字符识别率的提高。然而,使用上述的字符识别方法,相邻近的细分格网区不相互重叠,或即使相互重叠,其重叠宽度保持恒定。结果是,基于一字符图形畸变的方式与程度,会出现这样的情况,由于字符图形畸变引起的特征量的起伏不能被充分吸收。根据本专利技术的一个方面,提供了一个用以细分一个图形的方法,在其中,用于确定一个字符图形的字符区域首先被细分为第一多元子区域,以使预定的特征量在子区域中实际相等地分布,并且至少有一些第一多元子区域相结合而将第一多元子区域转化成第二多元格网区域,从而将字符区细分成格网区域。当将至少一些子区域结合时,首先考虑的是将两个或更多的相邻子区域结合成为一个格网区。此外,至少一些格网区具有一重叠部分,该重叠部分、是由结合在两个与共用子区相邻的子区域中的共用子区域而确定的。根据本专利技术的另一方面,提供了一个用于字符识别方法中的字符图形细分方法。它包括步骤有,对于确定一个字符区中的字符图形的轮廓象素指定一多元预定定向码;细分字符区成为第一多元子区域,以便使指定的方向码在第一多元子区域中实际均匀地分布;根据一预定的方式,至少对一些所说的第一多元子区域进行结合,而将第一多元子区域转变成为第二多元格网区域。最好是,在数目上第一多元子区域大于第二多元格网区域。在本专利技术这方面的优选实施例中,字符识别的方法使用了所谓多元定向码直方图的方法。因此,本专利技术的一个基本目的是克服上述现有技术缺点,并提供一改进的字符图形细分方法。本专利技术的进一步目的是提供一个使用了一改进了的字符图形细分方法的字符识别方法和系统。本专利技术的更进一步目的是提供了一改进的字符图形细分方法和系统,它适合于处理变形的字符,例如手写字符。本专利技术更进一步的目的是提供了一个改进了的字符识别方法和系统,它受由于字符图形畸变的不利影响最小。本专利技术的进一步目的是提供一改进的字符图形细分方法,当使在一字符识别系统中时,能够保持高的识别率而同被处理的字符图形的条件无关。本专利技术的其它目的,优点及新颖特征,将由参考附图所作的下述详细描述而变得明显。附图的简介图1a和1b是说明,展示如何根据本专利技术的实施例将一字符区域首先细分成子区域,然后将其转变成格网区域;图2是一方块图,表示依照本专利技术的实施例而构成的字符图形细分系统去完成如图1a和1b所说明的字符细分过程;图3a是一个表示如何将图3a(1)和图3a(2)结合的说明;图3a(1),3a(2)和3b确定了一个流程图,表示了一个用于完成在图1a和图1b中所阐明的字符图形细分方法的步骤顺序;图4是一个表示根据本专利技术的另一实施例字符图形细分方法的说明;图5是一个表示如何将图5a和图5b结合的说明;图5a和图5b,当如图5所表明被结合时,确定一个流程图,表示一个用以完成如图4中所阐明的字符图形细分方法的步骤顺序;图6是一个方块图,表示一个依据本专利技术的又一实施例而构成的光学字符识别系统;图7a至图7f确定了一个流程图,表明一个执行如图6所示的系统中的特征提取单元15的步骤顺序;图8是一个图示说明,表明一个表格,它定义了一个多元方向码和与它相联系的适于图6所示系统中使用的利用中心象素作为重要象素的象素图形。图9是用于解释图6中所示的系统所采用的字符细分方法的说明。对于实施例的描述首先应该注意,本说明书中所谈“字符”一词的含意,包括了与之相类似的一类术语,例如“字母”,“符号”,“数字”。先参见图2,其中以方框图形式给出了一个按照本专利技术的实施例而构成的字符图形细分系统。如所示的那样,本字符图形细分系统包括一个微处理器1和一个用于存贮程序及数据的存贮器2,该存贮器是经总线3与微处理器I相联的,在系统中还提供有字符图形输入单元8,它是与总线3相联的。因而,一个由输入单元8输入的字符图形存贮在经由微处理器确定在存贮器2中的字符缓冲存贮器4中。微处理器1进行一定向码的指定工作,以便对一字符线的轮廓象素指定为预定的8种不同的定向码,其中的字符线根据预定的方式确定字符图形,而且,具有确定其轮廓的定向码的字符图形贮存在字符缓冲存贮器4中。一个关于这种定向码和对一个字符图形的轮廓象素指定这种定向码的步骤的有关例子,将在以后介绍。在这种情况下,加有定向码的全部数字ITOTAL被计数,而且将此数存贮在存贮器2的特定地址。存贮器2中也定有一子区表5,一分配表6和一格网区表7。根据图1a和图1b,依本专利技术实施例的一字符图形细分过程被描述如下。首先,对于一字符图形的轮廓(在此假设一个在行方向上有64个象素,在列方向上有64个象素的图形)被指定一如上所表示的多元预定定向码(特征量),并将其存贮在缓冲寄存器4中。然后,将字符图形在横向上及纵向上都划分成5个部分,使字符图形细分成一多元子区域,以便指定的定向码在细分的子区域中的分布是均匀的。更特殊地,字符图形被分成5个水平部份,以使每一水平部份包含有由对ITOTAL5等分而决定的指定的定向码的数目,相类似地,字符图形也被分成五个垂直部分,以使每一个垂直部分在实际上具有相同的定向码数。在图1b中,IT(2)至IT(5)表示沿水平轴将字符图形细分成5个水平部分的座标位置,JT(2)至JT(5)表明沿垂直轴将字符图形细分成5个垂直部份的座标轴位置。以这样的方式,即,将字符图形分成5个水平部分及5个垂直部分,得到了第一多元子区域A至Y(5乘5=25),如图16中所示。应当注意,连同其他细分点的座标存贮在子区域表5中的式子IT(1)=ST(1)=1和IT(6)=JT(6)=64。然而,根据存贮在分配表6中的分配指示信息,被指示的子区被分配到每一格网区,而后按一指明的方式将子区域结合,以便将第一多元子区转变成为一第二多元格网区(本例中为4×4),它在数值上是比第一多元子区要小。换句话说,至少有一部分子区域被结合成一定的格网区,由此而形成复盖全字符图形面的第二多元格网区域。由于分配指示信息内容是相应于存贮于分配表6中的数据的,因而在所说明本文档来自技高网...

【技术保护点】
一字符图形的细分方法包含的步骤有:将一字符图形细分为第一多元子区域;通过合并至少某些所说的子区域,将所说的第一多元子区域转变为第二多元格网区域,从而,将一字符图形最终细分成为所说的第二多元格网区域。

【技术特征摘要】
JP 1986-7-3 156838/86;JP 1986-7-8 160647/86确定的本发明的范围的限制。权利要求1.一字符图形的细分方法包含的步骤有将一字符图形细分为第一多元子区域;通过合并至少某些所说的子区域,将所说的第一多元子区域转变为第二多元格网区域,从而,将一字符图形最终细分成为所说的第二多元格网区域。2.如权利要求1所述的方法,其中所说的第二多元格网区域在数目上少于第一多元子区域。3.如权利要求2所述的方法,其中所说的字符图形具有按予定规则被指定到确定所说的字符图形轮廓象素的一个多元予定特征量,每个特征量对应一个所说的轮廓象素。4.如权利要求3所述的方法,其中所说的细分步骤的完成是使所说的予定特征量实质上在所说的整个子区域上均匀分布。5.如权利要求4所述的方法,其中所说的予定特征量是定向码,而每一定向码都有一个随围绕在重要象素四周的予定数目的周围象素的排列而定的独特码。6.如权利要求5所述的方法,其中所说的每个定向码都对应着一种包括有一个重要象素的五个象素的特定排列,一对“上”和“下”象素分别置于重要象素的上部和下部,一对“左”和“右”象素分别置于重要象素的左边和右边。7.如权利要求1所述的方法,其中所说的第二多元格网区域中的至少两个相邻区域有一共同的重叠部分。8.如权利要求7所述的方法,其中所说的重叠部分是由一个或多个所说的第一多元子区域所确定的。9.如权利要求1所述的方法,其中所说的字符图形位于一个字符帧内,该字符帧是由间隔开第一予定距离的第一对平行水平线和间隔开第二予定距离的第二对平行垂直线确定的,其中所说的第一多元子区域是由第三多元水平线和第四多元垂直线确定的,第三多元水平线位于所说的第一对平行水平线之间且与之平行,第四多元垂直线位于所说的第二对平行垂直线之间且与之平行,以使所说的每个第...

【专利技术属性】
技术研发人员:立川道义
申请(专利权)人:株式会社理光
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利