文本图像识别方法和装置制造方法及图纸

技术编号:7975039 阅读:214 留言:0更新日期:2012-11-15 23:26
本发明专利技术公开了一种文本图像识别方法和装置,属于文本处理领域。所述方法包括:获取文本图像;使用多种图像预处理方法处理所述文本图像以获得多组二值图像;采用同一个识别核心识别所述多组二值图像以获得所述多组二值图像对应的多组文本识别结果;以及将所述多组文本识别结果进行融合,获得文本图像的最终识别结果。本发明专利技术采用了多种图像预处理方法,保证了针对每个字符都获得较好的识别结果,从而达到满意的识别效果;采用了单个识别核心,因此相对于采用多个识别核心的方案操作过程比较简单,并且降低了成本。

【技术实现步骤摘要】

本专利技术涉及文本处理领域,尤其是涉及一种文本图像识别方法和装置
技术介绍
在图像识别系统中,往往需要对图像进行一次二值化处理,二值化的关键在于阈值的选择。一般情况下,阈值的选择不仅与像素点的位置有关,而且还与该点的灰度值和它周围点的灰度值有关。所以阈值选取不确定性过强,如果阈值的选取过大会引起文本的粘连,反之阈值过小,文本会出现断裂现象。单一的二值化阈值也并非能够对文本图像中的所有字符都达到较好的识别效果。也就是说,这种方法难以保证针对每个字符都获得较好的识别结果,并且单一依靠阈值对待识别文本进行处理,使待识别文本图像的识别效果难以令人满意。 此外,常见的基于多识别信息融合的系统,通常采用多个识别核心或多种识别方法来识别文本图像以获取多组识别信息,将多组识别信息融合。然而,由于这种系统通过不同的识别核心并且采用不同的识别方法来得到多组识别信息,因此其操作过程复杂并且成本高。而对于采用单识别核心或一种识别方法来识别文本图像而言,目前尚没有基于多识别信息融合的文本图像识别方法。
技术实现思路
本专利技术所要解决的技术问题是提供一种文本图像识别方法和装置,综合不同的图像预处理方法对待识别的文本图像进行处理后融合,避免了单一依靠阈值对待识别文本进行处理,使待识别文本图像的识别效果大大改进。根据本专利技术的一个实施例,提供了一种文本图像识别方法,包括获取文本图像;使用多种图像预处理方法处理所述文本图像以获得多组二值图像;采用单个识别核心识别所述多组二值图像以获得所述多组二值图像对应的多组文本识别结果;以及将所述多组文本识别结果进行融合,获得文本图像的最终识别结果。此外,根据本专利技术的另一个实施例,提供了一种文本图像识别装置,包括图像获取模块,获取文本图像;图像处理模块,使用多种图像预处理方法处理所述文本图像以获得多组二值图像;识别模块,采用单个识别核心识别所述多组二值图像以获得所述多组二值图像对应的多组文本识别结果;以及融合模块,将所述多组文本识别结果进行融合,获得文本图像的最终识别结果。此外,本专利技术还提供了相应的计算机程序代码、计算机可读存储介质和计算机程序广品。通过根据本专利技术的方案,由于采用了多种图像预处理方法,因此可以保证针对每个字符都获得较好的识别结果,从而达到满意的识别效果。另外,在本专利技术的方案中采用了单个识别核心,因此相对于采用多个识别核心的方案操作过程比较简单,并且降低了成本。附图说明本专利技术可以通过参考下文中结合附图所给出的描述而得到更好的理解。所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分,而且用来进一步举例说明本专利技术的优选实施例和解释本专利技术的原理和优点。在附图中 图I是根据本专利技术的一个实施例的文本图像识别方法的流程 图2示出了英文字符的字符基线信息 图3(a)示出了本专利技术的一个实施例中的待识别的英文文本行灰度图像; 图3(b)是灰度图像图3(a)在阈值为T时得到的二值图像; 图3(c)是灰度图3(a)在阈值为O. 95*T且经插值放大得到的二值图像; 图3(d)是二值图像3(b)和二值图像3(c)通过识别核心得到的识别结果; 图3(e)是二值图像3(b)和二值图像3(c)通过识别核心得到的识别距离; 图3 Cf)是阈值为T的二值图像3(b)的识别结果和字符高度; 图3 (g)是阈值为O. 95*T的二值图像3(c)的识别结果和字符高度; 图4(a)示出了本专利技术的一个实施例中的待识别的中文文本行灰度图像; 图4(b)是灰度图4(a)在阈值为T时得到的二值图像; 图4(c)是灰度图4(a)在阈值为O. 95*Τ且经插值放大得到的二值图像; 图4(d)是二值图像4(b)和二值图像4(c)通过识别核心得到的识别结果; 图4(e)是二值图像4(b)和二值图像4(c)通过识别核心得到的识别距离; 图5示出了根据本专利技术的一个实施例的文本图像识别装置的示意性结构 图6示出了可用于实施根据本专利技术的实施例的计算机的示意性框图。具体实施例方式在下文中将结合附图对本专利技术的示范性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,并且这些决定可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本专利技术,在附图中仅仅示出了与根据本专利技术的方案密切相关的装置结构,而省略了与本专利技术关系不大的其他细节。在图像处理应用中经常出现的一种情形是要对文本图像进行识别。如何识别文本图像以准确地获取其中的字符是本领域技术人员经常遇到的问题。现有的识别方法多数都是采用单识别核心,同时仅仅执行一次图像预处理,然而这样的识别难以保证针对每个字符都获得较好的识别结果。为提高识别正确率需要进行多识别信息的融合,即得到多组识别结果。目前多识别信息融合的方法中,多组识别结果是通过不同的识别核心、采用不同的识别方法得到,其过程复杂,不利于单识别核心系统采用。所以本专利技术提出了一种方法,其中通过不同的预处理方法,将不同的图像预处理结果通过同一种识别核心,即采用一种识别方法进行处理,得到多组识别结果,然后将多组识别结果进行融合以获取最佳的识别结果。因此,本专利技术的方案相比于现有的基于多识别信息融合的系统操作简单快捷,成本较低,而相比于单识别核心没有多识别信息融合的系统,进一步提高了识别率。第一实施例 图I是根据本专利技术的一个实施例的文本图像识别方法的流程图。如图I所示,本专利技术包括如下步骤 步骤Si,获取文本图像。在实践中常用的是获取待识别文本的灰度图,其中图像中用灰度表示的图像称作灰度图,然而本领域技术人员容易理解的是,本专利技术并不局限于使用灰度图。步骤S2,使用多种图像预处理方法来处理文本图像,以获得多组二值图像,例如可以获得两组或两组以上的二值图像。在一般的文本图像识别系统中,对图像仅进行一次二值化处理。即使该二值化处理中所使用的阈值对文本图像中的文本整体识别率是最优的,但是对于个别字符,该阈值可能不是最适合的,结果可能表现为个别字符的识别效果较差。因此,在本专利技术的一个实施例中,通过采用步骤S2,使用不同的图像预处理方法来处理文本图像,获得不同的两组或两组以上的二值图像,以保证待识别的文本图像中的每个字符都能有较佳的识别结果。举例来说,在处理文本图像时,可以通过采用不同的二值化阈值和图像缩放比例的组合来实施不同的图像预处理方法。例如可以针对原始图像采用阈值T来进行二值化,以及针对将原始图像放大2倍之后采用阈值O. 95T来进行预处理,等等,由此得到多组二值图像。步骤S3,采用同一个识别核心来识别所述多组二值图像,得到多组文本识别结果。在本专利技术的一个实施例中,使用同一个光学字符识别(OCR)核心来进行识别,得到多组文本识别结果。同样地,本专利技术并不局限于此。本领域技术人员可以采用任何合适的手段进行识别。这里,文本识别结果包括对文本图像中的各个字符的识别结果和与各个字符相对应的识别距离。这里,识别距离指的是系统本文档来自技高网...

【技术保护点】
一种文本图像识别方法,包括:获取文本图像;使用多种图像预处理方法处理所述文本图像以获得多组二值图像;采用同一个识别核心识别所述多组二值图像以获得所述多组二值图像对应的多组文本识别结果;以及将所述多组文本识别结果进行融合,获得文本图像的最终识别结果。

【技术特征摘要】
1.一种文本图像识别方法,包括 获取文本图像; 使用多种图像预处理方法处理所述文本图像以获得多组二值图像; 采用同一个识别核心识别所述多组二值图像以获得所述多组二值图像对应的多组文本识别结果;以及 将所述多组文本识别结果进行融合,获得文本图像的最终识别结果。2.根据权利要求I所述的方法,其特征在于,所述多种图像预处理方法包括采用多种图像二值化阈值和图像缩放比例对所述文本图像进行处理。3.根据权利要求I所述的方法,其特征在于,所述文本识别结果包括所述文本图像中的所有字符的识别结果和识别距离;其中,所述识别距离为对输入的文本图像中的字符图像所提取的属性参数与预设的识别字符模板中的相应字符的属性参数之间的差距。4.根据权利要求3所述的方法,其特征在于,所述将所述多组文本识别结果进行融合,获得文本图像的最终识别结果,包括 在所述多组文本识别结果中逐个字符块地比较识别得到的对应字符的识别结果,保留识别结果相同的第一字符块对应的识别结果作为所述第一字符块对应的最终识别结果; 如果所述多组文本识别结果中存在多种内容的第二字符块,则根据所述第二字符块中各个字符的字符特征和识别距离,将所述多种内容的第二字符块对应的识别结果进行融合,获得所述第二字符块对应的最终识别结果。5.根据权利要求4所述的方法,其特征在于,将所述多种内容的第二字符块对应的识别结果进行融合,包括 根据所述多种内容的第二字符块中的字符特征,从所述多组文本识别结果中筛选所述第二字符块对应的合理识别结果;以及 根据所述字符特征和所述识别距离对所述第二字符块对应的合理识别结果进行融合,以获得所述第二字符块的最终识别结果, 其中,所述第二字符块对应的合理识别结果为所述第二字符块的字符特征与预设的识别字符模板中预定字符特征相符的识别结果。6.根据权利要...

【专利技术属性】
技术研发人员:刘正珍万鑫李玉梅
申请(专利权)人:汉王科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1