文本图像识别方法和装置制造方法及图纸

技术编号：7975039 阅读：227 留言：0更新日期：2012-11-15 23:26

本发明专利技术公开了一种文本图像识别方法和装置，属于文本处理领域。所述方法包括：获取文本图像；使用多种图像预处理方法处理所述文本图像以获得多组二值图像；采用同一个识别核心识别所述多组二值图像以获得所述多组二值图像对应的多组文本识别结果；以及将所述多组文本识别结果进行融合，获得文本图像的最终识别结果。本发明专利技术采用了多种图像预处理方法，保证了针对每个字符都获得较好的识别结果，从而达到满意的识别效果；采用了单个识别核心，因此相对于采用多个识别核心的方案操作过程比较简单，并且降低了成本。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及文本处理领域，尤其是涉及一种文本图像识别方法和装置。
技术介绍
在图像识别系统中，往往需要对图像进行一次二值化处理，二值化的关键在于阈值的选择。一般情况下，阈值的选择不仅与像素点的位置有关，而且还与该点的灰度值和它周围点的灰度值有关。所以阈值选取不确定性过强，如果阈值的选取过大会引起文本的粘连，反之阈值过小，文本会出现断裂现象。单一的二值化阈值也并非能够对文本图像中的所有字符都达到较好的识别效果。也就是说，这种方法难以保证针对每个字符都获得较好的识别结果，并且单一依靠阈值对待识别文本进行处理，使待识别文本图像的识别效果难以令人满意。此外，常见的基于多识别信息融合的系统，通常采用多个识别核心或多种识别方法来识别文本图像以获取多组识别信息，将多组识别信息融合。然而，由于这种系统通过不同的识别核心并且采用不同的识别方法来得到多组识别信息，因此其操作过程复杂并且成本高。而对于采用单识别核心或一种识别方法来识别文本图像而言，目前尚没有基于多识别信息融合的文本图像识别方法。
技术实现思路
本专利技术所要解决的技术问题是提供一种文本图像识别方法和装置，综合不同的图像预处理方法对待识别的文本图像进行处理后融合，避免了单一依靠阈值对待识别文本进行处理，使待识别文本图像的识别效果大大改进。根据本专利技术的一个实施例，提供了一种文本图像识别方法，包括获取文本图像；使用多种图像预处理方法处理所述文本图像以获得多组二值图像；采用单个识别核心识别所述多组二值图像以获得所述多组二值图像对应的多组文本识别结果；以及将所述多组文本识别结果进行融合，获得文本图像的最终识别结果。...

【技术保护点】
一种文本图像识别方法，包括：获取文本图像；使用多种图像预处理方法处理所述文本图像以获得多组二值图像；采用同一个识别核心识别所述多组二值图像以获得所述多组二值图像对应的多组文本识别结果；以及将所述多组文本识别结果进行融合，获得文本图像的最终识别结果。

【技术特征摘要】
1.一种文本图像识别方法，包括获取文本图像；使用多种图像预处理方法处理所述文本图像以获得多组二值图像；采用同一个识别核心识别所述多组二值图像以获得所述多组二值图像对应的多组文本识别结果；以及将所述多组文本识别结果进行融合，获得文本图像的最终识别结果。2.根据权利要求I所述的方法，其特征在于，所述多种图像预处理方法包括采用多种图像二值化阈值和图像缩放比例对所述文本图像进行处理。3.根据权利要求I所述的方法，其特征在于，所述文本识别结果包括所述文本图像中的所有字符的识别结果和识别距离；其中，所述识别距离为对输入的文本图像中的字符图像所提取的属性参数与预设的识别字符模板中的相应字符的属性参数之间的差距。4.根据权利要求3所述的方法，其特征在于，所述将所述多组文本识别结果进行融合，获得文本图像的最终识别结果，包括在所述多组文本识别结果中逐个字符块地比较识别得到的对应字符的识别结果，保留识别结果相同的第一字符块对应的识别结果作为所述第一字符块对应的最终识别结果；如果所述多组文本识别结果中存在多种内容的第二字符块，则根据所述第二字符块中各个字符的字符特征和识别距离，将所述多种内容的第二字符块对应的识别结果进行融合，获得所述第二字符块对应的最终识别结果。5.根据权利要求4所述的方法，其特征在于，将所述多种内容的第二字符块对应的识别结果进行融合，包括根据所述多种内容的第二字符块中的字符特征，从所述多组文本识别结果中筛选所述第二字符块对应的合理识别结果；以及根据所述字符特征和所述识别距离对所述第二字符块对应的合理识别结果进行融合，以获得所述第二字符块的最终识别结果，其中，所述第二字符块对应的合理识别结果为所述第二字符块的字符特征与预设的识别字符模板中预定字符特征相符的识别结果。6.根据权利要...

【专利技术属性】
技术研发人员：刘正珍，万鑫，李玉梅，
申请(专利权)人：汉王科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人