用于处理图像信息的方法和装置制造方法及图纸

技术编号:12730698 阅读:110 留言:0更新日期:2016-01-20 14:34
本申请公开了一种用于处理图像信息的方法和装置。所述方法的一具体实施方式包括:识别原始图像中的每个字符并获取每个字符的位置;对原始图像中的字符与模板图像的版面结构区域中的字符进行匹配,将两者中相同的字符或字符串记录为匹配点对;根据原始图像中字符的位置和模板图像版面结构区域中字符的位置获得匹配点对之间的投影变换矩阵;根据所述投影变换矩阵对原始图像进行配准,获得已配准图像;识别所述已配准图像以获得识别结果。该实施方式简化了文字识别中图像匹配的步骤,增强了匹配的准度与通用性,降低了开发成本。

【技术实现步骤摘要】

本申请涉及计算机
,具体涉及图像处理
,尤其涉及用于处理图像信息的方法和装置
技术介绍
图像处理主要用于对图像进行分析以获得所需结果。模式识别是图像处理领域中的重要技术,该技术可通过计算机用数学技术方法来研究模式的自动处理和判读,模式识别的一种应用就是OCR(OpticalCharacterRecognition,光学字符识别)技术。OCR技术利用电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成可供文字处理软件进一步编辑加工的计算机文字。然而,在对图像中文本进行识别的过程中,除了需要识别其中的单个文字外,还需对进行版面定位和分析,分析出图像中的结构化区域,然后根据这些区域的属性进行识别才能获得较好的识别效果。版面定位和分析通常需要使用图像配准技术。以证件识别为例,传统的配准方案通过对证件图像的角点或者关键区域(如人脸)的检测,确定证件图像在整个图像中的关键点位置并根据该位置对图像进行变换矫正,再对矫正后图像的不同区域进行针对性的识别。然而,还需要简化图像匹配的步骤并增强匹配的准度与通用性。
技术实现思路
本申请提供了一种用于处理图像信息的方法和装置,来解决图像配准中步骤不简化和准度不高的技术问题。第一方面,本申请提供了一种用于处理图像信息的方法,所述方法包括:识别原始图像中的每个字符并获取每个字符的位置;对原始图像中的字符与模板图像的版面结构区域中的字符进行匹配,将两者中相同的字符或字符串记录为匹配点对,其中,所述模板图像的版面结构区域为模板图像中内容不变的区域,所述模板图像的版面结构区域中字符的位置已标注;根据原始图像中字符的位置和模板图像版面结构区域中字符的位置确定匹配点对之间的投影变换矩阵;根据所述投影变换矩阵对原始图像进行配准,获得已配准图像;识别所述已配准图像以获得识别结果。在某些实施方式中,所述模板图像还包括内容可变的可变区域;以及所述识别所述已配准图像以获得识别结果,包括:将已配准图像匹配所述模板图像,获得已配准图像的可变区域图像,所述可变区域图像是已配准图像中与模板图像可变区域对应的图像;识别所述可变区域图像中的字符;根据所述可变区域图像中的字符与模板图像的版面结构区域中的字符获得识别结果。在某些优选实施方式中,所述识别所述可变区域图像中的字符包括:使用通用的光学字符识别引擎识别所述可变区域图像中的字符。在某些优选实施方式中,所述模板图像中可变区域的字符类型已标注;以及所述识别所述可变区域图像中的字符包括:使用与所述模板图像中可变区域的字符类型对应的光学字符识别引擎识别所述可变区域图像中的字符。在某些实施方式中,所述匹配点对的数量不小于4。在某些实施方式中,所述投影变换矩阵是以下任意一项:欧氏变换矩阵、相似变换矩阵、仿射变换矩阵、射影变换矩阵。第二方面,本申请提供了一种用于处理图像信息的装置,所述装置包括:原始图像识别单元,配置用于识别原始图像中的每个字符并获取每个字符的位置;匹配单元,配置用于对原始图像中的字符与模板图像的版面结构区域中的字符进行匹配,将两者中相同的字符或字符串记录为匹配点对,其中,所述模板图像的版面结构区域为模板图像中内容不变的区域,所述模板图像的版面结构区域中字符的位置已标注;变换矩阵获得单元,配置用于根据原始图像中字符的位置和模板图像版面结构区域中字符的位置确定匹配点对之间的投影变换矩阵;图像配准单元,配置用于根据所述投影变换矩阵对原始图像进行配准,获得已配准图像;已配准图像识别单元,配置用于识别所述已配准图像以获得识别结果。在某些实施方式中,所述模板图像还包括内容可变的可变区域;以及所述已配准图像识别单元包括:可变区域图像获取子单元,配置用于将已配准图像匹配所述模板图像,获得已配准图像的可变区域图像,所述可变区域图像是已配准图像中与模板图像可变区域对应的图像;可变区域识别子单元,配置用于识别所述可变区域图像中的字符;识别结果获取子单元,配置用于根据所述可变区域图像中的字符与模板图像的版面结构区域中的字符获得识别结果。在某些优选实施方式中,所述可变区域识别子单元配置用于使用通用的光学字符识别引擎识别所述可变区域图像中的字符。在某些优选实施方式中,所述模板图像中可变区域的字符类型已标注;所述可变区域识别子单元配置用于使用与所述模板图像中可变区域的字符类型对应的光学字符识别引擎识别所述可变区域图像中的字符。在某些实施方式中,所述匹配点对的数量不小于4。在某些实施方式中,所述投影变换矩阵是以下任意一项:欧氏变换矩阵、相似变换矩阵、仿射变换矩阵、射影变换矩阵。本申请提供的用于处理图像信息的方法和装置,在原始图像中查找与模板图像内容不变区域相同的字符或字符串,将相同的字符或字符串记录为匹配点对,利用匹配点对的几何变换关系对原始图像进行配准。由于这种方式通过模板匹配即可实现图像矫正,不需要进行角点检测以及关键区域检测,可简化图像匹配的步骤并增强匹配的准度与通用性,也降低了开发成本。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请用于处理图像信息的方法的一个实施例的流程;图2是图1对应的实施例中模板图像的示意图;图3a是图1对应的实施例中获取匹配点对的示意图;图3b是图1对应的实施例中对图像进行配准的示意图;图4是本申请用于处理图像信息的方法的另一个实施例的流程;图5是图4对应的实施例中模板图像的示意图;图6是本申请用于处理图像信息的装置的一个实施例的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。首先,请参考图1,其示出了根据本申请的用于处理图像信息的方法的一个实施例的流程100。本实施例主要以该方法应用于电子设备中来举例说明,该电子设备可以包括智能手机、平板电脑、电子书阅读器、MP3播放器(MovingPictu本文档来自技高网...

【技术保护点】
一种用于处理图像信息的方法,其特征在于,所述方法包括:识别原始图像中的每个字符并获取每个字符的位置;对原始图像中的字符与模板图像的版面结构区域中的字符进行匹配,将两者中相同的字符或字符串记录为匹配点对,其中,所述模板图像的版面结构区域为模板图像中内容不变的区域,所述模板图像的版面结构区域中字符的位置已标注;根据原始图像中字符的位置和模板图像版面结构区域中字符的位置获得匹配点对之间的投影变换矩阵;根据所述投影变换矩阵对原始图像进行配准,获得已配准图像;识别所述已配准图像以获得识别结果。

【技术特征摘要】
1.一种用于处理图像信息的方法,其特征在于,所述方法包括:
识别原始图像中的每个字符并获取每个字符的位置;
对原始图像中的字符与模板图像的版面结构区域中的字符进行匹
配,将两者中相同的字符或字符串记录为匹配点对,其中,所述模板
图像的版面结构区域为模板图像中内容不变的区域,所述模板图像的
版面结构区域中字符的位置已标注;
根据原始图像中字符的位置和模板图像版面结构区域中字符的位
置获得匹配点对之间的投影变换矩阵;
根据所述投影变换矩阵对原始图像进行配准,获得已配准图像;
识别所述已配准图像以获得识别结果。
2.根据权利要求1所述的方法,其特征在于,所述模板图像还包
括内容可变的可变区域;以及
所述识别所述已配准图像以获得识别结果,包括:
将所述已配准图像匹配所述模板图像,获得已配准图像的可变区
域图像,所述可变区域图像是已配准图像中与模板图像可变区域对应
的图像;
识别所述可变区域图像中的字符;
根据所述可变区域图像中的字符与模板图像的版面结构区域中的
字符获得识别结果。
3.根据权利要求2所述的方法,其特征在于,所述识别所述可变
区域图像中的字符包括:
使用通用的光学字符识别引擎识别所述可变区域图像中的字符。
4.根据权利要求2所述的方法,其特征在于,所述模板图像中可
变区域的字符类型已标注;以及
所述识别所述可变区域图像中的字符包括:
使用与所述模板图像中可变区域的字符类型对应的光学字符识别
引擎识别所述可变区域图像中的字符。
5.根据权利要求1-4之一所述的方法,所述匹配点对的数量不小
于4。
6.根据权利要求1-4之一所述的方法,所述投影变换矩阵是以下
任意一项:欧氏变换矩阵、相似变换矩阵、仿射变换矩阵、射影变换
矩阵。
7.一种用于处理图像信息的装置,其特征在于,所述装置包括:
原始图像识别单元,配置用于识别...

【专利技术属性】
技术研发人员:韩钧宇
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1