图像处理方法和装置制造方法及图纸

技术编号:10500025 阅读:104 留言:0更新日期:2014-10-04 16:32
一种图像处理方法和图像处理装置。该方法包括:在图像的文本区域中识别预定符号;从该文本区域中去除与识别出的预定符号相对应的部分;对去除了该相对应的部分的文本区域执行光学字符识别;以及将识别出的预定符号添加到光学字符识别的结果中的相应位置。

【技术实现步骤摘要】
图像处理方法和装置
本申请一般涉及图像处理,更具体地,涉及对图像进行光学字符识别(OCR)的方法和装置。
技术介绍
OCR被广泛应用于识别图像中的字符。通常,OCR被设计为对单一字符集或语种的字符进行识别,当识别对象为文字和某些符号的混合的情况下,一般的OCR方法可能难以得到令人满意的识别准确度。这些文字和符号混合的情况例如包括统一资源定位符(URL)、电子邮件地址、数学公式、程序代码等。相应地,针对特定识别对象的特点,存在对识别结果进行纠错以改善识别准确度的方法。例如,存在根据具体识别对象所具有的特定语法规则或基于历史信息来对识别结果进行纠错的方法。
技术实现思路
在下文中给出了关于本专利技术的简要概述,以便提供关于本专利技术的某些方面的基本理解。应当理解,这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分,也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。 根据本申请的一个方面,一种图像处理方法包括:在图像的文本区域中识别预定符号;从文本区域中去除与识别出的预定符号相对应的部分;对去除了该相对应的部分的文本区域执行光学字符识别;以及将识别出的预定符号添加到光学字符识别的结果中的相应位置。 根据本申请的另一个方面,一种图像处理装置包括:符号识别部分,被配置为在图像的文本区域中识别预定符号;符号去除部分,被配置为从文本区域中去除与识别出的预定符号相对应的部分;光学字符识别部分,被配置为对去除了该相对应的部分的文本区域执行光学字符识别;以及符号添加部分,被配置为将识别出的预定符号添加到光学字符识别的结果中的相应位置。 【附图说明】 本专利技术可以通过参考下文中结合附图所给出的描述而得到更好的理解,其中在所有附图中使用了相同或相似的附图标记来表示相同或者相似的部件。所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分,而且用来进一步举例说明本专利技术的优选实施例和解释本专利技术的原理和优点。在附图中: 图1是示出根据本申请实施例的图像处理方法的过程示例的流程图; 图2是用于说明根据本申请实施例的图像处理方法对反斜杠符号进行识别的示意图; 图3是示出根据本申请另一个实施例的图像处理方法的过程示例的流程图; 图4是示出用于识别URL的子过程示例的流程图; 图5是示出用于识别URL的子过程示例的流程图; 图6是示出用于识别URL的子过程示例的流程图; 图7是示出用于识别URL的子过程示例的流程图; 图8是示出根据本申请实施例的图像处理装置的配置示例的框图; 图9是示出符号识别部分的配置示例的框图; 图10是示出根据本申请另一个实施例的图像处理装置的配置示例的框图; 图11是示出URL识别部分的配置示例的框图; 图12是示出URL识别部分的配置示例的框图; 图13是示出URL识别部分的配置示例的框图; 图14是示出URL识别部分的配置示例的框图;以及 图15是示出实现本申请的方法和设备的计算机的示例性结构的框图。 【具体实施方式】 下面将参照附图来说明本专利技术的实施例。在本专利技术的一个附图或一种实施方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。应当注意,为了清楚的目的,附图和说明中省略了与本专利技术无关的、本领域普通技术人员已知的部件和处理的表示和描述。 首先参照图1描述根据本申请实施例的图像处理方法的过程示例。 作为本申请实施例的图像处理方法的处理对象可以是静态图像(例如网络图片或用户拍摄的图像等),或者可以是视频(例如电视、网络视频等)的帧,但不限于此。另外,图像可以包括彩色图像、灰度图像、二值图像等,但不限于此。在必要时,可以通过本领域已知的多种方法对图像进行颜色、分辨率等方面的调整或转换,以满足相应光学字符识别方式的要求。另外,可以通过多种已有的方式识别图像中的文本区域,在此不再赘述。 如图1所示,在步骤S110,在图像的文字区域中识别预定符号。 针对不同的应用,可以设置所要识别的具体预定符号。例如,根据本申请的一个具体实施例的图像处理方法可以用于对图像中包含的URL进行光学字符识别。基于图像或视频帧的URL检测与识别是光学字符识别的重要技术,其例如能够为电视或广告观看者提供在画面中显示的网站链接的URL,从而使得观看者能够在无需手动输入URL的情况下便捷地进行网站访问。作为人机交互的一种方式,重要的部分是使用光学字符系统快速正确的识别出图像中的URL。由于URL包含文字和符号的混合,因此URL识别的一个难点在于如何纠正光学字符系统输出URL的错误。 相应地,根据本申请的一个实施例,所要识别的预定符号包括用于URL的分隔符,例如~!*’ O ;:<§&=+$,/?%#□。当然,本专利技术不限于此,在用于对其他文字与符号混杂的对象进行光学字符识别的情况下,可以相应地设置要在步骤SllO中识别的预定符号。例如,在用于对图像中的数学公式或程序代码进行光学字符识别时,可以将预定的数学符号或程序代码符号作为预定符号。下面,在不失一般性的情况下,以针对URL的光学字符识别为例对本申请的实施例进行说明。 由于例如电视广告或平面广告中包含的URL通常较为简单以便于观看者记忆和访问,因此其中较常出现的符号通常是URL分隔符中的小数点”和反斜杠“/”。 因此,根据一个实施例,在图像的文字区域中识别预定符号的步骤可以包括:根据预定标准将文本区域内的笔划识别为小数点”,以及/或者根据预定标准将文本区域内的笔划识别为反斜杠“/”。 其中,“笔划”可以指图像的前景像素的预定大小范围内的联通部件(connectedcomponent)。例如,对于二值图像,笔划可以被确定为预定大小范围内的黑像素连通部件;对于灰度图像和彩色图像,可以将灰度或颜色在预定范围内的像素设定为前景像素,并且将预定大小范围内的前景像素连通部件确定为笔划。另外,连通部件的大小可以指绝对大小(例如包含的像素数量)或相对大小(例如相对于图像尺寸或相对于其他联通部件尺寸)。存在多种已知的方法来识别图像中的笔划,在此不再赘述。 用于识别小数点的预定标准例如可以包括:(i)该笔划相对于字符区域内的其他笔划的相对尺寸小于预定标准;(ii)该笔划位于文本区域的相应文本行的中线以下;以及 (iii)该笔划的外接矩形区域中的前景像素与背景像素的数量比高于预定阈值。 其中,关于条件(i ),该相对尺寸的预定标准例如可以是该笔划的大小(例如,包含的像素数量)与文本区域内其他笔划的平均大小之比小于预定阈值,但不限于此。 关于条件(ii),可以使用已有的方法(例如像素投影、笔划投影等)来确定文本区域内的文本行,从而确定该笔划是否在其文本行的中线以下。另外,关于上下方向的判断,例如,可以参照图像的默认取向,也可以参照利用已有方法判断出的图像取向来确定上下位置关系。已有多种文本行识别以及图像取向判断方法,在此不再赘述。 关于条件(iii),根据小数点的形状特征,该笔划的外接矩形区域应基本被前景像素占据,因此只有当前景像素与背景像素的数量比高于预定阈值时才确定为小数点。 本文档来自技高网...

【技术保护点】
一种图像处理方法,包括:在所述图像的文本区域中识别预定符号;从所述文本区域中去除与识别出的所述预定符号相对应的部分;对去除了所述相对应的部分的所述文本区域执行光学字符识别;以及将所述识别出的所述预定符号添加到所述光学字符识别的结果中的相应位置。

【技术特征摘要】
1.一种图像处理方法,包括: 在所述图像的文本区域中识别预定符号; 从所述文本区域中去除与识别出的所述预定符号相对应的部分; 对去除了所述相对应的部分的所述文本区域执行光学字符识别;以及 将所述识别出的所述预定符号添加到所述光学字符识别的结果中的相应位置。2.根据权利要求1所述的方法,其中,所述预定符号包括用于统一资源定位符的分隔符。3.根据权利要求1所述的方法,其中,所述预定符号包括小数点,并且识别所述预定符号的步骤包括根据下列标准将所述文本区域内的笔划识别为小数点: 该笔划相对于所述字符区域内的其他笔划的相对尺寸小于预定标准; 该笔划位于所述文本区域的相应文本行的中线以下;以及 该笔划的外接矩形区域中的前景像素与背景像素的数量比高于预定阈值。4.根据权利要求1所述的方法,其中,所述预定符号包括反斜杠,并且识别所述预定符号的步骤包括根据下列标准将所述文本区域内的笔划识别为反斜杠: 在将该笔划的外接矩形区域划分为多个块的情况下,所述矩形区域的左下至右上对角线上的块包含前景像素,而所述矩形区域的左上角和右下角处的块不包含前景像素;以及所述笔划的倾斜角度在预定范围内。5.根据权利要求2所述...

【专利技术属性】
技术研发人员:汪留安孙俊何源范伟胜山裕堀田悦伸
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1