图像处理方法和装置制造方法及图纸

技术编号：10500025 阅读：109 留言：0更新日期：2014-10-04 16:32

一种图像处理方法和图像处理装置。该方法包括：在图像的文本区域中识别预定符号；从该文本区域中去除与识别出的预定符号相对应的部分；对去除了该相对应的部分的文本区域执行光学字符识别；以及将识别出的预定符号添加到光学字符识别的结果中的相应位置。

全部详细技术资料下载

【技术实现步骤摘要】
图像处理方法和装置
本申请一般涉及图像处理，更具体地，涉及对图像进行光学字符识别(OCR)的方法和装置。
技术介绍
OCR被广泛应用于识别图像中的字符。通常，OCR被设计为对单一字符集或语种的字符进行识别，当识别对象为文字和某些符号的混合的情况下，一般的OCR方法可能难以得到令人满意的识别准确度。这些文字和符号混合的情况例如包括统一资源定位符(URL)、电子邮件地址、数学公式、程序代码等。相应地，针对特定识别对象的特点，存在对识别结果进行纠错以改善识别准确度的方法。例如，存在根据具体识别对象所具有的特定语法规则或基于历史信息来对识别结果进行纠错的方法。
技术实现思路
在下文中给出了关于本专利技术的简要概述，以便提供关于本专利技术的某些方面的基本理解。应当理解，这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分，也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念，以此作为稍后论述的更详细描述的前序。根据本申请的一个方面，一种图像处理方法包括:在图像的文本区域中识别预定符号；从文本区域中去除与识别出的预定符号相对应的部分；对去除了该相对应的部分的文本区域执行光学字符识别；以及将识别出的预定符号添加到光学字符识别的结果中的相应位置。根据本申请的另一个方面，一种图像处理装置包括:符号识别部分，被配置为在图像的文本区域中识别预定符号；符号去除部分，被配置为从文本区域中去除与识别出的预定符号相对应的部分；光学字符识别部分，被配置为对去除了该相对应的部分的文本区域执行光学字符识别...

【技术保护点】
一种图像处理方法，包括：在所述图像的文本区域中识别预定符号；从所述文本区域中去除与识别出的所述预定符号相对应的部分；对去除了所述相对应的部分的所述文本区域执行光学字符识别；以及将所述识别出的所述预定符号添加到所述光学字符识别的结果中的相应位置。

【技术特征摘要】
1.一种图像处理方法，包括: 在所述图像的文本区域中识别预定符号；从所述文本区域中去除与识别出的所述预定符号相对应的部分；对去除了所述相对应的部分的所述文本区域执行光学字符识别；以及将所述识别出的所述预定符号添加到所述光学字符识别的结果中的相应位置。2.根据权利要求1所述的方法，其中，所述预定符号包括用于统一资源定位符的分隔符。3.根据权利要求1所述的方法，其中，所述预定符号包括小数点，并且识别所述预定符号的步骤包括根据下列标准将所述文本区域内的笔划识别为小数点: 该笔划相对于所述字符区域内的其他笔划的相对尺寸小于预定标准；该笔划位于所述文本区域的相应文本行的中线以下；以及该笔划的外接矩形区域中的前景像素与背景像素的数量比高于预定阈值。4.根据权利要求1所述的方法，其中，所述预定符号包括反斜杠，并且识别所述预定符号的步骤包括根据下列标准将所述文本区域内的笔划识别为反斜杠: 在将该笔划的外接矩形区域划分为多个块的情况下，所述矩形区域的左下至右上对角线上的块包含前景像素，而所述矩形区域的左上角和右下角处的块不包含前景像素；以及所述笔划的倾斜角度在预定范围内。5.根据权利要求2所述...

【专利技术属性】
技术研发人员：汪留安，孙俊，何源，范伟，胜山裕，堀田悦伸，
申请(专利权)人：富士通株式会社，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人