本发明专利技术公开了一种识别字符串的方法,包括以下步骤:将字符串图像划分为多个片段;对所述多个片段进行OCR识别,获得候选字符,其中,每一个片段对应于至少一个候选字符;获取片段的候选字符和/或片段的候选字符形成的字符组合的统计信息;以及结合所述统计信息以及候选字符的OCR识别置信度来确定候选字符串。此外,本发明专利技术还公开了一种字符串识别装置。
【技术实现步骤摘要】
本专利技术涉及一种,即由字符串图像识别出字符串的装置 和方法。
技术介绍
当今,通过OCR技术识别各种字符信息是很普遍的事情。例如,用户在纸上或 触摸屏上写下一串字符,通过扫描、拍照或感应等转换为字符串图像,将该字符串图像 输入识别系统,从而识别并输出该字符串值。在实际应用中存在各种字符串,例如字符串可能完全由字母组成,也可能由字 母和数字混合组成,可能包含分隔符“.”,还可能包含分隔符“@”。对于这样的信息、特别是这些信息的手写体的识别现在变得越来越重要,因为 随着互联网的迅速发展,在传送信息时使用到这种字符串的情况越来越频繁,例如用户 会在触摸屏上手写输入Email地址。然而,对于这种字符串的识别,目前并没有特别高 效的方法。
技术实现思路
本专利技术的目的是提出一种识别字符串的方法和装置。在下文中给出关于本专利技术 的简要概述,以便提供关于本专利技术的某些方面的基本理解。应当理解,这个概述并不是 关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分,也不是意图限 定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详 细描述的前序。根据本专利技术的一个方面,提供了一种识别字符串的方法,包括以下步骤将字 符串图像划分为多个片段;对所述多个片段进行OCR识别,获得候选字符,其中,每一 个片段对应于至少一个候选字符;获取片段的候选字符和/或片段的候选字符形成的字 符组合的统计信息;以及结合所述统计信息以及候选字符的OCR识别置信度来确定候选 字符串。根据本专利技术的另一个方面,提供了一种字符串识别装置,包括片段划分模 块,用于将字符串图像划分为多个片段;OCR识别模块,用于对所述多个片段进行OCR 识别,获得候选字符,其中,每一个片段对应于至少一个候选字符;统计信息获取模 块,用于获取片段的候选字符和/或片段的候选字符形成的字符组合的统计信息;以及 第一字符串确定模块,用于结合所述统计信息以及候选字符的OCR识别置信度来确定候 选字符串。另外,本专利技术的实施例还提供了用于实现上述字符串识别方法的计算机程序。此外,本专利技术的实施例还提供了至少计算机可读介质形式的计算机程序产品, 其上记录有用于实现上述字符串识别方法的计算机程序代码。附图说明 本专利技术可以通过参考下文中结合附图所给出的描述而得到更好的理解。所述附 图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分,而且用来进 一步举例说明本专利技术的优选实施例和解释本专利技术的原理和优点。在附图中图1示出了根据本专利技术的第一实施例的方法的示意性流程图。图2示出了根据本专利技术的第二实施例的方法的示意性流程图。图3示出了对字符串的一个识别结果。图4在右边示出了对OCR识别结果进行筛选之后的筛选结果,并且在左边示出 了相应的路径图。图5示出了常见的由两个字符组成的音节和/或由三个字符组成的音节。图6示出了针对音节的训练和统计结果。图7示出了根据本专利技术的第三实施例的方法的示意性流程图。图8示出了数字和字母构成的三元组的统计结果。图9示出了根据本专利技术的第四实施例的方法的示意性流程图。图10示出了根据本专利技术的第五实施例的利用已知的库来校正OCR识别结果的方 法的示意性流程图。图11示出了根据本专利技术的第六实施例的方法的示意性流程图。图12示出了根据本专利技术的第七实施例的字符串识别装置。图13示出了根据本专利技术的第八实施例的字符串识别装置。图14示出了根据本专利技术的第九实施例的字符串识别装置。图15示出了根据本专利技术的第十实施例的字符串识别装置的分隔符识别模块。图16示出了根据本专利技术的第十一实施例的字符串识别装置。图17示出了可用于实施根据本专利技术的实施例的计算机的示意性框图。具体实施例方式在下文中将结合附图对本专利技术的示范性实施例进行描述。为了清楚和简明起 见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种 实际实施例的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目 标,并且这些决定可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开 发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这 种开发工作仅仅是例行的任务。在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本专利技术,在附 图中仅仅示出了与根据本专利技术的方案密切相关的装置结构,而省略了与本专利技术关系不大 的其他细节。下面通过具体实施例对本专利技术进行详细描述。第一实施例纯粹的OCR识别本身是公知的技术。为方便后面的说明和理解,下面对OCR 识别过程作一简要描述。待识别的输入字符串图像可以是用户在纸上或触摸屏上写下并通过扫描、拍照或感应等转换而得到的字符串图像。例如,用户在触摸屏上手写输入字符串 “hanashiro” 的图像。通常,在获得输入的字符串图像之后,对手写输入的该字符串图像进行预处 理,例如进行二值化处理以将模拟图像、彩色数字图像、灰度级图像等转换为二值图 像。然后进行连通域分析。连通域是指由相互邻接的同类像素(例如前景像素)形成的 图像区域。所述同类像素在二值图像的情况下可以指前景像素(例如黑像素),也可以指 背景像素(例如白像素);在灰度级图像的情况下可以是指灰度级在一定范围内的像素。 通常考虑的连通域有四邻域连通域、八邻域连通域等等。由于连通域的概念是本领域普 通技术人员所知道的,因此在这里不再进一步描述。在此,可以通过各种公知的方法来 搜索连通域,例如通过八邻域连通域分析,搜索字符图像中所有的连通域。在八邻域连通域分析中,首先找到一个前景点,并以它为种子,然后在该种子 的八邻域内搜索没有被访问过的前景点,并以它们为新的种子点,递归继续上面的搜索 过程,直到找不到新的种子点,结束搜索,输出所有被访问过的前景点,作为一块连 通域;寻找新的没有被访问过的前景点,并以它为种子,可以找到另一块连通域。如 此,直到所有的点都被访问过。关于八邻域连通域分析,例如可参见DigitalImage Processing (4th Edition), W.K.Pratt, John Wiley&Sons, Inc.2007。然后,可以基于连通域分析(还可以进行字符切分)的结果提取特征、利用分类 器进行OCR识别。 但是,仅仅依靠对字符串的OCR识别并不能达到令人满意的结果。申请人发 现,在很多情况下字符串中包含着某种组合的规律。通过对大量字符串的统计可以获得 这种规律,并且将其利用在字符串的识别中,从而可以明显提高识别的正确率。在本专利技术的一个实施例中,提出了一种可以利用字符组合的统计信息结合OCR 识别来确定待识别的字符串的方法。在很多情况下,要识别的字符串往往是一些常见的或者常用的字符串。例如 对于日文的字符串“hanashiro”,如果对大量日文词进行统计,可以得到在前面出现“ha”的字符组合的情况下,随后出现“皿”这一的字符组合的概率。那么在识别的时 候如果将OCR识别的结果与该统计信息结合,则应当可以得到更好的结果。图1示出了根据本专利技术的第一实施例的方法的示意性流程图。在步骤SllO中,将字符串图像划分为多个片段。该切分步骤可以借助于多种 现有技术进行。仍然以“hanashiro”为例,可以基于连通域分析结果进行切分和识别。本文档来自技高网...
【技术保护点】
一种识别字符串的方法,包括以下步骤:将字符串图像划分为多个片段;对所述多个片段进行OCR识别,获得候选字符,其中,每一个片段对应于至少一个候选字符;获取片段的候选字符和/或片段的候选字符形成的字符组合的统计信息;以及结合所述统计信息以及候选字符的OCR识别置信度来确定候选字符串。
【技术特征摘要】
1.一种识别字符串的方法,包括以下步骤将字符串图像划分为多个片段;对所述多个片段进行OCR识别,获得候选字符,其中,每一个片段对应于至少一个 候选字符;获取片段的候选字符和/或片段的候选字符形成的字符组合的统计信息;以及结合所述统计信息以及候选字符的OCR识别置信度来确定候选字符串。2.—种字符串识别装置,包括片段划分模块,用于将字符串图像划分为多个片段;OCR识别模块,用于对所述多个片段进行OCR识别,获得候选字符,其中,每一个 片段对应于至少一个候选字符;统计信息获取模块,用于获取片段的候选字符和/或片段的候选字符形成的字符组 合的统计信息;以及第一字符串确定模块,用于结合所述统计信息以及候选字符的OCR识别置信度来确 定候选字符串。3.根据权利要求2所述的字符串识别装置,其中所述统计信息包括一个字符、字 符类型和/或字符组合与至少一个预定字符、字符类型和/或字符组合一起出现的概率。4.根据权利要求2或3所述的字符串识别装置,其中所述字符组合为构成音节的字符 组合或者同类型字符的组合。5.根据权利要求2或3所述的字符串识别装置,其中,所述字符串包括分隔符,其 中,该字符串识别装置还包括分隔符识别模块,用于识别字符串中的分隔符。6...
【专利技术属性】
技术研发人员:白洪亮,郑大念,孙俊,诹访美佐子,武部浩明,堀田悦伸,于浩,直井聪,
申请(专利权)人:富士通株式会社,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。