文本行提取方法和文本行提取设备技术

技术编号：13878396 阅读：98 留言：0更新日期：2016-10-22 18:23

本发明专利技术公开了文本行提取方法和文本行提取设备。根据本发明专利技术的文本行提取方法包括：提取输入文档图像中的连通域；确定连通域之间的潜在链接；调整潜在链接构成的生成树；以及基于调整后的生成树，优化与生成树对应的文本行，使得文本行中字符的总差异最小。根据本发明专利技术的文本行提取方法和文本行提取设备能够准确地、鲁棒地提取出文档图像中的文本行。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术一般地涉及图像处理领域。具体而言，本专利技术涉及一种能够准确地、鲁棒地提取文档图像中的文本行的方法和设备。
技术介绍
近年来，图像处理技术得到了蓬勃的发展。其中，涉及文档图像的光学字符识别处理在商业和个人的应用中较为广泛地存在。对于光学字符识别技术来说，一个基本的任务是提取文档图像中的文本行。在此基础之上，才能进行确定文本行的方向、确定文本行中的字符等操作。图1示出了提取文档图像中的文本行的结果的示例。其中，用穿过文字的横线表明所提取的文本行的位置和包含的字符。由于提取文本行的处理需要应用到广泛的文档图像类型，例如图书、手册、封面、杂志、报纸等，所以复杂的背景、不同的行方向、低图像质量、不同类型的语言文字等提高了文本行提取处理的难度。大多数传统的提取文本行的处理针对特定类型的文档的特殊文本行形式，无法以通用的处理方式，准确地提取各种类型的文档图像中的文本行。因此，期望一种提取文档图像中的文本行的方法和设备，其能够准确地、鲁棒地提取各种类型的文档图像中的文本行。
技术实现思路
在下文中给出了关于本专利技术的简要概述，以便提供关于本专利技术的某些方面的基本理解。应当理解，这个概述并不是关于本专利技术的穷举性概述。
它并不是意图确定本专利技术的关键或重要部分，也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念，以此作为稍后论述的更详细描述的前序。本专利技术的目的是针对现有技术的上述问题，提出了一种能够准确地、鲁棒地提取各种类型的文档图像中的文本行的方法和设备。为了实现上述目的，根据本专利技术的一个方面，提供了一种文本行提...

【技术保护点】
一种文本行提取方法，包括：提取输入文档图像中的连通域；确定连通域之间的潜在链接；调整潜在链接构成的生成树；以及基于调整后的生成树，优化与生成树对应的文本行，使得文本行中字符的总差异最小。

【技术特征摘要】
1.一种文本行提取方法，包括：提取输入文档图像中的连通域；确定连通域之间的潜在链接；调整潜在链接构成的生成树；以及基于调整后的生成树，优化与生成树对应的文本行，使得文本行中字符的总差异最小。2.如权利要求1所述的方法，其中所述确定连通域之间的潜在链接包括：针对每个连通域，确定多个预定方向上的候选链接；针对每个候选链接，计算候选链接的权值；根据候选链接的权值的大小，选取预定数量的候选链接作为所述潜在链接。3.如权利要求1所述的方法，其中所述调整潜在链接构成的生成树包括：按照链接权值最小原则，基于潜在链接，构建包括所有连通域的最小生成树；按照预定准则，调整所构建的生成树上的潜在链接，直至满足预定条件。4.如权利要求3所述的方法，其中所述按照预定准则，调整所构建的生成树上的潜在链接包括：去除生成树上的与同一连通域关联的4个或更多个潜在链接；去除生成树上的与同一连通域关联的3个潜在链接中不能两两构成线性链接的潜在链接；去除生成树上的与同一连通域关联的、不能构成线性链接的2个潜在链接；如果此时不满足预定条件，则对于因上述去除而与生成树不存在连接的连通域，按照链接权值最小原则，基于潜在链接，重新将这样的连通域与生成树上的连通域连接，并重新执行上述去除步骤直至满足预定条件。5.如权利要求4所述的方法，其中所述基于调整后的生成树，优化与生成树对应的文本行，使得文本行中字符的总差异最小包括：将去除的连通域与生成树上的连通域按照链接权值最小原则，基于潜在连接，重新与生成树连接；保持生成树的原有连接不变并...

【专利技术属性】
技术研发人员：汪留安，田中宏，范伟，孙俊，
申请(专利权)人：富士通株式会社，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人