用于根据图像生成文本字符串的方法和设备技术

技术编号：2952021 阅读：221 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供一种用于根据图像生成文本字符串的方法和设备。该方法包括以下步骤：通过在所述图像上检测边缘，生成边缘图像；在所述边缘图像上寻找连接分量；从所找出的所述连接分量中去除满足预定条件的连接分量；从所述去除之后保留的所述连接分量中将存在于相同直线上的连接分量分组在一起；以及基于分组后的所述连接分量，生成文本字符串。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种用于根据图像生成文本字符串的方法和设备，尤其涉及一种从自然图像自动提取文本的方法和设备。
技术介绍
自然图像的文本提取具有非常广泛的应用，所述应用诸如是牌照定位和基于内容的图像/视频索引等。然而，由于尺寸、样式、方向和对齐的不同所引起的文本的变化、以及低图像对比度和复杂的背景使得自动文本提取这一问题非常具有挑战性。已经针对特定应用提出了从图像和视频提取文本的各种方法(参考文献1到3)。根据所利用的特征，可以将文本提取方法分成两种类型基于区域的方法和基于紋理的方法。可以将基于区域的方法进一步分成两种子方法基于连接分量 (connected component)(以下称之为"CC")的方法和基于边缘的方法。这两种方法通过识别诸如CC或边缘的子结构，然后合并这些子结构以标记文本的包围盒，来以自下而上的方式进行工作。注意，某些方法使用基于CC的方法和基于边缘的方法两者的组合。基于紋理的方法使用如下观察图像中的文本具有将它们从背景区分开的明显紋理特性。可以使用基于Gabor滤波器、小波、FFT 和空间变异(spatial variance )等的技术，来检测图像中的文本区域的紋理特性。基于CC的方法通过将小分量依次分组成较大分量来使用自下而上的方法，直到在图像中识别出所有文本区域为止。需要进行几何分析以使用分量的空间排列来合并文本分量，从而过滤掉非文本分量，并标记文本区域的边界。基于cc的方法的关键点是生成分量和几何分析处理的方式，这也是各种基于cc的方法的主要差异。然而，图像的文本提取的准确度根据不同条件而改变。例如...

【技术保护点】
一种用于根据图像生成文本字符串的方法，包括以下步骤：　通过在所述图像上检测边缘，生成边缘图像；　在所述边缘图像上寻找连接分量；　从所找出的所述连接分量中去除满足预定条件的连接分量；　从所述去除之后保留的所述连接分量中将存在于相同直线上的连接分量分组在一起；以及　基于分组后的所述连接分量，生成文本字符串。

【技术特征摘要】

【专利技术属性】
技术研发人员：胥立丰，张宏志，王艳清，
申请(专利权)人：佳能株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人