本发明专利技术一种自适应图像文本信息提取方法,涉及图像中的文本信息提取技术,其包括步骤:1)图像预处理;2)图像背景复杂度分析;3)文本初检测;4)文本验证;5)文本抽取;6)文本信息输出或显示。本发明专利技术方法,通过计算图像背景复杂度,对不同复杂度背景的图像采用不同的文本检测方法,减少了采用单一文本检测方法中的漏检,误检现象,提高了文本提取系统的整体性能。本发明专利技术方法中图像背景复杂度的计算方法简单,有效,不仅能够检测出不同背景复杂度的图像中的文字信息,而且检测出的文本信息不受字体,大小及语言的影响,具有很强的通用性。
An adaptive image text information extraction method
The extraction method of the invention is an adaptive image text information relates to text information extraction technology in the image, which comprises the following steps: 1) image preprocessing; 2) background complexity analysis; text detection; 3) 4) 5) text authentication; text extraction; 6) text information output or display. The method of the invention, by calculating the background complexity, text detection methods of the complex image background by different degree, reduce the use of single text detection method in the detection, error detection, improve the performance of the whole text extraction system. The background image in the method of the invention of the complex calculation method is simple, effective, not only can detect the different background of complexity in the image and text information, the detected text information is not affected by the influence of font, size and language, has very strong versatility.
【技术实现步骤摘要】
本专利技术涉及模式识别与机器视觉领域中的文本信息提取
,具 体地是。
技术介绍
随着数码相机、摄像头、超高速扫描仪等图像获取设备的广泛应用, 图像中信息越来越引起人们的关注,然而计算机理解图像的内容,目前还 很困难。图像中嵌入的文字能够提供一些人们所要的重要信息,如书的封 面、视频、自然风景图片WWW网页的彩图等等,它对理解图像中的内容有 着重要的帮助。让计算机像人类一样识别图像中的文字,即文字的自动检 测系统,近年来越来越引起了人们的关注,它对于图像的存储、分类和检 索等来说具有极其重要的意义,有着广泛的应用前景和商业价值。在许多 情况下,图像中的场景文字甚至成为图像最主要、最关键的信息,例如对 于车牌的识别,对于路牌的识别和翻译等。这些场景文字被抽取后,送入0CR模块,转换成计算机可理解的内码,可以方便的进行后续的各种处理。国内外的研究人员是在近几年内才开始对图像中的文本信息提取技 术进行研究的,由于文本信息提取受到语种、文字分辨率、文字间距、分 布情况、文字的背景、光照、颜色之类因素的影响,并且某些图案、纹理的背景很难与文字区分开来,因此图像中的文本信息提取技术目前还没有 一个很好的解决办法。目前对这个问题提出一些解决的方法,大致可以分为四类基于边缘 的方法,基于纹理的方法,基于颜色的方法和基于连通区域的方法。基于 边缘的方法主要是利用图像中文字和背景通常存在较大的颜色差,因而在 文字和背景存在明显的边缘。基于边缘的方法就是通过寻找排列规则的边 缘,从而寻找文字区域;基于纹理的方法是把文字当成一种特殊的纹理, 根据文字纹理具有的某种特定频率和方向信息来确定图像中可能的文字 区域;基于颜色的文本信息提取方法利用了大多数图像文字具有均匀颜色 这一事实,通过颜色约减的方法可以将原图分解成属于若干个不同颜色的 子图,然后在各个子图上独立进行文字提取工作;基于连通区域的方法主 要是在图像上通过寻找一致性区域来寻找文字区域,基于连通域的方法利 用了文字的排列特性,即绝大多数情况下文字是成组出现的,例如多个字 母组成一个单词,或者多个汉字组成一个句子。属于同一组的文字会具有 比较统一的几何尺寸和排列规则。上述现有的研究方法,基于边缘的文本提取方法计算简单,但由于采 用单一的边缘检测方法,当文字和背景对比度相差不大的情况下检测效果 并不理想;而且,倘若背景轮廓和字符粘连,也容易得到错误结果。这就 需要结合其它的信息来扩大检测范围;基于纹理的文本提取方法需要抽取 有效的纹理特征,虽然可有效地检测出文字所在区域,但是也会提取出具 有类似纹理的背景区域,需要结合其它特征;基于颜色聚类方法的主要难 点在于无法预知文字和背景的颜色,因而也就难以确定颜色子图的个数,聚类数过多或者过少都会影响提取性能,而且计算量很大;基于连通区域 的方法大多数情况下不能单独使用, 一般用在边缘、纹理和颜色等方法之 后。上述各种方法进行文字信息提取时,都没有考虑到图像背景的复杂度 和文字、背景的对比度情况,对不同背景复杂度的图像,都采用单一的提 取方法,容易漏掉一些对比度弱的文本区域或者将似文本区域错误提取出 来,造成整体提取效果不好。
技术实现思路
本专利技术的目的是提供,根据图像背 景复杂程度,采用不同的图像文本检测技术,快捷、准确、有效的检测出 不同背景复杂度图像中的文字信息,而且检测出的文本信息不受字体,字 体大小及语言的影响,具有很强的通用性。为达到上述目的,本专利技术的技术解决方案如下,其包括步骤1)图像预处理;2) 图像背景复杂度分析;3)文本初检测;4)文本验证;5)文本抽取;6) 文本信息输出或显示;其具体步骤为A) 首先,从选定的路径中读取图像,并将彩色图像转换为灰色图像;B) 根据灰色图像所有象素点的灰度变化密度,计算出整幅图像的背景复杂度,计算方法为某一象素点P。的灰度强度s'按照下式计算S' 二厨(…-尸8|,|尸2 HA(1)245 0,S 2 T Otherwise则图像的背景复杂度为:(3)其中,s'为图像中像素点尸。的灰度强度,s按照(2)式将s'归一化为(0,l)范 围内的数,T为归一化的阈值,D为图像的背景复杂度值,w为图像中的像 素数目,A A为P。的八邻域;按照计算的D值对图像背景复杂度进行分级;C) 根据图像复杂度级别决定采用何种文字边缘检测方法,对于复杂 度较低的图像,采用较简单的边缘文本检测方法,对于复杂度较高的图像, 采用较复杂的边缘文本检测方法;D) 根据采用的文本检测方法,找出图像中的候选文本区域,对文本 信息区域进行初始定位;E) 对从图像中找到的候选文本区域,抽取相关特征进行文本区域验 证,通过验证的候选文本区域,即判定为文本块,将在后续的步骤中抽取 文本信息,未通过验证的候选文本区域,即判定为非文本区域,将其从候 选文本中去除;F) 对确定的文本块,去除文本块中的背景,将所有文本信息抽取出来;G)将图像中抽取出来的所有文本信息输出给下一级处理,或在计算 机上显示出来。所述的方法,其所述B)步中,对图像背景复杂度进行分级,是分为低、中、高三级如果0SDS0.15 ,则图像背景复杂度为低级;如果 0.15 < 1)^0.3,则图像背景复杂度为中级;如果0.3<1)^1则图像背景复杂度为高级。所述的方法,其所述C)步中,对于复杂度较低的图像,采用较简单的边缘检测方法,对于复杂度较高的图像,釆用较复杂的边缘检测方法,是:如果图像背景复杂度判定为低,则采用边缘特征抽取方法l:在灰度图 像上用Sobel四方向算子求取边缘并抽取特征;如果图像背景复杂度判定 为中,则采用边缘特征抽取方法2:基于形态学的方法在灰度图象上求取 形态边缘并抽取特征;如果图像背景复杂度判定为高,则采用边缘特征抽 取方法3 :用基于形态学的彩色边缘抽取方法,分别对三个颜色通道提取形态梯度,然后将三个颜色通道合并得到边缘并抽取特征。所述的方法,其所述D)步中,找出图像中的候选文本区域,是a) 提取图像的边缘并抽取特征后,在边缘图像上进行连通域分析,获 得图像上所有的连通元;b) 利用边缘特征和几何特征对连通元进行筛选,剔除非文本连通元;c) 对每个文本连通元的位置和尺寸进行分析,将在同一行或同一列的 文本连通元组合,形成候选文本区域。所述的方法,其所述E)步中的相关特征,为文本区域中字符宽度的均 值和方差,通过将文本行或文本列的二值图像向水平方向和竖直方向投 影,投影曲线上有明显的波峰和波谷,通过统计相邻波谷之间的距离,计 算字符的平均宽度和方差。所述的方法,其所述F)步中,将所有文本信息抽取出来,是采用二值 化的方法、颜色聚类的方法或统计模型的方法抽取所有文本信息。所述的方法,其所述b)步中的边缘特征和几何特征,其中,边缘特 征是边缘密度特征和边缘方向特征,几何特征是连通以元的长,宽,宽高 比,占空比。本专利技术,通过计算图像背景复杂度,对不同复杂度背景的图像采用不 同的边缘检测方法,减少了采用单一边缘检测方法中的漏检,误检现象, 提高了文本提取系统的整体性能。该专利技术中图像背景复杂度的计算方法简 单,有效,不仅能够检测出不同背景复杂度图像中的文本信息,而且当图 像中文本和背景对比度不同时,同样有效。检测出的文本本文档来自技高网...
【技术保护点】
一种自适应图像文本信息提取方法,其特征在于,包括步骤:1)图像预处理;2)图像背景复杂度分析;3)文本初检测;4)文本验证;5)文本抽取;6)文本信息输出或显示; 其具体步骤为: A)首先,从选定的路径中读取图像,并将彩色图像转 换为灰色图像; B)根据灰色图像所有像素点的灰度变化密度,计算出整幅图像的背景复杂度,计算方法为:某一像素点P↓[0]的灰度强度S′按照下式计算: S′=MAX{|P↓[1]-P↓[8]|,|P↓[2]-P↓[7]|,|P↓[3 ]-P↓[6]|,|P↓[4]-P↓[5]|} (1) *** (2) 则图像的背景复杂度为: D=*S(i,j)/n (3) 其中,S′为图像中像素点P↓[0]的灰度强度,S按照(2)式将S′归一化为(0, 1)范围内的数,T为归一化的阈值,D为图像的背景复杂度值,n为图像中的像素数目,P↓[1]~P↓[8]为P↓[0]的八邻域; 按照计算的D值对图像背景复杂度进行分级; C)根据图像复杂度级别决定采用何种文字边缘检测方法,对于复杂 度较低的图像,采用较简单的边缘文本检测方法,对于复杂度较高的图像,采用较复杂的边缘文本检测方法; D)根据采用的文本检测方法,找出图像中的候选文本区域,对文本信息区域进行初始定位; E)对从图像中找到的候选文本区域,抽取相关特征 进行文本区域验证,通过验证的候选文本区域,即判定为文本块,将在后续的步骤中抽取文本信息,未通过验证的候选文本区域,即判定为非文本区域,将其从候选文本中去除; F)对确定的文本块,去除文本块中的背景,将所有文本信息抽取出来; G) 将图像中抽取出来的所有文本信息输出给下一级处理,或在计算机上显示出来。...
【技术特征摘要】
【专利技术属性】
技术研发人员:李敏花,肖柏华,王春恒,戴汝为,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。