一种自适应图像文本信息提取方法技术

技术编号：4174516 阅读：310 留言：0更新日期：2012-04-11 18:40

本发明专利技术一种自适应图像文本信息提取方法，涉及图像中的文本信息提取技术，其包括步骤：１）图像预处理；２）图像背景复杂度分析；３）文本初检测；４）文本验证；５）文本抽取；６）文本信息输出或显示。本发明专利技术方法，通过计算图像背景复杂度，对不同复杂度背景的图像采用不同的文本检测方法，减少了采用单一文本检测方法中的漏检，误检现象，提高了文本提取系统的整体性能。本发明专利技术方法中图像背景复杂度的计算方法简单，有效，不仅能够检测出不同背景复杂度的图像中的文字信息，而且检测出的文本信息不受字体，大小及语言的影响，具有很强的通用性。

An adaptive image text information extraction method

The extraction method of the invention is an adaptive image text information relates to text information extraction technology in the image, which comprises the following steps: 1) image preprocessing; 2) background complexity analysis; text detection; 3) 4) 5) text authentication; text extraction; 6) text information output or display. The method of the invention, by calculating the background complexity, text detection methods of the complex image background by different degree, reduce the use of single text detection method in the detection, error detection, improve the performance of the whole text extraction system. The background image in the method of the invention of the complex calculation method is simple, effective, not only can detect the different background of complexity in the image and text information, the detected text information is not affected by the influence of font, size and language, has very strong versatility.

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及模式识别与机器视觉领域中的文本信息提取
，具体地是。
技术介绍
随着数码相机、摄像头、超高速扫描仪等图像获取设备的广泛应用，图像中信息越来越引起人们的关注，然而计算机理解图像的内容，目前还很困难。图像中嵌入的文字能够提供一些人们所要的重要信息，如书的封面、视频、自然风景图片WWW网页的彩图等等，它对理解图像中的内容有着重要的帮助。让计算机像人类一样识别图像中的文字，即文字的自动检测系统，近年来越来越引起了人们的关注，它对于图像的存储、分类和检索等来说具有极其重要的意义，有着广泛的应用前景和商业价值。在许多情况下，图像中的场景文字甚至成为图像最主要、最关键的信息，例如对于车牌的识别，对于路牌的识别和翻译等。这些场景文字被抽取后，送入0CR模块，转换成计算机可理解的内码，可以方便的进行后续的各种处理。国内外的研究人员是在近几年内才开始对图像中的文本信息提取技术进行研究的，由于文本信息提取受到语种、文字分辨率、文字间距、分布情况、文字的背景、光照、颜色之类因素的影响，并且某些图案、纹理的背景很难与文字区分开来，因此图像中的文本信息提取技术目前还没有一个很好的解决办法。目前对这个问题提出一些解决的方法，大致可以分为四类基于边缘的方法，基于纹理的方法，基于颜色的方法和基于连通区域的方法。基于边缘的方法主要是利用图像中文字和背景通常存在较大的颜色差，因而在文字和背景存在明显的边缘。基于边缘的方法就是通过寻找排列规则的边缘，从而寻找文字区域；基于纹理的方法是把文字当成一种特殊的纹理，根据文字纹理具有的某种特定频率和...

【技术保护点】
一种自适应图像文本信息提取方法，其特征在于，包括步骤：１）图像预处理；２）图像背景复杂度分析；３）文本初检测；４）文本验证；５）文本抽取；６）文本信息输出或显示；　其具体步骤为：　Ａ）首先，从选定的路径中读取图像，并将彩色图像转换为灰色图像；　Ｂ）根据灰色图像所有像素点的灰度变化密度，计算出整幅图像的背景复杂度，计算方法为：某一像素点Ｐ↓［０］的灰度强度Ｓ′按照下式计算：　Ｓ′＝ＭＡＸ｛｜Ｐ↓［１］－Ｐ↓［８］｜，｜Ｐ↓［２］－Ｐ↓［７］｜，｜Ｐ↓［３］－Ｐ↓［６］｜，｜Ｐ↓［４］－Ｐ↓［５］｜｝　（１）　＊＊＊　（２）　则图像的背景复杂度为：　Ｄ＝＊Ｓ（ｉ，ｊ）／ｎ　（３）　其中，Ｓ′为图像中像素点Ｐ↓［０］的灰度强度，Ｓ按照（２）式将Ｓ′归一化为（０，１）范围内的数，Ｔ为归一化的阈值，Ｄ为图像的背景复杂度值，ｎ为图像中的像素数目，Ｐ↓［１］～Ｐ↓［８］为Ｐ↓［０］的八邻域；　按照计算的Ｄ值对图像背景复杂度进行分级；　Ｃ）根据图像复杂度级别决定采用何种文字边缘检测方法，对于...

【技术特征摘要】

【专利技术属性】
技术研发人员：李敏花，肖柏华，王春恒，戴汝为，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人