一种基于水平集分割的文本抽取方法技术

技术编号：12527055 阅读：97 留言：0更新日期：2015-12-17 21:59

本发明专利技术公开了一种基于水平集分割的文本抽取方法，包括：读取图像数据信息，确定边界曲线；对读取的图像进行灰度化；抽取灰度特征值；根据灰度特征值采用水平集函数将图像分为两个区域；对分割出的两个区域进行二值化；对二值化后的两个区域分别进行连通元标定；对两个区域中标定的连通元进行滤波；对滤波后的区域进行极性判定，判断出文本像素区域和背景像素区域；对文本区域进行滤波，滤除背景噪声；输出文本抽取结果。本发明专利技术不仅能够抽取复杂背景中的文本信息，而且对含空心字的图像文本抽取也十分准确，具有一定的通用性和实用性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像处理领域中的文本抽取方法，尤其涉及一种基于水平集分割的文本抽取方法。
技术介绍
随着网络和计算机技术的发展，越来越多的信息以图像或视频等多媒体的形式出现。图像或视频中含有丰富的文本信息，这些文本信息对图像或视频起着说明和诠释的作用。提取和识别这些文本信息对图像理解、视频内容分析、智能交通、机器视觉、智能控制等方面有着重要的意义。然而，由于文本信息通常处于复杂背景中，通用的OCR系统很难识别出文本信息。因而文本检测出来在提交给OCR系统之前还需要一个去除背景的过程即文本抽取过程。因此，如何从复杂背景图像中抽取文本信息，成为以文本信息为线索来理解图像内容的一个关键任务。现有的图像文本抽取技术主要分为基于阈值的方法、基于聚类的方法和基于统计模型的方法。基于阈值的方法主要利用文本和背景颜色的分割，设定阈值将文本和背景分离。阈值的选取有全局阀值和局部阀值两种。该种方法抽取的效果取决于阀值对图像背景和文本的区分度，一般适用于图像背景比较单一的情况。基于聚类的方法一般利用颜色信息将文本块图像分为K类，然后根据某一聚类算法和设定的阀值将符合规则的类聚合，逐步的减少颜色的分类数。文本像素最后对应其中的一类，其余各类均为背景。这类方法但当背景中含有与文本颜色相同或相近的成分时，这些成分会被误分入文本类，从而产生大量的残余背景，影响OCR识别。基于统计模型的方法对文本块中的所有像素建立概率模型，然后设定合理的概率模型中的参数，然后根据最大似然法则确定每个像素是否属于文本像素。概率模型方法中模型参数一般需要统计学习...

【技术保护点】
一种基于水平集分割的文本抽取方法，其特征是，包括：读取图像数据信息，确定边界曲线；对读取的图像进行灰度化；抽取灰度特征值；根据灰度特征值采用水平集函数将图像分为边界曲线内区域和边界曲线外区域；对分割出的两个区域进行二值化；对二值化的两个区域分别进行连通元标定；对两个区域中标定的连通元进行滤波；对滤波后的区域进行极性判定，判断出文本像素区域和背景像素区域；对文本区域进行滤波，滤除背景噪声；输出文本抽取结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：吕英俊，李敏花，柏猛，吕雪菲，
申请(专利权)人：山东科技大学，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人