一种复杂背景图像文字分割方法技术

技术编号：8413346 阅读：266 留言：0更新日期：2013-03-14 02:15

本发明专利技术公开了一种复杂背景图像文字分割方法，主要包括以下步骤：进行图像读取；对读取的图像进行文字区域读取；对文字区域抽取底层颜色特征和底层纹理特征；对抽取出来的底层颜色特征和底层纹理特征进行融合得到底层局部特征；抽取文字区域的标签层全局特征；将文字区域的底层局部特征与文字区域的标签层全局特征进行融合得到文字区域所有像素的特征向量；对文字区域中所有像素特征向量训练得到第一级分割的分类器；用训练好的分类器进行第一级文字分割；对第一级分割的结果进行连通元标定；抽取连通元特征进行第文字分割；输出文字分割结果。本发明专利技术提高复杂背景图像中文字分割的准确率；具有一定的通用性和实用性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像处理领域中的图像分割技术，尤其涉及。
技术介绍
随着数码相机、摄像头、超高速扫描仪等图像获取设备的广泛应用，图像中信息越来越引起人们的关注，然而计算机理解图像的内容，目前还很困难。嵌入在图像中的文字，是图像语义内容的一种重要表达方式。如果能够自动提取和识别这些文字，就可以让机器自动理解图片内容并对图片进行分类，进而借助已经成熟的文本检索技术采用这些文字对图片进行标注和检索，从而为基于内容的图像和视频检索提供一种途径。然而，嵌入在图像中的文字通常都带有复杂背景，即使文本内容在图像中能被准确检测到，在没有去除背景之前，现有的OCR系统难以识别出字符，因而在提交给OCR系统之前还需要一个文字分割过程。因此，如何从复杂背景图像中分割文本信息，成为以文字为线索来理解和检索图像内容的一个关键任务。现有的图像文字分割技术主要分为以下三类基于阈值的方法、基于聚类的方法和基于统计模型的方法。基于阈值的方法一般根据文字块中前景和背景的亮度分布自适应地选取一个全局阈值或自适应局部阈值。在图像背景比较单一时该类方法能取得较好的效果；当文字具有较复杂的背景，例如文字的灰度可能介于背景的多个灰度之间时，阈值法不再适用。基于聚类的方法一般首先假定文字块中所有像素根据颜色可以分为K类，文字像素对应于其中一类，其余各类均为背景；然后采用经典的无监督聚类算法对所有像素进行聚类。这类方法可用于复杂背景的情况。但当背景中含有与文字颜色相同或相近的成分时，这些成分会被误分入文字类，从而产生大量的残余背景，影响OCR识别。基于统计模型的方法首先为文字块内所有像素或者文字像素建立...

【技术保护点】
一种复杂背景图像文字分割方法，其特征是，主要包括以下步骤：进行图像读取；对读取的图像进行文字区域读取；对读取的文字区域进行底层颜色特征抽取；对抽取过底层颜色特征的文字区域进行底层纹理特征抽取；对抽取出来的文字区域的底层颜色特征和底层纹理特征进行融合得到文字区域的底层局部特征；对文字区域的底层局部特征进行粗分类，然后在粗分类的结果上抽取文字区域的标签层全局特征；将文字区域的底层局部特征与文字区域的标签层全局特征进行融合得到文字区域所有像素的特征向量；对文字区域中所有像素特征向量进行训练得到用于第一级文字分割的分类器；用训练好的分类器对图像的特征分类，实现第一级文字分割；对第一级分割的结果进行连通元标定；抽取连通元特征，利用文字连通元与背景连通元的特征差异，进行连通元筛选，去除背景连通元，实现第二级文字分割；输出文字分割结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：柏猛，李敏花，吕英俊，
申请(专利权)人：山东科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人