当前位置: 首页 > 专利查询>南京大学专利>正文

一种基于视觉共生的图像分割方法技术

技术编号:7442492 阅读:267 留言:0更新日期:2012-06-16 20:37
本发明专利技术公开了一种基于视觉共生的图像分割方法,该方法包括像素特征提取、视觉共生关系的提取和基于视觉共生的图像分割三部分组成,其中像素特征的提取包括颜色空间的转换、特征量化等步骤,然后利用主题模型来提取各像素之间的视觉共生关系,最后进行图像的分割。本发明专利技术的优点是分割准确率高,能够充分有效的利用图像中不同物体的视觉相似性和差异性进行有效的物体的分割。

【技术实现步骤摘要】

本专利技术涉及一种彩色图像的分割算法,尤其涉及一种基于图像内部视觉共生的图像分割方法,属于图像处理

技术介绍
图像分割是图像处理、机器视觉、图像检索等领域中的一个重要研究课题。图像分割通过将图像中的不同物体,如前景和背景区域等分割为不同的区域,对图像的后续处理, 如特征提取和分类等,都具有非常重要的作用。图像分割大致可以分为自动和半自动两种方法。图像的自动分割包括常见的边缘检测、聚类、形态学方法、区域增长等。半自动的分割方法通常需要人为的干预,其结果通常也会好于自动分割算法,常见的方法有动态边界等。然而大多数图像分割方法都是通过图像中各个相邻像素之间的相似性来将整个图像分割为若干不相交的区域,每个不同的区域对应一个不同的类别。然而,在很多情况下,图像中的前景物体会出现被遮挡等情况,从而其区域出现一定的非连续性,传统的图像分割方法在这种情况下,会将对应的物体分割为不同的区域,然而该图像分割方法无法有效处理局部遮挡物体的分割的不足问题。
技术实现思路
专利技术目的针对现有技术中存在的问题与不足,本专利技术通过考虑图像中不同区域的视觉共生关系,将非连续的同类区域分割为同一类别,提供一种提高图像分割的准确性和有效性的基于视觉共生的图像分割方法。技术方案,包括如下步骤(1)针对一幅彩色图像I,将其从RGB空间转换为CIE-LAB空间;(2)对图像中每个像素的3X3邻域提取局部颜色直方图特征Hi ;(3)利用Kmeans对所有的颜色直方图进行聚类,得到K个聚类中心,构成词汇表 V ;(4)利用词汇表V对每个颜色直方图Hi进行量化,从而得到每个像素的视觉关键词1 ;R(5)将图像均勻分为D个RXR的矩形区域,每两个相邻的矩形区域重叠y (6)根据每个矩形区域的视觉关键词直方图Hd,d= 1,...,D,建立文集C;(7)根据先验知识人工的确定分割区域的数量为K,根据文集C,训练一个主题数量为K隐含狄利克雷分配,从而获得每个区域中各像素属于不同主题的概率< . (8)图像中每个像素属于各个主题的概率仍为包含其的所有对应区域中获得的概率<的均值;(9)根据概率值仍将图像分割为K个不同类别。本专利技术方法包括图像中每个像素的视觉关键词的提取与构造、主题模型的训练以及基于主题概率的图像分割三部分,其中步骤(1)至(4)描述了图像中每个像素的颜色直方图特征的提取以及视觉关键词的构造过程,步骤( 至(7)描述了主题模型的训练数据的构造以及概率输出,步骤(8)至(9)描述了如何基于主题模型的概率输出进行图像的分割。有益效果本专利技术的方法与现有技术相比,其显著优点是能够有效解决传统图像分割方法无法有效针对图像中非连续性区域进行分割的问题,通过使用图像中的视觉共生关系,将图像中非连续的同类区域分类为相同类别,为后续的处理,如特征提取、分类、检索等流程提供了更好的分割结果,从而提高图像分割的准确性和有效性。附图说明图1为本专利技术实施例的图像中视觉共生的描述示意图;图2为本专利技术实施例中使用的基于隐含狄利克雷分配的分类器示意图;图3是本专利技术实施例的工作流程图。具体实施例方式下面结合附图和具体实施例,进一步阐明本专利技术,应理解这些实施例仅用于说明本专利技术而不用于限制本专利技术的范围,在阅读了本专利技术之后,本领域技术人员对本专利技术的各种等价形式的修改均落于本申请所附权利要求所限定的范围。如图1所示,在不同的图像之间,相同类别存在着具有相似视觉特征的区域,这种性质叫做视觉共生,而在同一个图像的内部,这种视觉共生关系会更加明显,因为在同一幅图像不存在尺度、光照、旋转等因素的影响,同一类别的区域之间的视觉相似性会更加的突出,即使同一类别的物体在图像中非连续性的分布,利用这一特性也能有效的将其分类为同一类别。图2中描述了本专利技术实施例中使用的基于隐含狄利克雷分配的分类器,通过利用隐含狄利克雷分配来对图像中的视觉共生关系进行建模和分类。图3描述了本专利技术实施例的具体工作流程,包括图像中每个像素的视觉关键词的提取与构造、主题模型的训练以及基于主题概率的图像分割三部分。本专利技术实施例方法流程如图3所示,下面详细说明基于视觉共生的图像分割方法包括下列步骤步骤(1)针对一幅彩色图像I,将其从RGB空间转换为CIE-LAB空间,RGB颜色空间是一种常用的颜色空间,然而,基于RGB颜色空间的欧氏距离度量并不能很好的描述不同颜色在人眼中的视觉相似性,而使用CIE-LAB颜色空间则可以避免这类问题,视觉相似的颜色之间具有较小的欧式距离。步骤O)对图像中每个像素的3X3邻域提取局部颜色直方图特征H”为了描述图像中每个像素的特征,因此本实施例提取每个像素周围3X3邻域的27维颜色直方图。步骤(3)利用Kmeans对所有的颜色直方图进行聚类,得到K个聚类中心,构成词汇表V。针对当前图像中所有像素的27维的颜色直方图,利用Kmeans进行聚类,得到K个聚类中心(C1, C2, ... , cK),构成视觉词汇表V = Ic1, C2, ... , cK}。步骤利用词汇表V对每个颜色直方图印进行量化,针对每个像素的颜色直方图Hi在词汇表中选择欧式距离最小的视觉关键词化=argmi~ \\Ht -C1 ||2从而将原始图像转换为由每个像素的视觉关键词组成的图像,如图3中的第二步所示。R步骤(5)将图像均勻分为D个RXR的矩形区域,每两个相邻的矩形区域重叠y根据每个矩形区域的视觉关键词直方图Hd,d = 1,. . .,D,建立文集C,用于训练后续的主题模型。如图2所示,文集C包含一系列区域,每个区域包含对应的每个像素的视觉关键词, 从而构成一个视觉关键词的树状结构。步骤(7) :LDA是自然语言处理中的一种常用的主题模型,通过统计文档中的关键词出现频率等信息来得到不同关键词在不同文档中的主题信息P (Wn ι Zk, d)。在利用LDA来处理图像数据时,首先需要将图像进行分块,然后对每个分块区域提取特征,并量化为若干关键词。这里假设词汇表中共有N个关键词wn,η = 1,...,N表示第k个主题,K为主题的数量,d= 1,...,D代表D个文档。LDA的概率图结构如图1所示,其中α为K维向量, Ρ(θ I α)满足 Dirichlet 分布,P (ζ θ )满足多项式分布,β = P (w = n | z = k)。P (wn | zk, d)表示在文档d中,对应主题\的关键词为Wn的概率。根据先验知识人工的确定分割区域的数量为K,根据文集C,训练一个主题数量为K隐含狄利克雷分配,从而获得每个区域中各像素属于不同主题的概率< =P(ZIMW)。步骤(8):图像中每个像素属于各个主题的概率仍为包含其的所有对应区域中获得的概的均值权利要求1. ,其特征在于,包括如下步骤(1)针对一幅彩色图像I,将其从RGB空间转换为CIE-LAB空间;(2)对图像中每个像素的3X3邻域提取局部颜色直方图特征Hi;(3)利用Kmeans对所有的颜色直方图进行聚类,得到K个聚类中心,构成词汇表V;(4)利用词汇表V对每个颜色直方图Hi进行量化,从而得到每个像素的视觉关键词化;R(5)将图像均勻分为D个RXR的矩形区域,每两个相邻的矩形区域重叠y (6)根据每个矩形区域的视觉关键词直方图Hd,d= 1,本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:李宁郭乔进丁轶
申请(专利权)人:南京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术