图像分割装置、图像分割方法和程序制造方法及图纸

技术编号:10486907 阅读:130 留言:0更新日期:2014-10-03 15:58
本申请公开了一种图像分割装置、图像分割方法和程序。该图像分割装置包括:图像特征提取单元,被配置为提取输入图像中的各个图像块的图像特征,每个图像块包括一个或更多个像素;评估单元,被配置为基于各图像块的图像特征来评估在空间上相邻的两个或更多个相邻图像块被聚类到同一聚类中的置信度;以及聚类单元,被配置为对图像块进行基于样例的聚类,其中在聚类过程中考虑了评估单元的评估结果,图像块的每一聚类形成输入图像的一个分割区域。

【技术实现步骤摘要】
图像分割装置、图像分割方法
本专利技术涉及图像处理领域,具体地,涉及一种采用基于空间一致性的样例聚类的图像分割装置、图像分割方法和程序
技术介绍
在计算机视觉应用中,数字图像或视频中的图像分割是一个重要任务。图像分割是将图像中具有特殊含义和较强关联的不同区域分割开,以提取图像中的各种信息或特征。因此,期望提供一种准确、快速的图像分割方法。
技术实现思路
在下文中给出了关于本专利技术的简要概述,以便提供关于本专利技术的某些方面的基本理解。应当理解,这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分,也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。鉴于
技术介绍
部分所述的需求,本专利技术关注于如何快速准确地对图像进行分割,更具体地,本专利技术提出了采用基于空间一致性的样例聚类的图像分割装置、图像分割方法和程序。根据本专利技术的一个方面,提供了一种图像分割装置,包括:图像特征提取单元,被配置为提取输入图像中的各个图像块的图像特征,每个图像块包括一个或更多个像素;评估单元,被配置为基于各图像块的图像特征来评估在空间上相邻的两个或更多个相邻图像块被聚类到同一聚类中的置信度;以及聚类单元,被配置为对图像块进行基于样例的聚类,其中在聚类过程中考虑了评估单元的评估结果,图像块的每一聚类形成输入图像的一个分割区域,其中,所述评估单元包括:边缘图提取模块,被配置为对输入图像进行边缘提取,得到边缘图;边缘损失计算模块,被配置为计算边缘图中与相邻图像块对应的相邻边缘图块之间的边缘损失;以及置信度计算模块,被配置为基于边缘损失来评估相邻图像块被聚类到同一聚类中的置信度。根据本专利技术的另一个方面,提供了一种图像分割方法,包括:提取输入图像中的各个图像块的图像特征,每个图像块包括一个或更多个像素;基于各图像块的图像特征来评估在空间上相邻的两个或更多个相邻图像块被聚类到同一聚类中的置信度;以及对图像块进行基于样例的聚类,其中在聚类过程中考虑了评估的结果,图像块的每一聚类形成输入图像的一个分割区域,其中,基于各图像块的图像特征来评估在空间上相邻的两个或更多个相邻图像块被聚类到同一聚类中的置信度包括:对输入图像进行边缘提取,得到边缘图;计算边缘图中与相邻图像块对应的相邻边缘图块之间的边缘损失;以及基于边缘损失来评估相邻图像块被聚类到同一聚类中的置信度。依据本专利技术的其它方面,还提供了相应的计算机程序代码、计算机可读存储介质和计算机程序产品。根据本申请的图像分割装置、图像分割方法和程序在采用基于样例的聚类方法对图像进行分割的过程中还考虑了图像的空间一致性、即邻近的图像块更可能属于同一分割区域这一规律,从而实现了更准确和快速的图像分割。通过以下结合附图对本专利技术的优选实施例的详细说明,本专利技术的这些以及其他优点和特征将更加明显。附图说明为了进一步阐述本申请的以上和其它优点和特征,下面结合附图对本申请的具体实施方式作进一步详细的说明。所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分。具有相同的功能和结构的元件用相同的参考标号表示。应当理解,这些附图仅描述本申请的典型示例,而不应看作是对本申请的范围的限定。在附图中:图1是示出了根据本申请的一个实施例的图像分割装置的结构的框图;图2是示出了根据本申请的另一个实施例的图像分割装置的结构的框图;图3是示出了根据本申请的一个实施例的评估单元的结构的框图;图4是示出了根据本申请的一个实施例的聚类单元的结构的框图;图5是示出了根据本申请的一个实施例的图像分割方法的示意性流程图;图6是示出了根据本申请的一个实施例的图像分割方法中的评估步骤的子步骤的示意性流程图;图7是示出了根据本申请的一个实施例的图像分割方法中的聚类步骤的子步骤的示意性流程图;以及图8是其中可以实现根据本专利技术的实施例的方法和/或装置的通用个人计算机的示例性结构的框图。具体实施方式在下文中将结合附图对本专利技术的示范性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本专利技术,在附图中仅仅示出了与根据本专利技术的方案密切相关的设备结构和/或处理步骤,而省略了与本专利技术关系不大的其他细节。下文中的描述按如下顺序进行:1.图像分割装置2.图像分割方法3.用以实施本申请的装置和方法的计算设备[1.图像分割装置]下面参照图1描述根据本申请的一个实施例的图像分割装置100的结构和功能。如图1所示,图像分割装置100包括:图像特征提取单元101,被配置为提取输入图像中的各个图像块的图像特征,每个图像块包括一个或更多个像素;评估单元102,被配置为基于各图像块的图像特征来评估在空间上相邻的两个或更多个相邻图像块被聚类到同一聚类中的置信度;以及聚类单元103,被配置为对图像块进行基于样例的聚类,其中在聚类过程中考虑了评估单元102的评估结果,图像块的每一聚类形成输入图像的一个分割区域。图像分割装置100用于对输入的图像进行分割,以获得具有整体含义或者内部关联密切的分割区域。输入图像可以看作是由多个图像块构成的,每个图像块包括一个或更多个像素。因此,从该意义上看,图像分割装置100用于基于一定规则对这些图像块进行聚类,以获得规模相对较大的一个或更多个分割区域或聚类集群。本申请的图像分割装置100采用了基于样例的聚类的思想,但是在进行基于样例的聚类还考虑了相邻图像块的空间一致性的贡献,从而实现了一种更快速、准确的无监督的图像分割装置。其中,图像特征提取单元101用于提取各个图像块的图像特征。这里所述的图像特征可以根据实际应用来选取,例如可以使用图像的颜色、灰度等中的至少一个特征作为图像特征。虽然这里示出了颜色或灰度作为示例,但是显然可以采用的特征不限于此,例如还可以使用方向梯度直方图(HOG)、高维特征等。在图像块包括多个像素的情况下,除了图像块中各个像素的图像特征之外,图像特征提取单元101还被配置为计算图像块中图像特征的均值或中值作为该图像块的图像特征。例如,分别针对每个图像块,计算该图像块中所有像素的颜色特征或灰度特征,并取其均值或中值作为该图像块的图像特征。然后,基于所获得的图像特征对这些图像块进行聚类。在进行聚类之前,使用评估单元102来进行各图像块之间空间一致性的估算。空间一致性指的是相邻的图像块被聚类到同一聚类中的置信度。该置信度的估算基于相邻的图像块更可能落入同一分割区域中这一假定,因此,该置信度也可以理解为两个相邻的图像块被聚类到不同的聚类中所引起的损失。具体地,例如,如果使两个相邻的图像块属于同一聚类,则评估单元102将这种聚类的置信度设置为0,否则将其设置为一个正值。但是,应该注意,评估单元102在计算置信度时并没有进行聚类,而是通过图像特征提取单元101所提取的各本文档来自技高网...
图像分割装置、图像分割方法和程序

【技术保护点】
一种图像分割装置,包括:图像特征提取单元,被配置为提取输入图像中的各个图像块的图像特征,每个图像块包括一个或更多个像素;评估单元,被配置为基于各图像块的图像特征来评估在空间上相邻的两个或更多个相邻图像块被聚类到同一聚类中的置信度;以及聚类单元,被配置为对所述图像块进行基于样例的聚类,其中在聚类过程中考虑了所述评估单元的评估结果,所述图像块的每一聚类形成所述输入图像的一个分割区域。

【技术特征摘要】
1.一种图像分割装置,包括:图像特征提取单元,被配置为提取输入图像中的各个图像块的图像特征,每个图像块包括一个或更多个像素;评估单元,被配置为基于各图像块的图像特征来评估在空间上相邻的两个或更多个相邻图像块被聚类到同一聚类中的置信度;以及聚类单元,被配置为对所述图像块进行基于样例的聚类,其中在聚类过程中考虑了所述评估单元的评估结果,所述图像块的每一聚类形成所述输入图像的一个分割区域,其中,所述评估单元包括:边缘图提取模块,被配置为对所述输入图像进行边缘提取,得到边缘图;边缘损失计算模块,被配置为计算所述边缘图中与所述相邻图像块对应的相邻边缘图块之间的边缘损失;以及置信度计算模块,被配置为基于所述边缘损失来评估所述相邻图像块被聚类到同一聚类中的置信度。2.根据权利要求1所述的图像分割装置,所述聚类单元包括:能量函数构建模块,被配置为基于各图像块的图像特征来计算在所述图像特征空间中两个图像块之间的距离,并根据所述距离以及所述评估的结果来构建基于样例的聚类的能量函数;以及优化模块,被配置为通过最小化所述能量函数来进行基于样例的聚类。3.根据权利要求2所述的图像分割装置,其中,所述能量函数为其中,以及其中,xp是输入图像中的第p个图像块,cp是第p个图像块的聚类标签,d(xi,xj)表示在所述图像特征空间中第i个图像块和第j个图像块之间的距离,δp(c)是用于选择xp作为聚类...

【专利技术属性】
技术研发人员:郑赟何源孙俊
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1