形状描述符抽取方法技术

技术编号:2949630 阅读:207 留言:0更新日期:2012-04-11 18:40
一种图像搜索方法,其中搜索具有与查询图像相似形状的图像的方法包括:    (a)从查询图像的形状描述符中获取直线列表;    (b)通过比较检测的图像的形状描述符的直线列表和查询的图像的形状描述符的直线列表,获取相异性;以及    (c)基于获取的相异性检测与查询图像具有相似形状的图像。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及,更具体地说,涉及基于图像轮廓的。
技术介绍
形状描述符以使能自动抽取的低提取水平描述为基准,并且是人能够从图像中感知的基本描述符。正在研究描述一幅图像内的特定对象的形状以及基于该形状估量匹配或相似性程度的算法。但是,这些算法仅描述特定对象的形状,所以在感知一般对象的形状方面存在很多问题。目前,为了解决上述问题,由比如MPEG-7的标准组建议的形状描述符是通过查找给定对象的各种变形的特征来获得的。现有许多种类的形状描述符。在MPEG-7的实验模型(eXperimental Model,XM)1中采纳的两种形状描述符,公知的为泽尼克(Zernike)动量(moment)形状描述符和曲率尺度空间形状描述符。对于泽尼克动量形状描述符,定义关于多种形状的泽尼克基函数,以勘察一幅图像内的对象。然后,固定尺寸的图像投影在基函数之上,并将产生的结果用作形状描述符。对于曲率尺度空间描述符,抽取模型图像的外形,并以尺度空间表示沿着外形曲率点的变化。然后,将峰值的位置用z维向量表示。但是,抽取前者的一描述符时,输入图像的尺寸受到限制。而且,抽取后一形状描述符时,所抽取的形状只能是一个对象。
技术实现思路
为了解决上述问题,本专利技术的一个目的是提供一种,能够有效地应用到活动视频压缩技术和基于该活动视频压缩技术的图像搜索技术。本专利技术的另一个目的是提供一种图像搜索方法,使用通过抽取的形状描述符,在索引的图像内搜索与查询图像相似的图像。本专利技术的另一个目的是提供一种相异性估量方法,使用通过抽取的形状描述符,估量将要索引的图像间的相异性。从而,为了实现上述目的,根据本专利技术的一个方面,提供一种,包括(a)通过抽取图像的轮廓确定基于抽取的轮廓的形状描述符。另外,为了实现上述目的,根据本专利技术的另一方面,提供一种,包括(a)从输入的图像中抽取轮廓;(b)通过基于抽取的轮廓执行像素间的连线获得一直线列表;以及(c)将通过规格化直线列表获得的规则的直线列表确定为形状描述符。另外,步骤(a)最好包括(a-1)通过对输入的图像执行距离变换获取一距离映射;以及(a-2)从获得的距离映射中抽取轮廓。另外,步骤(b)最好包括(b-1)稀疏(thin)抽取的轮廓;以及(b-2)通过连接稀疏的轮廓中的每一个像素抽取直线。另外,步骤(c)最好包括(c-1)得出所连接的开始和终止点的列表;(c-2)通过径直组合抽取的直线获取第一直线列表;以及(c-3)确定通过基于每一条直线的端点间的最大距离规格化第一直线列表所获得的第二直线列表。另外,距离变换最好基于表示对象内侧的每一点作为离开背景的最小距离值的函数。另外,步骤(a-2)最好包括使用边缘检测方法获取到距离映射的局部最大值。另外,步骤(a-2)最好包括(a-2-1)使用局部最大值执行卷积检测四个方向的掩码(mask)以获取局部最大值。另外,在步骤(a-2-1)之后,最好进一步包括(a-2-2)将相应于具有最大尺寸的方向的卷标记录在方向映射和幅度映射中。另外,最好输入图像为二进制图像。另外,最好步骤(b-1)进一步包括留下在把相应的方向旋转90度后的方向中的最大的像素,并移去余下的像素。另外,最好步骤(c-2)进一步包括使用具有四个方向的方向映射,通过连接方向映射中具有同一卷标的像素,得出每一条线段的开始和终止点的列表。另外,最好步骤(c-2)进一步包括通过改变获得的第一直线列表中的各直线间的角度、距离以及直线的长度的阈值,执行直线组合。另外,最好一直重复直线组合,直到剩余的直线数量等于或少于预定值为止。同样,为了实现上述目的,根据本专利技术,提供一种图像搜索方法,包括(a)从查询图像的形状描述符中获取直线列表;(b)通过比较检测的图像的形状描述符的直线列表和查询的图像的形状描述符的直线列表,获取相异性。同样,为了实现上述目的,提供一种相异性估量方法,其中使用基于轮廓形成的形状描述符用于估量索引的图像间的相异性的方法包括(a)从查询图像的形状描述符中获取直线列表;以及(b)比较检测的图像的形状描述符的直线列表和查询的图像的形状描述符的直线列表,并获取相异性。附图说明通过参照附图对优选实施例的详细描述,本专利技术的上述目的和优点将变得更加清楚,其中图1为说明根据本专利技术的优选实施例的抽取形状描述符的主要步骤的流程图;图2a至2d为说明用于检测局部最大值的掩码的示例图;图3a为说明二进制图像的示例图;图3b为说明与黑-白图像成比例的距离映射的图;图3c为说明轮廓图像的图;图3d为说明稀疏后的轮廓图像的图;图3e为说明直线近似结果的图;图4为说明根据本专利技术的优选实施例的基于形状描述符的图像搜索方法的主要步骤的流程图;和图5和6为说明为了评价根据本专利技术的图像搜索方法的性能、对用作MPEG-7标准的实验模型(XM)版本的实验图像的二进制图像尝试实验的结果的图。具体实施例方式下面将参照附图详细描述本专利技术的优选实施例。根据本专利技术,定义了使用轮廓的形状描述符。通过从给定形状中抽取作为人类视觉基础的直线并简化所抽取的直线,获得基于轮廓的形状描述符。特别地,根据所述,可以通过抽取轮廓而不抽取边缘来简化该形状描述符。图1为说明根据本专利技术的优选实施例的的主要步骤的流程图。参照图1,在根据本专利技术的中,首先,输入一图像(步骤102),并且对输入的图像执行距离变换以获取距离映射(步骤104)。获取该距离映射所使用的距离变换采用表示对象内各点作为到背景的最短距离值的函数。接着,从该距离映射中抽取轮廓(步骤106)。距离映射中的局部最大值是轮廓的一点是公知的。获取距离映射所使用的距离变换是基于将对象内各点表示作为到背景的最短距离值的函数的。在一个优选实施例中,通过该距离变换将距离映射中的局部最大值确定为轮廓。为了从距离映射中获得局部最大值,在一个优选实施例中,可以采用在“线性特征值抽取和描述(Linear Feature Extraction and Description)”(R.Nevatia and K.R.Babu,Computer Graphics and Image Processing,Vol.13,pp.257-269,1980)中使用的、在此作为参考引用的边缘检测方法。图2a至2d说明用于检测局部最大值的掩码的示例。参照图2a至2d,将用于检测四个方向的局部最大值的掩码用来检测局部最大值。图2a是相应于0度方向的掩码。图2b是相应于45度方向的掩码。图2c是相应于90度方向的掩码。图2d是相应于135度方向的掩码。然后使用这些掩码执行卷积。结果,将相应于具有最大尺寸的方向的卷标记录在方向映射和幅度映射中。这样,基于从图3a所示的二进制图像通过距离变换获得的距离映射,获得局部最大值,从而抽取轮廓。接下来,稀疏抽取的轮廓(步骤108)。稀疏可以通过比如将方向映射中相应的方向旋转90度后的方向上具有最大尺寸的像素留下,并移去余下的像素来执行。图3d示出稀疏后的轮廓图像的示例。然后,通过连接所稀疏的轮廓内的各个像素抽取直线(步骤110)。即,将所稀疏的轮廓内的各个像素沿着一个方向连接,并通过生成线段的开始和终止点的列表抽取直线。在优选实施例中,使用了图2a至2d所示的四个方向的方向映射,并且将方向映射中具有相同值的像素连接,生本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:崔良林李宗河
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1