一种基于区间权值的相似性度量方法技术

技术编号:2820376 阅读:633 留言:0更新日期:2012-04-11 18:40
本发明专利技术是一种基于区间权值的相似性度量方法,属于多媒体检索领域。本方法是对任意两幅图像的特征向量进行相似性度量。在进行相似性度量的过程中,首先计算这两个特征向量间对应的每维分量的差值,并对所有的分量差值进行[0,1]归一化;再对[0,1]进行区间划分和为每个区间分配一个权值;然后判断所有归一化的差值所落入的区间,获取它们的权值;最后对所有权值进行累加求均值,并将该均值作为这两幅图像特征向量的相似性度量值。本发明专利技术通过区间划分及同一区间给定相同权值,从而忽略了量化到同一区间的分量间的差异,通过各区间的权值分配反映了每一区间对相似性度量的重要性。在相似度匹配的过程中,能够提高图像检索的效率。

【技术实现步骤摘要】

本专利技术是,属于多媒体检索领域。
技术介绍
相似性度量方法的选择是基于内容的图像检索的一个关键环节。在基于 内容的图像检索系统中,首先由用户提交查询图像给系统,系统对査询图像 进行特征提取,获取查询图像的特征向量,然后采用相似性度量算法对获得 的特征向量和图像特征库中的特征向量进行相似度匹配,最后系统将与查询 图像相似的图片返回给用户。常用的相似性度量方法有街区距离、欧氏距 离等等。在计算机中存储的各种数字图像,由于在扫描或传输过程引入噪声(例 如扫描得到的电子图书)及拍摄过程中光线不同等等而造成相同内容的图像 存在一定的差异,此外,相关图像在局部范围内也存在差异,因此,在匹配 的过程中,用户希望系统能具有很好的鲁棒性,能忽略这些小的差异而将这 些相关的图片检索出来。现有的相似性度量方法并没有对图像特征分量间每 维分量的差值进行区间划分及权值分配,以縮小这种差值对整个匹配过程的 影响。
技术实现思路
本专利技术提出了,该方法通过对每维 特征分量间的差值进行区间划分及权值分配,进而能够提高图像检索的检索 效率。本专利技术的总体思想如下本专利技术是对任意两幅图像的特征向量进行相似性 度量。在进行相似性度量的过程中,首先计算这两个特征向量间对应的每维 分量的差值,并对所有的分量差值进行归一化;再对进行区间 划分和为每个区间分配一个权值;然后判断所有归一化的差值所落入的区间, 获取它们的权值;最后对所有权值进行累加求均值,并将该均值作为这两幅 图像特征向量的相似性度量值。具体创新点对两个特征向量间对应的每维分量的差值进行了归一化、 区间划分及权值分配,本专利技术通过区间划分及同一区间给定相同权值,从而 忽略了量化到同一区间的分量间的差异,通过各区间的权值分配反映了每一 区间对相似性度量的重要性。本专利技术的技术方案为用于该图像检索系统的检索图像可以是bmp格式 (或其他格式)的图像,保存于计算机硬盘或移动存储媒体上,首先由用户 选择查询图像,再由计算机进行相应的运算和处理。其主要过程为计算机 系统接收用户输入的查询图像,再由检索系统对其进行处理。 具体方法步骤为首先,检索系统事先离线对图像库中的所有图像进行预处理和特征提取, 得到库中所有图像的特征向量,形成图像的特征向量库。然后再由用户输入 査询图像,检索系统对査询图像进行预处理和特征提取,获取査询图像的特征向量,并将査询图像的特征向量和图像特征向量库中的特征向量进行相似 度匹配,将与查询图像最相似的图像返回给用户。所述的将査询图像的特征向量和图像特征向量库中的特征向量进行相似 度匹配的具体方法如下现有待匹配的两幅图像的特征向量A及假设已知特征向量力={",}, 特征向量"=U,},其中",为特征向量J的第/维分量,6,为特征向量5的 第/维分量,/的取值为0,1,.......,£-1, Z为特征向量的长度,取整数。采用本专利技术提出的基于区间权值的相似性度量方法计算特征向量人万之间的相似度, 步骤如下1) 对两幅图像的特征向量A "中所对应的每维分量《、6,(/ = 0,1,.......求差值,然后再对差值进行归一化先计算对应的每维分量间的差值《,-6,,然后采用如下公式对每维分量间的差值进行归一化A |/max(|a,. "|&, Ua广6, |) , i' = 0,l,…….,丄—1其中A为对",-6,归一化后的值,其取值范围为。2) 对区间进行不均匀(或均匀)划分,并给每个划分的区间分配 一个权值首先,将不均匀(或均匀)划分为#个区间(通常7V取4 8间的 某个整数),即:, 然后,为每个区间[i^,^)分配一个权值^ a = l,2,......,TV, ^一般取值范围为0 10), ^可根据实际情况分配,可取整数也可以取小数。3)确定归一化后的图像特征分量间的差值/ , e所对应的权值G :如果归一化后的图像特征分量间的差值A e[《w,&),则差值A所对应的 权值为步骤2)中区间[《w,^)所分配的权值^,即^,=^, Z'的取值为 0,1,…….,丄-l; A的取值为l,2,……,W。4)对步骤3)中得到的所有权值进行累加求均值,得到特征向量A "之 间的相似性度量值S^:1丄—1L ,=0本专利技术通过区间划分及同一区间给定相同权值,从而忽略了量化到同一 区间的分量间的差异,通过各区间的权值分配反映了每一区间对相似性度量 的重要性,在相似度匹配的过程中,能够提高图像检索的效率。 附图说明图1图像检索系统整体流程框图图2区间权值示意图 图3 (a)系统检索得到的平均査全率 图3 (b)系统检索得到的平均査准率 具体实施例方式下面结合附图对本专利技术作进一步说明 本实施例的技术方案如图l所示首先,检索系统事先离线对图像库中的所有图像进行预处理和特征提取, 得到库中所有图像的特征向量,形成图像的特征向量库。然后再由用户输入查询图像,检索系统对査询图像进行预处理和特征提取,获取查询图像的特 征向量,并将查询图像的特征向量和图像特征向量库中的特征向量进行相似 度匹配,将与查询图像最相似的图像返回给用户。用于该图像检索系统的检索图像可以是bmp格式(或其他格式)的图像,保存于计算机硬盘或移动存储媒体上,首先由用户选择查询图像,再由计算机进行相应的运算和处理。计算机处理的过程为计算机系统接收用户输入 的査询图像,再由检索系统对其进行处理。本实施例中的计算机为"清华同方微机,Intel (R) Celeron (R) CPU 3. 20GHz, 1. 25G内存,80G硬盘",采用 乂0++6.0编程实现。本实施例中的将查询图像的特征向量和图像特征向量库中的特征向量进行相似度匹配的具体方法如下采用的图像数据库是由扫描仪扫描得到的文档图像数据库,由密度分布特征提取算法提取文档图像的特征向量,得到的特征向量A "的长度是2 X图像的分块块数抓B卩Z=2#。(在本实施例中,#根据实验过程中具体分 块块数不同而改变,本实验系统将给出9个具体的#值。)1)设特征向量^= {";},特征向量万=",};",为特征向量^的第/维 分量,6,为特征向量"的第/维分量,/的取值为0,1,.......,丄-l, Z为特征向量的长度,取整数。对两幅图像的特征向量A ^对应的每维分量",、6,("0,1,.......1)求差值,然后再将差值归一化到内,设归一化后的值为",,具体归一化方法为先计算对应的每维分量间的差值",-6,,然后采用如下公式对每维分量间 的差值进行归一化 <formula>formula see original document page 9</formula>其中々,为对",-6,归一化后的值,其取值范围为。2)对区间进行划分(此处采用不均匀划分),并给每个划分的区 间分配一个权值首先,将划分为4个区间,即:,然后,为每个区间分配一个权值^ (A: = l,2,3,4),具体为 在[O, 0.02)内,给定权值^为5;在内,给定权值『4为0。 3)确定归一化后的图像特征分量间的差值A e所对应的权值Q :A的取值范围被划分为4个区间,当/ ,在内,给定权值e,为o,则特征向量^与特征向量万的距离^为:&本文档来自技高网...

【技术保护点】
一种基于区间权值的相似性度量方法,具体步骤为:首先,检索系统事先离线对图像库中的所有图像进行预处理和特征提取,得到库中所有图像的特征向量,形成图像的特征向量库;然后再由用户输入查询图像,检索系统对查询图像进行预处理和特征提取,获取查询图像的特征向量,并将查询图像的特征向量和图像特征向量库中的特征向量进行相似度匹配,将与查询图像最相似的图像返回给用户;其特征在于:所述的将查询图像的特征向量和图像特征向量库中的特征向量进行相似度匹配的具体方法如下: 假设待匹配的两幅图像的特征向量分别为A、B,特征向量A={a↓[i]},特征向量B={b↓[i]};a↓[i]为特征向量A的第i维分量,b↓[i]为特征向量B的第i维分量,i的取值为0,1,……,L-1,L为特征向量的长度,取整数; 1)对两幅图像的特征向量A、B对应的每维分量a↓[i]、b↓[i](i=0,1,……,L-1)求差值,即a↓[i]-b↓[i],然后再将差值归一化到[0,1]内,设归一化后的值为β↓[i]; 2)对[0,1]区间进行不均匀(或均匀)划分,并给每个划分的区间分配一个权值: 首先,将[0,1]不均匀或均匀划分为N个区间,N的取值为4~8之间的整数,即:[K↓[0]=0,K↓[1])、[K↓[1],K↓[2])、……、[K↓[k-1],K↓[k]),……,[K↓[N-1],K↓[N]=1],然后,为每个区间[K↓[k-1],K↓[k])分配一个权值W↓[k],其中:W↓[k]的取值范围为0~10,k=1,2,……,N; 3)确定归一化后的图像特征分量间的差值β↓[i]所对应的权值Q↓[i]: 如果归一化后的图像特征分量间的差值β↓[i]∈[K↓[k-1],K↓[k]),则差值β↓[i]所对应的权值Q↓[i]为步骤2)中区间[K↓[k-1],K↓[k])所分配的权值,即Q↓[i]=W↓[k];其中:i的取值为0,1,……,L-1;k的取值为1,2,……,N; 4)对步骤3)中得到的所有权值进行累加求均值,得到特征向量A、B之间的相似性度量值S↓[A,B]为: S↓[A,B]=1/L*Q↓[i]。...

【技术特征摘要】

【专利技术属性】
技术研发人员:黄祥林杨丽芳李荫碧吕锐张洁
申请(专利权)人:中国传媒大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1