本发明专利技术涉及一种基于先验知识的图像检索方法,属于基于内容的图像检索领域。本发明专利技术的图像检索方法使用加入维度权值的欧式距离的度量方法,把图像中的背景部分剔除,只保留用户关注的前景内容;并降低背景部分的维度权值,提高前景维度权值,减少了背景的影响,增加了图像中的前景对最后检索结果的影响。其检索过程为:首先提取目标图像的局部特征,然后选取当前比较的图像类别下相应的维度权值,利用加权欧式距离函数进行相似性度量,最后根据相似度的大小返回相应的图片。本发明专利技术提出的基于先验知识的图像检索方法与已有基于内容的图像检索方法相比较,检索更准确、效率更高。
【技术实现步骤摘要】
本专利技术涉及一种图像检索方法,特别涉及一种,属于基于内容的图像检索领域。
技术介绍
随着计算机和互联网的普及,多媒体技术的迅速发展,网络上涌现出大量的图像、音频和视频资源。这些在给人们提供便利和丰富人们精神生活的同时,也给人们提出了新的研究课题如何从浩繁的多媒体资源中快速准确地查找出用户请求的资源。目前,常用的图像检索技术是基于内容的图像检索。在基于内容的图像检索领域中,图像特征度量作为衡量图像相似度的关键步骤,对最终图像检索结果的好坏起着至关重要的作用。因此,寻找一个好的距离度量方法对于研究基于内容的图像检索来说意义重大。由于图像背景千差万别,特别是柔性物体的结构容易发生形变,这些都会影响到从图像中提出的特征向量,在此基础上进行距离度量就会降低图像的检索精度。基于内容的图像检索方法,首先是分析图像库中图像的特征,提取能反映该图像内容的特征向量,存入相应的特征库中。在进行图像检索时,对每一幅给定的测试图像,分析图像特征并提取能反映该图像内容的特征向量;然后将提取到的特征向量与特征库中的特征向量进行匹配,根据匹配结果到图像库中搜索,就可以得到与之最相似的图像。其中特征向量匹配的过程常利用特征向量之间的距离来进行相似性度量,而常用的距离有欧式距离、加权欧式距离、明氏距离等等。这些距离函数的优点在于所有的参数和数据都是提前设定或从图像中直接提取得到,因此使用方便、计算简单。但是它们的缺点也同样明显由于未考虑先验知识,检索结果往往会不尽如人意。目前的基于内容的图像特征检索与相似度量算法都很难在效率和效果中取得一个平衡,而这个问题又是基于内容的图像检索领域中的一个重要的关键问题。由于这个问题的存在,阻碍了基于内容的图像检索的广泛应用。
技术实现思路
本专利技术的目的是为了克服已有图像特征度量方法存在的不足,提出。本专利技术的目的是通过下述技术方案实现的。一种,其操作步骤如下包括训练过程和测试过程。所述训练过程包括步骤一至步骤三,具体为步骤一、建立视觉词汇表。依次对训练数据集中的每类图像进行分析处理,为每类图像建立一个视觉词汇表。使用一个类别的图像建立该类别图像的视觉词汇表的具体步骤为步骤1.1 :获取训练数据集中该类别图像中各张图像的特征向量,用符号(fi, f2, · · · , fn)表示,其中,......、4分别表示图像的一个特征,η表示特征向量中特征的个数;所述特征是多维的,其维度用N表示,N > 2。所述获取训练数据集中的每张图像的特征向量的方法包括surf (Speed-upRobust Features)算法和 sift (Scale Invariant Feature Transform)算法。步骤1. 2 :对于步骤1.1得到的该类别图像的特征向量(f\,f2,. . .,fn)中的特征f1; f2, - - - , fn进行聚类,得到m个特征类别,m为正整数;步骤1. 3 :对于步骤1. 2得到的m个特征类别,获取每个特征类别的单词。所述每个特征类别的单词为该特征类别中全部特征向量聚类的中心点。步骤1. 4 :得到该类别图像的视觉词汇表。所述该类别图像的视觉词汇表由该类别类图像的各特征类别的单词组成。步骤二、在步骤一操作的基础上,统计每类图像的单词分布直方图。针对一类图像,统计该类别图像的单词分布直方图的具体操作步骤为步骤2.1 :为该类别图像的视觉词汇表中的每个单词设定一个统计量,分别用符号TpTy……、Tm表示,并设置1\、T2、……、Tm的初始值均为O。步骤2. 2 :依次使用该类别中的每一张图像的特征向量(f\,f2,. . .,fn)中的每一个特征与该类别图像的视觉词汇表中的单词逐一比较,找出距离最短的单词,并将该单词对应的统计量自增I。步骤2. 3:对统计量1\、T2、……、Tm进行归一化处理。具体为分别用统计量!\、T2,……、Tm除以该类别图像的特征数总和,得到的结果分别用T'2、……、τ/。步骤2. 4 :得到该类别图像的单词分布直方图。所述单词分布直方图由该类别图像的视觉词汇表中的每个单词对应的归一化后的统计量T'1、T' 2、……、τ/组成。步骤三、在步骤二操作的基础上,计算每个类别图像特征对应的特征权值。对于一个类别的图像,该类别图像特征对应的特征权值的计算方法为步骤3.1:找出该类别图像的单词分布直方图中T' ρ T' 2、……、Tm'中的最大值,用符号Tmax'表不。步骤3. 2 :在该类图像的特征向量(f\,f2,. . .,fn)中找到M个与步骤3.1得到的Tfflax/距离最接近的特征,生成MXN的矩阵,矩阵用符号AMXN,M值由人为指定,10彡M彡200并且M < η。步骤3. 3:计算矩阵Amxn中每列数据的方差的倒数,分别用符号0ι、σ2、……、 步骤3. 4 :对步骤3. 3中所述矩阵Amxn中每列数据的方差的倒数σ ρ σ 2、……、0,进行归一化处理,得到该类别图像特征对应的特征权值,分别用COi表示,I < i SN。其本文档来自技高网...
【技术保护点】
一种基于先验知识的图像检索方法,其特征在于:其操作步骤如下:包括训练过程和测试过程;所述训练过程包括步骤一至步骤三,具体为:步骤一、建立视觉词汇表;依次对训练数据集中的每类图像进行分析处理,为每类图像建立一个视觉词汇表;使用一个类别的图像建立该类别图像的视觉词汇表的具体步骤为:步骤1.1:获取训练数据集中该类别图像中各张图像的特征向量,用符号(f1,f2,...,fn)表示,其中,f1、f2、……、fn分别表示图像的一个特征,n表示特征向量中特征的个数;所述特征是多维的,其维度用N表示,N≥2;步骤1.2:对于步骤1.1得到的该类别图像的特征向量(f1,f2,...,fn)中的特征f1,f2,...,fn进行聚类,得到m个特征类别,m为正整数;步骤1.3:对于步骤1.2得到的m个特征类别,获取每个特征类别的单词;所述每个特征类别的单词为该特征类别中全部特征向量聚类的中心点;步骤1.4:得到该类别图像的视觉词汇表;所述该类别图像的视觉词汇表由该类别类图像的各特征类别的单词组成;步骤二、在步骤一操作的基础上,统计每类图像的单词分布直方图;针对一类图像,统计该类别图像的单词分布直方图的具体操作步骤为:步骤2.1:为该类别图像的视觉词汇表中的每个单词设定一个统计量,分别用符号T1、T2、……、Tm表示,并设置T1、T2、……、Tm的初始值均为0;步骤2.2:依次使用该类别中的每一张图像的特征向量(f1,f2,...,fn)中的每一个特征与该类别图像的视觉词汇表中的单词逐一比较,找出距离最短的单词,并将该单词对应的统计量自增1;步骤2.3:对统计量T1、T2、……、Tm进行归一化处理;具体为:分别用统计量T1、T2、……、Tm除以该类别图像的特征数总和,得到的结果分别用T′1、T′2、……、Tm′;步骤2.4:得到该类别图像的单词分布直方图;所述单词分布直方图由该类别图像的视觉词汇表中的每个单词对应的归一化后的统计量T′1、T′2、……、Tm′组成;步骤三、在步骤二操作的基础上,计算每个类别图像特征对应的特征权值;对于一个类别的图像,该类别图像特征对应的特征权值的计算方法为:步骤3.1:找出该类别图像的单词分布直方图中T′1、T′2、……、Tm′中的最大值,用符号Tmax′表示;步骤3.2:在该类图像的特征向量(f1,f2,...,fn)中找到M个与步骤3.1得到的Tmax′距离最接近的特征,生成M×N的矩阵,矩阵用符号AM×N,M值由人为指定,10≤M≤200并且M≤n;步骤3.3:计算矩阵AM×N中每列数据的方差的倒数,分别用符号σ1、σ2、……、σN;步骤3.4:对步骤3.3中所述矩阵AM×N中每列数据的方差的倒数σ1、σ2、……、σN进行归一化处理,得到该类别图像特征对应的特征权值,分别用ωi表示,1≤i≤N;其中,ωi=σi/Σj=1Nσj;经过上述步骤的操作,对于每一类图像得到该类别图像特征对应的特征权值ωi;所述测试过程包括步骤四,具体为:步骤四、在步骤三操作的基础上,对测试图像进行检索;步骤4.1:获取测试图像的特征向量;步骤4.2:将测试图像的每个特征依次与训练数据集中的每张图像的每个特征进行距离度量;其中,测试图像的某一特征F表示与训练数据集中某一张图像I的某个特征G的距离d可通过公式(1)计算;d=Σi=1Nωi(fi-gi)---(1)其中,fi为测试图像的特征F的第i维数据;gi为训练数据集中图像I的特征G的第i维数据;ωi为训练数据集中的图像I的特征G对应的特征权值;步骤4.3:用符号Pk表示训练数据集中的每张图像对应的匹配点对数,其初始值设定为0;其中,1≤k≤K,K表示训练数据集中图像的数量;针对训练数据集中的每张图像,依次将测试图像的某一特征分别与该张训练图像的每一个特征之间的距离作为一组数据,并从该组数据中挑选出最小值和次小值,分别用符号dmin和d′min表示;如果dmin/d′min<θ,0.5<θ<0.9,则将匹配点对数Pk自增1;步骤4.3:针对训练数据集中的每张图像,按照其对应的匹配点对数Pk从大到小的顺序对训练图像排序并输出;匹配点对数Pk越大,该匹配点对数Pk对应的训练图像与测试图像越相似;经过上述步骤的操作,即可实现对测试图像的检索。...
【技术特征摘要】
1.一种基于先验知识的图像检索方法,其特征在于其操作步骤如下包括训练过程和测试过程;所述训练过程包括步骤一至步骤三,具体为步骤一、建立视觉词汇表;依次对训练数据集中的每类图像进行分析处理,为每类图像建立一个视觉词汇表;使用一个类别的图像建立该类别图像的视觉词汇表的具体步骤为步骤1.1:获取训练数据集中该类别图像中各张图像的特征向量,用符号(fi, f2) · · · , fn)表示,其中,......、fn分别表示图像的一个特征,η表示特征向量中特征的个数;所述特征是多维的,其维度用N表示,Ν^2;步骤1. 2:对于步骤1.1得到的该类别图像的特征向量(f\,f2,. . .,fn)中的特征f1; f2, - - - , fn进行聚类,得到m个特征类别,m为正整数;步骤1. 3 :对于步骤1. 2得到的m个特征类别,获取每个特征类别的单词;所述每个特征类别的单词为该特征类别中全部特征向量聚类的中心点;步骤1. 4 :得到该类别图像的视觉词汇表;所述该类别图像的视觉词汇表由该类别类图像的各特征类别的单词组成;步骤二、在步骤一操作的基础上,统计每类图像的单词分布直方图;针对一类图像,统计该类别图像的单词分布直方图的具体操作步骤为步骤2.1 :为该类别图像的视觉词汇表中的每个单词设定一个统计量,分别用符号!\、T2 >……、Tm表示,并设置1\、T2、……、Tm的初始值均为O;步骤2. 2 :依次使用该类别中的每一张图像的特征向量(f\,f2,. . .,fn)中的每一...
【专利技术属性】
技术研发人员:陈宇峰,李凤霞,闫高洁,杨志中,俞文昌,
申请(专利权)人:北京理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。