一种基于深度特征的图像检索方法及装置制造方法及图纸

技术编号:15297483 阅读:51 留言:0更新日期:2017-05-11 19:55
本发明专利技术提供一种基于深度特征的图像检索方法及装置,其中,所述方法包括:获取图像样本集;将所述图像样本集中的每张图像切分为多个具有独立语义的图像块;从各个所述图像块中提取相应的图像特征,并对提取的所述图像特征进行聚类运算,以确定各个所述图像特征对应的视觉单词;根据确定的所述视觉单词,构建所述图像样本集中每张图像对应的特征向量,并通过各个所述特征向量形成图像索引库;获取待检索的目标图像,并提取所述目标图像对应的目标特征向量;将所述目标特征向量与所述图像索引库中的各个特征向量进行匹配,并根据匹配结果反馈所述目标图像的检索结果。本发明专利技术提供的一种基于深度特征的图像检索方法及装置,能够提高图像检索的精度。

Method and apparatus for image retrieval based on depth feature

The present invention provides a method and device for image retrieval which, based on the characteristics of depth, the method comprises: acquiring image data sets; each image segmentation of the image samples into a plurality of independent semantic blocks; from each of the image feature extraction of the corresponding image blocks, and the image the extracted features are clustering, to determine each of the image corresponding to the characteristic of visual words; according to the visual words to determine the construction of the image feature vector of each image corresponding to the sample set, and through each of the eigenvectors form an image index database; to obtain the target image retrieval, and extract the target feature vector corresponding to the target image; matching each feature vector of the target feature vector and the image index library, and according to the matching result Retrieval results for the target image. The invention provides a method and a device for image retrieval based on depth features, which can improve the precision of image retrieval.

【技术实现步骤摘要】

本专利技术涉及图像检索
,特别涉及一种基于深度特征的图像检索方法及装置
技术介绍
随着信息技术的飞速发展,互联网上的图像数据增长速度十分惊人。而快速精确地查找到一幅用户所需的图像,成为用户的一种急迫需求。基于内容的图像检索(Content-basedImageRetrieval,CBIR)就是希望利用机器学习和图像处理技术,解决图像检索中的难题。虽然基于内容的图像检索技术经过多年的研究,但由于“语义鸿沟”的存在,目前基于内容的图像检索系统依然很难满足人们日常检索的需求。一个高精度的基于内容的图像检索系统,主要依赖于两项关键技术来实现:第一,如何将图像表示成一种有效的检索特征,实现高精度检索;第二,如何在图像检索过程中度量查询图像与被检索图像的相似度,实现高效查询。为了解决以上两个核心问题,在过去的几十年中,研究者进行了大量的研究,有多种图像特征被用于图像检索系统。早期的图像检索系统,常常利用颜色、纹理、形状等全局特征实现图像相似度查询。虽然全局特征可以代表图像的整体描述,但是由于全局特征包含大量背景信息,使得图像中特定目标的查询精度不高。相对于利用全局特征描述图像内容,利用局部特征的图像检索方法可以显著提高检索精度,同时局部特征还可以克服图像中物体由于光照、旋转、尺度变换带来的影响。除此之外,局部特征(如SURF等特征)也进一步和BoW(BagofVisualWords),VLAD(VectorofLocallyAggregatedDescriptors),FV(FisherVector)等特征编码方法相结合来构建图像的特征描述符,进一步提高了图像检索系统的效率。但总体而言,不论是基于全局特征还是局部特征的图像检索系统,都没有脱离利用人工设计图像特征描述的模式,使得特征的表达能力受到限制,从而约束了图像检索系统的精度。
技术实现思路
本专利技术的目的在于提供一种基于深度特征的图像检索方法及装置,能够提高图像检索的精度。为实现上述目的,本专利技术提供一种基于深度特征的图像检索方法,所述方法包括:获取图像样本集,所述图像样本集中包括预设数量的图像;将所述图像样本集中的每张图像切分为多个具有独立语义的图像块;从各个所述图像块中提取相应的图像特征,并对提取的所述图像特征进行聚类运算,以确定各个所述图像特征对应的视觉单词;根据确定的所述视觉单词,构建所述图像样本集中每张图像对应的特征向量,并通过各个所述特征向量形成图像索引库;获取待检索的目标图像,并提取所述目标图像对应的目标特征向量;将所述目标特征向量与所述图像索引库中的各个特征向量进行匹配,并根据匹配结果反馈所述目标图像的检索结果。进一步地,将所述图像样本集中的每张图像切分为多个具有独立语义的图像块具体包括:按照预设算法生成多个图像推荐窗,并利用所述多个图像推荐窗对每张图像进行切分,以得到多个具有独立语义的图像块;其中,相邻的图像块之间存在重叠部分。进一步地,在将所述图像样本集中的每张图像切分为多个具有独立语义的图像块之后,所述方法还包括:将各个所述图像块的像素缩放至预设像素值。进一步地,从各个所述图像块中提取相应的图像特征具体包括:基于卷积神经网络模型对各个所述图像块进行特征提取,并将所述卷积神经网络模型中第一个全连接层输出的深度特征作为各个所述图像块对应的图像特征。进一步地,对提取的所述图像特征进行聚类运算,以确定各个所述图像特征对应的视觉单词具体包括:预先设置与所述图像特征的数量相适配的视觉单词;计算所述图像特征到每个所述视觉单词的词向量之间的距离;将所述图像特征划分至距离最近的视觉单词中,并将所述距离最近的视觉单词作为所述图像特征对应的视觉单词。进一步地,提取所述目标图像对应的目标特征向量具体包括:将所述目标图像切分为多个具有独立语义的图像块;从目标图像对应的各个图像块中提取相应的图像特征,并确定各个所述图像特征对应的视觉单词;根据确定的所述视觉单词,构建所述目标图像对应的目标特征向量。进一步地,将所述目标特征向量与所述图像索引库中的各个特征向量进行匹配,并根据匹配结果反馈所述目标图像的检索结果具体包括:计算所述目标特征向量与所述图像索引库中的各个特征向量之间的距离;按照计算的距离从近到远的顺序,对所述图像索引库中的特征向量进行排序,并将排序后的特征向量对应的图像作为检索结果进行反馈。为实现上述目的,本专利技术还提供一种基于深度特征的图像检索装置,所述装置包括:图像样本集获取单元,用于获取图像样本集,所述图像样本集中包括预设数量的图像;图像块切分单元,用于将所述图像样本集中的每张图像切分为多个具有独立语义的图像块;视觉单词确定单元,用于从各个所述图像块中提取相应的图像特征,并对提取的所述图像特征进行聚类运算,以确定各个所述图像特征对应的视觉单词;图像索引库构建单元,用于根据确定的所述视觉单词,构建所述图像样本集中每张图像对应的特征向量,并通过各个所述特征向量形成图像索引库;目标特征向量提取单元,用于获取待检索的目标图像,并提取所述目标图像对应的目标特征向量;检索结果反馈单元,用于将所述目标特征向量与所述图像索引库中的各个特征向量进行匹配,并根据匹配结果反馈所述目标图像的检索结果。进一步地,所述图像块切分单元具体包括:推荐窗生成模块,用于按照预设算法生成多个图像推荐窗;切分模块,用于利用所述多个图像推荐窗对每张图像进行切分,以得到多个具有独立语义的图像块;其中,相邻的图像块之间存在重叠部分。进一步地,所述视觉单词确定单元具体包括:视觉单词设定模块,用于预先设置与所述图像特征的数量相适配的视觉单词;距离计算模块,用于计算所述图像特征到每个所述视觉单词的词向量之间的距离;视觉单词划分模块,用于将所述图像特征划分至距离最近的视觉单词中,并将所述距离最近的视觉单词作为所述图像特征对应的视觉单词。由上可见,本专利技术将图像切分为具有独立语义的图像块,并可以针对各个图像块,确定相应的视觉单词。然后可以通过确定的视觉单词进行编码,从而确定各个图像对应的特征向量。这些特征向量可以构成图像索引库,当输入待检索的目标图像时,可以将目标图像的目标特征向量与图像索引库中的特征向量进行匹配,从而能够反馈与目标图像相关的检索结果。本专利技术利用深度特征和聚类算法,能够制定出精确的图像索引库,从而提高了图像检索的精度。附图说明图1为本专利技术实施方式提供的基于深度特征的图像检索方法流程图;图2为本专利技术实施方式提供的基于深度特征的图像检索装置的功能模块图。具体实施方式为了使本
的人员更好地理解本申请中的技术方案,下面将结合本申请实施方式中的附图,对本申请实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本申请一部分实施方式,而不是全部的实施方式。基于本申请中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施方式,都应当属于本申请保护的范围。请参阅图1,本专利技术实施方式提供一种基于深度特征的图像检索方法,所述方法包括以下步骤。步骤S1:获取图像样本集,所述图像样本集中包括预设数量的图像。在本实施方式中,可以利用网络爬虫在互联网上自动抓取图像,以构建图像样本集。由于Internet网络是一个网状结构的信息空间,可以用一个有向图G=(N,E)来表示本文档来自技高网
...
一种基于深度特征的图像检索方法及装置

【技术保护点】
一种基于深度特征的图像检索方法,其特征在于,所述方法包括:获取图像样本集,所述图像样本集中包括预设数量的图像;将所述图像样本集中的每张图像切分为多个具有独立语义的图像块;从各个所述图像块中提取相应的图像特征,并对提取的所述图像特征进行聚类运算,以确定各个所述图像特征对应的视觉单词;根据确定的所述视觉单词,构建所述图像样本集中每张图像对应的特征向量,并通过各个所述特征向量形成图像索引库;获取待检索的目标图像,并提取所述目标图像对应的目标特征向量;将所述目标特征向量与所述图像索引库中的各个特征向量进行匹配,并根据匹配结果反馈所述目标图像的检索结果。

【技术特征摘要】
1.一种基于深度特征的图像检索方法,其特征在于,所述方法包括:获取图像样本集,所述图像样本集中包括预设数量的图像;将所述图像样本集中的每张图像切分为多个具有独立语义的图像块;从各个所述图像块中提取相应的图像特征,并对提取的所述图像特征进行聚类运算,以确定各个所述图像特征对应的视觉单词;根据确定的所述视觉单词,构建所述图像样本集中每张图像对应的特征向量,并通过各个所述特征向量形成图像索引库;获取待检索的目标图像,并提取所述目标图像对应的目标特征向量;将所述目标特征向量与所述图像索引库中的各个特征向量进行匹配,并根据匹配结果反馈所述目标图像的检索结果。2.根据权利要求1所述的方法,其特征在于,将所述图像样本集中的每张图像切分为多个具有独立语义的图像块具体包括:按照预设算法生成多个图像推荐窗,并利用所述多个图像推荐窗对每张图像进行切分,以得到多个具有独立语义的图像块;其中,相邻的图像块之间存在重叠部分。3.根据权利要求1所述的方法,其特征在于,在将所述图像样本集中的每张图像切分为多个具有独立语义的图像块之后,所述方法还包括:将各个所述图像块的像素缩放至预设像素值。4.根据权利要求1所述的方法,其特征在于,从各个所述图像块中提取相应的图像特征具体包括:基于卷积神经网络模型对各个所述图像块进行特征提取,并将所述卷积神经网络模型中第一个全连接层输出的深度特征作为各个所述图像块对应的图像特征。5.根据权利要求1所述的方法,其特征在于,对提取的所述图像特征进行聚类运算,以确定各个所述图像特征对应的视觉单词具体包括:预先设置与所述图像特征的数量相适配的视觉单词;计算所述图像特征到每个所述视觉单词的词向量之间的距离;将所述图像特征划分至距离最近的视觉单词中,并将所述距离最近的视觉单词作为所述图像特征对应的视觉单词。6.根据权利要求1所述的方法,其特征在于,提取所述目标图像对应的目标特征向量具体包括:将所述目标图像切分为多个具有独立语义的图像块;从目标图像对应的各个图像块中提取相应的图像特征,并确...

【专利技术属性】
技术研发人员:李阳苗壮王家宝徐玉龙李航何明余裴义张显才
申请(专利权)人:中国人民解放军理工大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1