本公开是关于一种基于卷积神经网络的图片检索方法、装置和服务器,该方法包括:根据样本图像的尺寸和预设的图像特征尺寸,确定第一池化窗口的尺寸;根据所述第一池化窗口的尺寸对提取到的所述样本图像的初级图像特征进行处理,得到所述样本图像的高级图像特征;根据所述高级图像特征从图片数据库中检索出至少一个目标图像。可见,所述第一池化窗口的尺寸根据样本图像的尺寸自适应变化(即无需对样本图像进行任何缩放形变),因此,本公开实施例中提取到的图像特征的质量高,从而提高了图像检索的准确度和效率。
【技术实现步骤摘要】
本专利技术涉及计算机技术,尤其涉及一种基于卷积神经网络的图片检索方法、装置和服务器。
技术介绍
随着计算机网络技术的发展,越来越多用户通过网络下载或者查看需要的内容,例如图像等。图像检索通常采用两种方式:1)基于文本的传统的图像检索(即通过图像的名称或文字等信息进行检索的);2)基于内容的图像检索(Content Based Image Retrieval,简称CBIR)。其中,基于内容的图像检索是指直接采用图像内容进行图像信息查询的检索,即在图像数据库中检索与用户所提交样本图像在内容上一致或相似的图像集合的过程,通过对图像底层特征的比较来实现检索。相关技术中,基于内容的图像检索通常采用卷积神经网络对用户输入的样本图像进行特征提取,进而根据提取的图像特征进行检索;其中,需要先将样本图像的尺寸进行缩放形变,达到预设尺寸,进而对形变后具有预设尺寸的图像进行特征提取;对于样本图像的长宽比不同的图像,经过缩放形变会影响提取的图像特征的质量,进而会影响图像检索的准确度和效率。
技术实现思路
为克服相关技术中存在的问题,本公开提供一种基于卷积神经网络的图片检索方法、装置和服务器。根据本公开实施例的第一方面,提供一种基于卷积神经网络的图片检索方法,包括:根据样本图像的尺寸和预设的图像特征尺寸,确定第一池化窗口的尺寸;其中,所述第一池化窗口包括所述卷积神经网络的最后一个池化层对应的池化窗口;根据所述第一池化窗口的尺寸对提取到的所述样本图像的初级图像特征进行处理,得到所述样本图像的高级图像特征;根据所述高级图像特征从图片数据库中检索出至少一个目标图像;其中,所述图片数据库中包括:至少一个模板图像以及每个所述模板图像的高级图像特征;所述目标图像与所述样本图像在内容上相同或相似。本公开的实施例提供的技术方案可以包括以下有益效果:通过根据样本图像的尺寸和预设的图像特征尺寸确定第一池化窗口的尺寸,根据所述第一池化窗口的尺寸对提取到的所述样本图像的初级图像特征进行处理,得到所述样本图像的高级图像特征;进一步地,根据所述高级图像特征从图片数据库中检索出至少一个目标图像;可见,本公开实施例中,第一池化窗口的尺寸是根据样本图像的尺寸自适应变化的(即无需对样本图像进行任何缩放形变),进而根据自适应变化的第一池化窗口的尺寸对所述样本图像的初级图像特征进行处理,保证了对不同尺寸的样本图像卷积神经网络中的全连接层的输入都为固定尺寸的图像特征,进而输出固定尺寸的图像特征;因此,本公开实施例中提取到的图像特征的质量高,从而提高了图像检索的准确度和效率。进一步地,所述根据样本图像的尺寸和预设的图像特征尺寸,确定第一池化窗口的尺寸,包括:根据M=W/w确定所述第一池化窗口的宽度M;根据N=H/h确定所述第一池化窗口的高度N;其中,W为所述样本图像的宽度,Η为所述样本图像的高度,w为所述预设的图像特征尺寸的宽度,h为所述预设的图像特征尺寸的高度。进一步地,所述根据所述第一池化窗口的尺寸对提取到的所述样本图像的初级图像特征进行处理,得到所述样本图像的高级图像特征,包括:根据所述第一池化窗口的尺寸对所述样本图像的初级图像特征进行池化变换,得到所述样本图像的中级图像特征;其中,所述中级图像特征的尺寸等于所述预设的图像特征尺寸;对所述中级图像特征中的每个特征进行叠加得到所述高级图像特征。本公开的实施例提供的技术方案可以包括以下有益效果:公开了根据所述第一池化窗口的尺寸对提取到的所述样本图像的初级图像特征进行处理,得到所述样本图像的高级图像特征的具体实现方式,通过根据所述自适应变化的第一池化窗口(即无需对样本图像进行任何缩放形变)的尺寸对所述样本图像的初级图像特征进行池化变换,得到所述样本图像的中级图像特征,进而对所述中级图像特征中的每个特征进行叠加得到所述高级图像特征,保证了对不同尺寸的样本图像卷积神经网络中的全连接层的输入都为固定尺寸的图像特征,进而输出固定尺寸的图像特征;因此,本公开实施例中提取到的图像特征的质量高,从而提高了图像检索的准确度和效率。进一步地,所述根据样本图像的尺寸和预设的图像特征尺寸,确定第一池化窗口的尺寸之前,还包括:通过卷积变换和池化变换提取样本图像的初级图像特征;其中,所述池化变换对应的池化窗口的尺寸为预设的。进一步地,所述根据所述高级图像特征从图片数据库中检索出至少一个目标图像,包括:获取所述模板图像的高级图像特征;根据所述样本图像的高级图像特征以及每个所述模板图像的高级图像特征进行相似性检索,得到所述目标图像。本公开的实施例提供的技术方案可以包括以下有益效果:公开了根据所述高级图像特征从图片数据库中检索出至少一个目标图像的具体实现方式,由于本实施例中的模板图像的高级图像特征和样本图像的高级图像特征都是基于所述自适应变化的第一池化窗口(即无需对样本图像进行任何缩放形变)的尺寸对对应图像的初级图像特征进行处理得到的;因此,本公开实施例中提取到的图像特征的质量高,从而提高了图像检索的准确度和效率。根据本公开实施例的第二方面,提供一种基于卷积神经网络的图片检索装置,包括:确定模块,被配置为根据样本图像的尺寸和预设的图像特征尺寸,确定第一池化窗口的尺寸;其中,所述第一池化窗口包括所述卷积神经网络的最后一个池化层对应的池化窗口;处理模块,被配置为根据所述第一池化窗口的尺寸对提取到的所述样本图像的初级图像特征进行处理,得到所述样本图像的高级图像特征;检索模块,被配置为根据所述高级图像特征从图片数据库中检索出至少一个目标图像;其中,所述图片数据库中包括:至少一个模板图像以及每个所述模板图像的高级图像特征;所述目标图像与所述样本图像在内容上相同或相似。进一步地,所述确定模块包括:第一确定单元,被配置为根据M=W/w确定所述第一池化窗口的宽度M;第二确定单元,被配置为根据N=H/h确定所述第一池化窗口的高度N;其中,W为所述样本图像的宽度,Η为所述样本图像的高度,w为所述预设的图像特征尺寸的宽度,h为所述预设的图像特征尺寸的高度。进一步地,所述处理模块包括:池化单元,被配置为根据所述第一池化窗口的尺寸对所述样本图像的初级图像特征进行池化变换,得到所述样本图像的中级图像特征;其中,所述中级图像特征的尺寸等于所述预设的图像特征尺寸;叠加单元,被配置为对所述中级图像特征中的每个特征进行叠加得到所述高级图像特征。进一步地,所述装置还包括:提取模块,被配置为通过卷积变换和池化变换提取样本图像的初级图像特征;其中,所述池化变换对应的池化窗口的尺寸为预设的。进一步地,所述检索模块包括:获取单元,被配置为获取所述模板图像的高级图像特征;检索单元,被配置为根据所述样本图像的高级图像特征以及每个所述模板图像的高级图像特征进行相似性检索,得到所述目标图像。根据本公开实施例的第三方面,提供一种服务器,包括:处理器以及用于存储处理器可执行指令的存储器;所述处理器被配置为:根据样本图像的尺寸和预设的图像特征尺寸,确定第一池化窗口的尺寸;其中,所述第一池化窗口包括所述卷积神经网络的最后一个池化层对应的池化窗口;根据所述第一池化窗口的尺寸对提取到的所述样本图像的初级图像特征进行处理,得到所述样本图像的高级图像特征;根据所述高级图像特征从图片数据库中检索出至少一本文档来自技高网...
【技术保护点】
一种基于卷积神经网络的图片检索方法,其特征在于,包括:根据样本图像的尺寸和预设的图像特征尺寸,确定第一池化窗口的尺寸;其中,所述第一池化窗口包括所述卷积神经网络的最后一个池化层对应的池化窗口;根据所述第一池化窗口的尺寸对提取到的所述样本图像的初级图像特征进行处理,得到所述样本图像的高级图像特征;根据所述高级图像特征从图片数据库中检索出至少一个目标图像;其中,所述图片数据库中包括:至少一个模板图像以及每个所述模板图像的高级图像特征;所述目标图像与所述样本图像在内容上相同或相似。
【技术特征摘要】
【专利技术属性】
技术研发人员:杨松,秦秋平,王百超,
申请(专利权)人:小米科技有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。