一种图片检索方法和装置制造方法及图纸

技术编号:14583284 阅读:175 留言:0更新日期:2017-02-08 13:18
本发明专利技术公开了一种图片检索方法和装置。该图片检索方法包括:利用图片样本对基模型进行训练得到检索模型;将待检索图片输入到所述检索模型中进行计算得到图片特征,根据所述图片特征进行检索,得到结果图片集。本发明专利技术解决了由于检索模型训练过程中需要大量人工标注导致检索功能的实现难度增加的问题。通过提出一种图片模型训练方法,实现了无需进行人工标注就可以训练到图片检索模型,避免了人力资源消耗的效果,进而简化了模型训练过程,从而使检索功能的实现难度降低。

【技术实现步骤摘要】

本专利技术涉及图像处理领域,特别涉及一种图片检索方法和装置
技术介绍
大数据时代,人们可以访问获取的信息资源呈现出爆炸式的增长,互联网上每天都诞生海量的图像信息。为了有效地组织、查询与浏览如此大规模的图像资源,图像检索技术应运而生。卷积神经网络是最近广泛应用于模式识别和计算机视觉等领域的一种算法模型,为增加算法针对真实数据的实际性能测试,进而对应用程序的泛化性提出了更高的要求。特别涉及在泛化性的性能上,神经网络在整个结构设计和计算过程中有大量的时间消耗在样本采集和训练过程上,且在训练过程中需要人工标注,造成人力资源消耗巨大,图片模型的获取过程复杂的结果,增加了实现检索功能的难度。
技术实现思路
有鉴于此,本专利技术实施例提供一种图片检索方法和装置,以解决在图片检索模型的训练过程中需要大量的人工标注,造成人力资源消耗巨大,图片模型的获取过程复杂的结果,检索功能的实现难度增加的问题。第一方面,本专利技术实施例提供了一种图片检索方法,包括:利用图片样本对基模型进行训练得到检索模型;将待检索图片输入到所述检索模型中进行计算得到图片特征,根据所述图片特征进行检索,得到结果图片集。第二方面,本专利技术实施例提供了一种图片检索装置,包括:检索模型获取模块,用于利用图片样本对基模型进行训练得到检索模型;结果图片集获取模块,用于将待检索图片输入到所述检索模型中进行计算得到图片特征,根据所述图片特征进行检索,得到结果图片集。由上述技术方案可知,本专利技术实施例提出一种图片模型训练方法,实现了无需人工标注就可以得到图片检索模型,避免了人力资源的消耗,进而简化了模型训练过程,从而使检索功能的实现难度降低。附图说明图1是本专利技术实施例一中的一种图片检索方法流程示意图。图2是本专利技术实施例二中的一种图片检索方法中训练图片检索模型操作的流程示意图。图3是本专利技术实施例三中的一种图片检索方法中图片检索模型中检索操作的流程示意图。图4是本专利技术实施例四中的一种图片检索装置结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1是本专利技术实施例一提供的一种图片检索方法流程示意图,本实施例可适用使用在基模型的基础上进行训练的检索模型进行检索的情况,该方法可以由图片检索装置来执行,该装置可以由软件和/或硬件的方式来实现。如图1所示,该方法包括:具体包括如下步骤:S110、利用图片样本对基模型进行训练得到检索模型。所述检索模型过程可采用卷积神经网络的方法对图片样本进行训练得到。S120、将待检索图片输入到所述检索模型中进行计算得到图片特征,根据所述图片特征进行检索,得到结果图片集。所述图片特征是检索模型自动提取的一组特征,可以是图片像素,图片大小,图片色彩和图片内容信息中的任意一种。将图片特征输入数据库中,所述方法会将输入的图片特征和数据库中的图片特征进行比对,从而选取相似度较高的图片作为结果图片集,所述结果图片集中包括至少一张结果图片。本实施例的技术方案,通过提出一种图片模型训练方法,由于检索模型训练过程中需要大量人工标注导致检索功能的实现难度增加的问题,实现了无需进行人工标注就可以训练到图片检索模型,避免了人力资源消耗的效果,进而简化了模型训练过程,从而使检索功能的实现难度降低。实施例二图2为本专利技术实施例二提供的一种图片检索方法流程示意图方法中训练图片检索模型操作的流程图,本实施例在实施例一的基础上,进一步描述了图片检索方法中的训练图片检索模型操作。本实施例中的图片检索方法基于深度神经网络中的卷积神经网络展开的。如图2所示,该操作具体包括:S210、训练或下载基模型,所述基模型用于图像识别;本实施例中,基模型的获取方式有两种,分别为利用图片训练基模型和从其渠道获取现有的基模型。具体的,本实施例中选择的基模型获取方式为从互联网中下载。具体的,所述训练可以理解为,对所述基模型的参数进行成千上万次的调整,从而使得归一化损失(softmaxloss)越来越小。当选择利用图片训练基模型的方式训练基模型时,首先,需要先根据训练需求设计一个卷积神经网络,该卷积神经网络由卷积,采样,全连接,Softmax归一化等操作得到。另外,根据不同的应用场景,还会用到批量规范化操作(batchnormalization,BN),全局均值采样(globalaveragepooling,GAP)等操作。优选的,本实施例使用到了卷积,最大值采样(maxpooling),BN,GAP,softmax等操作。然后,选取一组随机数初始化该卷积神经网络中的parameter,所述随机数的选取规则可为:期望为0,方差为1且服从高斯分布的一组数字。最后,把大量图片输入到该卷积神经网络中,优化并调整所述hyper-parameter和parameter,最终获取一个图像识别的模型,即基模型。S220、依据场景,修改所述基模型的部分结构得到图片检索网络结构,所述部分结构包括超参数(hyper-parameter)。所述具体场景由人为设定,并没有明确的设定范围和设定规则,例如具体场景可以设定为对动物的识别,也可以设定为对性别为女的人类进行识别,还可以设定为对扑克牌进行识别。修改基模型中部分结构的超参数,即对所述hyper-parameter进行调优,调优方法包括手动调优、网格搜索、随机搜索和基于贝叶斯的参数调优方法等。所述图片检索网络结构包括网络节点的个数,节点之间连接关系等信息。S230、a、对图片检索网络的非超参数(parameter)进行初始化,所述初始化包括:与基模型部分相同的网络结构直接使用所述基模型的parameter,与所述基模型不同的网络结构,使用随机数进行初始化。该步骤的好处在于,使模型的训练速度更快,同时使最终得到的网络模型抽象能力更强。S240、定义图片检索网络结构的损失函数(tripletlossfunction),利用最小化损失函数对神经网络进行优化,从而得到检索预模型。所述tripletlossfunction是以triplet和tripletloss为基本思想提出的。具体的,triplet是一个三元组,所述三元组可以这样构成:例如,从训练数据集中随机选一个样本,该样本称为Anchor,然后再随机选取一个和Anchor(记为x_a)属于同一类的样本和不同类的样本,这两个样本对应的称为Positive(记为x_p)和Negative(记为x_n),由此构成一个(Anchor,Positive,Negative)三元组。所述tripletloss的目的通过学习,让x_a和x_p特征表达之间的距离尽可能小,而x_a和x_n的特征表达之间的距离尽可能大,并且要让x_a与x_n之间的距离和x_a与x_p之间的距离间的间隔最小,从而将学习过程中的损失尽可能的减小,进而使检索预模型的检索效率增高。具体的,所述定义图片检索网络结构的损失函数(tripletlossfunction),利用最小化损失函数对神经网络进行优化,从而得到检索预模型,包括:c、根据损失(tripletloss)的变化,选取一组网络训练参数本文档来自技高网...

【技术保护点】
一种图片检索方法,其特征在于,包括:利用图片样本对基模型进行训练得到检索模型;将待检索图片输入到所述检索模型中进行计算得到图片特征,根据所述图片特征进行检索,得到结果图片集。

【技术特征摘要】
1.一种图片检索方法,其特征在于,包括:利用图片样本对基模型进行训练得到检索模型;将待检索图片输入到所述检索模型中进行计算得到图片特征,根据所述图片特征进行检索,得到结果图片集。2.根据权利要求1所述的方法,其特征在于,所述利用图片样本对基模型进行训练得到检索模型,包括:训练或下载基模型,所述基模型用于图像识别;依据场景,修改所述基模型的部分结构得到图片检索网络结构,所述部分结构包括超参数;a、对图片检索网络的非超参数进行初始化,所述初始化包括:与基模型部分相同的网络结构直接使用所述基模型的非超参数,与所述基模型不同的网络结构,使用随机数进行初始化;b、定义图片检索网络结构的损失函数,利用最小化损失函数对神经网络进行优化,从而得到检索预模型;根据不同的所述场景并调整检索预模型结构,重复a-b步骤,得到多个检索预模型并保存到模型库中;将验证集带入至少一个所述检索预模型进行验证得到检索精度,将所述检索精度最高的检索预模型设置为检索模型,所述检索模型用于图像检索。3.根据权利要求2所述的方法,其特征在于,所述定义图片检索网络结构的损失函数,利用最小化损失函数对神经网络进行优化,从而得到检索预模型,包括:c、根据损失的变化,选取一组网络训练参数,所述网络训练参数包括学习率参数和动量参数;d、从样本图片集中随机选取一组样本图片保存到图片库中,并将所述样本图片输入所述图片检索网络结构进行训练操作,所述训练操作包括修改参数,进而最小化损失;重复c、d步骤,直到损失不再明显或持续减小时,则获取检索预模型并保存到模型库中。4.根据权利要求3所述的方法,其特征在于,所述样本图片集包括原始图片组、积极图片组和消极图片组;所述积极图片组是对所述原始图片组中原始图片增强操作后得到的积极图片组成;所述增强操作包括旋转变换、透视变换、反射变换和剪切操作。5.根据权利要求4所述的方法,其特征在于,所述损失函数包括其中,dist(x,y)表示x和y间的距离;表示所述原始图片组中第i张图片输入所述检索预模型得到的样本特征;表示所述积极图片组中第i张图片输入所述检索预模型得到的样本特征;表示所述消极图片组中第i张图片输入所述检索预模型得到的样本特征;α表示与间距离和与间距离的最小间隔;f表示所述检索预模型;f(x)表示图像x通过该检索预模型计算得到的特征。6.根据权利要求1所述的方法,其特征在于,所述将待检索图片输入到所述检索模型中进行计算得到图片特征,根据所述图片特征进行检索,得到结果图片集,包括:将数据库中图片输入所述检索模型,得到图片特征,建立图片和图片特征之间的索引,并将所述图片特征和所述索引存储到特征库;对所述待检索图片进行预处理,并输入到所述检索模型中得到待检索特征;计算所述待检索特征和特征库中的特征间的特征距离,当特征距离小于预设阈值时,从所述图片库中选取与所述特征对应的图片添加到结果图片集,并将所述结果图片集返回。7.根据权利要求5所述的方法,其特征在于,所述特征距离包括欧氏距离、余弦距离或汉明距离。8.一种图片检索装置,其特征在于,包括:检索模型获取模块,用于利用图片样本对基模型进行训练得到检索模型;结果...

【专利技术属性】
技术研发人员:高钰舒张凯磊
申请(专利权)人:上海谦问万答吧云计算科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1