一种图像数据检索方法技术

技术编号：22688935 阅读：17 留言：0更新日期：2019-11-30 03:35

一种图像数据检索方法，属于计算机科学与技术领域。为了解决有些现有模型需要依赖于三元组进行训练导致的训练过程复杂的问题，以及现有的模型网络深度严重受到梯度问题的影响而导致的精度不高的问题。本发明专利技术INPUT层后连接一个卷积子网络和一个哈希子网络；哈希子网络包括分片层、全连接层单元、归一化层单元、激活层单元、合并层和阈值化层；分片层将卷积子网络输出的特征划片，然后分别进入每个全连接层分别处理，然后分别经过归一化层后再经过激活函数处理；经过激活函数后的特征进入合并层合并；进入阈值化层，阈值化层数输出哈希码；针对检索图像，利用训练好的深度哈希模型进行目标图像数据的检索。本发明专利技术适用于图像数据检索。

A method of image data retrieval

An image data retrieval method belongs to the field of computer science and technology. In order to solve the problem that some existing models need to rely on triples for training, the training process is complex, and the existing model network depth is seriously affected by the gradient problem, resulting in the problem of low precision. The input layer of the invention is connected with a convolution sub network and a hash sub network; the hash sub network includes a slice layer, a full connection layer unit, a normalization layer unit, an activation layer unit, a merging layer and a thresholding layer; the slice layer slices the characteristics of the output of the convolution sub network, and then enters each full connection layer for processing respectively, and then passes through the normalization layer and the activation function respectively Data processing; after the activation function, the features enter the merge layer; enter the threshold layer, the threshold layer output hash code; for the retrieval image, use the trained depth hash model to retrieve the target image data. The invention is suitable for image data retrieval.

全部详细技术资料下载

【技术实现步骤摘要】
一种图像数据检索方法
本专利技术涉及一种图像的检索方法，属于计算机科学与

技术介绍
随着计算机技术的发展，尤其是人工智能领域技术的发展。面部识别、图像处理、自然语言处理等各个实际应用领域都开始利用深度神经网络来实现，甚至已经依赖于深度神经网络。针对最近邻搜索问题，需要根据一个给定的查询(query)，然后需要找到空间中离它最近的点，图像检索也通常也作为一种近邻搜索来处理。近些年，图像检索得到了非常广泛的研究，如中山大学的潘炎老师研究组和颜水成老师合作，在美国人工智能协会年会(AAAI2014)上发表的论文提出了一种名为CNNH(ConvolutionalNeuralNetworkHashing)的方法，把基于CNN的深度哈希算法推到了前台。后来颜水成老师使用了一个比CNNH中的网络深得多的NetworkinNetwork的网络结构，简称为NINH(NINHashing)或DNNH(DeepNeuralNetworkHashing)。其网络使用三张图像构成的三元组进行训练。取得了良好的效果，但是训练过程需要花费较多的训练图像处理的时间，而且操作比较繁琐。其他科研人员对于CNN和深度哈希算法来解决图像搜索问题的技术也展开了大量的研究和实验，大家搭建的深度神经网络各不相同，取得的效果也各有优劣。这个过程中出现过比较经典的模型结构，但是各种经典的模型也由于适用范围和自身存在的特定被不断改进和更新，但是有些改进不但不能更优，甚至效果会变差，这都是由于深度神经网络自身具备的特性而导致的，因为深度神经网络的结构会...

【技术保护点】
1.一种图像数据检索方法，其特征在于，包括以下步骤：/n深度哈希模型如下：/nINPUT层后连接一个卷积子网络，卷积子网络后连接一个哈希子网络；所述的哈希子网络包括分片层、全连接层单元、归一化层单元、激活层单元、合并层和阈值化层；/n将卷积子网络输出的特征记为x，分片层将特征x划分为n片，每片特征为x

【技术特征摘要】
1.一种图像数据检索方法，其特征在于，包括以下步骤：
深度哈希模型如下：
INPUT层后连接一个卷积子网络，卷积子网络后连接一个哈希子网络；所述的哈希子网络包括分片层、全连接层单元、归一化层单元、激活层单元、合并层和阈值化层；
将卷积子网络输出的特征记为x，分片层将特征x划分为n片，每片特征为xi，i＝1,2,…n；每一片包含的特征维数是m/n，m为特征x的维数；
哈希子网络的全连接层单元有n个全连接层，每个全连接层分别对应处理一个xi，全连接处理表示为fi＝Wixi+bi，其中Wi为第i个全连接层的权重矩阵，bi为对应的偏置；
归一化层单元有n个归一化层，每个归一化层对应处理一个fi，归一化处理后表示为gi，范围为[-1,1]，
激活层单元有n个激活函数层，每个激活函数层对应处理一个gi，激活函数为其中β为平滑控制参数，e自然常数；gi经过激活函数后记为qi；激活层编码进入Softmax分类器；
所有的qi进入合并层，合并层将qi合并为一个n维向量q＝(q1,q2,…,qn)T；
然后进入阈值化层，阈值化函数为：
阈值化层数输出哈希码；
深度哈希模型的损失函数为
v＝(v(q1),v(q2),…,v(qn))T为阈值化层输出的哈...

【专利技术属性】
技术研发人员：齐峰，张艳明，徐海利，迟言，杨巍巍，
申请(专利权)人：黑龙江中医药大学，
类型：发明
国别省市：黑龙;23

全部详细技术资料下载我是这个专利的主人