The invention discloses a text image retrieval method based on sparse neural networks, constructing two independent sparse neural network model, and then the underlying characteristics of image and text input to the sparse neural network model, the output of two sparse neural network model for semantic understanding of image and text, and the as the semantic space of the image and text, image retrieval in text semantic space, and according to the ranking of search results, search and query text image matching. In the invention, the image and text semantic projection to the common space of the two, make full use of the semantic information of the two, and the BP neural network is introduced to the traditional sparse encoding, sparse constraints force the network to learn useful information, so it can improve the retrieval accuracy.
【技术实现步骤摘要】
一种基于稀疏神经网络的图像检索文本方法
本专利技术涉及一种基于稀疏神经网络的图像检索文本方法。
技术介绍
传统的信息检索是单模态数据之间的检索,然而,随着大数据时代的到来,多模态数据增长迅速,单模态检索已无法满足人们的需要。因而,跨媒体检索(如图像检索文本)应运而生,并且正在成为信息检索的新趋势。图像检索文本最大的挑战就是二者之间的异构鸿沟。最通用的解决方法为子空间学习方法,典型相关分析(CCA)使用相关系数作为测量标准,在保持图像和文本的相关性达最大的前提下,将图像和文本投影到一个同维子空间,从而实现图像和文本在同一空间检索的任务,类似的方法还有,偏最小二乘(PLS)和双线性差值(BLM)等,他们都属于无监督的方法;进一步的加入语义信息的有监督子空间学习方法,三视图典型相关分析(Three-ViewCCA)同时优化图像和文本之间的子空间和二者的投影与语义之间的相关性,使之达到最大,此外还有,联合特征选择和子空间学习方法(JFSSL),广义多视图分析(GMA)等。近年,深度学习技术在多个领域取得突破性进展,也在跨媒体检索中得到了广泛应用,深度典型相关分析(DeepCanonicalCorrelationAnalysis)使用深度神经网络学习一个复杂的非线性投影,使得投影后的图像和文本之间的数据相关性最大;端到端的典型相关分析(End-to-endCCA)使用两路神经网络同时优化图像和文本之间的相关性,最终使得二者之间的相关性最大。然而,上述方法均具有以下缺点:一方面,这些方法假设图像和文本之间可以学习到一个有效的同构子空间,但对于许多真实应用,可能一幅图像 ...
【技术保护点】
一种基于稀疏神经网络的图像检索文本方法,其特征是:构建两个独立的稀疏神经网络模型,然后分别把图像和文本的底层特征输入到稀疏神经网络模型中,将两个稀疏神经网络模型的输出作为图像和文本的语义理解,并将其视为图像和文本的语义空间,在此语义空间中进行图像检索文本操作,并根据检索结果排序,检索出与查询图像最匹配的文本。
【技术特征摘要】
1.一种基于稀疏神经网络的图像检索文本方法,其特征是:构建两个独立的稀疏神经网络模型,然后分别把图像和文本的底层特征输入到稀疏神经网络模型中,将两个稀疏神经网络模型的输出作为图像和文本的语义理解,并将其视为图像和文本的语义空间,在此语义空间中进行图像检索文本操作,并根据检索结果排序,检索出与查询图像最匹配的文本。2.如权利要求1所述的一种基于稀疏神经网络的图像检索文本方法,其特征是:对两个独立的稀疏神经网络模型进行训练。3.如权利要求1所述的一种基于稀疏神经网络的图像检索文本方法,其特征是:与查询图像最匹配的文本为语义空间内距离图像距离最近的检索文本。4.一种基于稀疏神经网络的图像检索文本方法,其特征是:具体包括以下步骤:(1)获取图像和文本的底层特征,构建图像的训练样本、测试样本以及文本的训练样本和测试样本;(2)构建独立的稀疏神经网络模型,利用其训练图像训练样本,构建另一独立稀疏神经网络模型利用其训练文本训练样本;(3)将图像的测试样本输入其对应的训练好的稀疏神经网络模型,得到其网络输出,将文本的测试样本输入其对应的训练好的稀疏神经网络模型,得到其网络输出;(4)利用图像与文本的网络输出,分别表示查询图像和带检索文本,求查询图像与所有待检所文本两两之间的距离,确定最匹配的文本。5.如权利要求4所述的一种基于稀疏神经网络的图像检索文本方法,其特征是:所述步骤(1)中,采用多倍交叉验证,将所有数据随机均匀分成多份,每次选取一组作为测试数据,其余的作为训练数据,实验重复多次,同样的,文本的训练样本和测试样本也采用多倍交叉验证,图像和文本选取的训练样...
【专利技术属性】
技术研发人员:张化祥,张滨,王振华,王强,孟丽丽,任玉伟,吴鸿辰,郭培莲,季辉,邵秀婷,李圣涛,
申请(专利权)人:山东师范大学,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。