一种基于图文语义转移技术的照片检索方法技术

技术编号:29979113 阅读:11 留言:0更新日期:2021-09-08 10:09
本发明专利技术提供一种基于图文语义转移技术的照片检索方法,包括以下步骤:S1:扫描存放有图片的文件夹,对文件夹进行排序并编号;扫描文件夹中的图片,对图片进行排序并编号;S2:对每张图片进行识别分析,并建立该图片的标签;S3:根据标签内容,实现图片聚类操作;S4:对检索内容提取关键字,通过关键字在聚类集合、标签中进行检索,并将得到的检索结果显示。本方法是对图片检索技术的优化方案,通过图文语义转移,自动为图片生成文本描述并归类,在用户检索时就可以使用文本检索技术来对图片完成检索。索。索。

【技术实现步骤摘要】
一种基于图文语义转移技术的照片检索方法


[0001]本专利技术涉及一种图片检索方法,尤其是涉及一种基于图文语义转移技术的照片检索方法。

技术介绍

[0002]随着互联网应用技术的发展,图片成为获取信息的主要来源之一。在互联网海量信息中,图片的数量也呈现爆炸式的增长。如何在繁多的图片中快速、精准的搜索到所需图片是互联网应用领域研究的热点。
[0003]传统的图片搜索方法是基于文本的搜索,参考了在文献检索中常被使用到的关键词检索技术,该方法需要对图片相关的文本信息进行关键词的提取和分析,并建立关键词索引。但这种方法往往会因为图片相关的文本信息与图片内容差异较大导致检索结果相关度较低。为了解决基于文本搜索方法的不足,后来又出现了基于图片内容特征的方法,该方法通过提取图片的内容特征,包括图片本身的颜色、纹理、形状、空间关系等建立特征索引。检索时需提供一张样图,通过提取分析样图的内容特征,与已构造的特征索引进行对比,返回在内容特征上相似的图片。该方法虽然能从图片本身的特征上进行分析对比,但缺乏图片表达的语义信息,只能检索到“形似”的结果,而且对图片的内容特征进行索引构建有较高的计算要求。因此根据文本描述可以检索相关内容图片,是需要解决的问题。

技术实现思路

[0004]本专利技术提供了一种基于图文语义转移技术的照片检索方法,解决了存储图片太多检索困难的问题,其技术方案如下所述:
[0005]一种基于图文语义转移技术的照片检索方法,包括以下步骤:
[0006]S1:扫描存放有图片的文件夹,对文件夹进行排序并编号;扫描文件夹中的图片,对图片进行排序并编号;
[0007]S2:对每张图片进行识别分析,并建立该图片的标签;
[0008]S3:根据标签内容,实现图片聚类操作;
[0009]S4:对检索内容提取关键字,通过关键字在聚类集合、标签中进行检索,并将得到的检索结果显示。
[0010]进一步的,步骤S2中,图片生成标签的过程如下所述:
[0011]S21:图片颜色的标签生成,识别模块分析图片的颜色,生成颜色标签;
[0012]S22:图片人脸识别的标签生成,识别模块分析图片的人脸数量,生成人数标签;
[0013]S23:图片建筑物识别的标签生成,识别模块分析图片的建筑物,生成建筑物标签;
[0014]S24:图片车辆识别的标签生成,识别模块分析图片的车辆,生成车辆标签;
[0015]S25:图片动物识别的标签生成,识别模块分析图片的动物种类以及数量,生成动物标签;
[0016]S26:图片植物识别的标签生成,识别模块分析图片的植物种类以及数量,生成植
物标签;
[0017]S27:图片文字识别的标签生成,识别模块分析图片的文字,生成文字标签;
[0018]S28:图片二维码识别的标签生成,识别模块分析图片的二维码,生成二维码标签。
[0019]进一步的,步骤S3中,聚类操作包括以下步骤:
[0020]S31:图片日期聚类,将拍摄图片时间在同一天的图片进行聚类,集合名称设置为日期;
[0021]S22:图片标签聚类,将标签重合数到达设定值的图片进行聚类,集合名称设置为标签组合;
[0022]S23:图片近似度聚类,将相近似的图片形成一个集合,集合名称设置为重要标签和数字的组合,所述重要标签是指这些图片中标签出现频率最多的标签。
[0023]进一步的,步骤S23中,近似度聚类的操作如下:
[0024]S231,在图片库中选取一张图片P,以这张图片P为输入在图片库中进行检索,寻找相似度距离最小的图片Q1;
[0025]S232,以图片Q1为检索输入并将图片集划分为和Q1的相似度距离小于距离阙值A1的部分SH1,并得到相似度距离最小的图片Q2;
[0026]S233,循环执行步骤S232,每次的检索图片为上一次循环得到的最相似图片QN,被检索的图片集为上一次循环得到的SHN,直到SHN为空为止,所得到的Q1
……
QNN张图片即为近似度选出的N个聚类图片。
[0027]进一步的,步骤S2中,所述标签能够带有备注,所述备注内容是标签信息的详细文字描述。
[0028]进一步的,步骤S4中,检索过程如下所述:
[0029]S41:分析关键字所述标签类型;通过标签在聚类集合中的名称中进行检索,将最接近的集合进行图片提取;
[0030]S42:在检索到没有最接近的集合时,反馈用户检索是否扩大范围,用户同意时,则在数据库模块对标签进行检索;得到检索结果后,将图片提取并显示。
[0031]在检索反馈的图片不符合用户要求时,询问是否发起近似检索,在用户点击同意后,通过检索内容中的关键字,以及关键字的等效替换,通过关键字在标签和备注中进行检索,得到检索结果后,将图片提取并显示。
[0032]提取相关图片后,当用户浏览该图片时,能够点击图片显示该图片所述聚类集合,点击对应的聚类集合,能够将该图片同一聚类集合的图片也同时显示出来。
[0033]进一步的,步骤S2中,所述标签的类型数量不超过10个。
[0034]所述基于图文语义转移技术的照片检索方法对图片检索技术的优化方案,通过图文语义转移,自动为图片生成文本描述并归类,在用户检索时就可以使用文本检索技术来对图片完成检索。
附图说明
[0035]图1是所述基于图文语义转移技术的照片检索方法的流程示意图。
具体实施方式
[0036]如图1所示,所述基于图文语义转移技术的照片检索方法,利用的检索系统,包括图片编号模块、图片标签模块、聚类模块、检索模块、调用模块和数据库模块,所述图片编号模块、图片标签模块、聚类模块的应用数据均放置在数据库模块中,所述检索模块通过对数据库模块进行检索,然后通过调用模块调出相关符合要求的图片,并予以显示。
[0037]所述图片编号模块用于对手机中的图片进行编号,编号时以文件夹为编号分组,对存放有图片的文件夹进行文件夹编号,对文件夹中的图片进行图片编号,图片编号是文件夹编号和图片顺序的组合,比如文件夹的编号为001,该文件夹中的图片按照排序为第58张,则图片编号为00100058,其中图片在文件夹中的排序方式是统一的,可以根据名称、时间等进行排序,确定每个图片具有唯一编号,当文件夹中的图片被删除或者新增时,及时更新该文件夹中的图片编号。所述图片编号模块将文件夹编号和图片编号的内容放置在数据库模块中。
[0038]所述图片标签模块用于对每张图片建立标签,并将标签内容存放在数据库模块中,和数据库模块中记录的图片编号对应。
[0039]所述聚类模块用于对标签内容进行聚类处理,生成多个集合。
[0040]所述检索模块通过关键字提取、关键字检索、关键字近似检索步骤,实现对聚类分组和图片标签的检索。
[0041]所述调用模块根据检索模块的检索结果,将符合要求的图片调取并显示。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图文语义转移技术的照片检索方法,包括以下步骤:S1:扫描存放有图片的文件夹,对文件夹进行排序并编号;扫描文件夹中的图片,对图片进行排序并编号;S2:对每张图片进行识别分析,并建立该图片的标签;S3:根据标签内容,实现图片聚类操作;S4:对检索内容提取关键字,通过关键字在聚类集合、标签中进行检索,并将得到的检索结果显示。2.根据权利要求1所述的基于图文语义转移技术的照片检索方法,其特征在于:步骤S2中,图片生成标签的过程如下所述:S21:图片颜色的标签生成,识别模块分析图片的颜色,生成颜色标签;S22:图片人脸识别的标签生成,识别模块分析图片的人脸数量,生成人数标签;S23:图片建筑物识别的标签生成,识别模块分析图片的建筑物,生成建筑物标签;S24:图片车辆识别的标签生成,识别模块分析图片的车辆,生成车辆标签;S25:图片动物识别的标签生成,识别模块分析图片的动物种类以及数量,生成动物标签;S26:图片植物识别的标签生成,识别模块分析图片的植物种类以及数量,生成植物标签;S27:图片文字识别的标签生成,识别模块分析图片的文字,生成文字标签;S28:图片二维码识别的标签生成,识别模块分析图片的二维码,生成二维码标签。3.根据权利要求1所述的基于图文语义转移技术的照片检索方法,其特征在于:步骤S3中,聚类操作包括以下步骤:S31:图片日期聚类,将拍摄图片时间在同一天的图片进行聚类,集合名称设置为日期;S22:图片标签聚类,将标签重合数到达设定值的图片进行聚类,集合名称设置为标签组合;S23:图片近似度聚类,将相近似的图片形成一个集合,集合名称设置为重要标签和数字的组合,所述重要标签是指这些图片中标签出现频率最多的标签。4.根据权利要求3所述的基于图文语义转移技术的照片检索方法,其特征在于:步骤S23中,近似度聚类的操作如下:S...

【专利技术属性】
技术研发人员:张楠坤
申请(专利权)人:北京海纳数聚科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1