图片检索方法、电子设备及计算机可读存储介质技术

技术编号:31706883 阅读:32 留言:0更新日期:2022-01-01 11:09
本发明专利技术提供一种基于图片语义信息的图片检索方法、电子设备及计算机可读存储介质,本发明专利技术的模糊搜索引擎基于预先导入的语义信息文本集D

【技术实现步骤摘要】
图片检索方法、电子设备及计算机可读存储介质


[0001]本专利技术属于图片检索
,尤其涉及一种基于图片语义信息的图片检索方法、电子设备及计算机可读存储介质。

技术介绍

[0002]在日常检索中,以文字检索图片仅局限于以图片的命名或者特征描述来进行限定检索,如果图片存在命名错误或者特征描述错误,就会存在输入文字无法精准搜索到相应图片的问题。比如说一张衣服的图片文件名为手机,通过输入文字“手机”来进行搜索,检索结果就会出现这张衣服的图片,即通过传统方式,输入关键字文字“手机”后,检索出的图片结果并不准确。而现实生活中存在大量图片和文件名不相符的现象,文件名和图片本身不具有相关性。再比如说,有些手机拍照图片是以时间戳和序号方式来命名的,而没有以图片特征或者图片所属类型来命名,则这种图片就不具备以图片名反映文件名的条件和形式,无法通过输入文字描述来定位检索到特定的图片。
[0003]综上所述,以文件名来检索图片这种传统的方式已经无法满足如今大数据时代的搜索需要了。

技术实现思路

[0004]基于此,针对上述技术问题,提供一种基于图片语义信息的图片检索方法、电子设备及计算机可读存储介质。
[0005]本专利技术采用的技术方案如下:
[0006]一方面,提供一种基于图片语义信息的图片检索方法,其特征在于,包括:
[0007]S101、将待检索文本输入模糊搜索引擎,输出与所述待检索文本相似的语义信息文本集D
sim
,所述模糊搜索引擎通过预先导入的语义信息文本集D
full
构建索引本,所述语义信息文本集D
full
中的语义信息文本与图库中的图片一一对应;
[0008]S102、根据相似度得分由大至小,从所述语义信息文本集D
sim
中取出K个语义信息文本,形成语义信息文本集D
top

sim
,所述K为预设值;
[0009]S103、根据所述语义信息文本集D
top

sim
,从所述图库中匹配到相应的图片;
[0010]S104、输出匹配到的图片。
[0011]另一方面,提供一种电子设备,其特征在于,包括存储模块,所述存储模块包括由处理器加载并执行的指令,所述指令在被执行时使所述处理器执行上述的一种基于图片语义信息的图片检索方法。
[0012]再一方面,提供一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,其特征在于,所述一个或多个程序当被处理器执行时,实现上述的一种基于图片语义信息的图片检索方法。
[0013]本专利技术的模糊搜索引擎基于预先导入的语义信息文本集D
full
构建索引本,该语义信息文本集D
full
中的语义信息文本与图库中的图片一一对应,通过该引擎输出与待检索文
本相似的语义信息文本集D
sim
,之后根据相似度缩小语义信息文本量得到语义信息文本集D
top

sim
,进而检索到相应的图片并进行输出,实现了通过文本深度检索图片语义,提高了检索准确性,可以满足如今大数据时代的搜索需要了。
附图说明
[0014]下面结合附图和具体实施方式对本专利技术进行详细说明:
[0015]图1为本专利技术的流程图。
具体实施方式
[0016]如图1所示,本说明书实施例提供一种基于图片语义信息的图片检索方法,包括:
[0017]S101、将待检索文本输入模糊搜索引擎,输出与待检索文本相似的语义信息文本集D
sim
,模糊搜索引擎预先导入有语义信息文本集D
full
,语义信息文本集D
full
中的语义信息文本与图库中的图片一一对应。
[0018]使用模糊搜索有以下好处:
[0019](1)待检索文本不清晰时,如果使用完全匹配搜索,则搜索结果不理想,当检索文本过长时,但仅包含个别重要关键字时,通过模糊搜索可以搜索长文本具备核心关键词的对应结果。
[0020](2)模糊搜索较灵活,没有匹配搜索那么死板。
[0021](3)模糊搜索甚至支持待检索文本中包含部分错字。
[0022]语义信息文本集D
full
的构建过程如下:
[0023]a、遍历图库中的每张图片,通过AI模型提取每张图片的语义信息文本。
[0024]其中,AI模型包括车牌识别模型、人脸识别模型以及物体识别模型,车牌识别模型用于输入车牌图片、输出车牌文字,人脸识别模型用于输入人脸图片、输出对应的人名,物体识别模型用于输入物体图片、输出对应的名称,能够识别出通用80余种常见物体,比如手机、电脑、桌子、路灯、桥梁、轮胎、各种武器、各种动物等。
[0025]上述AI模型为现有模型,作为本专利技术的功能接口使用,此处不作重点描述。
[0026]相应地,步骤a进一步包括:
[0027]若AI模型从一张图片中提取出一个结果,则该结果为一个语义信息文本。
[0028]若AI模型从一张图片中提取出多个结果,则将多个结果进行拼接,形成一个语义信息文本,比如一张图片的提取结果包含汽车、车牌号、路灯、行人,那么对应的语义信息文本为“汽车、沪Axxx、路灯、行人”。
[0029]b、形成每张图片与语义信息文本的对应关系e
i
=(图ID,语义d
i
),i=1,2,

,n;
[0030]c、形成语义图库E=(e1,e2……
e
n
);
[0031]d、从所述语义图库中取所有语义d
i
形成所述语义信息文本集D
full

[0032]为了便于步骤S102的执行,可以将语义信息文本集D
sim
中的语义信息文本按照相似度得分由大至小排列,与待检索文本越相似得分越高。
[0033]相似度可使用编辑距离进行打分,编辑距离,也叫莱文斯坦距离(levenshtein),是针对二个字符串的差异程度的量化量测,量测方式是看至少需要多少次的处理(增删改查)才能将一个字符串变成另一个字符串。
[0034]例如,有两个字符串分别为:a=love和b=lolpe。
[0035]那么计算a和b的编辑距离,就是要算出从a变化到b需要经过多少个步骤:
[0036]1.love

>lolve(插入I)
[0037]2.lolve

>lolpe(用v替换成p)
[0038]那么我们就说他们的编辑距离为2。
[0039]编辑距离越短,则代表两个字符串越相似,由此得到的相似度得分越高。
[0040]在一种实施方式中,模糊搜索引擎采用倒排索引方式,如采用Elas本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图片语义信息的图片检索方法,其特征在于,包括:S101、将待检索文本输入模糊搜索引擎,输出与所述待检索文本相似的语义信息文本集D
sim
,所述模糊搜索引擎预先导入有语义信息文本集D
full
,所述语义信息文本集D
full
中的语义信息文本与图库中的图片一一对应;S102、根据相似度得分由大至小,从所述语义信息文本集D
sim
中取出K个语义信息文本,形成语义信息文本集D
top

sim
,所述K为预设值;S103、根据所述语义信息文本集D
top

sim
,从所述图库中匹配到相应的图片;S104、输出匹配到的图片。2.根据权利要求1所述的一种基于图片语义信息的图片检索方法,其特征在于,通过以下步骤构建所述语义信息文本集D
full
:a、遍历所述图库中的每张图片,通过AI模型提取每张图片的语义信息文本;b、形成每张图片与语义信息文本的对应关系e
i
=(图ID,语义d
i
),i=1,2,

,n;c、形成语义图库E=(e1,e2……
e
n
);d、从所述语义图库中取所有语义d
i
形成所述语义信息文本集D
full
。3.根据权利要求2所述的一种基于图片语义信息的图片检索方法,其特征在于,所述AI模型包括车牌识别模型、人脸识别模型以及物体识别模型,所述车牌识别模型用于输入车牌图片、输出车牌文字,所述人脸识别模型用于输入人脸图片、输出对应的人名,所述物体识别模型用于输入物体图片、输出对应的名称;所述步骤a进一步包括:若所述AI模型从一张图片中提取出一个结果,则该结果为一个语义信息文本;...

【专利技术属性】
技术研发人员:元方张凡超
申请(专利权)人:新智认知数据服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1