【技术实现步骤摘要】
搜索方法、搜索装置、电子设备、存储介质和程序产品
本公开涉及计算机技术,并且更具体地,涉及搜索方法、搜索装置、电子设备、计算机可读存储介质和计算机程序产品,可以用于搜索领域和人工智能领域等领域,尤其可以用于以图搜图领域和机器学习领域等领域。
技术介绍
当今互联网生活中广泛存在着基于输入的图像来搜索与之相关联的、包括匹配的图像和相关联的文本的网页信息的搜索诉求,因此多个公司的多种产品已经被开发用于实现前述的、可以被称为以图搜图的搜索请求。用于以图搜图的产品的主要技术方案包括分析输入的、要被搜索的图像的特征、基于要被搜索的图像的特征来与数据库中的现有图像的特征进行比对,并且基于搜索到的相关联的图像来拉取与图像对应的网页,并且对拉取的网页进行展现。在以图搜图的上述过程中,对拉取的网页进行排序展现极大程度上影响了相关产品的最终质量。然而,传统的用于以图搜图的产品在对拉取的网页进行排序展现时存在很大的局限性,从而使得用户难以直观地看到最为接近的、或者被合理排序的搜索结果,进而影响用户使用搜索工具针对输入图像进行搜索操作时的用户体验。
技术实现思路
根据本公开的实施例,提供了一种搜索方法、搜索装置、电子设备、计算机可读存储介质和计算机程序产品。在本公开的第一方面中,提供了一种搜索方法,包括:获取图像文本对集合,其中图像文本对集合为基于输入图像通过以图搜图得到的搜索结果;确定图像文本对集合中的第一图像文本对中的第一文本与图像文本对集合中的第二图像文本对中的第二文本的文本相似度;以及基于文本相似度 ...
【技术保护点】
1.一种搜索方法,包括:/n获取图像文本对集合,其中所述图像文本对集合为基于输入图像通过以图搜图得到的搜索结果;/n确定所述图像文本对集合中的第一图像文本对中的第一文本与所述图像文本对集合中的第二图像文本对中的第二文本的文本相似度;以及/n基于所述文本相似度,确定所述第一图像文本对与所述第二图像文本对的图像文本对相似度。/n
【技术特征摘要】
1.一种搜索方法,包括:
获取图像文本对集合,其中所述图像文本对集合为基于输入图像通过以图搜图得到的搜索结果;
确定所述图像文本对集合中的第一图像文本对中的第一文本与所述图像文本对集合中的第二图像文本对中的第二文本的文本相似度;以及
基于所述文本相似度,确定所述第一图像文本对与所述第二图像文本对的图像文本对相似度。
2.根据权利要求1所述的方法,其中确定所述文本相似度包括:
基于所述第一文本和所述第二文本之间的相同部分来确定所述文本相似度。
3.根据权利要求2所述的方法,其中确定所述文本相似度包括:
以字为单位,确定所述第一文本中、与所述第二文本中所包括的内容相同的第一部分;
确定所述第一部分的字数与所述第一文本的字数的第一比值;
以字为单位,确定所述第二文本中、与所述第一文本中所包括的内容相同的第二部分;
确定所述第二部分的字数与所述第二文本的字数的第二比值;以及
将所述第一比值与所述第二比值的乘积确定为所述文本相似度。
4.根据权利要求3所述的方法,其中:
确定所述第一部分包括以至少两个连续字为单位,确定所述第一文本中、与所述第二文本中所包括的内容相同的所述第一部分;并且
确定所述第二部分包括以至少两个连续字为单位,确定所述第二文本中、与所述第一文本中所包括的内容相同的所述第二部分。
5.根据权利要求1所述的方法,其中确定所述图像文本对相似度包括:
确定所述第一图像文本对中的第一图像与所述第二图像文本对中的第二图像的图像相似度;以及
基于所述文本相似度和所述图像相似度,确定所述第一图像文本对与所述第二图像文本对的所述图像文本对相似度。
6.根据权利要求1所述的方法,其中:
所述第二图像文本对包括多个第二图像文本对;
确定所述文本相似度包括确定所述第一文本与所述多个第二图像文本中的多个第二文本的多个文本相似度;并且
确定所述图像文本对相似度包括确定所述第一图像文本对与所述多个第二图像文本对的多个图像文本对相似度。
7.根据权利要求6所述的方法,还包括:
将所述第一图像文本对和所述多个第二图像文本对中的、图像文本对相似度高于相似度阈值的第二图像文本对确定为正样本;
将所述多个第二图像文本对中的、所述图像文本对相似度不高于所述相似度阈值的第二图像文本对确定为负样本;以及
利用所述正样本和所述负样本来训练搜索模型,使得所述搜索模型能够基于所述输入图像来从所述图像文本对集合选择出所述第一图像文本对和所述图像文本对相似度高于所述相似度阈值的所述第二图像文本对。
8.根据权利要求6或7所述的方法,还包括:
利用所述多个第二图像文本对和所述多个图像文本对相似度来训练排序模型,使得所述排序模型能够基于所述输入图像来按照所述多个图像文本对相似度来对所述多个第二图像文本对排序。
9.一种搜索装置,包括:
获取模块,被配置为获取图像文本对集合,其中所述图像文本对集合为基于输入图像通过以图搜图得到的搜索结果;
第一文本相似度确定模块,被配置为确定所述图像文本对集合中的第一图像文本对中的第一文本与所述图像文本对集合中的第二图像文本对中的第二文本的文本相似度;以及
第一图像文本对相似度确定模块,被配置为基于所述文本相似度,确定所述第一图像文本对与所述第二图像文本对的图像文本对相似度。
10.根据权利要求9所述的装置,其中所述第一文本相似度确定模块包括:
第二文本相似度确定模块,被配置为基于所述第一文本和所述第二文本之间的相...
【专利技术属性】
技术研发人员:程洲,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。