一种搜索方法和处理设备技术

技术编号：21736132 阅读：27 留言：0更新日期：2019-07-31 19:13

本申请提供了一种搜索方法和处理设备，其中，该方法包括：提取目标图像的图像特征向量，其中，所述图像特征向量用于表征所述目标图像的图像内容；在同一向量空间中，根据所述图像特征向量与文本的文本特征向量之间的相关度，确定所述目标图像对应的文本，其中，所述文本特征向量用于表征文本的语义。通过上述方式解决了现有的推荐文本方式所存在的效率较低、对系统处理能力要求较高的问题，达到了可以简单准确的实现图像打标的技术效果。

A Search Method and Processing Equipment

全部详细技术资料下载

【技术实现步骤摘要】
一种搜索方法和处理设备
本申请属于互联网
，尤其涉及一种搜索方法和处理设备。
技术介绍
随着互联网、电子商务等技术的不断发展，对图像数据的需求越来越大，如何对图像数据进行更为有效的分析和利用，对电子商务会产生很大的影响。在对图像数据进行处理的过程中，为图像推荐标签可以更为有效地实现图像的聚合、图像分类、图像检索等等，因此，对图像数据推荐标签的需求也就越来越大。例如，用户A希望通过图像搜索产品的方式来搜索产品，这种情况下，如果可以自动对图像进行打标，那么用户在上传图像之后，就可以自动推荐出与图像相关的品类关键词和属性关键词。或者是在其他存在图像数据的场景，可以自动为图像推荐文本(例如：标签等)，不需要人为进行分类打标。针对如何简单高效地对图像进行打标，目前尚未提出有效的解决方案。
技术实现思路
本申请目的在于提供一种搜索方法和处理设备，可以简单高效地对图像进行打标。本申请提供一种搜索方法和处理设备是这样实现的：一种搜索方法，所述方法包括：提取目标图像的图像特征向量，其中，所述图像特征向量用于表征所述目标图像的图像内容；在同一向量空间中，根据所述图像特征向量与标签的文本特征向量之间的相关度，确定所述目标图像对应的标签，其中，所述文本特征向量用于表征标签的语义。一种处理设备，包括处理器以及用于存储处理器可执行指令的存储器，所述处理器执行所述指令时实现：提取目标图像的图像特征向量，其中，所述图像特征向量用于表征所述目标图像的图像内容；在同一向量空间中，根据所述图像特征向量与标签的文本特征向量之间的相关度，确定所述目标图像对应的标签，其中，所述文本特征向量用于表征...

【技术保护点】
1.一种搜索方法，其特征在于，所述方法包括：提取目标图像的图像特征向量，其中，所述图像特征向量用于表征所述目标图像的图像内容；在同一向量空间中，根据所述图像特征向量与文本的文本特征向量之间的相关度，确定所述目标图像对应的文本，其中，所述文本特征向量用于表征文本的语义。

【技术特征摘要】
1.一种搜索方法，其特征在于，所述方法包括：提取目标图像的图像特征向量，其中，所述图像特征向量用于表征所述目标图像的图像内容；在同一向量空间中，根据所述图像特征向量与文本的文本特征向量之间的相关度，确定所述目标图像对应的文本，其中，所述文本特征向量用于表征文本的语义。2.根据权利要求1所述的方法，其特征在于，在根据所述图像特征向量与文本的文本特征向量之间的相关度，确定所述目标图像对应的文本之前，还包括：根据所述图像特征向量与所述文本特征向量之间的欧式距离，确定所述目标图像与文本之间的相关度。3.根据权利要求1所述的方法，其特征在于，根据所述图像特征向量与文本的文本特征向量之间的相关度，确定所述目标图像对应的文本，包括：将文本特征向量与所述目标图像的图像特征向量之间的相关度大于预设阈值的一个或多个文本作为所述目标图像对应的文本；或者，将文本特征向量与所述目标图像的图像特征向量之间的相关度位于前预设数量的文本作为所述目标图像的文本。4.根据权利要求1所述的方法，其特征在于，根据所述图像特征向量与文本的文本特征向量之间的相关度，确定所述目标图像对应的文本，包括：逐个确定所述图像特征向量与多个文本中各个文本的文本特征向量之间的相关度；在确定出所述图像特征向量与多个文本中各个文本的文本特征向量之间的相似度后，基于确定出的所述图像特征向量与多个文本中各个文本的文本特征向量之间的相似度，确定所述目标图像对应的文本。5.根据权利要求1所述的方法，其特征在于，在提取目标图像的图像特征向量之前，还包括：获取搜索点击行为数据，其中，所述搜索点击行为数据包括：搜索文本和基于搜索文本点击的图像数据；将所述搜索点击行为数据转换为多个图像文本对；根据所述多个图像文本对，训练得到用于提取图像特征向量和文本特征向量的数据模型。6.根据权利要求5所述的方法，其特征在于，将所述搜索点击行为数据转换为多个图像文本对包括：对所述搜索文本进行分词处理和词性分析；从分词处理和词性分析所得到的数据中确定出文本；对所述基于搜索文本点击的图像数据进行去重处理；根据确定出的文本和去重处理后得到的图像数据，建立图像文本对。7.根据权利要求6所述的方法，其特征在于，所述图像文本对包括单标签对，所述单标签对中携带有：一个图像和一个文本。8.一种处理设备，包括处理器以及用于存储处理器可执行指令的存储器，所述处理器执行所述指令时实现：确定图像文本的方法，其特征在于，所述方法包括：提取目标图像的图像特征向量，其中，所述图像特征向量用于表征所述目标图像...

【专利技术属性】
技术研发人员：刘瑞涛，刘宇，徐良鹏，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛,KY

全部详细技术资料下载我是这个专利的主人