信息检索方法、信息推荐方法、装置、电子设备制造方法及图纸

技术编号:38991787 阅读:20 留言:0更新日期:2023-10-07 10:22
本公开提供了一种信息检索方法,涉及计算机技术领域,尤其涉及信息推荐方法、装置、电子设备。具体实现方案为:获取分层可导航小世界图索引,其中每层可导航小世界子图包含多个节点,每个节点对应一个推荐对象向量;获取待检索的目标用户数据,并将目标用户数据转换为目标用户向量;将目标用户向量输入分层可导航小世界图索引,按照从上到下的顺序依次在各层可导航小世界子图中进行检索,直至从最下层可导航小世界子图包含的多个节点中,确定目标用户向量的多个近邻节点;根据多个近邻节点对应的多个推荐对象向量生成与待检索的目标用户数据相匹配的召回结果。据相匹配的召回结果。据相匹配的召回结果。

【技术实现步骤摘要】
信息检索方法、信息推荐方法、装置、电子设备


[0001]本公开涉及计算机
,尤其涉及信息检索方法、信息推荐方法、装置、电子设备。

技术介绍

[0002]在智能推荐系统中,通常将推荐流程分为两个步骤,第一个步骤是召回步骤,也即将要检索的用户数据或相关语句输入到推荐系统,与数据库内的大量(例如,上亿个)的推荐对象(例如:商品对象、视频对象、文章对象等)相似度,再选取相似度高的多个推荐对象作为召回结果。第二个步骤是推荐步骤,也即将召回结果包含的多个推荐对象进行排序,再根据排序确定最终推荐给用户的推荐对象。
[0003]在相关技术中,通常通过计算推荐对象特征和用户特征的向量内积,来度量相似度,这种方式计算量大且不便于实现用户和推荐对象之间的特征组合;或者,基于树索引,对用户和推荐对象的兴趣度量进行层次化建模和检索,但这种方式也存在诸多缺陷。

技术实现思路

[0004]本公开提供了一种用于解决上述技术问题中的至少一项的信息检索方法、信息推荐方法、装置、电子设备。
[0005]根据本公开的一方面,提供了一种信息检索方法,所述方法包括:
[0006]获取分层可导航小世界图索引,其中,所述分层可导航小世界图索引包括多层自上而下排列的可导航小世界子图,其中每层可导航小世界子图包含多个节点,每个所述节点对应一个推荐对象向量;
[0007]获取待检索的目标用户数据,并将所述目标用户数据转换为目标用户向量;
[0008]将所述目标用户向量输入所述分层可导航小世界图索引,按照从上到下的顺序依次在各层可导航小世界子图中进行检索,直至从最下层可导航小世界子图包含的多个节点中,确定所述目标用户向量的多个近邻节点;
[0009]根据所述多个近邻节点对应的多个推荐对象向量生成与所述待检索的目标用户数据相匹配的召回结果。
[0010]根据本公开的另一方面,提供了一种信息推荐方法,所述方法包括:
[0011]基于上述信息检索方法生成的与待检索的目标用户数据相匹配的召回结果,确定向所述待检索的目标用户数据对应的用户推荐的至少一个推荐对象。
[0012]根据本公开的另一方面,提供了一种信息检索装置,该装置包括:
[0013]图索引获取模块,用于获取分层可导航小世界图索引,其中,所述分层可导航小世界图索引包括多层自上而下排列的可导航小世界子图,其中每层可导航小世界子图包含多个节点,每个所述节点对应一个推荐对象向量;
[0014]向量转换模块,用于获取待检索的目标用户数据,并将所述目标用户数据转换为目标用户向量;
[0015]向量检索模块,用于将所述目标用户向量输入所述分层可导航小世界图索引,按照从上到下的顺序依次在各层可导航小世界子图中进行检索,直至从最下层可导航小世界子图包含的多个节点中,确定所述目标用户向量的多个近邻节点;
[0016]召回结合生成模块,用于根据所述多个近邻节点对应的多个推荐对象向量生成与所述待检索的目标用户数据相匹配的召回结果。
[0017]根据本公开的另一方面,提供了一种电子设备,包括:
[0018]至少一个处理器;以及
[0019]与所述至少一个处理器通信连接的存储器;其中,
[0020]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执上述信息检索方法或信息推荐方法。
[0021]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据上述信息检索方法或信息推荐方法。
[0022]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据上述信息检索方法或信息推荐方法。
[0023]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0024]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0025]图1是本公开一种示例性的分层可导航小世界图索引的结构示意图;
[0026]图2是本公开第一实施例提供的信息检索方法的流程示意图;
[0027]图3是本公开第二实施例提供的分层可导航小世界图索引构建方法的流程示意图;
[0028]图4是本公开第三实施例提供的信息检索方法的流程示意图;
[0029]图5是本公开提供的信息检索方法的一种示例性的应用场景架构图;
[0030]图6是本公开第四实施例提供的信息推荐方法的流程示意图;
[0031]图7是本公开第五实施例提供的信息检索装置的结构示意图;
[0032]图8是本公开第六实施例提供的信息推荐装置的结构示意图;
[0033]图9是用来实现本公开实施例的信息检索方法的电子设备的框图。
具体实施方式
[0034]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0035]在不冲突的情况下,本公开各实施例及实施例中的各特征可相互组合。
[0036]如本文所使用的,术语“和/或”包括一个或多个相关列举条目的任何和所有组合。
[0037]本文所使用的术语仅用于描述特定实施例,且不意欲限制本公开。如本文所使用
的,单数形式“一个”和“该”也意欲包括复数形式,除非上下文另外清楚指出。
[0038]除非另外限定,否则本文所用的所有术语(包括技术和科学术语)的含义与本领域普通技术人员通常理解的含义相同。还将理解,诸如那些在常用字典中限定的那些术语应当被解释为具有与其在相关技术以及本公开的背景下的含义一致的含义,且将不解释为具有理想化或过度形式上的含义,除非本文明确如此限定。
[0039]相关技术中,通过计算推荐对象特征和用户特征的向量内积,来度量相似度,在基于相似度确定召回结果,这种方式计算量大且不便于实现用户和推荐对象之间的特征组合;或者,基于树索引,对用户和推荐对象的兴趣度量进行层次化建模,在通过在树索引上逐层检索确定召回结果,但这种方式也存在诸多缺陷,例如:
[0040]1.相关技术中树索引结构和向量转换模型的训练强耦合在一起,造成在线和离线链路过于复杂,相互依赖,扩展性很差,不能独立优化,难以迭代。
[0041]2.树索引在非最底层的其他层中,其他层包含的节点均是虚拟节点,虚拟节点只有对象标识,而不能直接加入辅助信息(side information)特征,因此这种索引结构限制了召回结果的准确性。
[0042]3.树索引采用自顶向下的建库方式,由粗到细逐渐把每层的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息检索方法,所述方法包括:获取分层可导航小世界图索引,其中,所述分层可导航小世界图索引包括多层自上而下排列的可导航小世界可导航小世界子图,其中每层可导航小世界子图包含多个节点,每个所述节点对应一个推荐对象向量;获取待检索的目标用户数据,并将所述目标用户数据转换为目标用户向量;将所述目标用户向量输入所述分层可导航小世界图索引,按照从上到下的顺序依次在各层可导航小世界子图中进行检索,直至从最下层可导航小世界子图包含的多个节点中,确定所述目标用户向量的多个近邻节点;根据所述多个近邻节点对应的多个推荐对象向量生成与所述待检索的目标用户数据相匹配的召回结果。2.根据权利要求1所述的方法,其中,所述按照从上到下的顺序依次在各层可导航小世界子图中进行检索,包括:针对每一层可导航小世界子图,在当前层可导航小世界子图包含的多个节点中,检索出距离所述目标用户向量最近的k个近邻节点作为当前层可导航小世界子图的检索结果,通过所述当前层可导航小世界子图的检索结果包含的所述k个近邻节点进入下一层可导航小世界子图;其中,k为大于1的整数。3.根据权利要求2所述的方法,其中,所述在当前层可导航小世界子图包含的多个节点中,检索出距离所述目标用户向量最近的k个近邻节点作为当前层可导航小世界子图的检索结果,包括:在所述当前层为最上层可导航小世界子图的情况下,以最上层可导航小世界子图包含的所有节点作为最上层可导航小世界子图的初始节点,在所述初始节点中检索出距离所述目标用户向量最近的k个近邻节点作为当前层可导航小世界子图的检索结果;在所述当前层为其他层可导航小世界子图的情况下,以上一层可导航小世界子图的检索结果包含的k个近邻节点作为当前层可导航小世界子图的初始节点,根据k个所述初始节点以及与所述k个初始节点具有连接关系的邻接节点,检索出距离所述目标用户向量最近的k个近邻节点作为当前层可导航小世界子图的检索结果。4.根据权利要求3所述的方法,其中,所述在所述当前层为其他层可导航小世界子图的情况下,以上一层可导航小世界子图的检索结果包含的k个近邻节点作为当前层可导航小世界子图的初始节点,根据k个所述初始节点以及与所述k个初始节点具有连接关系的邻接节点,检索出距离所述目标用户向量最近的k个近邻节点作为当前层可导航小世界子图的检索结果,包括:通过所述复杂打分模型,以当前层可导航小世界子图的k个所述初始节点以及与所述k个初始节点具有连接关系的邻接节点作为所述复杂打分模型的初始输入,根据所述复杂打分模型输出的相关度打分对所述k个所述初始节点以及与所述k个初始节点具有连接关系的邻接节点进行多轮筛选,并以最后一轮的筛选结果确定出的k个节点作为当前层可导航小世界子图的检索结果。5.根据权利要求4所述的方法,其中,所述多轮筛选的每一轮按照如下方式进行:以上一轮筛选结果确定出的m个节点作为当前轮筛选的目标节点,确定m个目标节点和所述m个目标节点的邻接节点;
将所述m个目标节点和所述m个目标节点的邻接节点输入所述复杂打分模型,得到所述m个目标节点和所述m个目标节点的邻接节点的相关度打分;根据所述相关度打分对所述所述m个目标节点和所述m个目标节点的邻接节点进行排序,并确定排序前m个节点为当前轮的筛选结果;其中,m为大于等于k的整数;针对每一层可导航小世界子图的最后一轮筛选,m=k。6.根据权利要求3

5任一所述的方法,其中,所述在所述当前层为最上层可导航小世界子图的情况下,以最上层可导航小世界子图包含的所有节点作为最上层可导航小世界子图的初始节点,在所述初始节点中检索出距离所述目标用户向量最近的k个近邻节点作为当前层可导航小世界子图的检索结果,包括:将所述最上层可导航小世界子图包含的所有节点输入所述复杂打分模型,得到所述所有节点的相关度打分;根据所述相关度打分对所述所有节点进行排序,并确定排序前k个节点为当前层可导航小世界子图的检索结果。7.根据权利要求1

6任一所述的方法,其中,所述目标用户向量包括用户子向量和关联对象子向量;所述获取待检索的目标用户数据,并将所述目标用户数据转换为目标用户向量,包括:通过向量转换模型将所述目标用户数据转换为所述用户子向量;在推荐对象向量集合中查找与所述用户子向量相关的推荐对象向量作为所述关联对象子向量;将所述用户子向量和所述关联对象子向量拼接为所述目标用户向量。8.根据权利要求1

7任一所述的方法,其中,所述分层可导航小世界图索引通过以下步骤构建得到:获取多个推荐对象数据;通过向量转换模型将所述多个推荐对象数据转换为多个推荐对象向量;基于所述推荐对象向量,采用分层可导航小世界算法,构建所述分层可导航小世界图索引。9.根据权利要求7或8所述的方法,其中,所述向量转换模型采用服务节点和工作节点进行训练;所述向量转换模型采用下述方式进行训练:所述服务节点从所述工作节点中读取训练数据,并输入所述向量转换模型进行训练;所述服务节...

【专利技术属性】
技术研发人员:陈广星廖小超杨国宝李俊俊朱俊祝段雪涛牛化康杨作栋刘元俊
申请(专利权)人:百度时代网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1