【技术实现步骤摘要】
信息检索方法、信息推荐方法、装置、电子设备
[0001]本公开涉及计算机
,尤其涉及信息检索方法、信息推荐方法、装置、电子设备。
技术介绍
[0002]在智能推荐系统中,通常将推荐流程分为两个步骤,第一个步骤是召回步骤,也即将要检索的用户数据或相关语句输入到推荐系统,与数据库内的大量(例如,上亿个)的推荐对象(例如:商品对象、视频对象、文章对象等)相似度,再选取相似度高的多个推荐对象作为召回结果。第二个步骤是推荐步骤,也即将召回结果包含的多个推荐对象进行排序,再根据排序确定最终推荐给用户的推荐对象。
[0003]在相关技术中,通常通过计算推荐对象特征和用户特征的向量内积,来度量相似度,这种方式计算量大且不便于实现用户和推荐对象之间的特征组合;或者,基于树索引,对用户和推荐对象的兴趣度量进行层次化建模和检索,但这种方式也存在诸多缺陷。
技术实现思路
[0004]本公开提供了一种用于解决上述技术问题中的至少一项的信息检索方法、信息推荐方法、装置、电子设备。
[0005]根据本公开的一方面,提供了一种信息检索方法,所述方法包括:
[0006]获取分层可导航小世界图索引,其中,所述分层可导航小世界图索引包括多层自上而下排列的可导航小世界子图,其中每层可导航小世界子图包含多个节点,每个所述节点对应一个推荐对象向量;
[0007]获取待检索的目标用户数据,并将所述目标用户数据转换为目标用户向量;
[0008]将所述目标用户向量输入所述分层可导航小世界图索引,按照从上到 ...
【技术保护点】
【技术特征摘要】
1.一种信息检索方法,所述方法包括:获取分层可导航小世界图索引,其中,所述分层可导航小世界图索引包括多层自上而下排列的可导航小世界可导航小世界子图,其中每层可导航小世界子图包含多个节点,每个所述节点对应一个推荐对象向量;获取待检索的目标用户数据,并将所述目标用户数据转换为目标用户向量;将所述目标用户向量输入所述分层可导航小世界图索引,按照从上到下的顺序依次在各层可导航小世界子图中进行检索,直至从最下层可导航小世界子图包含的多个节点中,确定所述目标用户向量的多个近邻节点;根据所述多个近邻节点对应的多个推荐对象向量生成与所述待检索的目标用户数据相匹配的召回结果。2.根据权利要求1所述的方法,其中,所述按照从上到下的顺序依次在各层可导航小世界子图中进行检索,包括:针对每一层可导航小世界子图,在当前层可导航小世界子图包含的多个节点中,检索出距离所述目标用户向量最近的k个近邻节点作为当前层可导航小世界子图的检索结果,通过所述当前层可导航小世界子图的检索结果包含的所述k个近邻节点进入下一层可导航小世界子图;其中,k为大于1的整数。3.根据权利要求2所述的方法,其中,所述在当前层可导航小世界子图包含的多个节点中,检索出距离所述目标用户向量最近的k个近邻节点作为当前层可导航小世界子图的检索结果,包括:在所述当前层为最上层可导航小世界子图的情况下,以最上层可导航小世界子图包含的所有节点作为最上层可导航小世界子图的初始节点,在所述初始节点中检索出距离所述目标用户向量最近的k个近邻节点作为当前层可导航小世界子图的检索结果;在所述当前层为其他层可导航小世界子图的情况下,以上一层可导航小世界子图的检索结果包含的k个近邻节点作为当前层可导航小世界子图的初始节点,根据k个所述初始节点以及与所述k个初始节点具有连接关系的邻接节点,检索出距离所述目标用户向量最近的k个近邻节点作为当前层可导航小世界子图的检索结果。4.根据权利要求3所述的方法,其中,所述在所述当前层为其他层可导航小世界子图的情况下,以上一层可导航小世界子图的检索结果包含的k个近邻节点作为当前层可导航小世界子图的初始节点,根据k个所述初始节点以及与所述k个初始节点具有连接关系的邻接节点,检索出距离所述目标用户向量最近的k个近邻节点作为当前层可导航小世界子图的检索结果,包括:通过所述复杂打分模型,以当前层可导航小世界子图的k个所述初始节点以及与所述k个初始节点具有连接关系的邻接节点作为所述复杂打分模型的初始输入,根据所述复杂打分模型输出的相关度打分对所述k个所述初始节点以及与所述k个初始节点具有连接关系的邻接节点进行多轮筛选,并以最后一轮的筛选结果确定出的k个节点作为当前层可导航小世界子图的检索结果。5.根据权利要求4所述的方法,其中,所述多轮筛选的每一轮按照如下方式进行:以上一轮筛选结果确定出的m个节点作为当前轮筛选的目标节点,确定m个目标节点和所述m个目标节点的邻接节点;
将所述m个目标节点和所述m个目标节点的邻接节点输入所述复杂打分模型,得到所述m个目标节点和所述m个目标节点的邻接节点的相关度打分;根据所述相关度打分对所述所述m个目标节点和所述m个目标节点的邻接节点进行排序,并确定排序前m个节点为当前轮的筛选结果;其中,m为大于等于k的整数;针对每一层可导航小世界子图的最后一轮筛选,m=k。6.根据权利要求3
‑
5任一所述的方法,其中,所述在所述当前层为最上层可导航小世界子图的情况下,以最上层可导航小世界子图包含的所有节点作为最上层可导航小世界子图的初始节点,在所述初始节点中检索出距离所述目标用户向量最近的k个近邻节点作为当前层可导航小世界子图的检索结果,包括:将所述最上层可导航小世界子图包含的所有节点输入所述复杂打分模型,得到所述所有节点的相关度打分;根据所述相关度打分对所述所有节点进行排序,并确定排序前k个节点为当前层可导航小世界子图的检索结果。7.根据权利要求1
‑
6任一所述的方法,其中,所述目标用户向量包括用户子向量和关联对象子向量;所述获取待检索的目标用户数据,并将所述目标用户数据转换为目标用户向量,包括:通过向量转换模型将所述目标用户数据转换为所述用户子向量;在推荐对象向量集合中查找与所述用户子向量相关的推荐对象向量作为所述关联对象子向量;将所述用户子向量和所述关联对象子向量拼接为所述目标用户向量。8.根据权利要求1
‑
7任一所述的方法,其中,所述分层可导航小世界图索引通过以下步骤构建得到:获取多个推荐对象数据;通过向量转换模型将所述多个推荐对象数据转换为多个推荐对象向量;基于所述推荐对象向量,采用分层可导航小世界算法,构建所述分层可导航小世界图索引。9.根据权利要求7或8所述的方法,其中,所述向量转换模型采用服务节点和工作节点进行训练;所述向量转换模型采用下述方式进行训练:所述服务节点从所述工作节点中读取训练数据,并输入所述向量转换模型进行训练;所述服务节...
【专利技术属性】
技术研发人员:陈广星,廖小超,杨国宝,李俊俊,朱俊祝,段雪涛,牛化康,杨作栋,刘元俊,
申请(专利权)人:百度时代网络技术北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。