【技术实现步骤摘要】
【国外来华专利技术】在线社交网络上利用图和紧致回归码的快速索引
本公开总体上涉及网络环境中的数据库和文件管理,并且尤其涉及在社交网络环境中执行对象搜索。背景可以包括社交网络网站的社交网络系统可以使它的用户(例如个人或组织)能够与它互动以及通过它彼此互动。社交网络系统可以利用来自用户的输入来创建并在社交网络系统中存储与用户相关联的用户简档(userprofile)。用户简档可以包括人口统计信息、通信渠道信息以及关于用户的个人兴趣的信息。社交网络系统还可以用来自用户的输入来创建并存储用户与社交网络系统的其他用户的关系的记录,以及提供服务(例如,发帖墙(wallpost)、照片分享、事件组织、消息传送、游戏或广告)以便于在用户之间或当中的社交互动。社交网络系统可以通过一个或更多个网络向用户的移动设备或其他计算设备发送与它的服务相关的内容或消息。用户还可以在用户的移动设备或其他计算设备上安装软件应用,用于访问用户的用户简档和在社交网络系统内的其他数据。社交网络系统可以生成一组个性化的内容对象以显示给用户,例如关连(connect)到该用户的其他用户的汇总动态(story)的动态消息(newsfeed)。社交图分析从由节点和边组成的网络理论方面来看待社交关系。节点表示网络中的单独参与者,以及边表示在参与者之间的关系。由此产生的基于图的结构常常是非常复杂的。可以有很多类型的节点和用于连接节点的很多类型的边。在它的最简单的形式中,社交图是在所有被研究的节点之间的所有相关边的布局图。特定实施例的概述在特定实施例中,社交网络系 ...
【技术保护点】
1.一种方法,包括由一个或更多个计算系统:/n接收搜索查询,其中,所述搜索查询包括查询内容对象和一个或更多个查询约束;/n生成表示所述查询内容对象的特征向量;/n访问稀疏图,所述稀疏图包括对应于多个候选内容对象的多个节点和连接所述节点的多个链接,其中,连接到任何特定节点的链接的数量小于链接的阈值数量,并且其中,每个候选内容对象由紧致码表示;/n从所述稀疏图的多个节点中选择入口节点;/n从所述多个候选内容对象中选择关于所述查询内容对象的一个或更多个相似内容对象,其中,所述一个或更多个相似内容对象通过以下方式被迭代地选择:/n识别所述入口节点的一个或更多个链接节点,其中,每个链接节点通过链接连接到所述入口节点;/n对于对应于所述链接节点的每个候选内容对象,解压缩表示所述候选内容对象的紧致码,以生成表示所述候选内容对象的特征向量;/n基于表示所述查询内容对象的特征向量和表示所述候选内容对象的特征向量之间的比较,从所述候选内容对象中选择零个或更多个相似内容对象;/n确定是否达到选择所述一个或更多个相似内容对象的完成条件,其中,基于所述一个或更多个查询约束来确定所述完成条件;和/n基于所述确定: ...
【技术特征摘要】
【国外来华专利技术】20171211 US 62/597,012;20181210 US 16/215,3221.一种方法,包括由一个或更多个计算系统:
接收搜索查询,其中,所述搜索查询包括查询内容对象和一个或更多个查询约束;
生成表示所述查询内容对象的特征向量;
访问稀疏图,所述稀疏图包括对应于多个候选内容对象的多个节点和连接所述节点的多个链接,其中,连接到任何特定节点的链接的数量小于链接的阈值数量,并且其中,每个候选内容对象由紧致码表示;
从所述稀疏图的多个节点中选择入口节点;
从所述多个候选内容对象中选择关于所述查询内容对象的一个或更多个相似内容对象,其中,所述一个或更多个相似内容对象通过以下方式被迭代地选择:
识别所述入口节点的一个或更多个链接节点,其中,每个链接节点通过链接连接到所述入口节点;
对于对应于所述链接节点的每个候选内容对象,解压缩表示所述候选内容对象的紧致码,以生成表示所述候选内容对象的特征向量;
基于表示所述查询内容对象的特征向量和表示所述候选内容对象的特征向量之间的比较,从所述候选内容对象中选择零个或更多个相似内容对象;
确定是否达到选择所述一个或更多个相似内容对象的完成条件,其中,基于所述一个或更多个查询约束来确定所述完成条件;和
基于所述确定:
如果满足所述完成条件,则返回一个或更多个所选择的相似内容对象;否则
如果不满足所述完成条件,则通过使用来自所述一个或更多个链接节点的对应于最相似内容对象的链接节点作为所述入口节点来重复迭代选择;和
响应于接收到所述搜索查询,向与用户相关联的客户端系统发送用于呈现一个或更多个所选择的相似内容对象的指令。
2.根据权利要求1所述的方法,其中,所述一个或更多个查询约束包括以下项中的一个或更多个:
存储器利用率或CPU利用率约束;
选择精度约束;或者
搜索查询处理时间约束。
3.根据权利要求1所述的方法,其中,所述稀疏图的多个链接由一个或更多个机器学习算法生成。
4.根据权利要求1所述的方法,其中,基于一种或更多种编码来生成每个候选内容对象的紧致码。
5.根据权利要求4所述的方法,其中,所述一种或更多种编码包括乘积量化器或优化乘积量化器中的一个或更多个。
6.根据权利要求1所述的方法,其中,所述稀疏图中的每个节点与候选内容对象的聚类相关联,其中,候选对象的每个聚类与特征向量相关联。
7.根据权利要求6所述的方法,从所述稀疏图的多个节点中选择所述入口节点包括:
基于表示所述查询内容对象的特征向量和表示候选内容对象的所述聚类的特征向量之间的比较来选择所述入口节点。
8.根据权利要求1所述的方法,其中,解压缩表示每个候选内容对象的紧致码是基于以下项中的一个或更多个:
细化,所述细化基于表示所述候选内容对象的紧致码和与对应于所述候选内容对象的节点的一个或更多个链接节点相关联的一个或更多个紧致码;或者
表示所述候选内容对象的紧致码和包括多个回归权重向量的回归码本。
9.根据权利要求8所述的方法,其中,所述细化基于一个或更多个损失函数,并且其中,所述一个或更多个损失函数将表示所述候选内容对象的特征向量和与所述候选内容对象相关联的代码矩阵相关联,其中,所述代码矩阵包括表示所述候选内容对象的紧致码和与对应于所述候选内容对象的节点的链接节点相关联的紧致码。
10.根据权利要求8所述的方法,其中,基于所述多个候选内容对象和一个或更多个损失函数来学习所述回归码本。
11.根据权利要求10所述的方法,其中,所述回归码本包括每个候选内容对象的一组量化回归系数,并且其中,生成表示每个候选内容对象的特征向量还基于所述一组量化回归系数。
12.根据权利要求1所述的方法,其中,所述查询内容对象包括文本、音频剪辑、图像或视频剪辑中的一个或更多个。
13.根据权利要求1所述的方法,其中,表示所述查询内容对象的特征向量是基于一个或更多个机器学习算法生成的,并且其中,所述一个或更多个机器学习算法基于卷积神经网络。
14.根据权利要求1所述的方法,其中,所述入口节点的一个或更多个链接节点包括一个或更多个短程链接节点和至少一个长程链接节点。
15.根据权利要求14所述的方法,其中,所述一个或更多个短程链接节点中的每一个相对于所述入口节点具有大于或等于阈值水平的相似性水平。
16.根据权利要求14所述的方法,其中,所述至少一个长程链接节点相对于所述入口节点具有小于阈值水平的相似性水平。
17.根据权利要求1所述的方法,其中,基于所述一个或更多个查询约束来确定所述完成条件。
18.一个或更多个体现软件的计算机可读非暂时性存储介质,所述软件在被执行时能够操作来:
接收搜索查询,其中,所述搜索查询包括查询内容对象和一个或更多个查询约束;
生成表示所述查询内容对象的特征向量;
访问稀疏图,所述稀疏图包括对应于多个候选内容对象的多个节点和连接所述节点的多个链接,其中,连接到任何特定节点的链接的数量小于链接的阈值数量,并且其中,每个候选内容对象由紧致码表示;
从所述稀疏图的多个节点中选择入口节点;
从所述多个候选内容对象中选择关于所述查询内容对象的一个或更多个相似内容对象,其中,所述一个或更多个相似内容对象通过以下方式被迭代地选择:
识别所述入口节点的一个或更多个链接节点,其中,每个链接节点通过链接连接到所述入口节点;
对于对应于所述链接节点的每个候选内容对象,解压缩表示所述候选内容对象的紧致码,以生成表示所述候选内容对象的特征向量;
基于表示所述查询内容对象的特征向量和表示所述候选内容对象的特征向量之间的比较,从所述候选内容对象中选择零个或更多个相似内容对象;
确定是否满足选择所述一个或更多个相似内容对象的完成条件,其中,基于所述一个或更多个查询约束来确定所述完成条件;和
基于所述确定:
如果满足所述完成条件,则返回一个或更多个所选择的相似内容对象;否则
如果不满足所述完成条件,则通过使用来自所述一个或更多个链接节点的对应于最相似内容对象的链接节点作为所述入口节点来重复迭代选择;和
响应于接收到所述搜索查询,向与用户相关联的客户端系统发送用于呈现一个或更多个所选择的相似内容对象的指令。
19.一种系统,包括:一个或更多个处理器;以及耦合到所述处理器的非暂时性存储器,所述非暂时性存储器包括能够由所述处理器执行的指令,在执行所述指令时,所述处理器能够操作来:
接收搜索查询,其中,所述搜索查询包括查询内容对象和一个或更多个查询约束;
生成表示所述查询内容对象的特征向量;
访问稀疏图,所述稀疏图包括对应于多个候选内容对象的多个节点和连接所述节点的多个链接,其中,连接到任何特定节点的链接的数量小于链接的阈值数量,并且其中,每个候选内容对象由紧致码表示;
从所述稀疏图的多个节点中选择入口节点;
从所述多个候选内容对象中选择关于所述查询内容对象的一个或更多个相似内容对象,其中,所述一个或更多个相似内容对象通过以下方式被迭代地选择:
识别所述入口节点的一个或更多个链接节点,其中,每个链接节点通过链接连接到所述入口节点;
对于对应于所述链接节点的每个候选内容对象,解压缩表示所述候选内容对象的紧致码,以生成表示所述候选内容对象的特征向量;
基于表示所述查询内容对象的特征向量和表示所述候选内容对象的特征向量之间的比较,从所述候选内容对象中选择零个或更多个相似内容对象;
确定是否达到了选择所述一个或更多个相似内容对象的完成条件,其中,基于所述一个或更多个查询约束来确定所述完成条件;和
基于所述确定:
如果满足所述完成条件,则返回一个或更多个所选择的相似内容对象;否则
如果不满足所述完成条件,则通过使用来自所述一个或更多个链接节点的对应于最相似内容对象的链接节点作为所述入口节点来重复迭代选择;和
响应于接收到所述搜索查询,向与用户相关联的客户端系统发送用于呈现一个或更多个所选择的...
【专利技术属性】
技术研发人员:马蒂斯·杜兹,亚历山大·萨布利罗勒斯,埃尔韦·耶古,
申请(专利权)人:脸谱公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。