当前位置: 首页 > 专利查询>邻客音公司专利>正文

用于搜索分布式节点分片图的系统和方法技术方案

技术编号:12283710 阅读:190 留言:0更新日期:2015-11-06 00:18
本发明专利技术的实施方式涉及用于搜索分布式节点分片图的系统和方法。提供了一种用于搜索由节点所分片的分布式图的系统、装置和方法。控制器接收保证或要求在起始节点处开始的宽度优先搜索的查询。该控制器向维护该起始节点的第一数据服务器发出搜索请求,其具有其它标准的标识符(例如,目的地节点)并且具有任何可应用执行参数,该执行参数可以使得该搜索提早结束或者可以使得一些结果被删减。如果该第一数据服务器无法解析该请求,则其将该搜索传播至存储其它节点(例如,直接连接至该起始节点的节点)的一个或多个其它数据服务器,并且转发该执行参数以及其可能已经生成的任意部分结果(例如,部分路径)。那些数据服务器将对该搜索请求进行处理,向控制器返回响应结果,和/或进一步传播该请求。

【技术实现步骤摘要】

本公开内容涉及数据库和计算机系统的领域。更具体地,提供了用于搜索分布式 图、数据库或者其它数据集合的系统和方法。
技术介绍
大型数据库经常通过(一般在单个服务器上)存储单一模式的数据库行的不同集 合而在水平上进行分区。水平分区的一种好处是对应于分区的索引的大小有所减小。分片 (sharding)通过跨一种模式的多个实例对数据库行进行分区而延伸了这一概念,由此允许 大数据库表得以跨多个服务器而被划分;使用单独的索引来管理每个分区。 例如,包括数百万节点以及连接那些节点的边的大型图可能过大而无法被存储在 单个存储库中,并且因此可能跨多个存储库或者在多个存储库之中进行分布。【附图说明】 图1是描绘可以在其中实施一个或多个实施例的计算环境的框图。 图2是依据一些实施例的描绘用于执行分布式图的宽度优先搜索的装置和方法 的框图。 图3是依据一些实施例的演示执行分布式图的宽度优先搜索的方法的流程图。 图4是依据一些实施例的用于搜索已经由节点所分片的分布式图的装置的框图。【具体实施方式】 以下描述被给出以使得本领域的任何技术人员都能够制造并使用所公开的实施 例,并且以一个或多个特定应用及其要求为背景而提供。针对所公开实施例的各种修改对 于本领域技术人员将是轻易显而易见的,并且这里所定义的一般原则可以被应用于其它实 施例和应用而并不背离所公开的那些实施例和应用的范围。因此,与本公开相关联的一项 或多项专利技术并非意在被局限于所示出的实施例,而是要以与本公开相符的最为宽泛的范围 为依据。 在一些实施例中,提供了用于对已经由节点跨多个逻辑或物理数据服务器进行分 片或水平分区的分布式图来执行搜索或查询的系统和方法。根据以下描述,能够容易研发 出其它实施例以便随以有利于进行分片或水平分区的方式进行配置的其它类型的数据而 使用。 该系统包括多个数据服务器以及附加的用于接收查询并对其作出响应的逻辑,并 且该方法提供了查询响应从个体服务器的快速返回,同时允许对查询进行动态调节以提早 终止查询、删减结果,或者影响查询的执行和/或针对查询的响应。 图1是根据一些实施例的用于搜索水平分区或分片的数据集合(诸如分布图)的 系统的框图。系统110可以被说明性地实施为一个组织的数据中心或者在该数据中心内实 施,该数据中心托管维护数据的在线应用或服务。 在一些特定实现中,系统lio在由例如Linked丨n?公司所提供的专业或社交联 网服务或系统内进行操作,上述服务或系统帮助成员创建、开发并维护专业(和个人)关 系。作为说明,在这些实现中,数据可以表示成员以及它们针对彼此的连接。 系统110所提供的服务或应用的成员或用户经由客户端设备连接至该系统,该客 户端设备可以是静态的(例如,台式计算机、工作站)和/或移动的(例如,智能电话、平板 电脑、膝上电脑)。该客户端设备操作诸如浏览器程序或者专门被设计为访问系统lio所提 供的(多种)服务的应用之类的适当的客户端应用。系统110的用户可以被称作成员,因 为他们可能被要求向系统进行注册以便完全访问可用服务。 用户连接通常通过端口 112来形成,后者可以包括应用服务器、web服务器和/或 一些其它网关或入口点。系统110还包括内容服务器114、(多个)控制器116、内容存储 124和数据服务器126。 作为其所提供的服务的一部分,系统110供应内容以用于经由用户的客户端设备 向其进行呈现。所供应的内容可以包括状态更新、消息、广告、工作机会、通告、工作列表、新 闻等,并且可以是或可以包括任意类型的媒体(例如,文本、图像、视频、音频)。系统110可 以供应由系统的服务的用户所生成的内容和/或由第三方所提供的内容以便递送至那些 服务的用户。 内容服务器114维护用于向成员供应的内容项的一个或多个存储库(例如,内容 存储124)、内容项的索引和/或在向成员提供内容时有用的其它信息。作为说明,内容服务 器114可以每天供应数亿量级的内容项,系统可以针对其中的每一个内容项存储事件记录 (除了反应其它用户活动的数据之外)。 如以上所指出的,内容存储124可以包括用于向成员提供和/或供系统110的各 种组件所使用的各种类型的内容和内容项,包括状态更新、成员以及有可能非成员所发布 的信息(例如,通告、消息、评论、布告)、文档、广告(例如,收益广告和非收益广告二者)、 工作列表、媒体内容(例如,图像、视频、音频),等等。内容服务器114(或者系统110的一 些其它组件)可以包括用于推荐向成员供应的内容的推荐模块。 系统110所托管的服务的成员在系统上具有对应页面(例如,网页、内容页面),他 们可以使用该页面来促成其与该系统以及彼此之间的活动。这些页面(或者经由这些页面 提供给成员的信息)可用于一些或所有其它成员访问以便浏览相对应成员所提供或者与 之相关联的消息、通告和/或其它信息。成员的页面可以存储在图1中所描绘的系统110 的组件上,或者存储在图中并未示出的组件上。 数据服务器116存储表示成员连接的图的数据,其中每个节点对应于一个成员或 用户(或其它实体),并且两个节点之间的每条边对应于这两个节点所表示的成员/用户/ 实体之间的关系。在不同实施例中,关系可以是明确的、隐含的,或者是明确和隐含的组合。 当一个成员直接请求与另一个成员的关系并且该另一成员同意时形成明确关系。 隐含关系则通过更为随意的类型的联系而形成,诸如当一个成员向另一个成员发送消息 (例如,聊天消息、电子邮件消息)时,当一个成员为另一个成员确认(endorse)时,当一个 成员对另一个成员的动作作出响应时(例如,通过对其进行评论或者通过"点赞"它),当两 个成员表现出相同或相似的行为或兴趣时(例如,通过互相"点赞"或"分享"一个或多个 内容项),和/或以其它方式形成。群组的成员可以通过明确或隐含的关系进行连接。 系统110所提供的服务的成员的网络可以数量在数千万或数亿。因此,成员的连 接的图可以在任何数量的数据服务器126之中进行分布。在一些实施例中,图数据由节点 (例如,成员)所分片,其中每个数据服务器负责维护一定数量的节点。数据服务器所存储 的节点可以包括相对应成员的一些或全部属性。特别地,节点包括或者伴随有标识相对应 成员与之直接连接的所有其它成员的信息。换句话说,节点的数据可以包括连接至该节点 的所有边,并且每条边标识处于这条边的另一端的节点。下文中对搜索被分片的图数据的 方法进一步进行描述。 系统110可以包括图1中并未图示的其它组件。例如,在一些实施例中,系统110 可以包括简档服务器以在简档数据库中维护系统110所托管的(多种)服务的成员的简 档。 个体成员的简档可以反映该成员的任意数量的属性或特性,包括个人的(例如, 性别、年龄或年龄范围、兴趣、爱好、成员ID)、职业的(例如,就业状况、职位名称、职能范围 或行业、雇主、技能、确认情况、职业薪酬)、社交的(例如,用户作为其成员的组织、居住的 地理区域、好友)、教育的(例如,(多种)程度、毕业院校、其它培训),等等。成员简档或者 成员简档的属性或维度可以以各种方式被系统组件所使用(例如,以标识谁发送了消息, 以标识状态更新的接受方,记录内容递送事件)。 组织也可以是服本文档来自技高网...

【技术保护点】
一种搜索由节点所分片的分布式图的方法,该方法包括:在存储有所述分布式图的第一分片的第一节点存储库处接收有关第一节点和第二节点的搜索请求;操作所述第一节点存储库的处理器以确定所述第一分片是否包括所述第一节点和所述第二节点之间的直接连接;以及如果所述第一分片不包括所述第一节点和所述第二节点之间的直接连接,则直接向存储有所述分布式图的其他分片的一个或多个其他节点存储库传播所述搜索请求。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:A·尼加姆赵成柱
申请(专利权)人:邻客音公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1