【技术实现步骤摘要】
相关申请的交叉引用本申请要求2014年8月29日所提交的美国临时专利申请序列号62/043,849的优先权。明确地要求该临时申请的优先权,并且该临时申请的披露通过引用以其全部内容并且出于所有目的结合在此。
本披露总体上涉及基于图形的关系,并且更具体地(但不排他地)涉及对图形数据的允许边收集和顶点收集的分布式计算。
技术介绍
对大数据集的许多类型的数据分析要求面向图形的分析、或将得益于面向图形的分析。图形是包括被称为顶点的数据对象的集合以及被称为边的顶点到顶点连接的集合的数据结构。以图形格式自然地对其中对象具有与其他对象的关系的数据进行分析。在常规的面向图形的分析中,计算遵循迭代且传播的过程。常规的计算以活动顶点和活动边的初始集开始。每一次迭代都包括对顶点和边的子集所进行的选择——这些顶点和边与活动集相邻——以成为下一次迭代的活动集。从而,计算在概念上行进通过该图形,从顶点一步步走到相邻顶点。在许多应用中,常规图形数据计算的缺点是非常大量的计算步骤。典型的计算需要考虑从源顶点至一个或多个目的顶点的每一条可能的路径。随着路径长度的增加或顶点总数量的增加,路径的数量以更快的速率增加。由于在处理大数据集时考虑高数量路径,常规的图形数据计算系统可能过慢。鉴于前述内容,为了克服常规面向图形的分析系统的上述障碍和缺陷,需要一种用于图形数据的分布式计算的改善的系统。附图说明图 ...
【技术保护点】
一种用于对具有一条或多条边的图形进行分布式计算的计算机实现的方法,该一条或多条边中的每一条边连接一个源顶点和一个端点顶点,该方法包括:读取该一条或多条边的属性值以及该一条或多条边的这些源顶点的属性值;对所读取的这些属性值执行计算;以及基于所执行的这些计算来更新该一条或多条边的和该一条或多条边的这些端点顶点的这些属性值,其中,所述执行没有修改所读取的这些属性值中的任何一个属性值。
【技术特征摘要】
2014.08.29 US 62/043,8491.一种用于对具有一条或多条边的图形进行分布式计算的计算机实
现的方法,该一条或多条边中的每一条边连接一个源顶点和一个端点顶
点,该方法包括:
读取该一条或多条边的属性值以及该一条或多条边的这些源顶点的
属性值;
对所读取的这些属性值执行计算;以及
基于所执行的这些计算来更新该一条或多条边的和该一条或多条边
的这些端点顶点的这些属性值,
其中,所述执行没有修改所读取的这些属性值中的任何一个属性值。
2.如权利要求1所述的计算机实现的方法,进一步包括维护所读取的
属性值之间的一个相关性列表。
3.如权利要求2所述的计算机实现的方法,其中,所述更新这些属性
值基于所维护的该相关性列表而发生,从而使得在所述执行计算期间没有
冲突。
4.如权利要求1所述的计算机实现的方法,进一步包括将该一条或多
条边分割为一个或多个边处理单元并且将这些源顶点和这些端点顶点分
割为一个或多个顶点处理单元。
5.如权利要求4所述的计算机实现的方法,其中,该一个或多个边处
理单元相互独立地工作并且该一个或多个顶点处理单元相互独立地工作。
6.如权利要求1所述的计算机实现的方法,进一步包括将一个数据消
息从所选择的一条边传输至所选择的该边的端点顶点,
其中,该数据消息包括所选择的该边的源顶点的一个标识码和所选择
的该边的属性值中的至少一项。
7.如权利要求6所述的计算机实现的方法,其中,所述更新这些端点
顶点的属性值也是基于所传输的数据消息进行的。
8.如权利要求1所述的计算机实现的方法,其中,该一个或多个边各
自是活动的或不活动的之一,并且所述读取、执行和更新不针对不活动边
执行。
9.如权利要求1所述的计算机实现的方法,其中,每一个源顶点和每
\t一个端点顶点是活动的或不活动的之一,并且所述读取、执行和更新不针
对不活动顶点执行。
10.如权利要求1所述的计算机实现的方法,其中,该一条或多条
边的属性值进一步被存储在一个边数据结构中,该边数据结构包括以下各
项中的至少一项:该边的源顶点的标识、该边的源顶点的存储器地址、该
边的端点顶点的标识、以及该边的边类型。
11.一种用于对具有一条或多条边的图形进行分布式计算的系统,
该一条或多...
【专利技术属性】
技术研发人员:陈立,靳若明,许昱,
申请(专利权)人:SQL图表有限公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。