【技术实现步骤摘要】
一种跳跃式连接的优化路径查询方法、装置、设备及存储介质
[0001]本专利技术属于子图匹配
,具体地涉及一种跳跃式连接的优化路径查询方法、装置、设备及存储介质。
技术介绍
[0002]当前,有很多图系统被提出来用于高效地存储数据图和处理查询图,它们主要包括RDF(Resource
‑
Description
‑
Framework,即资源描述框架,是采用XML编写的一种网络资源描述模型)图系统,如Jena、Virtuoso、RDF4J和gStore等,以及属性图系统Neo4j、Graphflow和EmptyHeaded等,其中,一些系统查询语言支持变长路径查询操作,最常见是SPARQL和Cypher查询语言。
[0003]作为一个图系统来说,查询无外乎是一个重要的基本操作,并可以把所有的查询操作归纳为子图匹配,即查找数据图G中与查询图q同构的所有嵌入。子图匹配在学术界得到了广泛的应用。由于子图匹配的重要性,人们提出了各种算法。在数据库领域,可以将子图匹配算法分为两种类型,其中一类就是连接类型(即Join类型),现有的连接策略可以大致分为三种策略(当然也有不属于这三类的连接策略,因与本申请无关,不再介绍)。
[0004](1)第一种连接策略就是pair
‑
wise join(以下简称为PJ),这种策略即是在数据库中常见的两列表连接策略(因与本申请无关,不再过多介绍),例如在属性图系统Neo4j中就是采用的这种策略。
[0005](2)第二种 ...
【技术保护点】
【技术特征摘要】
1.一种跳跃式连接的优化路径查询方法,其特征在于,包括:针对一个路径边数为n且边标签为的查询语句获取对应的第一子查询语句和第二子查询语句其中,n为大于或等于三的正整数,k1为正整数且表示所述第一子查询语句的路径边数,k2为正整数且表示所述第二子查询语句的路径边数,k1+k2+1=n,所述查询语句所述第一子查询语句和所述第二子查询语句的起始查询点分别只有一条出边,所述查询语句所述第一子查询语句和所述第二子查询语句的终止查询点分别只有一条入边,所述查询语句所述第一子查询语句和所述第二子查询语句的其余查询点分别只有一对入边和出边;根据所述第一子查询语句从目标数据图中查询得到第一子查询匹配结果,以及根据所述第二子查询语句从所述目标数据图中查询得到第二子查询匹配结果,其中,所述第一子查询匹配结果和所述第二子查询匹配结果分别包含有至少一个边匹配结果,所述边匹配结果的起点只有一条出边,所述边匹配结果的终点只有一条入边,所述边匹配结果的其它点分别只有一对入边和出边;从所述第一子查询匹配结果和所述第二子查询匹配结果中,选取一个子查询匹配结果,然后根据该子查询匹配结果中的所有边匹配结果的起点构建一个第一点集合,并对另一子查询匹配结果中的各个边匹配结果的终点进行如下边扩展:针对某个终点,在所述第一点集合中遍历搜索对应的所有扩展点,并在发现能搜索到某个拓展点时,通过扩展连接与所述某个终点对应的边匹配结果和与所述某个扩展点对应的边匹配结果,得到一个与所述查询语句对应的边匹配结果。2.如权利要求1所述的优化路径查询方法,其特征在于,当k1=k2时,所述第一子查询语句和所述第二子查询语句为相同的子查询语句,所述第一子查询匹配结果和所述第二子查询匹配结果为相同的子查询匹配结果;从所述第一子查询匹配结果和所述第二子查询匹配结果中,选取一个子查询匹配结果,包括:从所述第一子查询匹配结果和所述第二子查询匹配结果中,任意选取一个子查询匹配结果。3.如权利要求1所述的优化路径查询方法,其特征在于,当k1≠k2时,所述第一子查询语句和所述第二子查询语句为不同的子查询语句,所述第一子查询匹配结果和所述第二子查询匹配结果为不同的子查询匹配结果;从所述第一子查询匹配结果和所述第二子查询匹配结果中,选取一个子查询匹配结果,包括:从所述第一子查询匹配结果和所述第二子查询匹配结果中,选取边匹配结果总数较多的一个子查询匹配结果。4.如权利要求1所述的优化路径查询方法,其特征在于,针对所述第一子查询语句
或所述第二子查询语句若对应的路径边数为大于或等于三的正整数,则根据对应的子查询语句从目标数据图中查询得到对应的子查询匹配结果,包括:针对子查询语句获取对应的第一孙查询语句和第二孙查询语句其中,所述子查询语句为所述第一子查询语句或所述第二子查询语句k为k1或k2,k
11
为正整数且表示所述第一孙查询语句的路径边数,k
22
为正整数且表示所述第二孙查询语句的路径边数,k
11
+k
22
+1=k,所述第一孙查询语句和所述第二孙查询语句的起始查询点分别只有一条出边,所述第一孙查询语句和所述第二孙查询语句的终止查询点分别只有一条入边,所述第一孙查询语句和所述第二孙查询语句的其余查询点分别只有一对入边和出边;根据所述第一孙查询语句从目标数据图中查询得到第一孙查询匹配结果,以及根据所述第二孙查询语句从所述目标数据图中查询得到第二孙查询匹配结果,其中,所述第一孙查询匹配结果和所述第二孙查询匹配结果分别包含有至少一个边匹配结果,所述边匹配结果的起点只有一条出...
【专利技术属性】
技术研发人员:李艳,彭鹏,李文杰,
申请(专利权)人:北京途普科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。