System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 面向关系型数据库的图数据查询方法及装置制造方法及图纸_技高网

面向关系型数据库的图数据查询方法及装置制造方法及图纸

技术编号:42569712 阅读:6 留言:0更新日期:2024-08-29 00:36
本发明专利技术涉及一种面向关系型数据库的图数据查询方法及装置。该方法的步骤包括:首先根据关系型数据库提取图结构,然后根据图结构提取单元得到的关系型数据库的图结构,将图查询转为SQL查询。本发明专利技术通过在关系型数据库中实现高效的图算法和查询优化策略,将图的顶点集和边集映射到关系表中,解决了在关系型数据库中原位数据的图查询问题。本发明专利技术以用户查询需求为导向,结合对原关系型源数据库的结构,对查询语法进行优化,并且根据图查询的特点对关系型数据库进行特定的优化。

【技术实现步骤摘要】

本专利技术涉及图数据、大数据技术、数据库技术等领域,提出一种面向关系型数据库的图数据查询方法及装置


技术介绍

1、在各个广泛的应用领域中,关系型数据库扮演着不可或缺的角色,成为最主流且被广泛采用的数据库类型。其应用范围覆盖了企业级系统以及各行各业的信息管理和数据存储需求。以其结构化的数据存储方式和强大的查询语言为特点,关系型数据库为企业、政府机构和各类组织提供了可靠高效的数据管理解决方案。即便在当前技术环境下,关系型数据库仍然是许多业务和组织优先选择的数据库类型,为数据的组织、存储和检索提供了坚实的基础。

2、随着信息技术的不断演变,图数据逐渐显现出巨大的社会和商业价值。这种数据形式不仅能深入挖掘社交网络中用户之间复杂的关系,还能在物流运输中实现路径的优化,甚至在金融网络中进行信贷危机的回归分析。为了应对这一趋势,国内外众多商业公司和开源组织纷纷将关注点聚焦在大规模图数据存储和处理等相关技术上,成功地应用于信息检索、推荐系统、数据挖掘等领域,取得了显著的成就。

3、然而,尽管图数据通常存储在关系型数据库中,关系型数据库并不直接支持高效的图查询,从而在处理图数据时性能和效率面临挑战。同时,将数据迁移到专门设计的用于图查询的图数据库上存在事务原子性和一致性保障的不足,且迁移过程涉及庞大的时间和空间成本。

4、在这个背景下,现有研究有两种方法:一种方法只是向用户公开一个独立的图查询层,并实现一个翻译组件,该组件输出查询的sql版本,对关系型数据库管理系统的查询处理器进行最小或无修改。这种方法不着重于性能,通常用于特定的商业数据库。第二种方法引入了一个新的专门用于图的查询处理器,与关系型数据库管理系统的现有处理器共存。将sql进行扩展,使用新的图特定运算符,如edgescan和pathscan。查询引用图特定构造的部分编译成这些专用图运算符,而查询的非图部分编译成关系型数据库管理系统的现有运算符。但是也存在用户需要适应新的扩展语言。并且各类扩展语法规则没有统一的标准。


技术实现思路

1、为了提高关系型数据库处理图查询的能力,本方法提出了一种基于最优化的图查询加速技术。该技术通过在关系型数据库中实现高效的图算法和查询优化策略,以加速图查询操作,并设计查询方法让其支持图查询,解决了在存放于关系型数据库的原位数据的图查询问题。

2、本专利技术的技术方案如下:

3、第一方面,与在图数据库上进行图查询不同,关系型数据库将图的顶点集和边集映射到表中,即在关系型数据库中的一张表可能会包含有图的多个顶点或者是多个关系。所以本专利技术首先提出了一种根据关系型数据库提取图结构的方法,其步骤包括:

4、1)获取关系型数据库的表中的主键个数;

5、2)获取关系型数据库的表中的外键个数以及引用字段;

6、3)基于步骤1)、2)得到的主键个数、外键个数以及引用字段,将关系型数据库的表按照存储的数据类型分为图顶点表与图关系表;

7、4)根据图顶点表与图关系表,生成当前关系型数据库的图结构。

8、其中,在关系型数据库中,存储数据的基本结构被称为“表”(table)。表是由行(记录)和列(字段)组成的二维结构,每行代表一个数据记录,每列代表记录的一个属性。表中的数据通过特定的约束和规则进行组织,以确保数据的完整性和准确性。这些规则包括但不限于:主键、外键。

9、主键是指关系型数据库的表中的一个或多个字段(列),其值能够唯一地标识表中的每一条记录。主键的主要特点和作用如下:

10、1、唯一性:主键的值必须在整个表中是唯一的,不能有重复。这样可以确保每一条记录都可以被准确地识别和访问。

11、2、非空性:主键字段不允许为空(null),因为空值无法保证唯一性。

12、3、索引:通常情况下,数据库系统会自动为主键创建一个索引,以加快查询速度。

13、4、标识作用:主键作为记录的唯一标识,可以方便地与其他表通过外键进行关联。

14、外键是指关系型数据库的表中的字段(或字段组合),它是另一个表的主键的引用。外键的主要特点和作用如下:

15、1、引用完整性:外键约束确保了表之间的数据一致性和引用完整性。如果一个外键值在其所引用的主键表中不存在,那么这个外键值就不能被插入或更新。

16、2、关联查询:外键使得不同表之间的数据可以进行关联查询,通过外键可以快速找到相关联的记录。

17、3、级联操作:外键可以定义级联更新或删除操作,当主键表中的记录被更新或删除时,相关联的外键记录可以自动进行相应的操作。

18、4、数据约束:外键作为一种约束,有助于维护数据库的数据完整性和准确性。

19、进一步地,上述方法将关系型数据库中的表映射为图结构,需要通过表结构以及主键和外键约束来推断表中数据之间的关系。其中表结构指的是一组相关的数据库对象的集合,这些对象可以包括表(tables)、视图(views)、索引(indexes)、存储过程(storedprocedures)、触发器(triggers)以及其他类型的数据库结构。

20、进一步地,所述将关系型数据库的表按照存储的数据类型分为图顶点表与图关系表,包括:

21、1)图顶点表:当一个表中存在主键时,这张表就被认为是存储顶点信息的表,即图顶点表。

22、2)图关系表:a)当一个表中具有一个主键以及一个外键,那么这张表会被认为是图关系表,即同时存储了图顶点信息与图关系信息;b)当一个表中存在k(k>=2)个外键时,这张表会被认为是种图关系表,其中每一对外键构成了一种图关系表。

23、进一步地,步骤4)根据遍历的结果生成该关系型数据库的图结构,需要记录的内容如下;

24、1)图顶点信息结构:url字段用于记录数据库连接,table_name字段用于记录存放该顶点信息的表,id字段用于记录存放该顶点信息的表的主键名,label字段用于记录该图顶点的标签,properties字段用于记录存放该顶点信息的表的其他属性。

25、2)图关系信息结构:url字段用于记录数据库连接,table_name字段用于记录存放该关系信息的表,src_fk字段用于记录第一个外键,并且如果第一个外键是有向的,该字段对应的是起始顶点,src_table字段用于记录第一个外键对应的表名,dst_fk字段用于记录第二个外键,并且如果第二个外键是有向的,该字段对应的是目的顶点,dst_table字段用于记录第二个外键对应的表名,direction字段用于记录图关系是否有向,label字段用于记录该图顶点的标签,properties字段用于记录存放该顶点信息的表的其他属性。

26、进一步地,特殊的情况下,根据主键和外键约束无法推断关系型数据库中的两个表存在关系,对此做如下处理:

27、1)在某些情况下关系型数据库的两个表之间存在本文档来自技高网...

【技术保护点】

1.一种根据关系型数据库提取图结构的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述将关系型数据库的表按照存储的数据类型分为图顶点表与图关系表,包括:

3.根据权利要求1所述的方法,其特征在于,所述生成关系型数据库的图结构,其中包括记录图顶点信息结构和图关系信息结构;

4.根据权利要求1所述的方法,其特征在于,对于关系型数据库的两个表之间存在逻辑上的顶点与边的关系,但是根据关系型数据库的主键和外键的约束无法推断出两个表间的关系的情况,在指定的两个表后添加图关系信息,并且添加索引;对于在同一张表中存储多个标签,导致同一张表中转化为图结构后对应的的图顶点类型不唯一的情况,对于该表根据标签进行分片,再对分片后的部分添加索引。

5.一种在关系型数据库上进行图查询的方法,其特征在于,该方法根据权利要求1~4中任一项所述方法得到的关系型数据库的图结构,将图查询转为SQL查询,包括按照顶点id对顶点进行查询、按照顶点label查询顶点、按照关系Id查询关系、按照关系顶点查询关系。

6.根据权利要求5所述的方法,其特征在于,所述按照顶点id对顶点进行查询,包括:

7.根据权利要求5所述的方法,其特征在于,所述按照顶点label查询顶点,包括:

8.根据权利要求5所述的方法,其特征在于,所述按照关系Id查询关系,包括:

9.根据权利要求5所述的方法,其特征在于,所述按照关系顶点查询关系,包括:

10.一种面向关系型数据库的图数据查询装置,其特征在于,包括:

...

【技术特征摘要】

1.一种根据关系型数据库提取图结构的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述将关系型数据库的表按照存储的数据类型分为图顶点表与图关系表,包括:

3.根据权利要求1所述的方法,其特征在于,所述生成关系型数据库的图结构,其中包括记录图顶点信息结构和图关系信息结构;

4.根据权利要求1所述的方法,其特征在于,对于关系型数据库的两个表之间存在逻辑上的顶点与边的关系,但是根据关系型数据库的主键和外键的约束无法推断出两个表间的关系的情况,在指定的两个表后添加图关系信息,并且添加索引;对于在同一张表中存储多个标签,导致同一张表中转化为图结构后对应的的图顶点类型不唯一的情况,对于该表根据标签进行分片,再对分片后的部分添加索引。

【专利技术属性】
技术研发人员:胡川王华进王开南
申请(专利权)人:中国科学院计算机网络信息中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1