一种数据血缘图谱显示方法技术

技术编号:39570893 阅读:5 留言:0更新日期:2023-12-03 19:22
本发明专利技术提供了一种数据血缘图谱显示方法

【技术实现步骤摘要】
一种数据血缘图谱显示方法、电子设备及存储介质


[0001]本专利技术涉及计算机技术应用领域,特别是涉及一种数据血缘图谱显示方法

电子设备及存储介质


技术介绍

[0002]随着数据的爆发式增长,数据之间的关系也变得越发复杂

在这样的背景下,具备可塑性

归属性等特征的数据血缘将数据治理过程中发挥越来越大的作用

数据的血缘对于分析数据

跟踪数据的动态演化

衡量数据的可信度

保证数据的质量具有重要的意义

目前,会基于数据血缘分析结果生成数据血缘图谱,以供用户直观知晓数据的流转路径

数据血缘图谱一般由数据节点

处理节点和连接线构成,处理节点用于标记该处理节点连接的上游数据节点流转为下游数据节点所需要的处理方式和处理规则

然而,在一些应用场景中,会存在数据回环情况,例如,某个父节点数据可能在子节点数据通过处理节点后又得到该父节点数据,这种情况下,一般是将两个相同的节点数据通过连接线进行回连

然而,这种通过连接线进行回连的方式,在节点数较多或者血缘层级较多的情况下,会增加显示难度和导致可视化效果差,导致难以准确知晓具有回连关系的两个数据节点,影响用户体验


技术实现思路

[0003]针对上述技术问题,本专利技术采用的技术方案为:
[0004]本专利技术实施例提供一种数据血缘图谱显示方法,所述方法包括如下步骤:
[0005]S100
,基于用户在预设数据血缘图谱上选择的中心节点,生成对应的基础数据血缘图;所述预设数据血缘图谱包括数据节点和处理节点以及连接数据节点和处理节点的连接线,所述连接线具有方向;
[0006]S200
,基于用户对当前数据血缘图的点击操作,更新当前数据血缘图;
[0007]S300
,如果当前数据血缘图中存在回连线,并且,如果
m

D2
,或者
D1

m≤D2
,并且,
n

D3
,则在当前数据血缘图中的回连处理节点后侧增加与对应的回连数据节点对应的虚拟数据节点,并将所述虚拟数据节点与所述回连处理节点连接,并且删除所述回连线;所述回连数据节点和所述回连处理节点分别为通过所述回连线连接的数据节点和处理节点,所述回连线的方向与当前数据血缘图中的数据流转方向相反;
m
为当前数据血缘图中的节点数量,
n
为当前数据血缘图中的层级数,
D1、D2

D3
分别为第一预设值至第三预设值

[0008]本专利技术实施例提供一种非瞬时性计算机可读存储介质,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如前述方法

[0009]本专利技术实施例还提供一种电子设备,包括处理器和前述的非瞬时性计算机可读存储介质

[0010]本专利技术至少具有以下有益效果:
[0011]本专利技术实施例提供的数据血缘图谱显示方法,在显示的数据血缘图中存在回环情况时,如果数据血缘图的节点数量和层级数满足预设条件,则会将回连线进行删除,通过增加对应的虚拟节点进行显示,如此,能够避免节点数较多或者血缘层级较多的情况下,所导致的数据血缘图混乱

可视化效果差的问题

附图说明
[0012]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

[0013]图1为本专利技术实施例提供的数据血缘图谱显示方法的流程图

具体实施方式
[0014]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚

完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例

基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围

[0015]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述指定的顺序或先后次序

应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施

此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程

方法

系统

产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程

方法

产品或设备固有的其它步骤或单元

[0016]本专利技术实施例提供一种数据血缘图谱显示方法,技术思想在于,在数据血缘图谱存在回环情况时,基于当前显示的数据血缘图的节点数量和层级数,对当前显示的数据血缘图进行调整,以避免由于节点数较多或者血缘层级较多的情况下,所导致的数据血缘图混乱

可视化效果差的问题

[0017]进一步地,如图1所示,本专利技术实施例提供的数据血缘图谱显示方法可包括如下步骤:
[0018]S100
,基于用户在预设数据血缘图谱上选择的中心节点,生成对应的基础数据血缘图;所述预设数据血缘图谱包括数据节点和处理节点以及连接数据节点和处理节点的连接线,所述连接线具有方向

连接线可为直线或者弧线

[0019]在本专利技术实施例中,所述预设数据血缘图谱可基于预设空间中的数据生成

预设空间可为自定义空间,例如数据处理平台

[0020]在本专利技术实施例中,数据节点可包括结构化数据节点和非结构化数据节点

结构化数据节点可包括数据表节点
(MySQL、Oracle、Hive、PostgreSQL、HBase、SQLServer、Impala、ClickHouse、Iceberg、Jdbc、MongoDB

)、
数据表字段节点
、API
数据节点等,非结构化数据节点可包括文件节点
(HDFS、FTP、SFTP、Codis、S3、ODPS、HETU、LocalFile、JuiceFS、
OwnCloud

)、
消息队列节点
...

【技术保护点】

【技术特征摘要】
1.
一种数据血缘图谱显示方法,其特征在于,所述方法包括如下步骤:
S100
,基于用户在预设数据血缘图谱上选择的中心节点,生成对应的基础数据血缘图;所述预设数据血缘图谱包括数据节点和处理节点以及连接数据节点和处理节点的连接线,所述连接线具有方向;
S200
,基于用户对当前数据血缘图的点击操作,更新当前数据血缘图;
S300
,如果当前数据血缘图中存在回连线,并且,如果
m

D2
,或者
D1

m≤D2
,并且,
n

D3
,则在当前数据血缘图中的回连处理节点后侧增加与对应的回连数据节点对应的虚拟数据节点,并将所述虚拟数据节点与所述回连处理节点连接,并且删除所述回连线;所述回连数据节点和所述回连处理节点分别为通过所述回连线连接的数据节点和处理节点,所述回连线的方向与当前数据血缘图中的数据流转方向相反;
m
为当前数据血缘图中的节点数量,
n
为当前数据血缘图中的层级数,
D1、D2

D3
分别为第一预设值至第三预设值
。2.
根据权利要求1所述的方法,其特征在于,
S200
具体包括:
S201
,基于用户对当前数据血缘图的点击操作,在当前数据血缘图中增加对应的节点;
S202
,如果当前数据血缘图中的节点数量大于预设阈值,则将所述点击操作对应的节点作为新的中心节点,并将当前数据血缘图中除所述新的中心节点对应的基础数据血缘图外的其它节点隐藏
。3.
根据权利要求1所述的方法,其特征在于,如果中心节点为数据节点,对应的基础数据血缘图包括位于该中心节点上游的数据节点和处理节点以及位于该中心节点下游的数据节点和处理节点;如果中心节点为处理节点,对应的基础数据血缘...

【专利技术属性】
技术研发人员:吕观祥郑书磊叶新江刘东阳
申请(专利权)人:杭州西湖数据智能研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1