过滤数据沿袭图制造技术

技术编号:16388532 阅读:63 留言:0更新日期:2017-10-16 09:01
管理沿袭信息包括处理多个节点(102、104、106)中第一节点的数据沿袭表示请求。该处理包括:确定该第一节点与多个标签标识符中的至少第一标签标识符之间的关联关系;确定第一子集,该第一子集是第一标签标识符多个可能标签值中的至少一个标签值且少于第一标签标识符多个可能标签值的全部;以及沿着有向链路的第一沿袭路径从第一节点遍历多个节点,以确定第一节点的数据沿袭。确定数据沿袭包括,对于每个被遍历的节点(350),至少部分基于与被遍历的节点相关联的任何标签标识符或标签值,确定是将被遍历的节点添加(356)至数据沿袭,还是将被遍历的节点从数据沿袭排除(360)。

【技术实现步骤摘要】
【国外来华专利技术】过滤数据沿袭图相关申请的交叉引用本申请要求于2015年2月11日提交的序号为62/114,684的美国申请的优先权。
本说明书涉及用于过滤数据沿袭(datalineage)图的沿袭标签。
技术介绍
在数据处理系统中,某些类型的用户通常期望能够访问贯穿系统的数据沿袭的视觉表示。这样的“数据沿袭图”可以包括系统中的数据和用于处理该数据实体的图形表示以及它们之间的依赖关系。通常,在许多用途中,可以使用这些数据沿袭图来降低风险,验证合规性义务(regulatorycomplianceobligation),提高业务流程效率以及保护数据。重要的是数据沿袭图是正确且完整的。能够产生并显示数据沿袭图的一些系统能够自动呈现端到端的数据沿袭图,这些数据沿袭图示出数据项的表示,并且显示表示了用于消耗或生成这些数据项的处理实体的项的表示。在一些示例中,特定项上游的沿袭路径有时称为该项的“依赖性沿袭(dependencylineage)”,并且特定项下游的沿袭路径有时称为该项的“影响沿袭(impactlineage)”。在其他示例中,特定项上游的沿袭路径被称为“沿袭”或“依赖性”,并且特定项下游的沿袭路径称为“影响”或“影响分析”。如本文所使用的,“数据沿袭图”可以包括相对于任意给定项的上游依赖性沿袭和/或下游影响性沿袭。能够生成并显示数据沿袭图的一些系统允许用户将数据沿袭图中项的逻辑和/或物理组分解成单个元素。能够生成并显示数据沿袭图的一些系统能够通过丰富的数据信息(如数据质量评分)来增强数据沿袭图。
技术实现思路
在一个方案中,通常,一种用于在计算系统中管理沿袭信息的方法,所述方法包括:在数据存储系统中存储有向图的规范,所述有向图的规范包括多个节点和有向链路,所述有向链路表示所述多个节点之间的相应的沿袭关系,所述多个节点中的至少一些节点与多个标签标识符中的一个或多个标签标识符相关联,所述多个标签标识符中的至少一个标签标识符具有多个可能标签值;使用至少一个处理器来处理针对所述多个节点中第一节点的数据沿袭表示请求。所述处理包括:确定所述第一节点与所述多个标签标识符中至少第一标签标识符之间的关联关系,并且确定第一子集,所述第一子集是所述第一标签标识符的多个可能标签值中的至少一个标签值并且少于所述第一标签标识符的多个可能标签值的全部标签值;以及沿着从所述第一节点开始的有向链路的第一沿袭路径遍历各节点,以确定所述第一节点的数据沿袭。所述数据沿袭包括(1)依赖性沿袭和(2)影响沿袭中的一个或两个,所述依赖性沿袭由所述第一节点上游的有向链路的单向上游沿袭路径构成,所述影响沿袭由所述第一节点下游的有向链路的单向下游沿袭路径构成。确定所述数据沿袭包括,对于每个被遍历的节点,至少部分基于与所述被遍历的节点相关联的任何标签标识符或标签值,确定是将所述被遍历的节点添加至所述数据沿袭还是将所述被遍历的节点从所述数据沿袭中排除。方案可以包括一个或多个下述特征。确定所述数据沿袭包括:针对每个被遍历的节点:如果所述被遍历的节点不与所述第一标签标识符相关联,或者所述被遍历的节点与所述第一标签标识符相关联且与所述第一子集的至少一个标签值相关联,则将所述被遍历的节点添加至所述数据沿袭;或者如果所述被遍历的节点与所述第一标签标识符相关联但不与所述第一标签标识符的多个可能标签值中第一子集的至少一个标签值相关联,则将所述被遍历的节点从所述数据沿袭中排除。在从所述数据沿袭中排除所述被遍历的节点时,终止所述第一沿袭路径的遍历。该方法可以包括:在遍历所述多个节点中的各节点之前分析所述多个节点,以确定与所述第一标签标识符相关联但不与所述第一标签标识符的多个可能标签值第一子集中的至少一个标签值相关联的所述多个节点的第一子集。确定是将所述被遍历的节点添加至所述数据沿袭还是从所述数据沿袭中排除所述被遍历的节点包括确定所述被遍历的节点是否包括在所述多个节点的第一子集中。确定是否将所述被遍历的节点添加至所述数据沿袭包括:如果所述被遍历的节点不包括在所述多个节点的第一子集中,则将所述被遍历的节点添加至所述数据沿袭;如果被遍历的节点包括在所述多个节点的第一子集中,则从所述数据沿袭中排除所述被遍历的节点。所述多个节点中的至少一些节点嵌套在所述多个节点中的其他节点内。与所述节点嵌套层级中较低级别的节点相关联的标签标识符及其相关联的标签值的子集优先于与节点嵌套层级中较高级别的节点相关联的标签标识符及其相关联的标签值的子集。沿所述第一沿袭路径遍历多个节点包括从所述第一节点开始沿着与所述有向链路的方向相反的方向遍历多个节点。该方法还可以包括生成所述有向图的规范,其中,所述多个节点中的一个或多个节点表示计算,所述多个节点中的一个或多个节点表示执行计算的过程中通过所述计算接收或产生的数据元素,以及所述有向链路表示计算与数据元素之间的沿袭关系。所述多个节点中的一个或多个节点表示所述多个节点中的一个或多个其他节点的分组。所述第一标签标识符的多个可能标签值的第一子集由与所述第一节点相关联的一个或多个标签值构成。所述第一标签标识符的多个可能标签值的第一子集由从用户输入所接收的一个或多个标签值构成。该方法还可以包括:从所述第一节点开始沿有向链路的多个沿袭路径遍历多个节点,以确定所述第一节点的数据沿袭,其中确定所述数据沿袭包括:对于每个被编列的节点,至少部分基于与所述被遍历的节点相关联的任何标签标识符或标签值,确定是将所述被遍历的节点添加至所述数据沿袭,还是从所述数据沿袭中排除所述被遍历的节点。该方法还包括:默认将所述第一节点添加至所述数据沿袭。在其他方案中,一般而言,提供了存储在计算机可读介质上的软件,用于管理计算系统中的沿袭信息,所述软件包括用于使计算系统执行以下操作的指令:在数据存储系统中存储有向图的规范,所述有向图的规范包括多个节点和有向链路,所述有向链路表示所述多个节点之间的相应的沿袭关系,所述多个节点中的至少一些节点与多个标签标识符中的一个或多个标签标识符相关联,所述多个标签标识符中的至少一个标签标识符具有多个可能标签值;使用至少一个处理器来处理针对所述多个节点中第一节点的数据沿袭表示请求。所述处理包括:确定所述第一节点与所述多个标签标识符中至少第一标签标识符之间的关联关系,并且确定第一子集,所述第一子集是所述第一标签标识符的多个可能标签值中的至少一个标签值并且少于所述第一标签标识符的多个可能标签值的全部标签值;以及沿着从所述第一节点开始的有向链路的第一沿袭路径遍历各节点,以确定所述第一节点的数据沿袭,其中,所述数据沿袭包括(1)依赖性沿袭和(2)影响沿袭中的一个或两个,所述依赖性沿袭由所述第一节点上游的有向链路的单向上游沿袭路径构成,所述影响沿袭由所述第一节点下游的有向链路的单向下游沿袭路径构成,其中确定所述数据沿袭包括,对于每个被遍历的节点,至少部分基于与所述被遍历的节点相关联的任何标签标识符或标签值,确定是将所述被遍历的节点添加至所述数据沿袭还是将所述被遍历的节点从所述数据沿袭中排除。在另一个方案中,一般而言,一种计算系统,用于管理沿袭信息,所述计算系统包括:数据存储系统,用于存储有向图的规范,所述有向图的规范包括多个节点和有向链路,所述有向链路表示所述多个节点之间的相应的沿袭关系,本文档来自技高网...
过滤数据沿袭图

【技术保护点】
一种用于在计算系统中管理沿袭信息的方法,所述方法包括:在数据存储系统中存储有向图的规范,所述有向图的规范包括多个节点和有向链路,所述有向链路表示所述多个节点之间的相应的沿袭关系,所述多个节点中的至少一些节点与多个标签标识符中的一个或多个标签标识符相关联,所述多个标签标识符中的至少一个标签标识符具有多个可能标签值;使用至少一个处理器来处理针对所述多个节点中第一节点的数据沿袭表示请求,所述处理包括:确定所述第一节点与所述多个标签标识符中至少第一标签标识符之间的关联关系,并且确定第一子集,所述第一子集是所述第一标签标识符的多个可能标签值中的至少一个标签值并且少于所述第一标签标识符的多个可能标签值的全部标签值;以及沿着从所述第一节点开始的有向链路的第一沿袭路径遍历各节点,以确定所述第一节点的数据沿袭,其中,所述数据沿袭包括(1)依赖性沿袭和(2)影响沿袭中的一个或两个,所述依赖性沿袭由所述第一节点上游的有向链路的单向上游沿袭路径构成,所述影响沿袭由所述第一节点下游的有向链路的单向下游沿袭路径构成,其中确定所述数据沿袭包括,对于每个被遍历的节点,至少部分基于与所述被遍历的节点相关联的任何标签标识符或标签值,确定是将所述被遍历的节点添加至所述数据沿袭还是将所述被遍历的节点从所述数据沿袭中排除。...

【技术特征摘要】
【国外来华专利技术】2015.02.11 US 62/114,6841.一种用于在计算系统中管理沿袭信息的方法,所述方法包括:在数据存储系统中存储有向图的规范,所述有向图的规范包括多个节点和有向链路,所述有向链路表示所述多个节点之间的相应的沿袭关系,所述多个节点中的至少一些节点与多个标签标识符中的一个或多个标签标识符相关联,所述多个标签标识符中的至少一个标签标识符具有多个可能标签值;使用至少一个处理器来处理针对所述多个节点中第一节点的数据沿袭表示请求,所述处理包括:确定所述第一节点与所述多个标签标识符中至少第一标签标识符之间的关联关系,并且确定第一子集,所述第一子集是所述第一标签标识符的多个可能标签值中的至少一个标签值并且少于所述第一标签标识符的多个可能标签值的全部标签值;以及沿着从所述第一节点开始的有向链路的第一沿袭路径遍历各节点,以确定所述第一节点的数据沿袭,其中,所述数据沿袭包括(1)依赖性沿袭和(2)影响沿袭中的一个或两个,所述依赖性沿袭由所述第一节点上游的有向链路的单向上游沿袭路径构成,所述影响沿袭由所述第一节点下游的有向链路的单向下游沿袭路径构成,其中确定所述数据沿袭包括,对于每个被遍历的节点,至少部分基于与所述被遍历的节点相关联的任何标签标识符或标签值,确定是将所述被遍历的节点添加至所述数据沿袭还是将所述被遍历的节点从所述数据沿袭中排除。2.根据权利要求1所述的方法,其中,确定所述数据沿袭包括:针对每个被遍历的节点:如果所述被遍历的节点不与所述第一标签标识符相关联,或者所述被遍历的节点与所述第一标签标识符相关联且与所述第一子集的至少一个标签值相关联,则将所述被遍历的节点添加至所述数据沿袭;或者如果所述被遍历的节点与所述第一标签标识符相关联但不与所述第一标签标识符的多个可能标签值中第一子集的至少一个标签值相关联,则将所述被遍历的节点从所述数据沿袭中排除。3.根据权利要求2所述的方法,还包括:在从所述数据沿袭中排除所述被遍历的节点时,终止所述第一沿袭路径的遍历。4.根据权利要求1所述的方法,还包括:在遍历所述多个节点中的各节点之前分析所述多个节点,以确定与所述第一标签标识符相关联但不与所述第一标签标识符的多个可能标签值第一子集中的至少一个标签值相关联的所述多个节点的第一子集。5.根据权利要求4所述的方法,其中,确定是将所述被遍历的节点添加至所述数据沿袭还是从所述数据沿袭中排除所述被遍历的节点包括确定所述被遍历的节点是否包括在所述多个节点的第一子集中。6.根据权利要求5所述的方法,其中,确定是否将所述被遍历的节点添加至所述数据沿袭包括:如果所述被遍历的节点不包括在所述多个节点的第一子集中,则将所述被遍历的节点添加至所述数据沿袭;如果被遍历的节点包括在所述多个节点的第一子集中,则从所述数据沿袭中排除所述被遍历的节点。7.根据权利要求1所述的方法,其中,所述多个节点中的至少一些节点嵌套在所述多个节点中的其他节点内。8.根据权利要求7所述的方法,其中,相对于与节点嵌套层级中较高级别的节点相关联的标签标识符及其相关联的标签值的子集,与所述节点嵌套层级中较低级别的节点相关联的标签标识符及其相关联的标签值的子集具有优先级。9.根据权利要求1所述的方法,其中,沿所述第一沿袭路径遍历多个节点包括从所述第一节点开始沿着与所述有向链路的方向相反的方向遍历多个节点。10.根据权利要求1所述的方法,还包括:生成所述有向图的规范,其中,所述多个节点中的一个或多个节点表示计算,所述多个节点中的一个或多个节点表示执行计算的过程中通过所述计算接收或产生的数据元素,以及所述有向链路表示计算与数据元素之间的沿袭关系。11.根据权利要求10所述的方法,其中,所述多个节点中的一个或多个节点表示所述多个节点中的一个或多个其他节点的分组。12.根据权利要求1所述的方法,其中,所述第一标签标识符的多个可能标签值的第一子集由与所述第一节点相关联的一个或多个标签值构成。13.根据权利要求1所述的方法,其中,所述第一标签标识符的多个可能标签值的第一子集由从用户输入所接收的一个或多个标签值构成。14.根据权利要求1所述的方法,还包括:从所述第一节点开始沿有向链路的多个沿袭路径遍历多个节点,以确定所述第一节点的数据沿袭,其中确定所述数据沿袭包括:对...

【专利技术属性】
技术研发人员:D·拉迪沃杰维奇
申请(专利权)人:起元科技有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1