当前位置: 首页 > 专利查询>清华大学专利>正文

一种用于数据分析的访问控制规则描述方法技术

技术编号:14420908 阅读:141 留言:0更新日期:2017-01-12 23:13
本发明专利技术提供一种用于数据分析的访问控制规则描述方法,包括:S1,根据应用场景将用户角色分割为一个或多个角色单元,以及将数据资源分割为一个或多个数据元;S2,将用户角色组织成层次结构的形式,其中中间节点包含了其所有后代节点对应的角色单元,其中叶子节点则对应某个应用场景下所述角色单元所对应的具体人员;将数据资源组织成层次结构的形式,其中中间节点包含了其所有后代节点对应的数据元,叶子节点则对应了一组现实数据;S3,为每个数据资源指定一组动作;S4,基于用户角色、数据资源和动作,描述对数据资源的访问进行控制的访问控制规则。本发明专利技术支持对数据资源的同时访问进行控制,并可要求对数据资源进行特定的脱敏操作。

【技术实现步骤摘要】

本专利技术涉及数据资源权限管理控制
,尤其涉及一种用于数据分析的访问控制规则描述方法
技术介绍
数据分析是指用适当的统计分析方法,从数据中提出有用信息和结论的过程。随着云计算、大数据等相关技术的发展,越来越多的企业和机构开始利用数据分析技术挖掘商业数据中的价值。典型的应用场景包括零售企业、医疗机构和社交网络等。然而,商业数据中通常包含许多敏感信息,例如用户个人信息和商业机密信息。为了保护商业数据的安全,需要对数据访问进行控制。访问控制技术通过控制访问权限的方式保证资源不被非法使用和访问。为了利用访问控制技术保护商业数据,管理员首先需要利用计算机可以处理的访问控制语言编写访问控制规则。目前,一些常见的访问控制模型或语言包括RBAC(RoleBasedAccessControl,基于角色的访问控制)和XACML(eXtensibleAcessControlMarkupLanguage,可扩展的访问控制标记语言)。在RBAC中,每条访问控制规则禁止或允许具有某种角色的用户访问某种数据资源。XACML则支持更加丰富的语法元素,其中每条访问控制规则允许或禁止某些用户在某种条件下以何种动作访问某种数据资源。然而,对于数据分析场景,目前的访问控制技术存在如下两点问题。第一,现有的访问控制技术通常假设数据资源是独立的,因而难以对多种数据的同时访问进行控制。但数据分析脚本通常会同时访问多种数据资源以进行统计分析,并且数据资源之间也可能存在关联信息。例如,当同时访问顾客住址和销售记录时,数据分析人员不仅会得到这两种信息,也有可能额外得到每个住址的顾客所购买的商品记录。因此,在数据分析中,不仅需要对单独的数据资源进行控制,也需要考虑对多种数据资源的同时访问进行控制。第二,现有的访问控制技术通常只支持对数据资源访问的直接授权,而不能要求在数据资源上进行特定的操作。但数据分析脚本本质上是计算机程序,并且通常会对数据资源进行某些操作以去除其中的敏感信息,例如求和、平均和截断操作等。因此,为了更精确的对数据资源访问进行授权,也需要将这些脱敏操作考虑在内。
技术实现思路
本专利技术的目的是基于现有访问控制技术的上述两个问题,提出一种适用于数据分析的访问控制规则描述方法,其支持对数据资源的同时访问进行控制,并可以要求对数据资源进行特定的脱敏操作,因此通过其能够更精确地对数据资源访问进行控制。为实现以上目的,本专利技术的一种用于数据分析的访问控制规则描述方法,具体包括以下步骤:S1,根据应用场景将用户角色分割为一个或多个角色单元,以及将数据资源分割为一个或多个数据元;S2,将用户角色组织成层次结构的形式,其中中间节点包含了其所有后代节点对应的角色单元,其中叶子节点则对应某个应用场景下所述角色单元所对应的具体人员;将数据资源组织成层次结构的形式,其中中间节点包含了其所有后代节点对应的数据元,叶子节点则对应了一组现实数据;S3,为每个数据资源指定对应一组动作;S4,基于所述用户角色、数据资源和动作,描述对数据资源的访问进行控制的访问控制规则。优选地,所述具体人员为对应某个应用场景下的数据分析人员。优选地,所述动作包括:访问动作、输出动作和条件判断动作;所述访问动作则表示数据资源被输出或者用在条件判断中;所述输出动作表示某个数据资源被输出到最终结果中;所述条件判断动作表示某个数据资源被用在条件判断中,但没有被直接输出。优选地,所述访问控制规则包括:用户角色、数据资源和限制;并要求当用户同时访问一组数据资源时,必须按照所述限制对数据资源进行相应的脱敏操作。优选地,所述限制包括:直接禁止数据分析脚本;或者,根据条件判断动作进行一个或多个脱敏限制。优选地,所述脱敏限制为访问控制规则中的每个数据资源关联一组脱敏操作,并要求该数据资源以其中的某一个脱敏操作进行脱敏;所述脱敏限制中引用的脱敏操作被对应的数据资源所支持。本专利技术还提供一种用于数据分析的访问控制方法,其在接收到数据分析的访问请求时,基于上述访问控制规则进行访问控制。由上述本专利技术的技术方案可以看出,本专利技术具有如下技术效果:相比于现有的访问控制技术,本专利技术提出的访问控制规则描述方法结合了数据分析脚本的特点,支持对数据资源的同时访问进行控制,并可以要求对数据资源进行特定的脱敏操作。因此,该方法可以更加灵活、精确的描述用于数据分析的访问控制规则,并更加适用于数据分析场景。附图说明附图1为本专利技术的一种用于数据分析的访问控制规则描述方法流程图;附图2为用户角色层次结构的示意图;附图3为数据资源层次结构的示意图。具体实施方式本专利技术提出的是一种适用于数据分析的访问控制规则描述方法,结合附图和实施例说明如下。如图1所示,该方法包含以下步骤:步骤S1:根据应用场景将用户角色分割为一个或多个角色单元,以及将数据资源分割为一个或多个数据元;将其中一个角色单元对应数据分析人员;将其中一个数据元对应一组现实数据。步骤S2:将用户角色组织成层次结构的形式,其中中间节点包含了其所有后代节点对应的角色单元,其中叶子节点则对应某个应用场景下所述角色单元所对应的具体人员;将数据资源组织成层次结构的形式,其中中间节点包含了其所有后代节点对应的数据元,叶子节点则对应了一组现实数据。定义用户角色。每个用户角色对应了现实中的一组数据分析人员。在编写访问控制规则时,可以对定义的用户角色进行引用。同时,可以将用户角色组织为层次结构的形式。其中,中间节点用于组织节点间的层次关系,并且包含了其所有的后代节点对应的用户角色;叶子节点则对应现实中的数据分析人员。例如,图2给出了用户角色层次结构的示例。其中,顶层的用户角色Analyst对应了所有的数据分析人员。基于数据分析人员所分配的任务,Analyst又被进一步分为ReportAnalyst、MarketingAnalyst和AdvertiseAnalyst下一级层次的数据分析人员。定义数据资源。每个数据资源对应了一类现实数据。在编写访问控制规则时,同样可以对定义的数据资源进行引用。类似的,也可以将数据资源组织为层次结构的形式。其中,中间节点用于组织节点间的层次关系,并且包含了其所有后代节点对应的数据资源;叶子节点则对应了现实数据。在定义数据资源时,也可以定义数据资源支持的脱敏操作。脱敏操作用于去除数据资源的敏感信息,使其可以安全访问。当数据资源被组织成层次结构的形式时,一个中间节点支持的脱敏操作自动被其所有的后代节点所支持。例如,图3给出了顾客个人信息相关的数据资源层次结构示例。其中,All代表了所有的数据资源,根据应用场景,其又被进一步分为KeyAttribute、QuasiIdentifier和SensitiveAttribute。KeyAttribute代表了可以唯一定位个体的数据资源,例如姓名和电话号码。QuasiIdentifier表示那些当组合在一起访问时有可能定位个体的数据资源,例如一个组合为生日、邮政编码和性别。SensitiveAttribute表示顾客敏感信息相关的数据资源,例如顾客购买的商品Sale_Item及价格Sale_Price。对于销售价格Sale_Price,其脱敏操作可以是聚合操作,例如avg(平均)、sum(求和)、max(取大)和min(取小)等。而对本文档来自技高网
...
一种用于数据分析的访问控制规则描述方法

【技术保护点】
一种用于数据分析的访问控制规则描述方法,其特征在于,所述方法包括:S1,根据应用场景将用户角色分割为一个或多个角色单元,以及将数据资源分割为一个或多个数据元;S2,将用户角色组织成层次结构的形式,其中中间节点包含了其所有后代节点对应的角色单元,其中叶子节点则对应某个应用场景下所述角色单元所对应的具体人员;将数据资源组织成层次结构的形式,其中中间节点包含了其所有后代节点对应的数据元,叶子节点则对应了一组现实数据;S3,为每个数据资源指定对应一组动作;S4,基于所述用户角色、数据资源和动作,描述对数据资源的访问进行控制的访问控制规则。

【技术特征摘要】
1.一种用于数据分析的访问控制规则描述方法,其特征在于,所述方法包括:S1,根据应用场景将用户角色分割为一个或多个角色单元,以及将数据资源分割为一个或多个数据元;S2,将用户角色组织成层次结构的形式,其中中间节点包含了其所有后代节点对应的角色单元,其中叶子节点则对应某个应用场景下所述角色单元所对应的具体人员;将数据资源组织成层次结构的形式,其中中间节点包含了其所有后代节点对应的数据元,叶子节点则对应了一组现实数据;S3,为每个数据资源指定对应一组动作;S4,基于所述用户角色、数据资源和动作,描述对数据资源的访问进行控制的访问控制规则。2.根据权利要求1所述的一种用于数据分析的访问控制规则描述方法,其特征在于,所述具体人员为对应某个应用场景下的数据分析人员。3.根据权利要求1或2所述的一种用于数据分析的访问控制规则描述方法,其特征在于,所述动作包括:访问动作、输出动作和条件判断动作;所述访问动作则表示数据资源被输出或者用在条件判断中;所述输...

【专利技术属性】
技术研发人员:贺飞罗晨
申请(专利权)人:清华大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1