一种基于权限的数据脱敏方法技术

技术编号:18723225 阅读:42 留言:0更新日期:2018-08-22 00:44
本发明专利技术涉及一种基于权限的数据脱敏方法,包含如下步骤:步骤1:对原始数据进行敏感数据的识别,并对敏感数据建立脱敏规则;步骤2:定义权限与脱敏规则的对应策略;根据用户的访问权限,控制敏感信息、隐私信息和机密信息的访问权限,根据不同权限对敏感数据的需求,制定与权限相对应的脱敏策略;步骤3:定位脱敏数据;在访问原始数据中的信息过程中,根据敏感数据的特征,定位并识别脱敏数据;步骤4:动态生成脱敏数据;在原始数据输出显示时,根据用户的访问权限对应的脱敏策略对数据进行脱敏输出。

A data desensitization method based on permissions

The invention relates to a privilege-based data desensitization method, which comprises the following steps: step 1: identifying the sensitive data from the original data and establishing desensitization rules for the sensitive data; step 2: defining the corresponding policies of privileges and desensitization rules; and controlling sensitive information, privacy information and confidentiality according to the user's access privileges. Information access authority, according to the different rights of sensitive data needs, to develop the corresponding authority desensitization strategy; Step 3: Locate desensitization data; In the process of access to the original data, according to the characteristics of sensitive data, locate and identify desensitization data; Step 4: Dynamic generation of desensitization data; In the original data transmission When the display is displayed, the desensitization strategy is used to desensitization the data according to the desensitization strategy corresponding to the user's access rights.

【技术实现步骤摘要】
一种基于权限的数据脱敏方法
本专利技术属于数据处理
,具体涉及一种基于权限的数据脱敏方法。
技术介绍
政府机构、企业和其他组织向外界提供原始数据承受着越来越大的压力,收集的数据包含个人身份信息,如姓名、身份证号、家庭地址等敏感数据,存在着数据共享与隐私保护间的矛盾。数据脱敏对敏感数据变形,是平衡数据共享与隐私保护的矛盾目标的一种方式。数据脱敏技术是存在风险的,需要在数据的实用性、隐私保护之间折中。若彻底的数据脱敏,需要消除用户的所有标识信息,导致数据的潜在分析价值大打折扣;若完全保护用户的隐私数据信息,可以最大化数据的分析价值,但导致用户隐私泄露的风险无法控制。同时,在企业进行大型系统开发、测试过程有时对数据格式有一定要求,若脱敏方法选择不当极有可能导致系统功能不可用。此为现有技术的不足之处。
技术实现思路
本专利技术的目的在于,针对上述现有技术存在的缺陷,提供设计一种基于权限的数据脱敏方法,以解决上述技术问题。为了达到上述目的,本专利技术的技术方案是:一种基于权限的数据脱敏方法,包含如下步骤:步骤1:对原始数据进行敏感数据的识别,并对敏感数据建立脱敏规则;步骤2:定义权限与脱敏规则的对应策略;根据用户的访问权限,控制敏感信息、隐私信息和机密信息的访问权限,根据不同权限对敏感数据的需求,制定与权限相对应的脱敏策略;步骤3:定位脱敏数据;在访问原始数据中的信息过程中,根据敏感数据的特征,定位并识别脱敏数据;步骤4:动态生成脱敏数据;在原始数据输出显示时,根据用户的访问权限对应的脱敏策略对数据进行脱敏输出。进一步的,脱敏规则包括屏蔽、变形、替换、随机、格式保留加密和数据加密算法。进一步的,步骤1中,敏感数据包括固定信息组成的数据、有数据格式的数据和数字信息;固定信息组成的数据,根据数据字典进行替换、数据抑制、数据隐藏,其中采用数据字典的方式时,数据字典必须加密存储;有数据格式的数据,根据数据格式生成满足此格式的随机数据,通过随机数据进行替换,或者采用保持前缀/后缀不变,通过扰乱数据填充后半部分,或者采用格式保留加密方法对数据进行加密;数字信息,可以采用数据隐藏、取整、偏移、映射的方式进行处理,或者通过Hash等算法映射成其他数据。进一步的,数据抑制:使用固定数据、随机数据进行替换;数据隐藏:使用常量进行替换;映射:将数据映射为新值,并保持数据顺序。进一步的,步骤2中,采用基于角色的访问控制RABC定义权限与脱敏规则的对应策略;策略的制定根据权限制定,保证在数据最小化原则上,满足不同权限的用户对数据的需求;脱敏策略由对不同类型敏感数据的脱敏规则组合而成,且数据访问权限与脱敏策略一对一的关系或者多对一的关系。进一步的,步骤3中,原始数据是文件、数据库中包含敏感信息的数据,定位并识别敏感信息通过正则表达式匹配或者算法实现。进一步的,步骤4中,脱敏数据输出对原始敏感数据不作处理,在用户访问时脱敏输出。进一步的,脱敏数据输出对原始敏感数据不作处理,在用户访问时脱敏输出,包括:用户进行数据访问时,根据用户身份确定用户权限,根据用户权限确定脱敏策略,自动识别脱敏数据,通过脱敏策略对数据进行脱敏后输出。进一步的,步骤4中,动态生成脱敏数据时,记录敏感数据的脱敏频率,对脱敏频率较高的数据,在数据访问时对脱敏数据进行预判并预先处理,或者根据脱敏规则分别对数据进行脱敏存储。对敏感数据,如姓名、地址、直接关联到个人的日期、电话号码、电子邮件地址、账号、交易金额、IP地址、车牌号等通用敏感数据,或系统自定义的数据建立脱敏规则。根据用户的访问权限,严格控制敏感信息、隐私信息和机密信息的访问权限。根据不同权限对敏感数据的需求,制定与权限相对应的脱敏策略,在访问原始数据中的信息中,根据敏感数据的特征,定位并识别脱敏数据。在原始数据输出显示时,根据用户的访问权限对应的脱敏策略对数据进行脱敏输出。本专利技术的有益效果在于,本专利技术技术方案根据用户权限和数据的实际使用需求,对数据的敏感性进行处理。此种方法保证敏感信息的动态脱敏,保证隐私安全;同时,针对用户对敏感数据的需求,制定有针对性和区别化的策略,保证敏感数据的可用性。同时,对脱敏数据的处理频率进行统计,在数据访问时,可以进行预判或脱密存储,提高数据访问效率。此外,本专利技术设计原理可靠,结构简单,具有非常广泛的应用前景。由此可见,本专利技术与现有技术相比,具有突出的实质性特点和显著地进步,其实施的有益效果也是显而易见的。附图说明图1为本专利技术实施例提供的一种基于权限的数据脱敏方法示意图。具体实施方式下面结合附图并通过具体实施例对本专利技术进行详细阐述,以下实施例是对本专利技术的解释,而本专利技术并不局限于以下实施方式。如图1所示,本专利技术实施例提供的一种基于权限的数据脱敏方法,对敏感数据,如姓名、地址、直接关联到个人的日期、电话号码、电子邮件地址、账号、交易金额、IP地址、车牌号等通用敏感数据,或系统自定义的数据建立脱敏规则,包含如下步骤:步骤1:建立敏感数据的脱敏规则对敏感数据、用户指定的数据建立脱敏规则,姓名、地址信息等由固定信息组成的数据,可以根据数据字典进行替换、数据抑制(使用固定数据、随机数据进行替换)、数据隐藏(使用常量进行替换),其中若采用数字字典方式,数字字典必须加密存储。身份证、手机号码、电子邮件、日期时间、IP地址、车牌号等有数据格式的数据可通过脱敏生成高仿真的数据,使人无法辨别数据的真伪。对于此类敏感数据可以根据数据格式生成满足此格式的随机数据,通过随机数据进行替换或者采用保持前缀/后缀不变,通过扰乱数据填充后半部分或者采用格式保留加密方法对数据进行加密。若在数据库文件中,此类信息不作为主键数据,此类数据采用数据抑制、数据隐藏等方式进行处理。交易金额、收入等数字信息,可以采用数据隐藏、取整、偏移、映射(将数据映射为新值,并保持数据顺序)等方式进行处理。此种处理方式在一定程度保留了数据的规律性。若避免通过数据的规律性,进行背景攻击、相似性攻击等,可以通过Hash等算法映射成其他数据。步骤2:定义权限与脱敏规则的对应策略采用RABC(Role-BasedAccessControl,基于角色的访问控制)定义权限与脱敏规则的对应策略。脱敏策略由脱敏规则组合而成,对某一类型敏感数据可以选择一种或多种脱敏方法。如进行数据规律统计分析,可以采用保留敏感数据的前缀/后缀,乱数进行替代,或者对数值进行取整、偏移等操作。策略的制定根据权限制定,保证在数据最小化原则上,满足不同权限的用户对数据的需求。步骤3:定位脱敏数据访问原始数据时,根据数据格式或机器学习等方式定位脱敏数据。目前较为通用的方式是正则表达式匹配,适用由数字、字母、符号组成的数据。在数据库中应用,也可以通过字段名称进行定位。对于用户数据,可以通过算法进行数据定位,算法实现语言不限。步骤4:动态生成脱敏数据用户需要进行数据访问时,首先根据用户身份确定用户权限,进而确定脱敏策略。在访问数据时,自动识别脱敏数据,通过脱敏策略对数据进行脱敏后输出。在动态生成脱敏数据时,记录统计某字段/类型的脱敏频率。对于脱敏频率较高的数据,可在数据访问时对脱敏数据进行预判并预先处理,在一定程度可提交数据访问效率;同时也可以根据脱敏规则分别对数据进行脱敏存储。在用户进行数据本文档来自技高网...

【技术保护点】
1.一种基于权限的数据脱敏方法,其特征在于,包含如下步骤:步骤1:对原始数据进行敏感数据的识别,并对敏感数据建立脱敏规则;步骤2:定义权限与脱敏规则的对应策略;根据用户的访问权限,控制敏感信息、隐私信息和机密信息的访问权限,根据不同权限对敏感数据的需求,制定与权限相对应的脱敏策略;步骤3:定位脱敏数据;在访问原始数据中的信息过程中,根据敏感数据的特征,定位并识别脱敏数据;步骤4:动态生成脱敏数据;在原始数据输出显示时,根据用户的访问权限对应的脱敏策略对数据进行脱敏输出。

【技术特征摘要】
1.一种基于权限的数据脱敏方法,其特征在于,包含如下步骤:步骤1:对原始数据进行敏感数据的识别,并对敏感数据建立脱敏规则;步骤2:定义权限与脱敏规则的对应策略;根据用户的访问权限,控制敏感信息、隐私信息和机密信息的访问权限,根据不同权限对敏感数据的需求,制定与权限相对应的脱敏策略;步骤3:定位脱敏数据;在访问原始数据中的信息过程中,根据敏感数据的特征,定位并识别脱敏数据;步骤4:动态生成脱敏数据;在原始数据输出显示时,根据用户的访问权限对应的脱敏策略对数据进行脱敏输出。2.根据权利要求1所述的一种基于权限的数据脱敏方法,其特征在于,脱敏规则包括屏蔽、变形、替换、随机、格式保留加密和数据加密算法。3.根据权利要求1或2所述的一种基于权限的数据脱敏方法,其特征在于,步骤1中,敏感数据包括固定信息组成的数据、有数据格式的数据和数字信息;固定信息组成的数据,根据数据字典进行替换、数据抑制、数据隐藏,其中采用数据字典的方式时,数据字典必须加密存储;有数据格式的数据,根据数据格式生成满足此格式的随机数据,通过随机数据进行替换,或者采用保持前缀/后缀不变,通过扰乱数据填充后半部分,或者采用格式保留加密方法对数据进行加密;数字信息,采用数据隐藏、取整、偏移、映射的方式进行处理,或者通过Hash等算法映射成其他数据。4.根据权利要求3所述的一种基于权限的数据脱敏方法,其特征在于,数据抑制:...

【专利技术属性】
技术研发人员:李婷刘强孙大军曹刚
申请(专利权)人:山东超越数控电子股份有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1