【技术实现步骤摘要】
数据敏感度确定方法、装置、设备及存储介质
[0001]本申请涉及数据处理
,特别涉及一种数据敏感度确定方法、装置、设备及存储介质。
技术介绍
[0002]随着互联网技术和大数据应用的快速发展,数据共享的需求越来越强烈。目前,通过在数据共享过程中确定数据的敏感度,并基于数据的敏感度来设置数据的访问权限,以确保数据的安全性。
[0003]相关技术中确定数据敏感度的方式通常如下:例如,基于正则表达式构建数据敏感度分类规则,将待确定数据的字段与正则表达式进行匹配,以确定数据的敏感度。又例如,基于自定义数据字典的敏感度分类规则,将待确定数据的字段与数据字典中的敏感词进行匹配,以确定数据的敏感度。
[0004]然而,上述方式对数据质量的依赖度较高,在面对不同来源、不同质量的数据时,采用上述方式确定出的数据敏感度准确率较低,导致数据的安全性较低。
技术实现思路
[0005]本申请实施例提供了一种数据敏感度确定方法、装置、设备及存储介质,能够提高数据敏感度确定的准确率和数据安全性。该技术方案如下:
[0006]一方面,提供了一种数据敏感度确定方法,该方法包括:
[0007]获取目标数据的目标字段与至少一个第一字段之间的匹配度,该第一字段的敏感度级别属于第一敏感度类型,该第一敏感度类型包括至少一个敏感度级别;
[0008]若该至少一个第一字段中存在目标第一字段,基于该目标第一字段的敏感度级别,确定该目标字段的敏感度级别,该目标第一字段与该目标字段之间的匹配度满足第一匹配条件 ...
【技术保护点】
【技术特征摘要】
1.一种数据敏感度确定方法,其特征在于,所述方法包括:获取目标数据的目标字段与至少一个第一字段之间的匹配度,所述第一字段的敏感度级别属于第一敏感度类型,所述第一敏感度类型包括至少一个敏感度级别;若所述至少一个第一字段中存在目标第一字段,基于所述目标第一字段的敏感度级别,确定所述目标字段的敏感度级别,所述目标第一字段与所述目标字段之间的匹配度满足第一匹配条件;若所述至少一个第一字段中不存在所述目标第一字段,获取所述目标字段与至少一个第二字段之间的匹配度,所述第二字段的敏感度级别属于第二敏感度类型,所述第二敏感度类型包括至少一个敏感度级别;基于所述目标字段与至少一个第二字段之间的匹配度,确定所述目标字段的敏感度级别。2.根据权利要求1所述的方法,其特征在于,所述获取目标数据的目标字段与至少一个第一字段之间的匹配度,包括:将所述目标字段的字段名称与所述至少一个第一字段的字段名称进行匹配,得到所述目标字段与所述至少一个第一字段之间的至少一个第一匹配度,所述第一匹配条件是指所述目标第一字段与所述目标字段之间第一匹配度大于第一阈值。3.根据权利要求1所述的方法,其特征在于,所述获取所述目标字段与至少一个第二字段之间的匹配度,包括:基于所述至少一个第二字段对应的正则表达式,将所述目标字段和所述至少一个第二字段进行匹配,得到所述目标字段与所述至少一个第二字段之间的至少一个第二匹配度;所述基于所述目标字段与至少一个第二字段之间的匹配度,确定所述目标字段的敏感度级别,包括:将所述至少一个第二字段中第二匹配度最高的第二字段确定为第一候选字段;若所述目标字段与所述第一候选字段之间的第二匹配度大于第二阈值,基于所述第一候选字段的敏感度级别,确定所述目标字段的敏感度级别。4.根据权利要求3所述的方法,其特征在于,所述基于所述至少一个第二字段对应的正则表达式,将所述目标字段和所述至少一个第二字段进行匹配,得到所述目标字段与所述至少一个第二字段之间的至少一个第二匹配度,包括:对于任一个第二字段,将所述目标字段的字段名称与所述第二字段的字段名称进行匹配,得到所述目标字段与所述第二字段之间的第一名称匹配度;将所述目标字段对应的字段内容与所述第二字段对应的正则表达式进行匹配,得到所述目标字段与所述第二字段之间的第一内容匹配度;基于所述第一名称匹配度和所述第一内容匹配度,得到所述目标字段与所述第二字段之间的第二匹配度。5.根据权利要求1所述的方法,其特征在于,所述获取所述目标字段与至少一个第二字段之间的匹配度,包括:基于所述至少一个第二字段对应的关键词集合,将所述目标字段和所述至少一个第二字段进行匹配,得到所述目标字段与所述至少一个第二字段之间的至少一个第三匹配度;所述基于所述目标字段与所述至少一个第二字段之间的匹配度,确定所述目标字段的
敏感度级别,包括:将所述至少一个第二字段中第三匹配度最高的第二字段确定为第二候选字段;若所述目标字段与所述第二候选字段之间的第三匹配度大于第三阈值,基于所述第二候选字段的敏感度级别,确定所述目标字段的敏感度级别。6.根据权利要求5所述的方法,其特征在于,所述基于所述至少一个第二字段对应的关键词集合,将所述目标字段和所述至少一个第二字段进行匹配,得到所述目标字段与所述至少一个第二字段之间的至少一个第三匹配度,包括:对于任一个第二字段,将所述目标字段的字段名称与所述第二字段的字段名称进行匹配,得到所述目标字段与所述第二字段之间的第二名称匹配度;将所述目标字段对应的字段内容与所述第二字段对应的关键词集合进行匹配,得到所述目标字段与所述第二字段之间的第二内容匹配度;基于所述第二名称匹配度和所述第二内容匹配度,得到所述目标字段与所述第二字段之间的第三匹配度。7.根据权利要求1所述的方...
【专利技术属性】
技术研发人员:汪哲宇,史忠贤,王玮,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。