数据敏感度确定方法、装置、设备及存储介质制造方法及图纸

技术编号:39312647 阅读:9 留言:0更新日期:2023-11-12 15:57
本申请提供了一种数据敏感度确定方法、装置、设备及存储介质,涉及数据处理技术领域,应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。该方法包括:在确定目标数据中目标字段的敏感度级别时,先将该目标字段与第一敏感度类型的第一字段进行匹配,若存在符合匹配条件的目标第一字段,则直接基于该目标第一字段的敏感度级别确定目标字段的敏感度级别,若不存在,则将该目标字段与第二敏感度类型的第二字段进行匹配,以确定目标字段的敏感度级别。通过这种多阶段字段匹配的方式,能够减少数据敏感度确定过程中对数据质量的高度依赖,使得该方法适用于不同来源、不同质量的数据,从而提高了数据敏感度确定的准确率和数据安全性。提高了数据敏感度确定的准确率和数据安全性。提高了数据敏感度确定的准确率和数据安全性。

【技术实现步骤摘要】
数据敏感度确定方法、装置、设备及存储介质


[0001]本申请涉及数据处理
,特别涉及一种数据敏感度确定方法、装置、设备及存储介质。

技术介绍

[0002]随着互联网技术和大数据应用的快速发展,数据共享的需求越来越强烈。目前,通过在数据共享过程中确定数据的敏感度,并基于数据的敏感度来设置数据的访问权限,以确保数据的安全性。
[0003]相关技术中确定数据敏感度的方式通常如下:例如,基于正则表达式构建数据敏感度分类规则,将待确定数据的字段与正则表达式进行匹配,以确定数据的敏感度。又例如,基于自定义数据字典的敏感度分类规则,将待确定数据的字段与数据字典中的敏感词进行匹配,以确定数据的敏感度。
[0004]然而,上述方式对数据质量的依赖度较高,在面对不同来源、不同质量的数据时,采用上述方式确定出的数据敏感度准确率较低,导致数据的安全性较低。

技术实现思路

[0005]本申请实施例提供了一种数据敏感度确定方法、装置、设备及存储介质,能够提高数据敏感度确定的准确率和数据安全性。该技术方案如下:
[0006]一方面,提供了一种数据敏感度确定方法,该方法包括:
[0007]获取目标数据的目标字段与至少一个第一字段之间的匹配度,该第一字段的敏感度级别属于第一敏感度类型,该第一敏感度类型包括至少一个敏感度级别;
[0008]若该至少一个第一字段中存在目标第一字段,基于该目标第一字段的敏感度级别,确定该目标字段的敏感度级别,该目标第一字段与该目标字段之间的匹配度满足第一匹配条件
[0009]若该至少一个第一字段中不存在该目标第一字段,获取该目标字段与至少一个第二字段之间的匹配度,该第二字段的敏感度级别属于第二敏感度类型,该第二敏感度类型包括至少一个敏感度级别;
[0010]基于该目标字段与至少一个第二字段之间的匹配度,确定该目标字段的敏感度级别。
[0011]另一方面,提供了一种数据敏感度确定装置,该装置包括:
[0012]第一获取模块,用于获取目标数据的目标字段与至少一个第一字段之间的匹配度,该第一字段的敏感度级别属于第一敏感度类型,该第一敏感度类型包括至少一个敏感度级别;
[0013]第一敏感度确定模块,用于若该至少一个第一字段中存在目标第一字段,基于该目标第一字段的敏感度级别,确定该目标字段的敏感度级别,该目标第一字段与该目标字段之间的匹配度满足第一匹配条件;
[0014]第二获取模块,用于若该至少一个第一字段中不存在该目标第一字段,获取该目标字段与至少一个第二字段之间的匹配度,该第二字段的敏感度级别属于第二敏感度类型,该第二敏感度类型包括至少一个敏感度级别;
[0015]第二敏感度确定模块,用于基于该目标字段与至少一个第二字段之间的匹配度,确定该目标字段的敏感度级别。
[0016]在一些实施例中,该第一获取模块,用于:
[0017]将该目标字段的字段名称与该至少一个第一字段的字段名称进行匹配,得到该目标字段与该至少一个第一字段之间的至少一个第一匹配度,该第一匹配条件是指该目标第一字段与该目标字段之间第一匹配度大于第一阈值。
[0018]在一些实施例中,该第二获取模块,用于:
[0019]基于该至少一个第二字段对应的正则表达式,将该目标字段和该至少一个第二字段进行匹配,得到该目标字段与该至少一个第二字段之间的至少一个第二匹配度;
[0020]该第二敏感度确定模块,用于:
[0021]将该至少一个第二字段中第二匹配度最高的第二字段确定为第一候选字段;
[0022]若该目标字段与该第一候选字段之间的第二匹配度大于第二阈值,基于该第一候选字段的敏感度级别,确定该目标字段的敏感度级别。
[0023]在一些实施例中,该第二获取模块,用于:
[0024]对于任一个第二字段,将该目标字段的字段名称与该第二字段的字段名称进行匹配,得到该目标字段与该第二字段之间的第一名称匹配度;
[0025]将该目标字段对应的字段内容与该第二字段对应的正则表达式进行匹配,得到该目标字段与该第二字段之间的第一内容匹配度;
[0026]基于该第一名称匹配度和该第一内容匹配度,得到该目标字段与该第二字段之间的第二匹配度。
[0027]在一些实施例中,该第二获取模块,用于:
[0028]基于该至少一个第二字段对应的关键词集合,将该目标字段和该至少一个第二字段进行匹配,得到该目标字段与该至少一个第二字段之间的至少一个第三匹配度;
[0029]该第二敏感度确定模块,用于:
[0030]将该至少一个第二字段中第三匹配度最高的第二字段确定为第二候选字段;
[0031]若该目标字段与该第二候选字段之间的第三匹配度大于第三阈值,基于该第二候选字段的敏感度级别,确定该目标字段的敏感度级别。
[0032]在一些实施例中,该第二获取模块,用于:
[0033]对于任一个第二字段,将该目标字段的字段名称与该第二字段的字段名称进行匹配,得到该目标字段与该第二字段之间的第二名称匹配度;
[0034]将该目标字段对应的字段内容与该第二字段对应的关键词集合进行匹配,得到该目标字段与该第二字段之间的第二内容匹配度;
[0035]基于该第二名称匹配度和该第二内容匹配度,得到该目标字段与该第二字段之间的第三匹配度。
[0036]在一些实施例中,该第二获取模块,用于:
[0037]基于该至少一个第二字段对应的正则表达式,获取该目标字段与该至少一个第二
字段之间的至少一个第二匹配度;
[0038]该第二敏感度确定模块,用于:
[0039]若该目标字段与该至少一个第二字段中第一候选字段之间的第二匹配度大于第二阈值,基于该第一候选字段的敏感度级别,确定该目标字段的敏感度级别;
[0040]该第二获取模块,还用于:
[0041]若该目标字段与该第一候选字段之间的第二匹配度小于或等于第二阈值,基于该至少一个第二字段对应的关键词集合,获取该目标字段与该至少一个第二字段之间的至少一个第三匹配度;
[0042]该第二敏感度确定模块,还用于:
[0043]若该目标字段与该至少一个第二字段中第二候选字段之间的第三匹配度大于第三阈值,基于该第二候选字段的敏感度级别,确定该目标字段的敏感度级别。
[0044]在一些实施例中,该装置还包括第三敏感度确定模块,用于:
[0045]若该至少一个第一字段中不存在该目标第一字段,获取该目标字段与至少一个第三字段之间的匹配度,该第三字段为该目标数据中已确定敏感度级别的字段;
[0046]若该至少一个第三字段中存在目标第三字段,基于该目标第三字段的敏感度级别,确定该目标字段的敏感度级别,该目标第三字段与该目标字段之间的匹配度满足第二匹配条件。
[0047]在一些实施例中,该装置还包括字段确定模块,用于:
[0048]基于该目标字段的字段名称,确定本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据敏感度确定方法,其特征在于,所述方法包括:获取目标数据的目标字段与至少一个第一字段之间的匹配度,所述第一字段的敏感度级别属于第一敏感度类型,所述第一敏感度类型包括至少一个敏感度级别;若所述至少一个第一字段中存在目标第一字段,基于所述目标第一字段的敏感度级别,确定所述目标字段的敏感度级别,所述目标第一字段与所述目标字段之间的匹配度满足第一匹配条件;若所述至少一个第一字段中不存在所述目标第一字段,获取所述目标字段与至少一个第二字段之间的匹配度,所述第二字段的敏感度级别属于第二敏感度类型,所述第二敏感度类型包括至少一个敏感度级别;基于所述目标字段与至少一个第二字段之间的匹配度,确定所述目标字段的敏感度级别。2.根据权利要求1所述的方法,其特征在于,所述获取目标数据的目标字段与至少一个第一字段之间的匹配度,包括:将所述目标字段的字段名称与所述至少一个第一字段的字段名称进行匹配,得到所述目标字段与所述至少一个第一字段之间的至少一个第一匹配度,所述第一匹配条件是指所述目标第一字段与所述目标字段之间第一匹配度大于第一阈值。3.根据权利要求1所述的方法,其特征在于,所述获取所述目标字段与至少一个第二字段之间的匹配度,包括:基于所述至少一个第二字段对应的正则表达式,将所述目标字段和所述至少一个第二字段进行匹配,得到所述目标字段与所述至少一个第二字段之间的至少一个第二匹配度;所述基于所述目标字段与至少一个第二字段之间的匹配度,确定所述目标字段的敏感度级别,包括:将所述至少一个第二字段中第二匹配度最高的第二字段确定为第一候选字段;若所述目标字段与所述第一候选字段之间的第二匹配度大于第二阈值,基于所述第一候选字段的敏感度级别,确定所述目标字段的敏感度级别。4.根据权利要求3所述的方法,其特征在于,所述基于所述至少一个第二字段对应的正则表达式,将所述目标字段和所述至少一个第二字段进行匹配,得到所述目标字段与所述至少一个第二字段之间的至少一个第二匹配度,包括:对于任一个第二字段,将所述目标字段的字段名称与所述第二字段的字段名称进行匹配,得到所述目标字段与所述第二字段之间的第一名称匹配度;将所述目标字段对应的字段内容与所述第二字段对应的正则表达式进行匹配,得到所述目标字段与所述第二字段之间的第一内容匹配度;基于所述第一名称匹配度和所述第一内容匹配度,得到所述目标字段与所述第二字段之间的第二匹配度。5.根据权利要求1所述的方法,其特征在于,所述获取所述目标字段与至少一个第二字段之间的匹配度,包括:基于所述至少一个第二字段对应的关键词集合,将所述目标字段和所述至少一个第二字段进行匹配,得到所述目标字段与所述至少一个第二字段之间的至少一个第三匹配度;所述基于所述目标字段与所述至少一个第二字段之间的匹配度,确定所述目标字段的
敏感度级别,包括:将所述至少一个第二字段中第三匹配度最高的第二字段确定为第二候选字段;若所述目标字段与所述第二候选字段之间的第三匹配度大于第三阈值,基于所述第二候选字段的敏感度级别,确定所述目标字段的敏感度级别。6.根据权利要求5所述的方法,其特征在于,所述基于所述至少一个第二字段对应的关键词集合,将所述目标字段和所述至少一个第二字段进行匹配,得到所述目标字段与所述至少一个第二字段之间的至少一个第三匹配度,包括:对于任一个第二字段,将所述目标字段的字段名称与所述第二字段的字段名称进行匹配,得到所述目标字段与所述第二字段之间的第二名称匹配度;将所述目标字段对应的字段内容与所述第二字段对应的关键词集合进行匹配,得到所述目标字段与所述第二字段之间的第二内容匹配度;基于所述第二名称匹配度和所述第二内容匹配度,得到所述目标字段与所述第二字段之间的第三匹配度。7.根据权利要求1所述的方...

【专利技术属性】
技术研发人员:汪哲宇史忠贤王玮
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1