数据分级处理方法、装置、设备和存储介质制造方法及图纸

技术编号：35650584 阅读：34 留言：0更新日期：2022-11-19 16:45

本申请提供一种数据分级处理方法、装置、设备和存储介质。该方法包括：通过自然语言处理对新增字段进行分词处理，得到至少一个第一数据标签；根据数据分级规则库中的第二数据标签对应的分级级别，得到每个第一数据标签的分级级别；根据至少一个第一数据标签的分级级别，确定新增字段的分级级别；将新增字段作为新的数据标签，并将新的数据标签以及新的数据标签对应的分级级别存储至数据分级规则库。本实施例降低了人工参与数据分级的干预程度，减少了因个人主观因素掺杂到分级内容中的情况，提高了流程的可用性和自动化，提高了分级准确率，同时实现了数据分级规则库的自动扩充。同时实现了数据分级规则库的自动扩充。同时实现了数据分级规则库的自动扩充。

全部详细技术资料下载

【技术实现步骤摘要】
数据分级处理方法、装置、设备和存储介质

[0001]本申请涉及信息安全领域，尤其涉及一种数据分级处理方法、装置、设备和存储介质。

技术介绍

[0002]随着云计算、大数据的快速发展，政府部门以及各类企业通过各种途径收集了大量数据，用来进行数据分析研究并根据分析研究结果进行决策制定。收集到的敏感数据涉及个人隐私信息、财产信息、企业基础信息等等，若出现数据泄露或数据滥用事件将会给数据的使用者以及拥有者造成损失，因此如何提高数据使用过程的安全性，是数据安全领域的重要课题。
[0003]数据分类分级是数据安全的前提，准确高效的定义分级级别是数据共享开放的基础，数据只有在确认了分级级别的情况下，才能定义共享开放级别，从而保证数据流通的安全性。现行的分级技术主要是从字段内容出发，即根据字段的实际数据内容，如“身份证号码”、“手机号码”、“姓名”等，通过编写正则表达式，匹配数据内容。
[0004]然而，实际情况中绝大部分的字段并不含有实际的数据内容，这给数据分级带来了很大的难度。

技术实现思路

[0005]本申请提供一种数据分级处理方法、装置、设备和存储介质，以解决现有技术中存在的对不含有实际的数据内容的字段分级难度大的缺陷。
[0006]一方面，本申请提供一种数据分级处理方法，包括：
[0007]通过自然语言处理对新增字段进行分词处理，得到至少一个第一数据标签；
[0008]根据数据分级规则库中的第二数据标签对应的分级级别，得到每个第一数据标签的分级级别，所述分级级别用于指...

【技术保护点】

【技术特征摘要】
1.一种数据分级处理方法，其特征在于，包括：通过自然语言处理对新增字段进行分词处理，得到至少一个第一数据标签；根据数据分级规则库中的第二数据标签对应的分级级别，得到每个第一数据标签的分级级别，所述分级级别用于指示所述第一数据标签的敏感程度；根据所述至少一个第一数据标签的分级级别，确定所述新增字段的分级级别；将所述新增字段作为新的数据标签，并将所述新的数据标签以及所述新的数据标签对应的分级级别存储至所述数据分级规则库。2.根据权利要求1所述的方法，其特征在于，所述根据数据分级规则库中的第二数据标签对应的分级级别，得到每个第一数据标签的分级级别，包括：若所述数据分级规则库中存在与所述第一数据标签相同的第二数据标签，则将所述第二数据标签的分级级别作为所述第一数据标签的分级级别。3.根据权利要求1所述的方法，其特征在于，所述根据数据分级规则库中的第二数据标签对应的分级级别，得到每个第一数据标签的分级级别，包括：若所述数据分级规则库中不存在与所述第一数据标签相同的第二数据标签，则将第一预设分级级别作为所述第一数据标签的分级级别。4.根据权利要求3所述的方法，其特征在于，所述将第一预设分级级别作为所述第一数据标签的分级级别之前，所述方法还包括：获取所述数据分级规则库中预设数量的第二数据标签对应的分级级别的平均值；根据所述平均值得到所述第一预设分级级别。5.根据权利要求1所述的方法，其特征在于，所述根据所述至少一个第一数据标签的分级级别，确定所述新增字段的分级级别，包括：对所述至少一个第一数据标签的分级级别数据进行加权平均，得到所述新增字段的分级级别。6.根据权利要求1所述的方法，其特征在于，所述将所述新的数据标签以及所述新的数据标签对应的分级级别存储至所述数据分级规则库之前，所述方法...

【专利技术属性】
技术研发人员：周莉，栾泽琳，
申请(专利权)人：联通大数据有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人