数据分级方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:37641698 阅读:13 留言:0更新日期:2023-05-25 10:08
本申请涉及一种数据分级方法、装置、计算机设备、存储介质和计算机程序产品。方法包括:基于业务系统中目标字段的属性信息和字段数据,确定目标字段所对应的多于一个的字段特征因子;按照至少两种分类方式各自对应的特征组合条件,将字段特征因子进行组合,得到每种分类方式所对应的字段特征;按照每种分类方式,根据相应分类方式所对应的字段特征,对目标字段进行分类,获得每种分类方式各自对应的初步分类结果;根据初步分类结果进行融合,获得目标字段的字段分类结果;基于字段分类结果映射得到目标字段所对应数据的数据级别。采用本方法能够提高数据分级的处理效率。法能够提高数据分级的处理效率。法能够提高数据分级的处理效率。

【技术实现步骤摘要】
数据分级方法、装置、计算机设备和存储介质


[0001]本申请涉及计算机
,特别是涉及一种数据分级方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着计算机技术的发展,人们在工作、生活和娱乐过程中产生了大量的数据,如姓名、年龄、身份证号、手机号等个人信息数据,又如社交过程中的聊天记录数据、银行交易流水数据等。为了确保各种数据能够处于有效保护和合法利用的状态,以确保数据安全,可以对各种数据进行安全级别划分,根据数据对应的安全级别对相应数据进行保护,如设置不同的密级权限,通过不同的加密算法进行加密等。
[0003]目前,在对数据进行分级以确定数据的级别时,往往基于历史表单进行人工分级,或采用规则对具有明显特征的数据进行识别分级,数据分级处理的覆盖的场景有限,需要反复确认分级结果,导致数据分级的处理效率较低。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高数据分级处理效率的数据分级方法、装置、计算机设备、存储介质和计算机程序产品。
[0005]一种数据分级方法,所述方法包括:
[0006]基于业务系统中目标字段的属性信息和字段数据,确定目标字段所对应的多于一个的字段特征因子;
[0007]按照至少两种分类方式各自对应的特征组合条件,将字段特征因子进行组合,得到每种分类方式所对应的字段特征;
[0008]按照每种分类方式,根据相应分类方式所对应的字段特征,对目标字段进行分类,获得每种分类方式各自对应的初步分类结果
[0009]根据初步分类结果进行融合,获得目标字段的字段分类结果;
[0010]基于字段分类结果映射得到目标字段所对应数据的数据级别。
[0011]一种数据分级装置,所述装置包括:
[0012]特征因子确定模块,用于基于业务系统中目标字段的属性信息和字段数据,确定目标字段所对应的多于一个的字段特征因子;
[0013]特征因子组合模块,用于按照至少两种分类方式各自对应的特征组合条件,将字段特征因子进行组合,得到每种分类方式所对应的字段特征;
[0014]字段初步分类模块,用于按照每种分类方式,根据相应分类方式所对应的字段特征,对目标字段进行分类,获得每种分类方式各自对应的初步分类结果;
[0015]分类结果融合模块,用于根据初步分类结果进行融合,获得目标字段的字段分类结果;
[0016]数据级别确定模块,用于基于字段分类结果映射得到目标字段所对应数据的数据
级别。
[0017]一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0018]基于业务系统中目标字段的属性信息和字段数据,确定目标字段所对应的多于一个的字段特征因子;
[0019]按照至少两种分类方式各自对应的特征组合条件,将字段特征因子进行组合,得到每种分类方式所对应的字段特征;
[0020]按照每种分类方式,根据相应分类方式所对应的字段特征,对目标字段进行分类,获得每种分类方式各自对应的初步分类结果;
[0021]根据初步分类结果进行融合,获得目标字段的字段分类结果;
[0022]基于字段分类结果映射得到目标字段所对应数据的数据级别。
[0023]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0024]基于业务系统中目标字段的属性信息和字段数据,确定目标字段所对应的多于一个的字段特征因子;
[0025]按照至少两种分类方式各自对应的特征组合条件,将字段特征因子进行组合,得到每种分类方式所对应的字段特征;
[0026]按照每种分类方式,根据相应分类方式所对应的字段特征,对目标字段进行分类,获得每种分类方式各自对应的初步分类结果;
[0027]根据初步分类结果进行融合,获得目标字段的字段分类结果;
[0028]基于字段分类结果映射得到目标字段所对应数据的数据级别。
[0029]一种计算机程序产品,所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
[0030]基于业务系统中目标字段的属性信息和字段数据,确定目标字段所对应的多于一个的字段特征因子;
[0031]按照至少两种分类方式各自对应的特征组合条件,将字段特征因子进行组合,得到每种分类方式所对应的字段特征;
[0032]按照每种分类方式,根据相应分类方式所对应的字段特征,对目标字段进行分类,获得每种分类方式各自对应的初步分类结果;
[0033]根据初步分类结果进行融合,获得目标字段的字段分类结果;
[0034]基于字段分类结果映射得到目标字段所对应数据的数据级别。
[0035]上述数据分级方法、装置、计算机设备、存储介质和计算机程序产品,基于业务系统中目标字段的属性信息和字段数据确定多于一个的字段特征因子,按照至少两种分类方式各自对应的特征组合条件将字段特征因子进行组合,并按照每种分类方式,根据相应分类方式所对应的字段特征对目标字段进行分类,根据每种分类方式各自对应的初步分类结果进行融合,得到目标字段的字段分类结果,基于字段分类结果映射得到目标字段所对应数据的数据级别。在数据分级过程中,通过融合多种分类方式对目标字段进行分类的初步分类结果来对目标字段进行分类,以根据目标字段的字段分类结果映射得到对应数据的数据级别,可以覆盖各种分类方式的适用场景,避免对分级结果进行反复确认,提高了数据分
级的处理效率。
附图说明
[0036]图1为一个实施例中数据分级方法的应用环境图;
[0037]图2为一个实施例中数据分级方法的流程示意图;
[0038]图3为一个实施例中对目标字段的字段分类结果进行纠正的流程示意图;
[0039]图4为另一个实施例中数据分级方法的流程示意图;
[0040]图5为一个实施例中创建字段的界面示意图;
[0041]图6为一个实施例中显示推荐字段分类的界面示意图;
[0042]图7为一个实施例中对目标字段进行分类的流程示意图;
[0043]图8为一个实施例中字段血缘关系的示意图;
[0044]图9为一个实施例中对数据表进行分级处理的界面示意图;
[0045]图10为一个实施例中数据分级装置的结构框图;
[0046]图11为一个实施例中计算机设备的内部结构图。
具体实施方式
[0047]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0048]本申请提供的数据分级方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据分级方法,其特征在于,所述方法包括:基于业务系统中目标字段的属性信息和字段数据,确定所述目标字段所对应的多于一个的字段特征因子;按照至少两种分类方式各自对应的特征组合条件,将所述字段特征因子进行组合,得到每种所述分类方式所对应的字段特征;按照每种所述分类方式,根据相应分类方式所对应的字段特征,对所述目标字段进行分类,获得每种所述分类方式各自对应的初步分类结果;根据所述初步分类结果进行融合,获得所述目标字段的字段分类结果;基于所述字段分类结果映射得到所述目标字段所对应数据的数据级别。2.根据权利要求1所述的方法,其特征在于,所述按照至少两种分类方式各自对应的特征组合条件,将所述字段特征因子进行组合,得到每种所述分类方式所对应的字段特征,包括:确定至少两种分类方式;根据所述至少两种分类方式各自对应的特征组合条件,从所述字段特征因子中确定每种分类方式对应的目标特征因子;基于每种所述分类方式对应的目标特征因子,得到每种所述分类方式所对应的字段特征。3.根据权利要求2所述的方法,其特征在于,所述分类方式包括字段数据匹配方式,所述目标特征因子包括字段数据因子;所述基于每种所述分类方式对应的目标特征因子,得到每种所述分类方式所对应的字段特征,包括:确定所述字段数据因子为所述字段数据匹配方式所对应的第一字段特征;所述按照每种所述分类方式,根据相应分类方式所对应的字段特征,对所述目标字段进行分类,获得每种所述分类方式各自对应的初步分类结果,包括:通过所述字段数据匹配方式,基于所述第一字段特征对所述目标字段进行分类,得到所述字段数据匹配方式对应的初步分类结果。4.根据权利要求3所述的方法,其特征在于,所述通过所述字段数据匹配方式,基于所述第一字段特征对所述目标字段进行分类,得到所述字段数据匹配方式对应的初步分类结果,包括:获取所述字段数据匹配方式对应的字段数据匹配条件;将所述第一字段特征与所述字段数据匹配条件进行正则匹配,得到正则匹配结果;当所述正则匹配结果通过匹配校验时,根据所述正则匹配结果得到所述字段数据匹配方式对应的初步分类结果。5.根据权利要求2所述的方法,其特征在于,所述分类方式包括字段文本分类方式,所述目标特征因子包括字段描述因子和字段名称因子;所述基于每种所述分类方式对应的目标特征因子,得到每种所述分类方式所对应的字段特征,包括:将所述字段描述因子和所述字段名称因子进行组合,得到所述字段文本分类方式所对应的第二字段特征;所述按照每种所述分类方式,根据相应分类方式所对应的字段特征,对所述目标字段进行分类,获得每种所述分类方式各自对应的初步分类结果,包括:
通过所述字段文本分类方式对应的文本分类模型,基于所述第二字段特征对所述目标字段进行分类,得到所述字段文本分类方式对应的初步分类结果。6.根据权利要求5所述的方法,其特征在于,所述通过所述字段文本分类方式对应的文本分类模型,基于所述第二字段特征对所述目标字段进行分类,得到所述字段文本分类方式对应的初步分类结果,包括:通过所述字段文本分类方式对应的文本分类模型,对所述第二字段特征进行向量转化,得到词向量;通过所述文本分类模型,基于所述词向量对所述目标字段进行线性分类,得到所述字段文本分类方式对应的初步分类结果。7.根据权利要求2所述的方法,其特征在于,所述分类方式包括神经网络模型分类方式,所述目标特征因子包括字段数据因子和字段描述因子;所述基于每种所述分类方式对应的目标特征因子,得到每种所述分类方式所对应的字段特征,包括:将所述字段数据因子和所述字段描述因子进行组合,得到所述神经网络模型分...

【专利技术属性】
技术研发人员:刘妍陈守志刘畅董井然王鹏程岳红林张龙
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1