【技术实现步骤摘要】
数据分级方法、装置、计算机设备和存储介质
[0001]本申请涉及计算机
,特别是涉及一种数据分级方法、装置、计算机设备、存储介质和计算机程序产品。
技术介绍
[0002]随着计算机技术的发展,人们在工作、生活和娱乐过程中产生了大量的数据,如姓名、年龄、身份证号、手机号等个人信息数据,又如社交过程中的聊天记录数据、银行交易流水数据等。为了确保各种数据能够处于有效保护和合法利用的状态,以确保数据安全,可以对各种数据进行安全级别划分,根据数据对应的安全级别对相应数据进行保护,如设置不同的密级权限,通过不同的加密算法进行加密等。
[0003]目前,在对数据进行分级以确定数据的级别时,往往基于历史表单进行人工分级,或采用规则对具有明显特征的数据进行识别分级,数据分级处理的覆盖的场景有限,需要反复确认分级结果,导致数据分级的处理效率较低。
技术实现思路
[0004]基于此,有必要针对上述技术问题,提供一种能够提高数据分级处理效率的数据分级方法、装置、计算机设备、存储介质和计算机程序产品。
[0005]一种数据分级方法,所述方法包括:
[0006]基于业务系统中目标字段的属性信息和字段数据,确定目标字段所对应的多于一个的字段特征因子;
[0007]按照至少两种分类方式各自对应的特征组合条件,将字段特征因子进行组合,得到每种分类方式所对应的字段特征;
[0008]按照每种分类方式,根据相应分类方式所对应的字段特征,对目标字段进行分类,获得每种分类方式各自对应的初步分类结果 ...
【技术保护点】
【技术特征摘要】
1.一种数据分级方法,其特征在于,所述方法包括:基于业务系统中目标字段的属性信息和字段数据,确定所述目标字段所对应的多于一个的字段特征因子;按照至少两种分类方式各自对应的特征组合条件,将所述字段特征因子进行组合,得到每种所述分类方式所对应的字段特征;按照每种所述分类方式,根据相应分类方式所对应的字段特征,对所述目标字段进行分类,获得每种所述分类方式各自对应的初步分类结果;根据所述初步分类结果进行融合,获得所述目标字段的字段分类结果;基于所述字段分类结果映射得到所述目标字段所对应数据的数据级别。2.根据权利要求1所述的方法,其特征在于,所述按照至少两种分类方式各自对应的特征组合条件,将所述字段特征因子进行组合,得到每种所述分类方式所对应的字段特征,包括:确定至少两种分类方式;根据所述至少两种分类方式各自对应的特征组合条件,从所述字段特征因子中确定每种分类方式对应的目标特征因子;基于每种所述分类方式对应的目标特征因子,得到每种所述分类方式所对应的字段特征。3.根据权利要求2所述的方法,其特征在于,所述分类方式包括字段数据匹配方式,所述目标特征因子包括字段数据因子;所述基于每种所述分类方式对应的目标特征因子,得到每种所述分类方式所对应的字段特征,包括:确定所述字段数据因子为所述字段数据匹配方式所对应的第一字段特征;所述按照每种所述分类方式,根据相应分类方式所对应的字段特征,对所述目标字段进行分类,获得每种所述分类方式各自对应的初步分类结果,包括:通过所述字段数据匹配方式,基于所述第一字段特征对所述目标字段进行分类,得到所述字段数据匹配方式对应的初步分类结果。4.根据权利要求3所述的方法,其特征在于,所述通过所述字段数据匹配方式,基于所述第一字段特征对所述目标字段进行分类,得到所述字段数据匹配方式对应的初步分类结果,包括:获取所述字段数据匹配方式对应的字段数据匹配条件;将所述第一字段特征与所述字段数据匹配条件进行正则匹配,得到正则匹配结果;当所述正则匹配结果通过匹配校验时,根据所述正则匹配结果得到所述字段数据匹配方式对应的初步分类结果。5.根据权利要求2所述的方法,其特征在于,所述分类方式包括字段文本分类方式,所述目标特征因子包括字段描述因子和字段名称因子;所述基于每种所述分类方式对应的目标特征因子,得到每种所述分类方式所对应的字段特征,包括:将所述字段描述因子和所述字段名称因子进行组合,得到所述字段文本分类方式所对应的第二字段特征;所述按照每种所述分类方式,根据相应分类方式所对应的字段特征,对所述目标字段进行分类,获得每种所述分类方式各自对应的初步分类结果,包括:
通过所述字段文本分类方式对应的文本分类模型,基于所述第二字段特征对所述目标字段进行分类,得到所述字段文本分类方式对应的初步分类结果。6.根据权利要求5所述的方法,其特征在于,所述通过所述字段文本分类方式对应的文本分类模型,基于所述第二字段特征对所述目标字段进行分类,得到所述字段文本分类方式对应的初步分类结果,包括:通过所述字段文本分类方式对应的文本分类模型,对所述第二字段特征进行向量转化,得到词向量;通过所述文本分类模型,基于所述词向量对所述目标字段进行线性分类,得到所述字段文本分类方式对应的初步分类结果。7.根据权利要求2所述的方法,其特征在于,所述分类方式包括神经网络模型分类方式,所述目标特征因子包括字段数据因子和字段描述因子;所述基于每种所述分类方式对应的目标特征因子,得到每种所述分类方式所对应的字段特征,包括:将所述字段数据因子和所述字段描述因子进行组合,得到所述神经网络模型分...
【专利技术属性】
技术研发人员:刘妍,陈守志,刘畅,董井然,王鹏程,岳红林,张龙,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。