System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及数据处理领域,尤其涉及一种数据的分级方法及装置。
技术介绍
1、很多机构或者组织有大量原始数据需要发布或者共享。但数据发布前需要对数据进行分析分级,以便更好地进行隐私评估。
2、目前的属性分级算法,往往是定性分析,即只给出一个属性关联分析的模型,不涉及量化过程,数据的分级结果的主观性较强,导致数据分级结果的准确性较低。
技术实现思路
1、有鉴于此,本申请提供了一种数据的分级方法及装置,旨在提高数据分级结果的准确性。
2、第一方面,本申请提供了一种数据的分级方法,所述方法包括:
3、获取待分级的数据集,所述数据集包括多个数据和每个数据对应的属性;
4、根据每个属性之间的关联程度进行组合,得到多个组合属性;
5、利用分级算法对所述多个组合属性中每个组合属性进行分级计算,得到所述每个组合属性的联合分级向量;
6、根据所述每个组合属性的联合分级向量,确定所述每个组合属性对应的敏感等级,将所述每个组合属性的敏感等级作为所述待分级的数据集的分级结果。
7、可选地,所述分级算法的构建过程包括:
8、获取样本数据集,所述样本数据集包括多个样本数据,以及每个样本数据对应的属性;
9、确定所述每个样本数据属性的敏感等级;
10、将所述每个样本数据属性的敏感等级进行量化映射,得到所述每个样本数据属性对应的指标值;
11、利用单一属性分级算法,根据所述每个样本数据属
12、根据每个样本数据属性对隐私量的贡献值,设置每个样本数据属性对应的权重值;
13、将所述每个样本数据属性的分级概率向量,以及所述每个样本数据属性对应的权重值进行联合分级计算,得到每个样本数据组合属性的联合分级向量。
14、可选地,利用分级算法对所述多个组合属性中每个组合属性进行分级计算,得到所述每个组合属性的联合分级向量,包括:
15、确定所述每个组合属性中每个属性的敏感等级;
16、将所述每个组合属性中每个属性的敏感等级进行量化映射,得到所述每个组合属性中每个属性对应的指标值;
17、利用单一属性分级算法,根据所述每个组合属性中每个属性对应的指标值,计算得到所述每个组合属性中每个属性的分级概率向量;
18、根据所述每个组合属性中每个属性对隐私量的贡献值,设置所述每个组合属性中每个属性对应的权重值;
19、将所述每个组合属性中每个属性的分级概率向量,以及所述每个组合属性中每个属性对应的权重值进行联合分级计算,得到每个组合属性的联合分级向量。
20、可选地,所述确定所述每个样本数据属性的敏感等级,包括:
21、确定所述每个样本数据属性的属性值;
22、根据所述每个样本数据属性的属性值之间的距离,对每个样本数据属性进行分级,得到每个样本数据属性的敏感等级。
23、可选地,所述根据所述每个样本数据属性对应的指标值,计算得到每个样本数据属性的分级概率向量,包括:
24、根据所述每个样本数据属性对应的指标值,确定所述每个样本数据属性的分级指标向量;
25、根据所述每个样本数据属性的分级指标向量,计算得到每个样本数据属性的分级概率向量。
26、可选地,所述根据所述每个组合属性的联合分级向量,确定对应的敏感等级包括:
27、分别确定所述每个组合属性的联合分级向量中的最大值;
28、将所述每个组合属性的联合分级向量中的最大值所属的敏感等级,作为所述每个组合属性对应的敏感等级。
29、可选地,所述敏感等级包括:不敏感等级、一般敏感等级、比较敏感等级和非常敏感等级。
30、第二方面,本申请提供了一种数据的分级装置,所述装置包括:
31、获取模块,用于获取待分级的数据集,所述数据集包括多个数据和每个数据对应的属性;
32、组合模块,用于根据每个属性之间的关联程度进行组合,得到多个组合属性;
33、计算模块,用于利用分级算法分别对所述多个组合属性进行分级计算,得到所述多个组合属性中每个组合属性的联合分级向量;
34、分级模块,用于根据所述每个组合属性的联合分级向量,确定对应的敏感等级,将所述每个组合属性的敏感等级作为所述待分级的数据集的分级结果。
35、可选地,所述分级模块,具体用于:
36、分别确定所述每个组合属性的联合分级向量中的最大值;
37、将所述每个组合属性的联合分级向量中的最大值所属的敏感等级,作为所述每个组合属性对应的敏感等级。
38、可选地,所述敏感等级包括:不敏感等级、一般敏感等级、比较敏感等级和非常敏感等级。
39、第三方面,本申请实施例提供了一种电子设备,所述电子设备包括:
40、存储器,用于存储一个或多个程序;
41、处理器;当所述一个或多个程序被所述处理器执行时,实现前述第一方面任一项所述的数据的分级方法。
42、第四方面,本申请实施例提供了一种计算机存储介质,所述计算机存储介质中存储有程序,当所述程序被处理器执行时,实现前述第一方面任一项所述的数据的分级方法。
43、上述技术方案具有如下有益效果:
44、本申请提供了一种数据的分级方法及装置。在执行所述方法时,首先获取待分级的数据集,其中,数据集包括多个数据和每个数据对应的属性;然后根据每个属性之间的关联程度进行组合,得到多个组合属性;接着利用预先构建的分级算法对所述多个组合属性中每个组合属性进行分级计算,得到所述每个组合属性的联合分级向量;最后根据所述每个组合属性的联合分级向量,确定所述每个组合属性对应的敏感等级,将所述每个组合属性的敏感等级作为所述待分级的数据集的分级结果。通过上述方式,本申请不仅考虑单一属性的敏感程度,还考虑多属性关联后推断信息的隐私性,从而进行更全面的分级。而且,相比于定性分析模型,本申请通过预先构建的分级算法对组合属性进行分级计算,可以定量地描述多组合属性的分级结果,从而提高数据分级结果的准确性。
本文档来自技高网...【技术保护点】
1.一种数据的分级方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述分级算法的构建过程包括:
3.根据权利要求2所述的方法,其特征在于,利用分级算法对所述多个组合属性中每个组合属性进行分级计算,得到所述每个组合属性的联合分级向量,包括:
4.根据权利要求2所述的方法,其特征在于,所述确定所述每个样本数据属性的敏感等级,包括:
5.根据权利要求2所述的方法,其特征在于,所述根据所述每个样本数据属性对应的指标值,计算得到每个样本数据属性的分级概率向量,包括:
6.根据权利要求1所述的方法,其特征在于,所述根据所述每个组合属性的联合分级向量,确定对应的敏感等级包括:
7.根据权利要求1所述的方法,其特征在于,所述敏感等级包括:不敏感等级、一般敏感等级、比较敏感等级和非常敏感等级。
8.一种数据的分级装置,其特征在于,所述装置包括:
9.根据权利要求8所述的装置,其特征在于,所述分级模块,具体用于:
10.根据权利要求8所述的装置,其特征在于,所述敏感
...【技术特征摘要】
1.一种数据的分级方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述分级算法的构建过程包括:
3.根据权利要求2所述的方法,其特征在于,利用分级算法对所述多个组合属性中每个组合属性进行分级计算,得到所述每个组合属性的联合分级向量,包括:
4.根据权利要求2所述的方法,其特征在于,所述确定所述每个样本数据属性的敏感等级,包括:
5.根据权利要求2所述的方法,其特征在于,所述根据所述每个样本数据属性对应的指标值,计算得到每个样本数据属性的分级概率向量,...
【专利技术属性】
技术研发人员:白黎阳,张诗怡,陈卫屏,殷文静,刘鉴竹,
申请(专利权)人:中电科网络安全科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。