基于敏感性等级和可计算性等级的数据加密选择方法技术

技术编号:39006553 阅读:13 留言:0更新日期:2023-10-07 10:38
本发明专利技术公开了一种基于数据敏感性等级和可计算性等级的数据加密选择方法,主要解决现有技术加密结构化数据时间开销和空间开销大,数据样本和数据查询样本获取难度大的问题。其实现方案为:设置评估敏感性等级的隐私、风险、效率三方面指标及评估可计算性等级的指标,使用模糊综合评价获取多位专家的评估意见;使用Hellinger距离确定评估敏感性等级的每个指标的权重;分别融合敏感性等级和可计算性等级的多个指标评估结果,得到每列数据敏感性等级和可计算性等级;根据评估等级选择是否加密及加密方式。本发明专利技术降低了加密方式选择的难度,相比采用多种加密方式加密同一列数据,减小时间开销和空间开销,可用于结构化数据的安全存储。储。储。

【技术实现步骤摘要】
基于敏感性等级和可计算性等级的数据加密选择方法


[0001]本专利技术属于网络空间安全
,特别涉及一种数据加密方法,可用于结构化数据的安全存储。

技术介绍

[0002]随着互联网技术的发展,互联网技术在人们的日常生活中发挥着越来越大的作用,影响金融,物联网,医疗等各个行业,用户在使用互联网技术提供的各个服务时产生大量数据,这些数据中包含有价值的信息或用户的敏感信息等,人们越来越重视数据的安全性,密码技术是保障数据安全性的有效手段,在存储数据时可以使用密码技术保障数据安全。不同的加密方式有不同的优缺点。现有的加密算法包括对称加密,非对称加密,同态加密,其中对称加密算法包括DES算法,3DES算法,AES算法;非对称加密算法包括RSA算法,ECC算法;同态加密算法包括BFV方案,CKKS方案,不同的加密算法有不同加密效果。
[0003]对称加密算法,是使用不同的密钥长度提供不同等级的安全性,加密速度快,其中的DES算法和3DES算法的安全性较低,而其中的AES算法与DES算法和3DES算法相比,由于其使用密钥长度包括128位,192位,256位三种,因此会随着密钥长度的增加,加解密数据的效率不断降低,密文数据的安全性不断增加。
[0004]非对称加密算法,是使用公开的公钥加密数据保障数据的机密性,使用秘密保存的私钥解密数据提供明文数据信息,该算法只有拥有私钥的用户才能解密数据,与对称加密算法相比,非对称加密算法的加解密效率较低。
[0005]同态加密算法,是在加密数据后用户直接在密文上计算,无需解密,其中的BFV方案适合对整数加密,且不会损失数据的精度,对数据加密再解密后的数据与原始明文数据完全相同,使用密文进行计算得到的数据与在明文上进行相应计算得到的数据完全相同;其中的CKKS方案适合对小数加密,但会损失数据的精度,即对数据加密再解密后的数据与原始明文数据不完全一致,使用密文进行计算得到的数据与在明文上进行相应计算得到的数据不完全一致。
[0006]上述加密算法可以单独使用,也可以组合起来使用,在大数据环境下,使用多种加密算法加密数据并存储时,由于数据量大,数据种类多,且不同加密算法的优缺点不同,用户需要选择是否加密数据,并在加密数据时,为数据选择合适的加密算法,使得用户存储和使用数据的效率较高,同时保障数据的安全性。目前为数据选择加密算法的方法中包括采用多种加密算法加密同一列明文数据,直接为每列数据分配一种合适的加密算法以及根据数据样本和查询样本为每列数据选择合适的加密算法。
[0007]如果使用多种加密算法加密同一列数据,不同的加密算法要满足不同的需求,且要用同一个明文加密成多个密文,时间和空间开销较大。
[0008]如果直接为每列数据分配一种合适的加密算法,用户需根据经验和直觉选择加密方式,这种方式不能很好地平衡存储和使用数据的效率和安全性。
[0009]如果根据数据样本和数据查询样本为每列数据选择合适的加密算法,首先要获取
大量准确的数据样本和数据查询样本,再根据对数据的比较,查询,计算这些频繁操作和时间开销等内容,分析数据样本和查询样本,为数据选择最合适的加密方式。这种方比较依赖查询样本的准确性,不适合查询样本获取难度大和不准确的情况。
[0010]文献CryptDB:Protecting confidentiality with encrypted query processing提出了一种安全存储系统,该系统中每列明文数据使用多种加密算法加密,包括随机加密,同态加密,确定性加密,保序加密,可搜索加密,其中随机加密使用AES算法实现,同态加密使用paillier算法实现,用户使用CryptDB存储数据时,由于使用了多种加密算法加密同一列明文数据,导致存储系统存储每列明文数据对应的多列密文数据,时间和空间开销较大,同时由于paillier是半同态加密算法,只能在密文上实现加法操作,不能实现乘法操作。与paillier算法相比,BFV方案和CKKS方案可以在密文上实现加法和乘法操作,用户能够在密文数据上进行更复杂的计算。
[0011]文献Processing analytical queries over encrypted data在CryptDB的基础上进行改进,提出了一种安全存储系统Monomi,其通过分析预先输入的数据样本和查询样本为数据分配加密方式,该方法与使用多种加密算法加密同一列明文相比,虽然减少了加密存储数据时的时间开销和空间开销。但由于用户需要事先确定准确的数据样本和查询样本,因而当数据样本和查询样本获取难度较大时,使用这种方法为数据选择加密方式难度较大,当数据样本和查询样本不准确时,使用这种方法选择加密方式得到的结果用于安全存储系统时,不能能很好地平衡安全性和效率。

技术实现思路

[0012]本专利技术的目的在于针对上述现有技术的不足,提出一种基于敏感性等级和可计算性等级的数据加密选择方法,以更好地平衡存储和使用数据的效率和安全性,降低为数据选择加密方式的难度。
[0013]本专利技术的技术方案是:通过科学的方法评估每列数据的敏感性等级和可计算性等级,通过敏感性等级和可计算性等级为数据选择合适的加密方式,其实现步骤包括如下:
[0014](1)确定评估敏感性等级和可计算性等级的指标:
[0015](1a)设评估敏感性等级包括:隐私,风险,效率这三方面的指标;
[0016](1b)设置评估可计算性等级包括三个指标,分别为数据与有价值的预测相关、数据有统计分析的价值、数据与用户分类相关,数据与有价值的预测越相关,具有的统计及分析的价值越大,数据与用户的分类越相关,数据的可计算性等级越高;
[0017](2)评估数据的敏感性等级和可计算性等级:
[0018](2a)设敏感性等级分为三级,等级越高表示数据需要越安全的加密方式;设可计算性等级分为三级,等级越高表示用户使用数据进行计算越频繁;
[0019](2b)使用模糊综合评价获取多位专家的评估意见,构建从隐私,风险,效率的角度评估敏感性等级对应的模糊隶属度矩阵,及评估可计算性等级的模糊隶属度矩阵;
[0020](2c)从模糊隶属度矩阵中获取每位专家从单个指标的角度评估敏感性等级的评估结果,使用这些数据计算Hellinger距离,通过Hellinger距离确定每个指标的权重;
[0021](2d)从模糊隶属度矩阵中获取多位专家从单个指标角度的评估结果平均值,使用平均值作为基本概率分配,使用D

S证据理论融合多个指标的评估结果,得到对数据敏感性
等级和可计算性等级的评估结果,分别表示为概率分布(p1,p2,p3)和(g1,g2,g3),其中p1,p2,p3分别表示将数据敏感性等级评估为一级,二级,三级的可能性,g1,g2,g3分别表示将数据可计算性等级评估为一级,二级,三级的可能性;
[0022](2e)设数据敏感性等级和可计算性的三个等级均分别对应分数score1、score2、sco本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于敏感性等级和可计算性等级的数据加密选择方法,其特征在于,包括如下步骤:(1)确定评估敏感性等级和可计算性等级的指标:(1a)设评估敏感性等级包括:隐私,风险,效率这三方面的指标;(1b)设置评估可计算性等级包括三个指标,分别为数据与有价值的预测相关、数据有统计分析的价值、数据与用户分类相关,数据与有价值的预测越相关,具有的统计及分析的价值越大,数据与用户的分类越相关,数据的可计算性等级越高;(2)评估数据的敏感性等级和可计算性等级:(2a)设敏感性等级分为三级,等级越高表示数据需要越安全的加密方式;设可计算性等级分为三级,等级越高表示用户使用数据进行计算越频繁;(2b)使用模糊综合评价获取多位专家的评估意见,构建从隐私,风险,效率的角度评估敏感性等级对应的模糊隶属度矩阵,及评估可计算性等级的模糊隶属度矩阵;(2c)从模糊隶属度矩阵中获取每位专家从单个指标的角度评估敏感性等级的评估结果,使用这些数据计算Hellinger距离,通过Hellinger距离确定每个指标的权重;(2d)从模糊隶属度矩阵中获取多位专家从单个指标角度的评估结果平均值,使用平均值作为基本概率分布,使用D

S证据理论融合多个指标的评估结果,得到对数据敏感性等级和可计算性等级的评估结果,分别表示为概率分布(p1,p2,p3)和(g1,g2,g3),其中p1,p2,p3分别表示将数据敏感性等级评估为一级,二级,三级的可能性,g1,g2,g3分别表示将数据可计算性等级评估为一级,二级,三级的可能性;(2e)设数据敏感性等级和可计算性的三个等级均分别对应分数score1、score2、score3,将p1、p2、p3与score1、score2、score3分别相乘,再将相乘结果相加,得到敏感性等级评估结果最终对应的分值s1;将g1、g2、g3与score1、score2、score3分别相乘,再将相乘结果相加,得到可计算性等级评估结果最终对应的分值s2;(2f)根据分值s1和s2所在范围确定最终数据的敏感性等级和可计算性等级:设score4=score3

score1,分值在之间,将数据评估为一级,对应数值1,分值在之间,将数据评估为二级,对应数值2,分值在score4~score3之间,将数据评估为三级,对应数值3。(3)服务器端根据敏感性等级和可计算性等级确定加密方式:(3a)将数据的敏感性等级对应数值与可计算性等级对应数值相加,得到评估数值sa,设评估阈值d为5;(3b)将评估数值sa与其进行比较:若sa<d,则根据数据的敏感性等级按如下规则选择加密方式:数据的敏感性等级为一级时,选择不加密;数据的敏感性等级为二级时,选用AES

128算法对数据进行加密;数据的敏感性等级为三级时,选用AES

256算法对数据进行加密;若sa≧d,则根据数据是否包含小数和对数据的计算是否涉及小数选择加密方式:当数据不包含小数且对数据的计算不涉及小数时,则选择同态加密的BFV方案对数据进行加密;
否则,执行(3c);(3c)根据敏感性等级按如下规则选择一种加密方式:若数据的敏感性等级为二级,则选择AES

128算法和同态加密的CKKS方案同时对数据进行加密;若数据的敏感性等级为三级,则选择AES

256算法和同态加密的CKKS方案同时对数据进行加密。2.根据权利要求1所所述的方法,其特征在于,步骤(1a)中设定评估敏感性等级的三方面指标,其内容分别如下:所述隐私方面指标,包括标识个人身份、信息熵,越能标识个人身份的数据,信息熵越大的数据,敏感性等级越高;所述风险方面的指标,是指为数据带来的价值、对数据拥有者的社会影响、恶意攻击者的攻击偏好、已有的防御措施的完备性,数据带来的价值越大,对数据拥有者的社会影响越大,恶意攻击者对该类数据攻击越频繁,已有的其他防御措施越不完备,敏感性等级越高;所述效率方面的指标,是指为计划的安全性投资、数据使用的即时性,计划的安全性投资越高,能够提高数据存储和使用的效率的手段越多,敏感性等级可评估为越高的等级;数据使用的即时性要求越高,数据敏感性等级应该越低。3.根据权利要求1所所述的方法,其特征在于,步骤(2b)中使用模糊综合评价获取多位专家的评估意见,构建从隐私,风险,效率的角度评估数据敏感性等级对应的模糊隶属度矩阵,及评估数据可计算性等级的模糊隶属度矩阵,实现如下:(2b1)从隐私,风险,效率的角度评估敏感性等级时,分别确定因素集和评价集:从隐私的角度评估敏感性等级时,因素集包括:标识个人身份和信息熵这两个隐私方面的指标:从风险的角度评估敏感性等级时,因素集包括:数据带来的价值、对数据拥有者的社会影响、恶意攻击者的攻击偏好、已有的防御措施的完备性这四个风险方面的指标;从效率的角度评估敏感性等级时,因素集包括:计划的安全性投资、数据使用的即时性这两个效率方面的指标;从隐私,风险,效率的角度评估敏感性等级时,评价集均包括:一级、二级、三级这三个数据敏感性等级。(2b2)评估可计算性等级时,确定因素集和评价集:评估可计算性等级时,因素集包括:数据与有价值的预测相关、数据有统计分析的价值、数据与用户分类相关这三个指标,评价集包括:一级、二级、三级这三个数据可计算性等级;(2b3)从隐私,风险,效率的角度评估数据的敏感性等级对应的模糊隶属度矩阵分别为2
×
3矩阵,4
×
3矩阵,3
×
3矩阵;评估数据的可计算性等级的模糊隶属度矩阵为3
×
3矩阵,这四个矩阵中第i行第j列的隶属度记为a
ij
,b
ij
,c
ij
,d
ij
,其表示从对应因素集中第i个指标的角度将数据评估为对应评价集中第j个元素的可能性;(2b4)根据所述四个矩阵互不关联的情况,需要分别确定每个矩阵中的隶属度值,即专家从0,0.1,02,0.3,

,1共11个值中选择三个合适的值确定每行的三个隶属度值,三个隶属度值可以重复,但每行隶属度值相加之和为1,不同行之间隶属度取值互不影响,隶属度
值a
ij
,b
ij
,c
ij
,d
ij
越大,表示从对应因素集中第i个指标的角度评估时,专家将数据评估为对应评价集中第j个元素的把握越大。4.根据权利要求1所所述的方法,其特征在于,步骤(2c)使用每位专家从单个指标的角度评估数据敏感性等级的评估结果计算Hellinger距离,通过Hellinger距离确定每个指标的权重,实现如下:(2c1)评估数据的敏感性等级时,计算多位专家从单个指标角度的评估结果平均值:获取m位专家从标识个人身份、信息熵、数据带来的价值、对数据拥有者的社会影响、恶意攻击者的攻击偏好、已有的防御措施的完备性、计划的安全性投资、数据使用的即时性8个指标中每个指标的角度评估数据的评估结果;将第w个专家从第f个指标的角度评估数据的结果记为R
fw
=(r
f1w
,r
f2w
,r
f3w
),其中r
f1w
、r
f2w
、r
f3w
分别表示第w个专家从第f个指标的角度将数据敏感性等级评估为一级,二级,三级的概率,f为整数,0<f<9,w为整数,0<w<m+1,分别对应专家1,专家2,

,专家m;从隐私的角度评估敏感性等级时,专家w对应的模糊隶属度矩阵中,其第一行,第二行的三列值分别为R
1w
,R
2w
中的三个值;从风险的角度评估敏感性等级时,专家w对应的模糊隶属度矩阵中,其第一行,第二行,第三行,第四行的三列值分别为R
3w
,R
4w
,R
5w
,R
6w
中的三个值;从效率的角度评估敏感性等级时,专家w对应的模糊隶属度矩阵中,其第一行,第二行的三列值分别为R
7w
,R
8w
中的三个值;从第f个指标的角度评估敏感性等级时,计算m位专家的评估结果平均值R
fave
:(2c2)使用Hellinger距离确定每个指标的权重:(2c21)计算专家w的评估结果R
fw
与R
fave
的Hellinger距离HL
fn
:其中,(2c22)计算m位专家的评估结果R
fw
与R
fave
的Hellinger距离之和:(2c23)通过HL
fsum<...

【专利技术属性】
技术研发人员:李金库韩飞贾皓
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1