一种数据加密存储保护系统及方法技术方案

技术编号:39831852 阅读:12 留言:0更新日期:2023-12-29 16:13
本发明专利技术涉及数据处理领域,具体涉及一种数据加密存储保护系统及方法,包括:获取待加密数据;获取各用户各属性数据的关键词集合;将待加密数据任意两个不同的关键词组成目标关键词集合;根据各目标关键词集合及各用户各属性数据的关键词集合得到各关键词的契合序列独特系数;根据各用户各属性数据各关键词在属性数据中出现的频率得到各关键词的关键词独特系数;根据各用户各属性各关键词的契合序列独特系数和关键词独特系数得到各属性数据的属性内容独特指数;根据各属性数据的属性内容独特指数构建各用户的用户角色树进行聚类得到明文初始状态矩阵,利用

【技术实现步骤摘要】
一种数据加密存储保护系统及方法


[0001]本申请涉及数据加密
,具体涉及一种数据加密存储保护系统及方法


技术介绍

[0002]现在各行各业产生的数据信息规模庞大,数据存储已经从纸张存储转变为电子存储,其中,在进行电子存储数据时往往涉及到一些私密

重要的信息数据,如个人重要信息数据

企业重要业务数据等,需要对这些数据进行保护,而且为了保护设备

硬件丢失或者被盗时存储数据的安全,对于存储在计算机硬盘等电子存储上的数据往往需要进行加密处理

[0003]数据加密是一种将原始数据(明文)通过使用密码算法来转化为不可读形式(密文)的过程,加密存储可以防止未经授权的访问者查看或使用保密数据,只有授权的用户才能解密和访问数据,保护了数据的私密性;而且加密存储还可以防止数据被篡改,当攻击者未经授权修改了加密数据,用户解密后的数据与原始数据不匹配,从而提醒用户数据可能已被篡改

在如今的数字化世界中,加密存储已经成为一项不可或缺的安全措施

[0004]传统的数据加密算法如
AES
加密算法采用分组密码的方式,具有高效

便于实现的特点,但是传统
AES
加密算法采用从历史数据选择
128bits
的明文分组的方式,获取明文初始矩阵,此时明文初始矩阵中的相邻字节之间的关联度较大,存在数据加密存储安全性较低的问题

[0005]综上所述,本专利技术提出一种数据加密存储保护系统及方法,通过获取待加密数据,对各用户各属性数据中的关键词出现的频率与其他关键词之间的契合程度进行分析,构建各属性数据的属性内容独特指数,从而构建各用户的用户角色树,通过聚类算法完成各用户数据加密存储保护


技术实现思路

[0006]为了解决上述技术问题,本专利技术提供一种数据加密存储保护系统及方法,所采用的技术方案具体如下:第一方面,本专利技术实施例提供了一种数据加密存储保护方法,该方法包括以下步骤:获取待加密数据,待加密数据包括各用户各属性数据;对各用户各属性数据进行分词处理及筛选得到各用户各属性数据的关键词集合;将待加密数据中的所有关键词组成综合关键词集合,将综合关键词集合中任意两个不同的关键词组成目标关键词集合;对于各目标关键词集合,根据目标关键词集合及各用户各属性数据的关键词集合得到目标关键词集合的关键词语义相似因子;根据目标关键词集合的关键词语义相似因子得到目标关键词集合的关键词语义契合优异指数;根据所有目标关键词集合的关键词语义契合优异指数得到待加密数据中各关键词的契合序列;对于各用户各属性数据各关键词,根据关键词在属性数据中出现的频率得到关键
词的关键词独特系数;根据关键词的契合序列及关键词语义契合优异指数得到关键词的契合序列独特系数;根据关键词的契合序列独特系数和关键词独特系数得到待加密数据各属性数据的属性内容独特指数;根据待加密数据中各属性数据的属性内容独特指数构建各用户的用户角色树,对各用户的用户角色树进行聚类得到明文初始状态矩阵,利用
AES
算法完成数据加密存储保护

[0007]优选的,所述根据目标关键词集合及各用户各属性数据的关键词集合得到目标关键词集合的关键词语义相似因子,包括:对于各用户各属性数据,当属性数据的关键词集合被包含于目标关键词集合,则将属性数据的关键词匹配结果标记为1,否则标记为0;获取属性数据的关键词匹配权重;计算属性数据的关键词匹配结果与关键词匹配权重的乘积,将所有用户所有属性数据的所述乘积的和值作为目标关键词集合的关键词语义相似因子

[0008]优选的,所述获取属性数据的关键词匹配权重,包括:获取目标关键词集合中两个关键词在属性数据的关键词集合中出现的频率;遍历属性数据中所有关键词出现的频率之和;将目标关键词集合中两个关键词的所述频率的和值与所述频率之和的比值作为属性数据的关键词匹配权重

[0009]优选的,所述根据目标关键词集合的关键词语义相似因子得到目标关键词集合的关键词语义契合优异指数,包括:获取所有目标关键词集合中的最大关键词语义相似因子;计算目标关键词集合的关键词语义相似因子与所述最大关键词语义相似因子的比值;将目标关键词集合中两个关键词的归一化
Google
距离的相反数作为以自然常数为底数的指数函数的指数,将所述指数函数与所述比值的乘积作为目标关键词集合的关键词语义契合优异指数

[0010]优选的,所述根据所有目标关键词集合的关键词语义契合优异指数得到待加密数据中各关键词的契合序列,包括:对于待加密数据中各关键词,将关键词所在所有目标关键词集合中的关键词语义契合优异指数的归一化值采用阈值分割算法得到分割阈值,将关键词语义契合优异指数的归一化值大于分割阈值的目标关键词集合中除关键词外的另一个关键词作为关键词的契合关键词,将所有契合关键词与所对应的关键词语义契合优异指数的归一化值组成各二元组;将所有所述二元组组成关键词的契合序列

[0011]优选的,所述根据关键词在属性数据中出现的频率得到关键词的关键词独特系数,包括:获取关键词所在属性数据中出现的频率;将所有用户在相同属性数据种类中出现的关键词的频率和值作为第一和值;将所有用户在相同属性数据种类中具有最大频率关键词的最大频率和值作为第二和值;将所述频率与所述第二和值的乘积结果和所述第一和值的比值作为关键词的关
键词独特系数

[0012]优选的,所述根据关键词的契合序列及关键词语义契合优异指数得到关键词的契合序列独特系数,包括:计算关键词与关键词的契合序列中各契合关键词的契合关键词独特系数;将关键词的契合序列中所有契合关键词的契合关键词独特系数与关键词语义契合优异指数的乘积的均值作为关键词的契合序列独特系数

[0013]优选的,所述计算关键词与关键词的契合序列中各契合关键词的契合关键词独特系数,包括:对于关键词的契合序列中各契合关键词,获取契合关键词在所有用户相同属性数据种类中出现的频率和值作为第三和值;将关键词所在属性数据中出现的频率与所述第二和值的乘积结果和所述第三和值的比值作为契合关键词的契合关键词独特系数

[0014]优选的,所述根据关键词的契合序列独特系数和关键词独特系数得到待加密数据各属性数据的属性内容独特指数,包括:对于待加密数据各属性数据,将所有用户的属性数据中的所有关键词的契合序列独特系数与关键词独特系数之和的和值作为属性数据的属性内容独特指数

[0015]第二方面,本专利技术实施例还提供了一种数据加密存储保护系统,该系统包括待加密数据采集模块

各属性数据的属性内容独特指数提取模块以及各用户数据加密存储保护模块,其中:待加密数据采集模块,获取待加密数据,待加密数据包括各用户各属性数据;各属性数据的属性内容独本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种数据加密存储保护方法,其特征在于,该方法包括以下步骤:获取待加密数据,待加密数据包括各用户各属性数据;对各用户各属性数据进行分词处理及筛选得到各用户各属性数据的关键词集合;将待加密数据中的所有关键词组成综合关键词集合,将综合关键词集合中任意两个不同的关键词组成目标关键词集合;对于各目标关键词集合,根据目标关键词集合及各用户各属性数据的关键词集合得到目标关键词集合的关键词语义相似因子;根据目标关键词集合的关键词语义相似因子得到目标关键词集合的关键词语义契合优异指数;根据所有目标关键词集合的关键词语义契合优异指数得到待加密数据中各关键词的契合序列;对于各用户各属性数据各关键词,根据关键词在属性数据中出现的频率得到关键词的关键词独特系数;根据关键词的契合序列及关键词语义契合优异指数得到关键词的契合序列独特系数;根据关键词的契合序列独特系数和关键词独特系数得到待加密数据各属性数据的属性内容独特指数;根据待加密数据中各属性数据的属性内容独特指数构建各用户的用户角色树,对各用户的用户角色树进行聚类得到明文初始状态矩阵,利用
AES
算法完成数据加密存储保护
。2.
如权利要求1所述的一种数据加密存储保护方法,其特征在于,所述根据目标关键词集合及各用户各属性数据的关键词集合得到目标关键词集合的关键词语义相似因子,包括:对于各用户各属性数据,当属性数据的关键词集合被包含于目标关键词集合,则将属性数据的关键词匹配结果标记为1,否则标记为0;获取属性数据的关键词匹配权重;计算属性数据的关键词匹配结果与关键词匹配权重的乘积,将所有用户所有属性数据的所述乘积的和值作为目标关键词集合的关键词语义相似因子
。3.
如权利要求2所述的一种数据加密存储保护方法,其特征在于,所述获取属性数据的关键词匹配权重,包括:获取目标关键词集合中两个关键词在属性数据的关键词集合中出现的频率;遍历属性数据中所有关键词出现的频率之和;将目标关键词集合中两个关键词的所述频率的和值与所述频率之和的比值作为属性数据的关键词匹配权重
。4.
如权利要求2所述的一种数据加密存储保护方法,其特征在于,所述根据目标关键词集合的关键词语义相似因子得到目标关键词集合的关键词语义契合优异指数,包括:获取所有目标关键词集合中的最大关键词语义相似因子;计算目标关键词集合的关键词语义相似因子与所述最大关键词语义相似因子的比值;将目标关键词集合中两个关键词的归一化
Google
距离的相反数作为以自然常数为底数的指数函数的指数,将所述指数函数与所述比值的乘积作为目标关键词集合的关键词语义契合优异指数
。5.
如权利要求4所述的一种数据加密存储保护方法,其特征在于,所述根据所有目标关键词集合的关键词语义契合优异指数得到待...

【专利技术属性】
技术研发人员:梁敬岚李金鹏魏洁
申请(专利权)人:陕西昕晟链云信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1