一种大数据量的安全存储方法及装置制造方法及图纸

技术编号：39675982 阅读：30 留言：0更新日期：2023-12-11 18:42

本发明专利技术提供的一种大数据量的安全存储方法及装置，其方法包括：获取建立数据共享关系的每一个数据源的敏感数据集；对于每一个数据源的敏感数据集进行交叉计算，得到每一个数据源和其他数据源的数据重复情况，根据所有数据源的数据重复情况建立数据存储模型，将数据存储模型作为目标函数且以所有数据源的数据存储最小值作为优化目标，将目标函数的最优解作为数据存储策略；根据数据存储策略对非重复数据子集分别进行加密存储，对于重复数据子集仅加密存储一份，通过数据共享实现敏感数据在不同数据源的数据传输，以完成敏感数据集的安全存储

全部详细技术资料下载

【技术实现步骤摘要】
一种大数据量的安全存储方法及装置

[0001]本专利技术涉及数据存储
，特别涉及一种大数据量的安全存储方法及装置
。

技术介绍

[0002]随着大数据时代的到来，数据的重要性越来越明显，但也带来了以下的问题：用户担忧自身的隐私数据在网络上被随意地窃取盗用，因此，对于用户的敏感数据进行安全存储是至关重要的，比如专利申请号
CN202010478176.3
的一种基于大数据的档案数据存储系统，对档案数据进行加密存储，并进行一主两备合计三份数据的存储，后续在数据读写的时候可以相互验证，以防止数据被破坏或者被篡改
。
[0003]然而，敏感数据的安全存储在硬件方面
、
软件方面等各方面的性能要求都比普通数据的常规存储来说要高，因此，随着敏感数据越来越多，企业对于敏感数据的安全存储压力也越来越大，如何减轻敏感数据的安全存储所带来的性能压力，成为当下一个急需解决的问题
。

技术实现思路

[0004]为了解决现有技术的上述问题，本专利技术提供一种大数据量的安全存储方法及装置，能够在大数据量的情况下，减轻敏感数据的安全存储压力
。
[0005]为了达到上述目的，本专利技术采用的技术方案为：
[0006]第一方面，本专利技术提供一种大数据量的安全存储方法，包括步骤：
[0007]获取建立数据共享关系的每一个数据源的敏感数据集；
[0008]对于每一个数据源的敏感数据集进行交叉计算，得到每一个数据源和其他数据源的...

【技术保护点】

【技术特征摘要】
1.
一种大数据量的安全存储方法，其特征在于，包括步骤：获取建立数据共享关系的每一个数据源的敏感数据集；对于每一个数据源的敏感数据集进行交叉计算，得到每一个数据源和其他数据源的数据重复情况，根据所有数据源的数据重复情况建立数据存储模型，将所述数据存储模型作为目标函数且以所有数据源的数据存储最小值作为优化目标，将所述目标函数的最优解作为数据存储策略；根据所述数据存储策略对每一个数据源的敏感数据集进行拆分，得到每一个数据源的敏感数据子集，其中，所述敏感数据子集包括重复数据子集和非重复数据子集；对于所述重复数据子集，仅在其中一个数据源中加密存储所述重复数据子集，得到所述重复数据子集的第一存储位置和唯一数据标识，并在其余数据源的数据库中删除所述重复数据子集，将所述重复数据子集的第一存储位置
、
所述唯一数据标识以及对应数据源的唯一来源标识进行上链存储，并将所述第一存储位置发送至被删除的数据源；对于所述非重复数据子集，每一个数据源分别进行加密存储，以完成所述敏感数据集的安全存储
。2.
根据权利要求1所述的一种大数据量的安全存储方法，其特征在于，所述根据所有数据源的数据重复情况建立数据存储模型包括步骤：根据所有数据源的数据重复情况，将所有数据源的重复数据按照仅计算一份且不重复计算的原则来计算所有数据源的数据存储量，得到数据存储模型
。3.
根据权利要求1所述的一种大数据量的安全存储方法，其特征在于，所述对于所述重复数据子集，仅在其中一个数据源中加密存储所述重复数据子集包括步骤：对于所述重复数据子集，按照对应数据源的使用频率和加密等级选取其中一个数据源，以加密存储所述重复数据子集
。4.
根据权利要求1所述的一种大数据量的安全存储方法，其特征在于，还包括步骤：对于第一数据源来说，当接收到第一数据请求时，判断...

【专利技术属性】
技术研发人员：张美跃，陈伏前，周业，
申请(专利权)人：恒瑞通福建信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人