一种结合数据局部性特征的频率分析方法技术

技术编号:15394871 阅读:93 留言:0更新日期:2017-05-19 06:35
本发明专利技术属于密码学领域,公开了一种结合数据局部性特征的频率分析方法,在获取的最新版本的密文数据块序列C与之前备份的明文数据块序列M相关性很低的情况下,依然能够获得较高的破译率;将明文数据块和密文数据块根据频率大小进行排名并将排名前u的明密文分别按名次进行配对,获得u组明密文对,再找到与其中一对明密文对相邻的明文数据块和密文数据块,将找出的明文数据块和密文数据块分别按频率排序,获得排名前v的明密文对,将两次获得的明密文对均加入到破译集合T和迭代集合G,将迭代集合G中的明密文对进行重复寻找相邻数据块的步骤,直至迭代集合为空集,最后形成的破译集合即为最终结果。

【技术实现步骤摘要】
一种结合数据局部性特征的频率分析方法
本专利技术涉及密码学领域,特别是一种结合数据局部性特征的频率分析方法。
技术介绍
重复数据删除(简称数据去重)技术通过识别数据流中的冗余,只传输或存储唯一数据,而使用指向已存储数据的指针替换重复副本,以达到节省传输带宽或存储空间的目的。在支持数据去重的存储系统(统称为数据去重系统)中,去重后的任意数据块都被一个或多个文件引用,而文件则以指向这些数据块的指针的集合形式存储。这种文件共用数据块的存储模式强调了数据块的敏感性,因为一个数据块的泄漏可能扩散影响到共用这个数据块的所有文件。为了保护数据隐私,一种普遍的方法是数据加密。在传统的安全加密方式下,每个用户应具有不同的密钥,这样不同用户之间的相同数据会被加密为不同密文,难以被执行去重操作。现有技术是采用收敛加密来加密数据块:收敛加密基于数据块的内容来产生加密密钥(例如数据块的哈希值),可把相同的明文数据块加密为相同的密文数据块,从而能够在保护数据隐私的基础上支持数据密文的去重。另一方面,由于收敛加密将相同的数据加密为了相同的密文(即为确定性加密),不可避免地会泄漏数据块的频率信息,例如如果一个明文数据块出现了n次,则它对应的密文数据块也将出现n次。传统频率分析是一种古典的密码分析方法,可用于破解确定性加密(例如替换密码)。应用频率分析来破译密文去重系统主要包括如下两个步骤:步骤1,分别将已知备份M中的明文数据块和目标备份C中的密文数据块进行频率排序;步骤2,将C中的每个密文数据块映射为M中与其具有相同名次的明文数据块。传统频率分析方法在密文去重系统中的破译效果有限(通过基于真实数据集的实验分析,仅能正确破译0.0001%的数据块),这主要出于两方面原因:①由于M可能是一个较早时间点(例如若干个月之前)的备份,其中的数据块与最新版本备份中的数据块内容存在差异,会打乱M和C中数据块频率排序的对应关系,导致错误的破译;②在M(和C)的频率排序中可能存在许多具有相同频率的明文数据块(和密文数据块),频率分析方法难以正确对应这些具有相同频率的明文数据块(和密文数据块)。lp优化方法是最新提出的一种基于组合最优化的频率分析方法,已经被应用于破译确定性加密;然而,通过实验分析,传统频率分析方法能够达到与lp优化方法相同的破译效果;最新研究指出lp最优化方法实质上与传统频率分析方法是等价的。
技术实现思路
基于以上技术问题,本专利技术提供了一种结合数据局部性特征的频率分析方法,在获取的最新版本的密文数据块序列与之前备份的明文数据块序列相关性很低的情况下,依然能够获得较高的破译率。本专利技术采用的技术方案如下:一种结合数据局部性特征的频率分析方法,所述频率分析方法包括以下步骤:步骤1:根据最新版本加密备份时产生的密文数据块序列C和之前备份时产生的未加密的明文数据块序列M判断攻击模式,所述攻击模式包括唯密文攻击模式和已知明文攻击模式;步骤2:在所述唯密文攻击模式下,将明文数据块序列M中的明文数据块Mi根据出现频率高低进行排序并取出前u个明文数据块将密文数据块序列C中的密文数据块Cj根据出现频率高低进行排序并取出前u个密文数据块将k值相同的明文数据块和密文数据块配对,得到u组明密文对,将所述u组明密文对加入到破译集合T和迭代集合G;在所述已知明文攻击模式下,已知密文数据块序列C中的x个密文数据块和与所述密文数据块对应的明文数据块,得到x组明密文对,将所述x组明密文对加入到迭代集合G;其中,k代表频率排名的序号且k=1,2,…,u,i代表明文数据块的序号,j代表密文数据块的序号;步骤3:从迭代集合G中取出一组明密文对和从明文数据块序列M中提取出与明文数据块左相邻的所有明文数据块,构成左相邻明文集合从明文数据块序列M中提取出与明文数据块右相邻的所有明文数据块,构成右相邻明文集合从密文数据块序列C中提取出与密文数据块左相邻的所有密文数据块,构成左相邻密文集合从密文数据块序列C中提取出与密文数据块右相邻的所有密文数据块,构成右相邻密文集合步骤4:将左相邻明文集合中的明文数据块根据与同时出现的频率高低进行排名,将左相邻密文集合中的密文数据块根据与同时出现的频率高低进行排名,分别将两次排名前v的明文数据块和密文数据块取出并按相同名次进行配对,得到v组明密文对;将右相邻明文集合中的明文数据块根据与同时出现的频率高低进行排名,将右相邻密文集合中的密文数据块根据与同时出现的频率高低进行排名,分别将两次排名前v的明文数据块和密文数据块取出并按相同名次进行配对,得到v组明密文对;最终得到2v组明密文对,剔除在破译集合T中出现过的明密文对,将所述2v组明密文对中剩余的明密文对加入到破译集合T和迭代集合G;步骤5:重复步骤3和步骤4,直至迭代集合G为空集,最终输出的破译集合T中的所有明密文对为所破译的密文数据块。综上所述,由于采用了上述技术方案,本专利技术的有益效果是:在最新版本加密备份时产生的密文数据块序列和之前备份时产生的未加密的明文数据块序列相关性很小的前提下,利用明文数据块破译密文数据块,亦能获得较大的破解率,这样有助于有效利用资源,实现数据破译的目的;通过优化u和v的参数值,即可调节频率分析方法中明密文对的选取方式,提高破译的正确率,具有很强的实用性;在实际分析中,迭代集合可能随着备份大小的增加变得非常大,会耗尽储存空间,可进一步加入一个参数w合理限制迭代集合的大小,节约空间且使该破译方法变得灵活。附图说明图1是本专利技术的频率分析的系统流程图;图2是实施例1的算法实现图;图3是实施例2中破译流程图;图4是实施例3中唯密文攻击模式下基于FSL真实数据集的结果图;图5是实施例3中唯密文攻击模式下基于虚拟数据集的结果图;图6是实施例3中已知明文攻击模式下的结果图。具体实施方式本说明书中公开的所有特征,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。下面结合附图对本专利技术作详细说明。一种结合数据局部性特征的频率分析方法,所述频率分析方法包括以下步骤:步骤1:根据最新版本加密备份时产生的密文数据块序列C和之前备份时产生的未加密的明文数据块序列M判断攻击模式,所述攻击模式包括唯密文攻击模式和已知明文攻击模式;步骤2:在所述唯密文攻击模式下,将明文数据块序列M中的明文数据块Mi根据出现频率高低进行排序并取出前u个明文数据块将密文数据块序列C中的密文数据块Cj根据出现频率高低进行排序并取出前u个密文数据块将k值相同的明文数据块和密文数据块配对,得到u组明密文对,将所述u组明密文对加入到破译集合T和迭代集合G;在所述已知明文攻击模式下,已知密文数据块序列C中的x个密文数据块和与所述密文数据块对应的明文数据块,得到x组明密文对,将所述x组明密文对加入到迭代集合G;其中,k代表频率排名的序号且k=1,2,…,u,i代表明文数据块的序号,j代表密文数据块的序号;步骤3:从迭代集合G中取出一组明密文对和从明文数据块序列M中提取出与明文数据块左相邻的所有明文数据块,构成左相邻明文集合从明文数据块序列M中提取出与明文数据块右相邻的所有明文数据块,构成右相邻明文集合从密文数据块序列C中提取出与密文数据块左相邻的所有密文数据块,构成左相邻密文集合从密文数据块序列C中提取出与密文数据块右相邻本文档来自技高网
...
一种结合数据局部性特征的频率分析方法

【技术保护点】
一种结合数据局部性特征的频率分析方法,其特征在于:所述频率分析方法包括以下步骤:步骤1:根据最新版本加密备份时产生的密文数据块序列C和之前备份时产生的未加密的明文数据块序列M判断攻击模式,所述攻击模式包括唯密文攻击模式和已知明文攻击模式;步骤2:在所述唯密文攻击模式下,将明文数据块序列M中的明文数据块M

【技术特征摘要】
1.一种结合数据局部性特征的频率分析方法,其特征在于:所述频率分析方法包括以下步骤:步骤1:根据最新版本加密备份时产生的密文数据块序列C和之前备份时产生的未加密的明文数据块序列M判断攻击模式,所述攻击模式包括唯密文攻击模式和已知明文攻击模式;步骤2:在所述唯密文攻击模式下,将明文数据块序列M中的明文数据块Mi根据出现频率高低进行排序并取出前u个明文数据块将密文数据块序列C中的密文数据块Cj根据出现频率高低进行排序并取出前u个密文数据块将k值相同的明文数据块和密文数据块配对,得到u组明密文对,将所述u组明密文对加入到破译集合T和迭代集合G;在所述已知明文攻击模式下,已知密文数据块序列C中的x个密文数据块和与所述密文数据块对应的明文数据块,得到x组明密文对,将所述x组明密文对加入到迭代集合G;其中,k代表频率排名的序号且k=1,2,…,u,i代表明文数据块的序号,j代表密文数据块的序号;步骤3:从迭代集合G中取出一组明密文对和从明文数据块序列M中提取出与明文数据块左相邻的所有明文数据块,构成左相邻明文集...

【专利技术属性】
技术研发人员:李经纬秦川李柏晴张小松
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1