一种基于转移矩阵的密文判定方法、系统及设备技术方案

技术编号:31496034 阅读:17 留言:0更新日期:2021-12-18 12:37
本发明专利技术提出的一种基于转移矩阵的密文判定方法、系统及设备,所述方法包括:读取待判定的字符串;为待判定的字符串构建转移矩阵;统计转移矩阵中的非0元素数目X,若X<3,则待判定的字符串为明文;若X≥8,则待判定的字符串为密文;若3≤X<8,则使用预设算法计算转移矩阵的转移密度系数S;若S<0.86,则待判定的字符串为明文;若S≥0.86,则待判定的字符串为明文;输出并显示字符串的判定结果。本发明专利技术能够借助转移矩阵提取字符串的特征,量化字符串包含可读信息的概率,从而满足了密文字符识别的业务需求。业务需求。业务需求。

【技术实现步骤摘要】
一种基于转移矩阵的密文判定方法、系统及设备


[0001]本专利技术涉及字符识别
,更具体的说是涉及一种基于转移矩阵的密文判定方法、系统及设备。

技术介绍

[0002]随着信息化时代的到来,信息安全问题逐渐被人们所重视,于是产生了各种各样的加密算法来对信息进行加密。数据加密的基本过程是通过某种特殊算法改变原有信息数据,使其成为一段不可读的码文。这段不可读的码文即称为密文。
[0003]目前,国际上通用的加密方式有DES、TDES、AES、Blowfish、CAST5、SM4、RC2、IDEA、SEED等。他们中多数采用Feistel的网络结构体制对信息进行代换和移位等操作,最终输出一个信息熵较高的字符串。随着密文的广泛使用,客户对各类信息进行处理时往往需要对字符串中的密文字段进行筛选和识别。
[0004]但是现有的字符串识别算法通常采用逐个字符进行识别判断的方式,无法完整的提取出字符类型转换的概率特征,而且存在计算复杂度高、执行效率低下的缺陷,无法满足密文字符识别的业务需求。

技术实现思路

[0005]针对现有技术中存在的问题,本专利技术的目的在于提供一种基于转移矩阵的密文判定方法、系统及设备,能够借助转移矩阵提取字符串的特征,量化字符串包含可读信息的概率,从而满足了密文字符识别的业务需求。
[0006]本专利技术为实现上述目的,通过以下技术方案实现:
[0007]一种基于转移矩阵的密文判定方法,包括:
[0008]读取待判定的字符串;
[0009]为待判定的字符串构建转移矩阵;
[0010]统计转移矩阵中的非0元素数目X,若X<3,则待判定的字符串为明文;若X≥8,则待判定的字符串为密文;
[0011]若3≤X<8,则使用预设算法计算转移矩阵的转移密度系数S;
[0012]若S<0.86,则待判定的字符串为明文;若S≥0.86,则待判定的字符串为明文;输出并显示字符串的判定结果。
[0013]进一步,所述为待判定的字符串构建转移矩阵包括:
[0014]若待判定的字符串长度为d,构建转移矩阵A,转移矩阵A内的元素可以表示为A
i,j
,A
i,j
的初始值为0其中i为行序号,j为列序号;
[0015]设行标签依次为:大写字母、小写字母、数字和特殊符号;列标签依次为:大写字母、小写字母、数字和特殊符号;
[0016]根据待判定的字符串中相邻字符的类型确定转移矩阵A内每个元素的值;
[0017]其中,A
1,1
为相邻字符均为大写字母数目、A
1,2
为相邻字符为大写字母、小写字母的
数目,A
1,3
为相邻字符为大写字母、数字的数目,A
1,4
为相邻字符为大写字母、特殊符号的数目,A
2,1
为相邻字符为小写字母、大写字母数目、A
2,2
为相邻字符均为小写字母的数目,A
2,3
为相邻字符为小写字母、数字的数目,A
2,4
为相邻字符为小写字母、特殊符号的数目,A
3,1
为相邻字符为数字、大写字母数目、A
3,2
为相邻字符为数字、小写字母的数目,A
3,3
为相邻字符均为数字的数目,A
2,4
为相邻字符为数字、特殊符号的数目,A
4,1
为相邻字符为特殊符号、大写字母数目、A
3,2
为相邻字符为特殊符号、小写字母的数目,A
3,3
为相邻字符为特殊符号、数字的数目,A
2,4
为相邻字符均为特殊符号的数目。
[0018]进一步,所述使用预设算法计算转移矩阵的转移密度系数S包括如下步骤:
[0019]S31:根据构建转移矩阵A计算字符类型的转换频率;
[0020]S32:根据构建转移矩阵A计算字符类型的非转换频率;
[0021]S33:根据字符类型的转换频率和字符类型的非转换频率计算转移矩阵的转移密度系数S。
[0022]进一步,所述步骤S31包括:
[0023]通过以下公式计算字符类型的转换频率P
SWiCh
:
[0024][0025]进一步,所述步骤S32包括:
[0026]根据转移矩阵A对角线元素表示相邻字符类别相同的数目,则通过以下公式计算字符类型非转换频率P
retain

[0027][0028]进一步,所述步骤S33包括:
[0029]通过以下公式计算转移矩阵转移密度系数S:
[0030][0031]相应的,本专利技术还公开了一种基于转移矩阵的密文判定系统,包括:
[0032]读取模块,用于读取待判定的字符串;
[0033]矩阵构建模块,用为待判定的字符串构建转移矩阵;
[0034]统计模块,用于统计转移矩阵中的非0元素数目X,若X<3,则待判定的字符串为明文;若X≥8,则待判定的字符串为密文;若3≤X<8,则将转移矩阵发送至计算模块;
[0035]计算模块,用于使用预设算法计算转移矩阵的转移密度系数S;
[0036]判断模块,用于根据转移密度系数S判断待判定的字符串为密文或明文;
[0037]输出模块,用于输出并显示字符串的判定结果。
[0038]相应的,本专利技术还公开了一种基于转移矩阵的密文判定设备,包括:
[0039]存储器,用于存储计算机程序;
[0040]处理器,用于执行所述计算机程序时实现如上文任一项所述基于转移矩阵的密文判定方法的步骤。
[0041]对比现有技术,本专利技术有益效果在于:本专利技术提供了一种基于转移矩阵的密文判定方法、系统及设备,能够在需要大批量判定密文的场景下有效提高了判定的效率。具体来
说,首先通过统计字符串内字符类型特征构造类型转移矩阵,此构造过程相当于特征工程化过程,且保留了完整的转换信息。然后基于字符串类型转移的特征,输出特定转换类型的概率和转移密度系数。根据转换信息和转移密度系数实现了字符串的密文判定。
[0042]本专利技术简便易用、步骤清晰、复用率高。本专利技术通过转移矩阵的特性能够完整的提取出字符类型转换的概率特征。本专利技术计算复杂度低,执行效率高。可以应用于大批量检测判定密文的场景。基于转移矩阵的密文概率检测可以帮助企业、政府、安全组织或个人快速筛选密文字段。本专利技术既可以满足密文判定的基本要求,还可以帮助分析人员进一步全面的统计和分析密文的特征。
[0043]由此可见,本专利技术与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
[0044]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于转移矩阵的密文判定方法,其特征在于,包括:读取待判定的字符串;为待判定的字符串构建转移矩阵;统计转移矩阵中的非0元素数目X,若X<3,则待判定的字符串为明文;若X≥8,则待判定的字符串为密文;若3≤X<8,则使用预设算法计算转移矩阵的转移密度系数S;若S<0.86,则待判定的字符串为明文;若S≥0.86,则待判定的字符串为明文;输出并显示字符串的判定结果。2.根据权利要求1所述的基于转移矩阵的密文判定方法,其特征在于,所述为待判定的字符串构建转移矩阵包括:若待判定的字符串长度为d,构建转移矩阵A,转移矩阵A内的元素可以表示为A
i,j
,A
i,j
的初始值为0其中i为行序号,j为列序号;设行标签依次为:大写字母、小写字母、数字和特殊符号;列标签依次为:大写字母、小写字母、数字和特殊符号;根据待判定的字符串中相邻字符的类型确定转移矩阵A内每个元素的值;其中,A
1,1
为相邻字符均为大写字母数目、A
1,2
为相邻字符为大写字母、小写字母的数目,A
1,3
为相邻字符为大写字母、数字的数目,A
1,4
为相邻字符为大写字母、特殊符号的数目,A
2,1
为相邻字符为小写字母、大写字母数目、A
2,2
为相邻字符均为小写字母的数目,A
2,3
为相邻字符为小写字母、数字的数目,A
2,4
为相邻字符为小写字母、特殊符号的数目,A
3,1
为相邻字符为数字、大写字母数目、A
3,2
为相邻字符为数字、小写字母的数目,A
3,3
为相邻字符均为数字的数目,A
2,4
为相邻字符为数字、特殊符号的数目,A
4,1
为相邻字符...

【专利技术属性】
技术研发人员:张文雪刘洋洋孙琦孟维英娄爱涛
申请(专利权)人:中孚安全技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1