一种口令猜测集生成系统及方法技术方案

技术编号：24410509 阅读：19 留言：0更新日期：2020-06-06 08:59

本发明专利技术属于信息安全技术领域，公开了一种口令猜测集生成系统及方法，生成基于个人信息和口令数据库的概率上下文无关文法；对概率上下文无关文法中的字符串按分类规则分为适合或不适合用于训练长短期记忆神经网络的字符串；训练出收敛的长短期记忆神经网络模型；用收敛的长短期记忆神经网络模型生成口令段和与口令段相对应的概率；将与口令段相对应的概率映射为新概率，并将口令段按新概率降序排序；生成按概率降序排序的口令。本发明专利技术弥补了长短期记忆神经网络无法识别口令中的组成结构和语义信息，可解释性差的缺点；弥补了概率上下文无关文法泛化能力差的缺点；解决了长短期记忆神经网络生成口令段的概率偏低的问题。

A generating system and method of password guessing set

全部详细技术资料下载

【技术实现步骤摘要】
一种口令猜测集生成系统及方法
本专利技术属于信息安全
，尤其涉及一种口令猜测集生成系统及方法。
技术介绍
目前，最接近的现有技术：随着网络与便携式电子设备的不断发展，人们的日常生活与网络变得息息相关，身份认证逐渐成为保障用户信息安全的基本手段。口令作为一种身份认证的方式，因其简单且易部署的特点被广泛应用，已成为互联网世界里保护用户信息安全的最主要手段之一。因此，口令的安全性和可用性是人们一直非常关注的问题。口令猜测算法是研究口令安全的重要方法之一，其基本思想是生成一个用于猜测用户口令的口令猜测集。最原始的口令猜测集生成方法是枚举所有符合条件的口令，但由于整个口令搜索空间异常庞大，该方法可行性差、效率极低。随后，人们尝试从词典中选择使用频繁的单词或数字，并将其组合或稍作修改来做为口令猜测集，这些组合规则或修改规则相对简单，无法准确地描述人们生成口令的习惯，并且没有对这些口令的概率加以描述，使得猜测效率低下。然后，人们又使用概率模型，如概率上下文无关文法(Probabilisticcontext-freegrammar,简称PCFG)和马尔可夫(Markov)模型来生成口令猜测集，然而马尔可夫模型只能计算前后字符之间出现的可能性，无法识别口令的组成结构及语义信息，概率上下文无关文法虽然可以识别口令中的结构和一部分语义信息，但无法将口令进行泛化，只能将训练集中出现的口令段进行组合。近期出现了使用长短期记忆神经网络或生成对抗网络生成口令猜测集的方式，其利用神经网络对高维空间的拟合优势取得了较好的猜测效果，具有较...

【技术保护点】
1.一种口令猜测集生成方法，其特征在于，所述口令猜测集生成方法包括以下步骤：/n第一步，生成基于个人信息和口令数据库的概率上下文无关文法；对概率上下文无关文法中的字符串按分类规则分为适合或不适合用于训练长短期记忆神经网络的字符串；/n第二步，训练出收敛的长短期记忆神经网络模型；用收敛的长短期记忆神经网络模型生成口令段和与口令段相对应的概率；/n第三步，将与口令段相对应的概率映射为新概率，并将口令段按新概率降序排序；生成按概率降序排序的口令。/n

【技术特征摘要】
1.一种口令猜测集生成方法，其特征在于，所述口令猜测集生成方法包括以下步骤：
第一步，生成基于个人信息和口令数据库的概率上下文无关文法；对概率上下文无关文法中的字符串按分类规则分为适合或不适合用于训练长短期记忆神经网络的字符串；
第二步，训练出收敛的长短期记忆神经网络模型；用收敛的长短期记忆神经网络模型生成口令段和与口令段相对应的概率；
第三步，将与口令段相对应的概率映射为新概率，并将口令段按新概率降序排序；生成按概率降序排序的口令。

2.如权利要求1所述的口令猜测集生成方法，其特征在于，所述第一步根据个人信息模式，利用最长前缀匹配算法对个人信息和口令数据库中的口令进行个人信息模式的匹配、划分和标记，与个人信息不匹配的部分按其是字母、数字还是特殊符号，分别标记为L、D和S，并用下标表示该部分的长度，然后计算每个模式中每个字符串的概率，最后将基本终端和同一模式的字符串按概率降序排序，生成基于个人信息和口令数据库的概率上下文无关文法。

3.如权利要求2所述的口令猜测集生成方法，其特征在于，所述个人信息模式包括；
模式的匹配、划分和标记是指使用最长前缀匹配算法进行匹配，然后将口令划分为段，各段按匹配的模式进行标记；
个人信息模式的概率为1，个人信息是固定的；
模式为L，D和S的字符串，计算每个模式中每个字符串的概率的公式为：

其中，n为字符串出现的次数，m为模式出现的次数。

4.如权利要求1所述的口令猜测集生成方法，其特征在于，所述第一步对生成的概率上下文无关文法中的字符串按分类规则分类，分类规则为：若字符串的模式为个人信息模式，则该字符串为不适合用于训练长短期记忆神经网络的字符串；若字符串模式为L、D、S模式且长度小于等于4，则该字符串为不适合用于训练长短期记忆神经网络的字符串；若字符串模式为L、D、S模式且长度大于4，则该字符串为适合用于训练长短期记忆神经网络的字符串。

5.如权利要求1所述的口令猜测集生成方法，其特征在于，所述第二步对于每一个适合用于训练长短期记忆神经网络的字符串，将这个字符串不同时刻的字符依次传入长短期记忆神经网络的输入层，长短期记忆神经网络的输出是对字符串中下一个时刻的字符的预测；
训练长短期记忆神经网络时使用的损失函数为交叉熵损失函数；
训练长短期记忆神经网络时使用的优化算法为Adam或其他自适应学习速率的方法；
收敛是指长短期记忆神经网络的参数使得损失函数的值数学上收敛于某值。...

【专利技术属性】
技术研发人员：杨超，张静，尤伟，郑昱，闫志成，朱泉龙，
申请(专利权)人：西安电子科技大学，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人