一种口令猜测集生成系统及方法技术方案

技术编号:24410509 阅读:19 留言:0更新日期:2020-06-06 08:59
本发明专利技术属于信息安全技术领域,公开了一种口令猜测集生成系统及方法,生成基于个人信息和口令数据库的概率上下文无关文法;对概率上下文无关文法中的字符串按分类规则分为适合或不适合用于训练长短期记忆神经网络的字符串;训练出收敛的长短期记忆神经网络模型;用收敛的长短期记忆神经网络模型生成口令段和与口令段相对应的概率;将与口令段相对应的概率映射为新概率,并将口令段按新概率降序排序;生成按概率降序排序的口令。本发明专利技术弥补了长短期记忆神经网络无法识别口令中的组成结构和语义信息,可解释性差的缺点;弥补了概率上下文无关文法泛化能力差的缺点;解决了长短期记忆神经网络生成口令段的概率偏低的问题。

A generating system and method of password guessing set

【技术实现步骤摘要】
一种口令猜测集生成系统及方法
本专利技术属于信息安全
,尤其涉及一种口令猜测集生成系统及方法。
技术介绍
目前,最接近的现有技术:随着网络与便携式电子设备的不断发展,人们的日常生活与网络变得息息相关,身份认证逐渐成为保障用户信息安全的基本手段。口令作为一种身份认证的方式,因其简单且易部署的特点被广泛应用,已成为互联网世界里保护用户信息安全的最主要手段之一。因此,口令的安全性和可用性是人们一直非常关注的问题。口令猜测算法是研究口令安全的重要方法之一,其基本思想是生成一个用于猜测用户口令的口令猜测集。最原始的口令猜测集生成方法是枚举所有符合条件的口令,但由于整个口令搜索空间异常庞大,该方法可行性差、效率极低。随后,人们尝试从词典中选择使用频繁的单词或数字,并将其组合或稍作修改来做为口令猜测集,这些组合规则或修改规则相对简单,无法准确地描述人们生成口令的习惯,并且没有对这些口令的概率加以描述,使得猜测效率低下。然后,人们又使用概率模型,如概率上下文无关文法(Probabilisticcontext-freegrammar,简称PCFG)和马尔可夫(Markov)模型来生成口令猜测集,然而马尔可夫模型只能计算前后字符之间出现的可能性,无法识别口令的组成结构及语义信息,概率上下文无关文法虽然可以识别口令中的结构和一部分语义信息,但无法将口令进行泛化,只能将训练集中出现的口令段进行组合。近期出现了使用长短期记忆神经网络或生成对抗网络生成口令猜测集的方式,其利用神经网络对高维空间的拟合优势取得了较好的猜测效果,具有较强的泛化能力,然而同马尔可夫模型类似,其无法识别口令中的组成结构和语义信息。综上所述,现有技术存在的问题是:现有口令猜测集生成技术中存在无法兼顾口令的组成结构、语义信息和泛化能力的问题,导致生成的口令猜测集无法准确描述人们生成口令的习惯,使用现有技术生成的口令猜测集猜测口令时,需要花费大量的时间并消耗大量的计算资源才能取得比较理想的猜测效果。解决上述技术问题的难度:由于现有口令猜测集生成技术所利用的概率模型的不同,其生成的口令的概率遵循各自的衡量标准,例如,对同一个口令,不同口令猜测集生成技术给出的概率不同,有时甚至相差几个数量级,因此无法简单地根据不同模型生成的口令的概率将不同模型生成的口令合并在一起,并按概率降序排序。解决上述技术问题的意义:更深入地理解人们构造口令的习惯,帮助人们减少弱口令的使用;更深入地理解口令猜测攻击者的能力,从而想办法规避;更深入地理解口令的安全性和可用性,帮助系统管理员阻止弱口令的使用;加快口令猜测速度,为数字取证提供更好的技术保障。
技术实现思路
针对现有技术存在的问题,本专利技术提供了一种口令猜测集生成系统及方法。本专利技术是这样实现的,一种口令猜测集生成方法,所述口令猜测集生成方法包括以下步骤:第一步,生成基于个人信息和口令数据库的概率上下文无关文法;对概率上下文无关文法中的字符串按分类规则分为适合或不适合用于训练长短期记忆神经网络的字符串;第二步,训练出收敛的长短期记忆神经网络模型;用收敛的长短期记忆神经网络模型生成口令段和与口令段相对应的概率;第三步,将与口令段相对应的概率映射为新概率,并将口令段按新概率降序排序;生成按概率降序排序的口令。进一步,所述第一步根据个人信息模式,利用最长前缀匹配算法对个人信息和口令数据库中的口令进行个人信息模式的匹配、划分和标记,与个人信息不匹配的部分按其是字母、数字还是特殊符号,分别将其标记为L、D和S,并用下标表示该部分的长度,然后计算每个模式中每个字符串的概率,最后将基本终端和同一模式的字符串按概率降序排序,生成基于个人信息和口令数据库的概率上下文无关文法。进一步,所述个人信息模式包括;模式的匹配、划分和标记是指使用最长前缀匹配算法进行匹配,然后将口令划分为段,各段按匹配的模式进行标记;个人信息模式的概率为1,个人信息是固定的;模式为L,D和S的字符串,计算每个模式中每个字符串的概率的公式为:其中,n为字符串出现的次数,m为模式出现的次数。进一步,所述第一步对生成的概率上下文无关文法中的字符串按分类规则分类,分类规则为:若字符串的模式为个人信息模式,则该字符串为不适合用于训练长短期记忆神经网络的字符串;若字符串模式为L、D、S模式且长度小于等于4,则该字符串为不适合用于训练长短期记忆神经网络的字符串;若字符串模式为L、D、S模式且长度大于4,则该字符串为适合用于训练长短期记忆神经网络的字符串。进一步,所述第二步对于每一个适合用于训练长短期记忆神经网络的字符串,将这个字符串不同时刻的字符依次传入长短期记忆神经网络的输入层,长短期记忆神经网络的输出是对字符串中下一个时刻的字符的预测;训练长短期记忆神经网络时使用的损失函数为交叉熵损失函数;训练长短期记忆神经网络时使用的优化算法为Adam或其他自适应学习速率的方法;收敛是指长短期记忆神经网络的参数使得损失函数的值数学上收敛于某值。进一步,所述第三步将生成的概率大于某个阈值的口令段的概率按映射函数映射为新概率,并将口令段按新概率降序排序,映射函数为:其中,p旧指生成的某个概率大于p阈值的口令段的概率,∑pi指生成的所有概率大于p阈值的口令段的概率的和,p阈值根据所需生成口令猜测集的大小自由选择。进一步,利用生成的概率上下文无关文法中的基本终端及概率;分类为不适合用于训练长短期记忆神经网络的字符串及概率和映射后的口令段及新概率生成口令及概率,使用next函数生成按概率降序排序的口令,其中生成口令的方法为逐个替换基本终端中的个人信息模式为猜测目标的相应模式的相应个人信息,模式为L、D或S且下标小于等于4的模式被替换成概率上下文无关文法中的相应字符串,模式为L、D或S且下标大于4的模式被替换成概率映射模块映射后的口令段,概率的计算方法为基本终端的概率乘以不适合用于训练长短期记忆神经网络的相应字符串的概率或概率映射模块映射后的口令段的新概率;最后一个口令概率的计算过程为本专利技术的另一目的在于提供一种实施所述口令猜测集生成方法的口令猜测集生成系统,所述口令猜测集生成系统包括:文法生成模块,用于生成基于个人信息和口令数据库的概率上下文无关文法;字符串分类模块,用于对文法生成模块生成的概率上下文无关文法中的字符串按分类规则分为适合用于训练长短期记忆神经网络的字符串和不适合用于训练长短期记忆神经网络的字符串;模型训练模块,用于使用字符串分类模块分类为适合用于训练长短期记忆神经网络的字符串训练长短期记忆神经网络,并训练出收敛的长短期记忆神经网络模型;口令段生成模块,用于使用模型训练模块训练出的收敛的长短期记忆神经网络模型生成口令段和与口令段相对应的概率;概率映射模块,用于将与口令段相对应的概率按映射函数映射为新概率,并将口令段按新概率降序排序;口令生成模块,用于利用文法生成模块生成本文档来自技高网
...

【技术保护点】
1.一种口令猜测集生成方法,其特征在于,所述口令猜测集生成方法包括以下步骤:/n第一步,生成基于个人信息和口令数据库的概率上下文无关文法;对概率上下文无关文法中的字符串按分类规则分为适合或不适合用于训练长短期记忆神经网络的字符串;/n第二步,训练出收敛的长短期记忆神经网络模型;用收敛的长短期记忆神经网络模型生成口令段和与口令段相对应的概率;/n第三步,将与口令段相对应的概率映射为新概率,并将口令段按新概率降序排序;生成按概率降序排序的口令。/n

【技术特征摘要】
1.一种口令猜测集生成方法,其特征在于,所述口令猜测集生成方法包括以下步骤:
第一步,生成基于个人信息和口令数据库的概率上下文无关文法;对概率上下文无关文法中的字符串按分类规则分为适合或不适合用于训练长短期记忆神经网络的字符串;
第二步,训练出收敛的长短期记忆神经网络模型;用收敛的长短期记忆神经网络模型生成口令段和与口令段相对应的概率;
第三步,将与口令段相对应的概率映射为新概率,并将口令段按新概率降序排序;生成按概率降序排序的口令。


2.如权利要求1所述的口令猜测集生成方法,其特征在于,所述第一步根据个人信息模式,利用最长前缀匹配算法对个人信息和口令数据库中的口令进行个人信息模式的匹配、划分和标记,与个人信息不匹配的部分按其是字母、数字还是特殊符号,分别标记为L、D和S,并用下标表示该部分的长度,然后计算每个模式中每个字符串的概率,最后将基本终端和同一模式的字符串按概率降序排序,生成基于个人信息和口令数据库的概率上下文无关文法。


3.如权利要求2所述的口令猜测集生成方法,其特征在于,所述个人信息模式包括;
模式的匹配、划分和标记是指使用最长前缀匹配算法进行匹配,然后将口令划分为段,各段按匹配的模式进行标记;
个人信息模式的概率为1,个人信息是固定的;
模式为L,D和S的字符串,计算每个模式中每个字符串的概率的公式为:



其中,n为字符串出现的次数,m为模式出现的次数。


4.如权利要求1所述的口令猜测集生成方法,其特征在于,所述第一步对生成的概率上下文无关文法中的字符串按分类规则分类,分类规则为:若字符串的模式为个人信息模式,则该字符串为不适合用于训练长短期记忆神经网络的字符串;若字符串模式为L、D、S模式且长度小于等于4,则该字符串为不适合用于训练长短期记忆神经网络的字符串;若字符串模式为L、D、S模式且长度大于4,则该字符串为适合用于训练长短期记忆神经网络的字符串。


5.如权利要求1所述的口令猜测集生成方法,其特征在于,所述第二步对于每一个适合用于训练长短期记忆神经网络的字符串,将这个字符串不同时刻的字符依次传入长短期记忆神经网络的输入层,长短期记忆神经网络的输出是对字符串中下一个时刻的字符的预测;
训练长短期记忆神经网络时使用的损失函数为交叉熵损失函数;
训练长短期记忆神经网络时使用的优化算法为Adam或其他自适应学习速率的方法;
收敛是指长短期记忆神经网络的参数使得损失函数的值数学上收敛于某值。...

【专利技术属性】
技术研发人员:杨超张静尤伟郑昱闫志成朱泉龙
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1