声纹密码文本生成方法及系统技术方案

技术编号:13793054 阅读:114 留言:0更新日期:2016-10-06 05:38
本发明专利技术公开了一种声纹密码文本生成方法及系统,该方法包括:确定各声纹密码文本字符的说话人区分性能;选择说话人区分性能满足要求的字符构建声纹密码文本候选字符集;从所述声纹密码文本候选字符集挑选字符生成声纹密码文本。利用本发明专利技术,可以提高声纹认证的准确性。

【技术实现步骤摘要】

本专利技术涉及身份认证
,具体涉及一种声纹密码文本生成方法及系统
技术介绍
随着信息技术的迅猛发展,通信以及网络的全球覆盖使得信息公开化成为历史必然,伴随着信息透明化,个人隐私的安全性也受到了极大的威胁,如何正确地进行个人身份的识别进而保护私人数据是现代社会需要重点关注的方向之一。声纹作为个人身份相关性很高的生物特征已被应用到身份认证领域中,并且声纹密码认证可以利用密码文本和声纹特征两种加密手段进行加密,具有较强的安全保障,得到了社会广泛的关注和应用。现有的声纹密码生成方法一般分为以下两种:1)固定密码文本,即在用户的注册阶段和认证阶段使用相同的密码文本,如“芝麻开门”,在注册阶段让用户朗读多遍“芝麻开门”完成声纹模型训练数据录制,在认证阶段直接让用户朗读注册时密码文本,进行声纹密码认证。2)随机密码文本,即在用户注册阶段和认证阶段的密码文本都是系统随机产生的。上述第1)种固定密码文本,由于密码文本的公开化,容易被冒认者利用目标说话人录音进行冒认。上述第2)种随机密码文本的随机性,经常会出现一些区分性较差的字符作为密码文本,如‘555’,进行声纹认证时,由于‘5’的发音过于低沉,相对于其它字符文本,较难将冒认说话人和目标说话人区分开,从而降低认证效果。另外,现有方法在声纹认证时,由于经常会存在一些字符组合的发音很难完全切分开的现象,如零声母的字符组合‘25’,在声纹模型建模时,容易混入难切分字符的语音,导致模型训练不准确,认证准确度下降,如对字符‘2’
进行声纹模型训练时,训练数据中含有字符‘5’的语音。
技术实现思路
本专利技术实施例提供一种声纹密码文本生成方法及系统,以提高声纹认证的准确性。为此,本专利技术实施例提供如下技术方案:一种声纹密码文本生成方法,包括:确定各声纹密码文本字符的说话人区分性能;选择说话人区分性能满足要求的字符构建声纹密码文本候选字符集;从所述声纹密码文本候选字符集挑选字符生成声纹密码文本。优选地,所述确定各字符的说话人区分性能包括:收集各声纹密码文本字符的语音数据;利用所述语音数据训练所述字符的声纹模型;将所述字符作为声纹密码文本进行目标说话人和冒认说话人声纹认证,并根据认证结果确定所述字符的说话人区分性能。优选地,所述说话人区分性能指标包括以下任意一种或多种组合:等错误率、识别正确率、检测代价。优选地,所述从所述声纹密码文本候选字符集挑选字符包括:随机从所述声纹密码文本候选字符集挑选设定个数的字符。优选地,所述方法还包括:计算所述声纹密码文本候选字符集中每个字符被选中为声纹密码文本的概率;划分概率区间;所述从所述声纹密码文本候选字符集挑选字符包括:根据划分的概率区间从所述声纹密码文本候选字符集中挑选字符。优选地,所述根据划分的概率区间从所述声纹密码文本候选字符集中挑选字符包括:建立概率区间与所述声纹密码文本候选字符集中字符的对应关系;生成随机数;挑选所述随机数所属的概率区间对应的字符或字符组合。优选地,所述方法还包括:确定声纹密码文本字符排列规则;所述从所述声纹密码文本候选字符集挑选字符生成声纹密码文本包括:从所述声纹密码文本候选字符集挑选字符,并依照所述排列规则将挑选的字符生成声纹密码文本。优选地,所述声纹密码文本字符排列规则包括:相同字符不能相邻;零声母字符不能相邻。一种声纹密码文本生成系统,包括:区分性能确定模块,用于确定各声纹密码文本字符的说话人区分性能;候选字符集生成模块,用于选择说话人区分性能满足要求的字符构建声纹密码文本候选字符集;字符挑选模块,用于从所述声纹密码文本候选字符集挑选字符;密码文本生成模块,用于将挑选的字符生成声纹密码文本。优选地,所述区分性能确定模块包括:语音数据获取单元,用于收集各声纹密码文本字符的语音数据;训练单元,用于利用所述语音数据训练所述字符的声纹模型;认证确定单元,用于将所述字符作为声纹密码文本进行目标说话人和冒认说话人声纹认证,并根据认证结果确定所述字符的说话人区分性能。优选地,所述字符挑选模块,具体用于随机从所述声纹密码文本候选字符集挑选设定个数的字符。优选地,所述系统还包括:计算模块,用于计算所述声纹密码文本候选字符集中每个字符被选中为声纹密码文本的概率;区间划分模块,用于划分概率区间;所述字符挑选模块,具体用于根据划分的概率区间从所述声纹密码文本候选字符集中挑选字符。优选地,所述字符挑选模块包括:对应关系建立单元,用于建立概率区间与所述声纹密码文本候选字符集中字符的对应关系;随机数生成单元,用于生成随机数;选择单元,用于挑选所述随机数所属的概率区间对应的字符或字符组合。优选地,所述系统还包括:排列规则确定模块,用于确定声纹密码文本字符排列规则;所述密码文本生成模块,具体用于依照所述排列规则将挑选的字符生成声纹密码文本。本专利技术实施例提供的声纹密码文本生成方法及系统,选择说话人区分性能较好的字符作为候选字符构建声纹密码文本候选字符集,从候选字符集中挑选字符生成声纹密码文本。由于生成声纹密码文本的各字符具有较好的说话人区分性能,因此有效地提高了声纹密码认证的效果。进一步地,按照确定的声纹密码文本字符排列规则生成声纹密码文本,从而有效地避免了生成的密码文本中出现难切分的字符组合的情况,进而提高声纹密码认证的效果。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1是本专利技术实施例声纹密码文本生成方法的流程图;图2是本专利技术实施例声纹密码文本生成系统的一种结构示意图;图3是本专利技术实施例声纹密码文本生成系统的另一种结构示意图。具体实施方式为了使本
的人员更好地理解本专利技术实施例的方案,下面结合附图和实施方式对本专利技术实施例作进一步的详细说明。如图1所示,是本专利技术实施例声纹密码文本生成方法的流程图,包括以下
步骤:步骤101,确定各声纹密码文本字符的说话人区分性能。所述声纹密码文本字符可以是汉字、字母、数字或特殊符号中的一种或多种组合。在本专利技术实施例中,可以采用数据驱动的方法计算每个声纹密码文本字符针对不同说话人的区分性能,具体过程如下:1)收集各声纹密码文本字符的语音数据。也就是说,所述语音数据包含相应的字符,而且,对应一个字符有多个不同说话人的语音数据。2)利用所述语音数据训练所述字符的声纹模型。对于每个字符,利用收集到的包含该字符的大量说话人的语音数据提取声学特征,利用模型训练准则进行声纹模型训练,所述训练准则如最大似然准则,所述模型例如HMM(Hidden Markov Model,隐马尔可夫模型)、GMM(Gaussian Mixture Model,高斯混合模型),从而得到对应该字符的声纹模型。3)将所述字符作为声纹密码文本进行目标说话人和冒认说话人声纹认证,并根据认证结果确定所述字符的说话人区分性能。具体地,对于每个字符,将其作为声纹密码文本,利用对应该字符的声纹模型和该字符对应的目标说话人语音,首先进行自适应训练得到该目标说话人对应的声纹模型,所述自适应算法例如最大后验概率;然后利用所述声纹模型对目标说话人和冒认说话人本文档来自技高网
...

【技术保护点】
一种声纹密码文本生成方法,其特征在于,包括:确定各声纹密码文本字符的说话人区分性能;选择说话人区分性能满足要求的字符构建声纹密码文本候选字符集;从所述声纹密码文本候选字符集挑选字符生成声纹密码文本。

【技术特征摘要】
1.一种声纹密码文本生成方法,其特征在于,包括:确定各声纹密码文本字符的说话人区分性能;选择说话人区分性能满足要求的字符构建声纹密码文本候选字符集;从所述声纹密码文本候选字符集挑选字符生成声纹密码文本。2.根据权利要求1所述的方法,其特征在于,所述确定各字符的说话人区分性能包括:收集各声纹密码文本字符的语音数据;利用所述语音数据训练所述字符的声纹模型;将所述字符作为声纹密码文本进行目标说话人和冒认说话人声纹认证,并根据认证结果确定所述字符的说话人区分性能。3.根据权利要求1所述的方法,其特征在于,所述说话人区分性能指标包括以下任意一种或多种组合:等错误率、识别正确率、检测代价。4.根据权利要求1所述的方法,其特征在于,所述从所述声纹密码文本候选字符集挑选字符包括:随机从所述声纹密码文本候选字符集挑选设定个数的字符。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:计算所述声纹密码文本候选字符集中每个字符被选中为声纹密码文本的概率;划分概率区间;所述从所述声纹密码文本候选字符集挑选字符包括:根据划分的概率区间从所述声纹密码文本候选字符集中挑选字符。6.根据权利要求5所述的方法,其特征在于,所述根据划分的概率区间从所述声纹密码文本候选字符集中挑选字符包括:建立概率区间与所述声纹密码文本候选字符集中字符的对应关系;生成随机数;挑选所述随机数所属的概率区间对应的字符或字符组合。7.根据权利要求1至6任一项所述的方法,其特征在于,所述方法还包括:确定声纹密码文本字符排列规则;所述从所述声纹密码文本候选字符集挑选字符生成声纹密码文本包括:从所述声纹密码文本候选字符集挑选字符,并依照所述排列规则将挑选的字符生成声纹密码文本。8.根据权利要求7所述的方法,其特征在于,所述声纹...

【专利技术属性】
技术研发人员:方昕刘俊华魏思胡国平王影胡郁刘庆峰
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1