声纹密码认证方法及系统技术方案

技术编号:11704767 阅读:139 留言:0更新日期:2015-07-09 04:21
本发明专利技术公开了一种声纹密码认证方法及系统,属于密码认证技术领域。该方法包括:接收用户输入的语音信号;对所述语音信号进行语音识别,获得密码文本;确定是否存在所述密码文本对应的背景模型;如果是,则获取所述背景模型;如果否,则根据所述密码文本对预先训练得到的发音单元模型进行扩展,获得所述密码文本对应的背景模型;利用所述语音信号中的声纹特征序列、所述背景模型和所述用户的声纹密码模型对所述用户进行认证。利用该方法及系统,可以满足用户自定义密码及频繁更改密码的需求。

【技术实现步骤摘要】

本专利技术涉及密码认证
,特别涉及一种声纹密码认证方法及系统
技术介绍
声纹认证,即根据用户输入语音信号中反映的说话人生理特征和行为特征的声纹 信息,自动确认说话人身份的技术。相比于其他生物认证技术,声纹认证具有更简便、准确、 经济及良好扩展性等众多优势,可广泛应用于安全验证、控制等各方面。 声纹密码认证,是一种文本相关(Text-Dependent)的声纹认证技术,该技术要求 用户语音输入确定密码文本,并根据声纹特点确认说话人身份。在声纹密码认证中,用户注 册及身份认证时均需要输入确定密码文本相关的语音信号,因而声纹信息较为一致,相应 的可取得相比与文本无关的声纹认证更好的认证效果,在门禁系统、开机密码、银行支付密 码等应用环境下发挥着积极的作用。 在现有技术中,声纹密码认证需要预先离线采集大量的与密码文本相关的语音数 据训练得到背景模型。在实际中,往往要求用户统一文本密码,且不能随意更改密码,才能 满足要求。 由于用户统一设定一个密码的方式容易导致设置的正确答案或密码文本泄露,进 而会导致大量冒认者语音会被误识别为目标说话人,从而无法提供有效的安全保障。因此, 为了提高安全性并满足用户个性化设置需求,允许不同用户使用自定义密码或者经常更换 密码就非常有必要。而现有技术对背景模型的训练往往要求采集大量的与密码文本相关的 语音数据,显然无法适用于用户自定义的声纹密码认证系统,且不利于声纹密码认证系统 的密码更新。
技术实现思路
本专利技术实施例提供了一种声纹密码认证方法及系统,以满足用户自定义密码及频 繁更改密码的应用需求。 本专利技术实施例提供的技术方案如下: -方面,提供了一种声纹密码认证方法,包括: 接收用户输入的语音信号; 对所述语音信号进行语音识别,获得密码文本; 确定是否存在所述密码文本对应的背景模型; 如果是,则获取所述背景模型;如果否,则根据所述密码文本对预先训练得到的发 音单元模型进行扩展,获得所述密码文本对应的背景模型; 利用所述语音信号中的声纹特征序列、所述背景模型和所述用户的声纹密码模型 对所述用户进行认证。 优选地,按照以下方式预先训练得到发音单元模型: 获取训练语音数据; 根据所述训练语音数据确定发音单元; 确定所述发音单兀的声学模型的拓扑结构; 对所述声学模型进行参数训练,得到发音单元模型。 优选地,所述声学模型为GMM模型; 所述根据所述密码文本对预先训练得到的发音单元模型进行扩展,获得所述密码 文本对应的背景模型包括: 获取所述密码文本中各发音单元对应的GMM模型,得到GMM模型集合; 对所述GMM模型集合中的模型单元,采用等权重拼接,得到新的组合GMM模型; 对所述组合GMM模型的高斯权重进行更新,使得所述组合GMM模型的高斯权重之 和为1,获得所述密码文本对应的背景模型。 优选地,所述声学模型为GMM模型; 所述根据所述密码文本对预先训练得到的发音单元模型进行扩展,获得所述密码 文本对应的背景模型包括: 获取所述密码文本中各发音单元对应的GMM模型,得到GMM模型序列; 对所述GMM模型序列中的至少两个模型单元依次拼接后,采用预设的自跳转概率 和外跳转概率进行跳转转移,获得所述密码文本对应的背景模型,其中,所述自跳转概率和 外跳转概率之和为1。 优选地,所述声学模型为HMM模型; 所述根据所述密码文本对预先训练得到的发音单元模型进行扩展,获得所述密码 文本对应的背景模型包括: 获取所述密码文本中各发音单元对应的HMM模型序列; 对所述HMM模型序列中的模型单元依次拼接后,获得所述密码文本对应的背景模 型。 优选地,所述利用所述语音信号中的声纹特征序列、所述背景模型和所述用户的 声纹密码模型对所述用户进行认证包括: 分别计算所述声纹特征序列相对于所述声纹密码模型的第一似然度,以及所述声 纹特征序列相对于所述背景模型的第二似然度; 根据所述第一似然度与所述第二似然度的比值以及预设阈值,确定用户是否为合 法用户。 优选地,所述方法还包括:在对所述语音信号进行语音识别之前或者在获得所述 密码文本对应的背景模型之后,提取所述语音信号中的声纹特征序列。 优选地,所述方法还包括:在对所述语音信号进行语音识别之前或者在获得所述 密码文本对应的背景模型之后,获取所述用户的声纹密码模型。 优选地,所述方法还包括:在获取所述用户的声纹密码模型之前,判断当前是否存 在用户的声纹密码模型; 如果不存在,则根据用户的注册语音信号及所述背景模型构建用户的声纹密码模 型。 另一方面,提供了一种声纹密码认证系统,包括: 接收模块,用于接收用户输入的语音信号; 识别模块,用于对所述语音信号进行语音识别,获得密码文本; 确定模块,用于确定是否存在所述密码文本对应的背景模型; 背景模型获取模块,用于在所述确定模块确定存在所述密码文本对应的背景模型 后,获取所述背景模型,在所述确定模块确定不存在所述密码文本对应的背景模型后,根据 所述密码文本对预先训练得到的发音单元模型进行扩展,获得所述密码文本对应的背景模 型; 认证模块,用于利用所述语音信号中的声纹特征序列、所述背景模型和所述用户 的声纹密码模型对所述用户进行认证。 优选地,所述系统还包括:训练模块,用于预先训练得到发音单元模型;所述训练 模块包括: 语音数据获取单元,用于获取训练语音数据; 第一确定单元,用于根据所述训练语音数据确定发音单元; 第二确定单元,用于确定所述发音单元的声学模型的拓扑结构; 参数训练单元,用于对所述声学模型进行参数训练,得到发音单元模型。 优选地,所述声学模型为GMM模型,所述背景模型获取模块包括: GMM模型获取单元,用于获取所述密码文本中各发音单元对应的GMM模型,得到 GMM模型集合; 第一拼接单元,用于对所述GMM模型集合中的模型单元,采用等权重拼接,得到新 的组合GMM模型; 权重更新单元,用于对所述组合GMM模型的高斯权重进行更新,使得所述组合GMM 模型的高斯权重之和为1,获得所述密码文本对应的背景模型。 优选地,所述声学模型为GMM模型,所述背景模型获取模块包括: GMM模型获取单元,用于获取所述密码文本中各发音单元对应的GMM模型,得到 GMM模型序列; 第二拼接单元,用于对所述GMM模型序列中的至少两个模型单元依次拼接后,采 用预设的自跳转概率和外跳转概率进行跳转转移,获得所述密码文本对应的背景模型,其 中,所述自跳转概率和外跳转概率之和为1。 优选地,所述声学模型为HMM模型,所述背景模型获取模块包括: HMM模型序列获取单元,用于获取所述密码文本中各发音单元对应的HMM模型序 列; 第三拼接单元,用于对所述HMM模型序列中的模型单元依次拼接后,获得所述密 码文本对应的背景模型。 优选地,所述认证模块包括: 计算单元,用于分别计算所述声纹特征序列相对于所述声纹密码模型的第一似然 度,以及所述声纹特征序列相对于所述背景模型的第二似然度; 确定单元,用于根据所述第一似然度与所述第二似然度的比值以及预设阈值,确 定用户是否为合法用户。 优选地,所述系统还包括:声纹特征序列提取模块,用于在对所述语音信号进行语 音识别之前或者在获得所述密码文本对应的背景模型之后,提取所述语音信号中的声纹本文档来自技高网...
声纹密码认证方法及系统

【技术保护点】
一种声纹密码认证方法,其特征在于,包括:接收用户输入的语音信号;对所述语音信号进行语音识别,获得密码文本;确定是否存在所述密码文本对应的背景模型;如果是,则获取所述背景模型;如果否,则根据所述密码文本对预先训练得到的发音单元模型进行扩展,获得所述密码文本对应的背景模型;利用所述语音信号中的声纹特征序列、所述背景模型和所述用户的声纹密码模型对所述用户进行认证。

【技术特征摘要】

【专利技术属性】
技术研发人员:殷兵魏思胡国平胡郁
申请(专利权)人:讯飞智元信息科技有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1