基于语音的生物认证方法及设备技术

技术编号:12931171 阅读:57 留言:0更新日期:2016-02-29 02:56
本发明专利技术公开了一种用户认证的方法和设备。所述方法包括:向所述用户发送问题提示,所述问题提示要求用户说出语音片段以及动态问题的答案,所述语音片段具有相应的在认证之前训练出的文本相关的说话人识别模型;响应于接收所述语音回答,从述语音回答中切分出所述语音片段部分以及动态问题答案部分;验证所述语音回答中所述语音片段以及动态问题答案之间的边界平滑度。通过所述方法和设备,可以更为有效的防止用户认证时的录音欺诈。

【技术实现步骤摘要】
基于语音的生物认证方法及设备
本专利技术涉及用户认证,并且具体涉及一种基于语音的生物认证方法及设备。
技术介绍
随着技术的发展,用户在工作、生活中需要进行大量基于通信、互联网的活动,为了保障用户活动的安全性,通常都需要进行用户认证。密码作为一种传统的认证方式,存在着容易被破解、丢失或遗忘的缺点。为了提高密码认证的安全性,在台式机或者笔记本上还可以用U盾来保证安全性,但这种方式难以应用在手持移动终端或者呼叫中心中。更为重要的是,前述方式的人身关联性低,非法获取上述信息的人容易被当作是用户本人。目前,很多场合都需要确认是用户本人的操作,为了提高用户认证的人身关联性,指纹识别、虹膜检测、人脸识别以及声音识别等生物特征认证方式得到了广泛的应用与发展。说话人识别是当前生物信息认证方式中的一种主流方式,通常包括文本相关(Textdependent)以及文本无关(Textindependent)两种声纹识别方式,并且,声纹识别通常也都包括训练(enrollment)、校验(verification)两个步骤。在文本相关的声纹验证中,在训练中说的什么语音片段,校验的时候也必须说相同的语音片段。该种方式准确率很高,可达到99%以上,并且训练所用的语音片段只需几秒钟即可,应用方便,是一种广泛采用的声音认证方式。但是由于始终说的都是训练集中的几句话,而且声音是公开的,很容易被录音窃取后通过播放的方式欺骗认证系统。在文本无关型的声纹验证中,校验的时候可以说和训练不一样的文本。采用该种方式在认证时提出动态问题可以解决录音欺骗的问题,但其准确率低,通常只能达到70%左右,还无法完全进入实用阶段,特别是在银行等需要高准确率的用户认证领域中,并且,训练时要求用户至少说出几十秒的内容,使用不便。因此,在实际应用中,文本无关型的声纹验证方式通常要和其他的生物特征认证方式共同使用,很难作为一种独立的检测方式,由此也限制了其使用的范围。综上可见,现有技术仍然存在着缺陷,迫切的需要一种准确率高的防止录音欺骗的语音验证方案。
技术实现思路
鉴于以上问题而提出了本专利技术。本专利技术的一个目的在于提供一种准确率高的防止录音欺骗的语音验证方案。根据本专利技术的一个方面,提供了一种用户认证的方法,所述方法包括:向所述用户发送问题提示,所述问题提示要求用户说出语音片段以及动态问题的答案,所述语音片段用于在认证之前训练出文本相关的说话人识别模型;响应于接收所述语音回答,从述语音回答中切分出所述语音片段部分以及动态问题答案部分;根据所述文本相关的说话人识别模型对所述语音片段部分进行校验;对所述动态问题答案部分进行答案检验;验证所述语音回答中所述语音片段以及动态问题答案之间的边界平滑度;根据所述声纹校验、答案验证以及边界平滑度进行所述用户认证。。根据本专利技术的另一个方面,提供了一种用户认证的设备,所述设备包括:提示装置,配置为向所述用户发送问题提示,所述问题提示要求用户说出语音片段以及动态问题的答案,所述语音片段用于在认证之前训练出文本相关的说话人识别模型;切分装置,配置为响应于接收所述语音回答,从所述语音回答中切分出所述语音片段部分以及动态问题答案部分;语音片段检验装置,配置为根据所述文本相关的说话人识别模型对所述语音片段部分进行校验;动态问题检验装置,配置为对所述动态问题答案部分进行答案检验;边界检验装置,配置为验证所述语音回答中所述语音片段以及动态问题答案之间的边界平滑度;认证结果生成装置,配置为根据所述声纹校验、答案验证以及边界平滑度进行所述用户认证。在根据本专利技术上述方面的方法和设备中,根据检测边界处的平滑程度,能够分辨出语音回答是否涉及录音欺骗。附图说明通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。图1示出了适于用来实现本专利技术实施方式的示例性计算机系统/服务器12的框图。图2是示出根据本专利技术实施例的用户认证的方法的流程图。图3示出了基于能量的边界平滑度检测实施例。图4、图5示出了基于基音频率(pitch)的边界平滑度检测实施例。图6示出了一个实施例中生成问题的具体步骤。图7是示出根据本专利技术实施例的用户认证设备的框图。具体实施方式下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。所属
的技术人员知道,本专利技术可以实现为系统、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的软件(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“电路”、“模块”或“系统”。此外,在一些实施例中,本专利技术还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言或其组合来编写用于执行本专利技术操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。下面将参照本专利技术实施例的方法、装置(系统)和计算机程序产品的流程图本文档来自技高网
...
基于语音的生物认证方法及设备

【技术保护点】
一种用户认证的方法,所述方法包括:向所述用户发送问题提示,所述问题提示要求用户说出语音片段以及动态问题的答案,所述语音片段具有相应的在认证之前所训练出的文本相关的说话人识别模型;响应于接收所述语音回答,从述语音回答中切分出所述语音片段部分以及动态问题答案部分;验证所述语音回答中所述语音片段以及动态问题答案之间的边界平滑度。

【技术特征摘要】
1.一种用户认证的方法,所述方法包括:向所述用户发送问题提示,所述问题提示要求用户说出语音片段以及动态问题的答案,所述语音片段具有相应的在认证之前所训练出的文本相关的说话人识别模型;响应于接收所述语音回答,从所述语音回答中切分出所述语音片段部分以及动态问题答案部分;验证所述语音回答中所述语音片段以及动态问题答案之间的边界平滑度。2.如权利要求1所述的方法,其中所述验证所述语音片段部分以及动态问题答案部分之间的边界平滑度包括:根据能量、基音频率、频谱三者中的至少一种确定所述平滑度。3.如权利要求1所述的方法,其中,所述问题提示要求用户按照设定顺序说出所述语音片段以及所述动态问题的答案。4.如权利要求3所述的方法,其中所述设定顺序选择以下之一:所述语音片段位于所述答案之前;所述语音片段位于所述答案之后;所述语音片段与所述答案相交叉。5.如权利要求4所述的方法,其中所述语音片段与所述答案相交叉包括:所述答案位于所述语音片段之中;或所述语音片段位于所述答案之中。6.如权利要求3所述的方法,根据所述设定顺序从所述语音回答中切分出所述语音片段部分以及所述动态问题答案部分。7.如权利要求1所述的方法,其中所述预先训练的语音片段以及所述动态问题的答案之间符合发音的连贯性。8.如权利要求5所述的方法,根据语音模型以及声音模型使得所述预先训练的语音片段以及所述动态问题的答案之间符合发音的连贯性。9.如权利要求1所述的方法,还包括:根据所述文本相关的说话人识别模型确定所述语音片段部分是否为所述用户的声音;确定所述动态问题答案部分的回答是否正确。10.一种用户认证的设备,所述设备包括:提示装置,配置为向所...

【专利技术属性】
技术研发人员:刘文张世磊包胜华李敏秦勇苏中
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1