用于语音用户接口的耳内活性检测制造技术

技术编号:35504944 阅读:19 留言:0更新日期:2022-11-09 14:16
这里介绍了基于输入的“活性”来对讲话者的身份进行认证的方法。为了防止假冒,认证平台可以确定语音样本表示由身份要被认证的讲话者说出的(一个或多个)单词的记录的可能性,然后基于该可能性来确定是否对该讲话者进行认证。认证。认证。

【技术实现步骤摘要】
【国外来华专利技术】用于语音用户接口的耳内活性检测
[0001]相关申请的交叉引用
[0002]本申请要求于2020年3月30日提交的题为“In

Ear Liveness Detection for Voice Interfaces”的美国临时申请No.63/002,051的优先权,其全部内容通过引用并入本文。


[0003]本公开涉及计算机安全性中的生物计量认证,并且更具体地,涉及基于一个或多个相关生理特性来增强语音认证的安全性的技术。

技术介绍

[0004]生物计量认证过程通过独特的生物计量特性来验证个体的身份。这些生物计量特性更难以假冒,并且更加方便,因为相应的个体不必记住密码或管理令牌。相反,认证符号(authenticator)是个体的一部分。
[0005]语音识别(也称为“语音认证”)涉及对语音样本进行分析以验证讲话者的身份。各种生理特征(例如,嘴、气道和软组织腔的形状)都会影响语音模式,因此可以为每个个体创建独特的声音简档(profile)。该声音简档可以被称为“声音指纹”或“语音印迹”。
[0006]语音认证有两种主要方法,即文本无关方法和文本相关方法。在文本无关方法中,可以使用任何密码短语来执行语音认证。在文本相关方法中,语音认证要求将同一密码短语用于登记和验证。这意味着讲话者将被请求说出预定短语以用于认证目的。然而,随着人工智能驱动(AI驱动)技术的普及,传统的文本无关方法和文本相关方法都遭受到假冒的影响。
附图说明
[0007]图1包括常规认证过程的高级图示,其中由电子设备提示未知讲话者说出密码短语,其中,该电子设备生成所说出的密码短语的记录(模拟音频数据的形式)
[0008]图2A包括可以被用来对讲话者身份进行认证的系统的高级表示。
[0009]图2B示出了图2A的系统的示意性实现方式。
[0010]图3A包括被设计用于密码短语认证的系统的高级表示。
[0011]图3B包括被设计用于监视发言(monitored speech)认证的系统的高级表示。
[0012]图3C包括被设计用于质询

响应认证的系统的高级表示。
[0013]图4示出了能够实现认证平台的电子设备的示例,该认证平台被设计为基于由麦克风生成的音频数据和由形状传感器生成的形状数据来对讲话者的身份进行认证。
[0014]图5A至图5B包括用于基于表示短语记录的音频数据和表示讲话者讲话时的耳道形状的形状数据来对讲话者进行认证的过程的流程图。
[0015]图6A至图6B包括根据密码短语认证方法来执行的认证过程的训练阶段和使用阶段的流程图。
[0016]图7A至图7B包括根据监视发言认证方法来执行的认证过程的训练阶段和使用阶段的流程图。
[0017]图8A至图8B包括根据质询

响应认证方法来执行的认证过程的训练阶段和使用阶段的流程图。
[0018]图9描绘了用于以生物计量的方式对讲话者的身份进行认证的过程的流程图。
[0019]图10描绘了用于基于耳道的变形来确定是否对讲话者的身份进行认证的过程的流程图。
[0020]图11是示出其中可以实现本文所述的至少一些操作的处理系统的示例的框图。
[0021]通过结合附图对具体实施方式进行学习,本领域技术人员将更清楚本文所描述的技术的各种特征。在附图中通过示例而非限制的方式示出了实施例,其中类似的附图标记可以指示类似的元件。虽然附图出于说明的目的描绘了各种实施例,但是本领域技术人员将认识到,在不脱离技术原理的情况下可以采用替代实施例。因此,尽管在附图中示出了特定实施例,但是该技术可以进行各种修改。
具体实施方式
[0022]为了在认证程序中进行登记,最初可以提示个体(也称为“用户”)提供被用来创建参考模板的语音样本,其中,未来的语音样本被与该参考模板进行比较以用于认证目的。在较高的层面上,该参考模板表示根据该语音样本确定的声音质量,例如,持续时间、强度、力度和音调等。
[0023]图1包括常规认证过程的高级图示,其中由电子设备提示未知讲话者说出密码短语,其中,该电子设备生成所说出的密码短语的记录(模拟音频数据的形式)。电子设备的示例包括移动电话、平板计算机和销售点(POS)系统。此后,可以将模拟音频数据转换为数字表示(例如,在频谱中)。这可以由该电子设备或与该电子设备通信地连接的另一电子设备(例如,计算机服务器)来完成。通过分析模拟音频数据的数字表示,能够识别表示未知讲话者的特征和/或模式。
[0024]通常,这些特征和/或模式被与一个或多个参考模板进行比较,以确定未知讲话者的身份。例如,如果未知讲话者试图通过提供语音样本来验证她作为给定个体的身份,则可以将该语音样本与先前为该给定个体创建的参考模板进行比较。如果该语音样本与参考模板匹配,则未知讲话者可以被认证为该给定个体。然而,如果该语音样本与参考模板不匹配,则电子设备可以确定未知讲话者没有成功地验证她的身份。
[0025]然而,无论采用哪种语音认证方法,这种技术都易受假冒的影响。就文本相关方法而言,如果未经授权的个体(也称为“假冒者”)能够访问说出密码短语的、被假扮的个体的记录,则假冒者可以简单地启动该记录的重放。尽管文本无关方法被认为可以更安全地应对重放攻击,但是能够创建语音样本的AI驱动的生成器程序造成了安全风险。利用给定个体的足够的语音样本,AI驱动的生成器程序能够生成新的、完全虚构的、非常逼真的语音样本。
[0026]因此,本文介绍了基于输入的“活性(liveness)”来对讲话者身份进行认证的方法。为了防止假冒,认证平台可以确定语音样本表示由身份要被认证的讲话者说出的(一个或多个)单词的记录的可能性,然后基于该可能性来确定是否对讲话者进行认证。更具体
地,认证平台可以生成指示生物计量特性的“活性信号”,该生物计量特性能够被用来确定讲话者是否实际说出了密码短语。理想情况下,生物计量特性应该对讲话者是独特的,对密码短语是独特的,或者是难以推断/猜测的。
[0027]外耳(也称为“耳廓”或“耳郭”)是用于授权的有吸引力的选项,因为当人出生时耳廓和耳道几乎完全形成,并且在该人的整个生命中保持基本上相同的形状。耳道的形状可以被认为是独特的生物计量数据,其能够例如通过麦克风所检测到的探测信号的反射来测量。该生物计量数据可以以若干不同的方式而被使用。
[0028]第一,认证平台可以将耳道的变形视为语音样本是由讲话者所提供的证据。例如,假设在耳廓中佩戴电子设备的讲话者被提示说出用于认证的密码短语。在这种情况下,电子设备可以将探测信号发射到耳道中,然后生成表示被耳道反射的探测信号的数据。通过将该数据与指示密码短语的记录的语音样本进行比较,认证平台可以确定讲话者实际说出了该密码短语的可能性。更具体地,认证平台可以检验数据中与密码短语的发声相对应的部分,以确定该数据是否指示说话时耳道如所预期的那样变形。
[002本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于基于生物计量对身份进行认证的方法,所述方法包括:由佩戴在耳朵的耳廓中的电子设备将探测信号发射到耳道中;由所述电子设备获取音频数据,所述音频数据表示被所述耳道反射的所述探测信号;由所述电子设备识别所述音频数据中与一时间间隔相对应的部分,在该时间间隔内,人类讲话者说出用于认证为给定个体的短语;以及由所述电子设备基于对所述音频数据的所述部分的分析,来确定所述人类讲话者是所述给定个体的可能性。2.根据权利要求1所述的方法,其中,所述确定包括:基于所述音频数据的所述部分来建立简档,所述简档表示所述时间间隔内的所述耳道的形状,以及基于所述简档来产生得分,所述得分指示所述人类讲话者是所述给定个体的可能性。3.根据权利要求2所述的方法,还包括:将所述得分与阈值进行比较,其中,所述人类讲话者是所述给定个体的可能性进一步基于所述比较的结果。4.根据权利要求2所述的方法,还包括:由所述电子设备将所述简档与生物计量数据库进行比较,以确定是否找到匹配条目,其中,所述生物计量数据库中的条目包括不同人的耳道的参考简档。5.根据权利要求4所述的方法,还包括:由所述电子设备获取第二音频数据,所述第二音频数据是响应于所述人类讲话者被请求说出用于认证的所述短语而生成的;由所述电子设备识别所述第二音频数据中的一部分,在该部分中,所述短语被所述人类讲话者说出;以及由所述电子设备将所述第二音频数据的所述部分与第二生物计量数据库进行比较,以确定是否找到匹配条目;其中,所述第二生物计量数据中的条目包括不同人的参考语音样本;其中,所述人类讲话者是所述给定个体的可能性基于:(i)所述生物计量数据库中的匹配条目,如果存在的话;以及(ii)所述第二生物计量数据库中的匹配条目,如果存在的话。6.根据权利要求5所述的方法,其中,所述音频数据和所述第二音频数据是由所述电子设备生成的。7.根据权利要求1所述的方法,其中,所述发射是响应于以下操作而执行的:所述电子设备确定所述人类讲话者已被请求说出用于认证的所述短语。8.根据权利要求1所述的方法,其中,所述人类讲话者所说出的所述短语充当所述探测信号。9.一种非暂时性计算机可读介质,其上存储有指令,所述指令当由处理器执行时使所述处理器执行包括以下项的操作:确定已由讲话者在一时间间隔内说出短语,作为用于认证的生物计量凭证;获取由个体佩戴在耳朵的耳廓中的电子设备生成的数据,其中,所述电子设备被配置为将一系列探测信号发射到耳道中,并且其中,所述数据表示一系列返回信号,所述一系列返回信号是由所述一系列探测信号
相对于所述耳道的表面的反射生成的;基于所述数据,来建立所述时间间隔内的所述耳道的形状;基于所述耳道的形状来产生第一得分,所述第一得分指示所述个体是所述讲话者的可能性,并且产生第二得分,所述第二得分指示以下二者之间的对应关系:根据所述数据确定的所述时间间隔内的所述耳道的实际变形、给定所述短语的情况下所述时间间隔内的所述耳道的预期变形;以及基于所述第一得分和所述第二得分,来确定是否将所述讲话者认证为所述个体。10.根据权利要求9所述的非暂时性计算机可读介质,其中,所述第一得分是通过以下操作来产生的:确定所述耳道的形状是否匹配生物计量数据库中与所述个体相关联的条目。11.根据权利要求9所述的非暂时性计算机可读介质,其中,所述第二得分是通过以下操作来产生的:应用计算机实现的模型,所述计算机实现的模型在接收到作为输入的所述数据后,输出所述预期变形。12.根据权利要求9所述的非暂时性计算机可读介质,还包括:从短...

【专利技术属性】
技术研发人员:
申请(专利权)人:JVC建伍株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1