基于声纹的身份识别及应用方法、装置与设备制造方法及图纸

技术编号:28504532 阅读:30 留言:0更新日期:2021-05-19 22:55
本发明专利技术公开了基于声纹的身份识别及应用方法、装置与设备。通过采集移动号码及通话声纹,结合构建的移动号码及其所有者声纹和身份证件号码间的索引进行识别,并在未直接匹配到相同声纹时,辅助声纹间的总体相似声纹索引,进一步进行用户声纹匹配,能够准确识别用户身份,并能够针对特殊人群作出识别。鉴于语音通话的普遍性和声纹采集的便捷性,基于声纹的身份识别能够在面签、呼叫中心、特殊人群识别、布控、APP应用身份识别等方面具有广泛的应用。本发明专利技术能够准确获取用户的身份证件信息,实现身份识别,将数字应用人准确映射到自然人,从而为各类数字应用提供基础,推动互联网深化应用。用。用。

【技术实现步骤摘要】
基于声纹的身份识别及应用方法、装置与设备


[0001]本专利技术涉及通信、信息
,具体涉及基于声纹的身份识别及应用方法、装置与设备。

技术介绍

[0002]人的生物特征如人脸、声音、指纹、虹膜等可以数字化,可以在数字空间代表唯一的生物人。人的身份证件号码,可以在数字空间代表现实的人。人的电话号码,可以在数字应用空间代表数字应用的人。生物人、现实人、数字应用人的通用对应方法和工具,是互联网深化应用的前提。
[0003]目前的生物人、现实人、数字应用人的对应方法,如短信认证、人脸确认对应,都是局部的对应方法。通用方便的生物人、现实人、数字应用人的对应方法和工具,是互联网深化应用绕不过去的过程。
[0004]自然人在现实空间的行为是通过身份证件号码关联的,在数字空间的行为是通过应用注册ID关联的。自然人的生物人特征,如指纹、人脸、声音、虹膜等是唯一、孪生的,不可伪造。自然人的现实人特征,如身份证件号码,是法律意义上的自然人唯一代表,在应用时需要确认与自然人的对应。自然人的数字人特征,如电话号码,是自然人在数字应用中的一般代表,在应用时没有限定。因此,即使应用ID捆绑了证件号码,也不能证明该应用是对应的自然人所为,对于一些要严格确认自然人的应用,要经常性的进行如人脸、声纹、指纹的生物验证。这种在应用过程中频繁的进行验证的方法一是应用场景的局限、二是麻烦、三是不能普及到所有人群。需要一种通用的、方便的、可以普及到所有人的数字应用中自然人的验证方法和工具,特别是在今后的深度数字应用、数字城市建设中,关于人的数字化建设,需要精准的映射到自然人。这就需要一个能被所有数字应用接受,低成本的数字应用与自然人的映射方法和工具。
[0005]对于物联网设备,除了设备间的连接需要设备身份识别验证外,设备的用户归属及用户访问也必须进行用户身份识别和验证,物联网设备针对自然人的身份识别和验证,是未来物联网时代必须的基础技术。特别是设备无需具有生物特征检测模块,也能动态进行生物识别,使得物联网设备运行的安全性得以提高,同时降低设备的成本。

技术实现思路

[0006]专利技术目的:针对上述现有技术存在的问题,本专利技术的目的在于提供简便的、能够普遍适用各类人群和应用场景的基于声纹的身份识别及相关应用方法,能够仅根据移动号码及通话声纹,结合基础索引数据和声纹之间的相似性,准确获取用户的身份证件信息,实现身份识别,将数字应用人准确映射到自然人,从而为各类数字应用提供基础,推动互联网深化应用。
[0007]技术方案:为实现上述专利技术目的,本专利技术采用如下技术方案:一种基于声纹的身份识别方法,包括如下步骤:
接收输入的移动号码及待识别声纹,所述待识别声纹为该移动电话通话时采集的通话声纹,或者,APP应用或设备注册时保存的注册声纹,判断索引D
IWM
中是否存在所述移动号码;所述索引D
IWM
保存有移动号码及其所有者声纹和身份证件号码之间的对应关系;若存在,则判断通过所述移动号码所关联的声纹是否与所述通话声纹或注册声纹相同,若相同,则返回所述移动号码所关联的身份证件号码;在待识别声纹为通话声纹时,若索引D
IWM
不存在所述移动号码,或者,虽然存在所述移动号码,但所述移动号码所关联的声纹与所述通话声纹不同,则:计算所述通话声纹与索引D
IWM
中所有声纹的汉明距离,通过阈值筛选得到所述通话声纹的基于汉明距离相似声纹集合,并从索引D
WW
中获取所述基于汉明距离相似声纹集合中各声纹的相似声纹并合并得到总体相似声纹并集;获取总体相似声纹并集中重合度大于设定阈值的声纹,并与所述通话声纹进行确认比较,若存在所述通话声纹的相同声纹,返回该相同声纹所关联的移动号码及身份证件号码;所述索引D
WW
保存有各移动号码所有者声纹与其对应的总体相似声纹集合之间的对应关系;在待识别声纹为注册声纹时,若索引D
IWM
不存在所述移动号码,则返回标记号码不存在的识别失败结果;若虽然存在所述移动号码,但所述移动号码所关联的声纹与所述注册声纹不同,则返回标记声纹识别失败的结果及所述移动号码所关联的身份证件号码。
[0008]进一步优选,所述基于声纹的身份识别方法,在返回身份证件号码时,还返回标记的特殊人群标识信息;所述特殊人群标识信息包括老年人、青少年、诈骗者、失信者或追逃罪犯中的一种或多种。
[0009]进一步优选,所述基于声纹的身份识别方法,从索引D
IWM
中根据标记特殊人群的移动号码、身份证件号码或声纹编码,提取对应的声纹得到特殊人群声纹集合;在索引D
IWM
中存在所接收到的移动号码时,直接判断所述特殊人群声纹集合中是否存在所接收到的通话声纹,若存在则返回特殊人群标识;所述特殊人群包括电话诈骗者或追逃罪犯;所述声纹编码对应于声纹模型文件,内容为声纹所有者的移动号码、身份证件号码或用于区别不同声纹的唯一编码;在索引D
IWM
中不存在所接收到的移动号码时,计算所接收到的通话声纹与特殊人群声纹集合中所有声纹的汉明距离,通过阈值筛选得到所述通话声纹的基于汉明距离相似声纹集合,并从索引D
WW
中获取所述基于汉明距离相似声纹集合中各声纹的总体相似声纹,并与所述通话声纹进行确认比较,若存在所述通话声纹的相同声纹,返回特殊人群标识。
[0010]进一步优选,所述基于声纹的身份识别方法,在返回特殊人群标识时,还返回通话声纹的相同声纹关联的电话号码、身份证件号码。
[0011]进一步优选,所述索引D
IWM
保存在移动运营商侧,索引D
IWM
中保存的移动号码及其所有者声纹和身份证件号码由移动运营商在用户入网时或变更移动号码时采集;或者,所述索引D
IWM
保存在呼叫中心侧,索引D
IWM
中保存的移动号码及其所有者声纹和身份证件号码由呼叫中心在呼入或呼出的通话录音及身份核验的基础上获取。
[0012]进一步优选,所述索引D
IWM
在新移动号码出现或移动号码与所有者声纹对应关系出现变化时动态更新;其中判断移动号码与所有者声纹对应关系出现变化的方法为:确定移动号码在观察时间窗口内每次通话或抽取的若干次通话的使用者声纹与该移动号码所有者声纹是否相同,并记录比较结果;
对比较结果进行统计,确定设定的第一时间范围内移动号码使用者声纹是否为所有者声纹,得到以第一时间范围为单位的标记移动号码使用者声纹与所有者声纹是否相同的连续字符串;根据设定的第二时间范围和时间间隔对所得到的连续字符串进行分组后重新组合得到移动号码声纹确认结果特征向量;其中相邻两组中首个字符对应的时间之间相隔设定的时间间隔;计算移动号码声纹确认结果特征向量的SIMHASH值,并计算与标记全为移动号码所有者声纹的连续字符串对应的移动号码声纹确认结果特征向量的SIMHASH值的汉明距离,根据阈值确定观察时间窗口内移动号码使用者与本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于声纹的身份识别方法,其特征在于,包括如下步骤:接收输入的移动号码及待识别声纹,所述待识别声纹为该移动电话通话时采集的通话声纹,或者,APP应用或设备注册时保存的注册声纹,判断索引D
IWM
中是否存在所述移动号码;所述索引D
IWM
保存有移动号码及其所有者声纹和身份证件号码之间的对应关系;若存在,则判断通过所述移动号码所关联的声纹是否与所述通话声纹或注册声纹相同,若相同,则返回所述移动号码所关联的身份证件号码;在待识别声纹为通话声纹时,若索引D
IWM
不存在所述移动号码,或者,虽然存在所述移动号码,但所述移动号码所关联的声纹与所述通话声纹不同,则:计算所述通话声纹与索引D
IWM
中所有声纹的汉明距离,通过阈值筛选得到所述通话声纹的基于汉明距离相似声纹集合,并从索引D
WW
中获取所述基于汉明距离相似声纹集合中各声纹的相似声纹并合并得到总体相似声纹并集;获取总体相似声纹并集中重合度大于设定阈值的声纹,并与所述通话声纹进行确认比较,若存在所述通话声纹的相同声纹,返回该相同声纹所关联的移动号码及身份证件号码;所述索引D
WW
保存有各移动号码所有者声纹与其对应的总体相似声纹集合之间的对应关系;在待识别声纹为注册声纹时,若索引D
IWM
不存在所述移动号码,则返回标记号码不存在的识别失败结果;若虽然存在所述移动号码,但所述移动号码所关联的声纹与所述注册声纹不同,则返回标记声纹识别失败的结果及所述移动号码所关联的身份证件号码。2.根据权利要求1所述的一种基于声纹的身份识别方法,其特征在于,在返回身份证件号码时,还返回标记的特殊人群标识信息;所述特殊人群标识信息包括老年人、青少年、诈骗者、失信者或追逃罪犯中的一种或多种。3.根据权利要求1所述的一种基于声纹的身份识别方法,其特征在于,从索引D
IWM
中根据标记特殊人群的移动号码、身份证件号码或声纹编码,提取对应的声纹得到特殊人群声纹集合;在索引D
IWM
中存在所接收到的移动号码时,直接判断所述特殊人群声纹集合中是否存在所接收到的通话声纹,若存在则返回特殊人群标识;所述特殊人群包括电话诈骗者或追逃罪犯;所述声纹编码对应于声纹模型文件,内容为声纹所有者的移动号码、身份证件号码或用于区别不同声纹的唯一编码;在索引D
IWM
中不存在所接收到的移动号码时,计算所接收到的通话声纹与特殊人群声纹集合中所有声纹的汉明距离,通过阈值筛选得到所述通话声纹的基于汉明距离相似声纹集合,并从索引D
WW
中获取所述基于汉明距离相似声纹集合中各声纹的总体相似声纹,并与所述通话声纹进行确认比较,若存在所述通话声纹的相同声纹,返回特殊人群标识。4.根据权利要求3所述的一种基于声纹的身份识别方法,其特征在于,在返回特殊人群标识时,还返回通话声纹的相同声纹关联的电话号码、身份证件号码。5.根据权利要求1

4任一项所述的一种基于声纹的身份识别方法,其特征在于,所述索引D
IWM
保存在移动运营商侧,索引D
IWM
中保存的移动号码及其所有者声纹和身份证件号码由移动运营商在用户入网时或变更移动号码时采集;或者,所述索引D
IWM
保存在呼叫中心侧,索引D
IWM
中保存的移动号码及其所有者声纹和身份证件号码由呼叫中心在呼入或呼出的通话录音及身份核验的基础上获取。6.根据权利要求5所述的一种基于声纹的身份识别方法,其特征在于,所述索引D
IWM
在新移动号码出现或移动号码与所有者声纹对应关系出现变化时动态更新;其中判断移动号
码与所有者声纹对应关系出现变化的方法为:确定移动号码在观察时间窗口内每次通话或抽取的若干次通话的使用者声纹与该移动号码所有者声纹是否相同,并记录比较结果;对比较结果进行统计,确定设定的第一时间范围内移动号码使用者声纹是否为所有者声纹,得到以第一时间范围为单位的标记移动号码使用者声纹与所有者声纹是否相同的连续字符串;根据设定的第二时间范围和时间间隔对所得到的连续字符串进行分组后重新组合得到移动号码声纹确认结果特征向量;其中相邻两组中首个字符对应的时间之间相隔设定的时间间隔;计算移动号码声纹确认结果特征向量的SIMHASH值,并计算与标记全为移动号码所有者声纹的连续字符串对应的移动号码声纹确认结果特征向量的SIMHASH值的汉明距离,根据阈值确定观察时间窗口内移动号码使用者与所有者声纹是否相同;若观察时间窗口内移动号码使用者与所有者声纹不相同,则更新移动号码在观察时间窗口内最后的通话声纹作为所有者声纹。7.根据权利要求5所述的一种基于声纹的身份识别方法,其特征在于,所述索引D
IWM
中对经确认相同的移动号码所有者声纹使用相同的声纹编码,从而能够获取到同一个移动号码所有者声纹关联的所有移动号码;具体判断收集到的移动号码所有者声纹是否相同的方法为:获取收集到的所有移动号码的所有者声纹集合,记其中某一声纹为目标声纹,其余声纹组成第一待匹配声纹集合;计算目标声纹与第一待匹配声纹集合中每个声纹的汉明距离,得到基于汉明距离的相似声纹集合,作为第二待匹配声纹集合;计算目标声纹与第二待匹配声纹集合中每个声纹的余弦距离或欧氏距离,得到基于余弦距离或欧氏距离的相似声纹集合,作为一度相似声纹集合;计算一度相似声纹集合中每个声纹i与第一待匹配声纹集合中每个声纹的汉明距离,得到声纹i基于汉明距离的相似声纹集合,作为声纹i的二度汉明相似声纹集合;计算一度相似声纹集合中每个声纹i与声纹i的二度汉明相似声纹集合中的每个声纹的余弦距离或欧氏距离,得到声纹i的二度相似声纹集合;一度相似声纹集合中所有声纹的二度相似声纹集合构成目标声纹的二度相似声纹集合;计算一度相似声纹集合中每个声纹i的二度相似声纹集合与一度相似声纹集合中相同声纹的重合度,选择重合度超过设定阈值的一度相似声纹集合中声纹作为目标声纹的最优相似声纹,从而得到目标声纹的最优相似声纹集合;计算一度相似声纹集合中最优相似声纹的二度相似声纹集合的并集中相同声纹的重合度,选择重合度大于设定阈值,且不属于最优相似声纹的声纹为目标声纹的次优相似声纹,从而得到目标声纹的次优相似声纹集合;记收集到的所有移动号码中的某一移动号码为目标移动号码,将目标移动号码所有者声纹的最优相似声纹集合和次优相似声纹集合去重合并后,得到目标移动号码所有者声纹的总体相似声纹集合;将目标移动号码所有者声纹与其总体相似声纹集合中的声纹进行一对一确认或一对
多辨认,确定相同声纹及对应的移动号码。8.根据权利要求1

4任一项所述的一种基于声纹的身份识别方法,其特征在于,所述索引D
WW
中保存的移动号码所有者声纹的总体相似声纹集合根据如下方法确定:获取收集到的所有移动号码的所有者声纹集合,记其中某一声纹为目标声纹,其余声纹组成第一待匹配声纹集合;计算目标声纹与第一待匹配声纹集合中每个声纹的汉明距离,得到基于汉明距离的相似声纹集合,作为第二待匹配声纹集合;计算目标声纹与第二待匹配声纹集合中每个声纹的余弦距离或欧氏距离,得到基于余弦距离或欧氏距离的相似声纹集合,作为一度相似声纹集合;计算一度相似声纹集合中每个声纹i与第一待匹配声纹集合中每个声纹的汉明距离,得到声纹i基于汉明距离的相似声纹集合,作为声纹i的二度汉明相似声纹集合;计算一度相似声纹集合中每个声纹i与声纹i的二度汉明相似声纹集合中的每个声纹的余弦距离或欧氏距离,得到声纹i的二度相似声纹集合;一度相似声纹集合中所有声纹的二度相似声纹集合构成目标声纹的二度相似声纹集合;计算一度相似声纹集合中每个声纹i的二度相似声纹集合与一度相似声纹集合中相同声纹的重合度,选择重合度超过设定阈值的一度相似声纹集合中声纹作为目标声纹的最优相似声纹,从而得到目标声纹的最优相似声纹集合;计算一度相似声纹集合中最优相似声纹的二度相似声纹集合的并集中相同声纹的重合度,选择重合度大于设定阈值,且不属于最优相似声纹的声纹为目标声纹的次优相似声纹,从而得到目标声纹的次优相似声纹集合;记收集到的所有移动号码中的某一移动号码为目标移动号码,将目标移动号码所有者声纹的最优相似声纹集合和次优相似声纹集合去重合并后,得到目标移动号码所有者声纹的总体相似声纹集合。9.根据权利要求8所述的一种基于声纹的身份识别方法,其特征在于,在得到目标移动号码所有者声纹的总体相似声纹集合后,将目标移动号码所有者声纹与其总体相似声纹集合中的声纹进行一对一确认或一对多辨认,确定相同声纹及对应的移动号码,从而得到与目标移动号码所有者声纹相同的其他移动号码;将目标移动号码的所有者声纹的编码,及与所有者声纹相同的其他移动号码的所有者声纹的编码更新为同一声纹编码,以新声纹编码建立各声纹与对应的总体相似声纹集合的索引D
WW
。10.根据权利要求9所述的一种基于声纹的身份识别方法,其特征在于,移动号码所有者声纹的初始编码为移动号码或身份证件号码;在移动号码所有者的身份经过人工或人工智能通话确认后,移动号码所有者声纹的初始编码为身份证件号码,在未经过身份确认的,移动号码所有者声纹的初始编码为移动号码;根据如下规则对声纹编码进行更新:如果目标移动号码所有者声纹及对应的相同声纹的声纹编码中,存在若干相同的身份证件号码标识的声纹编码,则所有相同的声纹编码更新为统一的身份证件号码;如果所有相同的声纹编码都是初始的移动号码编码,则统一将这些相同声纹编码更新为新的唯一编码;如果相同的声纹编码中存在若干不同的身份证件号码标识的声纹编码,则所有相同的声纹编码更新为相同证件号码多数的证件号码,如果不同的证件号码个数相同,则所有相
同的声纹编码更新为新的唯一编码。11.一种基于通话声纹的面签方法,其特征在于,包括如下步骤:与面签预留的移动号码通话,采集面签者的通话声纹;调用根据权利要求1所述的一种基于声纹的身份识别方法获取所述移动号码所关联的身份证件号码;根据移动号码、通话声纹和身份证件号码,判断用户预留的面签信息是否准确,若正确,则面签正常,否则面签异常。12.根据权利要求11所述的基于通话声纹的面签方法,其特征在于,还包括:若通过调用基于声纹的身份识别方法返回的信息还包括用户的其它移动号码,则补充面签用户的其它移动号码;若返回的信息还包括特殊人群标识信息,则补充面签用户的特殊人群标识,根据不同的特殊人群标识制定不同的面签流程。13.一种基于通话声纹的呼叫中心客户识别方法,其特征在于,包括如下步骤:当用户呼入呼叫中心时,采集通话的移动号码及通话声纹;调用根据权利要求1所述的一种基于声纹的身份识别方法获取所述移动号码所关联的身份证件号码;根据移动号码、通话声纹和身份证件号码,实时实现呼入者的声纹、移动号码、证件号码的一致性检验,同时根据业务需要,以证件号码、移动号码、声纹为标识关联出业务信息,使得客服在接听电话时就能获得呼叫用户的真实身份及相关的业务信息;当呼叫中心呼叫用户的移动号码时,采集接听者的通话声纹;调用根据权利要求1所述的一种基于声纹的身份识别方法获取所述移动号码所关联的身份证件号码;根据移动号码、通话声纹和身份证件号码,确认通话的接听者是否是该呼叫移动号码的所有者;当通话者不是移动号码的所有者时,则标记所呼叫用户的移动号码失效。14.根据权利要求13所述的基于通话声纹的呼叫中心客户识别方法,其特征在于,在呼叫中心呼叫用户的移动号码为失效的号码时,根据保存的最近的有效号码对应的历史通话声纹,通过保存有移动号码及其所有者声纹和身份证件号码之间的对应关系的索引D
IWM
:或保存有移动号码及其所有者声纹对应关系的索引D
WM
查找到历史通话声纹对应的最新的移动号码,重新呼叫该最新的移动号码。15.一种基于通话声纹的自然人生存验证方法,其特征在于,包括如下步骤:采集运营商的每通通话的客户移动号码及通话声纹;调用根据权利要求1所述的一种基于声纹的身份识别方法获取所述移动号码所关联的身份证件号码;若获取的身份证件号码关联的自然人为待进行生存验证的自然人,则认为待生存验证的自然人到通话声纹采集时间为止,处于生存状态。16.一种基于通话声纹的布控方法,其特征在于,包括如下步骤:根据布控目标的移动号码、证件号码或者声纹模型为标识组成特殊布控人群集合;采集布控场景内通话者每通通话的移动号码和通话声纹;调用根据权利要求2所述的一种基于声纹的身份识别方法获取所述移动号码所关联的身份证件号码以及特殊人群标识信息;
若所述移动号码、通话声纹、...

【专利技术属性】
技术研发人员:李爽朱东宁綦连敏王勇时鑫浩然
申请(专利权)人:南京大正智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1