一种活体识别方法和系统技术方案

技术编号:38333960 阅读:12 留言:0更新日期:2023-08-02 09:14
本说明书提供的活体识别方法,获取目标用户的目标人脸图像和在预设时段内目标地理区域内的语音数据库,通过将目标人脸图像与语音数据库进行跨模态比对,以确定目标用户属于语音数据库中的基础用户的概率,从而判断活体识别时的攻击风险。如此,通过低成本的语音跨模态校验目标用户的目标人脸图像,在提高活体识别准确率的同时降低了活体识别的成本。别准确率的同时降低了活体识别的成本。别准确率的同时降低了活体识别的成本。

【技术实现步骤摘要】
一种活体识别方法和系统


[0001]本说明书涉及图像处理领域,尤其涉及一种活体识别方法和系统。

技术介绍

[0002]生物识别系统,例如人脸识别系统近年来得到广泛的应用,在诸如刷脸支付、刷脸进站、刷脸考勤等场景都取得了成功。然而,人脸识别系统也在面临着安全挑战,活体攻击是主要的安全威胁之一,例如电子屏幕显示的照片、打印的纸张照片、3D面具等攻击。
[0003]因此,为了准确检测到生物识别过程中的活体攻击,亟需一种新的活体识别方法。

技术实现思路

[0004]本说明书提供的活体识别方法和系统,通过低成本的语音跨模态校验目标用户的目标人脸图像,在提高活体识别准确率的同时降低了活体识别的成本。
[0005]第一方面,本说明书提供一种活体识别方法,包括:通过目标终端获得目标用户的目标人脸图像;获得语音数据库,所述语音数据库包括在预设时段内位于目标地理区域内的多个基础用户对应的语音,所述目标终端位于所述目标地理区域内;将所述目标人脸图像与所述语音数据库进行跨模态比对,并确定比对结果,所述比对结果包括所述目标用户属于所述多个基础用户的概率;以及基于所述比对结果,确定所述目标用户对应的活体识别结果。
[0006]在一些实施例中,所述语音包括去除语音内容信息保留身份信息的数据。
[0007]在一些实施例中,所述语音数据库通过如下方法得到:获得所述多个基础用户的原始语音;以及对所述多个基础用户的原始语音进行脱敏处理,得到脱敏语音;以及基于所述脱敏语音,得到所述语音数据库。
[0008]在一些实施例中,所述对所述多个基础用户的原始语音进行脱敏处理,得到所述脱敏语音,包括:将所述原始语音输入预先完成训练的内容脱敏模块,输出所述脱敏语音,所述内容脱敏模块在训练过程中的训练目标包括:预先完成训练的内容识别模块无法从训练样本对应的脱敏语音中识别出所述训练样本的原始语音中的内容、以及预先完成训练的声纹识别模块从所述训练样本对应的脱敏语音中能够识别出所述训练样本的原始语音对应的身份。
[0009]在一些实施例中,所述基于所述脱敏语音,得到所述语音数据库,包括:对所述脱敏语音进行身份特征提取,得到第一身份特征;以及将所述多个基础用户对应的多个第一身份特征存储到所述语音数据库。
[0010]在一些实施例中,所述将所述目标人脸图像与所述语音数据库进行跨模态比对,并确定比对结果,包括:确定所述目标人脸图像的图像特征;将所述图像特征与所述多个第一身份特征中的每个第一身份特征进行跨模态比对,确定所述比对结果。
[0011]在一些实施例中,所述将所述图像特征与所述多个第一身份特征中的每个第一身份特征进行跨模态比对,确定所述比对结果,包括:确定所述图像特征与所述每个第一身份
特征之间的特征相似度;以及将所述特征相似度最大的最大相似度确定为所述比对结果。
[0012]在一些实施例中,所述图像特征包含语音模态信息。
[0013]在一些实施例中,所述图像特征通过图像特征编码器得到,所述图像特征编码器在训练过程中的训练目标包括:预先完成训练的模态迁移模块能够基于人脸图像训练样本对应的图像特征生成满足预设的第一迁移条件的跨模态语音特征,所述第一迁移条件包括所述跨模态语音特征与所述人脸图像训练样本对应的真实语音特征之间的差异小于预设的第一差异阈值,其中,所述第一身份特征是基于身份特征提取模型得到的,所述人脸图像训练样本对应的真实语音特征是通过所述身份特征提取模型对所述人脸图像训练样本对应的真实语音进行身份特征提取得到的。
[0014]在一些实施例中,所述确定所述图像特征与所述每个第一身份特征之间的特征相似度包括,对于所述每个第一身份特征:将所述图像特征与当前第一身份特征输入跨模态校验模块中,输出所述特征相似度,所述特征相似度包括所述图像特征与所述当前第一身份特征属于同一个身份的概率。
[0015]在一些实施例中,所述将所述图像特征与所述每个第一身份特征进行跨模态比对,确定所述比对结果,包括:确定所述多个第一身份特征对应的多个第二身份特征;确定所述图像特征与所述多个第二身份特征中的每个第二身份特征之间的特征相似度;以及将所述特征相似度最大的最大相似度确定为所述比对结果。
[0016]在一些实施例中,所述第二身份特征包含图像模态信息。
[0017]在一些实施例中,所述第二身份特征通过语音特征编码器得到,所述语音特征编码器在训练过程中的训练目标包括:预先完成训练的模态迁移模块能够基于语音训练样本对应的第二身份特征生成满足预设的第二迁移条件的跨模态图像特征,所述第二迁移条件包括所述跨模态图像特征与所述语音训练样本对应的真实人脸图像特征之间的差异小于预设的第二差异阈值,其中,所述图像特征是基于图像特征编码器对所述目标人脸图像进行特征提取得到的,所述语音训练样本对应的真实人脸图像特征是基于所述图像特征编码器对所述语音训练样本对应的真实人脸图像进行特征提取得到的。
[0018]在一些实施例中,所述确定所述图像特征与所述多个第二身份特征中的每个第二身份特征之间的特征相似度包括,对于所述每个第二身份特征:将所述图像特征与当前第二身份特征输入跨模态校验模块中,输出所述特征相似度,所述特征相似度包括所述图像特征与所述当前第二身份特征属于同一个身份的概率。
[0019]在一些实施例中,所述基于所述比对结果,确定所述目标用户对应的活体识别结果包括:基于所述比对结果,确定活体识别阈值;基于所述目标人脸图像确定所述目标用户属于攻击的攻击概率;以及基于所述攻击概率和所述活体识别阈值,确定所述活体识别结果。
[0020]在一些实施例中,所述基于所述攻击概率和所述活体识别阈值,确定所述活体识别结果,包括:确定所述攻击概率大于所述活体识别阈值,确定所述活体识别结果为攻击;或者确定所述攻击概率小于所述活体识别阈值,确定所述活体识别结果为活体。
[0021]第二方面,本说明书还提供一种活体识别系统,包括至少一个存储介质,存储有至少一组指令集用于实现活体识别;以及至少一个处理器,同所述至少一个存储介质通信连接,其中当所述活体识别系统运行时,所述至少一个处理器读取所述至少一个指令集并实
施第一方面所述的活体识别方法。
[0022]由以上技术方案可知,本说明书提供的活体识别方法和系统,获取目标用户的目标人脸图像和在预设时段内目标地理区域内的语音数据库,通过将目标人脸图像与语音数据库进行跨模态比对,以确定目标用户属于语音数据库中的基础用户的概率,从而判断活体识别时的攻击风险。所述方法和系统还可以根据目标用户属于基础用户的概率,动态调整活体识别的判断阈值。由于固定场所内的基础用户较为固定,波动较小,当目标用户属于所述基础用户的概率较大时,目标用户属于攻击用户的可能较小,此时可以调整判断阈值,使得目标用户更容易被识别为正常用户;当目标用户属于所述基础用户的概率较小时,目标用户属于攻击用户的可能较大,此时可以调整判断阈值,使得目标用户更容易被识别为攻击用户。如此,通过低成本的语音跨本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种活体识别方法,包括:通过目标终端获得目标用户的目标人脸图像;获得语音数据库,所述语音数据库包括在预设时段内位于目标地理区域内的多个基础用户对应的语音,所述目标终端位于所述目标地理区域内;将所述目标人脸图像与所述语音数据库进行跨模态比对,并确定比对结果,所述比对结果包括所述目标用户属于所述多个基础用户的概率;以及基于所述比对结果,确定所述目标用户对应的活体识别结果。2.如权利要求1所述的方法,其中,所述语音包括去除语音内容信息保留身份信息的数据。3.如权利要求2所述的方法,其中,所述语音数据库通过如下方法得到:获得所述多个基础用户的原始语音;对所述多个基础用户的原始语音进行脱敏处理,得到脱敏语音;以及基于所述脱敏语音,得到所述语音数据库。4.如权利要求3所述的方法,其中,所述对所述多个基础用户的原始语音进行脱敏处理,得到所述脱敏语音,包括:将所述原始语音输入预先完成训练的内容脱敏模块,输出所述脱敏语音,所述内容脱敏模块在训练过程中的训练目标包括:预先完成训练的内容识别模块无法从训练样本对应的脱敏语音中识别出所述训练样本的原始语音中的内容、以及预先完成训练的声纹识别模块从所述训练样本对应的脱敏语音中能够识别出所述训练样本的原始语音对应的身份。5.如权利要求3所述的方法,其中,所述基于所述脱敏语音,得到所述语音数据库,包括:对所述脱敏语音进行身份特征提取,得到第一身份特征;以及将所述多个基础用户对应的多个第一身份特征存储到所述语音数据库。6.如权利要求5所述的方法,其中,所述将所述目标人脸图像与所述语音数据库进行跨模态比对,并确定比对结果,包括:确定所述目标人脸图像的图像特征;以及将所述图像特征与所述多个第一身份特征中的每个第一身份特征进行跨模态比对,确定所述比对结果。7.如权利要求6所述的方法,其中,所述将所述图像特征与所述多个第一身份特征中的每个第一身份特征进行跨模态比对,确定所述比对结果,包括:确定所述图像特征与所述每个第一身份特征之间的特征相似度;以及将所述特征相似度最大的最大相似度确定为所述比对结果。8.如权利要求7所述的方法,其中,所述图像特征包含语音模态信息。9.如权利要求8所述的方法,其中,所述图像特征通过图像特征编码器得到,所述图像特征编码器在训练过程中的训练目标包括:预先完成训练的模态迁移模块能够基于人脸图像训练样本对应的图像特征生成满足预设的第一迁移条件的跨模态语音特征,所述第一迁移条件包括所述跨模态语音特征与所述人脸图像训练样本对应的真实语音特征之间的差异小于预设的第一差异阈值,其中,所述第一身份特征是基于身份特征提取模型得到的,所述人脸图像训练样本对
应的真实语音特征是通过所述身份特征提取模型对所述人脸图像训练样本对应的...

【专利技术属性】
技术研发人员:曹佳炯
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1