模型训练、人脸识别方法、电子设备及存储介质技术

技术编号:31638582 阅读:17 留言:0更新日期:2021-12-29 19:19
本发明专利技术实施例涉及人脸识别领域,公开了一种模型训练、人脸识别方法、电子设备及存储介质,其中模型训练包括:采集包含不同人群类别下人脸的图像样本,并标注所述图像样本所属人群类别的类别标签;基于由所述图像样本构建的三元组样本,对预先搭建的人脸识别模型进行原始训练,得到训练完成后的人脸识别模型;以所述人脸识别模型中特征提取网络中任一层输出的特征图为输入,增设人群类别分支网络,形成中间模型;基于所述图像样本和所述图像样本的类别标签训练所述人群类别分支网络,得到训练完成后的所述中间模型。本方案能够有效解决当前人脸识别产品采用同一人脸识别算法无法很好地同时解决因人群类别差异造成的拒识率高或者误识率高的问题。或者误识率高的问题。或者误识率高的问题。

【技术实现步骤摘要】
模型训练、人脸识别方法、电子设备及存储介质


[0001]本专利技术涉及人脸识别领域,特别涉及一种模型训练、人脸识别方法、电子设备及存储介质。

技术介绍

[0002]随着人脸识别技术在日常生活中的普及,其面临的应用场景也越来越复杂。传统的基于单一场景单一群体的很多人脸识别方法已暴露出局限性。当应用场景中人群包含多种族(黄种人,白种人,黑人等)或者多年龄段(儿童,成人,老人)时,通常的解决方案有两种:方案一:针对不同的人群类别训练不同的人脸识别算法,然后根据具有评估分类功能(如种族分类或者年龄段分类)的估计模型选择特定的人脸识别模型和识别阈值完成人脸识别。
[0003]方案二:不区分人群类别之间的差异性,整体采用一个识别模型进行人脸识别。
[0004]然而,上述两种方案均存在一些弊端:方案一虽然总体在方法和结果上能很好地解决复杂场景下对不同的人群类别的人脸识别,但是整个系统较复杂,算法开发工作量大,且对硬件平台算力和存储有很高的要求。
[0005]方案二中对于重量型识别模型,其由于自身模型(容量)能力,相对轻量型网络来说,在训练时是对多种人群类别一起训练,其总体识别效果也许能满足场景需求。但是从本质上,由于多种人群类别本身具有的特异性,无论是重量型模型还是轻量型模型各种类别人群其对应的特征空间是无法完全重合的,且相互存在一定的重叠。因此若不加以区分直接进行识别,在特定的人群上体验会较差,如拒识率较高或者误识率较高。同时由于特征空间存在重叠的固有弊端,使用传统的机器学习方法对特征聚类或者使用额外的评估分类模型对群体进行区分后,虽能改善一部分拒识或者误识的情况,但依然无法满足所有的场景需求,尤其是在金融场景或者人脸识别门锁场景部署的这种对安全性要求极高的人脸识别系统。

技术实现思路

[0006]本专利技术实施方式的目的在于提供一种模型训练、人脸识别方法、电子设备及存储介质,能够有效解决当前人脸识别产品采用同一人脸识别算法无法很好地同时解决因人群类别差异造成的拒识率高或者误识率高的问题。
[0007]为解决上述技术问题,本专利技术的实施方式提供了一种模型训练方法,包括:采集包含不同人群类别下人脸的图像样本,并标注所述图像样本所属人群类别的类别标签;基于由所述图像样本构建的三元组样本,对预先搭建的人脸识别模型进行原始训练,得到训练完成后的人脸识别模型;
以所述人脸识别模型中特征提取网络中任一层输出的特征图为输入,增设人群类别分支网络,形成中间模型;所述中间模型的输出包括所述人脸识别模型输出的人脸特征,以及所述人群类别分支网络输出的人群类别;基于所述图像样本和所述图像样本的类别标签训练所述人群类别分支网络,得到训练完成后的所述中间模型。
[0008]本专利技术的实施方式提供了一种人脸识别方法,包括:采用如上所述的模型训练方法训练出的中间模型对待识别人脸图像进行人脸识别,得到所述中间模型中所述人脸识别模型输出的人脸特征,以及所述人群类别分支网络输出的人群类别;采用预设的相似阈值中与所述中间模型识别得到的人群类别对应的相似阈值,对所述人脸识别模型输出的人脸特征与注册特征库中的人脸特征逐一进行相似比对,确定所述待识别人脸图像中人脸的身份信息。
[0009]本专利技术的实施方式还提供了一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的模型训练方法,或者如上所述的人脸识别方法。
[0010]本专利技术的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的模型训练方法,或者如上所述的人脸识别方法。
[0011]本专利技术实施方式相对于现有技术而言,通过采集包含不同人群类别下人脸的图像样本,并标注图像样本所属人群类别的类别标签;基于由图像样本构建的三元组样本,对预先搭建的人脸识别模型进行原始训练,得到训练完成后的人脸识别模型;以人脸识别模型中特征提取网络中任一层输出的特征图为输入,增设人群类别分支网络,形成中间模型;中间模型的输出包括人脸识别模型输出的人脸特征,以及人群类别分支网络输出的人群类别;基于图像样本和图像样本的类别标签训练人群类别分支网络,得到训练完成后的中间模型。本方案中训练的中间模型,可以同时得到待识别人脸图像的人脸特征以及待识别人脸所属的人群类别。在后续进行特征比对时,可以采用预设的相似阈值中与识别出的人群类别对应的相似阈值,对人脸识别模型输出的人脸特征与注册特征库中的人脸特征逐一进行相似比对,确定待识别人脸图像中人脸的身份信息,从而很好地解决因人群类别差异造成的拒识率高或者误识率高的问题,提高人脸识别的准确率。
附图说明
[0012]图1是根据本专利技术实施方式的模型训练方法的具体流程图一;图2是根据本专利技术实施方式的中间模型的结构示意图;图3是根据本专利技术实施方式的模型训练方法的具体流程图二;图4是根据本专利技术实施方式的人脸识别方法的具体流程图;图5是根据本专利技术实施方式的电子设备的结构示意图。
具体实施方式
[0013]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本专利技术各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
[0014]本专利技术的一实施方式涉及一种模型训练方法,如图1所示,本实施例提供的模型训练方法,包括如下步骤。
[0015]步骤101:采集包含不同人群类别下人脸的图像样本,并标注图像样本所属人群类别的类别标签。
[0016]其中,上述不同人群类别为从某一维度划分的多个人群类别,如按年龄段划分的多个年龄类别或者按种族划分的多个种族类别等。
[0017]具体地,采集按上述某一维度划分的不同人群类别下人脸的图像样本,并标注图像样本所属人群类别的类别标签。例如,按人脸所属年龄段可以划分三个年龄类别:儿童、成年、老年;对应的类别标签为0、1、2,其中0代表儿童、1代表成年、2代表老年。又例如,按人脸所属种族可以划分如下种族类别:黄种人、白种人、黑种人,
……
;对应的类别标签为0、1、2,
……
,其中0代表黄种人、1代表白种人、2代表黑种人,
……

[0018]为了避免训练得到的人脸识别模型具有偏向性(如该人脸识别模型对中年群体识别鲁棒性较好,老年、儿童群体识别鲁棒性较差),将已有的人脸识别模型作为预训练模型,修改三元组损失(triplet loss)采样策略,保持总体数据均衡。在一个例子中,采集包含不同人群类别下人脸的图像样本的过程可满足如下采集策略。
[0019]在任一次采样的图像样本中:包含全部人群类别、且各人群类别的图像样本数量均衡;所属不同人的图像样本数量本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:采集包含不同人群类别下人脸的图像样本,并标注所述图像样本所属人群类别的类别标签;基于由所述图像样本构建的三元组样本,对预先搭建的人脸识别模型进行原始训练,得到训练完成后的人脸识别模型;以所述人脸识别模型中特征提取网络中任一层输出的特征图为输入,增设人群类别分支网络,形成中间模型;所述中间模型的输出包括所述人脸识别模型输出的人脸特征,以及所述人群类别分支网络输出的人群类别;基于所述图像样本和所述图像样本的类别标签训练所述人群类别分支网络,得到训练完成后的所述中间模型。2.根据权利要求1所述的方法,其特征在于,所述人群类别为按年龄段划分的多个年龄类别或者按种族划分的多个种族类别;所述采集包含不同人群类别下人脸的图像样本的过程满足如下采集策略:在任一次采样的图像样本中:包含全部所述人群类别、且各所述人群类别的图像样本数量均衡;所属不同人的图像样本数量均衡;同一人的图像样本在预设的多个应用场景中的图像样本数量均衡。3.根据权利要求1所述的方法,其特征在于,所述基于由所述图像样本构建的三元组样本,对预先搭建的人脸识别模型进行原始训练,得到训练完成后的人脸识别模型之后,包括:针对原始训练时得到的所述人脸识别模型计算所述三元组图像样本的三元组损失,并根据计算结果从所述三元组图像样本中提取出困难样本;基于所述困难样本对所述原始训练后得到的人脸识别模型进行再次训练,得到优化的人脸识别模型;其中,再次训练时用于计算三元组损失的间隔参数,小于原始训练时用于计算三元组损失中的间隔参数;所述以所述人脸识别模型中特征提取网络中任一层输出的特征图为输入,增设人群类别分支网络,形成中间模型,包括:以所述优化的人脸识别模型中特征提取网络中任一层输出的特征图为输入,增设所述人群类别分支网络,形成所述中间模型。4.根据权利要求3所述的方法,其特征在于,所述针对原始训练时得到的所述人脸识别模型计算所述三元组图像样本的三元组损失,并根据计算结果从所述三元组图像样本中提取出困难样本,包括:通过如下公式计算各所述三元组图像样本的三元组损失L:当与所属相同人群类别时,M=margin1;当与所属不同人群类别时,M=margin2;其中,为第i个三元组图像样本中的锚定样本、为第i个三元组图像样本中的正样
本、为第i个三元组图像样本中的负样本、f(*)为图像样本*经所述人脸识别模型计算得到的特征向量、N为所述三元组图像样本的总数量、为正样本与锚定样本之间的欧式...

【专利技术属性】
技术研发人员:胡长胜浦煜付贤强何武朱海涛户磊
申请(专利权)人:合肥的卢深视科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1