System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于增量数据的模型迭代方法、活体检测方法及装置制造方法及图纸_技高网

一种基于增量数据的模型迭代方法、活体检测方法及装置制造方法及图纸

技术编号:43266470 阅读:12 留言:0更新日期:2024-11-08 20:44
一种基于增量数据的模型迭代方法,包括:获取第一数据集和第二数据集,第一数据集中的样本具有第一标签和第二标签,第二数据集中的样本具有第三标签,第一标签和第三标签均与活体检测任务相关,第二标签与活体检测任务无关;利用活体检测模型对第一数据集和第二数据集中的样本进行检测处理,得到第一检测结果,基于第一检测结果、第一标签和第三标签进行损失计算,得到第一损失,该活体检测模型基于第一数据集训练得到;至少通过活体检测模型对第一数据集中的样本进行分类处理,得到第一分类结果,基于第一分类结果和第二标签进行损失计算,得到第二损失;基于第一损失和第二损失,对活体检测模型进行迭代更新。该方法能够提升模型的训练效果。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及一种基于增量数据的模型迭代方法、活体检测方法及装置


技术介绍

1、活体检测是一种通过人像识别技术来判断相机镜头前的用户是否为真人的一种技术。目前,一般是通过深度学习算法实现对由神经网络(neural network,nn)等构成的活体检测模型的训练。在训练过程中,训练数据是决定训练得到的活体检测模型性能上限的决定因素。训练数据一般是不断的分批次采集或购买,这使得训练数据会变得越来越复杂。目前常将不同批次的数据直接按照某个比例进行混合,并由混合后的数据对活体检测模型进行训练。但这样,经常会导致训练出的模型过拟合到某一批数据之上,影响模型的训练效果。


技术实现思路

1、本申请提供了一种基于增量数据的模型迭代方法、活体检测方法、装置、电子设备、计算机存储介质及包含指令的计算机程序产品,能够缓解在数据迭代过程中存在的某些数据过拟合的现象,提升了模型的训练效果,和模型的泛化能力。

2、第一方面,本申请提供一种基于增量数据的模型迭代方法,包括:获取第一数据集和第二数据集,第二数据集中的样本为增量数据,第一数据集中的样本具有第一标签和第二标签,第二数据集中的样本具有第三标签,第一标签和第三标签均与活体检测任务相关,第二标签与活体检测任务无关;利用第一活体检测模型对第一数据集和第二数据集中的样本进行检测处理,得到第一检测结果,以及,基于第一检测结果、第一标签和第三标签进行损失计算,得到第一损失,其中,第一活体检测模型基于第一数据集和第一标签训练得到;至少通过第一活体检测模型,对第一数据集中的样本进行分类处理,得到第一分类结果,以及,基于第一分类结果和第二标签进行损失计算,得到第二损失;基于第一损失和第二损失,对第一活体检测模型进行迭代更新,得到第二活体检测模型。

3、这样,通过设定训练数据中与活体检测任务无关的标签,并以增大该标签对应的损失,迫使模型忽视不同数据分布对训练任务带来的负面影响,从而降低了模型过拟合到与活体检测任务无关的特征之上;而通过以减小与活体检测任务有关的标签对应的损失,可使得模型更多的关注与活体检测任务有关的特征之上。由此,就在缓解在数据迭代过程中存在的某些数据过拟合的现象的同时,提升了模型的训练效果,和模型的泛化能力。

4、在一种可能的实现方式中,第一数据集中包括第一样本。至少通过第一活体检测模型,对第一数据集中的样本进行分类处理,得到第一分类结果,包括:利用第一活体检测模型对第一样本进行特征提取,得到第一样本特征;对第一样本特征进行分类处理,得到第一样本的分类结果。

5、基于第一分类结果和第二标签进行损失计算,得到第二损失,包括:基于第一样本的分类结果和第一样本的第二标签进行损失计算,得到第二损失。

6、基于第一损失和第二损失,对第一活体检测模型进行迭代更新,得到第二活体检测模型,包括:以减小第一损失和增大第二损失为目标,对第一活体检测模型进行迭代更新。

7、在一种可能的实现方式中,第一数据集中包括第一样本,第二数据集中包括第二样本。利用第一活体检测模型对第一数据集和第二数据集中的样本进行检测处理,得到第一检测结果,包括:利用第一活体检测模型分别对第一样本和第二样本进行特征提取,得到第一样本的第一样本特征和第二样本的第二样本特征;以及,利用第一活体检测模型分别对第一样本特征和第二样本特征进行检测,得到第一样本的检测结果和第二样本的检测结果。

8、基于第一检测结果、第一标签和第三标签进行损失计算,得到第一损失,包括:基于第一样本的检测结果和第一样本的第一标签进行损失计算,得到第一子损失,并基于第二样本的检测结果和第二样本的第三标签进行损失计算,得到第二子损失;以及,对第一子损失和第二子损失进行加权计算,得到第一损失。

9、在一种可能的实现方式中,在对第一子损失和第二子损失进行加权计算之前,还包括:设置第一子损失和第二子损失的权重,以使第一子损失大于第二子损失。

10、在一种可能的实现方式中,第二标签包括多个类别的标签,多个类别包括样本采集设备的类别、样本采集光照的类别、样本中目标对象的属性类别和样本图像质量的类别中的至少两项。

11、在一种可能的实现方式中,第二标签中的至少一个类别对应的标签包括第一子标签和第二子标签,且在第一数据集中具有第一子标签的样本的占比和具有第二子标签的样本的占比均大于预设阈值。

12、在一种可能的实现方式中,第二数据集中的样本还具有与所述活体检测任务无关的第四标签,所述第四标签对应的类别与所述第二标签对应的类别一致。该方法还包括:至少通过所述第一活体检测模型,对所述第二数据集中的样本进行分类处理,得到第二分类结果,以及,基于所述第二分类结果和所述第四标签进行损失计算,得到第三损失;以增大所述第三损失为目标,对所述第一活体检测模型进行迭代更新。

13、第二方面,本申请提供一种活体检测方法,包括:获取待检测图像;通过活体检测模型对待检测图像进行处理,该活体检测模型通过第一方面中所提供的方法迭代得到;输出待检测图像是否为活体的检测结果。

14、第三方面,本申请提供一种基于增量数据的模型迭代装置,包括:获取模块和处理模块。其中,获取模块,用于获取第一数据集和第二数据集,第二数据集中的样本为增量数据,第一数据集中的样本具有第一标签和第二标签,第二数据集中的样本具有第三标签,第一标签和第三标签均与活体检测任务相关,第二标签与活体检测任务无关。处理模块,用于利用第一活体检测模型对第一数据集和第二数据集中的样本进行检测处理,得到第一检测结果,以及,基于第一检测结果、第一标签和第三标签进行损失计算,得到第一损失,其中,第一活体检测模型基于第一数据集和第一标签训练得到。处理模块,还用于至少通过第一活体检测模型,对第一数据集中的样本进行分类处理,得到第一分类结果,以及,基于第一分类结果和第二标签进行损失计算,得到第二损失。处理模块,还用于基于第一损失和第二损失,对第一活体检测模型进行迭代更新,得到第二活体检测模型。

15、在一种可能的实现方式中,第一数据集中包括第一样本。处理模块在至少通过第一活体检测模型,对第一数据集中的样本进行分类处理,得到第一分类结果时,具体用于:利用第一活体检测模型对第一样本进行特征提取,得到第一样本特征;对第一样本特征进行分类处理,得到第一样本的分类结果。

16、处理模块在基于第一分类结果和第二标签进行损失计算,得到第二损失时,具体用于:基于第一样本的分类结果和第一样本的第二标签进行损失计算,得到第二损失。

17、处理模块在基于第一损失和第二损失,对第一活体检测模型进行迭代更新,得到第二活体检测模型时,具体用于:以减小第一损失和增大第二损失为目标,对第一活体检测模型进行迭代更新。

18、在一种可能的实现方式中,第一数据集中包括第一样本,第二数据集中包括第二样本。处理模块在利用第一活体检测模型对第一数据集和第二数据集中的样本进行检测处理,得到第一检本文档来自技高网...

【技术保护点】

1.一种基于增量数据的模型迭代方法,包括:

2.根据权利要求1所述的方法,其中,所述第一数据集中包括第一样本;

3.根据权利要求1所述的方法,其中,所述第一数据集中包括第一样本,所述第二数据集中包括第二样本;

4.根据权利要求3所述的方法,其中,在对所述第一子损失和所述第二子损失进行加权计算之前,还包括:

5.根据权利要求1所述的方法,其中,所述第二标签包括多个类别的标签,所述多个类别包括样本采集设备的类别、样本采集光照的类别、样本中目标对象的属性类别和样本图像质量的类别中的至少两项。

6.根据权利要求1所述的方法,其中,所述第二标签中的至少一个类别对应的标签包括第一子标签和第二子标签,且在所述第一数据集中具有所述第一子标签的样本的占比和具有所述第二子标签的样本的占比均大于预设阈值。

7.根据权利要求1所述的方法,其中,所述第二数据集中的样本还具有与所述活体检测任务无关的第四标签,所述第四标签对应的类别与所述第二标签对应的类别一致;

8.一种活体检测方法,其中,包括:

9.一种基于增量数据的模型迭代装置,包括:

10.一种活体检测装置,其中,包括:

11.一种电子设备,包括:

12.一种计算机存储介质,所述计算机存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1-7任一所述的方法,或者,执行如权利要求7所述的方法。

13.一种包含指令的计算机程序产品,当所述指令在计算机上运行时,使得所述计算机执行如权利要求1-7任一所述的方法,或者,执行如权利要求7所述的方法。

...

【技术特征摘要】

1.一种基于增量数据的模型迭代方法,包括:

2.根据权利要求1所述的方法,其中,所述第一数据集中包括第一样本;

3.根据权利要求1所述的方法,其中,所述第一数据集中包括第一样本,所述第二数据集中包括第二样本;

4.根据权利要求3所述的方法,其中,在对所述第一子损失和所述第二子损失进行加权计算之前,还包括:

5.根据权利要求1所述的方法,其中,所述第二标签包括多个类别的标签,所述多个类别包括样本采集设备的类别、样本采集光照的类别、样本中目标对象的属性类别和样本图像质量的类别中的至少两项。

6.根据权利要求1所述的方法,其中,所述第二标签中的至少一个类别对应的标签包括第一子标签和第二子标签,且在所述第一数据集中具有所述第一子标签的样本的占比和具有所述第二子标签的...

【专利技术属性】
技术研发人员:熊柏桥王旭
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1