图像处理模型的训练方法、装置、电子设备和介质制造方法及图纸

技术编号:31797428 阅读:18 留言:0更新日期:2022-01-08 10:57
本公开提供了一种图像处理模型的训练方法、装置、电子设备和介质,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于人脸图像处理和人脸识别等场景。具体实现方案为:根据待训练图像处理模型输出的样本图像的样本特征,以及所述样本图像所属类别的类中心特征,确定所述样本图像的惩罚参数;根据所述惩罚参数确定损失函数,并根据所述损失函数对所述待训练图像处理模型进行训练。本公开实现了对损失函数中的惩罚参数进行动态调整的效果,使得对不同样本图像实施不同的惩罚,改善图像处理模型训练的效果。改善图像处理模型训练的效果。改善图像处理模型训练的效果。

【技术实现步骤摘要】
图像处理模型的训练方法、装置、电子设备和介质


[0001]本公开涉及人工智能
,具体为计算机视觉和深度学习
,可应用于人脸图像处理和人脸识别等场景,特别涉及一种图像处理模型的训练方法、装置、电子设备和介质。

技术介绍

[0002]人脸识别是计算机视觉领域一个重要的研究方向。但由于人脸的复杂性,传统方法很难取得好的效果。随着神经网络技术的加入,人脸识别取得了一系列重大进展,目前的一些识别方法已经超过了人类的识别能力。
[0003]在目前的人脸识别模型训练的损失函数中,通常会设置惩罚参数来扩大样本之间的差距。

技术实现思路

[0004]本公开提供了一种用于改善人脸识别模型的模型训练效果的方法、装置、设备以及存储介质。
[0005]根据本公开的一方面,提供了一种图像处理模型的训练方法,包括:
[0006]根据待训练图像处理模型输出的样本图像的样本特征,以及所述样本图像所属类别的类中心特征,确定所述样本图像的惩罚参数;
[0007]根据所述惩罚参数确定损失函数,并根据所述损失函数对所述待训练图像处理模型进行训练。
[0008]根据本公开的另一方面,提供了一种电子设备,包括:
[0009]至少一个处理器;以及
[0010]与所述至少一个处理器通信连接的存储器;其中,
[0011]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开中任一项所述的方法。
[0012]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开中任一项所述的方法。
[0013]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0014]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0015]图1是根据本公开实施例公开的一种图像处理模型的训练方法的流程图;
[0016]图2是根据本公开实施例公开的一种图像处理模型的训练方法的流程图;
[0017]图3是根据本公开实施例公开的一种图像处理模型的训练装置的结构示意图;
[0018]图4是用来实现本公开实施例公开的图像处理模型的训练方法的电子设备的框
图。
具体实施方式
[0019]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0020]申请人在研发过程中发现,近年来,深度学习技术随着硬件资源的支持获得了飞速发展,在很多领域相比传统算法都取得了不错的效果,特别是在计算机视觉领域,如目标检测、图像识别和图像增强等方向都取得了很大的成功。其中,人脸识别是计算机视觉领域一个重要的研究方向。但由于人脸的复杂性,传统方法很难取得好的效果。随着神经网络技术的加入,人脸识别取得了一系列重大进展,目前的一些识别方法已经超过了人类的识别能力。
[0021]在目前的人脸识别训练的损失函数中,基本都是采用基于softmax函数设计的损失函数。在这些损失函数中,会设置惩罚参数来扩大样本之间的差距,以此来减少类内间距,扩大类间间距。但这些方法中的惩罚参数一般是作为超参数,由相关人员根据经验或实验设定为固定的数值。
[0022]然而由于设置固定的惩罚参数,对于不同难度的样本图像,就会不加区分的施加同样的惩罚,最后就会出现在模型训练时对困难样本的关注不够的问题,导致模型训练的效果不佳,进一步的影响到模型的以损失函数为cosface函数为例进行解释说明:
[0023][0024]其中,L
lmc
表示cosface函数,m表示固定的惩罚参数,而cos(θ
yi
,i)表示样本图像i的样本特征和样本图像i所属类别yi的类中心特征之间的相似度,而相似度越高表示样本图像i的识别难度越低,相似度越低表示样本图像i的识别难度越高。通过在样本图像i的余弦角度上减去惩罚参数m,类别分割的标准变得更加严格,有些本来可以分对的类由于m的影响也变成了分错的类,这就对模型提出了更高的要求,模型产生的特征就变得更加有区分性。然而由于惩罚参数m是固定的,这就导致对不同难度的样本图像,不加区分的施加同样的惩罚,对于那些难度较高的样本图像,会出现惩罚不足的问题,导致模型训练的效果不佳。
[0025]图1是根据本公开实施例公开的一种图像处理模型的训练方法的流程图,本实施例可以适用于训练人脸识别模型的情况。本实施例方法可以由本公开实施例公开的图像处理模型的训练装置来执行,所述装置可采用软件和/或硬件实现,并可集成在任意的具有计算能力的电子设备上。
[0026]如图1所示,本实施例公开的图像处理模型的训练方法可以包括:
[0027]S101、根据待训练图像处理模型输出的样本图像的样本特征,以及所述样本图像所属类别的类中心特征,确定所述样本图像的惩罚参数。
[0028]其中,待训练图像处理模型表示未训练完成的图像处理模型,模型类型包括但不
限于神经网络模型,例如目标检测模型、图像识别模型和图像增强模型,在本实施例中待训练图像处理模型可选的为人脸识别模型。样本图像即训练数据集中的训练样本图像,样本图像可预先通过人工的方式采集得到,或者通过关键词搜索的方式在图像库中搜索得到,本实施例并不对样本图像的来源进行限定。样本特征表示各样本图像的图像特征,是通过待训练图像处理模型的卷积层对各样本图像进行特征提取得到的。各样本图像被预先标定了所属的类别,以待训练图像处理模型为人脸识别模型为例,各样本图像被预先标定了分别所属的一个身份信息,例如样本图像A和样本图像B均所属用户A,即样本图像A和样本图像B为用户A不同的两张人脸图像。类中心特征表示同一类样本图像的样本特征的平均特征,即同一类样本图像的样本特征的中心点,由待训练图像处理模型对同一类样本图像的样本特征学习得到。惩罚参数即margin参数,用于对各样本图像来进行度量的约束,让当前样本图像所属类别减去一个惩罚参数之后仍然属于这个类别。
[0029]在一种实施方式中,获取待训练图像处理模型输出的各样本图像的样本特征,以及各样本图像所属类别的类中心特征,并确定各样本图像的样本特征与其所属类别的类中心特征之间的相似度值,例如将样本特征与类中心特征之间的特征夹角作为相似度值,或者将样本特征与类中心特征之间的余弦值作为相似度值,本实施例并不对相似度值的计算方式进行具体限定。
[0030]确定各样本图像对应的所述相似度值后,根据预先设定的相似度值和惩罚参数之间的函数关系,即将相似度值作为函数输入,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像处理模型的训练方法,包括:根据待训练图像处理模型输出的样本图像的样本特征,以及所述样本图像所属类别的类中心特征,确定所述样本图像的惩罚参数;根据所述惩罚参数确定损失函数,并根据所述损失函数对所述待训练图像处理模型进行训练。2.根据权利要求1所述的方法,其中,所述根据待训练图像处理模型输出的样本图像的样本特征,以及所述样本图像所属类别的类中心特征,确定所述样本图像的惩罚参数,包括:确定任一样本图像的样本特征和该样本图像所属类别的类中心特征之间的相似度值;根据所述相似度值确定该样本图像对应的惩罚参数;其中,所述惩罚参数的取值与所述相似度值之间呈负相关。3.根据权利要求2所述的方法,其中,所述确定任一样本图像的样本特征和该样本图像所属类别的类中心特征之间的相似度值,包括:确定所述样本特征和所述类中心特征之间的特征夹角,并根据所述特征夹角的余弦值确定所述相似度值。4.根据权利要求3所述的方法,其中,所述根据所述相似度值确定该样本图像对应的惩罚参数,包括:通过以下公式确定所述惩罚参数:其中,dm
i
表示样本图像i对应的惩罚参数,cos(θ
yi,i
)表示样本图像i的样本特征和样本图像i所属类别yi的类中心特征之间的相似度,θ
yi,i
表示样本图像i的样本特征与类别yi的类中心特征之间的特征夹角,m表示固定常数。5.根据权利要求1所述的方法,其中,所述根据所述惩罚参数确定损失函数,包括:确定任一样本图像的样本特征和该样本图像所属类别的类中心特征之间的相似度值;确定该样本图像的样本特征和非该样本图像所属类别的类中心特征之间的辅助相似度值;根据所述相似度值、所述辅助相似度值和该样本图像对应的惩罚参数,确定所述损失函数。6.根据权利要求5所述的方法,其中,所述根据所述相似度值、所述辅助相似度值和该样本图像对应的惩罚参数,确定所述损失函数,包括:通过以下公式确定所述损失函数:其中,l表示所述损失函数,N表示样本图像的总数量,cos(θ
yi,i
)表示样本图像i的样本特征和样本图像i所属类别yi的类中心特征之间的相似度,θ
yi,i
表示样本图像i的样本特征与类别yi的类中心特征之间的特征夹角,cos(θ
j,i
)表示样本图像i的样本特征和非样本图像i所属类别j的类中心特征之间的辅助相似度值,θ
j,i
表示样本图像i的样本特征与类别j
的类中心特征之间的特征夹角,dm
i
表示样本图像i对应的惩罚参数,s表示固定常数。7.一种图像处理模型的训练装置,包括:惩罚参数确定模块,用于根据待训练图像处理模型输出的样本图像的样本特征,以及所述样本图像所属类别的类中心特征,确定所述样本图像的惩罚参数。模型训练模块,用于根据...

【专利技术属性】
技术研发人员:张玉立
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1