年龄估计模型的训练方法、年龄估计方法以及对应的装置制造方法及图纸

技术编号:22220253 阅读:51 留言:0更新日期:2019-09-30 01:58
本申请实施例提供了一种年龄估计模型的训练方法、年龄估计方法以及对应的装置,该训练方法包括:获取训练样本,各样本为标注有对应的年龄标签的人脸图像;确定各样本的年龄标签所对应的年龄标签分布;基于样本以及年龄标签分布,对年龄估计模型进行训练,直至年龄估计模型的总损失函数收敛;其中,总损失函数包括分布损失函数和回归损失函数,分布损失函数表征了样本的年龄标签分布和预测年龄分布的差异,回归损失函数表征了样本的年龄标签和预测年龄值的差异。基于本申请实施例所提供的方案,能够有效提供年龄预测的准确性,更好的满足了实际应用需求。

Training Method, Age Estimation Method and Corresponding Device of Age Estimation Model

【技术实现步骤摘要】
年龄估计模型的训练方法、年龄估计方法以及对应的装置
本申请涉及计算机
,具体而言,本申请涉及一种年龄估计模型的训练方法、年龄估计方法以及对应的装置。
技术介绍
人脸的年龄进程是比较难可控的、非常个性化的,深度学习之前的传统的方法经常会存在泛化能力不足的问题。最近几年,在年龄估计中,深度CNN(ConvolutionalNeuralNetwork,卷积神经网络)因其具有较强的泛化能力而成为主要的研究方法。虽然当前对于年龄估计的研究已经有了很大程度的改进,但是由于人脸年龄是一个“动态”变化的个性化过程,现有的年龄估计方案仍有待改进。
技术实现思路
本申请实施例提供了一种年龄估计模型的训练方法、年龄估计方法以及对应的装置,具体技术方案如下:第一方面,本申请实施例提供了一种年龄估计模型的训练方法,年龄估计模型包括依次级联的特征提取模块、概率分布预测模块和年龄值预测模块,其中,特征提取模块,用于提取输入至模型的人脸图像的图像特征,概率分布预测模块,用于根据图像特征输出人脸图像中的人脸年龄对应于各个预划分的年龄端点值的预测年龄分布;年龄值预测模块,用于根据预测年龄分布输出人脸年龄的预测年龄值;该训练方法包括:获取训练样本,各样本为标注有对应的年龄标签的人脸图像;确定各样本的年龄标签所对应的年龄标签分布;基于样本以及年龄标签分布,对年龄估计模型进行训练,直至年龄估计模型的总损失函数收敛;其中,总损失函数包括分布损失函数和回归损失函数,分布损失函数表征了样本的年龄标签分布和预测年龄分布的差异,回归损失函数表征了样本的年龄标签和预测年龄值的差异。可选的,确定各样本的年龄标签所对应的年龄标签分布,包括:根据预划分的年龄端点值中与年龄标签相邻的至少两个年龄端点值,确定年龄标签分布;其中,年龄标签分布中的非零元素值为年龄标签属于相邻的至少两个年龄端点值中各端点值的概率。可选的,年龄标签为相邻的至少两个年龄端点值的凸组合,年龄标签属于相邻的至少两个年龄端点值中各端点值的概率为凸组合中相邻的至少两个年龄端点值中各端点值所对应的权重值。可选的,预划分的年龄端点值包括基于至少两种切分粒度分别对年龄范围进行划分得到的端点值;根据预划分的年龄端点值中与年龄标签相邻的至少两个年龄端点值,确定年龄标签分布,包括:分别根据每种切分粒度所对应的端点值中与年龄标签相邻的至少两个年龄端点值,确定每种切分粒度所对应的年龄标签分布;基于样本以及年龄标签分布,对年龄估计模型进行训练,直至年龄估计模型的总损失函数收敛,包括:基于样本和每种切分粒度所对应的年龄标签分布,分别对年龄估计模型进行训练,直至每种切分粒度所对应的总损失函数均收敛。可选的,若年龄标签为预划分的年龄端点值中的一个,确定各样本中的年龄标签所对应的年龄标签分布,包括以下任一种:根据等于年龄标签的年龄端点值确定年龄标签分布,年龄标签分布中的非零元素值为年龄标签属于与年龄标签相等的年龄端点值的概率,非零元素值的取值为1;根据等于年龄标签的年龄端点值,以及与等于年龄标签的年龄端点值相邻的至少两个年龄端点值,确定年龄标签分布,年龄标签分布中的非零元素值为年龄标签分别属于至少三个年龄端点值的概率,该至少三个年龄端点值包括等于年龄标签的年龄端点值,以及与等于年龄标签的年龄端点值相邻的至少两个年龄端点值;根据与等于年龄标签的年龄端点值相邻的至少两个年龄端点值,确定年龄标签分布。可选的,相邻的至少两个年龄端点值是与年龄标签直接相邻的两个年龄端点值。可选的,分布损失函数为KL-散度,回归损失函数为MAE(MeanAbsoluteError,平均绝对误差)。可选的,特征提取模块包括级联的卷积神经网络和第一全连接层,概率分布预测模块为第二全连接层,年龄值预测模块为第三全连接层;卷积神经层用于提取输入至模型的人脸图像的特征图,第一全连接层用于将卷积神经网络所提取的特征图映射为特征向量,第二全连接层用于根据特征映射模块输出的特征向量输出对应的预测年龄分布。第二方面,本申请实施例提供了一种年龄估计方法,该方法包括:获取待处理人脸图像;将待处理人脸图像输入至年龄估计模型中,基于年龄估计模型的输出得到待处理人脸图像中人脸的预测年龄值,其中,年龄估计模型是基于本申请第一方面中任一方案中所示的方法训练得到的。第三方面,本申请实施例提供了一种年龄估计模型的训练装置,该年龄估计模型包括依次级联的特征提取模块、概率分布预测模块和年龄值预测模块,其中,特征提取模块,用于提取输入至模型的人脸图像的图像特征,概率分布预测模块,用于根据图像特征输出人脸图像中的人脸年龄对应于各个预划分的年龄端点值的预测年龄分布;年龄值预测模块,用于根据预测年龄分布输出人脸年龄的预测年龄值;该训练装置包括:训练数据获取模块,获取训练样本,各样本为标注有对应的年龄标签的人脸图像;标签分布确定模块,用于确定各样本的年龄标签所对应的年龄标签分布;模型训练模块,用于基于样本以及年龄标签分布,对年龄估计模型进行训练,直至年龄估计模型的总损失函数收敛;其中,总损失函数包括分布损失函数和回归损失函数,分布损失函数表征了样本的年龄标签分布和预测年龄分布的差异,回归损失函数表征了样本的年龄标签和预测年龄值的差异。可选的,标签分布确定模块具体用于:根据预划分的年龄端点值中与年龄标签相邻的至少两个年龄端点值,确定年龄标签分布;其中,年龄标签分布中的非零元素值为年龄标签属于相邻的至少两个年龄端点值中各端点值的概率。可选的,年龄标签为相邻的至少两个年龄端点值的凸组合,年龄标签属于相邻的至少两个年龄端点值中各端点值的概率为凸组合中相邻的至少两个年龄端点值中各端点值所对应的权重值。可选的,预划分的年龄端点值包括基于至少两种切分粒度分别对年龄范围进行划分得到的端点值;标签分布确定模块在根据预划分的年龄端点值中与年龄标签相邻的至少两个年龄端点值,确定年龄标签分布时,具体用于:分别根据每种切分粒度所对应的端点值中与年龄标签相邻的至少两个年龄端点值,确定每种切分粒度所对应的年龄标签分布;相应的,模型训练模块具体用于:基于样本和每种切分粒度所对应的年龄标签分布,分布对年龄估计模型进行训练,直至每种切分粒度所对应的总损失函数均收敛。可选的,在年龄标签为预划分的年龄端点值中的一个时,标签分布确定模块在确定各样本中的年龄标签所对应的年龄标签分布时,具体用于执行以下任一项:根据等于年龄标签的年龄端点值确定年龄标签分布,年龄标签分布中的非零元素值为年龄标签属于与年龄标签相等的年龄端点值的概率,非零元素值的取值为1;根据等于年龄标签的年龄端点值,以及与等于年龄标签的年龄端点值相邻的至少两个年龄端点值,确定年龄标签分布,年龄标签分布中的非零元素值为年龄标签分别属于至少三个年龄端点值的概率,至少三个年龄端点值包括等于年龄标签的年龄端点值,以及与等于年龄标签的年龄端点值相邻的至少两个年龄端点值;根据与等于年龄标签的年龄端点值相邻的至少两个年龄端点值,确定年龄标签分布。可选的,相邻的至少两个年龄端点值是与年龄标签直接相邻的两个年龄端点值。可选的,分布损失函数为KL-散度,回归损失函数为MAE。可选的,特征提取模块包括卷积神经网络和第一全连接层,概率分布预测模块为第二全连接层,年龄值预测模块为第三全连接层本文档来自技高网...

【技术保护点】
1.一种年龄估计模型的训练方法,其特征在于,所述年龄估计模型包括依次级联的特征提取模块、概率分布预测模块和年龄值预测模块,其中,所述特征提取模块,用于提取输入至模型的人脸图像的图像特征,所述概率分布预测模块,用于根据所述图像特征输出所述人脸图像中的人脸年龄对应于各个预划分的年龄端点值的预测年龄分布;所述年龄值预测模块,用于根据所述预测年龄分布输出所述人脸年龄的预测年龄值;所述训练方法包括:获取训练样本,各所述样本为标注有对应的年龄标签的人脸图像;确定各所述样本的年龄标签所对应的年龄标签分布;基于所述样本以及所述年龄标签分布,对所述年龄估计模型进行训练,直至所述年龄估计模型的总损失函数收敛;其中,所述总损失函数包括分布损失函数和回归损失函数,所述分布损失函数表征了所述样本的年龄标签分布和预测年龄分布的差异,所述回归损失函数表征了所述样本的年龄标签和预测年龄值的差异。

【技术特征摘要】
1.一种年龄估计模型的训练方法,其特征在于,所述年龄估计模型包括依次级联的特征提取模块、概率分布预测模块和年龄值预测模块,其中,所述特征提取模块,用于提取输入至模型的人脸图像的图像特征,所述概率分布预测模块,用于根据所述图像特征输出所述人脸图像中的人脸年龄对应于各个预划分的年龄端点值的预测年龄分布;所述年龄值预测模块,用于根据所述预测年龄分布输出所述人脸年龄的预测年龄值;所述训练方法包括:获取训练样本,各所述样本为标注有对应的年龄标签的人脸图像;确定各所述样本的年龄标签所对应的年龄标签分布;基于所述样本以及所述年龄标签分布,对所述年龄估计模型进行训练,直至所述年龄估计模型的总损失函数收敛;其中,所述总损失函数包括分布损失函数和回归损失函数,所述分布损失函数表征了所述样本的年龄标签分布和预测年龄分布的差异,所述回归损失函数表征了所述样本的年龄标签和预测年龄值的差异。2.根据权利要求1所述的方法,其特征在于,所述确定各所述样本的年龄标签所对应的年龄标签分布,包括:根据预划分的年龄端点值中与所述年龄标签相邻的至少两个年龄端点值,确定所述年龄标签分布;其中,所述年龄标签分布中的非零元素值为所述年龄标签属于所述相邻的至少两个年龄端点值中各端点值的概率。3.根据权利要求2所述的方法,其特征在于,所述年龄标签为所述相邻的至少两个年龄端点值的凸组合,所述年龄标签属于所述相邻的至少两个年龄端点值中各端点值的概率为所述凸组合中所述相邻的至少两个年龄端点值中各端点值所对应的权重值。4.根据权利要求2所述的方法,其特征在于,所述预划分的年龄端点值包括基于至少两种切分粒度分别对年龄范围进行划分得到的端点值;所述根据预划分的年龄端点值中与所述年龄标签相邻的至少两个年龄端点值,确定所述年龄标签分布,包括:分别根据每种切分粒度所对应的端点值中与所述年龄标签相邻的至少两个年龄端点值,确定每种切分粒度所对应的年龄标签分布;所述基于所述样本以及所述年龄标签分布,对所述年龄估计模型进行训练,直至所述年龄估计模型的总损失函数收敛,包括:基于所述样本和每种切分粒度所对应的年龄标签分布,分别对所述年龄估计模型进行训练,直至每种切分粒度所对应的所述总损失函数均收敛。5.根据权利要求1所述的方法,其特征在于,若所述年龄标签为预划分的年龄端点值中的一个,所述确定各所述样本中的年龄标签所对应的年龄标签分布,包括以下任一种:根据等于所述年龄标签的年龄端点值确定所述年龄标签分布,所述年龄标签分布中的非零元素值为所述年龄标签属于与所述年龄标签相等的年龄端点值的概率,非零元素值的取值为1;根据等于所述年龄标签的年龄端点值,以及与等于所述年龄标签的年龄端点值相邻的至少两个年龄端点值,确定所述年龄标签分布,所述年龄标签分布中的非零元素值为所述年龄标签分别属于至少三个年龄端点值的概率,所述至少三个年龄端点值包括等于所述年龄标签的年龄端点值,...

【专利技术属性】
技术研发人员:章超刘帅成
申请(专利权)人:成都旷视金智科技有限公司北京旷视科技有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1