【技术实现步骤摘要】
非线性3DMM人脸重建和姿态归一化方法、装置、介质及设备
本专利技术涉及计算机视觉领域,特别是指一种非线性3DMM人脸重建方法、装置、计算机可读存储介质及设备,以及基于该非线性3DMM重建方法的人脸姿态归一化方法、装置、计算机可读存储介质及设备。
技术介绍
在人脸图像识别技术中,人脸的姿态是影响人脸识别率的重要因素,现有技术的人脸图像识别主要是对正面人脸图像或者小姿态(角度)人脸图像的识别,对于大姿态人脸图像的识别结果很不理想,为了提高识别准确率,需要对人脸图像(尤其是大姿态人脸图像)进行姿态归一化。前述的人脸图像、小姿态人脸图像和大姿态人脸图像都是2D人脸图像。基于3D重建的人脸姿态归一化方法是指将前述的2D人脸图像进行3D重建,得到3D人脸,对3D人脸进行姿态矫正(归一化)后重新投影成2D人脸图像以完成人脸姿态归一化的方法。基于3D重建的人脸姿态归一化方法的核心是对待归一化的2D人脸图像进行3D重建,一般的,3D在重建中3DMM类型的方法应用最多,3DMM方法主要分为如下方面。(1)线性3DMM参数估计方法3D形变模型(3DMorphableModel,3DMM),是一种基于统计学原理构建3D人脸模型的方法。线性3DMM参数估计方法的大致思路是利用一个人脸数据库构造一个平均(准确地说是特征人脸:平均人脸+特征向量组*对应系数,注:此系数非特征值,而是需要最终逆向求解的)人脸形变模型,在给出新的2D人脸图像后,将2D人脸图像与平均人脸形变模型进行匹配结合,调整平均人脸形变模型相应的参 ...
【技术保护点】
1.一种非线性3DMM人脸重建方法,其特征在于,所述方法包括:/n使用训练集对非线性3DMM模型进行训练;/n其中,所述训练集包括多个2D人脸图像样本,所述非线性3DMM模型包括CNN编码器、多层感知形状解码器、CNN纹理解码器和渲染层;/n在训练时,输入所述非线性3DMM模型的2D人脸图像样本经过所述CNN编码器估计得到相机投影参数、形状参数和纹理参数,所述多层感知形状解码器将所述形状参数解码为3D形状,所述CNN纹理解码器将所述纹理参数解码为3D纹理,所述渲染层根据所述相机投影参数、3D形状和3D纹理得到渲染图像;通过损失函数训练所述CNN编码器、多层感知形状解码器和CNN纹理解码器的参数;/n将获取的2D人脸图像输入训练好的非线性3DMM模型,得到3D人脸;/n其中,2D人脸图像经过所述CNN编码器估计得到形状参数和纹理参数,所述多层感知形状解码器将所述形状参数解码为3D形状,所述CNN纹理解码器将所述纹理参数解码为3D纹理,所述渲染层根据所述3D形状、3D纹理和预定义的2D纹理图进行3D渲染,得到3D人脸。/n
【技术特征摘要】
20190624 CN 20191055120091.一种非线性3DMM人脸重建方法,其特征在于,所述方法包括:
使用训练集对非线性3DMM模型进行训练;
其中,所述训练集包括多个2D人脸图像样本,所述非线性3DMM模型包括CNN编码器、多层感知形状解码器、CNN纹理解码器和渲染层;
在训练时,输入所述非线性3DMM模型的2D人脸图像样本经过所述CNN编码器估计得到相机投影参数、形状参数和纹理参数,所述多层感知形状解码器将所述形状参数解码为3D形状,所述CNN纹理解码器将所述纹理参数解码为3D纹理,所述渲染层根据所述相机投影参数、3D形状和3D纹理得到渲染图像;通过损失函数训练所述CNN编码器、多层感知形状解码器和CNN纹理解码器的参数;
将获取的2D人脸图像输入训练好的非线性3DMM模型,得到3D人脸;
其中,2D人脸图像经过所述CNN编码器估计得到形状参数和纹理参数,所述多层感知形状解码器将所述形状参数解码为3D形状,所述CNN纹理解码器将所述纹理参数解码为3D纹理,所述渲染层根据所述3D形状、3D纹理和预定义的2D纹理图进行3D渲染,得到3D人脸。
2.根据权利要求1所述的非线性3DMM人脸重建方法,其特征在于,所述非线性3DMM模型的训练包括先后进行的预训练阶段和微调阶段,其中:
所述预训练阶段的损失函数L0为:
L0=λ1L1+L2+λ3L3+λ4L4
L1为关键点损失,L2为3D形状损失,L3为3D纹理损失,L4为投影参数损失;
所述微调阶段的损失函数L为:
L=L6+λ5L5+λ1L1
L5为对抗损失,在对抗损失中,生成器为所述非线性3DMM模型,判别器为patchGAN的判别器;L6为重建损失;
X(i,j)为渲染图像在坐标(i,j)处的值,Y(i,j)为2D人脸图像在坐标(i,j)处的值,H、W分别为2D人脸图像的高度和宽度;
λ1~λ5为定义的系数。
3.根据权利要求1或2所述的非线性3DMM人脸重建方法,其特征在于,所述CNN编码器包括依次连接的14个卷积层、AvgPool层和全连接层,所述CNN编码器在所述AvgPool层输出形状参数和纹理参数;所述CNN纹理解码器包括依次连接的全连接层、14个卷积层,所述CNN纹理解码器在最后一个卷积层输出3D纹理;所述多层感知形状解码器包括两个全连接层。
4.根据权利要求3所述的非线性3DMM人脸重建方法,其特征在于,所述渲染层根据所述3D形状、3D纹理和预定义的2D纹理图进行3D渲染,得到3D人脸,包括:
预定义2D纹理图,所述2D纹理图每个像素点与3D形状的顶点相对应;
通过2D纹理图中每个像素点纹理值确定3D形状中每个顶点的纹理值。
5.一种非线性3DMM人脸重建装置,其特征在于,所述装置包括:
训练模块,用于使用训练集对非线性3DMM模型进行训练;
其中,所述训练集包括多个2D人脸图像样本,所述非线性3DMM模型包括CNN编码器、多层感知形状解码器、CNN纹理解码器和渲染层;
在训练时,输入所述非线性3DMM模型的2D人脸图像样本经过所述CNN编码器估计得到相机投影参数、形状参数和纹理参数,所述多层感知形状解码器将所述形状参数解码为3D形状,所述CNN纹理解码器将所述纹理参数解码为3D纹理,所述渲染层根据所述相机投影参数、3D形状和3D纹理得到渲染图像;通过损失函数训练所述CNN编码器、多层感知形状解码器和CNN纹理解码器的参数;
预测模块,用于将...
【专利技术属性】
技术研发人员:周军,刘利朋,江武明,丁松,
申请(专利权)人:北京眼神智能科技有限公司,北京眼神科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。