人脸预测模型的训练及多任务预测方法、装置和直播系统制造方法及图纸

技术编号：38706757 阅读：26 留言：0更新日期：2023-09-08 14:47

本申请涉及一种人脸预测模型的训练方法和装置、人脸多任务预测方法和装置、直播系统、计算机设备以及计算机可读存储介质；该训练方法包括：根据预测任务对人脸图像集进行分组，并分别对人脸图像分组进行数据标注；构建特征图金字塔网络以及各个预测任务对应的预测任务层，将预测任务层分别连接到特征图金字塔网络输出的特征图上得到人脸多任务预测模型；分别配置人脸多任务预测模型的各个预测任务层在预测训练中的损失函数；利用标注的人脸图像并根据损失函数对人脸多任务预测模型进行训练。该技术方案，能够训练得到同时执行多种预测任务的预测模型，提升人脸多任务预测的效率，特别适用于直播场景下预测需求，满足不同实时直播场景的使用需求。实时直播场景的使用需求。实时直播场景的使用需求。

全部详细技术资料下载

【技术实现步骤摘要】
人脸预测模型的训练及多任务预测方法、装置和直播系统

[0001]本申请涉及网络直播
，特别是涉及一种人脸预测模型的训练方法和装置、人脸多任务预测方法和装置、直播系统、计算机设备以及计算机可读存储介质。

技术介绍

[0002]随着网络直播技术的发展，各种美颜、美妆和整形等特效被广泛应用于网络直播当中，从而可以提高网络直播中分享的优质内容的传播效果。在直播过程中，为了精准定位到人脸位置并进行特效添加，需要对人脸关键点检测、分割等，因此人脸关键点检测、分割相关算法是美颜、美妆、整形等直播、短视频特效技术的基础。
[0003]目前，在对人脸图像执行2D关键点、3D关键点和图像分割任务时，通常是训练人脸预测模型来进行检测，每个预测模型可以完成一个相应的预测任务，例如，预测2D关键点可以使用2D关键点模型、预测3D关键点可以使用3D关键点模型、预测图像分割可以使用分割模型等，然而，在直播场景下，当需要完成多种预测任务时，同时使用这些预测模型无法满足直播实时性的高要求，由此会影响直播场景下美颜、美妆算法的运算效率，难以满足直播业务中的多任务使用需求，容易影响直播效果。

技术实现思路

[0004]基于此，有必要针对上述技术问题，提供一种人脸预测模型的训练方法和装置、人脸多任务预测方法和装置、直播系统、计算机设备以及计算机可读存储介质，实现单模型的多任务预测功能，提升了直播实时性。
[0005]第一方面，本申请提供一种人脸预测模型的训练方法，包括：
[0006]根据预测任务对人脸图像集进行...

【技术保护点】

【技术特征摘要】
1.一种人脸预测模型的训练方法，其特征在于，包括：根据预测任务对人脸图像集进行分组，并根据各个预测任务分别对所述人脸图像分组进行数据标注；构建特征图金字塔网络以及各个预测任务对应的预测任务层，将所述预测任务层分别连接到所述特征图金字塔网络输出的特征图上得到人脸多任务预测模型；分别配置所述人脸多任务预测模型的各个预测任务层在预测训练中的损失函数；利用所述标注的人脸图像并根据所述损失函数对所述人脸多任务预测模型进行训练。2.根据权利要求1所述的人脸预测模型的训练方法，其特征在于，构建特征图金字塔网络以及各个预测任务对应的预测任务层，包括：构建一个提取图像特征的特征图金字塔网络；其中，所述特征图金字塔网络以人脸图像为输入，输出分辨率逐渐增大的多个特征图；根据需要执行的各个预测任务，在所述特征图金字塔网络之后分别搭建对应的预测任务层。3.根据权利要求2所述的人脸预测模型的训练方法，其特征在于，将所述预测任务层分别连接到所述特征图金字塔网络输出的特征图上得到人脸多任务预测模型，包括：针对于各个预测任务层，分别从所述特征图金字塔网络输出的特征图中选择至少一个特征图作为输入图像；根据各个预测任务对应选择的输入图像将所述预测任务层连接到所述特征图上，得到人脸多任务预测模型。4.根据权利要求1所述的人脸预测模型的训练方法，其特征在于，预测任务包括：预测人脸图像的2D关键点和预测人脸图像的3D关键点；所述根据各个预测任务分别对所述人脸图像分组进行数据标注，包括：在2D关键点人脸图像分组的每张人脸图像上人脸部位标注若干个2D关键点；利用人脸3D基模型渲染一张正面人脸图像，确定3D基模型顶点与各个2D关键点的对应关系；根据所述对应关系在3D关键点人脸图像分组的每张人脸图上人脸部位标注若干个2D关键点。5.根据权利要求4所述的人脸预测模型的训练方法，其特征在于，利用人脸3D基模型渲染一张正面人脸图像，确定3D基模型顶点与各个2D关键点的对应关系，包括：将人脸3D基模型的表情基和形状基进行降维；利用人脸3D基模型的平均脸渲染一张正面人脸图像，并在所述正面人脸图像上标注若干个2D关键点；计算所述正面人脸图像上3D顶点的2D投影点，并分别确定与各个2D关键点之间距离最小的投影点，获得正脸时3D基模型顶点与2D关键点的对应关系；对所述正面人脸图像脸颊轮廓的2D关键点进行调整处理，获得侧脸时3D基模型顶点与2D关键点的对应关系。6.根据权利要求4所述的人脸预测模型的训练方法，其特征在于，所述预测任务还包括：预测人脸图像中人脸可见区域像素分类和预测3D人脸关键点所形成3D网格；所述根据各个预测任务分别对所述人脸图像分组进行数据标注，还包括：将人脸区域分割人脸图像分组的每张人脸图像上的人脸区域与背...

【专利技术属性】
技术研发人员：宫凯程，
申请(专利权)人：广州方硅信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人