生成面部动画的方法、装置、电子设备和存储介质制造方法及图纸

技术编号：39185689 阅读：10 留言：0更新日期：2023-10-27 08:33

本公开的实施例提供了生成面部动画的方法、装置、电子设备和存储介质。该方法包括：生成与驱动音频信号对应的第一特征表示；利用与驱动视频序列对应的第二特征表示，更新第一特征表示，以获取第三特征表示；以及基于第三特征表示和用于指示面部模板信息的第四特征表示，生成与驱动音频信号对应的面部动画。基于这样的方式，本公开的实施例能够支持利用驱动音频信号和驱动视频序列来生成对应的面部动画，从而提升面部动画的真实感。从而提升面部动画的真实感。从而提升面部动画的真实感。

全部详细技术资料下载

【技术实现步骤摘要】
生成面部动画的方法、装置、电子设备和存储介质

[0001]本公开的示例实施例总体涉及图像处理领域，特别地涉及生成面部动画的方法、装置、电子设备和计算机可读存储介质。

技术介绍

[0002]随着信息技术的普及和快速发展，动画已经成为人们生活中广泛应用的娱乐手段，人们可以通过电子设备创作动画、观看动画、分享动画等等。面部动画在诸如数字人、动画制作等诸多领域中具有广泛的应用。人们期望能够提高生成的面部动画的效果。

技术实现思路

[0003]在本公开的第一方面，提供了一种生成面部动画的方法。该方法包括：生成与驱动音频信号对应的第一特征表示；利用与驱动视频序列对应的第二特征表示，更新第一特征表示，以获取第三特征表示；以及基于第三特征表示和用于指示面部模板信息的第四特征表示，生成与驱动音频信号对应的面部动画。
[0004]在本公开的第二方面，提供了一种生成面部动画的装置。该装置包括：特征生成模块，被配置为生成与驱动音频信号对应的第一特征表示；特征更新模块，被配置为利用与驱动视频序列对应的第二特征表示，更新第一特征表示，以获取第三特征表示；以及动画生成模块，被配置为基于第三特征表示和用于指示面部模板信息的第四特征表示，生成与驱动音频信号对应的面部动画。
[0005]在本公开的第三方面，提供了一种电子设备。该设备包括至少一个处理单元；以及至少一个存储器，至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令。指令在由至少一个处理单元执行时使设备执行第一方面的方法。
[0...

【技术保护点】

【技术特征摘要】
1.一种生成面部动画的方法，包括：生成与驱动音频信号对应的第一特征表示；利用与驱动视频序列对应的第二特征表示，更新所述第一特征表示，以获取第三特征表示；以及基于所述第三特征表示和用于指示面部模板信息的第四特征表示，生成与所述驱动音频信号对应的面部动画。2.根据权利要求1所述的方法，还包括：响应于用于生成所述面部动画的目标音频的长度大于阈值，将所述目标音频切分为具有预设长度的一组驱动音频信号。3.根据权利要求1所述的方法，其中所述驱动视频序列包括多个面部图像，所述方法还包括：基于所述多个面部图像的多个图像表示，确定均值表示；以及基于所述多个图像表示与所述均值表示的多个差异，确定所述第二特征表示。4.根据权利要求3所述的方法，其中基于所述多个图像表示与所述均值表示的多个差异，确定所述第二特征表示包括：利用目标嵌入矩阵，生成与所述多个差异对应的多个特征向量；以及利用编码器处理所述多个特征向量，以生成所述第二特征表示。5.根据权利要求4所述的方法，其中所述第四特征表示是利用所述目标嵌入矩阵所生成的。6.根据权利要求4所述的方法，其中基于所述第三特征表示和用于指示面部模板信息的第四特征表示生成与所述驱动音频信号对应的面部动画包括：级联所述第三特征表示和所述第四特征表示，以生成目标特征表示；利用解码器处理所述目标特征表示，以生成预测运动特征；以及基于所述面部模板信息和所述预测运动特征，生成与所述驱动音频信号对应的所述面部动画。7.根据权利要求4所述的方法，其中用于生成所述面部动画的目标模型被训练以最小化所述目标嵌入矩阵的L1范数。8.根据权利要求7所述的方法，其中所述目标模型基...

【专利技术属性】
技术研发人员：温翔，吴昊哲，贾珈，周松涛，兴军亮，温琦，
申请(专利权)人：清华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人