利用端到端机器学习模型的动画面部表情和姿势转移制造技术

技术编号：42873385 阅读：13 留言：0更新日期：2024-09-30 15:00

本公开的实施例涉及利用端到端机器学习模型的动画面部表情和姿势转移。本公开涉及使用人工智能促进的图像理解经由基于场景的编辑来修改数字图像的系统、方法和非暂态计算机可读介质。例如，在一个或多个实施例中，所公开的系统利用生成式机器学习模型来创建描绘人类对象的经修改的数字图像。特别地，所公开的系统通过执行填入修改以完整数字图像或描绘人类的数字图像的部分的人类修复来生成经修改的数字图像。此外，在一些实施例中，所公开的系统执行对数字图像内描绘的对象的重定姿以生成经修改的数字图像。此外，在一些实施例中，所公开的系统执行面部表情转移和面部表情动画以生成经修改的数字图像或动画。

全部详细技术资料下载

【技术实现步骤摘要】

技术介绍

1、近年来，用于执行计算机视觉和图像编辑任务的硬件和软件平台有了显著的进步。实际上，系统提供了各种与图像相关的任务，例如对象标识、分类、分割、合成、样式转移、图像修复等。

技术实现思路

1、本文描述的一个或多个实施例利用实现人工智能模型以促进灵活和高效的基于场景的图像编辑的系统、方法和非暂态计算机可读介质，提供了益处和/或解决本领域中的一个或多个问题。为了说明，在一个或多个实施例中，系统利用一个或多个机器学习模型来学习/标识数字图像的特性、预测对数字图像的潜在编辑、和/或生成可在各种编辑中使用的补充组件。因此，该系统获得对二维数字图像的理解，就好像它是真实场景，具有反映真实世界(例如，三维)状况的不同语义区域。此外，该系统使二维数字图像能够被编辑，使得改变自动且一致地反映对应的真实世界状况，而不依赖于附加的用户输入。在一个或多个实施例中，该系统通过执行各种填入修改、人类修复、在数字图像内被描绘的主体的重定姿、以及面部表情转移和动画来执行基于场景的图像编辑。此外，为了执行上述填入修改、人类修复、重定姿、以及面部表情转移和动画，该系统利用各种生成式模型和人工智能的各种实例来生成经修改的数字图像或动画。因此，该系统促进了对数字图像的灵活和直观的编辑，同时有效地减少了进行这种编辑通常所需的用户交互。

2、本公开的一个或多个实施例的附加特征和优点在下面的描述中概述，并且部分地将从描述中显而易见，或者可以通过这种示例实施例的实践来了解。

【技术保护点】

1.一种计算机实现的方法，包括：

2.根据权利要求1所述的计算机实现的方法，还包括：利用所述三维编码器从描绘所述面部的所述目标动画的所述目标数字视频提取目标姿势动画嵌入。

3.根据权利要求2所述的计算机实现的方法，还包括：利用所述面部动画生成式神经网络从所述静态源数字图像、所述目标面部表情动画嵌入、以及所述目标姿势动画嵌入生成所述动画。

4.根据权利要求1所述的计算机实现的方法，其中从所述目标数字视频提取所述目标面部表情动画嵌入还包括：从所述目标数字视频的第一帧生成第一目标面部表情动画嵌入以及从所述目标数字视频的第二帧生成第二目标面部表情嵌入。

5.根据权利要求1所述的计算机实现的方法，其中利用所述面部动画生成式神经网络还包括：通过利用面部动画扩散神经网络从所述目标数字视频生成描绘根据所述目标动画被动画化的所述源面部的所述动画。

6.根据权利要求5所述的计算机实现的方法，其中利用所述面部动画扩散神经网络还包括：利用目标姿势动画嵌入、所述目标面部表情动画嵌入、以及来自所述源面部的源形状嵌入来调节所述面部动画扩散神经网络。</p>

7.根据权利要求1所述的计算机实现的方法，还包括：

8.根据权利要求7所述的计算机实现的方法，其中提供所述目标动画选择元素以用于经由所述客户端设备的所述用户界面显示包括：提供多个预定义的目标动画以用于显示。

9.根据权利要求7所述的计算机实现的方法，还包括：基于与所述目标动画选择元素的用户交互，标识来自所述客户端设备的相机相册的所述目标动画。

10.一种系统，包括：

11.根据权利要求10所述的系统，其中所述一个或多个处理器被配置为使所述系统：提供用以从多个预定义的目标动画进行选择的选项，以用于经由所述客户端设备的所述用户界面显示。

12.根据权利要求10所述的系统，其中所述一个或多个处理器被配置为使所述系统：提供用以选择来自从所述客户端设备的相机相册的数字图像的选项，以用于经由所述客户端设备的所述用户界面显示。

13.根据权利要求12所述的系统，其中所述一个或多个处理器被配置为使所述系统：通过接收对来自所述客户端设备的所述相机相册的所述数字图像的选择，来标识描绘所述源面部的所述静态源图像。

14.根据权利要求10所述的系统，其中所述一个或多个处理器被配置为使所述系统通过以下项生成所述目标面部表情动画嵌入：

15.根据权利要求14所述的系统，其中所述一个或多个处理器被配置为使所述系统通过以下项利用所述面部动画生成式神经网络来生成所述动画：利用所述第一目标面部表情动画嵌入和所述第二目标面部表情动画嵌入来调节面部动画扩散神经网络。

16.一种非暂态计算机可读介质，存储可执行指令，所述可执行指令在由处理设备执行时使所述处理设备执行操作，所述操作包括：

17.根据权利要求16所述的非暂态计算机可读介质，其中生成所述动画还包括：

18.根据权利要求16所述的非暂态计算机可读介质，其中所述操作还包括：提供源图像选择元素和目标动画选择元素，以用于经由客户端设备的用户界面显示，其中所述目标动画选择元素包括提供多个预定义的目标动画以用于显示。

19.根据权利要求18所述的非暂态计算机可读介质，其中从描绘所述源面部的所述静态源数字图像提取所述源形状嵌入包括：基于与所述源图像选择元素的用户交互来标识所述源数字图像，所述源图像选择元素包括用以选择来自所述客户端设备的相机相册的数字图像的选项。

20.根据权利要求16所述的非暂态计算机可读介质，其中所述操作还包括：利用三维编码器来生成所述目标姿势动画嵌入和所述目标面部表情动画嵌入。

...

【技术特征摘要】

1.一种计算机实现的方法，包括：

2.根据权利要求1所述的计算机实现的方法，还包括：利用所述三维编码器从描绘所述面部的所述目标动画的所述目标数字视频提取目标姿势动画嵌入。

6.根据权利要求5所述的计算机实现的方法，其中利用所述面部动画扩散神经网络还包括：利用目标姿势动画嵌入、所述目标面部表情动画嵌入、以及来自所述源面部的源形状嵌入来调节所述面部动画扩散神经网络。

7.根据权利要求1所述的计算机实现的方法，还包括：

9.根据权利要求7所述的计算机实现的方法，还包括：基于与所述目标动画选择元素的用户交互，标识来自所述客户端设备的相机相册的所述目标动画。

10.一种系统，包括：

<...

【专利技术属性】
技术研发人员：C·史密斯，
申请(专利权)人：奥多比公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人