一种基于深度学习的语音驱动3D人物面部表情方法技术

技术编号：31227028 阅读：64 留言：0更新日期：2021-12-08 09:34

本发明专利技术提供一种基于深度学习的语音驱动3D人物面部表情方法，包括以下步骤：从制作好的动画中获取语音并提取语音特征以得到融合语音特征，将其与控制器参数对应起来构成训练数据；搭建深度学习网络模型，对语音特征从多个维度进行建模，得到抽象特征用于训练和回归预测，得到面部表情控制器参数；将融合语音特征输入上述模型中，通过实际输出与目标输出的均方误差，利用Adam优化器最小化误差，优化网络参数，得到最终模型；将语音特征经过处理后输入深度学习网络模型中，回归预测得到控制器参数，用输出的控制器参数驱动动画模型以生成面部表情动画，可以更快地得到更加稳定的动画出品，同时降低了人力和时间成本。同时降低了人力和时间成本。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的语音驱动3D人物面部表情方法

[0001]本专利技术涉及动画制作
，具体涉及一种基于深度学习的语音驱动3D人物面部表情方法。

技术介绍

[0002]在现有的动画制作技术中，3D人物面部表情一般先由拍摄现场的面部捕捉技术捕捉到初步表情动画，再由制作人员制作，手动调整控制器参数值，最后得到最终面部表情动画。这个过程因为是人工参与的，所以需要耗费大量的时间和人力，而且由于制作人员的因素，最后的3D人物面部表情动画效果可能参差不齐。
[0003]申请号为CN202011413230.2的专利技术专利公开了一种基于深度学习框架的数字人面部表情动画自动迁移方法，使用神经网络学习不同模型之间动画控制器通道参数之间的映射关系，从而实现用已知模型动画去驱动另一模型动画的效果，但该技术依赖数字人表情模型输入的质量，需要作出多帧模型作为训练数据，前期准备则需要耗费时间和人力，同时对表情模型的要求也比较高。

技术实现思路

[0004]本专利技术的目的是提供一种基于深度学习的语音驱动3D人物面部表情方法，得到更加稳定的动画出品，同时降低了人力和时间成本。
[0005]本专利技术提供了如下的技术方案：一种基于深度学习的语音驱动3D人物面部表情方法，包括以下步骤：S1、从制作好的动画中获取每帧动画人物面部表情的控制参数及对应的语音，提取多种语音特征并进行拼接融合得到融合语音特征，将所述融合语音特征与控制器参数对应起来，共同构成训练数据；S2、搭建深度学习网络模型，对所述语音特征从多个维度进行...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的语音驱动3D人物面部表情方法，其特征在于，包括以下步骤：S1、从制作好的动画中获取每帧动画人物面部表情的控制参数及对应的语音，提取多种语音特征并进行拼接融合得到融合语音特征，将所述融合语音特征与控制器参数对应起来，共同构成训练数据；S2、搭建深度学习网络模型，对所述语音特征从多个维度进行建模，得到抽象特征以用于训练和回归预测，得到面部表情控制器参数；S3、模型训练，将步骤S1所述的融合语音特征输入至步骤S2所述的深度学习网络模型中获取实际输出，将语音特征对应的表情控制器参数作为网络的目标输出，获取实际输出与目标输出的均方误差，利用Adam优化器最小化误差，优化网络参数；S4、根据步骤S3的步骤训练若干轮数，以得到最终模型；S5、将一条语音特征经过特征提取和处理后输入所述深度学习网络模型中，回归预测得到一系列控制器参数，用输出的控制器参数驱动动画模型以生成面部表情动画。2.根据权利要求1所述的一种基于深度学习的语音驱动3D人物面部表情方法，其特征在于，步骤S2的所述深度学习网络模型包括若干层CNN网络层，其每层均对融合语音特征在特征维度上进行卷积操作，以实现对特征的降维处理，得到抽象特征；RNN层，其采用双向lstm网络，对所述CNN层提取出的特征做时间维度上的序列建模，得到特征向量；全连接网络层，对所述特征向量进行回归预测，以得到面部表情控制器参数值。3.根据权利要求1所述的一种基于深度学习的语音驱动3D人物面部表情方法，其特征在于，步骤S3...

【专利技术属性】
技术研发人员：赵锐，候志迎，李帆，
申请(专利权)人：江苏原力数字科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人