数字人说话视频生成方法、系统、终端设备及介质技术方案

技术编号：35299919 阅读：13 留言：0更新日期：2022-10-22 12:48

本发明专利技术公开了一种数字人说话视频生成方法、系统、终端设备以及计算机可读存储介质，该数字人说话视频生成方法的步骤包括：获取预设语音信息的语音特征，将所述语音特征输入第一深度学习模型得到人脸关键点坐标偏移值，并基于所述人脸关键点坐标偏移值得到对应的人脸关键点；基于所述人脸关键点确定人脸轮廓视频，并将所述人脸轮廓视频输入第二深度学习模型得到包括面部运动形象和头部姿态变化的具备照片级真实感的数字人说话视频。本发明专利技术能够提升数字人说话视频的视频质量。提升数字人说话视频的视频质量。提升数字人说话视频的视频质量。

全部详细技术资料下载

【技术实现步骤摘要】
数字人说话视频生成方法、系统、终端设备及介质

[0001]本专利技术涉及人工智能
，尤其是涉及一种数字人说话视频生成方法、系统、终端设备以及计算机可读存储介质。

技术介绍

[0002]随着人工智能、虚拟现实等新技术浪潮的发展，虚拟数字人的生产门槛进一步降低，各方面的性能获得了飞跃式的提升，开始从外观的数字化逐渐深入到行为的交互化、思想的智能化。以虚拟主播、虚拟员工等为代表的数字人成功进入大众视野，并以多元的姿态在影视、游戏、传媒、文旅、金融等众多领域大放异彩。
[0003]语音驱动数字人形象技术是虚拟数字人应用的基础，其目标是根据输入的语音信息合成目标人物的音频同步视频帧。它对于交互式应用程序(如数字化身、视频会议、视觉效果、虚拟现实、视频配音和计算机游戏)很有价值。随着目前多模态技术研究的发展热潮，语音驱动数字人形象技术作为一种跨模态领域的研究课题，受到了研究人员的广泛关注，已经涌现了一些相关的研究成果和应用。然而，合成出逼真且富有表现力的目标人物音频同步数字人视频仍然是一个开放的挑战。
[0004]目前语音驱动数字人形象技术按照输出的视频质量可以分为非照片级真实的和照片级真实两种技术路线。非照片级真实的语音驱动数字人形象技术重点关注如何学习输入语音信息到对应的人脸面部运动的映射关系，其输出通常为人脸三维模型的顶点坐标变化或者人脸模型表情参数和头部运动参数。然后利用现有的三维模型渲染引擎将驱动后的三维人脸模型序列渲染成音频同步说话的视频。然而这种技术路线需要事先通过硬件设备获取高质量的4D人脸...

【技术保护点】

【技术特征摘要】
1.一种数字人说话视频生成方法，其特征在于，所述数字人说话视频生成方法应用于机器人，所述数字人说话视频生成方法包括以下步骤：获取预设语音信息的语音特征，将所述语音特征输入第一深度学习模型得到人脸关键点坐标偏移值，并基于所述人脸关键点坐标偏移值得到对应的人脸关键点；基于所述人脸关键点确定人脸轮廓视频，并将所述人脸轮廓视频输入第二深度学习模型得到包括面部运动形象和头部姿态变化的具备照片级真实感的数字人说话视频。2.如权利要求1所述的数字人说话视频生成方法，其特征在于，所述第一深度学习模型包括：第一多层传感器、第二多层传感器和双向长短期记忆网络；所述将所述语音特征输入第一深度学习模型得到人脸关键点坐标偏移值，并基于所述人脸关键点坐标偏移值得到对应的人脸关键点的步骤，包括：将所述语音特征输入所述第一多层传感器得到升维的语音特征，并将所述升维的语音特征输入所述双向长短期记忆网络得到基础人脸关键点；将所述基础人脸关键点与预设的静态人脸关键点坐标进行级联，并将级联后的所述基础人脸关键点和所述静态人脸关键点输入至所述第二多层传感器得到坐标偏移值；将所述坐标偏移值与所述静态人脸关键点的坐标相加得到人脸关键点。3.如权利要求1所述的数字人说话视频生成方法，其特征在于，在所述将所述语音特征输入第一深度学习模型得到人脸关键点坐标偏移值的步骤之前，还包括：基于预设的第一数据集，通过预设优化器对第一初始深度学习模型进行训练得到所述第一深度学习模型。4.如权利要求3所述的数字人说话视频生成方法，其特征在于，在所述基于预设的第一数据集，通过预设优化器对预设第一初始深度学习模型进行训练得到所述第一深度学习模型的步骤之前，还包括：构建所述第一数据集；所述构建所述第一数据集的步骤，包括：通过人脸对齐算法提取预设样本视频中各个帧的多个3D人脸关键点，将所述各个帧的多个3D人脸关键点进行二维投影得到人脸关键点集；将所述人脸关键点集作为第一数据集，以完成对所述第一数据集的构建。5.如权利要求4所述的数字人说话视频生成方法，其特征在于，在所述将所述人脸轮廓视频输入第二深度学习模型得到包括面部运动形象和头部姿态变化的具备照片级真实感的数字人说话视频的步骤之前，还包括：通过预设的第二数据集对预设第二初始深度学习模型进行训练得到所述第二深度学习...

【专利技术属性】
技术研发人员：潘涛，李国鸣，朱勰戎，钱学成，
申请(专利权)人：招商银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人