视频生成方法、装置、存储介质及电子设备制造方法及图纸

技术编号：29590494 阅读：15 留言：0更新日期：2021-08-06 19:50

本公开涉及一种视频生成方法、装置、存储介质及电子设备。该视频生成方法包括：确定目标文本对应的标准发音视频，所述标准发音视频包括标准发音音频和标准发音脸部图像帧序列；根据所述标准发音音频和目标用户的音色信息，得到具有目标用户音色特征的目标发音音频；根据所述标准发音脸部图像帧序列和所述目标用户的脸部图像模板，得到具有目标用户脸部特征的目标发音脸部图像帧序列；将所述目标发音音频和所述目标发音脸部图像帧序列，合成目标发音视频。采用这种方式，可根据任意文本生成具有目标用户音色和脸部特征的目标发音视频。

全部详细技术资料下载

【技术实现步骤摘要】
视频生成方法、装置、存储介质及电子设备
本公开涉及视频
，具体地，涉及一种视频生成方法、装置、存储介质及电子设备。
技术介绍
在语言教学场景下，通常给出教学文本，用户通过点击音频按钮以播放该教学文本对应的标准发音音频。用户通过模仿该标准发音音频来学习该教学文本的正确发音。然而，只通过声音来判断应该如何发音是较为困难的，加上每个人的音色大相径庭，导致发音模仿更加困难，使得发音学习效果较差，效率较低。
技术实现思路
提供该
技术实现思路
部分以便以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。第一方面，本公开提供一种视频生成方法，所述方法包括：确定目标文本对应的标准发音视频，所述标准发音视频包括标准发音音频和标准发音脸部图像帧序列；根据所述标准发音音频和目标用户的音色信息，得到具有目标用户音色特征的目标发音音频；根据所述标准发音脸部图像帧序列和所述目标用户的脸部图像模板，得到具有目标用户脸部特征的目标发音脸部图像帧序列；将所述目标发音音频和所述目标发音脸部图像帧序列，合成目标发音视频。第二方面，本公开提供一种视频生成装置，所述装置包括：确定模块，用于确定目标文本对应的标准发音视频，所述标准发音视频包括标准发音音频和标准发音脸部图像帧序列；第一执行模块，用于根据所述标准发音音频和目标用户的音色信息，得到具有目标用户音色特征的目标发音音频；第二执行模块，...

【技术保护点】
1.一种视频生成方法，其特征在于，所述方法包括：/n确定目标文本对应的标准发音视频，所述标准发音视频包括标准发音音频和标准发音脸部图像帧序列；/n根据所述标准发音音频和目标用户的音色信息，得到具有目标用户音色特征的目标发音音频；/n根据所述标准发音脸部图像帧序列和所述目标用户的脸部图像模板，得到具有目标用户脸部特征的目标发音脸部图像帧序列；/n将所述目标发音音频和所述目标发音脸部图像帧序列，合成目标发音视频。/n

【技术特征摘要】
1.一种视频生成方法，其特征在于，所述方法包括：
确定目标文本对应的标准发音视频，所述标准发音视频包括标准发音音频和标准发音脸部图像帧序列；
根据所述标准发音音频和目标用户的音色信息，得到具有目标用户音色特征的目标发音音频；
根据所述标准发音脸部图像帧序列和所述目标用户的脸部图像模板，得到具有目标用户脸部特征的目标发音脸部图像帧序列；
将所述目标发音音频和所述目标发音脸部图像帧序列，合成目标发音视频。

2.根据权利要求1所述的方法，其特征在于，所述根据所述标准发音音频和目标用户的音色信息，得到具有目标用户音色特征的目标发音音频，包括：
将所述标准发音音频输入音色转换模型，所述音色转换模型结合所述目标用户的音色信息输出所述目标发音音频；
其中，所述音色转换模型是通过如下方式训练得到的：
将所述目标用户念读给定例句的音频、根据该音频确定的所述目标用户的音色信息以及标准发音音频作为所述音色转换模型的训练数据；
根据所述训练数据训练得到所述音色转换模型。

3.根据权利要求2所述的方法，其特征在于，所述音色转换模型包括特征提取模块、音色转换模块以及声码器模块，所述特征提取模块用于，提取所述标准发音音频的音素后验概率向量；
所述音色转换模块用于，将所述音素后验概率向量与所述目标用户的音色信息结合得到目标发音梅尔特征信息；
所述声码器模块用于，根据所述目标发音梅尔特征信息得到所述目标发音音频。

4.根据权利要求2所述的方法，其特征在于，所述音色转换模型包括特征提取模块、音色转换模块以及声码器模块，所述特征提取模块用于，提取所述标准发音音频的音素后验概率向量以及所述标准发音音频的口音信息；
所述音色转换模块用于，将所述音素后验概率向量、所述标准发音音频的口音信息与所述目标用户的音色信息结合得到目标发音梅尔特征信息；
所述声码器模块用于，根据所述目标发音梅尔特征信息...

【专利技术属性】
技术研发人员：殷翔，马泽君，
申请(专利权)人：北京有竹居网络技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人