System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 视频生成方法、装置、电子设备和计算机可读介质制造方法及图纸_技高网

视频生成方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号:43791753 阅读:0 留言:0更新日期:2024-12-24 16:23
本申请实施例公开了视频生成方法、装置、电子设备和计算机可读介质。该方法的实施例包括:确定客户端所播放的第一视频中的目标角色;在接收到客户端发送的会话消息时,基于目标角色的角色信息,生成针对会话消息的答复文本;基于预先训练的语音合成模型,将答复文本转换成与目标角色的音色相匹配的第一语音,并基于答复文本和预先训练的视频生成模型,生成目标角色的形象视频;基于第一语音和形象视频,生成第二视频,并向客户端返回第二视频,以使客户端播放第二视频。使得用户在观影过程中能够实现与影视角色的高逼真互动,提高了用户与影视角色互动过程的沉浸感。

【技术实现步骤摘要】

本申请实施例涉及计算机,具体涉及视频生成方法、装置、电子设备和计算机可读介质


技术介绍

1、随着互联网技术的发展,用户可通过各种视频类的应用程序观看影视内容。在用户观看影视内容时,在遇到引人入胜的剧情和角色时,常常感到情感需要及时释放和交流。

2、现有技术中,可通过简单的角色对话来模拟用户与角色的互动。然而,这种互动方式缺乏真实感,限制了用户的沉浸感。


技术实现思路

1、本申请实施例提出了视频生成方法、装置、电子设备和计算机可读介质,以解决现有技术中用户与视频中的角色的互动缺乏真实感的技术问题。

2、第一方面,本申请实施例提供了一种视频生成方法,该方法包括:确定客户端所播放的第一视频中的目标角色;在接收到客户端发送的会话消息时,基于所述目标角色的角色信息,生成针对所述会话消息的答复文本;基于预先训练的语音合成模型,将所述答复文本转换成与所述目标角色的音色相匹配的第一语音,并基于所述答复文本和预先训练的视频生成模型,生成所述目标角色的形象视频;基于所述第一语音和所述形象视频,生成第二视频,并向所述客户端返回所述第二视频,以使所述客户端播放所述第二视频。

3、第二方面,本申请实施例提供了一种视频生成装置,该装置包括:确定单元,用于确定客户端所播放的第一视频中的目标角色;第一生成单元,用于在接收到客户端发送的会话消息时,基于所述目标角色的角色信息,生成针对所述会话消息的答复文本;第二生成单元,用于基于预先训练的语音合成模型,将所述答复文本转换成与所述目标角色的音色相匹配的第一语音,并基于所述答复文本和预先训练的视频生成模型,生成所述目标角色的形象视频;第三生成单元,用于基于所述第一语音和所述形象视频,生成第二视频,并向所述客户端返回所述第二视频,以使所述客户端播放所述第二视频。

4、第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面中任一实施例所描述的方法。

5、第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面中任一实施例所描述的方法。

6、本申请实施例提供的视频生成方法、装置、电子设备和计算机可读介质,首先确定客户端所播放的第一视频中的目标角色,在接收到客户端发送的会话消息时,基于目标角色的角色信息生成针对会话消息的答复文本,而后基于预先训练的语音合成模型将答复文本转换成与目标角色的音色相匹配的第一语音,并基于答复文本和预先训练的预先训练的视频生成模型生成目标角色的形象视频,最后基于第一语音和形象视频,生成并播放第二视频。由此,在用户输入会话消息后,能够以目标角色的人像和音色输出视频形式的答复内容,使得用户在观影过程中能够实现与影视角色的高逼真互动,提高了用户与影视角色互动过程的沉浸感。

本文档来自技高网...

【技术保护点】

1.一种视频生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述确定客户端所播放的第一视频中的目标角色,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于预先训练的语音合成模型,将所述答复文本转换成与所述目标角色的音色相匹配的第一语音,包括:

4.根据权利要求3所述的方法,其特征在于,所述语音合成模型包括语音特征生成模块和语音合成模块;所述语音合成模型通过如下步骤生成所述第二语音:

5.根据权利要求1所述的方法,其特征在于,所述基于所述答复文本和预先训练的视频生成模型,生成所述目标角色的形象视频,包括:

6.根据权利要求5所述的方法,其特征在于,所述视频生成模型包括语音转换模块、语音编码器、图像编码器和视频生成模块;所述视频生成模型通过如下步骤生成所述形象视频:

7.根据权利要求1所述的方法,其特征在于,所述会话消息包括第二语音;所述基于所述目标角色的角色信息,生成针对所述会话消息的答复文本,包括:

8.一种视频生成装置,其特征在于,所述装置包括:

<p>9.一种电子设备,其特征在于,包括:

10.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。

...

【技术特征摘要】

1.一种视频生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述确定客户端所播放的第一视频中的目标角色,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于预先训练的语音合成模型,将所述答复文本转换成与所述目标角色的音色相匹配的第一语音,包括:

4.根据权利要求3所述的方法,其特征在于,所述语音合成模型包括语音特征生成模块和语音合成模块;所述语音合成模型通过如下步骤生成所述第二语音:

5.根据权利要求1所述的方法,其特征在于,所述基于所述答复文本和预先训练的视频生成模型,生成所述目标角色的形象...

【专利技术属性】
技术研发人员:秦雨王富鹏
申请(专利权)人:北京爱奇艺科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1