数字人驱动方法、装置、设备及存储介质制造方法及图纸

技术编号:33426086 阅读:19 留言:0更新日期:2022-05-19 00:17
本申请实施例提供了数字人驱动方法、装置、设备及存储介质,涉及到基于标记语言配置的数字人标准标记协议,所述方法包括:通过解析引擎接收针对数字人的驱动数据包,并解析驱动数据包得到驱动信息;其中,所接收的驱动数据包为基于所配置的数字人标准标记协议的数据包,用于控制数字人在预设时刻执行预设事件;通过解析引擎调用渲染引擎,并在所调用的渲染引擎中根据驱动信息驱动预先渲染的数字人。基于数字人标准标记协议对数字人的制作进行规范进而统一数字人的渲染驱动,使得数字人的渲染与驱动不存在相关服务场景的逻辑,对数字人的渲染驱动方面进行复用,且不受渲染驱动引擎的升级或者变更的影响。引擎的升级或者变更的影响。引擎的升级或者变更的影响。

【技术实现步骤摘要】
数字人驱动方法、装置、设备及存储介质


[0001]本申请涉及计算机
,特别是涉及一种数字人驱动方法、相应的一种数字人驱动装置、相应的一种电子设备以及相应的一种计算机存储介质。

技术介绍

[0002]数字人在狭义的定义是信息科学与生命科学融合的产物,其可利用信息科学的方法对人体在不同水平的形态和功能进行虚拟仿真。在数字人完成后需要对数字人进行渲染和驱动,对数字人的渲染表现为将所构建的数字人在显示器上进行渲染,此时渲染的数字人是静态的,而对数字人的驱动表现为将渲染的静态数字人像真实人类一样动起来。
[0003]虚拟数字人的发展进入到快速成长阶段,其可以应用到具有数字人需求的多种不同场景,例如游戏行业、直播场景等。目前通常是一个项目制作与其对应的一套渲染驱动,实现对数字人的渲染和驱动,但在对新项目中的数字人进行渲染驱动时,还需从头开始渲染和驱动,即便存在用于对数字人进行渲染驱动的数字人平台,但对于不同的数字人驱动缺少规范的驱动与渲染接口,不利于对不同场景下的数字人进行渲染驱动。

技术实现思路

[0004]鉴于上述问题,提出了本申请实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种数字人驱动方法、相应的一种数字人驱动装置、相应的一种电子设备以及相应的一种计算机存储介质。
[0005]本申请实施例公开了一种数字人驱动方法,涉及到基于标记语言配置的数字人标准标记协议,应用于与所配置的数字人标准标记协议适配的解析引擎,所述解析引擎支持不同的渲染引擎,所述方法包括:
[0006]通过所述解析引擎接收针对数字人的驱动数据包,并解析所述驱动数据包得到驱动信息;其中,所接收的驱动数据包为基于所配置的数字人标准标记协议的数据包,用于控制数字人在预设时刻执行预设事件;
[0007]通过所述解析引擎调用渲染引擎,并在所调用的渲染引擎中根据所述驱动信息驱动预先渲染的数字人。
[0008]可选地,在接收针对数字人的驱动数据包之前,还包括:
[0009]接收用户系统发送的针对数字人的构建信息;所述构建信息包括适用于预设场景的数字人信息、数字人装扮信息、数字人声音信息和数字人动作信息;
[0010]通过所述解析引擎基于所述构建信息生成与预设场景适配的数字人,以便对所构建的数字人进行预先渲染。
[0011]可选地,在基于所述构建信息生成与预设场景适配的数字人之后,还包括:
[0012]基于所述适用于预设场景的数字人信息从所述解析引擎所整合的渲染引擎中确定与预设场景对应的渲染引擎;
[0013]通过所述解析引擎调用所述渲染引擎,并通过所调用的渲染引擎预先对所构建的
数字人以及预设场景进行渲染,以便驱动预先渲染后预设场景中的数字人。
[0014]可选地,所述通过所述解析引擎接收针对数字人的驱动数据包,包括:
[0015]通过所述解析引擎接收用户系统发送的针对数字人的驱动数据包;所述针对数字人的驱动数据包为由所述用户系统将基于所述构建信息确定的数字人需要展示的内容信息转换为数字人标准标记协议的数据包;其中,在转换后的驱动数据包中采用用于表示预设事件的元素,以及所述预设事件的元素具有的用于表示预设时刻的起始位置属性配置数字人需要展示的内容信息,所述数字人需要展示的内容信息包括在预设时刻的数字人需要执行的说话事件、动作事件与表情事件,以及在预设场景中在预设时刻的卡片插入事件。
[0016]可选地,所述解析所述驱动数据包得到驱动信息,包括:
[0017]通过所述解析引擎对所述驱动数据包中用于表示预设事件的元素,以及所述预设事件的元素具有的用于表示预设时刻的起始位置属性,进行实时解析得到所述数字人的驱动信息;所述驱动信息包括在预设时刻的说话文本信息、动作文本信息、卡片文本信息以及表情文本信息。
[0018]可选地,所述在所调用的渲染引擎中根据所述驱动信息驱动预先渲染的数字人,包括:
[0019]通过所述解析引擎将所述说话文本信息实时转化为流式的语音数据,并在流式语音转化过程中基于所述说话文本信息、动作信息以及表情信息生成对应的在预设时刻的嘴型数据、表情数据与动作数据;
[0020]通过所述解析引擎将所生成的在预设时刻的语音数据、嘴型数据、表情数据与动作数据实时发送给所调用的渲染引擎;
[0021]通过所述渲染引擎获取预先渲染的数字人,并基于在预设时刻的语音数据、嘴型数据、表情数据与动作数据驱动所述预先渲染的数字人进行播放,以将所播放的数字人推送至用户系统。
[0022]可选地,所述驱动信息还包括在预设时刻的卡片文本信息,所述在所调用的渲染引擎中根据所述驱动信息驱动预先渲染的数字人,还包括:
[0023]在驱动所述预先渲染的数字人播放的过程中,在预设场景中按照预设时刻插入所述预设时刻的卡片文本信息。
[0024]本申请实施例还公开了一种数字人驱动装置,涉及到基于标记语言配置的数字人标准标记协议,应用于与所配置的数字人标准标记协议适配的解析引擎,所述解析引擎支持不同的渲染引擎,所述装置包括:
[0025]驱动数据包解析模块,用于接收针对数字人的驱动数据包,并解析所述驱动数据包得到驱动信息;其中,所接收的驱动数据包为基于所配置的数字人标准标记协议的数据包,用于控制数字人在预设时刻执行预设事件;
[0026]数字人驱动模块,用于调用渲染引擎,并在所调用的渲染引擎中根据所述驱动信息驱动预先渲染的数字人。
[0027]可选地,在接收针对数字人的驱动数据包之前,所述装置还包括:
[0028]构建信息接收模块,用于接收用户系统发送的针对数字人的构建信息;所述构建信息包括适用于预设场景的数字人信息、数字人装扮信息、数字人声音信息和数字人动作信息;
[0029]数字人生成模块,用于通过所述解析引擎基于所述构建信息生成与预设场景适配的数字人,以便对所构建的数字人进行预先渲染。
[0030]可选地,在基于所述构建信息生成与预设场景适配的数字人之后,所述装置还包括:
[0031]渲染引擎确定模块,用于基于所述适用于预设场景的数字人信息从所述解析引擎所整合的渲染引擎中确定与预设场景对应的渲染引擎;
[0032]数字人渲染模块,用于通过所述解析引擎调用所述渲染引擎,并通过所调用的渲染引擎预先对所构建的数字人以及预设场景进行渲染,以便驱动预先渲染后预设场景中的数字人。
[0033]可选地,所述驱动数据包解析模块包括:
[0034]驱动数据包接收子模块,用于通过所述解析引擎接收用户系统发送的针对数字人的驱动数据包;所述针对数字人的驱动数据包为由所述用户系统将基于所述构建信息确定的数字人需要展示的内容信息转换为数字人标准标记协议的数据包;其中,在转换后的驱动数据包中采用用于表示预设事件的元素,以及所述预设事件的元素具有的用于表示预设时刻的起始位置属性配置数字人需要展示的内容信息,所述数字人需要展示的内容信息包括在预设时刻的数字人需要执行的说话事件、动本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数字人驱动方法,其特征在于,涉及到基于标记语言配置的数字人标准标记协议,应用于与所配置的数字人标准标记协议适配的解析引擎,所述解析引擎支持不同的渲染引擎,所述方法包括:通过所述解析引擎接收针对数字人的驱动数据包,并解析所述驱动数据包得到驱动信息;其中,所接收的驱动数据包为基于所配置的数字人标准标记协议的数据包,用于控制数字人在预设时刻执行预设事件;通过所述解析引擎调用渲染引擎,并在所调用的渲染引擎中根据所述驱动信息驱动预先渲染的数字人。2.根据权利要求1所述的方法,其特征在于,在接收针对数字人的驱动数据包之前,还包括:接收用户系统发送的针对数字人的构建信息;所述构建信息包括适用于预设场景的数字人信息、数字人装扮信息、数字人声音信息和数字人动作信息;通过所述解析引擎基于所述构建信息生成与预设场景适配的数字人,以便对所构建的数字人进行预先渲染。3.根据权利要求2所述的方法,其特征在于,在基于所述构建信息生成与预设场景适配的数字人之后,还包括:基于所述适用于预设场景的数字人信息从所整合的渲染引擎中确定与预设场景对应的渲染引擎;通过所述解析引擎调用所述渲染引擎,并通过所调用的渲染引擎预先对所构建的数字人以及预设场景进行渲染,以便驱动预先渲染后预设场景中的数字人。4.根据权利要求2所述的方法,其特征在于,所述通过所述解析引擎接收针对数字人的驱动数据包,包括:通过所述解析引擎接收用户系统发送的针对数字人的驱动数据包;所述针对数字人的驱动数据包为由所述用户系统将基于所述构建信息确定的数字人需要展示的内容信息转换为数字人标准标记协议的数据包;其中,在转换后的驱动数据包中采用用于表示预设事件的元素,以及所述预设事件的元素具有的用于表示预设时刻的起始位置属性配置数字人需要展示的内容信息,所述数字人需要展示的内容信息包括在预设时刻的数字人需要执行的说话事件、动作事件与表情事件,以及在预设场景中在预设时刻的卡片插入事件。5.根据权利要求1或4所述的方法,其特征在于,所述解析所述驱动数据包得到驱动信息,包括:通过所述解析引擎对所述驱动数据包中用于表示预设事件的元素,以及所述预设事件的元素具有的用于表示预设时刻的起始位置属性,进行实时解析得到所...

【专利技术属性】
技术研发人员:陈卓学黄齐李禹田树东
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1