数字人交互控制方法、装置、电子设备和存储介质制造方法及图纸

技术编号：38355774 阅读：25 留言：0更新日期：2023-08-05 17:27

本发明专利技术公开了一种数字人交互控制方法、装置、电子设备和存储介质，该方法包括：获取用户音频，基于预设语音识别模型对所述用户音频进行语音识别，得到交互请求信息；根据所述用户音频的音频属性和所述交互请求信息确定目标数字人的形象参数；根据所述交互请求信息获取答复音频，并根据所述答复音频确定所述目标数字人的动作参数；基于所述形象参数和所述动作参数生成与所述目标数字人对应的交互动画，以此基于与用户音频对应的形象参数和动作参数驱动数字人进行互动，实现了更加高效的进行数字人交互，提升了用户体验。提升了用户体验。提升了用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
数字人交互控制方法、装置、电子设备和存储介质

[0001]本申请涉及计算机
，更具体地，涉及一种数字人交互控制方法、装置、电子设备和存储介质。

技术介绍

[0002]随着人工智能的不断发展，数字人交互也开始应用在各个领域中，以实现智能化的人机交互。现有技术中，在与数字人进行交互时，数字人的语言交互与肢体动作中经常存在衔接延迟、动作与表述不一致、动作单一等问题，造成交互效率较低，影响了用户体验。
[0003]因此，如何更加高效的进行数字人交互，提升用户体验，是目前有待解决的技术问题。
[0004]需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]本申请实施例提出了一种数字人交互控制方法、装置、电子设备和存储介质，用以更加高效的进行数字人交互，提升用户体验。
[0006]第一方面，提供一种数字人交互控制方法，所述方法包括：获取用户音频，基于预设语音识别模型对所述用户音频进行语音识别，得到交互请求信息；根据所述用户音频的音频属性和所述交互请求信息确定目标数字人的形象参数；根据所述交互请求信息获取答复音频，并根据所述答复音频确定所述目标数字人的动作参数；基于所述形象参数和所述动作参数生成与所述目标数字人对应的交互动画。
[0007]第二方面，提供一种数字人交互控制装置，所述装置包括：获取模块，用于获取用户音频，基于预设语音识别模型对所述用户音频进行语音识别，得到...

【技术保护点】

【技术特征摘要】
1.一种数字人交互控制方法，其特征在于，所述方法包括：获取用户音频，基于预设语音识别模型对所述用户音频进行语音识别，得到交互请求信息；根据所述用户音频的音频属性和所述交互请求信息确定目标数字人的形象参数；根据所述交互请求信息获取答复音频，并根据所述答复音频确定所述目标数字人的动作参数；基于所述形象参数和所述动作参数生成与所述目标数字人对应的交互动画。2.如权利要求1所述的方法，其特征在于，所述根据所述用户音频的音频属性和所述交互请求信息确定目标数字人的形象参数，包括：根据所述音频属性确定所述用户的用户特征信息；根据所述交互请求信息确定场景信息；根据所述用户特征信息和所述场景信息确定所述形象参数。3.如权利要求2所述的方法，其特征在于，所述根据所述用户特征信息和所述场景信息确定所述形象参数，包括：将所述用户特征信息与多个预设动作特征标签和多个预设声音特征标签比对，确定与所述用户特征信息匹配的目标动作特征标签和目标声音特征标签；将所述场景信息与多个预设外形特征标签进行比对，确定与所述场景信息匹配的目标外形特征标签；根据与所述目标动作特征标签对应的动作特征参数、与所述目标声音特征标签对应的声音特征参数和与所述目标外形特征标签对应的外形特征参数确定所述形象参数。4.如权利要求1所述的方法，其特征在于，所述根据所述答复音频确定所述目标数字人的动作参数，包括：按预设解析规则对所述答复音频进行解析，得到所述答复音频的语义信息和/或语调信息；根据预设匹配关系从多个第一动作中确定与所述语义信息和/或语调信息匹配的至少一个第一目标动作；根据所述第一目标动作确定所述动作参数。5.如权利要求4所述的方法，其特征在于，在根据所述第一目标动作确定所述动作参数之后，所述方法还包括：根据所述答复音频的长度信息从多个第二动作中确定至少一个第二目标动作；按预设插入规则将与所述第二目标动作对应的参数增加至所述动作参数中。6.如权利要求4所述的方法，其特征在于，在根据所述...

【专利技术属性】
技术研发人员：沈中熙，钱晓亮，
申请(专利权)人：厦门黑镜科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人