System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及人工智能,尤其涉及一种数字人的交互控制方法及相关设备。
技术介绍
1、随着人工智能技术的发展,数字人被广泛应用于各种视频播放场景中,尤其是电商直播场景。数字人在电商直播中的应用不仅能够提供创新的购物体验,还能够帮助企业降低成本、提高效率,并通过与用户互动增强用户粘性。
2、数字人与用户之间的互动往往依赖于人工编写的对话脚本,对话脚本定义了一些常见问题及其对应的回复话术,基于对话脚本,数字人可以回复用户提出的常见问题。若用户提出的问题不属于对话脚本定义的常见问题,数字人可能会无法正确理解或回应用户。目前的数字人无法适应用户多变和细分的个性化对话需求,降低用户的互动意愿,进而降低商品购买意愿。
技术实现思路
1、本申请的多个方面提供一种数字人的交互控制方法及相关设备,用以提升数字人与用户之间的交互质量,实现更为自然、流畅且富有情感的多模态互动体验。
2、本申请实施例提供一种数字人的交互控制方法,获取目标用户针对数字人发起的第一互动信息;利用意图识别模型从第一互动信息中识别目标用户的情感特征和目标意图信息;根据情感特征和目标意图信息调用具有多模态交互能力的语言模型,生成用于控制数字人进行多模态交互的控制信息;根据控制信息,控制数字人与目标用户进行多模态交互。
3、本申请实施例提供一种电子设备,包括:存储器和处理器;存储器,用于存储计算机程序;处理器耦合至存储器,用于执行计算机程序以用于执行数字人的交互控制方法中的步骤。
4、本申请
5、本申请实施例提供一种计算机程序产品,包括计算机程序/指令,当计算机程序/指令被处理器执行时,致使处理器能够实现数字人的交互控制方法中的步骤。
6、在本申请实施例中,在数字人与用户的交互过程中,通过意图识别模型基于用户的互动信息识别用户的情感特征和意图信息,通过具有多模态交互能力的语言模型基于用户的情感特征和意图信息进行多模态互动反馈。由此,提升了数字人与用户之间的交互质量,实现了更为自然、流畅且富有情感的多模态互动体验,有效地适应用户多变和细分的个性化对话需求,提高了用户的互动意愿,特别是在商品直播场景中,能够有效提高用户的商品购买意愿。
本文档来自技高网...【技术保护点】
1.一种数字人的交互控制方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述意图识别模型包括情感分析网络和意图识别网络;利用意图识别模型从所述第一互动信息中识别所述目标用户的情感特征和目标意图信息,包括:
3.根据权利要求2所述的方法,其特征在于,结合上下文信息分析所述第一互动信息表达的情感信息,作为所述情感特征,包括:
4.根据权利要求3所述的方法,其特征在于,所述上下文信息包括以下至少一种信息:
5.根据权利要求2所述的方法,其特征在于,结合数字人直播的应用场景对所述第一互动信息进行语义理解,以得到所述目标意图信息,包括:
6.根据权利要求1-5任一项所述的方法,其特征在于,根据所述情感特征和所述目标意图信息调用具有多模态交互能力的语言模型,生成用于控制所述数字人进行多模态交互的控制信息,包括:
7.根据权利要求6所述的方法,其特征在于,根据所述情感特征和所述目标意图信息,生成用于控制所述数字人进行多模态交互的语言类控制信息和非语言类控制信息,包括:
8.根据权利要求7所述
9.根据权利要求8所述的方法,其特征在于,所述目标意图信息为与第一商品相关的知识问答意图,则执行所述目标交互控制流程,以生成初始语言类控制信息,包括:
10.根据权利要求9所述的方法,其特征在于,根据所述第一商品与所述数字人当前直播的第二商品相关性,生成初始语言类控制信息,包括:
11.根据权利要求9所述的方法,其特征在于,根据所述目标用户对所述第一商品的付款情况,生成初始语言类控制信息,包括:
12.根据权利要求8所述的方法,其特征在于,执行所述目标交互控制流程,以生成初始语言类控制信息,还包括:
13.根据权利要求1-6任一项所述的方法,其特征在于,所述语言类控制信息为语音播报信息,所述非语言类控制信息包括目标表情信息和目标动作信息,根据所述控制信息,控制所述数字人与所述目标用户进行多模态交互,包括:
14.一种电子设备,其特征在于,包括:存储器和处理器;所述存储器,用于存储计算机程序;所述处理器耦合至所述存储器,用于执行所述计算机程序以用于执行权利要求1-13任一项所述方法中的步骤。
15.一种存储有计算机程序的计算机可读存储介质,其特征在于,当所述计算机程序被处理器执行时,致使所述处理器能够实现权利要求1-13任一项所述方法中的步骤。
16.一种计算机程序产品,其特征在于,包括计算机程序/指令,当计算机程序/指令被处理器执行时,致使处理器能够实现权利要求1-13任一项所述方法中的步骤。
...【技术特征摘要】
1.一种数字人的交互控制方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述意图识别模型包括情感分析网络和意图识别网络;利用意图识别模型从所述第一互动信息中识别所述目标用户的情感特征和目标意图信息,包括:
3.根据权利要求2所述的方法,其特征在于,结合上下文信息分析所述第一互动信息表达的情感信息,作为所述情感特征,包括:
4.根据权利要求3所述的方法,其特征在于,所述上下文信息包括以下至少一种信息:
5.根据权利要求2所述的方法,其特征在于,结合数字人直播的应用场景对所述第一互动信息进行语义理解,以得到所述目标意图信息,包括:
6.根据权利要求1-5任一项所述的方法,其特征在于,根据所述情感特征和所述目标意图信息调用具有多模态交互能力的语言模型,生成用于控制所述数字人进行多模态交互的控制信息,包括:
7.根据权利要求6所述的方法,其特征在于,根据所述情感特征和所述目标意图信息,生成用于控制所述数字人进行多模态交互的语言类控制信息和非语言类控制信息,包括:
8.根据权利要求7所述的方法,其特征在于,根据所述目标意图信息和辅助信息,生成所述语言类控制信息,包括:
9.根据权利要求8所述的方法,其特征在于,所述目标意图信息为与第一商品相关的知识问答意图,则执行所述目标...
【专利技术属性】
技术研发人员:郭雅志,俞一鹏,郭从云,孙煜晗,金美光,马俊锋,
申请(专利权)人:淘宝中国软件有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。