数字人的动作控制方法及其系统技术方案

技术编号：39647181 阅读：8 留言：0更新日期：2023-12-09 11:15

本发明专利技术公开了一种数字人的动作控制方法及其系统，其获取由摄像头采集的用户动作交互视频；对所述用户动作交互视频进行特征提取以得到上下文动作时序语义特征向量；以及，基于所述上下文动作时序语义特征向量，生成针对于数字人的动作控制指令

全部详细技术资料下载

【技术实现步骤摘要】
数字人的动作控制方法及其系统

[0001]本专利技术涉及智能化控制
，尤其涉及一种数字人的动作控制方法及其系统
。

技术介绍

[0002]数字人是一种能够在虚拟环境中模拟真实人类的三维模型，具有高度的逼真度和交互性
。
数字人的动作控制是数字人技术的重要组成部分，它决定了数字人能否根据用户的意图进行合理的动作响应
。
[0003]目前，常见的数字人的动作控制方法主要有基于传感器的方法和基于视觉的方法
。
基于传感器的方法需要用户佩戴多个传感器来捕捉用户的动作数据，然后将其映射到数字人的动作上，这种方法存在成本高
、
侵入性强
、
易受干扰等缺点
。
基于视觉的方法则利用摄像头采集用户的动作视频，然后通过计算机视觉技术来识别用户的动作意图，并将其转换为数字人的动作控制指令，这种方法具有成本低
、
便捷性强
、
自然交互等优点
。
[0004]然而，现有的基于视觉的数字人的动作控制方法也存在一些问题
。
例如，难以准确地提取用户动作视频中的时序特征，导致动作识别效果不理想
。
因此，期待一种优化的数字人的动作控制方案
。

技术实现思路

[0005]本专利技术实施例提供一种数字人的动作控制方法及其系统，其获取由摄像头采集的用户动作交互视频；对所述用户动作交互视频进行特征提取以得到上下文动作时序语义特征向量；以及，

【技术保护点】

【技术特征摘要】
1.
一种数字人的动作控制方法，其特征在于，包括：获取由摄像头采集的用户动作交互视频；对所述用户动作交互视频进行特征提取以得到上下文动作时序语义特征向量；以及基于所述上下文动作时序语义特征向量，生成针对于数字人的动作控制指令
。2.
根据权利要求1所述的数字人的动作控制方法，其特征在于，对所述用户动作交互视频进行特征提取以得到上下文动作时序语义特征向量，包括：对所述用户动作交互视频进行多区域的时序特征提取以得到多个用户动作交互时序特征图；以及提取所述多个用户动作交互时序特征图之间的全局语义关联以得到所述上下文动作时序语义特征向量
。3.
根据权利要求2所述的数字人的动作控制方法，其特征在于，对所述用户动作交互视频进行多区域的时序特征提取以得到多个用户动作交互时序特征图，包括：将所述用户动作交互视频进行视频切分以得到多个用户动作交互片段；将所述多个用户动作交互片段分别通过基于三维卷积神经网络的动作时序特征提取器以得到所述多个用户动作交互时序特征图
。4.
根据权利要求3所述的数字人的动作控制方法，其特征在于，提取所述多个用户动作交互时序特征图之间的全局语义关联以得到所述上下文动作时序语义特征向量，包括：将所述多个用户动作交互时序特征图分别展开为多个用户动作交互时序特征向量；以及将所述多个用户动作交互时序特征向量通过基于转换器的动作上下文编码器以得到所述上下文动作时序语义特征向量
。5.
根据权利要求4所述的数字人的动作控制方法，其特征在于，基于所述上下文动作时序语义特征向量，生成针对于数字人的动作控制指令，包括：对所述上下文动作时序语义特征向量进行特征分布优化以得到优化上下文动作时序语义特征向量；将所述优化上下文动作时序语义特征向量通过分类器以得到分类结果，所述分类结果用于表示用户动作交互视频对应的操作意图标签；以及基于所述分类结果，生成所述针对于数字人的动作控制指令
。6.
根据权利要求5所述的数字人的动作控制方法，其特征在于，对所述上下文动作时序语义特征向量进行特征分布优化以得到优化上下文动作时序语义特征向量，包括：对所述多个用户动作交互时序特征向量进行级联以得到用户动作交互时序级联特征向量；以及对所述用户动作交互时序级联特征向量以及所述上下文动作时序语...

【专利技术属性】
技术研发人员：张青辉，王英，
申请(专利权)人：世优北京科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人