一种基于声音的虚拟数字人视线追随系统、方法及车辆技术方案

技术编号：38645447 阅读：11 留言：0更新日期：2023-08-31 18:36

本发明专利技术涉及一种基于声音的虚拟数字人视线追随系统、方法及车辆，涉及虚拟数字人视线追随交互方法技术领域，包括红外热像仪，其用于采集所有用户的热图像信息；传声器阵列，其用于采集所有用户的声音信息；处理模块，其用于获取所述热图像信息并进行处理得到每个用户与虚拟数字人之间的水平距离，还用于获取所述声音信息并进行处理得到声源的竖向二维平面位置点，结合所述水平距离和所述竖向二维平面位置得到声源的三维空间位置点，根据所述三维空间位置点生成视线追随指令，以根据所述视线追随指令控制所述虚拟数字人的视线。本申请能够结合声音信息，精确定位声源位置，并控制虚拟数字人自动注视发声的用户，提高虚拟数字人的仿真度。人的仿真度。人的仿真度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于声音的虚拟数字人视线追随系统、方法及车辆

[0001]本专利技术涉及虚拟数字人视线追随交互方法
，特别涉及一种基于声音的虚拟数字人视线追随系统、方法及车辆。

技术介绍

[0002]近年，仿真虚拟数字人技术已经非常成熟，通过人眼几乎辨别不出现实中的真人视频与通过仿真虚拟数字人技术生成的虚拟数字人视频之间的差异。但是在与用户交互时，虚拟数字人的视线无法实时的追踪用户的位置，只能根据预设好的动作和表情来展示，影响了用户的体验效果。
[0003]在其中一类解决方案中，提到了可以根据身体区域重要性不同，以一定的概率密度函数进行随机抽样获得视线焦点位置，从而使得虚拟数字人眼睛更加有神。
[0004]比如，现有技术提出了一种虚拟数字人视线追随交互方法，该方法通过深度神经网络实时生成具有透明背景的、语音驱动其嘴型和姿态的虚拟数字人，然后应用在后，视频在前，点击透传，边缘融合，最后采用响应状态和跟随状态两种方式实现虚拟数字人与应用及用户的交互，响应状态下，确定用户意图及目标控件后，虚拟数字人响应控件在屏幕中的方位指令从而转动身体部位或生成相关表情，其面部、眼睛、手或身体的作用方向是应用界面中的目标控件；处于跟随状态时，虚拟数字人根据摄像头的人像检测信息，将自己眼睛及头部状态跟踪交互用户进行相应运动。该方案能够使虚拟数字人与应用软件界面更加自然融合，根据应用内容及用户状态使虚拟数字人与用户之间交互自然。
[0005]上述基于虚拟数字人视线追随交互方法是基于单人的，而现实中与虚拟数字人交互的情况可能不...

【技术保护点】

【技术特征摘要】
1.一种基于声音的虚拟数字人视线追随系统，其特征在于，所述系统包括：红外热像仪，其用于采集所有用户的热图像信息；传声器阵列，其用于采集所有用户的声音信息；处理模块，其用于获取所述热图像信息并进行处理得到每个用户与虚拟数字人之间的水平距离，还用于获取所述声音信息并进行处理得到声源的竖向二维平面位置点，结合所述水平距离和所述竖向二维平面位置得到声源的三维空间位置点，根据所述三维空间位置点生成视线追随指令，以根据所述视线追随指令控制所述虚拟数字人的视线。2.如权利要求1所述的基于声音的虚拟数字人视线追随系统，其特征在于，所述系统集成于虚拟交互设备上，所述虚拟交互设备用于生成所述虚拟数字人，并通过虚拟交互设备正面的显示屏幕进行显示；所述红外热像仪的数量至少为一个，所有所述红外热像仪均匀分布在所述虚拟交互设备正面；所述传声器阵列包含至少四个传声器，所述四个传声器两两一组对称分布在所述显示屏幕的上方和下方，所述四个传声器均分布于虚拟交互设备正面的中轴线上。3.如权利要求1所述的基于声音的虚拟数字人视线追随系统，其特征在于，所述系统还包括：摄像头组件，其用于采集所有用户的面部图像信息；所述处理模块还用于获取所述面部图像信息并进行处理得到每个用户的面部图像区域；所述处理模块还用于根据所述面部图像区域对所述三维空间位置点进行校验，在所述三维空间位置点落在所述面部图像区域内时，判断所述三维空间位置点校验通过，在所述三维空间位置点落在所述面部图像区域外时，判断所述三维空间位置点校验不通过，并删除校验不通过的所述三维空间位置点。4.如权利要求1所述的基于声音的虚拟数字人视线追随系统，其特征在于，当所述处理模块处理得到一个三维空间位置...

【专利技术属性】
技术研发人员：邬婷婷，王小焕，杨丹，孙先国，张海培，
申请(专利权)人：东风汽车集团股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人