基于事件驱动的头部姿态估计方法、系统、设备与介质技术方案

技术编号：43341731 阅读：0 留言：0更新日期：2024-11-15 20:37

本发明专利技术公开了一种基于事件驱动的头部姿态估计方法、系统、设备与介质，方案中：基于事件信号驱动，通过利用事件信号的独特优势应用于多样场景下的头部姿态估计任务中，在提高传统图像在头部高速运动场景下的泛模糊情况有显著优势，同时对复杂光照场景下传统图像纹理失真也有很好的改善作用；通过网络中的事件时空信息融合模块，降低了某些场景下事件信息的稀疏所带来的影响，提高了多场景下头部姿态估计的精度，通过网络中的事件运动信息感知模块，将注意力集中于对头部姿态估计帮助更大的人脸关键部位，有效提高了关注稀疏事件运动信息有效部分的能力，进一步增强了系统在复杂环境中的应用能力。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机视觉领域，尤其涉及一种基于事件驱动的头部姿态估计方法、系统、设备与介质。

技术介绍

1、头部姿态估计在计算机视觉领域也是一个重要的研究方向。其主要任务是通过分析场景序列中的人脸图像，准确计算出头部的三个旋转角度(俯仰角、偏航角和翻滚角)。头部姿态估计技术在多个应用领域中发挥着关键作用，包括驾驶员监控系统中的注意力检测、虚拟现实中的用户交互、人机交互系统中的情感分析，以及安防监控中的身份识别等。随着深度学习技术的发展，头部姿态估计的精度和鲁棒性得到了显著提升，现有的方法能够更准确地估计头部姿态，同时提高对快速运动和部分遮挡的适应能力。

2、然而，尽管在较慢速度和正常光照下取得了显著成就，头部姿态估计技术在复杂光照条件和快速运动场景下的应用仍然面临重大挑战。在这种条件下，传统图像的质量通常会遭受严重的质量退化，例如，在高速运动场景下会出现泛模糊的情况、强光条件下头部纹理信息失真、弱光条件下头部细节的大量丢失以及颜色信息的严重失真、光照动态变化的条件下信息捕捉不足等问题，都会影响到头部姿态估计算法的精度和稳定性。更为关键的是，大多数现行的传统图像估计算法比较依赖清晰、高质量的图像输入作为前提，而这一条件在紧急制动、夜间驾驶或远近光灯间接性闪烁等实际场景中往往难以满足。正因为对清晰高质量的头部图像的依赖性，极大地限制了传统图像头部姿态估计技术在多样环境下的应用潜力和实际效果。

3、有鉴于此，特提出本专利技术。

技术实现思路

1、本专利技术的目的是

2、本专利技术的目的是通过以下技术方案实现的：

3、一种基于事件驱动的头部姿态估计方法，包括：

4、收集不同分辨率下的场景事件流，进行体素网格化处理，并获得标签信息；

5、构建多场景下的头部姿态估计网络，其包括：事件时空信息融合模块、特征提取模块、事件运动信息感知注意力模块以及头部姿态估计模块；

6、使用体素网格化处理后的事件数据训练所述头部姿态估计网络，包括：输入体素网格化处理后的事件数据，经事件时空信息融合模块分别提取均值信息和峰值信息，并进行边缘检测后生成融合空间信息的事件表征，经过特征提取模块提取特征信息后，所述事件运动信息感知注意力模块采用注意力机制捕获头部信息，获得事件运动信息感知的特征信息，再经头部姿态估计模块估计出头部姿态信息；结合估计出的头部姿态信息与对应的标签信息计算训练损失函数，使用训练损失函数训练所述头部姿态估计网络；

7、对于输入的体素网格化处理后的事件数据，通过训练后的头部姿态估计网络估计头部姿态信息。

8、一种基于事件驱动的头部姿态估计系统，包括：

9、数据收集与处理单元，用于收集不同分辨率下的场景事件流，进行体素网格化处理，并获得标签信息；

10、网络构建单元，用于构建多场景下的头部姿态估计网络，其包括：事件时空信息融合模块、特征提取模块、事件运动信息感知注意力模块以及头部姿态估计模块；

11、网络训练单元，用于使用体素网格化处理后的事件数据训练所述头部姿态估计网络，包括：输入体素网格化处理后的事件数据，经事件时空信息融合模块分别提取均值信息和峰值信息，并进行边缘检测后生成融合空间信息的事件表征，经过特征提取模块提取特征信息后，所述事件运动信息感知注意力模块采用注意力机制捕获头部信息，获得事件运动信息感知的特征信息，再经头部姿态估计模块估计出头部姿态信息；结合估计出的头部姿态信息与对应的标签信息计算训练损失函数，使用训练损失函数训练所述头部姿态估计网络；

12、头部姿态估计单元，用于对于输入的体素网格化处理后的事件数据，通过训练后的头部姿态估计网络估计头部姿态信息。

13、一种处理设备，包括：一个或多个处理器；存储器，用于存储一个或多个程序；

14、其中，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现前述的方法。

15、一种可读存储介质，存储有计算机程序，当计算机程序被处理器执行时实现前述的方法。

16、由上述本专利技术提供的技术方案可以看出，基于事件信号驱动，通过利用事件信号的独特优势应用于多样场景下的头部姿态估计任务中，这种方法在提高传统图像在头部高速运动场景下的泛模糊情况有显著优势，同时对复杂光照场景下传统图像纹理失真也有很好的改善作用；构建的网络中通过事件时空信息融合模块，降低了某些场景下事件信息的稀疏所带来的影响，提高了多场景下头部姿态估计的精度，通过事件运动信息感知模块，将注意力集中于对头部姿态估计帮助更大的人脸关键部位，有效提高了关注稀疏事件运动信息有效部分的能力，进一步增强了系统在复杂环境中的应用能力；并且，采用有监督的训练方式进行训练，利用事件信息的高动态和去模糊的特性提高了不同场景下的头部姿态估计精度。

本文档来自技高网...

【技术保护点】

1.一种基于事件驱动的头部姿态估计方法，其特征在于，包括：

2.根据权利要求1所述的一种基于事件驱动的头部姿态估计方法，其特征在于，所述收集不同分辨率下的场景事件流，进行体素网格化处理，并获得标签信息包括：

3.根据权利要求1所述的一种基于事件驱动的头部姿态估计方法，其特征在于，所述事件时空信息融合模块包括：均值信息提取模块、峰值信息模块、边缘检测模块与融合模块；其中：

4.根据权利要求1所述的一种基于事件驱动的头部姿态估计方法，其特征在于，所述事件运动信息感知注意力模块包括：若干层处理模块，每一层处理模块包括：依次设置的第一卷积层、分组卷积模块、深度膨胀卷积模块、批量归一化模块、第二卷积层与注意力乘积模块，且每一卷积层后方均设有激活函数；

5.根据权利要求1所述的一种基于事件驱动的头部姿态估计方法，其特征在于，所述经头部姿态估计模块估计出头部姿态信息表示为：

6.根据权利要求1或5所述的一种基于事件驱动的头部姿态估计方法，其特征在于，结合估计出的头部姿态信息与对应的标签信息计算损失函数包括：

7.根据权利要

8.一种基于事件驱动的头部姿态估计系统，其特征在于，包括：

9.一种处理设备，其特征在于，包括：一个或多个处理器；存储器，用于存储一个或多个程序；

10.一种可读存储介质，存储有计算机程序，其特征在于，当计算机程序被处理器执行时实现如权利要求1～7任一项所述的方法。

...

【技术特征摘要】

1.一种基于事件驱动的头部姿态估计方法，其特征在于，包括：

4.根据权利要求1所述的一种基于事件驱动的头部姿态估计方法，其特征在于，所述事件运动信息感知注意力模块包括：若干层处理模块，每一层处理模块包括：依次设置的第一卷积层、分组卷积模块、深度膨胀卷积模块、批量归一化模块、第二卷积层与注意力乘积模块，且每一卷积层后方均设有激活...

【专利技术属性】
技术研发人员：孙晓艳，袁嘉辉，张越一，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人