一种基于坐标系回归的实时骨骼关键点识别方法及系统技术方案

技术编号：33543238 阅读：21 留言：0更新日期：2022-05-21 09:56

本发明专利技术公开了一种基于坐标系回归的实时骨骼关键点识别系统，包括图像采集模块、核心计算单元、轻量级神经网络算法模块、坐标系回归输出模块，所述轻量级神经网络算法模块采用ShuffleNetV2作为基础骨干网络，在ShuffleNetV2骨干网络的最后一层添加两次连续的上采样，并对网络中ShuffleV2Block3和DUC2进行跳跃连接(skip connection)，最后获得热图(heatmap)；所述坐标系回归输出模块，对通过所述轻量级神经网络算法模块获得每一个通道输出的热图，定义为Z，通过normalized(归一化函数)将数值归一化到0至1之间，并将归一化后的热图定义为得到一个离散概率分布值，表示为m

全部详细技术资料下载

【技术实现步骤摘要】
一种基于坐标系回归的实时骨骼关键点识别方法及系统

[0001]本专利技术涉及图像识别
，尤其涉及一种基于坐标系回归的实时骨骼关键点识别方法及系统。

技术介绍

[0002]骨骼关键点识别技术是计算机视觉的基础技术之一。该技术通过传感器(摄像头，红外线等设备)，在图像/视频数据中检测人体的关节、五官，通过关键点描述人体骨骼信息。现有基于深度学习的骨骼关键点识别的新算法大多是基于高斯热图输出的方式，存在着其要求的输出特征图很大、算法训练和推理速度慢的问题。在低成本硬件平台上难以实时运行，需要搭配高成本的硬件(如GPU或高端摄像头)才能达到实时。由于最新的基于深度学习的骨骼关键点识别算法的输出基本是高斯热图，而热图输出的值为整数，不同于坐标回归输出是浮点数，不会丢失精度，因此存在一个理论误差下界的问题。
[0003]基于上述不足，本专利技术主要面向于移动端/嵌入式设备的骨骼关键点识别，采用轻量级的深度学习算法并采用坐标系回归避免热图输出的理论误差下界问题，硬件仅需采用CPU和单目摄像头，即可完成对骨骼关键点的低成本实时识别，无需GPU或高端摄像头(如kinect)。传统的骨骼关键点算法在几何先验的基础上基于模版匹配的思路来进行，精确性较差。而现有的基于深度学习的骨骼关键点识别算法由于硬件性能的限制，在低成本硬件平台上(如移动端手机、平板)的识别速度较慢，算法联动应用会造成应用卡顿、丢帧等情况，非常影响用户体验。
[0004]当前专利技术基于一种基于坐标系回归的实时骨骼关键点识别方法，可以实现在低成本硬件...

【技术保护点】

【技术特征摘要】
1.一种基于坐标系回归的实时骨骼关键点识别系统，包括图像采集模块、核心计算单元、轻量级神经网络算法模块、坐标系回归输出模块，其中，图像采集模块采用任意单目摄像头，核心计算单元采用移动端CPU，其特征在于，所述轻量级神经网络算法模块采用ShuffleNetV2作为基础骨干网络，在ShuffleNetV2骨干网络的最后一层添加两次连续的上采样，并对网络中ShuffleV2Block3和DUC2进行跳跃连接(skip connection)，最后获得热图(heatmap)；所述坐标系回归输出模块，对通过所述轻量级神经网络算法模块获得每一个通道输出的热图，定义为Z，通过normalized(归一化函数)将数值归一化到0至1之间，并将归一化后的热图定义为得到一个离散概率分布值，表示为m
×
n的矩阵，m与n对应着热图的分辨率，其中，通过定义的公式计算获得骨骼关键点在Z中存在的坐标信息。2.如权利要求1所述的基于坐标系回归的实时骨骼关键点识别系统，其特征在于，所述轻量级神经网络算法模块采用ShuffleNetV2作为基础骨干网络进一步包括：输入图像首先进入ShuffleNetV2骨干网络进行计算，该ShuffleNetV2骨干网络由两个卷积层，三个ShuffleV2Block层和一个最大池化层组成，其中卷积层conv1层经过24组3x3的卷积核(步长为2),卷积层conv5经过1024组1x1的卷积核(步长为1)；池化层Maxpool1大小均为3x3，步长为2；ShuffleV2Block层结构统一，将输入通道的特征图分为两个分支，左边分支不做任何操作，右边的分支由连续的1x1卷积核和3x3卷积连接组成，两个分支用concat操作进行合并，紧接进行通道混洗(channel shuffle)。3.如权利要求2所述的基于坐标系回归的实时骨骼关键点识别系统，其特征在于，所述在ShuffleNetV2骨干网络的最后一层添加两次连续的上采样进一步包括：对该骨干网络输出一系列卷积特征图通过连续的DUC上采样，其中，DUC层结构统一，其由连续的3x3卷积与PixelShuffle上采样方式连接组成，将低分辨的特征图，通过卷积和多通道间的重组得到高分辨率的特征图，并在最后一层上采样层DUC2进行对应ShuffleNetV2骨干网络相同形状的特征图ShuffleBlock3进行跳跃连接，以提高训练期间鲁棒性，防止过拟合，最终输出热图。4.如权利要求3所述的基于坐标系回归的实时骨骼关键点识别系统，其特征在于，所述normalized(归一化函数)定义如公式1：其中，首先定义两个矩阵X与Y，i＝1
…
m，j＝1
…
n，使其...

【专利技术属性】
技术研发人员：顾友良，张磊，赵乾，
申请(专利权)人：广东新王牌智能信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人