一种检测人体坐姿识别方法技术

技术编号：39719597 阅读：11 留言：0更新日期：2023-12-17 23:26

本发明专利技术涉及一种检测人体坐姿识别方法，包括如下步骤：图像采集：利用摄像头来实时采集学生的姿势图像；骨骼模型生成：根据练字姿势图像，系统通过卷积神经网络来预测人体的关键点，并生成人体的骨骼模型；姿态评估：基于生成的骨骼模型，提取出学生的上半身和手部关键点，通过预设的坐姿评分标准，对学生的练字姿势进行评估；反馈生成：根据评估结果，生成反馈信息

全部详细技术资料下载

【技术实现步骤摘要】
一种检测人体坐姿识别方法

[0001]本专利技术涉及姿态识别
，尤其涉及一种检测人体坐姿识别方法
。

技术介绍

[0002]学生在学习书法或者练字的过程中，坐姿的正确性至关重要
。
坐姿不正确不仅可能影响书写效果，同时也会对身体健康产生影响
。
目前，对学生练字坐姿的识别多依赖于教师的现场指导，但教师的资源有限，无法实时监控每一个学生的坐姿
。
因此，研发一种能自动识别学生练字坐姿的算法具有重要的实用价值
。
[0003]随着计算机视觉和深度学习的发展，人体姿态识别技术已经取得了显著的进步
。
基于以上需求提出了一种独特的
、
开创性的深度学习框架，该框架能实时地从图像和视频中识别出人体的关键点，并进一步生成相应的人体骨骼模型
。
[0004]该方法利用了一种双向的卷积神经网络，该网络包括两个并行的分支：一个分支预测出
24
个关键点的置信度图（
Part Confidence Maps
，
PCM
），另一个分支预测各部位之间的连接（
Part Affinity Fields
，
PAF
）
。
通过
PCM
和
PAF
的联合解码，该方法能够高效准确地估计出人体姿态
。
[0005]相比其他传统的姿态识别方法，如基于随机森林的方法
、/>基于人工特征的方法等，此方法具有以下显著的优势：高精度：由于该方法使用深度卷积神经网络对人体姿态进行建模，它可以有效地学习并利用图像中的复杂和抽象的特征，因此能够提供比传统方法更高的识别精度
。
[0006]实时性：该模型结构简洁，计算效率高，适合实时的姿态识别，这是许多传统方法难以做到的
。
[0007]鲁棒性：该预测不仅仅依赖于局部信息，还考虑了全局的空间结构信息，因此对于遮挡和人体姿态的变化有较好的鲁棒性
。
[0008]在学生书写姿态识别的场景中，以上优点使得此方法的应用潜力非常大
。
[0009]通过对人体关键点的检测，我们可以获取学生的手部
、
头部和躯干的姿态信息，这对于分析和纠正学生的书写姿态极为重要
。
如何更有效地应用到书写姿态的识别和纠正中，仍然是一个需要探讨的问题
。
面对个体差异
、
环境因素
、
实时性需求等挑战，需要进一步研究和优化技术方案，以期在实际应用中取得更好的效果
。
[0010]现有的相关技术方案存在以下主要缺点：
1. 准确性问题：对于传感器或者摄像头的方法，其准确性受到技术手段本身的限制，例如视觉图像处理可能会受到光照
、
遮挡等因素的影响，而传感器可能会因为布置位置或者接触不良等问题，无法准确地判断学生的坐姿
。
[0011]2. 反馈不及时：现有的方案大多数没有实现实时反馈和提醒功能，这对于学生坐姿的改善是不利的
。
[0012]3. 简单的机器学习技术不够强大：例如
SVM
等机器学习技术，其分类和识别能力有限，无法应对复杂和多变的实际场景
。

技术实现思路

[0013]为了克服上述的现有技术的缺点与不足，本专利技术的目的是提供一种实用
、
低成本
、
高效的学生练字坐姿识别算法，以便学生
、
教师或者家长能够实时监控学生的坐姿，从而有效提升学生的字迹质量以及防止由于长时间保持不良坐姿引发的健康问题
。
[0014]本专利技术的主要目标是提供一种检测人体坐姿识别方法或算法，该算法能够检测人体的关键点，并生成人体的骨骼模型，在此基础上，本专利技术通过对学生的上半身和手部关键点的精确定位和分析，实现对学生练字坐姿的识别和评估
。
[0015]本专利技术是通过如下技术方案实现的：一种检测人体坐姿识别方法，包括如下步骤：一
、
图像采集：利用摄像头来实时采集学生的练字姿势图像
。
[0016]二
、
骨骼模型生成：根据练字姿势图像，系统通过卷积神经网络来预测人体的关键点，并生成人体的骨骼模型
。
[0017]三
、
姿态评估：基于生成的骨骼模型，提取出学生的上半身和手部关键点，通过预设的坐姿评分标准，对学生的练字姿势进行评估
。
[0018]四
、
反馈生成：根据评估结果，生成反馈信息
。
[0019]进一步地，步骤一中，图像采集具体包括如下步骤：（1）首先创建一个摄像头对象来开启摄像头
。
[0020]（2）检查摄像头是否成功打开
。
[0021]（3）成功打开摄像头后，开始一个无限循环，持续获取摄像头的帧直到用户选择退出
。
[0022]（4）最终获取用户的坐姿连续图像，并建立复杂的学习库用以训练
。
[0023]更进一步地，其中：创建一个摄像头对象来开启摄像头，如果摄像头没有打开成功，会输出错误信息并退出程序；在一个无限循环中，系统每次都读取摄像头的当前帧，并在
GUI
窗口中显示出来，如果读取帧失败，退出循环
。
[0024]进一步地，步骤二中，骨骼模型生成具体包括如下步骤：系统接收到一个人体图像，通过一个深度卷积神经网络进行前向传播，最终输出两类特征图，一类是
Part Confidence Maps
，一类是
Part Affinity Fields。
[0025]更进一步地，其中：
Part Confidence Maps
是关键点的概率图，对于每个关键点类型
j
，有一个对应的
PCM Mj
，
PCM Mj
中的每个像素值
Mj(x, y)
代表该像素位置（
x
，
y
）属于关键点类型
j
的概率，假设有
K
个关键点，那么网络会输出
K
个
PCM
，通过应用
Softmax
函数，可以将网络的原始输出转化为概率值
。
[0026]Part Affinity Fields
是用于表示身体部位方向和长度的向量场，对于每一个身体部位，例如从关键点
j
到关键点
k
的连线，有一个对应的
PAF Vjk
，在
Vjk
中，每一个像素位置的向量
Vjk(x, y)
表示该位置处的身体部位方向和长度，假设有
C
本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种检测人体坐姿识别方法，其特征在于，包括如下步骤：一
、
图像采集：利用摄像头来实时采集学生的姿势图像；二
、
骨骼模型生成：根据练字姿势图像，系统通过卷积神经网络来预测人体的关键点，并生成人体的骨骼模型；三
、
姿态评估：基于生成的骨骼模型，提取出学生的上半身和手部关键点，通过预设的坐姿评分标准，对学生的练字姿势进行评估；四
、
反馈生成：根据评估结果，生成反馈信息
。2.
根据权利要求1所述的检测人体坐姿识别方法，其特征在于，步骤一中，图像采集具体包括如下步骤：（1）首先创建一个摄像头对象来开启摄像头；（2）检查摄像头是否成功打开；（3）成功打开摄像头后，开始一个无限循环，持续获取摄像头的帧直到用户选择退出；（4）最终获取用户的坐姿连续图像，并建立复杂的学习库用以训练
。3.
根据权利要求2所述的检测人体坐姿识别方法，其特征在于，其中：创建一个摄像头对象来开启摄像头是使用
cv2.VideoCapture(0)
来创建一个摄像头对象，其中0表示使用电脑的第一个摄像头；检查摄像头是否成功打开是通过摄像头对象的
isOpened
方法来检查，如果摄像头没有打开成功，会输出错误信息并退出程序；在一个无限循环中，系统每次都读取摄像头的当前帧，并在
GUI
窗口中显示出来，如果读取帧失败，退出循环
。4.
根据权利要求2所述的检测人体坐姿识别方法，其特征在于，步骤二中，骨骼模型生成具体包括如下步骤：系统接收到一个人体图像，通过一个深度卷积神经网络进行前向传播，最终输出两类特征图，一类是
Part Confidence Maps
，一类是
Part Affinity Fields。5.
根据权利要求4所述的检测人体坐姿识别方法，其特征在于，其中：
Part Confidence Maps
是关键点的概率图，对于每个关键点类型
j
，有一个对应的
PCM Mj
，
PCM Mj
中的每个像素值
Mj(x, y)
代表该像素位置（
x
，
y
）属于关键点类型
j
的概率，...

【专利技术属性】
技术研发人员：张仁超，张晓航，
申请(专利权)人：杭州华冬人工智能有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人