基于小样本情况下的手势识别算法制造技术

技术编号：43049743 阅读：21 留言：0更新日期：2024-10-22 14:33

本发明专利技术公开了一种基于小样本情况下的手势识别算法。本发明专利技术首先利用生成器网络生成逼真的新样本，同时通过判别器网络对生成样本进行鉴别，以保证生成样本的质量。然后，针对实时动作流数据进行滑窗分批处理，将数据分批处理以便实时监测和分析。通过对每个分批后的实时数据进行手势标签输出概率分布的计算，完成对实时数据的时间状态区间的划定。除此之外，还构建了适用于三维图像格式的手势数据，并搭建了基于三维卷积的神经网络模型，以实现对手势数据的分类识别。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及手势识别，特别涉及基于小样本情况下的手势识别算法。

技术介绍

1、手势分割与识别技术在计算机视觉和人机交互领域具有重要应用，尤其是在虚拟现实、智能交通和人机界面等领域。传统的手势分割与识别算法通常基于光学图像或深度相机数据，但在特定场景下，如低光照环境或复杂背景下，这些传统方法可能面临性能下降的问题。

2、毫米波雷达技术在手势识别领域有着广泛的应用，其具有穿透能力强、不受光照和环境干扰的优势。然而，传统的毫米波雷达手势识别算法往往需要大量标记数据进行训练，而在实际应用中获取大规模数据集往往是困难的，导致传统算法性能下降严重。

3、在现有的毫米波雷达手势分割与识别算法中，大多数是基于大样本数据集训练的深度学习模型，如卷积神经网络(cnn)。然而，对于特定场景或任务，往往难以获得足够数量的样本数据，尤其是针对手势识别任务。因此，针对小样本数据集进行高效的毫米波雷达手势分割与识别仍然是一个亟待解决的问题。

技术实现思路

1、本专利技术的目的是提供基于小样本情况下的手势识别算法，旨在解决传统手势识别算法在面对小样本数据时性能不佳的问题。且通过有效地利用小样本数据，实现了准确和高效的手势识别。

2、本专利技术的上述技术目的是通过以下技术方案得以实现的：

3、1.基于小样本情况下的手势识别算法，包括模型搭建与训练阶段以及模型应用阶段，所述模型搭建与训练阶段包括以下步骤，其特征在于，所述模型搭建与训练阶段包括以下步骤：

5、步骤2：利用混频器将雷达的发射信号st(t)和接收信号sr(t)输入，得到混频信号sm(t)，然后通过低通滤波器滤除高频部分，获得中频信号sif(t)，其中，77ghz毫米波雷达的发射信号st(t)具体表达式为：

6、

7、在这里，at表示发射信号的振幅，fc是载波的中心频率，t代表锯齿波信号的脉冲宽度，表示在t时间内发射信号的频率；

8、雷达接收的信号sr(t)用以下表达式：

9、

10、在此，ar代表接收信号的幅值，δt代表时延，而fr(t)则表示在t时间内接收到的信号频率；

11、经过混频器后获得混频信号sm(t)，其表达式为：sm(t)＝st(t)sr(t)，混频信号sm(t)经过低通滤波器后，得到中频信号sif(t)，其表达式为：

12、

13、步骤3：将中频信号逐帧进行二维傅里叶变换，然后进行高通滤波处理，以获取时间-距离-速度三维图谱；

14、步骤4：将视频数据集根据时间轴滑动窗口切分为片段，每个片段对应一个单一手势动作集，切分的样本在时间上存在部分重叠，重叠的帧数由滑动窗口算法的窗长和步长决定，不同的窗长和步长会直接影响手势分割和识别的效果，切分完成后，得到一系列样本；

15、步骤5：gan(生成对抗网络)利用少量数据集的特征生成更多新的数据；gan生成网络和判别网络博弈，判别网络d的目标是提高真实样本x的概率值，并使判断fake样本g(z)为真实样本的概率值尽可能小，生成网络g则希望生成的fake样本g(z)与真实样本x越相似越好，以增加判别网络将其判断为真实样本的概率d(g(z))，gan(生成对抗网络)的目标函数为：

16、

17、步骤6：建立三维卷积神经网络模型，将通过扩充得到的数据集划分为训练集strain作为三维卷积神经网络的输入数据，训练该模型，并且用验证集sval对其性能进行测试，具体内容如下所示：

18、步骤6-1：建立一个三维卷积神经网络模型，其中包括四个3d卷积层，卷积核个数分别为4、8、32和64，这些层后跟relu激活函数，接下来是四个batch norma l i zat ion(bn)层和三个最大3d池化层，通过f l atten层展平后，接入三个全连接层，神经元个数分别为256、32和3，前两个全连接层采用tanh作为激活函数，输出层采用softmax函数；

19、步骤6-2：设置训练的epoch，每轮训练开始之前把训练集strain随机打乱；

20、步骤6-3：输入训练集strain训练模型，epoch＝28，10个样本作为一个batch，交叉熵是loss函数；模型的梯度优化算法选择adam算法，该算法能自适应动态地调节学习率，可以依据不同的参数选择不同的学习率，对学习率还有一个动态的约束，避免及其不稳定的梯度波动，记录训练集损失函数值，准确率，每轮结束后，验证集sval进行验证，把验证集的损失函数值和准确率记录下来；

21、该模型应用过程包括：

22、步骤7：对于连续手势序列，采用逐帧滑动窗口的方式提取样本，并将其输入训练好的三维卷积神经网络模型中进行识别，再次对初步识别结果进行精确定位和手势分割，以获得完整的手势信息；

23、步骤4的步骤如下：

24、步骤4-1：估算动作周期，通过多次试验确定最佳的窗长l和步长lsp，确保窗长小于最快动作一个周期的帧数；

25、步骤4-2:使用步长lsp来滑动窗口，截取样本，并标记添加标签；

26、步骤4-3：将样本按照80％和20％的比例划分为训练集strain和验证集sval；

27、本专利技术步骤7中具体包括以下步骤：

28、步骤7-1：根据时间轴上的步长(lsp)和窗长(l)，将连续手势划分成三维图谱，并将其输入到步骤6中获得的模型中进行识别，将识别结果记录为数组，并进行可视化；

29、步骤7-2：将识别概率低于0.8的窗口标记为过渡窗口；

30、步骤7-3：将连续识别为同一动作的片段记录为动作；

31、步骤7-4：随着时间的推移，某种手势标签的输出概率下降，而另一种手势标签的输出概率上升，导致输出标签的概率矩阵曲线相交，这些交叉点被确定为分割的边界点，可作为动作的起止点或分界点，从而完成手势的分割；

32、步骤7-5：将这些找到的分割边界与预先记录的分割边界进行对比，进行性能分析。

33、本专利技术具体采用以下步骤：

34、步骤1：设计三种手势动作，分别为上下挥手、左右挥手和前推后拉，将每种动作分类记录，在每个采集周期内，重复执行单一手势动作多次，同时，采集连续手势动作，至少包含两种手势，并记录手势切换的时刻，包括以下步骤：

35、步骤1-1：确定要收集的手势动作，包括上下挥手、左右挥手和前推后拉，并为每个动作添加标签；

36、步骤1-2：对于数据采集所使用的77ghz毫米波雷达进行参数配置，根据手势识别的实际应用场景，设置相应的雷达波形参数，可选用t i公司的iwr1642雷达，其波形为线性调频连续波，采样频率本文档来自技高网...

【技术保护点】

1.基于小样本情况下的手势识别算法，包括模型搭建与训练阶段以及模型应用阶段，所述模型搭建与训练阶段包括以下步骤，其特征在于，所述模型搭建与训练阶段包括以下步骤：

2.根据权利要求1所述的基于小样本情况下的手势识别算法，其特征在于，具体采用以下步骤：

【技术特征摘要】

1.基于小样本情况下的手势识别算法，包括模型搭建与训练阶段以及模型应用阶段，所述模型搭建与训练阶段包括以下步骤，其特征在于，所述模...

【专利技术属性】
技术研发人员：吴聪，韩梦姣，
申请(专利权)人：无锡太湖学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人