一种基于度量学习的非接触式跨域人体活动识别方法技术

技术编号:37967186 阅读:8 留言:0更新日期:2023-06-30 09:42
一种基于度量学习的非接触式跨域人体活动识别方法,通过对已采集到的活动数据采用自编码器进行数据增强,然后通过采用度量学习完成未出现在训练集中的新活动类别的识别。具体步骤如下:在室内环境中采集人员活动时对应的无线信号数据,从中提取CSI原始数据;对原始CSI数据进行数据预处理,数据插值,统一数据长度,数据去噪;对已知活动类型的数据使用自编码器进行数据增强,扩充数据集;使用扩充后的数据集训练特征提取网络,将待识别活动数据和支持集输入特征提取网络得到相应特征,使用度量学习的方法将待识别数据特征与支持集数据特征一一对比,从而判断活动类型。本方法对于未训练的活动类型能实现较高识别精度,增强泛化性和鲁棒性。化性和鲁棒性。化性和鲁棒性。

【技术实现步骤摘要】
一种基于度量学习的非接触式跨域人体活动识别方法


[0001]本专利技术涉及活动识别领域,具体涉及一种基于度量学习的非接触式跨域人体活动识别方法。

技术介绍

[0002]基于Wi

Fi的人体活动识别(Human Activity Recognition, HAR)旨在利用Wi

Fi信号识别人体活动。由于不需要用户佩戴特殊设备和额外的部署成本,基于Wi

Fi的人体识别在构建人机交互、智能监、入侵检测智能应用方面受到越来越多的关注。然而,由于采集信道状态信息(ChannelState Information, CSI) 数据需要大量的人力物力,现有的Wi

Fi感知公开数据集非常匮乏。因此,Wi

Fi感知没有足够的标记数据来训练具有良好性能的机器学习模型。同时,无线信号受到物理环境,人类行为的影响,传输过程中的人体 (位置、姿势或动作)不同的动作类型可能引起相似的信号波动,这无疑使棏活动识别的过程变得更加复杂。特别是在实际应用中,系统可能需要识别一些在训练阶段从未见过的活动类型,对未知活动类型进行识别是一个巨大的挑战。
[0003]传统的基于Wi

Fi的识别通常采用有监督的方法,只能识别预先定义的活动,并且需要大量的数据来学习足够的先验知识,它们复杂的训练过程加剧了模型训练的成本,使得整体开销大幅增加。这些活动识别方法首先收集大量带标签的样本,然后训练一个传统的机器学习模型来识别活动类型。然而,当需要识别训练过程中未出现的新活动类型时,由于新数据的活动类别和训练集中数据活动类别不同,需要跨类别对新的活动数据进行识别,此时上述方法的模型的识别性能会严重下降。为了解决这个问题,最近的一些工作收集了一些未出现在训练集中的新类型的活动数据来重新训练模型。但是,重训练的过程无疑增加了模型训练的开销。
[0004]在计算机视觉领域中,度量学习被广泛用于识别未见过的活动和场景。度量学习问题通常被描述为一个优化问题,优化一些衡量数据相似性的目标函数。将数据从原始向量空间映射到隐藏空间,得到与活动相关的特征。针对上述问题,由于Wi

Fi CSI的数据集很少,实际场景中可能会出现需要识别未知类型活动的情况。

技术实现思路

[0005]本专利技术的目的是提供一种基于度量学习的非接触式跨域人体活动识别方法,使用自编码器对活动数据集进行扩充来丰富数据集提升识别准确度,之后通过基于度量学习的方法比较数据之间的相似度来实现对未出现在训练集中的新活动类别进行识别的功能。
[0006]一种基于度量学习的非接触式跨域人体活动识别方法,包括如下步骤:步骤1,在室内环境中采集人员活动时对应的无线信号数据,从中提取CSI的原始信号;步骤2,对步骤1中采集到的原始CSI数据进行数据预处理,数据插值统一长度,数据去噪来去除硬件设备造成的噪声信号;
步骤3,使用自编码器对步骤2处理后的数据进行数据增强,生成对应活动相关的数据以扩大数据集;步骤4,使用基于度量学习的方法,建立活动识别模型,对步骤3中生成的数据和原有数据进行训练,学习数据之间的相似度,训练活动相关特征提取模型,对比待识别数据和支持集数据的特征,进行未知类型活动的识别。
[0007]本专利技术达到的有益效果:(1)利用度量学习的方法将待识别的未知类型活动数据特征与支持集数据特征一一对比,从而实现了未知类型活动的识别。
[0008](2)解决了无线感知中未知类型活动识别的问题,对于未训练的活动类型能实现较高的识别精度,无需额外的训练成本,增强了活动识别网络的鲁棒性。
[0009](3)受度量学习核心思想的启发,通过使相似样本更靠近,不相似样本更远离的准则来训练网络,不需要复杂的训练策略就可以实现对未知类型活动的识别。
附图说明
[0010]图1是本专利技术实施例中的基于信道状态信息的未知类型的活动识别方法的流程示意图。
[0011]图2是本专利技术实施例中的未知活动识别网络的网络结构示意图。
[0012]图3是本专利技术实施例中在实验室场景下的跨域活动识别效果示意图。
[0013]图4是本专利技术实施例中在会议室场景下的跨域活动识别效果示意图。
[0014]图5是本专利技术实施例中在卧室场景下的跨域活动识别效果示意图。
[0015]图6是本专利技术实施例中在走廊场景下的跨域活动识别效果示意图。
[0016]图7是本专利技术实施例中的数据增强方法对活动识别精度的影响示意图。
具体实施方式
[0017]下面结合说明书附图对本专利技术的技术方案做进一步的详细说明。
[0018]如图1所示,本专利技术提供了一种基于度量学习的非接触式跨域人体活动识别方法,其过程如下所述:步骤1:使用配备有Intel 5300 网卡和三根天线的电脑作为实验的接收器,配备有Intel 5300 网卡和一根天线的电脑作为实验的发射器,将设备部署在四个不同的日常生活场景中(实验室、会议室、办公室、卧室)。其中发射器和接收器之间的直线距离为3米,高度距离地面1米。收发器在志愿者活动时收发数据包,采集人员活动相关数据。使用Linux802.11 CSI tools从采集到的活动数据中提取用于人体活动识别的CSI原始数据。
[0019]步骤2:CSI(信道状态信息)刻画了信号传播空间的特性,不同的活动会导致信号不同的多径传播,利用这一特点,可以使用Wi

Fi进行人体活动识别。
[0020]发送端发射的无线信号在传输过程中受物理环境或人的因素(位置、姿势、动作)影响,形成直射、反射和散射等多条路径传播,产生多径效应。当有人员活动时,接收端信号发生变化。此时接收端接收到的信号反映了由于人员活动造成的多径变化。CSI包含了每个子载波上的幅度和相位信息,刻画信号空间传播的特性,能够反映信号的变化。接收端接收到的信号可以描述成:
[0021]其中为信道矩阵,表示CSI信息;接收和发射的信号向量分别为和;为加性高斯白噪声。
[0022]由于在室内环境中射频信号从发射器到接收器通过多条路径传播,CSI是所有路径信号的叠加。因此信道矩阵可以表示为:
[0023]这里是路径的数量,是复衰减,是第条路径的传播长度,是波长。由此模型可以得到当室内人员活动时,信号经过人体的反射,改变了信号路径长度,从而影响信道状态矩阵。
[0024]步骤2

1:数据插值,由于设备硬件和信道影响,数据传输过程中会发生丢包现象,根据时间戳使用三次样条插值对CSI数据进行补全,使得CSI数据的长度统一。插值补全Matlab中有直接提供插值函数,是一种常用的数据处理方法。
[0025]步骤2

2:数据去噪,对于人类日常活动行为,CSI的幅值在30 ~ 60 Hz之间波动。在保证信号不失真的前提下最大的去除硬件设备带来的噪声,本专利技术利用巴特沃斯低通滤波器对步骤2
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于度量学习的非接触式跨域人体活动识别方法,其特征在于:所述方法包括如下步骤:步骤1,在室内环境中采集人员活动时对应的无线信号数据,从中提取CSI的原始信号;步骤2,对步骤1中采集到的原始CSI数据进行数据预处理,数据插值统一长度,数据去噪来去除硬件设备造成的噪声信号;步骤3,使用自编码器对步骤2处理后的数据进行数据增强,生成对应活动相关的数据以扩大数据集;步骤4,使用基于度量学习的方法,建立活动识别模型,对步骤3中生成的数据和原有数据进行训练,学习数据之间的相似度,训练活动相关特征提取模型,对比待识别数据和支持集数据的特征,进行未知类型活动的识别。2.根据权利要求1所述的一种基于度量学习的非接触式跨域人体活动识别方法,其特征在于:步骤1中,使用Linux 802.11 CSI tools从中提取CSI的原始信号。3.根据权利要求1所述的一种基于度量学习的非接触式跨域人体活动识别方法,其特征在于:步骤2中,数据预处理方法如下:步骤2

1:数据插值,对于数据传输过程中发生的丢包现象,根据时间戳使用三次样条插值对CSI数据进行补全;步骤2

2:数据去噪,利用巴特沃斯低通滤波器对步骤2

1中的CSI数据进行去燥,去除环境中的高频噪声,利用Hampel滤波器去除CSI数据中的异常值,得到预处理后的数据。4.根据权利要求1所述的一种基于度量学习的非接触式跨域人体活动识别方法,其特征在于:步骤3中,数据增强的具体方法如下:使用自动编码器来生成相关的活动数据,其中每个自动编码器都是一个编码器

解码器结构;首先,通过编码器对数据进行压缩,提取与其活动相关的特征信息,将输入编码为正态分布;假设产生数据的概率为;编码器在输入为的条件下输出潜在向量z的概率为;然后将提取的特征和高斯随机噪声输入解码器以重构数据;最后,在训练阶段引入损失函数;目标是训练编码器输出潜在向量z的概率近似于生成潜在向量z的概率,其中符合的正态分布;将编码器损失定义为Kullback

Leibler散度,和分别表示类别的正态分布的期望和方差;;编码器的输出混合噪声输入解码器中来重构输入,其中为真实值,最小化重构损失为:;那么,数据增强模块的整体损失函数定义为:。5.根据权利要求1...

【专利技术属性】
技术研发人员:毛一敏肖甫郭政鑫桂林卿盛碧云李延超蔡惠
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1