System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于无线感知,具体涉及基于毫米波传感的语音命令识别方法。
技术介绍
1、随着互联网技术的快速发展,智能设备数量不断增加,语音助手已广泛应用于智能驾驶、智能家居、智能医疗等领域。然而,现有语音助手主要依赖麦克风采集语音信号,在无噪声的理想环境下效果良好,但复杂声学环境中的多声源、噪声和远场干扰易导致信号失真,使传统语音识别技术难以满足实际需求。此外,麦克风方法在穿墙感知等场景下无法应用。为提高语音识别性能,研究人员开始探索非声学传感器的可能性,提出接触式和非接触式两种方法。接触式方法通过可穿戴设备捕捉声带及周围组织的振动生成语音信号,但长时间接触皮肤可能造成不便。因此,研究逐渐转向非接触式人声感知。非接触式感知最早基于计算机视觉,其原理与人类语言交流方式相似。然而,该方法存在个人隐私问题,且受限于环境光条件,在用户佩戴口罩的场景下难以适用。
2、近年来,毫米波雷达因其成本低、体积小、高分辨率以及隐私保护等优势,被广泛应用于各种人机交互场景。毫米波雷达通过天线发射无线电信号,并接收由于声门振动导致相位被调制后反射回来的无线电信号,采集到回波的信号与麦克风所录制的语音信号的相似性较高。其工作频率范围为76-81ghz,对应波长约为4mm, 具有更细粒度的传感能力,该技术利用相位信息分辨距离变化的精度可以达到毫米级别,能穿透衣服、口罩、塑料等特定材料,且不受环境光、灰尘和雨雾等恶劣环境条件的影响。此外,用户无需佩戴额外的电子器件,不具有侵入性。zhang等人提出了ambiear,这是首个适用于非视距场景的毫米波(m
技术实现思路
1、本专利技术的目的是提供基于毫米波传感的语音命令识别方法,解决了现有技术在处理独立语音命令和检测微弱声音(如患者语音)方面的局限性,同时克服有限数据量对模型设计和扩展带来的困难。
2、本专利技术所采用的技术方案是,基于毫米波传感的语音命令识别方法,其特征在于,具体按照以下步骤实施:
3、步骤1、搭建毫米波雷达数据采集平台,采集不同语音命令的回波数据;
4、步骤2、对步骤1采集的回波数据进行预处理;
5、步骤3、对每个距离单元上经预处理后的回波数据进行短时傅里叶变换,提取目标的多普勒信息,随后对所有距离单元的多普勒谱进行非相干叠加,生成微多普勒谱图;
6、步骤4、对步骤3生成所有接收天线上的微多普勒谱图,利用改进的深度卷积对抗网络进行数据扩增,构建数据集并按照7:1.5:1.5的比例划分为训练集、验证集和测试集;
7、步骤5、构建声带振动识别网络bac-net,集成贝叶斯优化与卷积块注意力模块,聚焦关键频段和微多普勒特征,提高超参数调优效率和识别性能,将步骤4得到的训练集作为声带振动识别网络bac-net的输入,网络通过对不同语音命令词的训练,得到最优模型,从而识别不同语音命令。
8、本专利技术的特点还在于,
9、步骤1具体按照以下步骤实施:
10、步骤1.1、搭建毫米波雷达数据采集平台,包括硬件架构和软件配置,硬件需安装德州仪器公司(ti)生产的awr1642boost评估模块开发板及dca1000evm数据采集卡,包括主板,主板配备两根发射天线和四根接收天线,主板上安装有ti官方的mmwave studio02.01.01.00,并设置毫米波雷达相关参数,具体如下表:
11、
12、步骤1.2、设计并布置实验场景,雷达安置在距地面1-1.2m径向距离0.5-0.8m的三脚架上,放置在被测目标前方10-30cm处;
13、步骤1.3、为避免可能由信号分割引发的误差,本专利技术采用逐一录制语音命令的方式采集室内场景下不同语音命令词的回波信号,每位受试者需依次说出要求的10个命令词,在每个命令词的录制过程中,受试者根据采集人员的手势指导重复说出同一命令词5次,在固定的5秒间隔内自动进行数据采集,每个类别平均有50(5*10)组词,采用多通道融合方法,将毫米波雷达中4个接收天线的信号进行整合,因此每个类别有200(50*4)组词,增强声带微振动感知能力。
14、步骤2具体按照以下步骤实施:
15、步骤2.1、通过步骤1采集到不同语音命令词的回波数据,该数据以三维矩阵形式表示,维度为:
16、
17、其中,为快速时间维度上的采样点索引,为慢时间维度上的 chirp 索引,为接收通道的索引,代表示矩阵的数据类型是复数形式,即每个数据点可表示为,蕴含信号的幅度和相位信息,表示快速时间维度的采样点数,每个快速时间采样点对应于模拟数字转换器adc在一次采样周期内捕获的信号样本,快速时间通常与目标的距离信息相关,表示慢时间维度的线性调频 chirp 数量,一个 chirp是雷达发送的单个频率调制信号,用于获取目标的速度信息,表示接收通道数;
18、步骤2.2、对步骤2.1获取的回波数据,在快速时间维进行快速傅里叶变换,提取目标的距离信息,将原始 adc 数据从时域变换到距离域,具体计算公式为:
19、
20、为距离单元索引,与快速时间维度的采样点一一对应,最终生成距离-时间矩阵;
21、步骤2.3、对步骤2.2的距离-时间矩阵采用相量均值算法滤除静态杂波,对所有chirp取相量均值,计算静态杂波分量,并从原矩阵中减去:
22、
23、为滤除静态杂波后的距离-时间矩阵,从而增强动态目标的显示,得到更清晰的动态目标信号;
24、步骤2.4、对步骤2.3的去除直流分量,直流分量的计算公式为:
25、
26、从中减去计算得到的直流分量,以消除背景干扰:
27、
28、最终得到去除直流分量的矩阵。
29、步骤3具体按照以下步骤实施:
30、步骤3.1、将步骤2.4得到的回波数据矩阵,对每个距离单元上进行短时傅里叶变换,提取目标的多普勒信息:
31、
32、表示距离单元、频率、接收通道上的微多普勒谱;
33、步骤3.2、根据步骤3.1得到的每个距离单元上的多普勒谱,对所有距离单元的多普勒谱进行非相干叠加,生成微多普勒谱图:
34、
35、表示频本文档来自技高网...
【技术保护点】
1.基于毫米波传感的语音命令识别方法,其特征在于,具体按照以下步骤实施:
2.根据权利要求1所述的基于毫米波传感的语音命令识别方法,其特征在于,所述步骤1具体按照以下步骤实施:
3.根据权利要求2所述的基于毫米波传感的语音命令识别方法,其特征在于,所述步骤2具体按照以下步骤实施:
4.根据权利要求3所述的基于毫米波传感的语音命令识别方法,其特征在于,所述步骤3具体按照以下步骤实施:
5.根据权利要求4所述的基于毫米波传感的语音命令识别方法,其特征在于,所述步骤4具体按照以下步骤实施:
6.根据权利要求5所述的基于毫米波传感的语音命令识别方法,其特征在于,所述步骤4.1中改进的深度卷积对抗网络具体结构如下:
7.根据权利要求6所述的基于毫米波传感的语音命令识别方法,其特征在于,所述步骤4.1中改进的深度卷积对抗网络具体模型结构为:
8.根据权利要求7所述的基于毫米波传感的语音命令识别方法,其特征在于,所述步骤5具体按照以下步骤实施:
【技术特征摘要】
1.基于毫米波传感的语音命令识别方法,其特征在于,具体按照以下步骤实施:
2.根据权利要求1所述的基于毫米波传感的语音命令识别方法,其特征在于,所述步骤1具体按照以下步骤实施:
3.根据权利要求2所述的基于毫米波传感的语音命令识别方法,其特征在于,所述步骤2具体按照以下步骤实施:
4.根据权利要求3所述的基于毫米波传感的语音命令识别方法,其特征在于,所述步骤3具体按照以下步骤实施:
5.根据权利要求4所述的基于毫...
【专利技术属性】
技术研发人员:李军怀,郭与番,王怀军,费蓉,于蕾,吴婷,王侃,成宽洪,
申请(专利权)人:西安理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。