System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 利用无人机搭载传声器阵列实现声源定位的方法及装置制造方法及图纸_技高网

利用无人机搭载传声器阵列实现声源定位的方法及装置制造方法及图纸

技术编号:44448479 阅读:5 留言:0更新日期:2025-02-28 18:54
本发明专利技术公开了一种利用无人机搭载传声器阵列实现声源定位的方法及装置,本发明专利技术方法包括下述步骤:S1、获取无人机搭载传声器阵列测得的含有无人机飞行噪声的多通道音频信号;S2、使用常规波束形成技术提取多通道音频信号的波束形成图;S3、将波束形成图输入训练好的神经网络模型以获得预测的声源位置和声源强度。本发明专利技术旨在克服无人机上苛刻的声阵列条件(阵列孔径受限,阵元间距较小)和复杂的声学环境(极低信噪比以及无人机自噪声非平稳特性),实现无人机搭载传声器阵列对于高频声源进行高效且实时的声源定位。

【技术实现步骤摘要】

本专利技术属于声源的定位方法领域,具体涉及一种利用无人机搭载传声器阵列实现声源定位的方法及装置


技术介绍

1、无人机搭载传声器阵列,在空中异常声响监听、搜索救援、人机交互等都应用中都具有重要作用。但与手持的传声器阵列不同,无人机搭载传声器阵列的噪声来源更多样,其自噪声包括旋桨电机工作噪声、叶片旋转等,也包括外界噪声,包括悬停或者飞行状态下的风噪,以及周围环境中的噪声等。

2、声源定位是基于多通道采集的声音信号来估计一个或多个声源相对于某个参考点位置信息的问题,这个参考点通常是与传声器阵列位置有关的。在大多数情况下,声源定位是指对声源的到达方向(doa)的估计,也就是指对声源相对于参考位置的方位角和仰角的估计。声源定位在语音识别、语音增强、噪声控制以及房间声学分析等应用中都具有重要作用。

3、传统声源定位算法中较为常用的方法可以分类为以下三种:基于波束形成、基于高分辨率谱估计、基于波达时间差。波束形成技术通过对各阵元加权进行空域滤波,并通过控制传声器阵列的指向,遍历空间位置,获得最大输出功率的方向,实现声源定位。不难看出,基于波束形成的声源定位算法可以在声源多于一个的条件下对多声源进行定位。在过去的几十年里,常规波束形成技术(conventional beamforming , cb)已经证明了其在评估声源的空间分布及其强度方面的价值,尤其是可以将遍历方位获得不同方位阵列输出信号的能量绘制成图像(波束形成图,简称cb图)。

4、但是,无法忽视的是常规波束形成在无人机搭载传声器阵列中的使用存在难点:(1)无人机搭载传声器阵列接收信号具有极低信噪比,从能量上看接收信号信噪比远远低于-15db,导致对声源定位精度存在严重影响。同时,这种cb图的视觉表示也往往表现出错误的源强重建;(2)无人机噪声不仅能量强,而且具有非平稳特点,在cb图上存在大量类似干扰源的部分,且干扰源位置随时间发生变化;(3)无人机可搭载的传声器阵列的有效孔径和阵元间距都具有限制,常规波束形成算法估计声源空间分布时的空间分布效果受传声器阵列的有效孔径限制,特别是对于大波长信号声源。


技术实现思路

1、本专利技术要解决的技术问题:针对现有技术的上述问题,提供一种利用无人机搭载传声器阵列实现声源定位的方法及装置,本专利技术旨在克服无人机上苛刻的声阵列条件(阵列孔径受限,阵元间距较小)和复杂的声学环境(极低信噪比以及无人机自噪声非平稳特性),实现无人机搭载传声器阵列对于高频声源进行高效且实时的声源定位。

2、为了解决上述技术问题,本专利技术采用的技术方案为:

3、一种利用无人机搭载传声器阵列实现声源定位的方法,包括下述步骤:

4、s1、获取无人机搭载传声器阵列测得的含有无人机飞行噪声的多通道音频信号;

5、s2、使用常规波束形成技术提取多通道音频信号的波束形成图;

6、s3、将波束形成图输入训练好的神经网络模型以获得预测的声源位置和声源强度。

7、可选地,步骤s1中的无人机飞行噪声包括无人机工作状态下的电机噪声、旋翼噪声、天然存在的风噪以及气动噪声中的部分或全部。

8、可选地,步骤s2包括:

9、s2.1,将多通道音频信号根据下式进行预延迟:

10、,

11、上式中,为第个传声器阵元预延迟后的、第个采样点的音频信号,为第个传声器阵元在时刻的音频信号,为时间,为第个传声器阵元在方向的预延迟,,为第个传声器阵元的扫描延迟时间,为无人机搭载传声器阵列的位置和声源入射方向的夹角,为信号采样周期,,为传声器阵元数量;

12、s2.2,将各个传声器阵元预延迟后的音频信号通过a/d转换为数字采样信号后输入采用范数约束优化的fir滤波器组,所述fir滤波器组的滤波器长度为,第个传声器阵元第个快拍的权值为,所述fir滤波器组对所有数据加权求和得到波束输出时间序列的函数表达式为:

13、,

14、上式中,为波束输出时间序列的第个采样点的音频信号,为第个传声器阵元预延迟后的、第个采样点的音频信号,为第个传声器阵元第个快拍的权值,,;所述采用范数约束优化的函数表达式为:

15、,

16、,

17、上式中,为fir滤波器组的冲激响应,~分别为第1~l个快拍的冲激响应,为第个频率点的误差加权系数,,为滤波器通带频率集中的频率点数量,为第个频率点的向量函数,为第个频率点的期望响应,为第个频率点的阻带频率,,为滤波器阻带频率集中的频率点数量,为旁瓣值大小;

18、s2.3,对获得的波束输出时间序列根据下式计算能量:

19、,

20、上式中,为方向的能量,为采样点总数量,为波束输出时间序列的第个采样点的音频信号;

21、s2.4,结合无人机高度信息,将方向的能量绘制成某一指定平面上的声能量分布图以作为得到的多通道音频信号的波束形成图。

22、可选地,步骤s3中将波束形成图输入训练好的神经网络模型后,神经网络模型获得预测的声源位置和声源强度包括:首先使用采用64个大小为7×7的卷积核的卷积层进行特征提取,然后通过批归一化层的批归一化处理、relu激活函数激活和池化层的最大池化处理后送入残差网络单元,所述残差网络单元包括残差层1~残差层4共四个级联连接的残差层;所述残差网络单元的输出经过一个池化层的平均池化处理后送入全连接输出层得到声源位置的预测值和声源强度的预测值构成的输出向量。

23、可选地,所述残差网络单元中的每一个残差层对输入特征处理得到输出特征包括:首先将输入特征使用卷积层将进行特征提取后,再利用通过批归一化层的批归一化处理以实现缩放移位,再将缩放移位后得到的特征f采用通道注意力模块提取特征后再与原始的缩放移位后得到的特征f相乘得到特征f’,将特征f’采用空间注意力模块提取特征后再与原始的特征f’相乘得到特征f”,再将特征f”与残差层的输入特征拼接得到残差层的输出特征。

24、可选地,步骤s3之前还包括设置仿真声源并采集含有无人机飞行噪声的多通道音频信号样本,使用实际测量得到的含有无人机飞行噪声的多通道音频信号样本作为神经网络模型的输入、仿真声源的声源位置和声源强度作为标签构建训练数据集,并使用训练数据集来训练神经网络模型,并采用预设的损失函数来更新神经网络模型的模型参数以获得训练好的神经网络模型。

25、可选地,所述采用预设的损失函数来更新神经网络模型的模型参数时,所述预设的损失函数的函数表达式为:

26、,

27、上式中,为损失函数,和分别为声源位置的标签值和预测值,和分别为声源强度的标签值和预测值。

28、此外,本专利技术还提供一种利用无人机搭载传声器阵列实现声源定位的系统,包括相互连接的微处理器和存储器,所述微处理器被编程或配置以执行所述利用无人机搭载传声器阵列实现声源定位的方法。

29、此外,本专利技术还提供一种计算机可读存储介本文档来自技高网...

【技术保护点】

1.一种利用无人机搭载传声器阵列实现声源定位的方法,其特征在于,包括下述步骤:

2.根据权利要求1所述的利用无人机搭载传声器阵列实现声源定位的方法,其特征在于,步骤S1中的无人机飞行噪声包括无人机工作状态下的电机噪声、旋翼噪声、天然存在的风噪以及气动噪声中的部分或全部。

3.根据权利要求1所述的利用无人机搭载传声器阵列实现声源定位的方法,其特征在于,步骤S2包括:

4.根据权利要求1所述的利用无人机搭载传声器阵列实现声源定位的方法,其特征在于,步骤S3中将波束形成图输入训练好的神经网络模型后,神经网络模型获得预测的声源位置和声源强度包括:首先使用采用64个大小为7×7的卷积核的卷积层进行特征提取,然后通过批归一化层的批归一化处理、ReLU激活函数激活和池化层的最大池化处理后送入残差网络单元,所述残差网络单元包括残差层1~残差层4共四个级联连接的残差层;所述残差网络单元的输出经过一个池化层的平均池化处理后送入全连接输出层得到声源位置的预测值和声源强度的预测值构成的输出向量。

5.根据权利要求4所述的利用无人机搭载传声器阵列实现声源定位的方法,其特征在于,所述残差网络单元中的每一个残差层对输入特征处理得到输出特征包括:首先将输入特征使用卷积层将进行特征提取后,再利用通过批归一化层的批归一化处理以实现缩放移位,再将缩放移位后得到的特征F采用通道注意力模块提取特征后再与原始的缩放移位后得到的特征F相乘得到特征F’,将特征F’采用空间注意力模块提取特征后再与原始的特征F’相乘得到特征F”,再将特征F”与残差层的输入特征拼接得到残差层的输出特征。

6.根据权利要求1所述的利用无人机搭载传声器阵列实现声源定位的方法,其特征在于,步骤S3之前还包括设置仿真声源并采集含有无人机飞行噪声的多通道音频信号样本,使用实际测量得到的含有无人机飞行噪声的多通道音频信号样本作为神经网络模型的输入、仿真声源的声源位置和声源强度作为标签构建训练数据集,并使用训练数据集来训练神经网络模型,并采用预设的损失函数来更新神经网络模型的模型参数以获得训练好的神经网络模型。

7.根据权利要求6所述的利用无人机搭载传声器阵列实现声源定位的方法,其特征在于,所述采用预设的损失函数来更新神经网络模型的模型参数时,所述预设的损失函数的函数表达式为:

8.一种利用无人机搭载传声器阵列实现声源定位的装置,包括相互连接的微处理器和存储器,其特征在于,所述微处理器被编程或配置以执行权利要求1~7中任意一项所述利用无人机搭载传声器阵列实现声源定位的方法。

9.一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序或指令,其特征在于,该计算机程序或指令被编程或配置以通过处理器执行权利要求1~7中任意一项所述利用无人机搭载传声器阵列实现声源定位的方法。

10.一种计算机程序产品,包括计算机程序或指令,其特征在于,该计算机程序或指令被编程或配置以通过处理器执行权利要求1~7中任意一项所述利用无人机搭载传声器阵列实现声源定位的方法。

...

【技术特征摘要】

1.一种利用无人机搭载传声器阵列实现声源定位的方法,其特征在于,包括下述步骤:

2.根据权利要求1所述的利用无人机搭载传声器阵列实现声源定位的方法,其特征在于,步骤s1中的无人机飞行噪声包括无人机工作状态下的电机噪声、旋翼噪声、天然存在的风噪以及气动噪声中的部分或全部。

3.根据权利要求1所述的利用无人机搭载传声器阵列实现声源定位的方法,其特征在于,步骤s2包括:

4.根据权利要求1所述的利用无人机搭载传声器阵列实现声源定位的方法,其特征在于,步骤s3中将波束形成图输入训练好的神经网络模型后,神经网络模型获得预测的声源位置和声源强度包括:首先使用采用64个大小为7×7的卷积核的卷积层进行特征提取,然后通过批归一化层的批归一化处理、relu激活函数激活和池化层的最大池化处理后送入残差网络单元,所述残差网络单元包括残差层1~残差层4共四个级联连接的残差层;所述残差网络单元的输出经过一个池化层的平均池化处理后送入全连接输出层得到声源位置的预测值和声源强度的预测值构成的输出向量。

5.根据权利要求4所述的利用无人机搭载传声器阵列实现声源定位的方法,其特征在于,所述残差网络单元中的每一个残差层对输入特征处理得到输出特征包括:首先将输入特征使用卷积层将进行特征提取后,再利用通过批归一化层的批归一化处理以实现缩放移位,再将缩放移位后得到的特征f采用通道注意力模块提取特征后再与原始的缩放移位后得到的特征f相乘得到特征f’,将特征f’采用空间注意力模块提取特征后...

【专利技术属性】
技术研发人员:卢铃段新宇曹浩胡胜岳一石刘定国王海跃刘赟唐奇吴鸣陈双辉
申请(专利权)人:国网湖南省电力有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1