当前位置: 首页 > 专利查询>东南大学专利>正文

一种基于深度学习的水下声源定位方法技术

技术编号:21572671 阅读:53 留言:0更新日期:2019-07-10 15:42
本发明专利技术公开了一种基于深度学习的水下声源定位方法,包括:对使用KRAKEN程序模拟出的向量数据进行归一化操作,并叠加0均值高斯随机噪声复向量n,得到在频率f处的模拟声场数据p(f);根据模拟声场数据p(f)构建归一化协方差矩阵H,并对矩阵H进行Hermitian分解,将复矩阵H转化为卷积神经网络能够处理的实矩阵,得到卷积神经网络的输入数据;使用输入数据训练卷积神经网络,得到水下声源定位预测模型,则根据观测到的声场数据,预测出信号源的距离和深度。本发明专利技术针对单、多声源情形下水下声源定位使用了LeNet‑5卷积神经网络与56层深度残差网络,取得了拥有较高精度和准确率的水下声源定位算法,并提高了水下声源定位的实时性。

An underwater acoustic source location method based on depth learning

【技术实现步骤摘要】
一种基于深度学习的水下声源定位方法
本专利技术涉及一种水下声源定位方法,尤其涉及一种基于深度学习的水下声源定位方法,属于信号处理

技术介绍
水下声源定位是指利用水中声波和电子技术来确定水下声源的方向和距离的技术。根据数个水听器组成的接收阵列所接收到的水声信号数据,经过一定的数据处理过程来进行水下声源定位。目前,匹配场处理(MatchingFieldProcessing,MFP)技术为用于水下目标被动检测的代表性方法,它结合了信号处理技术和水声物理学,利用信道特征、窄带宽带等相关技术来处理水听器接收阵列所接收到的声源数据,在效率、准确率等方面均极大的优于传统信号处理技术。Hinich首先进行基于垂直阵列的匹配场处理的源定位[HinichMJ.Maximum-likelihoodsignalprocessingforaverticalarray[J].J.Acoust.Soc.Am,1973,54(2):499-503.],并提出了对源深度的估计方法;Bucker成功将匹配场运用于源范围和深度的估计[BuckerHP.Useofcalculatedsoundfieldsandmatched-fielddetectiontolocatesoundsourcesinshallowwater[J].J.Acoust.Soc.Am,1976,59(2):368-373.];Hamson在浅水中成功定位了不同频率的远距离声源[HamsonRM,HeitmeyerRM.Environmentalandsystemeffectsonsourcelocalizationinshallowwaterbythematched-fieldprocessingofaverticalarray[J].J.Acoust.Soc.Am,1989,86(5):1950-1959.]。至此,匹配场处理技术在相关领域取得了不俗的成果。但是,由于匹配场处理中预测声场是由声传播模型在各种环境参数条件下求解得到的,所以其性能在很大程度上依赖环境参数的准确性(即环境建模的精确与否),所以如何减小环境失配问题,成为相关研究者的关注点。为了减少环境失配,一种方法是利用某种手段减少模型误差所带来的损失,另一种方法是使用不需要建模的方法进行水下声源定位。深度学习是机器学习中一种对数据进行表征学习的方法,它由多个具有复杂结构的处理层组成,通过这种极度复杂的结构,可以对数据分层处理、逐步抽象。深度学习的诞生是为了更好的对大规模数据进行高层抽象,因此可以通过将深度学习应用于水下声源定位,从而设计出比现有方法拥有更高精度和准确率的算法。过去已有相关研究者将机器学习算法应用于声源定位中,特别是Steinberg等人将采用反演学习算法的单层前馈神经网络(FeedforwardNeuralNetwork,FNN)运用于确定均质介质中的源位置[SteinbergBZ,BeranMJ,ChinSH,etal.Aneuralnetworkapproachtosourcelocalization[J].J.Acoust.Soc.Am,1991,90(4):2081-2090.],该方法允许相关参数的连续性估计(即深度)。近期,Niu等人使用三层前馈神经网络、支持向量机、随机森林三种方法对海洋环境下单个声源进行了距离定位的实验[NiuH,ReevesE,GerstofP.Sourcelocalizationinanoceanwaveguideusingsupervisedmachinelearning[J].J.Acoust.Soc.Am,2017,142(3):1176-1188.]:在三层前馈神经网络中,使用了tensorflow编程并用其所提供的自适应矩估计来优化算法,并对信噪比(SignalNoiseRatio,SNR)、隐藏层数目等参数进行调节以比较算法的最终效果;在支持向量机中,通过训练K(K-1)/2个模型来创建具有K类的多类SVM。最经常分配给同一类别的点被认为组成单个类别,依此类推,直到所有点被赋予从1到K的类别为止;在随机森林中,通过使用统计抽样来使随机森林算法更加鲁棒,在给定绘图中,输入数据统一从所有训练集中随机选择。一个新的决策树适用于每个数据子集,每个点将在所有绘制中被分配给其最常见的类。但该文所使用三种方法的缺陷也比较明显(三层前馈神经网络为一种较为简单的神经网络结构,需要使用更加复杂的网络结构来提高预测的效果;支持向量机在样本数量较大时会占用大量的系统内存及训练时间,而且在效果达到一定程度后增加数据集无法给实验结果以更好的提升,无法较好地实现多组数据的目标检测;随机森林在很多资料中被论证,如果在某些分类回归问题中,数据存在较大的噪音,并且存在需要划分多类的某个变量,那么随机森林对于该变量的预测效果将大打折扣),而且该文仅对声源距离以及单个声源进行了预测,无法满足实际应用中的要求,因此需要使用更加复杂、高效的神经网络结构,设计出能在单、多声源情况下同时预测声源距离、深度并拥有更高精度和准确率的水下声源定位方法。
技术实现思路
专利技术目的:为克服现有技术不足,提供一种基于深度学习的水下声源定位方法,在保证了较高的水下声源定位准确率的同时,减少了硬件资源的消耗并提高了水下声源探测的实时性。技术方案:为实现上述专利技术目的,本专利技术采用以下技术方案:一种基于深度学习的水下声源定位方法,包括以下步骤:(1)对使用KRAKEN程序模拟出的向量数据进行归一化操作,并叠加0均值高斯随机噪声复向量n,得到在频率f处的模拟声场数据p(f);(2)根据模拟声场数据p(f)构建归一化协方差矩阵H,并对矩阵H进行Hermitian分解,将复矩阵H转化为卷积神经网络能够处理的实矩阵,得到卷积神经网络的输入数据;(3)使用输入数据训练卷积神经网络,得到水下声源定位预测模型,则根据观测到的声场数据,预测出信号源的距离和深度。进一步的,步骤(1)中KRAKEN程序所得到的数据为无噪声原始数据,需要手动添加噪声;首先将水听器阵列所接收到的数据向量s归一化:|s|=1,然后通过Box-Muller算法形成0均值高斯随机噪声复向量n,其概率密度函数为:其中,γ为名义上的信噪比,N为水听器阵列中接受器数量;复向量n是由下面公式得到:其中Xi,Yi为(0,1]上的均匀分布,最终得到的向量d=s+n;d即为该步骤最终得到的模拟声场数据p(f)。进一步的,步骤(2)中为了使处理过程独立于复合源谱,将接收到的模拟声场数据转换为归一化的采样协方差矩阵;通过对L个传感器的输入数据进行离散傅里叶变换,在频率f处的声场数据表示为p(f)=[p1(f),…,pL(f)]T;声场被建模成:p(f)=S(f)g(f,r)+∈;其中,∈为噪声,S(f)为源,函数g为格林函数,为了减少声场幅度带来的影响|S(f)|,该复合声场求归一化协方差矩阵形成共轭对称矩阵为:其中,H代表共轭转置运算,此时C(f)=CH(f),Ns代表形成的快照数目;假设C(f)=A+iB,为了将虚数矩阵转化为实数矩阵并且保留数据信息,将输入设定为则此时卷积神经网络的输入为矩阵H。进一步的,步骤(3)中首先将声源位置进行分类映射,具体包括本文档来自技高网
...

【技术保护点】
1.一种基于深度学习的水下声源定位方法,其特征在于,包括以下步骤:(1)对使用KRAKEN程序模拟出的向量数据进行归一化操作,并叠加0均值高斯随机噪声复向量n,得到在频率f处的模拟声场数据p(f);(2)根据模拟声场数据p(f)构建归一化协方差矩阵H,并对矩阵H进行Hermitian分解,将复矩阵H转化为卷积神经网络能够处理的实矩阵,得到卷积神经网络的输入数据;(3)使用输入数据训练卷积神经网络,得到水下声源定位预测模型,则根据观测到的声场数据,预测出信号源的距离和深度。

【技术特征摘要】
1.一种基于深度学习的水下声源定位方法,其特征在于,包括以下步骤:(1)对使用KRAKEN程序模拟出的向量数据进行归一化操作,并叠加0均值高斯随机噪声复向量n,得到在频率f处的模拟声场数据p(f);(2)根据模拟声场数据p(f)构建归一化协方差矩阵H,并对矩阵H进行Hermitian分解,将复矩阵H转化为卷积神经网络能够处理的实矩阵,得到卷积神经网络的输入数据;(3)使用输入数据训练卷积神经网络,得到水下声源定位预测模型,则根据观测到的声场数据,预测出信号源的距离和深度。2.根据权利要求1所述的一种基于深度学习的水下声源定位方法,其特征在于:步骤(1)中KRAKEN程序所得到的数据为无噪声原始数据,需要手动添加噪声;首先将水听器阵列所接收到的数据向量s归一化:|s|=1,然后通过Box-Muller算法形成0均值高斯随机噪声复向量n,其概率密度函数为:其中,γ为名义上的信噪比,N为水听器阵列中接受器数量;复向量n是由下面公式得到:其中Xi,Yi为(0,1]上的均匀分布,最终得到的向量d=s+n;d即为该步骤最终得到的模拟声场数据p(f)。3.根据权利要求1所述的一种基于深度学习的水下声源定位方法,其特征在于:步骤(2)中为了使处理过程独立于复合源谱,将接收到的模拟声场数据转换为归一化的采样协方差矩阵;通过对L个传感器的输入数据进行离散傅里叶变换,在频率f处的声场数据表示为p(f)=[p1(f),...,pL(f)]T;声场被建模成:p(f)=S(f)g(f,r)+∈;其中,∈为噪声,S(f)为源,函数g为格林函数,为了减少声场幅度带来的影响|S(f)|,该复合声场求归一化协方差矩阵形成共轭对称矩阵为:其中,H代表共轭转置运算,此时C(f)=CH(f),Ns代表形成的快照数目;假设C(f)=A+iB,为了将虚数矩阵转化为实数矩阵并且保留数据信息,将输入设定为则此时卷积神经网络的输入为矩阵H。4.根据权利要求1所述的一种基于深度学习的水下声源定位方法,其特征在于,步骤(3)中首先将声源位置进行分类映射,具体包括两种方法:(a)将深度和距离分别均分,然后单独训练,训练完后合并;具体为:将深度和距离分别分为K1,K2份,宽度为Δd、Δr,每一个输入向量xn,n=1,...N被gn、tn标记,k1=1,...,K1,k2=1,...,K2,标记代表真实的源位置分类,即水下声源定位预测模型的输出;对于卷积神经网络CNN,位置分类gn、tn被映射到一个1*K1,1*K2的向量g...

【专利技术属性】
技术研发人员:吴志翔姜龙玉金睿
申请(专利权)人:东南大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1