一种面向实时声源定位的改进时延估计方法技术

技术编号:34391379 阅读:12 留言:0更新日期:2022-08-03 21:20
一种面向实时声源定位的改进时延估计方法,包括:FIFO Buffer,声源信号检测,GCC

【技术实现步骤摘要】
一种面向实时声源定位的改进时延估计方法


[0001]本专利技术属于电子信息
,更具体地说,涉及一种面向实时声源定位的改进时延估计方法。

技术介绍

[0002]实现高精度、可靠且实时的声源定位备受当前工业界与学术界关注。声源定位系统的核心是声源定位算法,其中基于TDOA的算法由于运算量小且实时性高,是目前使用最广泛的算法之一。其主要通过对麦克风间的信号进行互相关,提取声源到达麦克风间的若干组时延,通过几何计算或位置估计实现定位。基于TDOA的算法中最常用的算法是相位变换加权广义互相关(GCC

PHAT),传统GCC

PHAT算法计算获得的互相关序列,虽然在高信噪比时互相关峰值尖锐,且通过峰值搜索获取的延迟点正确,但是在低噪比的场景中,GCC

PHAT算法受到噪声的影响显著,突出的峰值杂乱,准确的峰值容易被淹没,使得提取的延迟点存在较大误差。此外,现有时延估计方法存在实时性不足,以致难以在计算能力有限的嵌入式设备内得到有效运行,从而影响实现良好效果的实时声源定位系统。

技术实现思路

[0003]为了克服上述现有技术的缺点,本专利技术目的在于提供一种面向实时声源定位的改进时延估计方法。
[0004]为了实现上述目的,本专利技术采用的技术方案是:
[0005]一种面向实时声源定位的改进时延估计方法,包括:
[0006]FIFO Buffer,为FIFO数据结构的矩阵,矩阵每行具有先进先出的特性,用于实时存放多通道麦克风接收信号;
[0007]声源信号检测,从FIFO Buffer内取需要估计时延的两通道信号,采用离散hilbert变换和短时过零率相结合的双门限法,检测实时接收的信号中是否存在有效声源信号;
[0008]GCC

PHAT改进互相关算法,在确认存在有效声源信号的前提下,快速、准确计算两通道信号的互相关,得到包含尖锐互相关峰值的互相关序列;
[0009]区域峰值搜索,根据实际阵元的间距大小,设定在中搜索互相关峰值的范围,并同时提取区域峰值所对应的偏移量;
[0010]时延估计,将搜索的偏移量转化为时延值。
[0011]优选地,所述FIFO Buffer,需要实时无阻塞地将多通道麦克风接收信号写入其内,构建的Buffer内存放每通道接收信号的长度为0.8s~1.5s,太长不仅影响计算的实时性,还会引入较多的多径干扰。
[0012]优选地,所述声源信号检测,首先的离散hilbert变换用于提取信号包络,其基于FFT实现,通过设定其门限值作为检测声源的第一级判断,而短时过零率表示一帧语音中波形穿过横轴的次数,通过设定其门限值作为检测声源的第二级判断。
[0013]优选地,所述GCC

PHAT改进互相关算法,其主要步骤如下:
[0014]1)首先,求得带通滤波后的互功率谱,并对其进行最值归一化;
[0015]2)然后,根据所用带通滤波的上下截止频点,从上述归一化的互功率谱中截取出有效声源频段,并对其进行PHAT加权,拼接成完整的互功率谱;
[0016]3)最后,对拼接完的互功率谱进行IFFT,得所需的互相关序列。
[0017]与现有技术相比,在较低信噪比的场景下,本方法能够实时,稳定准确地估计出信号间的时延,即在同等条件下计算的互相关序列峰值更加准确尖锐,为后续的精确位置估计提供支撑。
附图说明
[0018]图1是本专利技术的整体架构图。
[0019]图2是展示的传统GCC

PHAT时延估计方法流程图。
[0020]图3(a)是接收的较高信噪比的两通道信号;图3(b)是利用传统GCC

PHAT方法获得的较高信噪比的两信号互相关曲线;图3(c)是利用本专利技术GCC改进方法获得的较高信噪比的两信号互相关曲线;图3(d)是接收的较低信噪比的两通道信号;图3(e)是利用传统GCC

PHAT方法获得的较低信噪比的两信号互相关曲线图;图3(f)是利用本专利技术GCC改进方法获得的较低信噪比的两信号互相关曲线。
[0021]图4(a)是两带通滤波后的信号互功率谱图;图4(b)是图4(a)进行PHAT加权后的互功率谱图;图4(c)是图(b)进行IFFT转到时域的互相关曲线;图4(d)是不对互功率谱进行最值归一化便拼接的互功率谱图;图4(e)是图(d)进行IFFT转到时域的互相关曲线;图4(f)是对互功率谱进行最值归一化的图;图4(g)是对图4(f)截取的有效语音频段进行PHAT加权后再拼接的互功率谱图;图4(h)是对图4(g)做IFFT得到的互相关曲线。
具体实施方式
[0022]下面结合附图和实施例详细说明本专利技术的实施方式。
[0023]一种面向实时声源定位的改进时延估计方法,其整体架构如图1所示,包括:
[0024]FIFO Buffer,为FIFO数据结构的矩阵,矩阵每行具有先进先出的特性,用于实时存放多通道麦克风接收信号;
[0025]声源信号检测,从FIFO Buffer内取需要估计时延的两通道信号,采用离散hilbert变换和短时过零率相结合的双门限法,检测实时接收的信号中是否存在有效声源信号;
[0026]GCC

PHAT改进互相关算法,在确认存在有效声源信号的前提下,快速、准确计算两通道信号的互相关,得到包含尖锐互相关峰值的互相关序列;
[0027]区域峰值搜索,根据实际阵元的间距大小,设定在中搜索互相关峰值的范围,并同时提取区域峰值所对应的偏移量;
[0028]时延估计,将搜索的偏移量转化为时延值。
[0029]优选地,所述FIFO Buffer,需要实时无阻塞地将多通道麦克风接收信号写入其内,构建的Buffer内存放每通道接收信号的长度为0.8s~1.5s,太长不仅影响计算的实时性,还会引入较多的多径干扰。
[0030]优选地,所述声源信号检测,首先的离散hilbert变换用于提取信号包络,其基于FFT实现,通过设定其门限值作为检测声源的第一级判断,而短时过零率表示一帧语音中波形穿过横轴的次数,通过设定其门限值作为检测声源的第二级判断。
[0031]优选地,所述声源信号检测,首先对FIFO Buffer内数据进行声源信号检测,检测数据内是否都存在有效声源。本专利技术提出一种hilbert变换和短时过零率相结合的双门限法,用于检测实时接收信号中是否存在有效声源。其中,离散hilbert变换可基于FFT而快速实现提取信号包络,计算式如下
[0032][0033][0034]式中,表示离散hilbert变换;表示卷积运算;为信号的频谱;为符号函数,;为的包络,通过设定其门限值作为检测声源的第一级判断。再则,短时过零率表示一帧语音中波形穿过横轴的次数,是判断语音信号的有效方法,通过设定其门限值作为检测声源的第二级判断。
[0035]按本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向实时声源定位的改进时延估计方法,其特征在于,包括:FIFO Buffer,为FIFO(First Input First Output,先进先出的队列)数据结构的矩阵,矩阵每行具有先进先出的特性,用于实时存放多通道麦克风接收信号;声源信号检测,从FIFO Buffer内取需要估计时延的两通道信号,采用离散hilbert变换和短时过零率相结合的双门限法,检测实时接收的信号中是否存在有效声源信号;GCC

PHAT改进互相关算法,在确认存在有效声源信号的前提下,快速、准确计算两通道信号的互相关,得到包含尖锐互相关峰值的互相关序列;区域峰值搜索,根据实际阵元的间距大小,设定在中搜索互相关峰值的范围,并同时提取区域峰值所对应的偏移量;时延估计,将搜索的偏移量转化为时延值。2.根据权利要求1所述的一种面向实时声源定位的改进时延估计方法,其特征在于,所述FIFO Buffer,需要实时无阻塞地将多通道...

【专利技术属性】
技术研发人员:汪志胜崔俊宁
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1