当前位置: 首页 > 专利查询>广州大学专利>正文

一种适用于声源定位的时延估计方法技术

技术编号:21397016 阅读:23 留言:0更新日期:2019-06-19 06:29
本发明专利技术公开了一种适用于声源定位的时延估计方法,包括对通过两个传声器获得的语音信号进行信号处理,获得最小相位分量的复倒谱;根据所述最小相位分量的复倒谱计算信号最小相位分量频谱和全通分量频谱;利用所述最小相位分量的频谱的模值与所述全通分量信号的频谱计算得到改进的全通分量频谱,并根据所述改进的全通分量频谱计算得到改进的相位加权函数,结合所述改进的全通分量频谱和所述改进的相位加权函数计算互功率谱;通过快速傅里叶反变换方法求解所述互功率谱的互相关函数,并根据所述互相关函数计算得到延迟时间。本发明专利技术提供的时延估计方法能够在混响和噪声环境下,有效地减少由噪声和混响带来的影响,从而提高对于噪声的适应性和时延估计的准确度。

【技术实现步骤摘要】
一种适用于声源定位的时延估计方法
本专利技术涉及声源定位
,具体涉及到一种适用于声源定位的时延估计方法。
技术介绍
近几年来,基于传声器阵列的声源定位技术被广泛应用于各种场景,声源定位技术确定的时延和位置信息为波束成形、语音增强、语音识别、盲信号分离等各种语音算法提供重要的信息。基于时延估计的声源定位技术具备运算成本少、所需要传声器数量较少等优点,因此被广泛应用于各种实时处理环境中。声源定位技术的定位方法分为两步,第一步是估计声波从声源传播到两个传声器之间的时间差,第二步是根据时间差对声源位置进行估计,其中,第一步时间差估计的准确度决定了第二步声源定位的准确度。现有技术中,基于互功率谱的时延估计方法因其具备运算成本少、定位精确度较高、在低混响(0ms-300ms)下能够估计的优点而被广泛的研究,但其估计性能在混响较高的环境下会下降,从而导致时延估计的准确度降低。针对于此,有学者提出了基于倒谱预滤波的时延估计方法,但是这种方法虽然能够很好的降低混响对时延估计的影响,却容易受到噪声的影响。
技术实现思路
本专利技术提供了一种适用于声源定位的时延估计方法,以解决现有技术难以减少噪声和混响带来的影响的技术问题,本专利技术能够在混响和噪声环境下,有效地减少由噪声和混响带来的影响,从而提高对于噪声的适应性和时延估计的准确度。为了解决上述技术问题,本专利技术实施例提供了一种适用于声源定位的时延估计方法,包括:对通过两个传声器获得的语音信号进行信号处理,获得最小相位分量的复倒谱;根据所述最小相位分量的复倒谱计算信号最小相位分量的频谱和全通分量信号的频谱;利用所述最小相位分量的频谱的模值与所述全通分量信号的频谱计算得到改进的全通分量频谱,并根据所述改进的全通分量频谱计算得到改进的相位加权函数,结合所述改进的全通分量频谱和所述改进的相位加权函数计算互功率谱;通过快速傅里叶反变换方法求解所述互功率谱的互相关函数,并根据所述互相关函数计算得到延迟时间。作为优选方案,所述利用所述最小相位分量的频谱的模值与所述全通分量信号的频谱计算得到改进的全通分量频谱,并根据所述改进的全通分量频谱计算得到改进的相位加权函数,结合所述改进的全通分量频谱和所述改进的相位加权函数计算互功率谱,具体为:利用所述最小相位分量的频谱的模值与所述全通分量信号的频谱相乘得到所述改进的全通分量频谱;根据所述改进的全通分量频谱计算得到所述改进的相位加权函数,结合所述改进的全通分量频谱和所述改进的相位加权函数计算得到所述互功率谱。作为优选方案,所述对通过两个传声器获得的语音信号进行信号处理,获得最小相位分量的复倒谱,具体为:通过两个传声器分别获得第一通道语音信号和第二通道语音信号;对所述第一通道语音信号和所述第二通道语音信号进行信号处理,得到第一通道复倒谱和第二通道复倒谱;对所述第一通道复倒谱和所述第二通道复倒谱进行同态滤波处理,获得第一通道最小相位分量的复倒谱和第二通道最小相位分量的复倒谱。作为优选方案,所述对所述第一通道语音信号和所述第二通道语音信号进行信号处理,具体为:设所述第一通道语音信号为x1(t),所述第二通道语音信号为x2(t);对经过滤波、分帧处理后的信号x1(t)和x2(t)进行语音端点检测,并选取出同一帧的语音帧,得到对应的y1(t)和y2(t);分别对y1(t)和y2(t)进行离散傅里叶变换处理,得到对应的Y1(ω)和Y2(ω);根据Y1(ω)和Y2(ω)得到所述第一通道复倒谱k1(n)和所述第二通道复倒谱k2(n);其中,k1(n)=IFFT(ln(|Y1(ω)|)),k2(n)=IFFT(ln(|Y2(ω)|)),IFFT为快速傅里叶反变换;对所述第一通道复倒谱k1(n)和所述第二通道复倒谱k2(n)进行同态滤波处理,分别获得所述第一通道最小相位分量的复倒谱k1min(n)和所述第二通道最小相位分量的复倒谱k2min(n);其中,k1min(n)=u*k1(n),k2min(n)=u*k2(n),N为傅里叶变换的点数。作为优选方案,所述根据所述最小相位分量的复倒谱计算信号最小相位分量的频谱和全通分量信号的频谱,具体为:根据所述第一通道最小相位分量的复倒谱k1min(n)和所述第二通道最小相位分量的复倒谱k2min(n)计算得到第一通道最小相位分量的频谱Y1min(ω)和第二通道最小相位分量的频谱Y2min(ω),其中,FFT为快速傅里叶变换;根据所述第一通道最小相位分量的频谱Y1min(ω)和所述第二通道最小相位分量的频谱Y2min(ω)计算得到第一通道全通分量信号的频谱Y1all(ω)和第二通道全通分量信号的频谱Y2all(ω),其中,Y1all(ω)=Y1(ω)/Y1min(ω),Y2all(ω)=Y2(ω)/Y2min(ω)。作为优选方案,所述利用所述最小相位分量的频谱的模值与所述全通分量信号的频谱计算得到改进的全通分量频谱,并根据所述改进的全通分量频谱计算得到改进的相位加权函数,结合所述改进的全通分量频谱和所述改进的相位加权函数计算互功率谱,具体为:通过所述第一通道最小相位分量的频谱Y1min(ω)获得第一通道最小相位分量的频谱的模值|Y1min(ω)|,通过所述第二通道最小相位分量的频谱Y2min(ω)获得第二通道最小相位分量的频谱的模值|Y2min(ω)|;将所述第一通道最小相位分量的频谱的模值|Y1min(ω)|与所述第一通道全通分量信号的频谱Y1all(ω)相乘,得到第一通道改进全通分量信号的频谱Y1-nall(ω);其中,Y1-nall(ω)=Y1all(ω)*|Y1min(ω)|;将所述第二通道最小相位分量的频谱的模值|Y2min(ω)|与所述第二通道全通分量信号的频谱Y2all(ω)相乘,得到第二通道改进全通分量信号的频谱Y2-nall(ω);其中,Y2-nall(ω)=Y2all(ω)*|Y2min(ω)|;利用所述第一通道改进全通分量信号的频谱Y1-nall(ω)和第二通道改进全通分量信号的频谱Y2-nall(ω)计算得到所述改进的相位加权函数其中α=0.75;将所述第一通道改进全通分量信号的频谱Y1-nall(ω)和第二通道改进全通分量信号的频谱Y2-nall(ω)乘以所述改进的相位加权函数计算互功率谱G12(ω);其中,作为优选方案,所述通过快速傅里叶反变换方法求解所述互功率谱的互相关函数,并根据所述互相关函数计算得到延迟时间,具体为:通过快速傅里叶反变换方法求解所述互功率谱G12(ω)的互相关函数R12,并得到采样后的延迟时间τmax;其中,R12(τ)=IFFT(G12(ω)),τmax=argmaxτR12(τ),IFFT为快速傅里叶反变换;根据所述采样后的延迟时间τmax求解采样前的延迟时间delay12,其中,delay12=τmax*fs,fs为采样频率。相比于现有技术,本专利技术实施例的有益效果在于,本专利技术实施例提供了一种适用于声源定位的时延估计方法,包括:对通过两个传声器获得的语音信号进行信号处理,获得最小相位分量的复倒谱;根据所述最小相位分量的复倒谱计算信号最小相位分量的频谱和全通分量信号的频谱;利用所述最小相位分量的频谱的模值与所述全通分量信号的频谱计算得到改进的全通分量频谱,并根据所述改进的本文档来自技高网...

【技术保护点】
1.一种适用于声源定位的时延估计方法,其特征在于,包括:对通过两个传声器获得的语音信号进行信号处理,获得最小相位分量的复倒谱;根据所述最小相位分量的复倒谱计算信号最小相位分量的频谱和全通分量信号的频谱;利用所述最小相位分量的频谱的模值与所述全通分量信号的频谱计算得到改进的全通分量频谱,并根据所述改进的全通分量频谱计算得到改进的相位加权函数,结合所述改进的全通分量频谱和所述改进的相位加权函数计算互功率谱;通过快速傅里叶反变换方法求解所述互功率谱的互相关函数,并根据所述互相关函数计算得到延迟时间。

【技术特征摘要】
1.一种适用于声源定位的时延估计方法,其特征在于,包括:对通过两个传声器获得的语音信号进行信号处理,获得最小相位分量的复倒谱;根据所述最小相位分量的复倒谱计算信号最小相位分量的频谱和全通分量信号的频谱;利用所述最小相位分量的频谱的模值与所述全通分量信号的频谱计算得到改进的全通分量频谱,并根据所述改进的全通分量频谱计算得到改进的相位加权函数,结合所述改进的全通分量频谱和所述改进的相位加权函数计算互功率谱;通过快速傅里叶反变换方法求解所述互功率谱的互相关函数,并根据所述互相关函数计算得到延迟时间。2.如权利要求1所述的适用于声源定位的时延估计方法,其特征在于,所述利用所述最小相位分量的频谱的模值与所述全通分量信号的频谱计算得到改进的全通分量频谱,并根据所述改进的全通分量频谱计算得到改进的相位加权函数,结合所述改进的全通分量频谱和所述改进的相位加权函数计算互功率谱,具体为:利用所述最小相位分量的频谱的模值与所述全通分量信号的频谱相乘得到所述改进的全通分量频谱;根据所述改进的全通分量频谱计算得到所述改进的相位加权函数,结合所述改进的全通分量频谱和所述改进的相位加权函数计算得到所述互功率谱。3.如权利要求1或2所述的适用于声源定位的时延估计方法,其特征在于,所述对通过两个传声器获得的语音信号进行信号处理,获得最小相位分量的复倒谱,具体为:通过两个传声器分别获得第一通道语音信号和第二通道语音信号;对所述第一通道语音信号和所述第二通道语音信号进行信号处理,得到第一通道复倒谱和第二通道复倒谱;对所述第一通道复倒谱和所述第二通道复倒谱进行同态滤波处理,获得第一通道最小相位分量的复倒谱和第二通道最小相位分量的复倒谱。4.如权利要求3所述的适用于声源定位的时延估计方法,其特征在于,所述对所述第一通道语音信号和所述第二通道语音信号进行信号处理,具体为:设所述第一通道语音信号为x1(t),所述第二通道语音信号为x2(t);对经过滤波、分帧处理后的信号x1(t)和x2(t)进行语音端点检测,并选取出同一帧的语音帧,得到对应的y1(t)和y2(t);分别对y1(t)和y2(t)进行离散傅里叶变换处理,得到对应的Y1(ω)和Y2(ω);根据Y1(ω)和Y2(ω)得到所述第一通道复倒谱k1(n)和所述第二通道复倒谱k2(n);其中,k1(n)=IFFT(ln(|Y1(ω)|)),k2(n)=IFFT(ln(|Y2(ω)|)),IFFT为快速傅里叶反变换;对所述第一通道复倒谱k1(n)和所述第二通道复倒谱k2(n)进行同态滤波处理,分别获得所述第一通道最小相位分量的复倒谱k1min(n)和所述第二通道最小相位分量的复倒谱k2min(n);其中,k1min(n)=u*k1(n),k2min(n)=u*k2(n),N为傅里叶变换的点数。5.如权利要求4所述的适用于声源定位的时延估计方法,其特征在于,所述...

【专利技术属性】
技术研发人员:张承云梁龙腾
申请(专利权)人:广州大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1