对头部相关冲激响应进行建模制造技术

技术编号:33627992 阅读:13 留言:0更新日期:2022-06-02 01:18
一种用于声音信号滤波的方法(1900)。所述方法包括:生成(s1902)用于由仰角角度θ和方位角角度指定的特定位置的滤波器对,所述滤波器对由右滤波器和左滤波器构成;使用所述右滤波器对声音信号滤波(s1904);以及使用所述左滤波器对所述声音信号滤波(s1906)。生成所述滤波器对包括:i)至少获得在所述仰角角度处的第一仰角基函数值集合;ii)至少获得在所述方位角角度处的第一方位角基函数值集合;iii)使用以下生成所述右滤波器:a)至少所述第一仰角基函数值集合,b)至少所述第一方位角基函数值集合,以及c)右滤波器模型参数;以及iv)使用以下生成所述左滤波器:a)至少所述第一仰角基函数值集合,b)至少所述第一方位角基函数值集合,以及c)左滤波器模型参数。c)左滤波器模型参数。c)左滤波器模型参数。

【技术实现步骤摘要】
【国外来华专利技术】对头部相关冲激响应进行建模


[0001]本公开涉及渲染空间声音。

技术介绍

[0002]我们有捕获朝着我们传播的声波的两只耳朵。图1示出了从由球坐标系中的仰角角度和方位角角度对指定的到达方向(DOA)朝着收听者传播的声波。在朝着我们的传播路径上,在到达我们的左耳鼓和右耳鼓之前,每个声波与我们的上躯干、头部、外耳和环境介质相互作用。这个相互作用导致到达左耳鼓和右耳鼓的波形的时间改变和频谱改变,其中的一些改变是DOA相关的。我们的听觉系统已经学会解释这些改变,以推断声波本身的各种空间特性以及收听者发现他自身/她自身所处的声音环境。这个能力称为空间听觉,其涉及我们如何评估嵌入在双耳信号(即右耳道和左耳道中的声音信号)中的空间线索,以推断由声音事件(物理声源)引发的听觉事件的位置和由我们所处的物理环境(例如,小房间、贴砖的浴室、礼堂、洞穴)导致的声音特性。人类的这个能力(空间听觉)进而可以被开发用于通过在双耳信号中重新引入将导致对声音的空间感知的空间线索来创建空间声音场景。
[0003]主空间线索包括:1)角度相关的线索:双耳线索(即耳间电平差(ILD)和耳间时差(ITD))和单耳(或频谱)线索;2)距离相关的线索:强度以及直接

混响(D/R)能量比。图2示出了朝着收听者传播的声波的ITD和频谱线索的示例。这两个图示出了在0度仰角和40度方位角处获得的HR滤波器对的幅度响应(所述数据来自CIPIC数据库:对象ID 28。所述数据库是公开可用的,其可以通过URLwww.ece.ucdavis.edu/cipic/spatial

sound/hrtf

data/访问)。在图1和图2中,使用正方位角方向向右的惯例,并且这也是在本文的其余部分中使用的惯例。然而,一些HR滤波器集合的确使用另一惯例(其中的正方位角方向向左)。波形的短时间的DOA相关的时间和频谱改变(1

5毫秒)的数学表示是所谓的头部相关(HR)滤波器。这些滤波器的频域(FD)表示是所谓的头部相关传递函数(HRTF)并且时域(TD)表示是头部相关冲激响应(HRIR)。已经逐渐建立了基于HR滤波器的双耳渲染方法,其中,通过直接利用希望位置的HR滤波器对对声源信号滤波而生成空间声音场景。这个方法对于许多新兴应用特别有吸引力,例如虚拟现实(VR)、增强现实(AR)、混合现实(MR)或扩展现实(XR)、以及移动通信系统,其中通常都使用耳机。
[0004]通常根据作为线性动态系统的冲激响应的测量结果来估计头部相关的(HR)滤波器,该线性动态系统将原始声音信号(输入信号)转换成可以在收听对象的耳道内测量到的左耳信号和右耳信号(输出信号),其中该收听对象在距该收听对象(例如,人造头部、人体模型或人体)恒定半径的球表面上的预定义仰角角度和方位角角度集合处。已估计的HR滤波器通常设置为FIR滤波器并且可以在该格式下直接使用。为了实现高效的双耳渲染,HRTF对可以转换成耳间传递函数(ITF)或经修改的ITF以防止陡峭的频谱峰。备选地,HRTF可以通过参数表示进行描述。这些参数化的HRTF易于与参数多通道声音编码器(例如MPEG环绕声和空间声音对象编码(SAOC))集成。
[0005]渲染空间声音信号以提供针对空间中任意位置的声音的令人信服的空间感知需
要针对对应位置的HR滤波器对,因此需要针对在2D球体上的精细采样位置的HR滤波器集合。最小可听角度(MAA)将我们的听觉系统的灵敏度表征为声音事件的角位移。关于方位角的位置,所报告的是,对于宽带噪声突发,MAA在前向和后向上最小(约1度)并且对于侧向声源要大得多(约10度)。正中面中的MAA随仰角增大。所报告的是,对于宽带噪声突发,仰角上的平均MAA与4度一样小。当前,存在一些公开可用的在空间上密集采样的HR滤波器数据库,例如SADIE数据库、CIPIC数据库。然而,特别是在仰角的样本上,它们都不能完全满足MAA要求。即使人造头部Neumann(纽曼)KU100和KEMAR人体模型的SAIDE数据集包含多于8000个测量结果,但是其在

15度与15度之间的仰角上的采样分辨率是15度,而根据MAA研究则需要4度。不可避免的是,需要HR滤波器的角度插值,从而可以在没有经测量的实际滤波器的位置渲染声源。图3示出了在2D球体上对网格进行采样的示例,其中的各个点指示对HR滤波器进行测量的位置。
[0006]已经针对HR滤波器的角度插值开发了多个不同的插值方案。通常,根据在球上处的测量结果估计M个HR滤波器对其中,r表示右耳,l表示左耳,表示仰角,表示方位角。任务是找到函数其中其中其在未经采样的角度处提供传递具有良好感知准确度的声音渲染的左滤波器和右滤波器。一旦获得就可以在由指定的任何任意位置生成左耳和右耳HR滤波器。要注意,为了简单而不造成混淆有时省略了上标l或r。
[0007]用于HRTF角度插值的两个主要的方法如下:
[0008](1)本地邻居法:通常采用的方法是线性插值,其中,通过在其周围最近位置测量的HRTF的贡献进行加权而推断缺失的HRTF。在插值之前可以对HRTF进行预处理,例如首先将在两个或更多个最近位置测量的HRTF转换成最小相位,然后应用线性插值。
[0009](2)变化的方法:更复杂的数据驱动的方法是将已测量的HRTF线性变换到由基函数集合定义的另一个空间,其中,基函数的一个集合覆盖仰角角度维度和方位角角度维度并且另一个集合覆盖频率维度。可以通过对已测量的HRTF的协方差矩阵进行特征分解来获得基函数[1,2]。在[3]中,已经将完备并且在2D球体上正交的球谐函数(SH)用于覆盖仰角角度维度和方位角角度维度,并且已经将复指数函数用于覆盖频率维度。基于SH的HRTF模型在模型的平均均方误差(MSE)和感知响度稳定性方面产生了令人鼓舞的性能水平[4]。

技术实现思路

[0010]准确和高效地渲染空间位置的声源的能力是基于HR滤波器的空间声音渲染器的主要特征之一。渲染器中使用的HR滤波器集合的空间分辨率确定经渲染的声源的空间分辨率。使用在2D球体上进行粗采样的HR滤波器集合,VR/AR/MR/XR用户经常报告移动声音的空间不连续性。这些空间不连续性导致音频视频同步误差,其明显地降低了沉浸感。使用在球体上经精细采样的HR滤波器集合是一个解决方案。然而,根据在满足MAA要求的精细网格上的输入

输出测量结果估计HR滤波器集合可能非常耗时并且对于对象和实验人员两者而言很枯燥。备选地,更高效的是在给定经稀疏采样的HR滤波器数据集时推断与缺失的HR滤波器有关的空间相关信息。
[0011]最近邻HR滤波器插值法假设在每个采样位置HR滤波器仅最多影响某个有限距离的区域。然后将未采样位置的HR滤波器近似为在某个截止距离之内位置的HR滤波器的加权平均,或基于直线2D网格上的指定数量的最近点对未采样位置的HR滤波器进行近似,例如,其中,是在未采样位置处估计的HR滤波器向量,并且并且这个方法本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于声音信号滤波的方法(1900),所述方法包括:生成(s1902)用于由仰角角度和方位角角度指定的特定位置的滤波器对,所述滤波器对由右滤波器和左滤波器构成;使用所述右滤波器对声音信号滤波(s1904);以及使用所述左滤波器对所述声音信号滤波(s1906),其中,生成所述滤波器对包括:i)在所述仰角角度处至少获得第一仰角基函数值集合;ii)在所述方位角角度处至少获得第一方位角基函数值集合;iii)使用以下生成所述右滤波器:a)至少所述第一仰角基函数值集合,b)至少所述第一方位角基函数值集合,以及c)右滤波器模型参数;以及iv)使用以下生成所述左滤波器:a)至少所述第一仰角基函数值集合,b)至少所述第一方位角基函数值集合,以及c)左滤波器模型参数。2.根据权利要求1所述的方法,其中,获得所述第一方位角基函数值集合包括:获得方位角基函数值的P个集合,其中所述方位角基函数值的P个集合包括所述第一方位角基函数值集合。3.根据权利要求1所述的方法,其中,生成所述右滤波器包括以下计算:以及生成所述左滤波器包括以下计算:其中(p=1至P、q=1至Q
p
、以及k=1至K)是右模型参数集合,(p=1至P、q=1至Q
p
、以及k=1至K)是左模型参数集合,(p=1至P)定义在所述仰角角度处的所述第一仰角基函数值集合,并且(p=1至P、以及q=1至Q
p
)定义在所述方位角角度处的所述方位角基函数值的P个集合,并且e
k
(k=1至K)是长度为N的标准正交基向量集合。4.根据权利要求1所述的方法,其中,获得所述第一仰角基函数值集合包括:获得仰角基函数值的Q个集合,其中,所述仰角基函数值的Q个集合包括所述第一仰角基函数值集合。5.根据权利要求1所述的方法,其中,生成所述右滤波器包括以下计算:以及生成所述左滤波器包括以下计算:其中
(p=1至P
q
、q=1至Q、以及k=1至K)是右模型参数集合,(p=1至P
q
、q=1至Q、以及k=1至K)是左模型参数集合,(q=1至Q、以及p=1至P
q
)定义在所述仰角角度处的所述仰角基函数值的Q个集合,并且(q=1至Q)定义在所述方位角角度处的所述第一方位角基函数值集合,并且e
k
(k=1至K)是长度为N的标准正交基向量集合。6.根据权利要求1至5中任一项所述的方法,其中,每个所述仰角基函数值取决于所述方位角角度,和/或每个所述方位角基函数值取决于所述仰角角度。7.根据权利要求1至5中任一项所述的方法,其中,获得所述第一仰角基函数值集合包括:针对第一仰角基函数集合中包括的每个仰角基函数,在所述仰角角度处评估该仰角基函数,以产生与所述仰角角度和该仰角基函数相对应的仰角基函数值,并且获得所述第一方位角基函数值集合包括:针对第一方位角基函数集合中包括的每个方位角基函数,在所述方位角角度处评估该方位角基函数,以产生与所述方位角角度和该方位角基函数相对应的方位角基函数值。8.根据权利要求7所述的方法,其中,所述第一仰角基函数集合中包括的每个仰角基函数是B样条基函数,并且所述第一方位角基函数集合中包括的每个方位角基函数是周期性B样条基函数。9.根据权利要求7或8所述的方法,还包括:获得至少表示所述第一仰角基函数集合的模型,其中,所述模型包括:序列(θ),其中,θ=(θ1,

,θ
U
)指定子区间)指定子区间所述仰角基函数是所述子区间上的多项式,以及模型参数的三维数组模型参数的三维数组10.根据权利要求9所述的方法,其中,所述第一仰角基函数集合包括第p仰角基函数,在所述仰角角度处评估所述第一仰角基函数集合中包括的每个仰角基函数包括:在所述仰角角度处评估所述第p仰角基函数,并且在所述仰角角度处评估所述第p仰角基函数包括以下步骤:找到满足的索引u;以及根据评估所述第p仰角基函数在该仰角角度处的值。11.根据权利要求7或8所述的方法,还...

【专利技术属性】
技术研发人员:厄兰多
申请(专利权)人:瑞典爱立信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1