空间音频参数信令制造技术

技术编号:27695711 阅读:29 留言:0更新日期:2021-03-17 05:19
一种装置,包括用于执行以下操作的部件:对于两个或更多个扬声器通道音频信号(102),确定用于提供空间音频再现的至少一个空间音频参数(108,310);在两个或更多个扬声器通道音频信号(102)之间确定至少一个音频信号关系参数(112),该至少一个音频信号关系参数(112)与至少一个相干性参数(112)相关联,由此使得至少一个相干性参数(112)提供针对至少两个频带提供两个或更多个扬声器通道音频信号(102)之间的至少一个通道间相干性信息,以便基于至少一个空间音频参数(108,310)和至少一个音频信号关系参数(112)来再现两个或更多个扬声器通道音频信号(102);以及发送至少一个空间音频参数(108,310),并使用至少一个确定值来发送与至少一个通道间相干性信息相关联的至少一个信息(112)。

【技术实现步骤摘要】
【国外来华专利技术】空间音频参数信令
本申请涉及用于空间音频参数信令的装置和方法,但并不排他地涉及用于空间相干性以及定向和球扇形参数的信令。
技术介绍
参数空间音频处理是音频信号处理的一个领域,其中使用一组参数来描述声音的空间方面。例如,在从麦克风阵列进行参数化空间音频捕获时,从麦克风阵列信号估计一组参数是一种典型且有效的选择,该组参数诸如是频带中声音的方向、以及频带中被捕获声音的定向与非定向部分的比率。众所周知,这些参数很好地描述了在麦克风阵列的位置处的被捕获声音的感知空间特性。这些参数可以相应地在空间声音的合成中使用,以用于双耳式耳机、扬声器、或诸如全景环绕声(Ambisonics)之类的其他格式。因此,频带中的方向和直接总能量比(directionanddirect-to-totalenergyratio)是对空间音频捕获特别有效的参数化。包括频带中的方向参数和频带中的能量比参数(指示声音的定向性)的参数集也可以被用作用于音频编解码器的空间元数据。例如,这些参数可以从麦克风阵列捕获的音频信号以及其他输入格式来估计,并且例如可以从麦克风阵列信号生成立体声信号以与空间元数据一起传送。立体声信号例如可以用EVS(在双-单声道配置中)或AAC编码器来进行编码。对应的解码器可以将音频信号解码成PCM信号,并(使用空间元数据)处理频带中的声音以获得空间输出,例如,双耳输出。前述的解决方案尤其适用于编码来自麦克风阵列(例如,在移动电话、VR相机、独立麦克风阵列中)的被捕获空间声音。可期望这种编码器能够对元数据参数进行编码以更准确地传送输入音频信号的相关方面。
技术实现思路
根据第一方面,提供了一种装置,包括用于执行以下操作的部件:对于两个或更多个扬声器通道音频信号,确定用于提供空间音频再现的至少一个空间音频参数;在两个或更多个扬声器通道音频信号之间确定至少一个音频信号关系参数,该至少一个音频信号关系参数与至少一个相干性参数相关联,由此使得至少一个相干性参数针对至少两个频带提供两个或更多个扬声器通道音频信号之间的至少一个通道间相干性信息,以便基于至少一个空间音频参数和至少一个音频信号关系参数来再现两个或更多个扬声器通道音频信号;以及发送至少一个空间音频参数,并使用至少一个确定值来发送与至少一个通道间相干性信息相关联的至少一个信息。用于发送的部件还用于发送至少一个音频信号关系参数,用于使用至少一个确定值来发送与至少一个通道间相干性信息相关联的至少一个信息的部件可以用于发送以下中的至少一个:至少一个相干性参数的至少一个定向;至少一个相干性参数的至少一个宽度;以及至少一个相干性参数的至少一个范围。至少一个确定值可以包括以下中的至少一个:至少一个定向码;至少一个宽度码;以及至少一个范围码。用于对于两个或更多个扬声器通道音频信号,确定用于提供空间音频再现的至少一个空间音频参数的部件可以用于针对两个或更多个扬声器通道音频信号,确定至少一个方向参数和/或至少一个能量比。所述部件还可以用于从两个或更多个扬声器通道音频信号确定传输音频信号,其中,该两个或更多个扬声器通道音频信号可以是基于至少一个空间音频参数、至少一个相干性参数、和/或传输音频信号来再现的。用于在两个或更多个扬声器通道音频信号之间确定至少一个相干性参数的部件可以用于确定扩展相干性参数,其中,该扩展相干性参数可以是基于在空间上与所识别的扬声器通道音频信号相邻的两个或更多个扬声器通道音频信号之间的通道间相干性信息来确定的,所识别的扬声器通道音频信号是基于至少一个空间音频参数来识别的。用于确定扩展相干性参数的部件还可以用于:确定立体度参数,该立体度参数与指示两个或更多个扬声器通道音频信号被使用在空间上与所识别的扬声器通道音频信号相邻的两个扬声器通道音频信号来相干地再现相关联,所识别的扬声器通道音频信号是在空间上最接近至少一个方向参数的扬声器通道音频信号;确定相干平移参数,该相干平移参数与指示两个或更多个扬声器通道音频信号被使用在空间上与所识别的扬声器通道音频信号相邻的至少两个或更多个扬声器通道音频信号来相干地再现相关联;以及基于立体度参数和相干平移参数,生成扩展相干性参数。用于基于立体度参数和相干平移参数来生成扩展相干性参数的部件还可以用于:确定主方向分析,以识别最接近至少一个方向参数的扬声器;从所识别的扬声器的方向进行搜索,并且每个搜索的区域包括按一系列角度步长从0度到180度的角度;估计所定义的主扬声器通道与搜索区域内的任一扬声器通道之间的平均相干性值;基于平均相干性值,确定基本恒定的相干区域;将扩展范围设置为最大相干区域的两倍;以及基于扩展范围,定义相干平移参数。用于基于最大相干区域来定义相干平移参数的部件可以用于:确定最接近所述至少一个方向参数的扬声器;确定最接近至少一个方向参数的扬声器;确定该扬声器与在最大相干区域内的所有扬声器之间的归一化相干性ca,i;忽略能量低于阈值能量的扬声器;从剩余的扬声器中选择最小相干性;基于在剩余扬声器之间的能量分布,确定能量分布参数;将能量分布参数与最大相干区域相乘,以确定相干平移参数。用于确定立体度参数的部件还可以用于:确定主方向分析,以识别最接近至少一个方向参数的扬声器;从所识别的扬声器的方向进行搜索,并且每个搜索的环由按一系列角度步长从0度到180度的角度定义;估计位于搜索环附近的所有扬声器的平均相干性值和平均能量值;基于平均相干性值和平均能量值,确定最大相干环角度;将扩展范围设置为最大相干环角度的两倍;以及基于扩展范围,定义立体度参数。用于基于扩展范围来定义立体度参数的部件可以用于:识别在最大相干环上具有最大能量的扬声器;确定所识别的扬声器与在最大相干环上的其他扬声器之间的归一化相干性;确定被相应的能量加权的归一化相干性的平均值;确定最大相干环上的能量与最大相干环内的能量的能量比率;以及将能量比率与归一化相干性的平均值相乘,以形成立体度参数。根据第二方面,提供了一种用于空间音频信号处理的方法,包括:对于两个或更多个扬声器通道音频信号,确定用于提供空间音频再现的至少一个空间音频参数;在两个或更多个扬声器通道音频信号之间确定至少一个音频信号关系参数,该至少一个音频信号关系参数与至少一个相干性参数相关联,由此使得至少一个相干性参数针对至少两个频带提供两个或更多个扬声器通道音频信号之间的至少一个通道间相干性信息,以便基于至少一个空间音频参数和至少一个音频信号关系参数来再现两个或更多个扬声器通道音频信号;以及发送至少一个空间音频参数,并使用至少一个确定值来发送与至少一个通道间相干性信息相关联的至少一个信息。使用至少一个确定值来发送与至少一个通道间相干性信息相关联的至少一个信息可以包括发送以下中的至少一个:至少一个相干性参数的至少一个定向;至少一个相干性参数的至少一个宽度;以及至少一个相干性参数的至少一个范围。至少一个确定值可以包括以下中的至少一个:至少一个定向码;至少一个宽度码;以及至少一个范围码。对于两个或更多个扬声器通道音频信号,确定用于提本文档来自技高网
...

【技术保护点】
1.一种装置,包括用于执行以下操作的部件:/n对于两个或更多个扬声器通道音频信号,确定用于提供空间音频再现的至少一个空间音频参数;/n在所述两个或更多个扬声器通道音频信号之间确定至少一个音频信号关系参数,所述至少一个音频信号关系参数与至少一个相干性参数相关联,由此使得所述至少一个相干性参数针对至少两个频带提供所述两个或更多个扬声器通道音频信号之间的至少一个通道间相干性信息,以便基于所述至少一个空间音频参数和所述至少一个音频信号关系参数来再现所述两个或更多个扬声器通道音频信号;以及/n发送所述至少一个空间音频参数,并使用至少一个确定值来发送与所述至少一个通道间相干性信息相关联的至少一个信息。/n

【技术特征摘要】
【国外来华专利技术】20180531 GB 1808930.01.一种装置,包括用于执行以下操作的部件:
对于两个或更多个扬声器通道音频信号,确定用于提供空间音频再现的至少一个空间音频参数;
在所述两个或更多个扬声器通道音频信号之间确定至少一个音频信号关系参数,所述至少一个音频信号关系参数与至少一个相干性参数相关联,由此使得所述至少一个相干性参数针对至少两个频带提供所述两个或更多个扬声器通道音频信号之间的至少一个通道间相干性信息,以便基于所述至少一个空间音频参数和所述至少一个音频信号关系参数来再现所述两个或更多个扬声器通道音频信号;以及
发送所述至少一个空间音频参数,并使用至少一个确定值来发送与所述至少一个通道间相干性信息相关联的至少一个信息。


2.根据权利要求1所述的装置,其中,用于发送的部件还用于发送所述至少一个音频信号关系参数,用于使用所述至少一个确定值来发送与所述至少一个通道间相干性信息相关联的所述至少一个信息的部件用于发送以下中的至少一个:
所述至少一个相干性参数的至少一个定向;
所述至少一个相干性参数的至少一个宽度;以及
所述至少一个相干性参数的至少一个范围。


3.根据权利要求2所述的装置,其中,所述至少一个确定值包括以下中的至少一个:
至少一个定向码;
至少一个宽度码;以及
至少一个范围码。


4.根据权利要求1至3中任一项所述的装置,其中,用于确定所述至少一个空间音频参数的部件用于针对所述两个或更多个扬声器通道音频信号,确定至少一个方向参数和/或至少一个能量比。


5.根据权利要求1至4中任一项所述的装置,其中,所述部件还用于从所述两个或更多个扬声器通道音频信号确定传输音频信号,其中,所述两个或更多个扬声器通道音频信号是基于所述至少一个空间音频参数、所述至少一个相干性参数、和/或所述传输音频信号来再现的。


6.根据权利要求1至4中任一项所述的装置,其中,用于确定所述至少一个相干性参数的部件用于确定扩展相干性参数,其中,所述扩展相干性参数是基于在空间上与所识别的扬声器通道音频信号相邻的两个或更多个扬声器通道音频信号之间的通道间相干性信息来确定的,所识别的扬声器通道音频信号是基于所述至少一个空间音频参数来识别的。


7.根据在从属于权利要求4时的权利要求6所述的装置,其中,用于确定所述扩展相干性参数的部件还用于:
确定立体度参数,所述立体度参数与指示所述两个或更多个扬声器通道音频信号被使用在空间上与所识别的扬声器通道音频信号相邻的两个扬声器通道音频信号来相干地再现相关联,所识别的扬声器通道音频信号是在空间上最接近所述至少一个方向参数的扬声器通道音频信号;
确定相干平移参数,所述相干平移参数与指示所述两个或更多个扬声器通道音频信号被使用在空间上与所识别的扬声器通道音频信号相邻的至少两个或更多个扬声器通道音频信号来相干地再现相关联;以及
基于所述立体度参数和所述相干平移参数,生成所述扩展相干性参数。


8.根据权利要求7所述的装置,其中,用于基于所述立体度参数和所述相干平移参数来生成所述扩展相干性参数的部件还用于:
确定主方向分析,以识别最接近所述至少一个方向参数的扬声器;
从所识别的扬声器的方向进行搜索,并且每个搜索的区域包括按一系列角度步长从0度到180度的角度;
估计所定义的主扬声器通道与所述搜索区域内的任一扬声器通道之间的平均相干性值;
基于所述平均相干性值,确定基本恒定的相干区域;
将扩展范围设置为最大相干区域的两倍;以及
基于所述扩展范围,定义所述相干平移参数。


9.根据权利要求8所述的装置,其中,用于基于所述最大相干区域来定义所述相干平移参数的部件用于:
确定最接近所述至少一个方向参数的扬声器;
确定所述扬声器与在所述最大相干区域内的所有扬声器之间的归一化相干性;
忽略能量低于阈值能量的扬声器;
从剩余的扬声器中选择最小相干性;
基于在所述剩余扬声器之间的能量分布,确定能量分布参数;
将所述能量分布参数与所述最大相干区域相乘,以确定所述相干平移参数。


10.根据权利要求6或7所述的装置,其中,用于确定所述立体度参数的部件还用于:
确定主方向分析,以识别最接近所述至少一个方向参数的扬声器;
从所识别的扬声器的方向进行搜索,并且每个搜索的环由按一系列角度步长从0度到180度的角度定义;
估计位于所述搜索环附近的所有扬声器的平均相干性值和平均能量值;
基于所述平均相干性值和所述平均能量值,确定最大相干环角度;
将扩展范围设置为所述最大相干环角度的两倍;以及
基于所述扩展范围,定义所述立体度参数。


11.根据权利要求10所述的装置,其中,用于基于所述扩展范围来定义所述立体度参数的部件用于:
识别在所述最大相干环上具有最大能量的扬声器;
确定所识别的扬声器与在所述最大相干环上的其他扬声器之间的归一化相干性;
确定被相应的能量加权的归一化相干性的...

【专利技术属性】
技术研发人员:MV·莱蒂南L·拉克索南J·维尔卡莫T·皮赫拉亚库亚
申请(专利权)人:诺基亚技术有限公司
类型:发明
国别省市:芬兰;FI

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1