音频对象呈现器、用于确定扬声器增益的方法以及使用平移对象扬声器增益和扩展对象扬声器增益的计算机程序技术

技术编号:34505773 阅读:14 留言:0更新日期:2022-08-13 20:48
一种音频对象呈现器(200;1200),用于基于对象位置信息(210、1210、azi、ele)和对象特征信息或扩展信息(1212)来确定扬声器增益(214、1214、1214a~c),扬声器增益描述用于将一个或多个音频对象信号(1260)包含到多个扬声器信号(1262a~1262c)中的增益,该音频对象呈现器被配置为使用音频对象的点源平移(202、1230)获得平移对象扬声器增益(202a、1232、g)。该音频对象呈现器被配置为考虑对象位置信息(210、1210、azi、ele)和对象特征信息或扩展信息(1212)来获得扩展对象扬声器增益(206a、1242、gOS)。该音频对象呈现器被配置为以始终存在平移对象扬声器增益的贡献的方式组合平移对象扬声器增益(202a、1232、g)和扩展对象扬声器增益(206a、1242、gOS),以便获得组合扬声器增益(214、1214、1214a~c)。还描述了方法和计算机程序。程序。程序。

【技术实现步骤摘要】
【国外来华专利技术】音频对象呈现器、用于确定扬声器增益的方法以及使用平移对象扬声器增益和扩展对象扬声器增益的计算机程序


[0001]根据本专利技术的实施例涉及一种音频对象呈现器。
[0002]根据本专利技术的其他实施例涉及用于确定扬声器增益的方法。
[0003]根据本专利技术的其他实施例涉及计算机程序。
[0004]根据本专利技术的实施例总体上涉及具有延伸的源大小的音频对象的平移。

技术介绍

[0005]在下文中,将描述本专利技术的一些背景。然而,应当注意,在下文中提及的特征、功能和应用也可以可选地与根据本专利技术的实施例结合使用。
[0006]在环绕声再现领域,扬声器通常被放置在房间中的一些特定位置处。常用的环绕再现系统“5.1”在前半球包含三个扬声器,并且在后半球包含两个扬声器。如果意欲在两个扬声器之间的空间内再现信号(例如,单声道音频信号),则将该信号按比例分布到这两个相邻的扬声器。该过程也适用于3D扬声器设置,其另外在水平平面上方和/或下方具有扬声器。一种熟知的平移算法是所谓的“基于向量的振幅平移”(VBAP)。在计算平移增益之后,利用对应的权重从相关扬声器再现单声道信号。
[0007]已经发现,大多数平移技术再现空间中的点状发声信号(对象)。此外,已经发现,然而经常希望改变对象的大小、使其声音更为扩散、改变感知距离或实现其他心理声学效果。因此,对象应当(或有时必须)听起来不只是点状的,而是来自更宽的再现角度。
[0008]图1示出了不同的对象扩展配置的图形表示。在上面一行中,在附图标记100、101、102处,示出了具有三个不同扩展值的对象。在下面一行中,在附图标记104和105处,对象在再现球体上非均匀地扩展。
[0009]换言之,图1描绘了与再现扬声器设置无关的不同对象扩展配置。在附图标记100处,描绘了点状发声对象。在附图标记101和102处,对象在更宽/更高的再现角度上均匀地扩展。在附图标记104处,对象竖直地扩展,而在附图标记105处,对象水平地扩展。
[0010]鉴于这种情况,需要创建一种在听觉印象与计算复杂度之间提供改进的折衷的概念。

技术实现思路

[0011]根据本专利技术的实施例创建了一种音频对象呈现器,用于基于对象位置信息和对象特征信息来确定扬声器增益,扬声器增益描述将一个或多个音频对象信号包含到多个扬声器信号中的增益。该音频对象呈现器被配置为使用音频对象的点源平移获得平移对象扬声器增益。该音频对象呈现器被配置为考虑对象特征信息(1212)来获得对象特征信息扬声器增益(例如,考虑在考虑中的一个或多个音频对象的延伸和/或感知延伸和/或感知角度延伸和/或扩散度和/或模糊的扬声器增益)。例如,对象特征信息可以描述发散度,例如源(或音频对象或源自音频对象的声音)到多个点的分布,其可以例如与源的拓广(broadening)
相对应。例如,可以根据对象特征信息放大对象或对象的感知。一般而言,例如,对象特征信息可以表示音频对象的扩展和/或范围和/或扩散度,并且对象特征信息扬声器增益可以考虑音频对象的这种扩展和/或范围和/或扩散度。备选地或附加地,对象特征信息可以例如描述音频对象的距离,并且该距离可以例如在预备步骤中被转换为扩展,其中然后可以在提供对象特征信息扬声器增益时考虑该扩展。然而,作为另一选项,对象特征信息扬声器增益也可以从距离中直接导出。
[0012]该音频对象呈现器还被配置为以始终存在平移对象扬声器增益的贡献的方式组合平移对象扬声器增益(202a、1232、g)和对象特征信息扬声器增益(206a、1242、gOS),以便获得组合扬声器增益(214、1214、1214a~c)。
[0013]根据本专利技术的该实施例基于以下发现:可以通过基于平移对象扬声器增益和扩展对象扬声器增益二者来获得对象特征信息扬声器增益(其可以对应于扩展对象扬声器增益)来获得计算复杂度与可实现的听觉印象之间的良好的折衷,对象特征信息扬声器增益描述来自与不同扬声器相关联的不同扬声器信号中的音频对象的对象信号的强度。具体地,通过使用平移对象扬声器增益(其通常提供“点源”听觉印象),可以促进用户对音频对象的定位。例如,平移对象扬声器增益的导出可以使用音频对象的点源平移,点源平移可以例如选择单个扬声器用于音频对象的回放,或者可以例如将音频对象分布到最接近音频对象的多个扬声器(例如,同时不使用不是最接近音频对象的最近扬声器的那些扬声器)。因此,音频对象的“点源”平移通常提供平移对象扬声器增益,其中仅最接近对象位置的几个扬声器的扬声器增益为非零。
[0014]此外,该音频对象呈现器还获得对象特征信息对象扬声器增益,其中对象在延伸的区域上扩展,例如在方位角的延伸范围上和/或在仰角的延伸范围上扩展。因此,对象特征信息对象扬声器增益的确定考虑音频对象的延伸,该延伸可以例如从对象特征信息中导出。与平移对象扬声器增益的确定相比,对象特征信息对象扬声器增益的确定通常使音频对象在更多数量的扬声器上扩展,因为对象特征信息对象扬声器增益的确定考虑音频对象的延伸,并且通常使用相对较广(例如,甚至比考虑中的音频对象的延伸更广)的稳定(例如,稳定地衰减)分布特性。
[0015]因此,通过组合基于音频对象的点源平移的平移对象扬声器增益和考虑音频对象的延伸的对象特征信息对象扬声器增益,可以实现音频对象的良好定位(甚至对于具有相对较大延伸的对象也是如此),并且仍然能够感知音频对象的延伸。这在存在多个使用和/或用户不位于收听布置的“甜点”的情况下尤其如此。通过始终例如独立于对象特征信息而引入平移对象扬声器增益的贡献,可以实现始终确保音频对象的定位,并且甚至对于不处于甜点位置的收听者也是可能的。
[0016]此外,应当注意,对象特征信息通常允许确定或估计音频对象的延伸。例如,对象特征信息可以指示对象的类型,其中该对象的类型可以暗示用于确定扩展对象扬声器增益的参数(例如,扩展参数)。例如,对象特征信息可以允许区别相对较小的对象和相对较大的对象。备选地或附加地,对象特征信息可以允许区别近对象和远对象,这还可以暗示用于确定扩展对象扬声器增益的一个或多个参数。可选地,对象特征信息可以描述音频对象的“斑点状”或“扩散的”延伸,或者音频对象到多个局部位置的分布。
[0017]概言之,该音频对象呈现器可以从对象特征信息中导出用于确定对象特征信息对
象扬声器增益的一个或多个参数。因此,对象特征信息允许适当地调整扩展对象扬声器增益的导出,使得对象既可以由于提供平移对象扬声器增益而被定位,又可以由于在提供对象特征信息扬声器增益时考虑了对象特征信息而以适当的延伸被感知。
[0018]在优选实施例中,该音频对象呈现器被配置为还考虑对象位置信息来获得对象特征信息扬声器增益。这样,可以考虑音频对象的延伸和位置二者。
[0019]在优选实施例中,所述对象特征信息是音频对象扩展信息。这允许特别高效的计算,因为在这种情况下不需要将“抽象的”对象特征信息映射到对象扩展信息上。
[0020]根据本专利技术的实施例创建了一种音本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种音频对象呈现器(200;1200),用于基于对象位置信息(210、1210、azi、ele)和对象特征信息(1212)来确定扬声器增益(214、1214、1214a~c),所述扬声器增益(214、1214、1214a~c)描述用于将一个或多个音频对象信号(1260)包含到多个扬声器信号(1262a~1262c)中的增益,其中,所述音频对象呈现器被配置为使用音频对象的点源平移(202、1230)获得平移对象扬声器增益(202a、1232、g);其中,所述音频对象呈现器被配置为考虑所述对象特征信息(1212)来获得对象特征信息扬声器增益(206a、1242、gOS);其中,所述音频对象呈现器被配置为以始终存在所述平移对象扬声器增益的贡献的方式组合所述平移对象扬声器增益(202a、1232、g)和所述对象特征信息扬声器增益(206a、1242、gOS),以便获得组合扬声器增益(214、1214、1214a~c)。2.根据权利要求1所述的音频对象呈现器(200;1200),其中,所述音频对象呈现器被配置为还考虑所述对象位置信息(210、1210、azi、ele)来获得对象特征信息扬声器增益(206a、1242、gOS)。3.根据权利要求1所述的音频对象呈现器(200;1200),其中,所述对象特征信息是音频对象扩展信息(212、1212)。4.根据权利要求2所述的音频对象呈现器(200;1200),其中,所述对象特征信息是音频对象扩展信息(212、1212)。5.一种音频对象呈现器(200;1200),用于基于对象位置信息(210、1210、azi、ele)和对象特征信息(1212)来确定扬声器增益(214、1214、1214a~c),所述扬声器增益(214、1214、1214a~c)描述用于将一个或多个音频对象信号(1260)包含到多个扬声器信号(1262a~1262c)中的增益,其中,所述音频对象呈现器被配置为使用音频对象的点源平移(202、1230)获得平移对象扬声器增益(202a、1232、g);其中,所述音频对象呈现器被配置为考虑所述对象位置信息(210、1210、azi、ele)和所述对象特征信息(1212)来获得扩展对象扬声器增益(206a、1242、gOS);其中,所述音频对象呈现器被配置为以始终存在所述平移对象扬声器增益的贡献的方式组合所述平移对象扬声器增益(202a、1232、g)和所述扩展对象扬声器增益(206a、1242、gOS),以便获得组合扬声器增益(214、1214、1214a~c)。6.一种音频对象呈现器(200;1200),用于基于对象位置信息(210、1210、azi、ele)和扩展信息(212、1212)来确定扬声器增益(214、1214、1214a~c),所述扬声器增益(214、1214、1214a~c)描述用于将一个或多个音频对象信号(1260)包含到多个扬声器信号(1262a~1262c)中的增益,其中,所述音频对象呈现器被配置为使用音频对象的点源平移(202、1230)获得平移对象扬声器增益(202a、1232、g);其中,所述音频对象呈现器被配置为考虑所述对象位置信息(210、1210、azi、ele)和所述扩展信息(212、1212)来获得扩展对象扬声器增益(206a、1242、gOS);其中,所述音频对象呈现器被配置为以始终存在所述平移对象扬声器增益的贡献的方式组合所述平移对象扬声器增益(202a、1232、g)和所述扩展对象扬声器增益(206a、1242、
gOS),以便获得组合扬声器增益(214、1214、1214a~c)。7.根据权利要求1至6之一所述的音频对象呈现器(200、1200),其中,所述音频对象呈现器被配置为评估一个或多个增益函数,所述一个或多个增益函数将支撑点(610a、612a~612g、614b~614f、616c~616e)的位置(204a、aziSSP、eleSSP)与对象位置(210、1210、azi、ele)之间的差异映射到一个或多个扩展增益值贡献(302a、aziGain(naz)、305a、eleGain(nel))上,并且所述音频对象呈现器被配置为基于所述一个或多个扩展增益值贡献来确定所述扩展对象扬声器增益(206a、1242、gOS)。8.根据权利要求1至7之一所述的音频对象呈现器(200、1200),其中,所述音频对象呈现器被配置为根据在第一方向上的扩展(spreadAngleAzi、spread
azi
)并根据在第二方向上的扩展(spreadAngleEle、spread
ele
)来确定扩展对象扬声器增益(206a、1242、gOS)在与平移对象扬声器增益(202a、1232、g)的组合中的权重(attenGain、g
atten
)。9.根据权利要求1至8之一所述的音频对象呈现器(200、1200),其中,所述音频对象呈现器被配置为根据在第一方向上的扩展角度(spreadAngleAzi、spread
azi
)与在第二方向上的扩展角度(spreadAngleEle、spread
ele
)的乘积来确定扩展对象扬声器增益(206a、1242、gOS)在与平移对象扬声器增益(202a、1232、g)的组合中的权重(attenGain、g
atten
)。10.根据权利要求1至9之一所述的音频对象呈现器(200、1200),其中,所述音频对象呈现器被配置为将以固定权重加权的平移对象扬声器增益(202a、1232、g)和以可变权重(attenGain、g
atten
)加权的扩展对象扬声器增益(206a、1242、gOS)相加,所述可变权重(attenGain、g
atten
)取决于在第一方向上的扩展角度(spreadAngleAzi、spread
azi
)和在第二方向上的扩展角度(spreadAngleEle、spread
ele
)。11.根据权利要求10所述的音频对象呈现器(200、1200),其中,所述音频对象呈现器被配置为对将以固定权重加权的平移对象扬声器增益(202a、1232、g)和以可变权重(attenGain、g
atten
)加权的扩展对象扬声器增益(206a、1242、gOS)相加的结果进行归一化。12.根据权利要求1至11之一所述的音频对象呈现器(200、1200),其中,所述音频对象呈现器被配置为根据下式确定扩展对象扬声器增益(206a、1242、gOS)在与平移对象扬声器增益(202a、1232、g)的组合中的权重attenGain:attenGain=0.89f*min(c1,max(spread
azi
,spread
ele
)/g
res1
)+0.11f*min(c2,min(spread
azi
,spread
ele
)/g
res2
);其中c1是预定值;其中c2是预定值;其中g
res1
是预定值;其中g
res2
是预定值;其中spread
azi
是音频对象在方位角方向上的扩展角度;其中spread
ele
是所述音频对象在仰角方向上的扩展角度;其中min(.)是最小运算符;并且其中max(.)是最大运算符。
13.根据权利要求1至12之一所述的音频对象呈现器(200、1200),其中,所述音频对象呈现器被配置为在与所述平移对象扬声器增益(202a、1232、g)相比时,随着所述音频对象的扩展角度(spreadAngleAzi、spread
azi
、spreadAngleEle、spread
ele
)增大而增大所述扩展对象扬声器增益(206a、1242、gOS)的相对贡献。14.根据权利要求1至13之一所述的音频对象呈现器(200、1200),其中,所述音频对象呈现器被配置为考虑所述对象位置信息(210、1210、azi、ele)和所述扩展信息(212、1212)并且使用支撑点位置在极坐标中的表示(204a、aziSSP、eleSSP)来获得扩展对象扬声器增益(206a、1242、gOS);并且其中,所述音频对象呈现器被配置为基于所述扩展对象扬声器增益(206a、1242、gOS)来提供所述扬声器增益(214、1214、1214a~c)。15.根据权利要求1至14之一所述的音频对象呈现器(200、1200),其中,所述音频对象呈现器被配置为:

评估所述音频对象的方位角位置(210、1210、azi)与一个或多个支撑点的方位角位置(204a、aziSSP)之间的一个或多个角度差异(diffCLKDir、diffAntiCLKDir),和/或

评估所述音频对象的仰角位置(210、1210、azi)与一个或多个支撑点的仰角位置(204a、eleSSP)之间的一个或多个角度差异(例如,diffCLKDir、diffAntiCLKDir),以便获得所述扩展扬声器增益(206a、1242、gOS)。16.根据权利要求1至15之一所述的音频对象呈现器(200、1200),其中,支撑点位置(204a、aziSSP、eleSSP)在球体半径的+/

10%或+/

20%的容差内被布置在所述球体上。17.根据权利要求1至16之一所述的音频对象呈现器(200、1200),其中,支撑点位置(204a、aziSSP、eleSSP)包括沿着具有恒定仰角和恒定半径的圆的均匀方位角间隔;和/或其中,支撑点位置(204a、aziSSP、eleSSP)包括沿着具有恒定方位角和恒定半径的圆的均匀仰角。18.根据权利要求1至17之一所述的音频对象呈现器(200、1200),其中,所述对象呈现器被配置为获得所述扩展对象扬声器增益(206a、1242、gOS),使得音频对象在以下区域上扩展:所述区域在所述音频对象位于的第一半球中延伸,并且还在方位角位置与所述第一半球相反的第二半球中延伸。19.根据权利要求18所述的音频对象呈现器(200、1200),其中,所述音频对象呈现器被配置为使用

180度与+180度之间的延伸仰角范围。20.根据权利要求18或19之一所述的音频对象呈现器(200、1200),其中,所述音频对象呈现器被配置为针对给定对象位置(210、1210、azi、ele)和给定扩展(212、1212、spreadAngleAzi、spread
azi
、spreadAngleEle、spread
ele
)计算以下项:

第一组方位角增益值(302a、aziGain),描述与支撑点位置或支撑点方位角索引(naz)相关联的多个方位角值对所述扩展增益(314a、g_spd)的贡献,所述第一组方位角增益值(302a、aziGain)与指示不越过球面坐标系的极点的原始仰角值范围中的仰角值相关联,以及

第二组方位角增益值(309a、aziGainExtd),描述与支撑点位置或支撑点方位角索引
(naz)相关联的多个方位角值对所述扩展增益(314a、g_spd)的贡献,所述第二组方位角增益值(309a、aziGainExtd)与指示越过所述球面坐标系的极点之一的延伸仰角值范围中的仰角值相关联,并且使用所述第一组方位角增益值(302a、aziGain(naz))并且使用所述第二组方位角增益值(309a、aziGainExtd)导出所述扩展增益(206a、1242、gOS)。21.根据权利要求20所述的音频对象呈现器(200、1200),其中,所述音频对象呈现器被配置为针对给定对象位置(210、1210、azi、ele)并且针对给定扩展(212、1212、spreadAngleAzi、spreadAngleEle)计算以下项:

第一组仰角增益值(305a、eleGain),描述与支撑点位置或扬声器方位角索引或支撑点仰角索引(nel)相关联的多个仰角值对所述扩展增益(314a、g_spd)的贡献,所述第一组仰角增益值(305a、eleGain)与指示不越过所述球面坐标系的极点的原始仰角值范围中的仰角值相关联,以及

第二组仰角增益值(311a、eleGainExtd),描述与支撑点位置或扬声器仰角索引或支撑点仰角索引(例如,nel)相关联的多个仰角值对所述扩展增益(314a、g_spd)的贡献,所述第二组仰角增益值(311a、eleGainExtd)与指示越过所述球面坐标系的极点之一的延伸仰角值范围中的仰角值相关联,并且使用所述第一组方位角增益值(302a、aziGain(naz))、使用所述第二组方位角增益值(309a、aziGainExtd)、使用所述第一组仰角增益值(305a、eleGain(nel))并且使用所述第二组仰角增益值(311a、eleGainExtd(nel))导出所述扩展增益(206a、1242、gOS)。22.根据权利要求18至21之一所述的音频对象呈现器(200、1200),其中,所述音频对象呈现器被配置为组合所述第一组方位角增益值和所述第一组仰角增益值的值(302a、aziGain(naz)、305a、eleGain(nel)),并且组合所述第二组方位角增益值和所述第二组仰角增益值的值(309a、aziGainExtd(naz)、311a、eleGainExtd(nel))。23.根据权利要求18至22之一所述的音频对象呈现器(200、1200),其中,所述第二组方位角增益值(309a、aziGainExtd)表示在与增益值在由所述第一组方位角增益值(302a、aziGaind)表示的方位角上的演变相比时,增益值在移位180度的方位角上的演变。24.根据权利要求18至23之一所述的音频对象呈现器(200、1200),其中,所述第一组方位角增益值(302a、aziGain)表示鉴于方位角对象位置(210、1210、azi)和方位角扩展角度(spreadAngleAzi、spread
azi
),增益值在360度的范围上的演变,其中角度准确度由扬声器的数量或者由支撑点的数量决定,和/或其中,所述第二组方位角增益值(309a、aziGainExtd)表示鉴于旋转180度的方位角对象位置(210、1210、azi)和方位角扩展角度(spreadAngleAzi、spread
azi
),增益值在360度的范围上的演变,其中角度准确度由扬声器的数量或者由支撑点的数量决定。25.根据权利要求18至24之一所述的音频对象呈现器(200、1200),其中,所述第一组仰角增益值(305a、eleGain)表示鉴于仰角对象位置(210、1210、ele)和仰角扩展角度(spreadAngleEle、spread
ele
),增益值在

90度与+90度之间的仰角范围上的演变,和/或其中,所述第二组仰角增益值(311a、eleGainExtd)表示鉴于仰角对象位置(210、1210、
ele)和仰角扩展角度(spreadAngleEle、spread
ele
),增益值在

180度至

90度之间和+90度与+180度之间的仰角范围上的演变。26.根据权利要求1至25之一所述的音频对象呈现器,其中,所述对象呈现器被配置为考虑所述对...

【专利技术属性】
技术研发人员:阿莱克萨德
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1