通过调制解相关进行的空间音频信号增强制造技术

技术编号:16708285 阅读:62 留言:0更新日期:2017-12-02 23:38
一些方法涉及接收包括N个输入音频声道的输入音频信号,输入音频信号表示具有第一声场格式分辨率的第一声场格式,N是≥2的整数。可以将第一解相关过程应用于输入音频声道中的两个或更多个输入音频声道以产生第一组解相关的声道,第一解相关过程维持该组输入音频声道的声道间相关性。可以将第一调制过程应用于第一组解相关的声道以产生第一组解相关的且经调制的输出声道。可以将第一组解相关的且经调制的输出声道与两个或更多个未解相关的输出声道组合以产生包括O个输出音频声道的输出音频信号,O个输出音频声道表示分辨率比第一声场格式相对较高的第二声场格式,O是≥3的整数。

【技术实现步骤摘要】
【国外来华专利技术】通过调制解相关进行的空间音频信号增强相关申请的交叉引用本申请要求2015年3月3日提交的美国临时申请No.62/127,613和2016年2月23日提交的美国临时申请No.62/298,905的优先权,其中每个申请全文通过引用并入本文。
本专利技术涉及包括多个音频声道的音频信号的操控,具体地涉及用于从具有较低分辨率空间特性的输入音频信号创建具有高分辨率空间特性的音频信号的方法。
技术介绍
多声道音频信号用于为终端收听者存储或传输收听体验,收听体验可以包括非常复杂的声学场景的印象。多声道信号可以承载使用数个常见约定来描述声学场景的信息,常见约定包括但不限于以下:离散扬声器声道:音频场景可能已经被以某种方式渲染以形成扬声器声道,这些扬声器声道当在适当布置的扩音器上回放时创建期望声学场景的错觉。离散扬声器声道格式的示例包括如现今的许多声音格式中使用的立体声、5.1或7.1信号。音频对象:音频场景可以被表示为一个或多个对象音频声道,这些对象音频声道当被收听者回放装备渲染时可以重新创建声学场景。在一些情况下,每个音频对象将伴随有元数据(隐式的或显式的),该元数据被渲染器用于将对象平移(pan)到收听者回放环境中的适当定位。音频对象格式的示例包括DolbyAtmos,其被用在蓝光盘上的丰富声轨和其他运动图像递送格式的输送中。声场声道:音频场景可以用声场格式(共同包含一个或多个音频对象的一组两个或更多个音频信号)表示,其中每个对象的空间定位被以平移增益的形式编码在空间格式中。声场格式的示例包括高保真立体声(Ambisonics)和高阶高保真立体声(两者在本领域中都是众所周知的)。本公开涉及遵照各种空间格式的多声道音频信号的修改。声场格式N声道声场格式可以由其平移函数PN(φ)限定。具体地说,G=PN(φ),其中G表示增益值的[N×1]列矢量,并且φ限定对象的空间定位。因此,一组M个音频对象(o1(t),o2(t),…,oM(t))可以根据等式2被编码为N声道空间格式信号XN(t)(其中音频对象m定位于由φm限定的位置处):
技术实现思路
如本文中详细描述的,在一些实现中,一种处理音频信号的方法可以涉及接收包括Nr个输入音频声道的输入音频信号。Nr可以是≥2的整数。在一些示例中,输入音频信号可以表示具有第一声场格式分辨率的第一声场格式。该方法可以涉及将第一解相关过程应用于输入音频声道中的一组两个或更多个输入音频声道以产生第一组解相关的声道。第一解相关过程可以涉及维持该组输入音频声道的声道间相关性。该方法可以涉及将第一调制过程应用于第一组解相关的声道以产生第一组解相关的且经调制的输出声道。在一些实现中,该方法可以涉及将第一组解相关的且经调制的输出声道与两个或更多个未解相关的输出声道组合以产生包括Np个输出音频声道的输出音频信号。在一些示例中,Np可以是≥3的整数。根据一些实现,输出声道可以表示第二声场格式,该第二声场格式是分辨率比第一声场格式相对较高的声场格式。在一些示例中,未解相关的输出声道可以与输出音频信号的较低分辨率分量相对应,并且解相关的且经调制的输出声道与输出音频信号的较高分辨率分量相对应。在一些实现中,未解相关的输出声道可以通过将最小二乘格式转换器应用于Nr个输入音频声道而产生。在一些示例中,调制过程可以涉及将线性矩阵应用于第一组解相关的声道。在一些实现中,组合可以涉及将第一组解相关的且经调制的输出声道与Nr个未解相关的输出声道组合。根据一些实现,应用第一解相关过程可以涉及将相同的解相关过程应用于Nr个输入音频声道中的每个输入音频声道。在一些实现中,该方法可以涉及将第二解相关过程应用于输入音频声道中的该组两个或更多个输入音频声道以产生第二组解相关的声道。在一些示例中,第二解相关过程可以涉及维持该组输入音频声道的声道间相关性。该方法可以涉及将第二调制过程应用于第二组解相关的声道以产生第二组解相关的且经调制的输出声道。在一些实现中,组合过程可以涉及将第二组解相关的且经调制的输出声道与第一组解相关的且经调制的输出声道以及与两个或更多个未解相关的输出声道组合。根据一些实现,第一解相关过程可以涉及第一解相关函数,并且第二解相关过程可以涉及第二解相关函数。在一些情况下,第二解相关函数可以涉及应用具有大约90度或大约-90度相移的第一解相关函数。在一些示例中,第一调制可以涉及第一调制函数,并且第二调制过程可以涉及第二调制函数,第二调制函数包括具有大约90度或大约-90度相移的第一调制函数。在一些示例中,解相关、调制和组合过程可以产生输出音频信号,以使得当输出音频信号被解码并且被提供给扬声器的阵列时:a)扬声器的阵列中的能量的空间分布与将由输入音频信号经由最小二乘解码器被解码到扬声器的阵列而得到的能量的空间分布基本上相同;以及b)扬声器的阵列中的相邻扩音器之间的相关性与将由输入音频信号经由最小二乘解码器被解码到扬声器的阵列而得到的相关性基本上不同。在一些示例中,接收输入音频信号可以涉及接收来自音频引导(steering)逻辑过程的第一输出。第一输出可以包括Nr个输入音频声道。在一些这样的实现中,该方法可以涉及将输出音频信号的Np个音频声道与来自音频引导逻辑过程的第二输出组合。在一些情况下,第二输出可以包括被引导音频数据的Np个音频声道,在被引导音频数据中,一个或多个声道的增益已经基于当前的主导声音方向而被改变。本文中所描述的方法中的一些或全部方法可以由一个或多个设备根据存储在非暂时性介质上的指令(例如,软件)执行。这样的非暂时性介质可以包括存储器设备,诸如本文中所描述的那些存储器设备,包括但不限于随机存取存储器(RAM)设备、只读存储器(ROM)设备等。例如,软件可以包括用于控制用于接收输入音频信号的一个或多个设备的指令,该输入音频信号包括Nr个输入音频声道。Nr可以是≥2的整数。在一些示例中,输入音频信号可以表示具有第一声场格式分辨率的第一声场格式。软件可以包括用于将第一解相关过程应用于输入音频声道中的一组两个或更多个输入音频声道以产生第一组解相关的声道的指令。第一解相关过程可以涉及维持该组输入音频声道的声道间相关性。软件可以包括用于将第一调制过程应用于第一组解相关的声道以产生第一组解相关的且经调制的输出声道的指令。在一些实现中,软件可以包括用于将第一组解相关的且经调制的输出声道与两个或更多个未解相关的输出声道组合以产生包括Np个输出音频声道的输出音频信号的指令。在一些示例中,Np可以是≥3的整数。根据一些实现,输出声道可以表示第二声场格式,该第二声场格式是分辨率比第一声场格式相对较高的声场格式。在一些示例中,未解相关的输出声道可以与输出音频信号的较低分辨率分量相对应,并且解相关的且经调制的输出声道与输出音频信号的较高分辨率分量相对应。在一些实现中,未解相关的输出声道可以通过将最小二乘格式转换器应用于Nr个输入音频声道而产生。在一些示例中,调制过程可以涉及将线性矩阵应用于第一组解相关的声道。在一些实现中,组合可以涉及将第一组解相关的且经调制的输出声道与Nr个未解相关的输出声道组合。根据一些实现,应用第一解相关过程可以涉及将相同的解相关过程应用于Nr个输入音频声道中的每个输入音频声道。在一些实现中,软件可以包括用于将本文档来自技高网
...
通过调制解相关进行的空间音频信号增强

【技术保护点】
一种对音频信号进行处理的方法,该方法包括:接收包括Nr个输入音频声道的输入音频信号,该输入音频信号表示具有第一声场格式分辨率的第一声场格式,Nr是≥2的整数;将第一解相关过程应用于输入音频声道中的一组两个或更多个输入音频声道以产生第一组解相关的声道,第一解相关过程维持该组输入音频声道的声道间相关性;将第一调制过程应用于第一组解相关的声道以产生第一组解相关的且经调制的输出声道;以及将第一组解相关的且经调制的输出声道与两个或更多个未解相关的输出声道组合以产生包括Np个输出音频声道的输出音频信号,Np是≥3的整数,输出声道表示第二声场格式,该第二声场格式是分辨率比第一声场格式相对较高的声场格式,未解相关的输出声道与输出音频信号的较低分辨率分量相对应,并且解相关的且经调制的输出声道与输出音频信号的较高分辨率分量相对应。

【技术特征摘要】
【国外来华专利技术】2015.03.03 US 62/127,613;2016.02.23 US 62/298,9051.一种对音频信号进行处理的方法,该方法包括:接收包括Nr个输入音频声道的输入音频信号,该输入音频信号表示具有第一声场格式分辨率的第一声场格式,Nr是≥2的整数;将第一解相关过程应用于输入音频声道中的一组两个或更多个输入音频声道以产生第一组解相关的声道,第一解相关过程维持该组输入音频声道的声道间相关性;将第一调制过程应用于第一组解相关的声道以产生第一组解相关的且经调制的输出声道;以及将第一组解相关的且经调制的输出声道与两个或更多个未解相关的输出声道组合以产生包括Np个输出音频声道的输出音频信号,Np是≥3的整数,输出声道表示第二声场格式,该第二声场格式是分辨率比第一声场格式相对较高的声场格式,未解相关的输出声道与输出音频信号的较低分辨率分量相对应,并且解相关的且经调制的输出声道与输出音频信号的较高分辨率分量相对应。2.根据权利要求1所述的方法,其中,调制过程涉及将线性矩阵应用于第一组解相关的声道。3.根据权利要求1或权利要求2所述的方法,其中组合涉及将第一组解相关的且经调制的输出声道与Nr个未解相关的输出声道组合。4.根据权利要求1-3中任一项所述的方法,其中应用第一解相关过程涉及将相同的解相关过程应用于Nr个输入音频声道中的每个输入音频声道。5.根据权利要求1-4中任一项所述的方法,进一步包括:将第二解相关过程应用于输入音频声道中的所述一组两个或更多个输入音频声道以产生第二组解相关的声道,第二解相关过程维持该组输入音频声道的声道间相关性;以及将第二调制过程应用于第二组解相关的声道以产生第二组解相关的且经调制的输出声道,其中组合涉及将第二组解相关的且经调制的输出声道与第一组解相关的且经调制的输出声道以及与所述两个或更多个未解相关的输出声道组合。6.根据权利要求5所述的方法,其中第一解相关过程包括第一解相关函数,并且第二解相关过程包括第二解相关函数,第二解相关函数包括具有大约90度或大约-90度相移的第一解相关函数。7.根据权利要求5或权利要求6所述的方法,其中第一调制过程包括第一调制函数,并且第二调制过程包括第二调制函数,第二调制函数包括具有大约90度或大约-90度相移的第一调制函数。8.根据权利要求1-7中任一项所述的方法,其中解相关、调制和组合产生输出音频信号,使得当该输出音频信号被解码并且被提供给扬声器的阵列时:a)扬声器的阵列中的能量的空间分布与将由输入音频信号经由最小二乘解码器被解码到扬声器的阵列而得到的能量的空间分布基本上相同;以及b)扬声器的阵列中的相邻扩音器之间的相关性与将由输入音频信号经由最小二乘解码器被解码到扬声器的阵列而得到的相关性基本上不同。9.根据权利要求1-8中任一项所述的方法,其中未解相关的输出声道通过将最小二乘格式转换器应用于Nr个输入音频声道而产生。10.根据权利要求1-9中任一项所述的方法,其中接收输入音频信号涉及接收来自音频引导逻辑过程的第一输出,该第一输出包括Nr个输入音频声道,进一步包括将输出音频信号的Np个音频声道与来自音频引导逻辑过程的第二输出组合,该第二输出包括被引导音频数据的Np个音频声道,在该被引导音频数据中,一个或多个声道的增益已经基于当前的主导声音方向而被改变。11.一种非暂时性介质,在该非暂时性介质上存储有软件,该软件包括用于控制一个或多个设备执行以下操作的指令:接收包括Nr个输入音频声道的输入音频信号,该输入音频信号表示具有第一声场格式分辨率的第一声场格式,Nr是≥2的整数;将第一解相关过程应用于输入音频声道中的一组两个或更多个输入音频声道以产生第一组解相关的声道,第一解相关过程维持该组输入音频声道的声道间相关性;将第一调制过程应用于第一组解相关的声道以产生第一组解相关的且经调制的输出声道;以及将第一组解相关的且经调制的输出声道与两个或更多个未解相关的输出声道组合以产生包括Np个输出音频声道的输出音频信号,Np是≥3的整数,输出声道表示第二声场格式,该第二声场格式是分辨率比第一声场格式相对较高的声场格式,未解相关的输出声道与输出音频信号的较低分辨率分量相对应,并且解相关的且经调制的输出声道与输出音频信号的较高分辨率分量相对应。12.根据权利要求11所述的非暂时性介质,其中调制过程涉及将线性矩阵应用于第一组解相关的声道。13.根据权利要求11或权利要求12所述的非暂时性介质,其中组合涉及将第一组解相关的且经调制的输出声道与Nr个未解相关的输出声道组合。14.根据权利要求11-13中任一项所述的非暂时性介质,其中应用第一解相关过程涉及将相同的解相关过程应用于Nr个输入音频声道中的每个输入音频声道。15.根据权利要求11-14中任一项所述的非暂时性介质,其中软件包括用于执行以下操作的指令:将第二解相关过程应用于输入音频声道中的所述一组两个或更多个输入音频声道以产生第二组解相关的声道,第二解相关过程维持该组输入音频声道的声道间相关性;以及将第二调制过程应用于第二组解相关的声道以产生第二组...

【专利技术属性】
技术研发人员:D·S·麦克格拉斯
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1