通过调制解相关进行的空间音频信号增强制造技术

技术编号：16708285 阅读：62 留言：0更新日期：2017-12-02 23:38

一些方法涉及接收包括N个输入音频声道的输入音频信号，输入音频信号表示具有第一声场格式分辨率的第一声场格式，N是≥2的整数。可以将第一解相关过程应用于输入音频声道中的两个或更多个输入音频声道以产生第一组解相关的声道，第一解相关过程维持该组输入音频声道的声道间相关性。可以将第一调制过程应用于第一组解相关的声道以产生第一组解相关的且经调制的输出声道。可以将第一组解相关的且经调制的输出声道与两个或更多个未解相关的输出声道组合以产生包括O个输出音频声道的输出音频信号，O个输出音频声道表示分辨率比第一声场格式相对较高的第二声场格式，O是≥3的整数。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】通过调制解相关进行的空间音频信号增强相关申请的交叉引用本申请要求2015年3月3日提交的美国临时申请No.62/127,613和2016年2月23日提交的美国临时申请No.62/298,905的优先权，其中每个申请全文通过引用并入本文。
本专利技术涉及包括多个音频声道的音频信号的操控，具体地涉及用于从具有较低分辨率空间特性的输入音频信号创建具有高分辨率空间特性的音频信号的方法。
技术介绍
多声道音频信号用于为终端收听者存储或传输收听体验，收听体验可以包括非常复杂的声学场景的印象。多声道信号可以承载使用数个常见约定来描述声学场景的信息，常见约定包括但不限于以下：离散扬声器声道：音频场景可能已经被以某种方式渲染以形成扬声器声道，这些扬声器声道当在适当布置的扩音器上回放时创建期望声学场景的错觉。离散扬声器声道格式的示例包括如现今的许多声音格式中使用的立体声、5.1或7.1信号。音频对象：音频场景可以被表示为一个或多个对象音频声道，这些对象音频声道当被收听者回放装备渲染时可以重新创建声学场景。在一些情况下，每个音频对象将伴随有元数据(隐式的或显式的)，该元数据被渲染器用于将对象平移(pan)到收听者回放环境中的适当定位。音频对象格式的示例包括DolbyAtmos，其被用在蓝光盘上的丰富声轨和其他运动图像递送格式的输送中。声场声道：音频场景可以用声场格式(共同包含一个或多个音频对象的一组两个或更多个音频信号)表示，其中每个对象的空间定位被以平移增益的形式编码在空间格式中。声场格式的示例包括高保真立体声(Ambisonics)和高阶高保真立体声(两者在本领域中都是众所...
通过调制解相关进行的空间音频信号增强

【技术保护点】
一种对音频信号进行处理的方法，该方法包括：接收包括Nr个输入音频声道的输入音频信号，该输入音频信号表示具有第一声场格式分辨率的第一声场格式，Nr是≥2的整数；将第一解相关过程应用于输入音频声道中的一组两个或更多个输入音频声道以产生第一组解相关的声道，第一解相关过程维持该组输入音频声道的声道间相关性；将第一调制过程应用于第一组解相关的声道以产生第一组解相关的且经调制的输出声道；以及将第一组解相关的且经调制的输出声道与两个或更多个未解相关的输出声道组合以产生包括Np个输出音频声道的输出音频信号，Np是≥3的整数，输出声道表示第二声场格式，该第二声场格式是分辨率比第一声场格式相对较高的声场格式，未解相关的输出声道与输出音频信号的较低分辨率分量相对应，并且解相关的且经调制的输出声道与输出音频信号的较高分辨率分量相对应。

【技术特征摘要】
【国外来华专利技术】2015.03.03 US 62/127,613;2016.02.23 US 62/298,9051.一种对音频信号进行处理的方法，该方法包括：接收包括Nr个输入音频声道的输入音频信号，该输入音频信号表示具有第一声场格式分辨率的第一声场格式，Nr是≥2的整数；将第一解相关过程应用于输入音频声道中的一组两个或更多个输入音频声道以产生第一组解相关的声道，第一解相关过程维持该组输入音频声道的声道间相关性；将第一调制过程应用于第一组解相关的声道以产生第一组解相关的且经调制的输出声道；以及将第一组解相关的且经调制的输出声道与两个或更多个未解相关的输出声道组合以产生包括Np个输出音频声道的输出音频信号，Np是≥3的整数，输出声道表示第二声场格式，该第二声场格式是分辨率比第一声场格式相对较高的声场格式，未解相关的输出声道与输出音频信号的较低分辨率分量相对应，并且解相关的且经调制的输出声道与输出音频信号的较高分辨率分量相对应。2.根据权利要求1所述的方法，其中，调制过程涉及将线性矩阵应用于第一组解相关的声道。3.根据权利要求1或权利要求2所述的方法，其中组合涉及将第一组解相关的且经调制的输出声道与Nr个未解相关的输出声道组合。4.根据权利要求1-3中任一项所述的方法，其中应用第一解相关过程涉及将相同的解相关过程应用于Nr个输入音频声道中的每个输入音频声道。5.根据权利要求1-4中任一项所述的方法，进一步包括：将第二解相关过程应用于输入音频声道中的所述一组两个或更多个输入音频声道以产生第二组解相关的声道，第二解相关过程维持该组输入音频声道的声道间相关性；以及将第二调制过程应用于第二组解相关的声道以产生第二组解相关的且经调制的输出声道，其中组合涉及将第二组解相关的且经调制的输出声道与第一组解相关的且经调制的输出声道以及与所述两个或更多个未解相关的输出声道组合。6.根据权利要求5所述的方法，其中第一解相关过程包括第一解相关函数，并且第二解相关过程包括第二解相关函数，第二解相关函数包括具有大约90度或大约-90度相移的第一解相关函数。7.根据权利要求5或权利要求6所述的方法，其中第一调制过程包括第一调制函数，并且第二调制过程包括第二调制函数，第二调制函数包括具有大约90度或大约-90度相移的第一调制函数。8.根据权利要求1-7中任一项所述的方法，其中解相关、调制和组合产生输出音频信号，使得当该输出音频信号被解码并且被提供给扬声器的阵列时：a)扬声器的阵列中的能量的空间分布与将由输入音频信号经由最小二乘解码器被解码到扬声器的阵列而得到的能量的空间分布基本上相同；以及b)扬声器的阵列中的相邻扩音器之间的相关性与将由输入音频信号经由最小二乘解码器被解码到扬声器的阵列而得到的相关性基本上不同。9.根据权利要求1-8中任一项所述的方法，其中未解相关的输出声道通过将最小二乘格式转换器应用于Nr个输入音频声道而产生。10.根据权利要求1-9中任一项所述的方法，其中接收输入音频信号涉及接收来自音频引导逻辑过程的第一输出，该第一输出包括Nr个输入音频声道，进一步包括将输出音频信号的Np个音频声道与来自音频引导逻辑过程的第二输出组合，该第二输出包括被引导音频数据的Np个音频声道，在该被引导音频数据中，一个或多个声道的增益已经基于当前的主导声音方向而被改变。11.一种非暂时性介质，在该非暂时性介质上存储有软件，该软件包括用于控制一个或多个设备执行以下操作的指令：接收包括Nr个输入音频声道的输入音频信号，该输入音频信号表示具有第一声场格式分辨率的第一声场格式，Nr是≥2的整数；将第一解相关过程应用于输入音频声道中的一组两个或更多个输入音频声道以产生第一组解相关的声道，第一解相关过程维持该组输入音频声道的声道间相关性；将第一调制过程应用于第一组解相关的声道以产生第一组解相关的且经调制的输出声道；以及将第一组解相关的且经调制的输出声道与两个或更多个未解相关的输出声道组合以产生包括Np个输出音频声道的输出音频信号，Np是≥3的整数，输出声道表示第二声场格式，该第二声场格式是分辨率比第一声场格式相对较高的声场格式，未解相关的输出声道与输出音频信号的较低分辨率分量相对应，并且解相关的且经调制的输出声道与输出音频信号的较高分辨率分量相对应。12.根据权利要求11所述的非暂时性介质，其中调制过程涉及将线性矩阵应用于第一组解相关的声道。13.根据权利要求11或权利要求12所述的非暂时性介质，其中组合涉及将第一组解相关的且经调制的输出声道与Nr个未解相关的输出声道组合。14.根据权利要求11-13中任一项所述的非暂时性介质，其中应用第一解相关过程涉及将相同的解相关过程应用于Nr个输入音频声道中的每个输入音频声道。15.根据权利要求11-14中任一项所述的非暂时性介质，其中软件包括用于执行以下操作的指令：将第二解相关过程应用于输入音频声道中的所述一组两个或更多个输入音频声道以产生第二组解相关的声道，第二解相关过程维持该组输入音频声道的声道间相关性；以及将第二调制过程应用于第二组解相关的声道以产生第二组...

【专利技术属性】
技术研发人员：D·S·麦克格拉斯，
申请(专利权)人：杜比实验室特许公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人