具有全向声元素的矩阵编码立体声信号制造技术

技术编号:37507667 阅读:39 留言:0更新日期:2023-05-07 09:45
公开了用于具有全向声元素的矩阵编码立体声信号的实施例。构造适合于处理多声道音频输入信号的混合矩阵,使得所产生的多声道输出信号包含来自输入信号的相同音频元素,其中,如由与输入信号格式相关联的平移规则定义的音频元素之间的空间关系在如由与输出信号格式相关联的矩阵编码规则定义的输出信号中得以保留。对混合矩阵系数的选择受相位偏好规则的约束,相位偏好规则用于确定要应用于每个输入信号声道的适当相位。入信号声道的适当相位。入信号声道的适当相位。

【技术实现步骤摘要】
【国外来华专利技术】具有全向声元素的矩阵编码立体声信号
[0001]相关申请的交叉引用
[0002]本申请要求于2020年8月27日提交的国际专利申请号PCT/CN/2020/111808、2020年9月23日提交的美国临时专利申请号63/081,937、2020年12月18日提交的美国临时专利申请号63/127,919、以及2021年1月8日提交的欧洲专利申请号21150688.6的优先权,所有这些申请均通过引用以其全文并入本文。


[0003]本公开总体上涉及音频信号处理。

技术介绍

[0004]在一些音频处理应用中,多个音频声道通过双声道音频连接进行传输,以供在客户端音频设备(例如,环绕声系统)处用例如高度元素表示空间音频场景之目的。这是通过以下方式来实现的:将M声道音频信号下混为双声道立体声信号并将该双声道下混(downmix)信号以及(可选的)空间参数发送到解码器,在该解码器中,使用下混信号和空间参数重构空间音频场景。

技术实现思路

[0005]公开了用于具有全向声元素的矩阵编码立体声信号的实施方式。构造适合于处理多声道音频输入信号的混合矩阵,使得所产生的多声道输出信号包含来自输入信号的相同音频元素,其中,如由与输入信号格式相关联的平移规则定义的音频元素之间的空间关系在如由与输出信号格式相关联的矩阵编码规则定义的输出信号中得以保留。对混合矩阵系数的选择受相位偏好规则的约束,相位偏好规则用于确定要应用于每个输入信号声道的适当相位。
[0006]在实施例中,一种将多个输入音频声道转换为多个输出音频声道的方法,包括:接收包括多个输入音频声道的输入音频信号;通过以下方式生成多个输出音频声道:将每个输入音频声道与由平移函数定义的复(complex)增益元素相关联,平移函数被配置为调整单位球体上一定仰角(elevation angle)处的第一位置周围的区域中的平移行为,并将该区域中的不连续性转移至单位球体上该仰角处且与单位球体上的第一位置相对的第二位置。
[0007]在实施例中,输出声道的数量为两个。
[0008]在实施例中,仰角为90度。
[0009]在实施例中,仰角是单位向量的函数。
[0010]在实施例中,平移函数被计算为复相位校正系数与复混合增益的乘积。
[0011]在实施例中,编码规则定义两个增益元素的幅值和这两个增益元素之间的相对相位。
[0012]在实施例中,编码规则被定义为包括对平移函数的约束,该约束由三维(3D)平移
函数与该3D平移函数的厄米特转置的乘积给出。
[0013]在实施例中,平移函数在第一平移位置处具有主导(dominant)方向,并且在第二平移位置处具有不连续性。
[0014]在实施例中,一种将多个输入音频声道转换为多个输出音频声道的方法,包括:接收包括多个输入音频声道的输入音频信号;通过以下方式生成多个输出音频声道:将每个输入音频声道与一组混合增益相关联,其中,每组混合增益包含多个复增益元素;将复增益元素中的每一个与输出音频声道中相应的输出音频声道相关联;将输入声道中的每一个与相应的单位向量相关联;根据编码规则将每组混合增益中的复增益元素之间的幅度和相对相位定义为相应的输入音频声道的相应单位向量的函数;以及根据相位偏好规则确定每组混合增益中的复增益元素的绝对相位,其中,相位偏好规则被选择为在不同组的混合增益之间提供一定程度的相位兼容性。
[0015]在实施例中,一种将多个输入音频声道转换为多个输出音频声道的方法,该方法包括:对于每个输入声道:确定与该输入声道相关联的单位向量;基于单位向量确定输入声道的原型(prototype)增益向量;基于单位向量的函数确定输入声道的主导仰角;基于原型增益向量和主导仰角来确定输入声道的相位校正;通过将相位校正应用于原型增益向量来确定输入声道的混合增益;以及通过将混合增益应用于输入声道来生成输出音频声道。
[0016]本文公开的其他实施方式涉及一种系统、装置和计算机可读介质。下文的附图和描述中阐述了所公开的实施方式的细节。根据所述描述、附图和权利要求,其他特征、目的和优点是显而易见的。
[0017]本文公开的特定实施方式提供了以下优点中的一个或多个。根据遵循某些矩阵编码规则的连续平移函数,将表示空间音频场景的N声道音频输入信号下混为适合于传输空间音频场景的双声道下混信号,其中,基于关于所假设的对象位置典型分布的假设来最小化平移函数中不连续性的影响。
附图说明
[0018]在附图中,为了便于描述,示出了示意性元素的特定布置或排序,如那些表示设备、单元、指令块和数据元素的示意性元素。然而,本领域技术人员应当理解,附图中示意性元素的特定排序或布置并不意味着暗示需要特定处理次序或顺序或者过程分离。进一步地,在附图中包括示意性元素并不意味着暗示在所有实施例中都需要这种元素,或者在一些实施方式中,由这种元素表示的特征可以不被包括在其他元素中或与其他元素组合。
[0019]进一步地,在附图中,在使用如实线或虚线或箭头等连接元素来说明两个或更多个其他示意性元素之间的连接、关系或关联的情况下,不存在任何这种连接元素并不意味着暗示不可能存在连接、关系或关联。换句话说,未在附图中示出元素之间的一些连接、关系或关联性,以免模糊本公开。另外,为了便于图示,使用单个连接元素来表示元素之间的多个连接、关系或关联性。例如,在连接元素表示信号、数据或指令的通信的情况下,本领域的技术人员应理解,这样的元素表示为了影响通信而可能需要的一个或多个信号路径。
[0020]图1是根据一些实施例的混频器(mixer)的框图。
[0021]图2是根据一些实施例的图示了单位球体的坐标轴和关键组成部分的简图。
[0022]图3是根据一些实施例的图示了包括上环的单位球体的简图。
[0023]图4是根据一些实施例的图示了方位(azimuth)角的修改的简图。
[0024]图5图示了根据一些实施例的包括主导角的单位球体。
[0025]图6A是根据一些实施例的将输入音频信号的多个声道转换为输出音频信号的多个输出声道的过程的流程图。
[0026]图6B是根据一些实施例的将输入音频信号的多个声道转换为输出音频信号的多个输出声道的替代性过程的流程图。
[0027]图6C是根据一些实施例的将输入音频信号的多个声道转换为输出音频信号的多个输出声道的替代性过程的流程图。
[0028]图7示出了适合于实施本公开的示例实施例的示例系统的框图。
[0029]各附图中使用的相同附图标记指示相似的元素。
具体实施方式
[0030]在以下具体实施方式中,阐述了许多具体细节以提供对所描述的各种实施例的全面理解。对于本领域普通技术人员而言将明显的是,可以在没有这些具体细节的情况下实践所描述的各种实施方式。在其他实例中,并未详细描述众所周知的方法、过程、部件以及电路以免不必要地模糊实施例的各方面。下文描述了几个特征,每个特征可以彼此独立使用或本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种将多个输入音频声道转换为多个输出音频声道的方法,所述方法包括:使用至少一个处理器来接收包括多个输入音频声道的输入音频信号;使用所述至少一个处理器通过以下方式生成多个输出音频声道:将每个输入音频声道与由平移函数定义的复增益元素相关联,所述平移函数被配置为调整单位球体上一定仰角处的第一位置周围的区域中的平移行为,并将所述区域中的不连续性转移至所述单位球体上所述仰角处且与所述单位球体上的所述第一位置相对的第二位置。2.如权利要求1所述的方法,其中,输出声道的数量为两个。3.如权利要求1或权利要求2所述的方法,其中,所述仰角是单位向量的函数。4.如从属于权利要求2时的权利要求3所述的方法,其中,所述平移函数由下式给出:其中,λ是复相位校正系数,并且G

是复增益的2
×
1列向量。5.如从属于权利要求2时的权利要求3或4所述的方法,其中,编码规则定义两个增益元素的幅值和所述两个增益元素之间的相对相位。6.如前述权利要求3至5中任一项所述的方法,其中,编码规则被定义为包括对所述平移函数的约束,所述约束由下式给出:其中,x、y、z是直角坐标系中的单位向量的分量,z为非零,并且是所述平移函数的厄米特转置。7.如权利要求3所述的方法,其中,所述平移函数p
up
(x,y,z)在第一平移位置p
up
(0,0,1)处具有主导方向,并且在第二平移位置p
up
(0,0,

1)处具有不连续性。8.如权利要求7所述的方法,其中,所述平移函数p
up
(x,y,z)由下式给出:9.一种将多个输入音频声道...

【专利技术属性】
技术研发人员:D
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1