环绕声系统中扬声器位置的自动发现和定位技术方案

技术编号:39740568 阅读:43 留言:0更新日期:2023-12-17 23:41
本公开涉及环绕声系统中扬声器位置的自动发现和定位

【技术实现步骤摘要】
环绕声系统中扬声器位置的自动发现和定位
[0001]本申请是基于申请号为
201780060656.4、
申请日为
2017
年9月
28


专利技术名称为“环绕声系统中扬声器位置的自动发现和定位”的专利申请的分案申请



[0002]一个或多个实现总体涉及环绕声扬声器系统,并且更具体地涉及自动确定收听环境中的扬声器位置

[0003]版权声明
[0004]本专利文件的公开内容的一部分包含受版权保护的材料

版权所有者不反对任何人对专利文件或专利公开内容进行传真复制,就如同它在专利和商标局专利文件或记录中出现的那样,但在其他方面保留所有版权


技术介绍

[0005]环绕声扬声器系统包括数个扬声器以及低频效果
(LFE)
扬声器
(
低音炮
)
,它们被设计为放置在房间中的指定位置以在水平平面中提供
360
度声音的音频环绕效果

在大多数情况下,环绕声系统将每个源声道映射到其自己的扬声器

许多不同的环绕声配置已经被开发出来,目前大多数环绕声应用的标准是
5.1
环绕声格式,其具有3个前置扬声器
、2
个后置扬声器和1个
LFE
声道

这常用于电影

电视和消费者应用,并且通常由传统多声道混音所需的规定位置驱动

[0006]对于环绕声系统定义了相对严格的扬声器放置规则,例如
L

R
声道之间
60
度,中置扬声器位于收听者正前方,环绕声道被放置为与中央声道成
100

120
度,任何额外的环绕扬声器均匀分布在
60

150
度之间
。5.1
环绕声系统通常受限于其传送
180
度或类似全景声音的能力,因此已经开发了更广泛的环绕声格式

例如,
7.1
声道环绕声常用于大型电影院,并增加了两个额外的声道以提供额外的左
/
右环绕声道或甚至额外的屏幕声道

其他环绕声配置包括
9.1

10.2

11.1

22.2
等等

[0007]在影院和家庭环境中,环绕声系统设置过程中的一个常见问题是房间内扬声器的位置

不同的房间大小和尺寸可能对扬声器定位造成约束,并且每个扬声器的定向角度以及它们的相对位置也是重要的

高级音频处理系统
(
例如
Atmos
TM
)
的出现已经引入了对于诸如
5.1.2(5
个环绕,1个
LFE
和2个高度扬声器
)

7.1.2

7.1.4

9.1.2
等的配置使用包括高度扬声器的许多不同扬声器的可能性

随着能够在影院和家庭影院应用中支持多达
24.1.10
个声道,要被定位和定向的扬声器数量可能非常高

这给用户带来了显著的设置负担,并且可能导致扬声器的非最佳放置

[0008]为了增强新一代环绕声系统的可用性,需要如下这样一种方法,该方法允许用户容易地在多扬声器音频系统中放置扬声器,这样允许系统中扬声器的相对任意放置以及允许系统中扬声器的自动发现
(
自动搜寻
)。
[0009]
技术介绍
部分中讨论的主题不应仅仅因为在
技术介绍
部分中提及而被认为是现有技术

类似地,不应假设在
技术介绍
部分中提到的或与
技术介绍
部分的主题相关的问题
先前已在现有技术中被认识到


技术介绍
部分中的主题仅代表不同的方法,这些方法本身也可以是专利技术
。Dolby Atmos

Dolby Digital Plus

Dolby TrueHD

Dolby Pulse

Dolby Laboratories(
杜比实验室
)
的商标

[0010]出于本说明书的目的,以下术语具有相关联的含义:术语“声道”指的是音频信号加元数据,其中位置被编码为频道标识符,例如左前或右上环绕;“基于声道的音频”是如下这样的音频,该音频被格式化以用于通过预定义的扬声器区域集合进行重放,扬声器区域集合具有相关联的标称位置,例如
5.1,7.1
等等
(
即上文刚刚定义的声道集
)
;术语“对象”指的是具有诸如视在源位置
(
例如,
3D
坐标
)、
视在源宽度等的参数源描述的一个或多个音频声道;“基于对象的音频”是指刚刚定义的对象集;“沉浸式音频”、“空间音频”或“自适应音频”指的是基于声道的和对象或基于对象的音频信号加上元数据,其使用在其中位置被编码为空间中的
3D
位置的音频流加元数据基于回放环境来呈现音频信号;“收听环境”指的是任何开放的,部分封闭的或完全封闭的区域,例如可用于音频内容单独回放或音频内容与视频或其他内容一起回放的房间,并且可以体现在家庭

影院

剧院

礼堂

工作室

游戏机等中

这样的区域可以在其中设置有一个或多个表面,例如可以直接反射或漫反射声波的墙壁或挡板

术语“驱动器”指的是单个电声换能器,其响应于电气音频输入信号而产生声音

术语“扬声器”或“扩音器”指的是整体外壳中的一个或多个驱动器,术语“机壳”或“外壳”指的是包围一个或多个驱动器的整体外壳

术语“扬声器馈送”可以指的是从音频呈现器发送到扬声器以便通过一个或多个驱动器进行声音回放的音频信号


技术实现思路

[0011]描述了如下方法的实施例,该方法通过确定
n
个扬声器和
m
个麦克风中的每一个的到达时间
(TOAs)
并且获得房间中的扬声器的种子
(
初始
)
布局和被定义的配置参数来执行扬声器定位和自动发现

该方法评估多个候选
TOA
,作为提高过程鲁邦性的方法

这些数据项被输入到成本函数,通过使用
TOA
值来最小化该成本函数以求解扬本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种用于在收听环境中定位扬声器的方法,所述收听环境具有多个扬声器和麦克风,所述方法包括:接收所述多个扬声器中的每个扬声器到所述多个麦克风中的每个麦克风的一个或多个相应的到达时间
(TOA)
,以产生多个
TOA
候选,其中每个麦克风接近单个相应的扬声器;接收所述收听环境的配置参数;使用每个扬声器的一个或多个相应的
TOA
值中的每一个来最小化成本函数,以估计相应的扬声器和麦克风的位置和延迟;在所述多个
TOA
候选中的每个
TOA
候选上迭代进行成本函数最小化;以及使用所述配置参数和经最小化的成本函数来向一个或多个后处理组件或者音频呈现组件提供扬声器位置信息
。2.
根据权利要求1所述的方法,其中每个麦克风被放置在单个相应的扬声器的扬声器箱的内部

顶部

或者附接到单个相应的扬声器的扬声器箱,并且进一步地,其中接收的
TOA
包括扬声器中的至少一个到麦克风中的至少一个的多个
TOA
候选
。3.
根据权利要求1所述的方法,包括:基于由扬声器中的一个或多个回放的参考音频序列和从麦克风中的一个或多个获得的所述参考音频序列的记录来估计所述收听环境的脉冲
(IR)
;以及使用所述
IR
来搜索直达声候选峰值,其中所述多个
TOA
候选与在所述搜索中识别的相应的候选峰值对应,其中提供给一个或多个后处理组件或者音频呈现组件的所述扬声器位置信息是基于最小化步骤的残差低于某个阈值的
TOA
候选当中的选择
。4.
根据权利要求1所述的方法,包括:通过以下中的一个来估计所述收听环境的脉冲响应
(IR)
:将已知的参考音频序列与从麦克风获得的所述序列的记录互相关以导出伪脉冲响应

或者对校准音频序列和从麦克风获得的所述校准音频序列的记录进行去卷积;使用所述
IR
通过评估参考峰值并且使用所述参考峰值周围的噪声水平来搜索直达声候选峰值,其中所述多个
TOA
候选与在所述搜索中识别的相应的候选峰值对应;以及通过选择初始
TOA
矩阵

利用最小化步骤的残差评估所述初始矩阵

以及改变
TOA
矩阵元素直到残差低于定义的阈值来执行多峰值评估
。5.
根据权利要求4所述的方法,其中使用所述
IR
来搜索直达声候选峰值包括:至少在所述
IR
的位于所述参考峰值之前的部分中搜索替代峰值
。6.
根据权利要求1所述的方法,其中所述延迟包括至少一个扬声器的回放延迟
。7.
根据权利要求1所述的方法,其中所述延迟包括至少一个麦克风的记录延迟
。8.
根据权利要求1所述的方法,其中所述配置参数包括以下中的至少一个:扬声器和麦克风的数量

所述收听环境的大小;回放和记录延迟的界限;二维或三维扬声器位置的规定;扬声器和麦克风相对定位的约束;扬声器和麦克风相对延迟的约束;以及对于旋转

平移和轴反转对称消歧的参考
。9.
根据权利要求1所述的方法,还包括向所述成本函数提供种子布局,所述种子布局指定在相对于定义的扬声器布局标准被定义的初始位置中扬声器和麦克风的正确数量
。10.
根据权利要求9所述的方法,还包括基于所述收听环境中的扬声器的配置将估计的
位置信息变换为规范格式
。11.
根据权利要求1所述的方法,其中所述收听环境中的扬声器被置于环绕声配置中,所述环绕声配置具有多个前置扬声器

后置扬声器和环绕扬声器

【专利技术属性】
技术研发人员:D
申请(专利权)人:杜比国际公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1