用于确定在声场的高阶高保真立体声表示中不相关的声源的方向的方法和装置制造方法及图纸

技术编号:12225191 阅读:123 留言:0更新日期:2015-10-22 02:28
高阶高保真立体声(HOA)表示三维立体声。HOA提供高空间分辨率并且促进关于主导声源的声场的分析。本发明专利技术的目的在于识别由声场构成的独立主导声源,并追踪它们暂时的轨迹。已知的申请是通过查看初始HOA表示的方向功率分布来搜索主导声源的所有潜在候选,而在本发明专利技术中,与先前发现的声源的信号相关的所有组件被除去。通过这种操作,许多代替仅一个正确声源的错误检测的问题可以被避免,以防它对声场的贡献被高度方向性地分散。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】用于确定在声场的高阶高保真立体声表示中不相关的声源 的方向的方法和装置 本专利技术涉及用于确定在声场的高阶高保真立体声表示中不相关的声源的方向的 方法和装置。
技术介绍
高阶高保真立体声(HOA)在其它技术(如波场合成(WFS)或基于信道的如22. 2 的方法)之中提供了表示三维立体声的一个可能性。然而,与基于信道的方法相比,HOA表 示对不依赖于特定扬声器的设置提供了优势。然而,这种灵活性是以对特殊扬声器设置上 的HOA表示的重放所需的过程进行解码为代价的。与WFS方法相比,所需要的扬声器的数 量通常是很大的,也可以对只包括少数的扬声器的设置提出HOA。HOA另外的优势是也可以 采用相同的表示而无需对双耳用的耳机做出任何修改。 HOA是基于由缩短的球谐函数(SH)展开式表示的复杂平面谐波幅度的空间密度。 每个展开系数是角频率的函数,其可以同样由时域函数来表示。因此,不失一般性,完整的 HOA声场表示实际上可以被假设被由0时域函数组成,其中0指示展开系数的数目。在下文 中,这些时域函数被称为HOA系数序列或被称为HOA信道。 HOA具有提供高空间分辨率的潜能,通过增长的展开的最高阶数N来进行改善。这 对关于主导声源的声场进行分析提供了可能性。
技术实现思路
-个如何可以从给定的HOA表示中识别由声场组成的独立主导声源、和如何追踪 它们暂时的轨迹的申请。需要这种操作用于例如通过将声场分写成主导方向信号和其余的 周边组件来压缩HOA表示,如专利申请EP12305537. 8中所述。针对这种方向追踪方法的另 外的申请会是粗糙的、初步的源分离。对后产生的HOA声场记录使用估计的方向轨迹以便 放大或减弱特定声源的信号也是可能的。 在EP 12305537. 8中提出了相继执行如下的三个操作: -识别时间帧内的当前存在的主导声源的数量并且搜索相应的方向。主导声源的 数量被从HOA信道互相关的矩阵的特征值确定。为了搜索主导声源的方向,估计与固定数 量的预定测试方向的HOA系数的帧相对应的方向功率分布。通过寻找方向功率分布中的最 大值获得第一方向估计。随后通过连续重复如下的两个操作来发现其余识别的方向:从其 余的测试方向的集合中排除空间邻域的测试方向,并且结果集合被认为是搜索的方向功率 分布的最大值。 _估计的方向被分配给在最后的时间帧中被认为是活动的声源。 _在分配之后,对方向估计执行适当的平滑化以便获得暂时平滑的方向轨迹。 然而,尽管通过这种过程,方向估计的暂时平滑在原则上通过以指数的方式计算 加权移动平局数来完成,但是该技术具有不能准确捕获意外的方向改变或突发的新主导声 音的缺点。 为了克服该问题,在专利申请EP 12306485.9中介绍了一种简单统计源移动 的预测模型,针对由贝叶斯学习定律实行的统计上的动力平滑利用该模型。然而,EP 12306485. 9和EP 12305537. 8仅从方向功率分布来针对声源方向计算似然函数。该分布表 示来自由在单元球面上几乎是均匀分布的取样点指定的方向的多数通用平面波的功率。没 有提供关于来自不同方向的通用平面波之间的互相关的任意信息。 实际上,HOA表示的阶数N通常是有限的,导致空间有限带宽的声场。具体的,这 意味着对方向功率分布的方向声源的贡献被周围入射在邻域内方向的真方向所弥散。该弥 散效应在数学上通过"分散函数"来描述,见下文高阶高保真立体声的空间分辨率部分。其 程度随着HOA表示的阶数下降而增长。EP 12306485. 9和EP 12305537. 8的方向追踪方法 某种程度上地考虑到了该效应,通过约束至先前发现方向邻域外的区域的方向的搜索。然 而,邻域的规范假设所有声源被编码有全阶N的HOA表示。该假设违反了 N阶HOA表示,该 N阶HOA表示包括在小于阶数N中编码的通用平面波。这种小于阶数N的通用平面波可以 是艺术创造的结果,为了使声源显得更宽。然而,它们还通过球形麦克风随着记录HOA声场 表示出现。 假使声场由小于阶数N的单个通用平面波组成(这是不期望有的性能),EP 12306485. 9和EP 12305537. 8的方向追踪方法不只识别单个声源。 本专利技术所要解决的问题是改进HOA声场中主导声源的确定,使得主导声源的暂时 的轨迹可以被追踪。该问题由权利要求1、2和6中公开的方法所解决。利用权利要求6的 方法的装置在权利要求7中公开。 本专利技术改进了 EP 12306485. 9的过程。该专利技术过程寻找独立主导声源并随着时间 追踪它们的方向。"独立主导声源"的表示意味着各自声源的信号是不相关的。 尽管EP 12305537. 8和EP 12306485. 9是通过仅考虑初始HOA表示的方向功率分 布来搜索主导声源方向的所有潜在候选的最先进的方法,但是下文描述的专利技术过程从初始 HOA表示中除去了每个方向候选的搜索,所有组件与先前发现的声源的信号有关。通过这 种操作,许多代替仅一个正确声源的错误检测的问题可以被避免,以防它对声场的贡献被 高度方向性地分散。如上所述,这种效应会针对N阶HOA表示发生,该N阶HOA表示包括在 小于阶数N中编码的通用平面波。与EP 12306485. 9相似,针对主导声源方向发现的候选 随后被分配给先前发现的主导声源,并最终根据统计源移动模式使其变平滑。因此,与EP 12306485. 9相似,专利技术过程提供暂时平滑的发现估计,并且能够捕获意外的方向改变或突 发的新主导声音。 专利技术过程在两个后续处理中确定针对HOA表示的连续帧的主导声源方向的估计, 这两个后续处理为: 从HOA表示的当前时间帧k,相继搜索针对主导声源方向的候选或估计,并且确定 被认为是由各自声源创建的HOA表示的组件。在该搜索过程的每次迭代中,每个另外的方 向候选由残差HOA表示计算,残差HOA表示表示来自与已经被除去的先前发现的声源的信 号相关的所有组件的初始HOA表示。当前方向候选从若干预定的测试方向中选出,使得从 监听者的位置上所选的方向撞击(impinging)的残差HOA表示的相关通用平面波的功率是 与所有其它测试方向的相比的最大值。 接下来,针对当前时间帧选择的方向候选被分配给在HOA系数的先前时间帧k-1 中发现的主导声源。其后,关于作为结果的时间轨迹平滑的最终方向估计通过实行贝叶斯 推理过程被计算,其中该贝叶斯推理过程一方面利用统计的先验声源移动模型,另一方面 利用初始HOA表示的主导声源组件的方向功率分布。先验声源移动模型从在先前时间帧 k-1的独立声源的方向和先前时间帧k-1与倒数第二的时间帧k-2之间的移动来统计地预 测独立声源的当前移动。通过方向估计和先前发现的声源的方向对之间的联合最小角度、 和关于方向估计和在先前时间帧发现的主导声源的方向信号对之间的相关系数的最大绝 对值来完成对在HOA系数的先前时间帧(k-1)中发现的主导声源的方向估计的分配。 原则上,专利技术方法适用于在表示声场的HOA的高阶高保真立体声表示中确定不相 关的声源的方向,所述方法包括如下步骤: -在HOA系数的当前时间帧中,相继搜索主导声源的初步方向估计,并计算由相应 的主导声源创建的HOA声场组件,并计算相应的方向信号; -通过比较所述当前时间帧的本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/62/CN104995926.html" title="用于确定在声场的高阶高保真立体声表示中不相关的声源的方向的方法和装置原文来自X技术">用于确定在声场的高阶高保真立体声表示中不相关的声源的方向的方法和装置</a>

【技术保护点】
一种在表示声场的HOA的高阶高保真立体声表示中确定不相关声源的方向的方法,所述方法包括如下步骤:‑在HOA系数c(k)的当前时间帧k中,相继搜索(11)主导声源的初步方向估计并计算(11)由相应的主导声源创建的HOA声场组件其中在所述搜索的每次迭代中,每个另外的方向估计由残差HOA表示来计算,该残差HOA表示表示来自与已经被除去的先前发现的声源的信号相关的所有组件的初始HOA表示,其中当前方向候选从若干预定的测试方向中选出,使得从监听者的位置上所选的方向撞击的所述残差HOA表示的相关通用平面波的功率是与所有其它测试方向的相比的最大值。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:亚历山大·克鲁格斯文·科尔东
申请(专利权)人:汤姆逊许可公司
类型:发明
国别省市:法国;FR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1