System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 根据基于声道的音频生成基于声道和对象的音频制造技术_技高网

根据基于声道的音频生成基于声道和对象的音频制造技术

技术编号:41720841 阅读:2 留言:0更新日期:2024-06-19 12:46
一种音频处理方法,该方法包括基于参考音频信号、提取的音频对象、提取的床声道、经渲染的音频信号和基于声道的音频信号的部分响度来生成检测分数。该检测分数指示音频对象和床声道中的一者或多者中的音频伪像。提取的音频对象和提取的床声道可以根据检测分数进行修改,以减少音频伪像。

【技术实现步骤摘要】
【国外来华专利技术】

本公开涉及音频处理,并且特别是涉及根据基于声道的音频生成基于对象的音频。


技术介绍

1、除非本文中另有说明,否则本节中所描述的方法不是本申请中权利要求的现有技术,并且不通过包含在本节中而被承认是现有技术。

2、近年来,在多媒体行业,三维(3d)电影和电视内容在影院和家庭中越来越受欢迎。为了跟上这些发展,还提出了几种音频再现系统。常规多声道系统(诸如立体声音频,例如,2声道、5.1声道环绕声、7.1声道环绕声等)已经被扩展以创建更具沉浸感的声场。

3、下一代音频系统的示例是包括音频声道(称为床声道)和音频对象两者的格式。音频对象是指在定义的持续时间内存在并且具有元数据(诸如描述音频对象的大小、速度和位置的空间信息)的单个音频元素。床声道是指要在预定义的固定扬声器位置再现的音频声道。在传输期间,可以单独发送对象和床声道,并且然后由再现系统使用以基于再现环境中回放扬声器的具体配置来自适应性地重塑艺术意图;基于扬声器的配置进行的音频输出的生成可以被称为渲染。


技术实现思路

1、现有音频处理系统的一个问题是,大多数现有音频内容是基于声道的,诸如5.1、7.1或立体声。为了将传统的基于声道的内容转换为基于声道和对象的格式,需要开发自动化的技术或工具来从传统混合中提取对象和床声道。此外,还需要自动化的渲染工具来进一步修改或上混提取的音频对象和床声道,并且改进传统内容的再现。此外,在自动对象提取和环境上混合过程中可能会引入伪像(artifects)和不准确的估计,因此还需要以自动化方式检测这些问题并提高最终输出内容的质量。实施例指向评估提取的音频对象和床声道的统计以识别不连续性,以及根据需要调整提取的音频对象和床声道以减少不连续性。这种自动评估和调整是对传统方法的改进,传统方法可能需要音频工程师进行广泛的手动评估和操纵。

2、实施例使用音频信号处理技术来自动地将任意多声道音频内容(例如5.1、7.1等)从基于声道的格式转换为基于声道和对象的格式。为了提高基于声道和对象的音频内容的质量,系统实施了三个模块:(1)控制模块,其验证和评估渲染模块和对象提取的结果;(2)自适应后处理模块,其基于控制模块的结果来获得后处理参数;和(3)修改模块,其基于所获得的后处理参数来修改提取的基于声道和对象的音频内容。

3、根据实施例,计算机实施的音频处理方法包括:接收基于声道的音频信号;根据基于声道的音频信号来生成参考音频信号;以及根据基于声道的音频信号来生成多个音频对象和多个床声道。方法还包括基于多个音频对象和多个床声道来生成经渲染的音频信号。方法还包括基于多个信号的多个部分响度来生成检测分数。多个信号包括参考音频信号、多个音频对象、多个床声道、经渲染的音频信号和基于声道的音频信号。检测分数指示多个音频对象和多个床声道中的一者或多者中的音频伪像。方法还包括基于检测分数来生成多个参数。方法还包括根据基于声道的音频信号、多个音频对象、多个床声道和多个参数来生成多个经修改的音频对象和多个经修改的床声道。

4、作为结果,与未经修改的音频对象和未经修改的床声道相比,经修改的音频对象和经修改的床声道具有减少的音频伪像。

5、根据另一实施例,一种装置包括一个或多个扬声器以及处理器。处理器被配置为控制该装置以实施本文所述的方法中的一个或多个方法。装置还可以包括与本文所述的方法中的一个或多个方法的细节类似的细节。

6、根据另一实施例,一种非暂态计算机可读介质存储计算机程序,计算机程序在由处理器执行时控制装置来执行处理,该处理包括本文所述的方法中的一个或多个方法。

7、以下详细描述和附图提供了对各种具体实施的性质和优点的进一步理解。

本文档来自技高网...

【技术保护点】

1.一种计算机实施的音频处理方法,所述方法包括:

2.根据权利要求1所述的计算机实施的方法,其中生成所述检测分数包括:

3.根据权利要求1至2中任一项所述的计算机实施的方法,其中生成所述检测分数包括:

4.根据权利要求1至3中任一项所述的计算机实施的方法,其中生成所述检测分数包括:

5.根据权利要求1至4中任一项所述的计算机实施的方法,其中生成所述检测分数包括:

6.根据权利要求5所述的计算机实施的方法,其中所述多个增强分数中的给定增强分数包括第一值、第二值和第三值的乘积,其中所述第一值是给定信号的多个声道之间的所述部分响度的相关性,其中所述第二值是相邻块之间所述给定信号的所述多个声道中的能量变化程度,并且其中所述第三值是所述给定信号的所述多个声道的多个响度比率之间的差异分数。

7.根据权利要求1至6中任一项所述的计算机实施的方法,其中生成所述检测分数包括:

8.根据权利要求1至7中任一项所述的计算机实施的方法,其中生成所述检测分数包括:

9.根据权利要求8所述的计算机实施的方法,其中所述检测分数是基于应用于第一值和第二值之和的双曲正切函数来生成的,其中所述第一值是所述偏差差异和所述偏差比率的乘积,并且其中所述第二值是所述连续性分数。

10.根据权利要求1至9中任一项所述的计算机实施的方法,其中生成所述检测分数包括:

11.根据权利要求1至10中任一项所述的计算机实施的方法,其中生成所述检测分数包括:

12.根据权利要求1至11中任一项所述的计算机实施的方法,其中生成所述检测分数包括:

13.根据权利要求1至12中任一项所述的计算机实施的方法,其中生成所述检测分数包括:

14.一种非暂态计算机可读介质,所述非暂态计算机可读介质存储计算机程序,所述计算机程序在由处理器执行时控制装置来执行处理,所述处理包括权利要求1至13中任一项所述的方法。

15.一种用于音频处理的装置,所述装置包括:

...

【技术特征摘要】
【国外来华专利技术】

1.一种计算机实施的音频处理方法,所述方法包括:

2.根据权利要求1所述的计算机实施的方法,其中生成所述检测分数包括:

3.根据权利要求1至2中任一项所述的计算机实施的方法,其中生成所述检测分数包括:

4.根据权利要求1至3中任一项所述的计算机实施的方法,其中生成所述检测分数包括:

5.根据权利要求1至4中任一项所述的计算机实施的方法,其中生成所述检测分数包括:

6.根据权利要求5所述的计算机实施的方法,其中所述多个增强分数中的给定增强分数包括第一值、第二值和第三值的乘积,其中所述第一值是给定信号的多个声道之间的所述部分响度的相关性,其中所述第二值是相邻块之间所述给定信号的所述多个声道中的能量变化程度,并且其中所述第三值是所述给定信号的所述多个声道的多个响度比率之间的差异分数。

7.根据权利要求1至6中任一项所述的计算机实施的方法,其中生成所述检测分数包括:

8.根据权利要求1至7中任一项所述的...

【专利技术属性】
技术研发人员:李煦G·琴加莱宾清原M·G·霍根
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1