利用元数据对基于音床的音频进行渲染的方法及装置制造方法及图纸

技术编号:35263556 阅读:31 留言:0更新日期:2022-10-19 10:24
本公开涉及一种利用元数据对基于音床的音频进行渲染的方法及装置,该方法包括基于预先构建的音频模型,并通过类型标签将所述音频模型的参数保存在各自的数据结构;通过所述类型标签,引入保存在各自的数据结构的所述音频模型的参数,生成音频模型的音床类型的元数据对象;通过所述类型标签,引入保存在各自的数据结构的所述音频模型的参数。本公开将将一组具有音床类型的元数据的音频信号转换为音频信号和元数据的不同配置,能够将音频这些信号渲染到高级音响系统中规定的所有扬声器配置。本公开提供一种利用元数据对基于音床的音频进行渲染的方法,无需任何信号改动,直接将每通道音频信号传送到每一个扬声器。通道音频信号传送到每一个扬声器。通道音频信号传送到每一个扬声器。

【技术实现步骤摘要】
利用元数据对基于音床的音频进行渲染的方法及装置


[0001]本公开涉及音频处理的
,尤其涉及一种利用元数据对基于音床的音频进行渲染的方法及装置。

技术介绍

[0002]随着科技的发展,音频变得越来越复杂。由早期的单声道音频演变成立体声,工作重心也注重左右声道的正确处理方式。但环绕声出现后,处理过程开始变得复杂。而环绕5.1扬声器系统则对多个通道进行排序约束,进而环绕6.1扬声器系统、环绕7.1扬声器系统等使音频处理千变万化,把正确的信号传递给合适的扬声器形成相互牵连的效果。因此,随着声音变得更具沉浸感和交互性,音频处理的复杂性也大大增加。
[0003]音频声道(或声道),是指声音在录制或播放时在不同空间位置采集或回放的相互独立的音频信号。而声道数也就是声音录制时的音源数量或回放时相应的扬声器数量。例如,在环绕5.1扬声器系统中包括6个不同空间位置的音频信号,每个独立的音频信号被用于驱动对应空间位置的扬声器;在环绕7.1扬声器系统中包括8个不同空间位置的音频信号,每个独立的音频信号被用于驱动对应空间位置的扬声器。
[0004]因此,当前扬声器系统实现的效果依赖于扬声器的数量和空间位置。例如,双声道扬声器系统无法实现环绕5.1扬声器系统的效果。

技术实现思路

[0005]本公开的目的在于提出一种利用元数据对基于音床的音频进行渲染的方法及装置,以将音频模型元素生成对应的结构数据,便于对音频数据进行渲染。
[0006]本公开第一方面提供了一种利用元数据对基于音床的音频进行渲染的方法,包括:
[0007]基于预先构建的音频模型,并通过类型标签将所述音频模型的参数保存在各自的数据结构;
[0008]通过所述类型标签,引入保存在各自的数据结构的所述音频模型的参数,生成音频模型的音床类型的元数据对象;
[0009]通过所述类型标签,引入保存在各自的数据结构的所述音频模型的参数和音床类型的元数据对象,生成音床类型的渲染项;音床类型的渲染项用于指示一个单独的音频通道格式或一组音频通道格式。
[0010]本公开第二方面提供了一种利用元数据对基于音床的音频进行渲染的装置,包括:
[0011]保存模块,用于基于预先构建的音频模型,并通过类型标签将所述音频模型的参数保存在各自的数据结构;
[0012]生成模块,用于通过所述类型标签,引入保存在各自的数据结构的所述音频模型的参数,生成音频模型的音床类型的元数据对象;
[0013]引入生成模块,用于通过所述类型标签,引入保存在各自的数据结构的所述音频模型的参数和音床类型的元数据对象,生成音床类型的渲染项;音床类型的渲染项用于指示一个单独的音频通道格式或一组音频通道格式。
[0014]本公开第三方面提供了一种电子设备,包括:存储器以及一个或多个处理器;
[0015]所述存储器,用于存储一个或多个程序;
[0016]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如任意实施例提供的利用元数据对基于音床的音频进行渲染的方法。
[0017]本公开第四方面提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器实现如任意实施例提供的利用元数据对基于音床的音频进行渲染的方法。
[0018]由上可见,本公开利用元数据对基于音床的音频进行渲染的方法,将将一组具有音床类型的元数据的音频信号转换为音频信号和元数据的不同配置,能够将音频这些信号渲染到高级音响系统中规定的所有扬声器配置。本公开利用元数据对基于音床的音频进行渲染的方法,无需任何信号改动,直接将每通道音频信号传送到每一个扬声器。
附图说明
[0019]图1为本公开实施例中提供了一种音频模型的示意图;
[0020]图2为本公开实施例中的利用元数据对基于音床的音频进行渲染的方法的流程图;
[0021]图3为本公开实施例中的利用元数据对基于音床的音频进行渲染的方法的另一流程图;
[0022]图4为本公开实施例中的利用元数据对基于音床的音频进行渲染的方法的另一流程图;
[0023]图5为本公开实施例中的利用元数据对基于音床的音频进行渲染的装置的结构示意图;
[0024]图6为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
[0025]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。
[0026]图1为本公开实施例中提供了一种音频模型的示意图。所述音频模型包括内容制作部分和格式制作部分;
[0027]其中,所述内容制作部分包括:音频节目元素、音频内容元素、音频对象元素和音轨唯一标识元素;
[0028]所述格式制作部分包括:音频包格式元素、音频通道格式元素、音频流格式元素和音频轨道格式元素;
[0029]所述音频节目元素引用至少一个所述音频内容元素;所述音频内容元素引用至少一个音频对象元素;所述音频对象元素引用对应的所述音频包格式元素和对应的所述音轨
唯一标识元素;所述音轨唯一标识元素引用对应的所述音频轨道格式元素和对应的所述音频包格式元素;
[0030]所述音频包格式元素引用至少一个所述音频通道格式元素;所述音频流格式元素引用对应的所述音频通道格式元素和对应的所述音频包格式元素;所述音频轨道格式元素和对应的所述音频流格式元素相互引用;
[0031]所述音频通道格式元素包含至少一个音频块格式元素。
[0032]如图2所示,本公开实施例提供一种利用元数据对基于音床的音频进行渲染的方法,包括:
[0033]S201、基于预先构建的音频模型,并通过类型标签将所述音频模型的参数保存在各自的数据结构;
[0034]如图3所示,所述基于预先构建的音频模型,并通过类型标签将所述音频模型的参数保存在各自的数据结构包括:
[0035]S301、将通用数据合并为额外数据;所述通用数据包括音频对象开始时间、对象持续时间、荧屏参考和通道频率,音频对象开始时间是路径上最后一个音频对象的开始start时间(在仅通道分配模式下未指定重要性),对象持续时间(object_duration)是路径上最后一个音频对象的duration(在仅通道分配模式下未指定重要性)。荧屏参考(reference_screen)是所选音频节目的音频节目荧幕参考(audioProgrammeReferenceScreen)(没选即为未指定重要性)。
[0036]通道频率(channel_frequency)是所选音频通道格式(audioChannelFormat)的通道频率frequency要素。
[0037]实现代码示例:
[0038][0039]S302、将重要数据存储在重要性数据结构中;所述重要数据包括音频包格式(a本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种利用元数据对基于音床的音频进行渲染的方法,其特征在于,包括:基于预先构建的音频模型,并通过类型标签将所述音频模型的参数保存在各自的数据结构;通过所述类型标签,引入保存在各自的数据结构的所述音频模型的参数,生成音频模型的音床类型的元数据对象;通过所述类型标签,引入保存在各自的数据结构的所述音频模型的参数和音床类型的元数据对象,生成音床类型的渲染项;所述音床类型的渲染项用于指示一个单独的音频通道格式或一组音频通道格式。2.根据权利要求1所述的方法,其特征在于,所述基于预先构建的音频模型,并通过类型标签将所述音频模型的参数保存在各自的数据结构包括:将通用数据合并为额外数据;所述通用数据包括音频对象开始时间、对象持续时间、屏幕参考和通道频率;或者,将重要数据存储在重要性数据结构中;所述重要数据包括音频对象和音频包。3.根据权利要求1所述的方法,其特征在于,所述基于预先构建的音频模型,并通过类型标签将所述音频模型的参数保存在各自的数据结构包括:将音频样本引用和封装在音轨规格结构中,并将其定义为音频样本源。4.根据权利要求3所述的方法,其特征在于,所述将音频样本引用和封装在音轨规格结构中,并将其定义为音频样本源的步骤还包括:将矩阵音频块格式系数元素中指定的参数应用于输入轨迹的音频样本;或者,指定应将至少一个封装在音轨规格结构输入的音频样本混合在一起。5.根据权利要求1、3或4任一所述的方法,其特征在于,所述通过所述类型标签,引入保存在各自的数据结构的所述音频模型的参数,生成音频模型的音床类型的元数据对象包括:引用音频块格式、包含音频通道格式的音频包格式集列表以及在额外数据...

【专利技术属性】
技术研发人员:吴健
申请(专利权)人:赛因芯微北京电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1