使用音频对象的时间变化的音频对象聚类制造技术

技术编号：11988063 阅读：89 留言：0更新日期：2015-09-02 17:02

本发明专利技术的实施例涉及使用音频对象的时间变化的音频对象聚类。提供一种用于在音频对象聚类中使用音频对象的时间变化的方法。该方法包括：获取与所述音频对象相关联的音轨的至少一个片段，所述至少一个片段包含所述音频对象；基于所述音频对象的至少一个属性，估计所述音频对象在所述至少一个片段的持续时间上的变化；以及至少部分地基于估计的所述变化，调整所述音频对象在所述音频对象聚类中对聚类中心的确定的贡献。还公开了相应的系统和计算机程序产品。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术总体上涉及音频对象聚类，更具体地，涉及用于在音频对象聚类中使用音频对象的时间变化的方法和系统。
技术介绍
传统上，音频内容W基于声道（channel based)的格式被创建和存储。在此使用的术语"音频声道"或"声道"是指通常具有预定义物理位置的音频内容。例如，立体声、环绕5. 1、环绕7. 1等都是用于音频内容的基于声道的格式。近来，很多传统的多声道系统已经被扩展为支持一种新型格式，该种格式包括声道和音频对象二者。在此使用的术语"音频对象"或简称"对象"是指在声场中存在特定持续时间的个体音频元素。一个音频对象可W是动态的也可W是静态的。例如，音频对象可W是人、动物或者能够充当声源的任何其他元素。音频对象和声道可W被分开发送，继而由重现系统动态使用W便基于回放设备的配置来自适应地重建创作意图。作为示例，在称为"自适应音频内容"（adaptive audio content)的格式中，可W存在一个或多个音频对象W及一个或多个"静态环境声"（audio bed),静态环境声是将W预定义的、固定的位置进行重现的声道。通过创建更具沉浸感的声场W及精准地控制离散的音频对象（无需考虑回放设备的特定配置），基于对象的音频内容相对于传统基于声道的音频内容而言代表着显著的进步。例如，在电影的音轨中可W包含多个不同声音元素，W对应于屏幕上画面、对话、噪声和音效，该些音效从画面上的不同位置发出，并且与背景音乐和环境音效结合W创建整体的听觉体验。然而，基于对象的音频内容中的大量音频信号（静态环境声和音频对象）给音频内容的编码和...

【技术保护点】
一种用于在音频对象聚类中使用音频对象的时间变化的方法，所述方法包括：获取与所述音频对象相关联的音轨的至少一个片段，所述至少一个片段包含所述音频对象；基于所述音频对象的至少一个属性，估计所述音频对象在所述至少一个片段的持续时间上的变化；以及至少部分地基于估计的所述变化，调整所述音频对象在所述音频对象聚类中对聚类中心的确定的贡献。

【技术特征摘要】

【专利技术属性】
技术研发人员：陈连武，芦烈，J·布里巴特，
申请(专利权)人：杜比实验室特许公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人