基于菁彩声Audio Vivid的音频制作监听系统技术方案

技术编号：42064269 阅读：11 留言：0更新日期：2024-07-19 16:48

本发明专利技术公开了一种基于菁彩声Audio Vivid的音频制作监听系统，包括工作机、服务器和终端设备，服务器进一步包括解码模块、制作模块、渲染模块、编码模块、监测模块以及监听模块，工作机将音频数据发送至解码模块进行解码，得到PCM裸数据；制作模块用于对音频裸数据按照声床和对象分类处理，并制作相关的元数据；将声源信息和元数据一起送到渲染模块中，根据不同的终端按照设定渲染状态输出，获取渲染后的PCM裸数据；针对不同场景的用途，将渲染后的PCM裸数据通过编码模块进行编码处理或直接传输的方式进行输出；对输出的音频设定指标门限值，采用监测模块进行客观监测指标打分；通过对输出的音频连接对应的终端播放，采用监听模块进行主观指标监听打分。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于音频处理，具体涉及一种基于菁彩声audio vivid的音频制作监听系统。

技术介绍

1、audio vivid，也被称为菁彩声，是全球首个基于ai技术的音频编解码标准。它由世界超高清视频产业联盟(ultra high definition world association，uwa)与数字音视频编解码技术标准工作组(audio video coding standard working group ofchina，avs)联合制定。audio vivid支持主流三维声编码，同时兼容单声道、立体声、环绕声和三维声，使得声音可以在三维空间的任何位置精准放置和移动，从而准确描述每一个声音的位置、大小、轨迹、时间和长度。这种技术为声音艺术家提供了更强大、更高效的创作工具，使他们可以在三维空间中进行创作，为听众提供极致的沉浸式听觉体验。

2、目前国内采用的华为自研的vst3三维声插件工具花瓣三维声(petal vivid)，其中花瓣三维声安装程序组件由petal vivid panner，petal vivid renderer和petalvivid return组成。petal vivid panner支持对已挂载该插件的音频进行空间位置编辑并将编辑后的音频与空间位置信息传入petal vivid renderer进行空间渲染。petal vividrenderer支持对收到的多对象音频进行三维声混音，以及录制三维声母带并渲染导出。petal vivid return支持将petal vivid render

技术实现思路

1、鉴于以上存在的问题，本专利技术提供一种基于菁彩声audio vivid的音频制作监听系统。

2、为解决上述技术问题，本专利技术采用如下的技术方案：

3、一种基于菁彩声audio vivid的音频制作监听系统，包括工作机、服务器和终端设备，所述服务器进一步包括解码模块、制作模块、渲染模块、编码模块、监测模块以及监听模块，

4、所述工作机将音频数据发送至解码模块进行解码，得到pcm裸数据；

5、所述制作模块用于对音频裸数据按照声床和对象分类处理，并制作相关的元数据；

6、将声源信息和元数据一起送到渲染模块中，根据不同的终端按照设定渲染状态输出，获取渲染后的pcm裸数据；

7、针对不同场景的用途，将渲染后的pcm裸数据通过编码模块进行编码处理或直接传输的方式进行输出；

8、对输出的音频设定指标门限值，采用监测模块进行客观监测指标打分，对输出的音频设置指标门限值；

9、通过对输出的音频连接对应的终端播放，采用监听模块进行主观指标监听打分。

10、一种可能的实施方式中，所述音频数据包括音频码流或音频文件。

11、一种可能的实施方式中，所述制作模块用于对音频裸数据按照声床和对象分类处理，并制作相关的元数据具体包括：对音频裸数据进行划分，将一部分设定为声床，通过预设扬声器布局和声场信息配置静态元数据；将另一部分设置为对象，通过对对象轨迹的绘制制作动态元数据。

12、一种可能的实施方式中，根据不同的终端按照设定渲染状态输出具体包括：不同终端包括移动终端、家庭终端和音箱终端，移动终端包括双耳渲染模式；家庭终端包括常规立体声效音箱5.1、7.1模式；音箱终端包括5.1.2、5.1.4、7.1.4模式。

13、一种可能的实施方式中，所述通过编码模块进行编码处理中音频编码格式包括菁彩声标准的av3a格式、wav和adm。

14、一种可能的实施方式中，所述直接传输的方式进行输出包括通过aes67进行2110-30的pcm音频数据输出。

15、一种可能的实施方式中，客观监测指标具体包括：通用的客观质量数值表征包括源输入音频类型、源输入音频位深、编码方式、采样率、通道名称、通道输入电平、对象通道号、对象坐标系、对象当前增益值、hoa布局、项目信息、通道声场位置、聚合响度值、响度范围值、最大真峰值、最大瞬时响度和平均对话响度；针对码流的客观质量监测还包含音频连续性错误、丢包、信源状态和音频流状态；音频内容信息的评价包括通道输入电平、响度、声道信号、对象信号、hoa信号以及元数据。

16、一种可能的实施方式中，主观指标包括总体音质、定位和空间感。

17、采用本专利技术具有如下的有益效果：仅需通过工作机向服务器发送基础音频信息以及音频制作指令，在内部进行渲染、编码输出，即可获取到面对不同场景的最终音频内容，不需要其他的系统搭配，即可完成从制作、渲染、传输分发、监测监听等一系列工作内容，大大降低了音频制作成本，提高工作效率；通过系统可以将菁彩声audio vivid从制作到分发完成端到端链路传递，可用于音频创作、交付、仿真监听等多种应用场景；从制作到渲染，支持动态切换多种终端场景，包含移动终端、家庭终端、音箱终端，从而满足场景制作要求；基于多种渲染模式以及输出方案，建立主客观评价机制，更加全面对音频进行测评。

本文档来自技高网...

【技术保护点】

1.一种基于菁彩声Audio Vivid的音频制作监听系统，其特征在于，包括工作机、服务器和终端设备，所述服务器进一步包括解码模块、制作模块、渲染模块、编码模块、监测模块以及监听模块，

2.如权利要求1所述的基于菁彩声Audio Vivid的音频制作监听系统，其特征在于，所述音频数据包括音频码流或音频文件。

3.如权利要求1所述的基于菁彩声Audio Vivid的音频制作监听系统，其特征在于，所述制作模块用于对音频裸数据按照声床和对象分类处理，并制作相关的元数据具体包括：对音频裸数据进行划分，将一部分设定为声床，通过预设扬声器布局和声场信息配置静态元数据；将另一部分设置为对象，通过对对象轨迹的绘制制作动态元数据。

4.如权利要求1所述的基于菁彩声Audio Vivid的音频制作监听系统，其特征在于，根据不同的终端按照设定渲染状态输出具体包括：不同终端包括移动终端、家庭终端和音箱终端，移动终端包括双耳渲染模式；家庭终端包括常规立体声效音箱5.1、7.1模式；音箱终端包括5.1.2、5.1.4、7.1.4模式。

5.如权利要求1所述的基

6.如权利要求1所述的基于菁彩声Audio Vivid的音频制作监听系统，其特征在于，所述直接传输的方式进行输出包括通过AES67进行2110-30的PCM音频数据输出。

7.如权利要求1所述的基于菁彩声Audio Vivid的音频制作监听系统，其特征在于，客观监测指标具体包括：通用的客观质量数值表征包括源输入音频类型、源输入音频位深、编码方式、采样率、通道名称、通道输入电平、对象通道号、对象坐标系、对象当前增益值、HOA布局、项目信息、通道声场位置、聚合响度值、响度范围值、最大真峰值、最大瞬时响度和平均对话响度；针对码流的客观质量监测还包含音频连续性错误、丢包、信源状态和音频流状态；音频内容信息的评价包括通道输入电平、响度、声道信号、对象信号、HOA信号以及元数据。

8.如权利要求1所述的基于菁彩声Audio Vivid的音频制作监听系统，其特征在于，主观指标包括总体音质、定位和空间感。

...

【技术特征摘要】

1.一种基于菁彩声audio vivid的音频制作监听系统，其特征在于，包括工作机、服务器和终端设备，所述服务器进一步包括解码模块、制作模块、渲染模块、编码模块、监测模块以及监听模块，

2.如权利要求1所述的基于菁彩声audio vivid的音频制作监听系统，其特征在于，所述音频数据包括音频码流或音频文件。

3.如权利要求1所述的基于菁彩声audio vivid的音频制作监听系统，其特征在于，所述制作模块用于对音频裸数据按照声床和对象分类处理，并制作相关的元数据具体包括：对音频裸数据进行划分，将一部分设定为声床，通过预设扬声器布局和声场信息配置静态元数据；将另一部分设置为对象，通过对对象轨迹的绘制制作动态元数据。

4.如权利要求1所述的基于菁彩声audio vivid的音频制作监听系统，其特征在于，根据不同的终端按照设定渲染状态输出具体包括：不同终端包括移动终端、家庭终端和音箱终端，移动终端包括双耳渲染模式；家庭终端包括常规立体声效音箱5.1、7.1模式；音箱终端包括5.1.2、5.1.4、7.1.4模式。

5.如权利要求1所述的...

【专利技术属性】
技术研发人员：夏道应，叶建华，陈家兴，刘坤，任博豪，
申请(专利权)人：杭州当虹科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人