用于捕获、编码、分布和解码沉浸式音频的系统和方法技术方案

技术编号：16935060 阅读：55 留言：0更新日期：2018-01-03 05:28

一种提供用与标准的两声道或多声道再现系统兼容的通用数字音频格式编码的沉浸式音频录制的灵活捕获、分布和再现的声场编码系统和方法。该端到端系统和方法缓解了对消费者移动设备(诸如智能电话或相机)中的标准的多声道麦克风阵列配置的任何不切实际的需要。该系统和方法从灵活的多声道麦克风阵列配置捕获与传统回放系统兼容的两声道或多声道沉浸式音频信号，并且对这些音频信号进行空间编码。

Systems and methods used to capture, code, distribute and decode immersion audio

A sound field coding system and method for flexible capture, distribution and reproduction of immersive audio recording encoded by a standard two channel or multichannel reproduction system are provided. The end to end system and method alleviated any unrealistic needs for standard multi-channel microphone array configuration in consumer mobile devices, such as smart phones or cameras. The system and method capture the two channel or multichannel immersive audio signals compatible with the traditional playback system from the flexible multichannel microphone array configuration, and encode the audio signals in space.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于捕获、编码、分布和解码沉浸式音频的系统和方法相关申请的交叉引用本申请要求2015年1月30日提交的、标题为“SystemandMethodforCapturingandEncodinga3-DAudioSoundfield”的美国临时专利申请第62/110,211号的权益，这两篇申请的全部内容通过引用并入本文。
技术介绍
随着专用的录制设备变得更加便携和更加实惠，并且随着录制能力在日常设备(诸如智能电话)中变得更加普及，音频内容的捕获(经常与视频结合)已经变得越来越普遍。视频捕获的质量已经持续提高，并且已经超过了音频捕获的质量。现代移动设备上的视频捕获通常是高分辨率的而且DSP处理密集的，但是伴随的音频内容一般是以低保真度和很少的额外处理用单声道捕获的。为了捕获空间线索，许多现有的音频录制技术采用至少两个麦克风。作为一般规则，录制360度水平环绕音频场景需要至少3个音频声道，而录制三维音频场景需要至少4个音频声道。虽然多声道音频捕获被用于沉浸式音频录制，但是目前可用的更普及的消费者音频递送技术和分布框架限于传输两声道音频。在标准的两声道立体声再现中，存储的或传输的左音频声道和右音频声道意图分别在左和右扩音器或耳机上直接回放。为了回放沉浸式音频录制，可能需要在各种回放配置中渲染录制的空间音频信息。这些回放配置包括耳机、前置条形音箱(sound-bar)扩音器、前置分立扩音器对、5.1水平环绕扩音器阵列以及包括高度声道的三维扩音器阵列。不论回放配置如何，期望的是为收听者再现空间音频场景，该空间音频场景是捕获的音频场景的基本精确的表示。另外，有利的是提供对于特定回...
用于捕获、编码、分布和解码沉浸式音频的系统和方法

【技术保护点】
一种用于对多个麦克风信号进行处理的方法，包括：选择具有用于从至少一个音频源捕获声音的多个麦克风的麦克风配置，该麦克风配置限定所述多个麦克风中的每个相对于参考方向的麦克风方向性；选择具有多个虚拟麦克风的虚拟麦克风配置，虚拟麦克风配置用于对关于所述至少一个音频源相对于参考方向的位置的空间信息进行编码；基于麦克风配置和虚拟麦克风配置来计算空间编码系数；以及将所述多个麦克风信号转换为包括虚拟麦克风信号的空间编码信号(SES)；其中虚拟麦克风信号中的每个是通过使用空间编码系数组合麦克风信号而获得的。

【技术特征摘要】
【国外来华专利技术】2015.01.30 US 62/110,2111.一种用于对多个麦克风信号进行处理的方法，包括：选择具有用于从至少一个音频源捕获声音的多个麦克风的麦克风配置，该麦克风配置限定所述多个麦克风中的每个相对于参考方向的麦克风方向性；选择具有多个虚拟麦克风的虚拟麦克风配置，虚拟麦克风配置用于对关于所述至少一个音频源相对于参考方向的位置的空间信息进行编码；基于麦克风配置和虚拟麦克风配置来计算空间编码系数；以及将所述多个麦克风信号转换为包括虚拟麦克风信号的空间编码信号(SES)；其中虚拟麦克风信号中的每个是通过使用空间编码系数组合麦克风信号而获得的。2.根据权利要求1所述的方法，其中空间信息被以以下中的一个的形式编码：(a)声道间振幅；以及(b)相位差。3.根据权利要求2所述的方法，进一步包括选择具有多个虚拟麦克风的虚拟麦克风配置，虚拟麦克风配置用于对关于音频源相对于参考方向的位置的空间信息进行编码。4.根据权利要求1所述的方法，其中所述多个麦克风信号是A格式麦克风信号，进一步包括将A格式麦克风信号转换为B格式麦克风信号。5.根据权利要求4所述的方法，进一步包括从B格式麦克风信号形成虚拟麦克风方向性图案。6.根据权利要求5所述的方法，进一步包括使用以下等式来形成虚拟麦克风方向性图案：

【专利技术属性】
技术研发人员：M·M·古德文，JM·卓特，M·沃尔什，
申请(专利权)人：DTS公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人