音频场景处理制造技术

技术编号：25127748 阅读：24 留言：0更新日期：2020-08-05 02:57

公开了一种装置，包括：用于从音频场景中的多个音频对象中标识感兴趣的一个或多个音频对象部件；以及用于处理与多个对象相关联的第一音频信号，以用于提供给用户设备的部件。处理可以基于用户设备在音频场景中的位置。处理可以包括：组合与音频对象相关联的第一音频信号，以形成经组合的第一音频信号；修改经组合的第一音频信号的振幅并且将经组合的第一音频信号的最大振幅限制为第一电平；以及修改与感兴趣的一个或多个音频对象相关联的一个或多个个体第一音频信号的振幅，所述修改独立于经组合的第一音频信号的振幅。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】音频场景处理
本公开涉及用于音频场景处理的方法和系统，尤其是(但不排他地)用于包括来自一个或多个音频对象的空间音频的虚拟现实(VR)和增强现实(AR)内容的方法和系统。
技术介绍
虚拟现实(VR)是将视频内容和音频内容中的一者或两者提供给用户设备的快速发展的
用户设备可以被提供有来自内容源的实时或所存储的馈送，该馈送表示用于通过用户设备进行沉浸式输出的虚拟现实空间或世界。在提供音频的情况下，可以是空间音频的音频表示从多个音频对象捕获或合成的音频。虚拟空间或虚拟世界是空间(例如捕获到的现实世界空间)的任何计算机生成的版本，用户可以通过诸如虚拟现实头戴式受话器的用户设备而沉浸其中。虚拟现实头戴式受话器可以被配置为例如通过使用被并入在头戴式受话器内的视频屏幕和头戴式耳机对来向用户提供虚拟现实视频和空间音频内容中的一者或多者。用户设备的位置和/或移动可以增强沉浸式体验。一些虚拟现实用户设备使用所谓的三自由度(3DoF)，其意味着偏航轴、俯仰轴以及滚转轴中的头部移动被测量到并且确定用户看到和听到的内容。在用户旋转其头部时，这促进了场景在单个位置中主要保持静态。下一阶段可以被称为3DoF+，其可以促进例如在位置周围的数十厘米的范围内的欧几里德空间中的有限平移移动。又一阶段是六自由度(6DoF)系统，其中，用户能够在欧几里德空间中自由地移动并且在偏航轴、俯仰轴以及滚转轴中旋转其头部。六自由度系统和方法将实现体积虚拟现实内容的供应和消耗。体积虚拟现实内容包括从所有角度以三维度来表示空间和/或对象的数据，使用户...

【技术保护点】
1.一种装置，包括：/n用于从音频场景中的多个音频对象中标识一个或多个感兴趣的音频对象的部件；/n用于通过以下操作来处理与多个所述对象相关联的第一音频信号以用于提供给用户设备的部件：/n组合与所述音频对象中的至少一些音频对象相关联的第一音频信号，以形成组合的第一音频信号；/n修改所述经组合的第一音频信号的振幅并且将所述经组合的第一音频信号的最大所述振幅限制为第一电平；以及/n修改与所述感兴趣的一个或多个音频对象相关联的一个或多个个体第一音频信号的所述振幅，所述修改独立于针对所述经组合的第一音频信号的修改。/n

【技术特征摘要】
【国外来华专利技术】20171227 EP 17210625.41.一种装置，包括：
用于从音频场景中的多个音频对象中标识一个或多个感兴趣的音频对象的部件；
用于通过以下操作来处理与多个所述对象相关联的第一音频信号以用于提供给用户设备的部件：
组合与所述音频对象中的至少一些音频对象相关联的第一音频信号，以形成组合的第一音频信号；
修改所述经组合的第一音频信号的振幅并且将所述经组合的第一音频信号的最大所述振幅限制为第一电平；以及
修改与所述感兴趣的一个或多个音频对象相关联的一个或多个个体第一音频信号的所述振幅，所述修改独立于针对所述经组合的第一音频信号的修改。

2.根据权利要求1所述的装置，还包括用于随后将受到所述第一电平限制的所述经组合的第一音频信号与所述一个或多个个体第一音频信号组合并且将所得信号提供给所述用户设备的部件。

3.根据权利要求1或权利要求2所述的装置，其中所述处理部件：
在第一处理路径中，将第一动态范围压缩应用于所述经组合的第一音频信号；以及
在第二处理路径中，将个体第二动态范围压缩应用于分别与所述感兴趣的一个或多个对象相关联所述一个或多个个体第一音频信号。

4.根据权利要求3所述的装置，其中所述处理部件还执行：
在组合之前在所述第一处理路径中对所述第一音频信号进行放大；以及
在将个体的第二动态范围压缩应用于所述一个或多个个体第一音频信号之后在所述第二处理路径中进行放大，所述放大基于的是所述用户设备距感兴趣的所述一个或多个音频对象的距离。

5.根据权利要求4所述的装置，其中所述放大通过所述用户设备距所述感兴趣的一个或多个音频对象的倒排距离而被确定。

6.根据权利要求3至5中任一项所述的装置，其中感兴趣的多个对象通过所述标识部件而被标识，并且其中通过所述处理部件被个体地应用于每个个体第一音频信号的所述第二动态范围压缩具有不同动态范围压缩特性。

7.根据权利要求3至6中任一项所述的装置，其中所述处理部件被配置为使得分别与所述感兴趣的一个或多个对象相关联的一个或多个第一音频信号的比例(i)在组合并且应用第一动态范围压缩之前被减小，并且(ii)同时在将个体第二动态范围压缩应用于所述一个或多个信号之前被增大。

8.根据权利要求1至6中任一项所述的装置，其中处理部件被配置为使得所述经组合的第一音频信号仅包括与除了感兴趣的所述一个或多个音频对象之外的音频对象相关联的第一音频信号。

9.根据任一项前述权利要求所述的装置，其中所述处理部件通过求和来组合所述音频信号。

10.根据任一项前述权利要求所述的装置，其中所述感兴趣的一个或多个对象基于距所述用户设备的距离而被标识。

11.根据任一项前述权利要求所述的装置，其中所述感兴趣的一个或多个对象基于所述用户设备相对于所述对象的移动方向而被标识。

【专利技术属性】
技术研发人员：A·埃罗南，J·A·利帕南，S·S·马特，A·勒蒂涅米，
申请(专利权)人：诺基亚技术有限公司，
类型：发明
国别省市：芬兰;FI

全部详细技术资料下载我是这个专利的主人