用于确定增强现实应用中音频上下文的系统和方法技术方案

技术编号：15338635 阅读：155 留言：0更新日期：2017-05-16 23:02

增强现实音频系统通过采样的音频信号来生成关于听觉环境的信息。使用高斯混合模型或其它技术，所述系统识别一个或多个音频源的位置，每个源将音频分量贡献至所采样的音频信号。所述系统使用音频分量确定听觉环境的混响时间。在确定混响时间时，所述系统可以丢弃来自被确定处于运动中的源的音频分量，诸如具有超过阈值的角速度的分量或具有超过阈值的多普勒偏移的分量。所述系统还可以丢弃来自具有超过阈值的信道间相干性的源的音频分量。在至少一个实施方式中，所述系统使用在与音频源分离的虚拟位置处的混响时间渲染声音。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于确定增强现实应用中音频上下文的系统和方法相关申请的交叉引用本申请要求于2014年7月23日递交的且标题为“SystemandMethodforDeterminingAudioContextinAugmented-RealityApplications”的美国临时专利申请序列号62/028，121的优先权和权益，其全部内容通过引用合并于此。
本公开涉及增强现实系统的音频应用。
技术介绍
当渲染增强现实应用中音频上下文时，具有关于现行音频情景上下文的信息是很重要的。增强现实内容需要符合周围环境和上下文以对增强现实应用的用户显得自然。例如，当增强音频场景内的人工音频源时，如果源混响不同于用户周围的音频场景的混响，或者如果内容在与环境源相同的相关方向被渲染，在所述内容听起来不是自然的并且不能提供自然的用户体验。当音频标签在域中或相对于用户在预定位置被增强时，这在虚拟现实游戏和娱乐中尤其重要。为了实现自然渲染，期望应用上下文分析以获得包括提供可靠的混响估计的给定音频场景的准确估计。这类似于对针对在增强现实屏幕上渲染的视觉分量具有匹配的照度和恰当的阴影的期望。混响估计通常通过搜索音频内容内衰减事件而来进行。在最佳情况中，估计器检测脉冲式声音事件，其衰减拖尾揭示了给定空间的混响条件。自然地，估计器还检测自然缓慢衰减的信号。在这种情况下，观测的衰减率为源信号衰减和给定空间的混响的结合。此外，通常假设音频场景是静止的，即，声音源不移动。然而，混响估计算法可能将移动的音频源检测为衰减信号源，这引起估计结果的误差。混响上下文仅仅在存在活跃音频源时可以被检测。然而，不是所有音...
用于确定增强现实应用中音频上下文的系统和方法

【技术保护点】
一种方法，该方法包括：从多个麦克风采样音频信号；从所采样的音频信号确定至少一个音频源的相应位置；以及渲染具有与所确定的至少一个位置相隔至少阈值间隔的虚拟位置的增强现实音频信号。

【技术特征摘要】
【国外来华专利技术】2014.07.23 US 62/028,1211.一种方法，该方法包括：从多个麦克风采样音频信号；从所采样的音频信号确定至少一个音频源的相应位置；以及渲染具有与所确定的至少一个位置相隔至少阈值间隔的虚拟位置的增强现实音频信号。2.根据权利要求1所述的方法，通过增强现实头戴式设备完成所述方法。3.根据权利要求1所述的方法，其中渲染包括应用头相关传递函数滤波。4.根据权利要求1所述的方法，其中所确定的位置是角位置，并且其中所述阈值间隔是阈值角距离。5.根据权利要求4所述的方法，其中所述阈值角距离具有从包含5度和10度的组选择的值。6.根据权利要求1所述的方法，其中所述至少一个音频源包括多个音频源，并且其中所述虚拟位置与各所确定的位置中的每一者相隔至少所述阈值间隔。7.根据权利要求6所述的方法，该方法进一步包括基于从包含谐振频率、声级和相干性的范围的组中选择的一个或多个统计特性来在所述多个音频源之间进行区分。8.根据权利要求6所述的方法，其中所述多个音频源中的每一者将相应音频分量贡献至所采样的音频信号，所述方法进一步包括：确定所述音频分量中的每一者具有超过预定相干性等级阈值的相应相干性等级。9.根据权利要求6所述的方法，所述方法进一步包括使用高斯混合模型识别所述多个音频源中的每一者。10.根据权利要求6所述的方法，该方法进一步包括至少部分通过确定到达数据的方向的概率密度函数来识别所述多个音频源中的每一者。11.根据权利要求6所述的方法，该方法进一步包括至少部分通过模型化到达数据的方向概率密度函数作为所述多个音频源的概...

【专利技术属性】
技术研发人员：P·S·奥贾拉，
申请(专利权)人：PCMS控股公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人