用于改进音频虚拟化的系统和方法技术方案

技术编号:20025205 阅读:28 留言:0更新日期:2019-01-06 04:16
当收听者自己成为双耳房间脉冲响应测量的受试者时,虚拟音响室的呈现是最逼真的,并且当涉及的音响室具有高声学保真度时,最令人愉悦。在收听者无法访问良好的音响室的情况下,使用来自收听者的个性化双耳脉冲响应数据的信息来修改非个性化的高保真音响室,以改善这些房间的真实感。在音响室可用的情况下,来自更高保真度的非个性化音响室的信息用于改善收听者的个性化房间数据的声音质量。或者,可以通过根据收听者的口味修改其混响特性来改善个性化或非个性化的房间。

【技术实现步骤摘要】
【国外来华专利技术】用于改进音频虚拟化的系统和方法
本专利技术总体上涉及通过耳机(headphone或earphone)的三维音频再现或音频虚拟化领域。
技术介绍
双耳房间脉冲响应的捕获及其随后用于创建虚拟化声音的用法是众所周知的,参见例如国际专利申请WO2006024850。总之,双耳房间脉冲响应包括房间内声源的脉冲响应数据,例如扬声器,放置在相对于头部的特定方位,通过将麦克风放入左耳和右耳管中或周围,在头部测量其传递函数。双耳脉冲响应的常见用途是用于通过耳机虚拟化扬声器。通过用双耳脉冲响应卷积或渲染音频信号来实现虚拟化,然后通过耳机将其呈现给收听者。在这些应用中,意图通常是在空间性、音色和房间混响方面忠实地再现真实扬声器的声音。不幸的是,真实度,即,通过耳机听到的虚拟化扬声器相比于真实扬声器的相似程度取决于收听者是使用在他们自己的耳朵处还是在不同头部的耳朵处测量的脉冲数据。当使用在他们自己的耳朵处测量的脉冲数据时,虚拟和真实声音好像可以几乎相同,从而产生非常有效的外放体验。另一方面,使用在别处测量的脉冲数据来收听呈现的虚拟化声音,真实度通常会相当低。尽管个性化脉冲测量(PRIR)非常有效,但是除非收听者能够访问具有良好声学特性的专业音响室、高质量的声音再现设备和适当的扬声器布局,否则难以获得高保真度测量。在家中进行测量,虽然足够简单,但通常只能达到它们所制造的房间的相同声学特性。提高房间的保真度通常需要对房间表面进行结构改变和巨大的声学处理,所有这些通常都超出普通收听者的范围。因此,希望改进通过耳机(headphone或earphone)呈现的虚拟音响室或音频虚拟化。专利
技术实现思路
本专利技术的第一方面提供了一种根据权利要求1所述的用于创建双耳房间脉冲响应数据的方法。本专利技术的第二方面提供了一种根据权利要求29所述的用于修改表示双耳房间脉冲响应的数据的方法。本专利技术的第三方面提供了一种根据权利要求37所述的用于产生双耳房间脉冲响应数据的数字信号处理装置。本专利技术的第四方面提供了一种根据权利要求39所述的用于修改表示双耳房间脉冲响应的数据的数字信号处理装置。本专利技术的第五方面提供了一种根据权利要求40所述的音频虚拟化方法。本专利技术的第六方面提供了一种根据权利要求41所述的音频虚拟化系统。本专利技术的优选实施例涉及修改双耳房间脉冲响应,无论是使用假人的头部还是人类受试者的头部来记录,都是为了改善虚拟化房间的真实性和声音质量。本专利技术的各方面提供了一种方法和装置,其允许通过操纵BRIR或PRIR数据来主观改进在耳机上呈现的虚拟音响室。双耳房间脉冲响应包括对收听者的每个耳朵(左和右)的相应脉冲响应。当记录脉冲响应时,目标收听者可以是真人(在这种情况下,可以说得到的响应数据是对该人个性化的),或者可以是假人或除目标收听者之外的人(在这种情况下,可以说得到的响应数据是非个性化的)。每个脉冲响应的特征在于传递函数。传递函数确定或表征输入信号如何变换以产生输出信号。在房间脉冲函数的上下文中,传递函数包括头部相关传递函数(HRTF),其表征耳朵如何从空间中的点接收声音。每个脉冲响应包括头部相关脉冲响应(HRIR)部分、早期反射部分和混响部分。在时域中,HRIR是这些部分中的第一部分,即它包括初始时间段内的脉冲响应部分。该初始时间段对应于任何反射声音到达耳朵之前的时间段。这样,HRIR可以视为脉冲响应的非房间相关部分。早期反射部分出现在HRIR部分之后,即它包括在所述初始时间段之后的第二时间段内的一部分脉冲响应。第二时间段对应于反射从房间中的表面(例如物体、墙壁、地板和天花板)到达耳朵的时间段。这些反射可以认为是早期反射,因为它们可以主要包括在到达耳朵之前已经反射过一次的信号。混响部分(也可以称为后期反射部分)出现在早期反射部分之后,即它包括在所述第二时间段之后的第三时间段内的一部分脉冲响应。第三时间段对应于进一步的反射从房间中的表面(例如物体、墙壁、地板和天花板)到达耳朵的时间段。这些反射可以认为是后期反射,因为它们可以主要包括在到达耳朵之前已经反射不止一次的信号。早期反射部分和混响部分可以认为是脉冲响应的房间相关部分。从每个或至少一对脉冲响应(即,对于左耳和右耳中的每一个)可以确定耳间延迟(ITD)。ITD(也可称为耳间差异)表示两耳之间的声学路径差异。通常,双耳房间脉冲响应数据集包括表示多个双耳房间脉冲响应的数据,每个双耳房间脉冲响应与不同的扬声器到头部方向相关联。通常,指示ITD的数据包括在双耳房间脉冲响应数据集中。双耳房间脉冲数据集用在数字信号处理装置中,例如称为音频虚拟器的类型,以将从扬声器接收的输入音频信号变换为虚拟化音频信号。通过耳机将虚拟化的音频信号呈现给收听者。因此,音频虚拟器可以包含在耳机的输入接口和输出接口之间。双耳房间脉冲数据集可以称为数字滤波器。出于本专利技术的目的,PRIR定义为在同一个人(即,目标(人类)收听者)的耳朵处测量的双耳房间脉冲响应,其听取由这种脉冲数据(即个性化)呈现的虚拟化耳机或耳机电话声音。而BRIR定义为通用双耳房间脉冲响应,其不是在目标收听者的耳朵处测量的,即非个性化的。希望使用本专利技术以改善他们通过耳机听到的内容的人本文称为收听者。本文使用的术语“耳机(headphone)”旨在包括“耳机(earphone)”。根据本专利技术的一个方面,提供了一种方法和装置,用于通过将来自收听者的PRIR数据集的某些信息结合到所述BRIR数据集中来获取BRIR数据集并改善该虚拟音响室的感知质量。这种方法很重要,因为收听者在他们自己的家中测量他们自己的PRIR相对容易,并且然后,例如,通过互联网下载从世界上的任何地方获得高质量的音响室BRIR。可以说本专利技术的这个和类似的方面涉及用另一个双耳房间脉冲响应数据集的相应的一个或多个非房间相关部分替换双耳房间脉冲响应数据集的一个或多个非房间相关部分,特别是前者是非个性化的而后者是个性化的。根据本专利技术的另一方面,提供了一种方法和装置,用于通过使其混响特性和/或其早期反射特性与BRIR数据集的特性一致来获取收听者的PRIR数据集并改善所述PRIR虚拟音响室的感知质量。这种方法在PRIR和BRIR数据集表示相似大小的房间和扬声器布局以及它们之间的混响特性差异适中的情况下是特别有效的。该方法的示例应用是当收听者希望通过使用更高质量的BRIR数据集作为参考来改善其家庭影院PRIR数据集的声音质量时。可以说本专利技术的这个和类似的方面涉及用另一个双耳房间脉冲响应数据集的一个或多个相应房间相关部分替换双耳房间脉冲响应数据集的一个或多个房间相关部分,特别是后者数据集是在具有比前者数据集更好的声学特性的房间中创建的(并且通常前者数据集是个性化的而后者是非个性化的)。根据本专利技术的另一方面,提供了一种方法和装置,用于允许收听者在时间和频率上手动调整PRIR、BRIR、混合PRIR或混合BRIR数据集的混响特性,作为改善其中包含的虚拟音响室的感知质量的装置。从另一方面来看,本专利技术提供了一种通过改变所述BRIR脉冲数据的某些特征来改善非个性化双耳房间脉冲响应(BRIR)的感知空间和/或音色自然度的方法,以更接近地匹配在收听者自己的个性化双耳房间脉冲数据集(PRIR)中发现的那些特征。有利地,所述BRIR的头部相关本文档来自技高网
...

【技术保护点】
1.一种用于创建双耳房间脉冲响应数据的数字信号处理方法,所述方法包括:提供表示个性化双耳房间脉冲响应的数据,所述个性化双耳脉冲响应是针对目标收听者创建的;提供表示非个性化双耳房间脉冲响应的数据,所述非个性化双耳脉冲响应是针对除目标收听者之外的假人或人创建的;并且使用所述个性化双耳脉冲响应数据和所述非个性化双耳脉冲响应数据来创建表示混合双耳房间脉冲响应的数据。

【技术特征摘要】
【国外来华专利技术】2016.05.24 GB 1609089.61.一种用于创建双耳房间脉冲响应数据的数字信号处理方法,所述方法包括:提供表示个性化双耳房间脉冲响应的数据,所述个性化双耳脉冲响应是针对目标收听者创建的;提供表示非个性化双耳房间脉冲响应的数据,所述非个性化双耳脉冲响应是针对除目标收听者之外的假人或人创建的;并且使用所述个性化双耳脉冲响应数据和所述非个性化双耳脉冲响应数据来创建表示混合双耳房间脉冲响应的数据。2.根据权利要求1所述的方法,其中所述数据包括多个部分,每个部分代表所述相应双耳房间脉冲响应的不同方面,并且其中创建所述混合双耳房间脉冲响应数据涉及使用所述个性化双耳房间脉冲响应数据的至少一部分来提供所述混合双耳房间脉冲响应数据的所述或每个相应部分,并且通过使用所述非个性化双耳房间脉冲响应数据的至少一个其他部分来提供所述混合双耳房间脉冲响应数据的所述或每个其他相应部分。3.根据权利要求2所述的方法,其中所述多个部分包括表示相应双耳房间脉冲响应的一部分的第一部分,其独立于所述相应双耳房间脉冲响应所代表的房间,并且其中创建所述混合双耳房间脉冲响应数据涉及使用所述个性化双耳房间脉冲响应数据的第一部分来提供所述混合双耳房间脉冲响应数据的第一部分。4.根据权利要求3所述的方法,其中所述第一部分包括表示相应双耳房间脉冲响应的头部相关脉冲响应(HRIR)部分的数据,并且其中所述个性化双耳房间脉冲响应数据的所述HRIR部分用于提供所述混合双耳房间脉冲响应数据的HRIR部分。5.根据权利要求4所述的方法,其中HRIR数据部分包括表示个性化双耳房间脉冲响应的HRIR部分的一个或多个频率分量的数据。6.根据权利要求4或5所述的方法,包括滤波,优选高通滤波或带通滤波,所述个性化双耳房间脉冲响应的所述HRIR数据部分,并使用所述滤波后的HRIR数据部分以提供所述混合双耳房间脉冲响应数据的HRIR部分。7.根据权利要求3至6中任一项所述的方法,包括用所述个性化双耳房间脉冲响应数据的第一部分覆盖所述非个性化双耳房间脉冲响应数据的所述第一部分,以创建所述混合双耳房间脉冲响应数据。8.根据权利要求7所述的方法,包括滤波,优选高通滤波或带通滤波,在所述覆盖之前,每个所述个性化和非个性化双耳房间脉冲响应数据的相应第一部分。9.根据前述权利要求中任一项所述的方法,其中相应的双耳房间脉冲响应数据包括表示耳间时间延迟的数据,并且其中所述个性化双耳房间脉冲响应的耳间时间延迟数据用于提供所述混合双耳房间脉冲响应数据的耳间时间延迟数据。10.根据前述权利要求中任一项所述的方法,其中相应的双耳房间脉冲响应数据包括表示相应双耳房间脉冲响应的一部分的至少一个部分,其取决于相应的双耳房间脉冲响应所代表的房间,并且其中创建所述混合房间脉冲响应数据涉及使用所述个性化双耳房间脉冲响应数据的全向头部传递函数(HRTF)和所述非个性化双耳房间脉冲响应数据的全向头部传递函数(HRTF)来修改所述非个性化双耳房间脉冲响应数据的至少一个房间相关部分,并且在所述混合双耳房间脉冲响应数据中使用所述至少一个修改的房间相关部分。11.根据权利要求10所述的方法,其中所述修改涉及使用表示所述全向头部传递函数之间的差异的滤波器来滤波所述非个性化双耳房间脉冲数据的所述至少一个房间相关部分。12.根据权利要求11所述的方法,其中所述滤波包括均衡滤波,并且所述滤波器包括均衡滤波器。13.根据权利要求11或12所述的方法,其中所述全向头部传递函数之间的差异由所述全向头部传递函数的数字信号分析确定。14.根据权利要求11或12所述的方法,其中所述全向头部传递函数之间的差异通过执行比较听力测试凭经验确定,所述听力测试优选地涉及将通过收听由所述非个性化双耳房间脉冲数据的第一部分处理的测试音频信号与由所述个性化双耳房间脉冲数据的第一部分处理的测试音频信号进行比较,并涉及调整,优选地通过可调整地滤波由所述非个性化双耳房间脉冲数据的第一部分处理的所述测试音频信号,以匹配由所述个性化双耳房间脉冲数据的第一部分处理的测试音频信号。15.根据权利要求10至14中任一项所述的方法,其中所述至少一个房间相关部分包括表示相应双耳房间脉冲响应的反射部分和混响部分的数据,并且其中使用所述全向头部传递函数修改表示所述反射部分和所述混响部分中的至少一个的所述数据。16.根据权利要求2至15中任一项所述的方法,其中所述多个部分包括至少一个与房间相关的部分,所述部分取决于相应的双耳房间脉冲响应所代表的房间,并且其中所述个性化双耳房间脉冲响应在第一房间中产生,通常具有相对较差的声学特性,并且所述非个性化双耳房间脉冲响应在第二房间中产生,通常具有比所述第一房间更好的声学特性,并且其中所述非个性化双耳房间脉冲响应数据的一个或多个房间相关部分用于提供所述混合双耳房间脉冲响应数据的所述或每个相应的房间相关部分。17.根据权利要求16所述的方法,其中创建所述混合双耳房间脉冲数据涉及使用所述非个性化双耳房间脉冲响应数据的所述一个或多个房间相关部分来修改所述个性化双耳房间脉冲响应数据的所述或每个相应的房间相关部分。18.根据权利要求16或17所述的方法,其中表示非个性化双耳房间脉冲响应的反射部分和/或混响部分的数据用于提供混合双耳房间脉冲响应数据的所述或每个相应部分。19.根据权...

【专利技术属性】
技术研发人员:S·M·F·史密斯
申请(专利权)人:S·M·F·史密斯
类型:发明
国别省市:英国,GB

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1