确定个体化头部相关传输函数和耳间时间差函数的计算机程序和方法技术

技术编号：16674561 阅读：177 留言：0更新日期：2017-11-30 18:02

一种估计特定人的个人化头部相关传输函数(HRTF)和个人化耳间时间差函数(ITDF)的方法，包括以下步骤：a)获得多个数据集(Li,Ri,Oi)，每个数据集包括来自一对入耳式话筒的左和右音频样本(Li,Ri)以及来自定向单元的定向信息(Oi)，所述定向信息时在其中经由扬声器呈现听觉测试信号的测试布置中测量的；b)将所述数据集存储在存储器中；c)基于所述定向数据和所述音频数据来估计所述扬声器相对于所述人的方向；d)基于所述数据集并且基于估计的相对位置/定向来估计ITDF；e)基于所述且基于估计的相对位置/定向来估计HRTF。一种用于执行该方法的计算机程序产品。一种包含该计算机程序的数据载体。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】确定个体化头部相关传输函数和耳间时间差函数的计算机程序和方法专利
本专利技术涉及3D声
更具体而言，本专利技术涉及估计特定人的个人化头部相关传输函数(HRTF)和个人化的耳间时间差函数(ITDF)的计算机程序产品和方法。本专利技术还涉及包括这种计算机程序产品的数据载体，并涉及包括这种数据载体的部件套件。专利技术背景过去数十年在虚拟现实
已经有了长足的进步，特别是在视觉虚拟现实方面。3DTV屏已经进入公众家中，尤其是此处的家庭影院和视频游戏所利用的。但是3D声技术仍旧滞后。然而，至少在理论上，创建虚拟3D听觉环境(被称为虚拟音频空间(VAS))是非常容易的。当人们在3D空间中定位声音时，他们使用由左耳和右耳拾取的两个音频信号。由此一个重要线索是所谓的“耳间时间差(ITD)”：取决于声音(相对于人的头部)的方向，声音将首先到达左耳或右耳，且这一时间差包含关于横向角度的信息(参见图2)。耳间时间差函数(ITDF)描述了ITD如何随声音源(例如扬声器)的方向变化，例如参见图3。当声音被内耳配准(register)时，声音的频谱内容包含其它线索。毕竟，在来自某个方向的声波到达鼓膜之前，声波与身体、头部和耳廓干涉。并且通过这种干涉，一些频率比其它频率更容易被传送；因此，发生取决于声音来自的方向的频谱滤波。这种滤波由所谓的“头部相关传输函数(HRTF)”(参见图4中的示例)描述，对于声音源的每个方向，HRTF描述了被传送或滤除的每个频率的比例。在双耳中接收的信号的频谱内容从而包含关于声音源的位置(被称为：频谱线索)，且尤其是关于高程(参见图2)以及声音...
确定个体化头部相关传输函数和耳间时间差函数的计算机程序和方法

【技术保护点】
一种用于估计特定人的个人化头部相关传输函数(HRTF)和耳间时间差函数(ITDF)的计算机程序产品，所述计算机程序产品当在包括处理器和存储器的至少一个计算设备上执行时，被适配成用于执行以下步骤：a)获得(1001)多个数据集(Li,Ri,Oi)，每个数据集包括源自左入耳式话筒的左音频样本(Li)和源自右入耳式话筒的右音频样本(Ri)以及源自定向单元(604；704；804)的定向信息(Oi)，每个数据集的所述左音频样本及所述右音频样本和所述定向信息是在布置中被同时捕捉的，其中：所述左入耳式话筒被插入在所述人的左耳中，以及所述右入耳式话筒被插入在所述人的右耳中，以及所述定向单元被安装在所述人的头部上或被安装到所述人的头部，以及所述人位于距扬声器(602；702；802)一距离处，以及所述扬声器被布置成用于呈现包括多个听觉刺激(Ci)的听觉测试信号，以及所述人在所述听觉测试信号的呈现期间在多个不同定向上转动头部；b)将所述多个数据集(Li,Ri,Oi)存储(1002)在存储器中；c)针对存储在所述存储器中的每个数据集(Li,Ri,Oi)，估计(1003)所述扬声器相对于所述人的所述头部的方...

【技术特征摘要】
【国外来华专利技术】2015.02.26 GB 1503213.91.一种用于估计特定人的个人化头部相关传输函数(HRTF)和耳间时间差函数(ITDF)的计算机程序产品，所述计算机程序产品当在包括处理器和存储器的至少一个计算设备上执行时，被适配成用于执行以下步骤：a)获得(1001)多个数据集(Li,Ri,Oi)，每个数据集包括源自左入耳式话筒的左音频样本(Li)和源自右入耳式话筒的右音频样本(Ri)以及源自定向单元(604；704；804)的定向信息(Oi)，每个数据集的所述左音频样本及所述右音频样本和所述定向信息是在布置中被同时捕捉的，其中：所述左入耳式话筒被插入在所述人的左耳中，以及所述右入耳式话筒被插入在所述人的右耳中，以及所述定向单元被安装在所述人的头部上或被安装到所述人的头部，以及所述人位于距扬声器(602；702；802)一距离处，以及所述扬声器被布置成用于呈现包括多个听觉刺激(Ci)的听觉测试信号，以及所述人在所述听觉测试信号的呈现期间在多个不同定向上转动头部；b)将所述多个数据集(Li,Ri,Oi)存储(1002)在存储器中；c)针对存储在所述存储器中的每个数据集(Li,Ri,Oi)，估计(1003)所述扬声器相对于所述人的所述头部的方向；d)基于存储在所述存储器中的所述多个数据集(Li,Ri,Oi)并且基于在步骤c)中估计的方向来估计(1004)所述人的个人化ITDF；e)基于存储在所述存储器中的所述多个数据集(Li,Ri,Oi)并且基于在步骤c)中估计的方向来估计(1005)所述人的个人化HRTF。2.如权利要求1所述的计算机程序产品，其特征在于，步骤e)进一步包括估计所述扬声器和所述话筒的组合频谱滤波性质。3.如权利要求2所述的计算机程序产品，其特征在于，估计所述扬声器和所述话筒的组合频谱滤波性质包括：-利用关于所述扬声器的频谱滤波性质的先验信息，和/或-利用关于所述话筒的频谱滤波性质的先验信息。4.如前述权利要求中任一项所述的计算机程序产品，其特征在于，步骤c)的估计基于存储在所述存储器中的所述多个数据集(Li,Ri,Oi)并且基于将听觉线索与空间信息相关的至少一个传输函数。5.如权利要求4所述的计算机程序产品，其特征在于，将听觉线索与空间信息相关的所述至少一个传输函数为耳间时间差函数(ITDF)。6.如权利要求4所述的计算机程序产品，其特征在于，将听觉线索与空间信息相关的所述至少一个传输函数为耳间时间差函数(ITDF)和头部相关传输函数(HRTF)。7.如前述权利要求中任一项所述的计算机程序产品，其特征在于，估计所述ITDF的步骤d)包括利用基于包含不同人的多个ITDF的数据库的统计分析的关于个体化ITDF的先验信息。8.如前述权利要求中任一项所述的计算机程序产品，其特征在于，估计所述HRTF的步骤e)包括利用基于包含不同人的多个HRTF的数据库的统计分析的关于个体化HRTF的先验信息。9.如前述权利要求中任一项所述的计算机程序产品，其特征在于，步骤c)包括：-从所述多个数据集的所述左音频样本和所述右音频样本提取定时信息；-从所述多个数据集的所述左音频样本和所述右音频样本提取频谱信息；-基于所提取的定时信息和频谱信息估计所述扬声器相对于所述人的所述头部的方向，由此使用通用ITDF和通用HRTF。10.如权利要求9所述的计算机程序产品，-其中步骤d)包括：基于所述左音频样本和所述右音频样本中包含的所述定时信息和频谱信息以及基于步骤c)的估计的方向来确定个人化ITDF的估计；以及-其中步骤e)包括：基于所述左音频样本和所述右音频样本中包含的所述定时信息和频谱信息以及基于步骤c)的估计的方向来确定个人化HRTF的估计。11.如权利要求10所述的计算机程序产品，其特征在于，所述计算机设备被进一步适配成用于执行以下步骤组合：i)在执行步骤d)和步骤e)之后，再次执行步骤c)，但是使用如在步骤d)中确定的个人化ITDF的估计而不是一般性ITDF以及使用如在步骤e)中确定的个人化HRTF的估计而不是一般性HRTF，以获得所述扬声器相对于所述人的头部的方向的经更新的估计；ii)在执行步骤i)之后，再次执行步骤d)，使用步骤i)的所述扬声器的所述方向的经更新的估计，以获得所述人的个人化ITDF的更新；iii)在执行步骤i)之后，再次执行步骤e)，使用步骤i)的所述扬声器的所述方向的经更新的估计，以获得所述人的个人化HRTF的更新。12.如权利要求1到8中任一项所述的计算机程序产品，其特征在于，步骤c)包括：-从所述多个数据集的所述左音频样本和所述右音频样本提取定时信息；-基于所提取的定时信息针对每个数据集(Li,Ri,Oi)估计所述扬声器相对于所述人的头部的方向，由此使用通用ITDF而不使用通用HRTF。13.如权利要求12所述的计算机程序产品，-其中所述计算设备被适配成用于在执行步骤c)和步骤d)的组合之后执行步骤e)；-并且其中步骤e)进一步包括：*从所述多个数据集的所述左音频样本和所述右音频样本(Li,Ri)提取频谱信息；*基于所提取的频谱信息估计高程偏移；*基于所述左音频样本和所述右音频样本中包含的所述定时信息和频谱信息以及基于步骤c)的所述扬声器的估计的方向来确定个人化HRTF的估计。14.如权利要求13所述的计算机程序产品，其特征在于，所述计算设备被适配成用于执行以下步骤组合的至少一次迭代：i)再次执行步骤c)以获得所述扬声器的方向的经更新的估计，其中在步骤c)的第二次执行和每次后续执行中使用个人化ITDF的估计而非通用ITDF；ii)使用步骤i)的所述扬声器的方向的经更新的估计来再次执行步骤d)以获得所述人的经更新的个人化ITDF。15.如前述权利要求中任一项所述的计算机程序产品，其特征在于，所述定向单元被适配成用于提供关于地球重力场以及关于地球磁场的定向信息。16.如前述权利要求中任一项所述的计算机程序产品，其中所述音频测试信号包括具有小于4.80ms的历时的多个听觉刺激。17.如前述权利要求中任一项所述的计算机程序产品，其特征在于，所述计算机程序产品被进一步适配成用于：-取决于对所述多个数据集的分析从一组预定义音频消息中选择预定义音频消息，以及-经由不同于所述第一扬声器的第二扬声器呈现所选择的音频消息，以用于在呈现所述音频测试信号之前和/或期间和/或之后向所述人提供信息或指令。18.如权利要求1到17中任一项所述的计算机程序产品，其中所述计算设备电连接至所述左和右入耳式话筒，并且电连接至所述定向单元，以及其中所述计算设备被适配成用于在步骤a)中捕捉多个左音频样本及右音频样本和定向信息，并用于执行步骤b)到步骤e)。19.如权利要求1到17中任一项所述的计算机程序产品，其中所述定向单元被包括在便携式设备中，所述便携式设备能安装到所述人的头部，以及其中所述便携式设备进一步包括可编程处理器和存储器，以及能够电连接至所述左和右入耳式话筒的接口装置，以及用于存储和/或传送所述所捕捉数据集的装置，以及其中所述计算机程序产品包括被适配成由所述便携式设备的处理器执行的第一软件模块和被适配成由所述计算设备执行的第二软件模块，以及其中所述第一软件模块被适配成用于执行步骤a)的所述左及右音频样本的捕捉和所述定向信息的捕捉，以及用于将所捕捉数据集传送至所述计算设备或用于将所捕捉数据集存储在可交换存储器上，以及其中所述第二软件模块被适配成用于获得所述多个数据集，并且用于执行步骤b)到步骤e)。20.如权利要求1到17中任一项所述的计算机程序产品，其中所述定向单元被包括在便携式设备中，所述便携式设备能安装到所述人的头部，以及其中所述便携式设备进一步包括形成所述计算设备的处理器和存储器，以及其中所述便携式设备进一步包括能够电连接至所述左和右入耳式话筒的接口装置，以及其中所述便携式设备的所述处理器被适配成用于执行步骤a)的所述左和右音频样本的捕捉以及所述定向信息的捕捉，以及用于在步骤b)中将所捕捉数据集存储在所述存储器中，以及用于执行步骤c)到步骤e)。21.如权利要求19或20所述的计算机程序产品，-其中所述便携式设备进一步包括扬声器，-以及其中所述便携式设备的处理器被进一步适配成用于分析所述定向信息，以便验证是否以至少预定义强度采样围绕所述头部的3D空间，-以及用于如果所述验证的结果分别是以/未以所述预定义强度采样所述空间，则经由所述便携式设备的所述扬声器分别呈现第一/第二预定义音频消息。22.包括如权利要求1到21中任一项所...

【专利技术属性】
技术研发人员：J·赖尼尔斯，H·G·P·佩雷曼斯，B·W·M·帕托恩斯，
申请(专利权)人：安特卫普大学，
类型：发明
国别省市：比利时,BE

全部详细技术资料下载我是这个专利的主人