音频处理方法、装置、设备及存储介质制造方法及图纸

技术编号：40360928 阅读：68 留言：0更新日期：2024-02-09 14:48

本申请公开一种音频处理方法、装置、设备及存储介质，方法包括：在第一对象处于目标场景中时，获取目标场景中的第二对象产生的原始音频数据；确定第二对象相对于第一对象的目标方位，获取采用与第一对象相关的耳间距所生成的目标双耳时间差；采用目标方位和目标双耳时间差，将第二对象产生的原始音频数据渲染为空间音频数据，得到目标空间音频数据，并向第一对象播放目标空间音频数据。通过本申请可以为对象定制化地生成空间音频数据，从而通过生成的空间音频数据给相应对象营造较为强烈的空间感，进而实现声源的准确定位。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及互联网，具体涉及多媒体，尤其涉及一种音频处理方法、装置、设备及存储介质。

技术介绍

1、目前，在某对象a处于某场景中时，若该场景中的对象b产生了原始音频数据，则对象a对应的音频播放设备通常是直接向对象a播放对象b所产生的原始音频数据的。由于对象b产生的原始音频数据通常不具备空间效果，所谓的空间效果是指具有空间感的音频播放效果，空间感可以给对象带来声音从相应方位传出的感觉；因此可见，通过直接为对象a播放对象b产生的原始音频数据，无法给对象a营造出空间感，使得用户a无法感知声源的方位。

技术实现思路

1、本申请实施例提供了一种音频处理方法、装置、设备及存储介质，可实现为对象定制化地生成空间音频数据，从而通过生成的空间音频数据给相应对象营造较为强烈的空间感，进而实现声源的准确定位。

2、一方面，本申请实施例提供了一种音频处理方法，所述方法包括：

3、在第一对象处于目标场景中时，获取所述目标场景中的第二对象产生的原始音频数据；其中，原始音频数据是未具有空间效果的音频数据；

4、确定所述第二对象相对于所述第一对象的目标方位，并获取采用与所述第一对象相关的耳间距所生成的目标双耳时间差；

5、采用所述目标方位和所述目标双耳时间差，将所述第二对象产生的原始音频数据渲染为空间音频数据，得到目标空间音频数据；

6、向所述第一对象播放所述目标空间音频数据。

7、另一方面，本申请实施例提供了一种音频处理装置，所述装置包括：</p>

8、获取单元，用于在第一对象处于目标场景中时，获取所述目标场景中的第二对象产生的原始音频数据；其中，原始音频数据是未具有空间效果的音频数据；

9、处理单元，用于确定所述第二对象相对于所述第一对象的目标方位，并获取采用与所述第一对象相关的耳间距所生成的目标双耳时间差；

10、所述处理单元，还用于采用所述目标方位和所述目标双耳时间差，将所述第二对象产生的原始音频数据渲染为空间音频数据，得到目标空间音频数据；

11、所述处理单元，还用于向所述第一对象播放所述目标空间音频数据。

12、再一方面，本申请实施例提供了一种计算机设备，所述计算机设备包括输入接口和输出接口，所述计算机设备还包括：

13、处理器以及计算机存储介质；

14、其中，所述处理器适于实现一条或多条指令，所述计算机存储介质存储有一条或多条指令，所述一条或多条指令适于由所述处理器加载并执行上述所提及的音频处理方法。

15、再一方面，本申请实施例提供了一种计算机存储介质，所述计算机存储介质存储有一条或多条指令，所述一条或多条指令适于由处理器加载并执行上述所提及的音频处理方法。

16、再一方面，本申请实施例提供了一种计算机程序产品，该计算机程序产品包括一条或多条指令；所述计算机程序产品中的一条或多条指令被处理器执行时，实现上述所提及的音频处理方法。

17、本申请实施例在获取到第一对象所处的目标场景中的第二对象产生的原始音频数据后，可采用第二对象相对于第一对象的目标方位以及采用与第一对象相关的耳间距所生成的目标双耳时间差，将第二对象产生的原始音频数据渲染为空间音频数据，从而向第一对象播放渲染出的空间音频数据。由此可见，本申请实施例可在使用方位信息的基础上，进一步结合与第一对象相关的耳间距，来为第一对象定制化地生成空间音频数据，使得生成的空间音频数据更适合第一对象的耳部结构，从而使得第一对象可以听到效果更符合自己的、更准确且头内空间效果更好的空间音频数据，这样便可通过生成的空间音频数据给相应对象营造较为强烈的空间感，让相应对象可以基于强烈的空间感较为准确地感知到声源的方位，进而实现声源的准确定位。

本文档来自技高网...

【技术保护点】

1.一种音频处理方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述获取采用与所述第一对象相关的耳间距所生成的目标双耳时间差，包括：

3.如权利要求2所述的方法，其特征在于，所述多个预设方位中的第i个预设方位对应的双耳时间差预测模型的生成过程，包括：

4.如权利要求3所述的方法，其特征在于，所述确定多个样本双耳时间差，包括：

5.如权利要求3所述的方法，其特征在于，所述采用所述K个训练样本对用于预测双耳时间差的目标模型进行模型优化，包括：

6.如权利要求3所述的方法，其特征在于，所述基于优化后的目标模型确定所述第i个预设方位对应的双耳时间差预测模型，包括：

7.如权利要求6所述的方法，其特征在于，所述方法还包括：

8.如权利要求6所述的方法，其特征在于，所述真实空间音频数据和所述测试空间音频数据之间的对比结果包括：所述真实空间音频数据和所述测试空间音频数据之间的差异度；

9.如权利要求2所述的方法，其特征在于，所述多个预设方位是在H个坐标平面中设置的，一个坐标平面设置

10.如权利要求9所述的方法，其特征在于，筛选出的预设方位的数量为H个，且筛选出的不同预设方位与所述目标方位中的不同角度分量相匹配；

11.如权利要求10所述的方法，其特征在于，所述根据筛选出的各个预设方位所匹配的角度分量，动态确定相应预设方位的权重，包括：

12.如权利要求1所述的方法，其特征在于，所述采用所述目标方位和所述目标双耳时间差，将所述第二对象产生的原始音频数据渲染为空间音频数据，得到目标空间音频数据，包括：

13.如权利要求12所述的方法，其特征在于，所述采用所述目标双耳时间差，对所述调整后的原始音频信号进行时延处理，得到目标音频信号，包括：

14.如权利要求13所述的方法，其特征在于，所述目标方位对应的头部相关传递函数集包括：各个耳朵对应的头部相关传递函数；

15.如权利要求1所述的方法，其特征在于，在播放所述目标空间音频数据之后，所述方法还包括：

16.一种音频处理装置，其特征在于，包括：

17.一种计算机设备，包括输入接口和输出接口，其特征在于，还包括：处理器以及计算机存储介质；

18.一种计算机存储介质，其特征在于，所述计算机存储介质存储有一条或多条指令，所述一条或多条指令适于由处理器加载并执行如权利要求1-15任一项所述的音频处理方法。

19.一种计算机程序产品，其特征在于，所述计算机程序产品包括一条或多条指令；所述计算机程序中的一条或多条指令被处理器执行时，实现如权利要求1-15任一项所述的音频处理方法。

...

【技术特征摘要】

1.一种音频处理方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述获取采用与所述第一对象相关的耳间距所生成的目标双耳时间差，包括：

3.如权利要求2所述的方法，其特征在于，所述多个预设方位中的第i个预设方位对应的双耳时间差预测模型的生成过程，包括：

4.如权利要求3所述的方法，其特征在于，所述确定多个样本双耳时间差，包括：

5.如权利要求3所述的方法，其特征在于，所述采用所述k个训练样本对用于预测双耳时间差的目标模型进行模型优化，包括：

6.如权利要求3所述的方法，其特征在于，所述基于优化后的目标模型确定所述第i个预设方位对应的双耳时间差预测模型，包括：

7.如权利要求6所述的方法，其特征在于，所述方法还包括：

9.如权利要求2所述的方法，其特征在于，所述多个预设方位是在h个坐标平面中设置的，一个坐标平面设置有至少一个预设方位，任一预设方位包括相应坐标平面上的一个预设角度；所述目标方位包括h个角度分量，一个角度分量对应一个坐标平面，h为正整数；

10.如权利要求9所述的方法，其特征在于，筛选出的预设方位的数量为h个，且筛选出的不同预设方位与所述目标方...

【专利技术属性】
技术研发人员：周伟，赵楚涵，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人