音频处理方法和装置制造方法及图纸

技术编号:37527162 阅读:6 留言:0更新日期:2023-05-12 15:52
本申请实施例提供一种音频处理方法和装置,涉及终端技术领域,方法包括:终端设备显示第一界面;终端设备接收针对多个控件中的第一控件的第一操作;响应于第一操作,终端设备获取第一控件对应的第一目标参数;其中,第一目标参数中包括下述一种或多种:耳间时间差、耳间声压级、或耳间相干性;终端设备获取第一音频信号;终端设备利用第一目标参数处理第一音频信号,得到第二音频信号;终端设备向耳机发送第二音频信号。这样,得终端设备可以根据用户选择头部特征,匹配合适的目标参数,使得经过目标参数输出的音频信号可以适配用户的头部特征,实现音频信号的个性化处理,使得用户获得较好的音频收听体验。获得较好的音频收听体验。获得较好的音频收听体验。

【技术实现步骤摘要】
音频处理方法和装置


[0001]本申请涉及终端
,尤其涉及一种音频处理方法和装置。

技术介绍

[0002]随着终端设备的普及和发展,通过耳机收听音频的用户急剧增加,当终端设备连接耳机播放音频信号时,原始立体声素材或多声道音频下混后以传统的方式通过耳机呈现时会有明显的“头中感”,该头中感可以理解为发出的声音被感知为从头中的位置发出到耳朵的左右两侧。
[0003]通常情况下,终端设备可以通过合适的双耳房间脉冲响应(binaural room impulse response,BRIR)参数对原始音频信号进行处理,使得处理后的音频信号在通过耳机播放时可以产生较好的空间效果。其中,该BRIR描述了从声源到声源接收位置(如用户双耳)处的声音传输过程。
[0004]然而,上述音频处理方法无法使得用户达到较好的音频收听体验。

技术实现思路

[0005]本申请实施例提供一种音频处理方法和装置,使得终端设备可以根据用户选择头部特征,匹配合适的目标参数,使得经过目标参数输出的音频信号可以适配用户的头部特征,实现音频信号的个性化处理,使得用户获得较好的音频收听体验。
[0006]第一方面,本申请实施例提供一种音频处理方法,应用于终端设备,终端设备与耳机建立通信连接,方法包括:终端设备显示第一界面;第一界面中包括用于选择头部特征的多个控件;终端设备接收针对多个控件中的第一控件的第一操作;响应于第一操作,终端设备获取第一控件对应的第一目标参数;其中,第一目标参数中包括下述一种或多种:耳间时间差、耳间声压级、或耳间相干性;终端设备获取第一音频信号;终端设备利用第一目标参数处理第一音频信号,得到第二音频信号;终端设备向耳机发送第二音频信号。这样,得终端设备可以根据用户选择头部特征,匹配合适的目标参数,使得经过目标参数输出的音频信号可以适配用户的头部特征,实现音频信号的个性化处理,使得用户获得较好的音频收听体验。
[0007]其中,该第一界面可以为图6中的b所示的界面,第一控件可以为图6中的b所示的界面中的任一头部特征对应的控件。
[0008]在一种可能的实现方式中,第一界面中还包括:用于选择空间渲染类型的第二控件,方法还包括:终端设备接收针对第二控件的第二操作;响应于第二操作,终端设备获取第二控件对应的第二目标参数;其中,第二目标参数包括下述一种或多种:BRIR直混比调节参数、回声密度、目标谱峰谱谷、房间大小、或混响时间;终端设备利用第一目标参数处理第一音频信号,包括:终端设备利用第一目标参数以及第二目标参数处理第一音频信号,得到第二音频信号。这样,终端设备可以根据用户对于空间渲染类型的选择,获取该空间渲染类型对应的第二目标参数,终端设备根据该第二目标参数,对原始初始音频信号进行处理,使
得处理后的音频信号可以模拟在不同空间中播放时的效果,便于用户获得较好的音频收听体验。
[0009]其中,用于选择空间渲染类型的第二控件可以为图7中的a(或图7中的b)所示的界面中的任一渲染类型对应的控件。
[0010]在一种可能的实现方式中,响应于第二操作,终端设备获取第二控件对应的第二目标参数,包括:响应于第二操作,终端设备显示第二控件对应的进度条;进度条用于调节耳机播放第二音频信号时第二音频信号与终端设备之间的距离;终端设备接收针对进度条的第三操作;响应于第三操作,终端设备获取进度条的目标位置处对应的第二目标参数。这样,使得用户不仅模拟在不同空间中收听音频,还可以灵活调节音频与用户之间的距离,进一步提高用户收听音频时的听觉体验。
[0011]其中,第二控件对应的进度条可以为图8中的b所示的进度条802。
[0012]在一种可能的实现方式中,方法还包括:终端设备显示第二界面;第二界面中包括用于对第一音频信号进行空间渲染的第三控件;终端设备接收针对第三控件的第四操作;终端设备显示第一界面,包括:响应于第四操作,终端设备显示第一界面。这样,终端设备可以基于用户针对第三控件的触发,对音频信号进行空间渲染,提高用户收听音频时的听觉体验。
[0013]其中,第二界面可以为图6中的a所示的界面,第三控件可以为图6中的a所示的开启控件。
[0014]在一种可能的实现方式中,方法还包括:终端设备将第一双耳房间脉冲响应BRIR参数以及第一目标参数输入到第一目标神经网络模型中,输出第二BRIR参数;其中,第一BRIR参数的阶数为N1,第二BRIR参数的阶数为N2,N1大于N2;第一目标神经网络模型的损失函数与第一目标参数中的一种或多种参数相关;终端设备利用第一目标参数处理第一音频信号,包括:终端设备利用第二BRIR参数处理第一音频信号。这样,终端设备可以利用第一目标神经网络模型降低第一BRIR参数的阶数,进而简化音频处理的复杂度。
[0015]其中,第一BRIR参数可以为本申请实施例中描述的N1阶BRIR参数;第二BRIR参数可以为本申请实施例中描述的N2阶BRIR参数;第一音频信号可以为本申请实施例中描述的初始音频信号;第二音频信号可以为本申请实施例中描述的目标音频信号。
[0016]在一种可能的实现方式中,终端设备将第一BRIR参数以及第一目标参数输入到第一目标神经网络模型中,输出第二BRIR参数,包括:终端设备将第一BRIR参数、第一目标参数、以及第二目标参数输入到第一目标神经网络模型中,输出第二BRIR参数;其中,损失函数与目标参数中的一种或多种参数相关;目标参数包括第一目标参数以及第二目标参数。这样,终端设备可以利用第一目标参数以及第二目标参数对第一目标神经网络模型中的BRIR参数进行调整,使得经过第一目标神经网络模型输出的第二BRIR参数符合用户对于音频信号的多种需求。
[0017]在一种可能的实现方式中,目标参数还包括:主观响度、或bark谱对应的数值。
[0018]在一种可能的实现方式中,方法还包括:终端设备将第一BRIR参数输入到第二目标神经网络模型中,输出第三BRIR参数;第一BRIR参数的阶数为N1,第三BRIR参数的阶数为N2,N1大于N2;终端设备利用第一目标参数中的一种或多种参数对第三BRIR参数进行调整,得到第二BRIR参数;第二BRIR参数的阶数为N2;终端设备利用第一目标参数处理第一音频
信号,包括:终端设备利用第二BRIR参数处理第一音频信号。这样,终端设备可以利用第二目标神经网络模型降低第一BRIR参数的阶数,进而简化音频处理的复杂度。
[0019]在一种可能的实现方式中,终端设备利用第一目标参数中的一种或多种参数对第三BRIR参数进行调整,得到第二BRIR参数,包括:终端设备利用第一目标参数中的一种或多种参数对第三BRIR参数进行调整,得到第四BRIR参数;第四BRIR参数的阶数为N2;终端设备利用第二目标参数中的一种或多种参数对第四BRIR参数进行调整,得到第二BRIR参数。
[0020]在一种可能的实现方式中,终端设备利用第二BRIR参数处理第一音频信号,包括:终端设备获取来自耳机的目标转动角度;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频处理方法,其特征在于,应用于终端设备,所述终端设备与耳机建立通信连接,所述方法包括:所述终端设备显示第一界面;所述第一界面中包括用于选择头部特征的多个控件;所述终端设备接收针对所述多个控件中的第一控件的第一操作;响应于所述第一操作,所述终端设备获取所述第一控件对应的第一目标参数;其中,所述第一目标参数中包括下述一种或多种:耳间时间差、耳间声压级、或耳间相干性;所述终端设备获取第一音频信号;所述终端设备利用所述第一目标参数处理所述第一音频信号,得到第二音频信号;所述终端设备向所述耳机发送所述第二音频信号。2.根据权利要求1所述的方法,其特征在于,所述第一界面中还包括:用于选择空间渲染类型的第二控件,所述方法还包括:所述终端设备接收针对所述第二控件的第二操作;响应于所述第二操作,所述终端设备获取所述第二控件对应的第二目标参数;其中,所述第二目标参数包括下述一种或多种:BRIR直混比调节参数、回声密度、目标谱峰谱谷、房间大小、或混响时间;所述终端设备利用所述第一目标参数处理所述第一音频信号,包括:所述终端设备利用所述第一目标参数以及所述第二目标参数处理所述第一音频信号,得到第二音频信号。3.根据权利要求2所述的方法,其特征在于,所述响应于所述第二操作,所述终端设备获取所述第二控件对应的第二目标参数,包括:响应于所述第二操作,所述终端设备显示所述第二控件对应的进度条;所述进度条用于调节所述耳机播放所述第二音频信号时所述第二音频信号与所述终端设备之间的距离;所述终端设备接收针对所述进度条的第三操作;响应于所述第三操作,所述终端设备获取所述进度条的目标位置处对应的所述第二目标参数。4.根据权利要求2或3任一项所述的方法,其特征在于,所述方法还包括:所述终端设备显示第二界面;所述第二界面中包括用于对所述第一音频信号进行空间渲染的第三控件;所述终端设备接收针对所述第三控件的第四操作;所述终端设备显示第一界面,包括:响应于所述第四操作,所述终端设备显示所述第一界面。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:所述终端设备将第一双耳房间脉冲响应BRIR参数以及所述第一目标参数输入到第一目标神经网络模型中,输出第二BRIR参数;其中,所述第一BRIR参数的阶数为N1,所述第二BRIR参数的阶数为N2,所述N1大于所述N2;所述第一目标神经网络模型的损失函数与所述第一目标参数中的一种或多种参数相关;所述终端设备利用所述第一目标参数处理所述第一音频信号,包括:所述终端设备利用所述第二BRIR参数处理所述第一音频信号。6.根据权利要求5所述的方法,其特征在于,所述终端设备将第一BRIR参数以及所述第一目标参数输入到第一目标神经网络模型中,输出第二BRIR参数,包括:
所述终端设备将所述第一BRIR参数、所述第一目标参数、以及所述第二目标参数输入到所述第一目标神经网络模型中,输出所...

【专利技术属性】
技术研发人员:陈绍天
申请(专利权)人:荣耀终端有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1