音频信号处理方法和设备技术

技术编号:14062419 阅读:106 留言:0更新日期:2016-11-27 23:42
本发明专利技术涉及用于处理音频信号的方法和设备,并且更具体地,涉及可以将对象信号与声道信号合成并且有效地双耳渲染所合成的用于处理音频信号的方法和设备。为此,本发明专利技术提供一种音频信号处理方法和使用该方法的音频信号处理设备,该方法包括下述步骤:接收具有多声道信号和多对象信号中的至少一个的输入音频信号;接收用于输入音频信号的双耳滤波的滤波器集合的类型信息,其中,滤波器集合的类型是有限脉冲响应(FIR)滤波器、频域的参数化滤波器和时域的参数化滤波器中的一个;基于类型信息,接收用于双耳滤波的滤波器信息;以及使用接收的滤波器信息对输入音频信号执行双耳滤波。当类型信息指示频域中的参数化滤波器时,接收滤波器信息的步骤包括接收具有针对频域的每个子带预定的长度的子带滤波器系数;并且执行双耳滤波的步骤包括使用与之对应的子带滤波器系数,滤波每个子带的输入音频信号。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及用于处理音频信号的方法和设备,并且更具体地,涉及将对象信号与声道信号合成并且有效地执行合成信号的双耳渲染的用于处理音频信号的方法和设备。
技术介绍
在现有技术中,3D音频统称为一系列信号处理、传输、编码和再现技术,该一系列信号处理、传输、编码和再现技术用于通过向在环绕音频中提供的水平面(2D)上的声音场景提供与高度方向对应的另一轴,来提供出现在3D空间中的声音。具体地,为了提供3D音频,应当使用比相关技术更多的扬声器,或者以其他方式,尽管使用了比相关技术更少的扬声器,但是需要在不存在扬声器的虚拟位置处产生声音图像的渲染技术。预计3D音频将是与超高清(UHD)TV对应的音频解决方案,并且预计3D音频将应用于各种领域,除了在演进为高品质的信息娱乐空间的车辆中的声音之外,还包括影院音响、个人3DTV、平板装置、智能手机和云游戏。同时,作为提供给3D音频的声源的类型,可以存在基于声道的信号和基于对象的信号。另外,可以存在基于声道的信号和基于对象的信号被混合的声源,并且因此,用户可以具有新型的收听体验。。
技术实现思路
技术问题本专利技术致力于实现一种滤波过程,该滤波过程在最小化在双耳渲染中的音质损失的同时,要求具有非常小的计算量的高计算量,以便在以立体声再现多声道或者多对象信号时保持原始信号的沉浸感。本专利技术还致力于在输入信号中包含失真时通过高质量滤波器来最小化失真传播。本专利技术还致力于实现具有非常大的长度的有限脉冲响应(FIR)滤波器作为具有较小长度的滤波器。本专利技术还致力于在使用缩小FIR的滤波器执行滤波时通过省略的滤波器系数来最小化截断部分(destructed part)的失真。本专利技术还致力于提供声道相关双耳渲染方法和可调整双耳渲染方法。技术解决方案为了实现这些目的,本专利技术提供如下用于处理音频信号的方法和装置。本专利技术的示例性实施例提供一种用于处理音频信号的方法,包括:接收包括多声道信号和多对象信号中的至少一个的输入音频信号;接收用于所述输入音频信号的双耳滤波的滤波器集合的类型信息,滤波器集合的类型是有限脉冲响应(FIR)滤波器、频域中的参数化滤波器和时域中的参数化滤波器中的一个;基于所述类型信息来接收用于双耳滤波的滤波器信息;以及通过使用所接收的滤波器信息,来执行用于所述输入音频信号的双耳滤波,其中,当所述类型信息指示频域中的参数化滤波器时,在接收滤波器信息中,接收具有对频域的每个子带确定的长度的子带滤波器系数,并且在执行双耳滤波中,通过使用与之对应的子带滤波器系数,来滤波所述输入音频信号的每个子带信号。本专利技术的另一示例性实施例提供一种用于处理音频信号的装置,该装置用于执行包括多声道信号和多对象信号中的至少一个的输入音频信号的双耳渲染,其中,用于处理音频信号的装置接收用于输入音频信号的双耳滤波的滤波器集合的类型信息,滤波器集合的类型是有限脉冲响应(FIR)滤波器、频域中的参数化滤波器和时域中的参数化滤波器中的一个;基于所述类型信息来接收用于双耳滤波的滤波器信息,并且通过使用所接收的滤波器信息来执行用于输入音频信号的双耳滤波,并且其中,当类型信息指示频域中的参数化滤波器时,用于处理音频信号的装置接收具有对频域的每个子带确定的长度的子带滤波器系数,并且通过使用与之对应的子带滤波器系数,来滤波所述输入音频信号的每个子带信号。每个子带滤波器系数的长度可以基于从原型滤波器系数获得的相应子带的混响时间信息来确定,并且从相同原型滤波器系数获得的至少一个子带滤波器系数的长度可以不同于另一子带滤波器系数的长度。该方法可以进一步包括:当类型信息指示频域中的参数化滤波器时,接收有关用于执行双耳渲染的频带的数目的信息和有关用于执行卷积的频带的数目的信息;接收用于相对于具有用于执行卷积的频带的高频子带组的每个子带信号执行抽头延迟线滤波的参数作为边界;以及通过使用所接收的参数来对高频率组的每个子带信号执行抽头延迟线滤波。在这种情况下,可以基于在用于执行双耳渲染的频带的数目和用于执行卷积的频带的数目之间的差,来确定执行抽头延迟线滤波的高频子带组的子带的数目。参数可以包括从对应于高频率组的每个子带信号的子带滤波器系数中提取的延迟信息和对应于所述延迟信息的增益信息。当类型信息指示FIR滤波器时,接收滤波器信息的步骤接收对应于输入音频信号的每个子带信号的原型滤波器系数。本专利技术的又一示例性实施例提供一种用于处理音频信号的方法,包括:接收包括多声道信号的输入音频信号;接收对频域的每个子带变化地确定的滤波器阶数信息;基于用于输入音频信号的双耳滤波的滤波器系数的每个子带的快速傅立叶变换长度来接收用于每个子带的块长度信息;接收对应于每相应子带的块的输入音频信号的每个子带和每个声道的频域可变阶数滤波(VOFF)系数,VOFF系数的长度的总和对应于基于相应子带的滤波器阶数信息确定的同一子带和同一声道;以及通过使用所接收的VOFF系数来滤波输入音频信号的每个子带信号以生成双耳输出信号。本专利技术的又一示例性实施例提供一种用于处理音频信号的装置,该装置用于执行包括多声道信号的输入音频信号的双耳渲染,该装置包括:快速卷积单元,被配置为执行用于输入音频信号的直达声部和早期反射声部的渲染,其中,快速卷积单元接收输入音频信号,接收对频域的每个子带变化地确定的滤波器阶数信息,基于用于输入音频信号的双耳滤波的滤波器系数的每个子带的快速傅立叶变换长度来接收用于每个子带的块长度信息,接收对应于每相应子带的块的输入音频信号的每个子带和每个声道的频域可变阶数滤波(VOFF)系数,VOFF系数的长度的总和对应于基于相应子带的滤波器阶数信息确定的同一子带和同一声道;以及通过使用所接收的VOFF系数来滤波输入音频信号的每个子带信号以生成双耳输出信号。在这种情况下,滤波器阶数可以基于从原型滤波器系数获得的相应子带的混响时间信息来确定,并且从同一原型滤波器系数获得的至少一个子带的滤波器阶数可以不同于另一子带的滤波器阶数。每块的VOFF系数的长度可以被确定为具有作为索引值的相应子带的块长度信息的2的幂的值。生成双耳输出信号可以包括将子带信号的每个帧划分成基于预定的块长度确定的子帧单元,并且执行在划分的子帧和VOFF系数之间的快速卷积。在这种情况下,子帧的长度可以被确定为预定块长度的一半大的值,并且划分的子帧的数目可以基于通过将帧的总长除以子帧的长度获得的值来确定。有益效果根据本专利技术的示例性实施例,当执行对多声道或者多对象信号的双耳渲染时,可以显著减少计算量,同时最小化音质损失。另外,能够对多声道或者多对象音频信号实现具有高音质的双耳渲染,而在现有技术的低功率装置中已经不可能进行这种实时处理。本专利技术提供了一种以小的计算量来有效地执行对包括音频信号的各种类型的多媒体信号进行滤波的方法。根据本专利技术,提供了包括声道相关双耳渲染、可调整双耳渲染等的方法以控制双耳渲染的质量和计算量。附图说明图1是示出根据本专利技术的示例性实施例的音频信号解码器的框图。图2是示出根据本专利技术的示例性实施例的双耳渲染器的每个组件的框图。图3是示出根据本专利技术的示例性实施例的用于生成用于双耳渲染的滤波器的方法的图。图4是示出根据本专利技术的示例性实施例的具体QTDL处理的图。图5是示出本专利技术的实施例的BRIR参数化单元的各本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/62/201580018973.html" title="音频信号处理方法和设备原文来自X技术">音频信号处理方法和设备</a>

【技术保护点】
一种用于处理音频信号的方法,所述方法包括:接收包括多声道信号和多对象信号中的至少一个的输入音频信号;接收用于所述输入音频信号的双耳滤波的滤波器集合的类型信息,所述滤波器集合的类型是有限脉冲响应(FIR)滤波器、频域中的参数化滤波器和时域中的参数化滤波器中的一个;基于所述类型信息来接收用于双耳滤波的滤波器信息;以及通过使用所接收的滤波器信息来执行用于所述输入音频信号的双耳滤波,其中,当所述类型信息指示所述频域中的参数化滤波器时,接收滤波器信息的所述步骤接收具有针对频域的每个子带确定的长度的子带滤波器系数,并且执行双耳滤波的步骤通过使用与之对应的所述子带滤波器系数来对所述输入音频信号的每个子带信号进行滤波。

【技术特征摘要】
【国外来华专利技术】2014.06.30 KR 10-2014-0081226;2014.04.02 US 61/9731.一种用于处理音频信号的方法,所述方法包括:接收包括多声道信号和多对象信号中的至少一个的输入音频信号;接收用于所述输入音频信号的双耳滤波的滤波器集合的类型信息,所述滤波器集合的类型是有限脉冲响应(FIR)滤波器、频域中的参数化滤波器和时域中的参数化滤波器中的一个;基于所述类型信息来接收用于双耳滤波的滤波器信息;以及通过使用所接收的滤波器信息来执行用于所述输入音频信号的双耳滤波,其中,当所述类型信息指示所述频域中的参数化滤波器时,接收滤波器信息的所述步骤接收具有针对频域的每个子带确定的长度的子带滤波器系数,并且执行双耳滤波的步骤通过使用与之对应的所述子带滤波器系数来对所述输入音频信号的每个子带信号进行滤波。2.如权利要求1所述的方法,其中,基于从原型滤波器系数获得的相应子带的混响时间信息,来确定每个子带滤波器系数的长度,并且从相同原型滤波器系数获得的至少一个子带滤波器系数的长度不同于另一子带滤波器系数的长度。3.如权利要求1所述的方法,进一步包括:当所述类型信息指示所述频域中的参数化滤波器时,接收关于用于执行双耳渲染的频带的数目的信息和关于用于执行卷积的频带的数目的信息;接收用于相对于具有用于执行所述卷积的频带的高频率子带组中的...

【专利技术属性】
技术研发人员:李泰圭吴贤午
申请(专利权)人:韦勒斯标准与技术协会公司
类型:发明
国别省市:韩国;KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1