用于解码立体声声音信号的左和右声道的方法和系统技术方案

技术编号:18580904 阅读:38 留言:0更新日期:2018-08-01 14:53
一种立体声声音解码方法和系统使用包括主声道的编码参数、辅声道的编码参数和因子β的接收的编码参数,来解码立体声声音信号的左和右声道。主声道编码参数包括主声道的LP滤波系数。响应于主声道编码参数来解码主声道。使用多个编码模型中的一个来解码辅声道,其中至少一个编码模型使用主声道LP滤波系数来解码辅声道。使用因子β对解码的主和辅声道进行时域上混合,以产生立体声声音信号的解码的左和右声道,其中因子β确定在所述左和右声道的产生时、所述主和辅声道的相应贡献。

Method and system for decoding left and right voice channels of stereophonic sound signals

A stereo sound decoding method and system use the encoding parameters of the main channel, the encoding parameters of the auxiliary channel and the encoded parameters of the factor beta, to decode the left and right sound channels of the stereo sound signal. The main channel coding parameters include the LP filter coefficient of the main channel. The main channel is decoded in response to the main channel coding parameter. A consonant channel is decoded using one of a plurality of coding models, of which at least one coding model decodes the consonant channel using the LP filter coefficients of the main channel. Using factor beta, the decoded main and auxiliary channels are mixed in time domain to produce the left and right sound channels decoded by the stereo sound signal, in which the factor beta determines the corresponding contribution of the said main and the auxiliary channels when the left and right sound channels are produced.

【技术实现步骤摘要】
【国外来华专利技术】用于解码立体声声音信号的左和右声道的方法和系统
本公开涉及立体声声音编码,具体但不排他地涉及能够按照低比特率和低延迟在复杂音频场景中产生好的立体声质量的立体声话音(speech)和/或音频编码。
技术介绍
历史上,已利用仅具有一个换能器以仅向用户的一只耳朵输出声音的电话听筒(handset)来实现对话电话。最近十来年,用户已开始使用他们的便携式电话听筒结合头戴式受话器,来接收越过他们的双耳的声音,以主要收听音乐,并且有时收听话音。然而,当使用便携式电话听筒来传送和接收对话话音时,内容仍然是单声道的,但是当使用头戴式受话器时内容被呈现到用户的双耳。利用参考文献[1](其全部内容通过引用合并在这里)中描述的最新3GPP话音编码标准,已显著改进了编码的声音的质量,例如通过便携式电话听筒传送和接收的话音和/或音频。下一自然步骤是传送立体声信息,使得接收机尽可能接近在通信链路的另一侧捕获的真实生活音频场景。在音频编解码器中,例如如同参考文献[2](其全部内容通过引用合并在这里)中描述的,正常使用立体声信息的传送。对于对话话音编解码器,单声道信号是规范。当传送单声道信号时,比特率通常需要加倍,因为使用单声道编解码器来编码左和右声道两者。这在大多数情景下工作良好,但是呈现了以下缺点,比特率加倍,并且不能充分利用两个声道(左和右声道)之间的任何潜在冗余。此外,为了在合理水平保持整体比特率,使用用于每一声道的非常低的比特率,由此影响整体声音质量。可能的替换方案是使用参考文献[6](其全部内容通过引用合并在这里)中描述的所谓参数化立体声。参数化立体声发送诸如双耳时间差(ITD)或双耳强度差(IID)的信息。后一信息是按每个频带发送的,并且按照低比特率,与立体声传送相关联的比特预算不足够高到允许这些参数有效地工作。传送平移因子(panningfactor)可能有助于以低比特率创建基本的立体声效果,但这种技术无法保持周围环境并呈现固有的局限性。太快的平移因子的调节(adaptation)变得干扰听众,而太慢的平移因子的调节并不能反映说话者的真实位置,这使得在干扰说话者的情况下或者当背景噪声的波动重要时,难以获得良好的质量。当前,对于所有可能的音频场景编码具有适当(decent)质量的对话立体声话音需要用于宽带(WB)信号的约24kb/s的最小比特率;低于该比特率时,话音质量开始受损。随着劳动力日益增长的全球化和工作团队在全球的分裂,存在改进通信的需求。例如,电话会议的参与者可能处于不同且遥远的位置。有些参与者可能会在他们的汽车中,其他人可能在大的消声室中或甚至在他们的客厅中。事实上,所有参与者都希望感觉好像他们进行面对面的讨论。在便携式设备中实现立体声话音(更一般的立体声声音),将是朝这个方向迈出的一大步。
技术实现思路
根据第一方面,本公开涉及一种用于对立体声声音信号的左声道和右声道进行解码的立体声声音解码方法,包括:接收编码参数,所述编码参数包括主声道的编码参数、辅声道的编码参数和因子β,其中主声道编码参数包括主声道的LP滤波系数;响应于主声道编码参数对主声道进行解码;使用多个编码模型之一对所述辅声道进行解码,其中,所述编码模型中的至少一个使用所述主声道LP滤波系数对所述辅声道进行解码;和使用因子β对解码的主声道和辅声道进行时域上混合,以产生解码的立体声声音信号的左声道和右声道,其中该因子β确定在所述左和右声道的产生时、所述主和辅声道的相应贡献。根据第二方面,提供了一种用于解码立体声声音信号的左和右声道的立体声声音解码系统,包括:用于接收包括主声道的编码参数、辅声道的编码参数、和因子β的编码参数的部件,其中该主声道编码参数包括该主声道的LP滤波系数;响应于该主声道编码参数的该主声道的解码器;使用多个编码模型之一的该辅声道的解码器,其中所述编码模型的至少一个使用所述主声道LP滤波系数来解码该辅声道;和使用因子β以产生所解码的立体声声音信号的左和右声道的所解码的主和辅声道的时域上混合器,其中该因子β确定在所述左和右声道的产生时所述主和辅声道的相应贡献。根据第三方面,提供了一种用于解码立体声声音信号的左和右声道的立体声声音解码系统,包括:至少一个处理器;和存储器,耦接到该处理器,并且包括非瞬时指令,所述指令当运行时促使该处理器实现:用于接收包括主声道的编码参数、辅声道的编码参数、和因子β的编码参数的部件,其中该主声道编码参数包括该主声道的LP滤波系数;响应于该主声道编码参数的该主声道的解码器;使用多个编码模型之一的该辅声道的解码器,其中所述编码模型的至少一个使用所述主声道LP滤波系数来解码该辅声道;和使用因子β以产生所解码的立体声声音信号的左和右声道的所解码的主和辅声道的时域上混合器,其中该因子β确定在所述左和右声道的产生时所述主和辅声道的相应贡献。另一方面涉及一种用于解码立体声声音信号的左和右声道的立体声声音解码系统,包括:至少一个处理器;和存储器,耦接到该处理器,并且包括非瞬时指令,所述指令当运行时促使该处理器:接收包括主声道的编码参数、辅声道的编码参数、和因子β的编码参数,其中该主声道编码参数包括该主声道的LP滤波系数;响应于该主声道编码参数解码该主声道;使用多个编码模型之一解码该辅声道,其中所述编码模型的至少一个使用所述主声道LP滤波系数来解码该辅声道;和使用因子β对所解码的主和辅声道进行时域上混合,以产生所解码的立体声声音信号的左和右声道,其中该因子β确定在所述左和右声道的产生时所述主和辅声道的相应贡献。本公开还涉及一种处理器可读存储器,包括非瞬时指令,所述指令当运行时,促使处理器实现上述方法的操作。通过阅读参考附图仅作为示例给出的其示意性实施例的以下非限制性描述,用于解码立体声声音信号的左和右声道的立体声声音解码方法和系统的前述和其他目的、优点和特征将变得更清楚。附图说明在附图中:图1是立体声声音处理和通信系统的示意性框图,其描绘了在以下描述中公开的立体声声音编码方法和系统的实现的可能上下文;图2是并发图示了根据第一模型(呈现为集成立体声设计)的立体声声音编码方法和系统的框图;图3是并发图示了根据第二模型(呈现为嵌入式模型)的立体声声音编码方法和系统的框图;图4是并发示出了图2和3的立体声声音编码方法的时域下混合操作的子操作、以及图2和3的立体声声音编码系统的声道混合器的模块的框图;图5是示出了如何将线性化长期相关差映射到因子β和能量归一化因子ε的图表;图6是示出了使用整个帧上的pca/klt方案和使用“余弦”映射函数之间的差别的多曲线图;图7是示出了通过使用背景中具有办公室噪声的双耳麦克风设置、向小型回声室中已记录的立体声样本施加时域下混合、而产生的主声道、辅声道以及这些主声道和辅声道的谱的多曲线图;图8是并发图示了立体声声音编码方法和系统的框图,具有立体声声音信号的主Y和辅X声道两者的编码的可能实现和优化;图9是图示了图8的立体声声音编码方法和系统的LP滤波相干性分析操作和对应LP滤波相干性分析器的框图;图10是并发图示了立体声声音解码方法和立体声声音解码系统的框图;图11是图示了图10的立体声声音解码方法和系统的附加特征的框图;图12是形成本公开的立体声声音编码系统和立体声声音解码器的硬件组件的示例本文档来自技高网
...

【技术保护点】
1.一种用于解码立体声声音信号的左和右声道的立体声声音解码方法,包括:接收包括主声道的编码参数、辅声道的编码参数、和因子β的编码参数,其中该主声道编码参数包括该主声道的LP滤波系数;响应于该主声道编码参数解码该主声道;使用多个编码模型之一来解码该辅声道,其中所述编码模型的至少一个使用所述主声道LP滤波系数来解码该辅声道;和使用因子β对所解码的主和辅声道进行时域上混合,以产生所解码的立体声声音信号的左和右声道,其中该因子β确定在所述左和右声道的产生时、所述主和辅声道的相应贡献。

【技术特征摘要】
【国外来华专利技术】2015.09.25 US 62/232,589;2016.07.14 US 62/362,3601.一种用于解码立体声声音信号的左和右声道的立体声声音解码方法,包括:接收包括主声道的编码参数、辅声道的编码参数、和因子β的编码参数,其中该主声道编码参数包括该主声道的LP滤波系数;响应于该主声道编码参数解码该主声道;使用多个编码模型之一来解码该辅声道,其中所述编码模型的至少一个使用所述主声道LP滤波系数来解码该辅声道;和使用因子β对所解码的主和辅声道进行时域上混合,以产生所解码的立体声声音信号的左和右声道,其中该因子β确定在所述左和右声道的产生时、所述主和辅声道的相应贡献。2.根据权利要求1的立体声声音解码方法,其中所述编码模型中的至少一个使用除了LP滤波系数之外的主声道编码参数,来解码该辅声道。3.根据权利要求1或2的立体声声音解码方法,其中所述编码模型包括通用编码模型、无声编码模型和不活动编码模型。4.根据权利要求1到3的任一个的立体声声音解码方法,其中所述辅声道编码参数包括标识在解码辅声道时要使用的编码模型之一的信息。5.根据权利要求1到4的任一个的立体声声音解码方法,包括使用因子β来恢复能量缩放因子,以在对所解码的主和辅声道执行时域上混合之前,重新缩放所解码的主声道。6.根据权利要求1到5的任一个的立体声声音解码方法,其中所解码的主和辅声道的时域上混合使用以下关系式以获得解码的左L’(n)和右R’(n)声道:其中因子β(t)表示因子β,Y’(n)是解码的主声道,X’(n)是解码的辅声道,n=0、……、N-1是帧中的样本索引,并且t是帧索引。7.一种用于解码立体声声音信号的左和右声道的立体声声音解码系统,包括:用于接收包括主声道的编码参数、辅声道的编码参数、和因子β的编码参数的部件,其中该主声道编码参数包括该主声道的LP滤波系数;响应于该主声道编码参数的该主声道的解码器;使用多个编码模型之一的该辅声道的解码器,其中所述编码模型的至少一个使用所述主声道LP滤波系数来解码该辅声道;和使用因子β以产生所解码的立体声声音信号的左和右声道的所解码的主和辅声道的时域上混合器,其中该因子β确定在所述左和右声道的产生时、所述主和辅声道的相应贡献。8.根据权利要求7的立体声声音解码系统,其中所述编码模型中的至少一个使用除了LP滤波系数之外的主声道编码参数来解码该辅声道。9.根据权利要求7或8的立体声声音解码系统,其中所述辅声道解码器包括使用通用编码模型的第一解码器、以及使用通用编码模型、无...

【专利技术属性】
技术研发人员:T瓦尔兰科特M杰利内克
申请(专利权)人:沃伊斯亚吉公司
类型:发明
国别省市:加拿大,CA

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1