A stereo sound decoding method and system use the encoding parameters of the main channel, the encoding parameters of the auxiliary channel and the encoded parameters of the factor beta, to decode the left and right sound channels of the stereo sound signal. The main channel coding parameters include the LP filter coefficient of the main channel. The main channel is decoded in response to the main channel coding parameter. A consonant channel is decoded using one of a plurality of coding models, of which at least one coding model decodes the consonant channel using the LP filter coefficients of the main channel. Using factor beta, the decoded main and auxiliary channels are mixed in time domain to produce the left and right sound channels decoded by the stereo sound signal, in which the factor beta determines the corresponding contribution of the said main and the auxiliary channels when the left and right sound channels are produced.
【技术实现步骤摘要】
【国外来华专利技术】用于解码立体声声音信号的左和右声道的方法和系统
本公开涉及立体声声音编码,具体但不排他地涉及能够按照低比特率和低延迟在复杂音频场景中产生好的立体声质量的立体声话音(speech)和/或音频编码。
技术介绍
历史上,已利用仅具有一个换能器以仅向用户的一只耳朵输出声音的电话听筒(handset)来实现对话电话。最近十来年,用户已开始使用他们的便携式电话听筒结合头戴式受话器,来接收越过他们的双耳的声音,以主要收听音乐,并且有时收听话音。然而,当使用便携式电话听筒来传送和接收对话话音时,内容仍然是单声道的,但是当使用头戴式受话器时内容被呈现到用户的双耳。利用参考文献[1](其全部内容通过引用合并在这里)中描述的最新3GPP话音编码标准,已显著改进了编码的声音的质量,例如通过便携式电话听筒传送和接收的话音和/或音频。下一自然步骤是传送立体声信息,使得接收机尽可能接近在通信链路的另一侧捕获的真实生活音频场景。在音频编解码器中,例如如同参考文献[2](其全部内容通过引用合并在这里)中描述的,正常使用立体声信息的传送。对于对话话音编解码器,单声道信号是规范。当传送单声道信号时,比特率通常需要加倍,因为使用单声道编解码器来编码左和右声道两者。这在大多数情景下工作良好,但是呈现了以下缺点,比特率加倍,并且不能充分利用两个声道(左和右声道)之间的任何潜在冗余。此外,为了在合理水平保持整体比特率,使用用于每一声道的非常低的比特率,由此影响整体声音质量。可能的替换方案是使用参考文献[6](其全部内容通过引用合并在这里)中描述的所谓参数化立体声。参数化立体声发送诸如双耳时间差(ITD ...
【技术保护点】
1.一种用于解码立体声声音信号的左和右声道的立体声声音解码方法,包括:接收包括主声道的编码参数、辅声道的编码参数、和因子β的编码参数,其中该主声道编码参数包括该主声道的LP滤波系数;响应于该主声道编码参数解码该主声道;使用多个编码模型之一来解码该辅声道,其中所述编码模型的至少一个使用所述主声道LP滤波系数来解码该辅声道;和使用因子β对所解码的主和辅声道进行时域上混合,以产生所解码的立体声声音信号的左和右声道,其中该因子β确定在所述左和右声道的产生时、所述主和辅声道的相应贡献。
【技术特征摘要】
【国外来华专利技术】2015.09.25 US 62/232,589;2016.07.14 US 62/362,3601.一种用于解码立体声声音信号的左和右声道的立体声声音解码方法,包括:接收包括主声道的编码参数、辅声道的编码参数、和因子β的编码参数,其中该主声道编码参数包括该主声道的LP滤波系数;响应于该主声道编码参数解码该主声道;使用多个编码模型之一来解码该辅声道,其中所述编码模型的至少一个使用所述主声道LP滤波系数来解码该辅声道;和使用因子β对所解码的主和辅声道进行时域上混合,以产生所解码的立体声声音信号的左和右声道,其中该因子β确定在所述左和右声道的产生时、所述主和辅声道的相应贡献。2.根据权利要求1的立体声声音解码方法,其中所述编码模型中的至少一个使用除了LP滤波系数之外的主声道编码参数,来解码该辅声道。3.根据权利要求1或2的立体声声音解码方法,其中所述编码模型包括通用编码模型、无声编码模型和不活动编码模型。4.根据权利要求1到3的任一个的立体声声音解码方法,其中所述辅声道编码参数包括标识在解码辅声道时要使用的编码模型之一的信息。5.根据权利要求1到4的任一个的立体声声音解码方法,包括使用因子β来恢复能量缩放因子,以在对所解码的主和辅声道执行时域上混合之前,重新缩放所解码的主声道。6.根据权利要求1到5的任一个的立体声声音解码方法,其中所解码的主和辅声道的时域上混合使用以下关系式以获得解码的左L’(n)和右R’(n)声道:其中因子β(t)表示因子β,Y’(n)是解码的主声道,X’(n)是解码的辅声道,n=0、……、N-1是帧中的样本索引,并且t是帧索引。7.一种用于解码立体声声音信号的左和右声道的立体声声音解码系统,包括:用于接收包括主声道的编码参数、辅声道的编码参数、和因子β的编码参数的部件,其中该主声道编码参数包括该主声道的LP滤波系数;响应于该主声道编码参数的该主声道的解码器;使用多个编码模型之一的该辅声道的解码器,其中所述编码模型的至少一个使用所述主声道LP滤波系数来解码该辅声道;和使用因子β以产生所解码的立体声声音信号的左和右声道的所解码的主和辅声道的时域上混合器,其中该因子β确定在所述左和右声道的产生时、所述主和辅声道的相应贡献。8.根据权利要求7的立体声声音解码系统,其中所述编码模型中的至少一个使用除了LP滤波系数之外的主声道编码参数来解码该辅声道。9.根据权利要求7或8的立体声声音解码系统,其中所述辅声道解码器包括使用通用编码模型的第一解码器、以及使用通用编码模型、无...
【专利技术属性】
技术研发人员:T瓦尔兰科特,M杰利内克,
申请(专利权)人:沃伊斯亚吉公司,
类型:发明
国别省市:加拿大,CA
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。