用于限制声音编解码器中的输出合成失真的方法及设备技术

技术编号：41538464 阅读：25 留言：0更新日期：2024-06-03 23:17

一种用于限制声音信号的失真的两级失真限制器和方法，所述声音信号例如是来自声音信号解码器的输出声音信号合成。在第一级中，电平检测器检测声音信号的幅度值，并且使用检测到的幅度值来计算控制增益，并且衰减器使用控制增益降低声音信号的电平。在第二级中，饱和检测器检测声音信号的饱和，并且响应于饱和的检测来更新控制增益。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】

本公开涉及声音编解码，尤其涉及但不仅限于用于限制声音信号(例如，来自声音信号解码器的输出声音信号合成)的失真的方法和设备(限制器)。如果使用声音渲染器，则失真限制的方法和设备(限制器)可以被实施在渲染器之后或作为渲染器的一部分被实施。在本公开和所附权利要求中：术语“声音(sound)”可以与语音(speech)、音频(audio)和任何其他声音相关；术语“立体声(stereo)”是“立体声的(stereophonic)”的缩写；术语“单声道(mono)”是“单声道的(monophonic)”的缩写；以及术语“多声道”可以与两个或更多个声音信号或声音编解码器相关。

技术介绍

1、历史上，会话电话已经用仅具有一个换能器以仅向用户的一只耳朵输出声音的手持机来实施。在过去的十年中，用户已经开始将他们的便携式手持机与耳机结合使用以通过他们的两只耳朵接收声音，主要是收听音乐，但有时也收听语音。然而，当便携式手持机被用来发送和接收会话语音时，内容仍然是单声道的，但是在使用耳机时呈现给用户的两只耳朵。

2、利用如参考文献[1]中所描述的最新的3gpp(第三代合作伙伴计划)语音编码标准(命名为增强语音服务(evs))，已经显著地提高了编码的声音(例如通过便携式手持机发送和接收的语音和/或音频)的质量，参考文献[1]的全部内容通过引用并入本文。下一个自然步骤是发送立体声信息，使得接收器尽可能接近在通信链路的另一端捕获的现实音频场景。

3、已经开发了高效的立体声编码技术并将其用于低比特率。作为非限制性示例，所谓的参数立体声编码

4、此外，在过去几年中，音频的生成、记录、表示、编码、传输和再现正朝着增强的、交互式的和沉浸式的听众体验的方向发展。沉浸式体验可以被描述为例如在声音来自所有方向时深度参与(engaged)或参与(involved)声音场景的状态。在沉浸式音频(也被称为3d(三维)音频)中，考虑到多种多样的声音特征，如音色、方向性、混响、透明度和(听觉)空间感的准确性，在听众周围的所有三维空间中再现声音图像。沉浸式音频是为特定的声音回放或再现系统(诸如基于扬声器的系统、集成再现系统(条形音箱)或耳机)产生的。然后，声音再现系统的交互性可以包括例如调整声级、改变声音位置或选择用于再现的不同语言的能力。

5、近年来，3gpp(第三代合作伙伴计划)开始致力于基于evs编解码器开发用于被称为ivas(沉浸式语音和音频服务)的沉浸式服务的3d声音编解码器(参见参考文献[2]，其全部内容通过引用并入本文)。

6、在声音编解码器中，输出声音信号可能被几种类型的失真损坏。

7、失真可能由其中声音信号样本具有高于或低于某个阈值的值的削波引起。这种情况通常可以发生在声音信号样本a)从浮点表示转换为定点表示时，b)从一个定点表示转换为具有更短比特长度的另一个定点表示(例如从长整数转换为短整数(例如，在参考文献[3]中描述的c99编程语言标准中，该参考文献[3]的全部内容通过引用并入本文，长符号整数类型能够包含[-2,147,483,647，+2,147,483,647]32位范围，而短符号整数类型能够包含[-32,767，+32,767]16位范围))时，c)由于声音编解码器的解码算法的不稳定性导致的时，d)在渲染期间，当声音(语音和/或音频)信号被操纵、下混合等时。当这些情况之一发生时，声音信号样本的幅度可能饱和，并且因此被限幅或限制，导致感觉上令人讨厌的声音。

8、为了减少这种削波，可以使用在单声道evs编解码器(参考文献[1])的acelp内核中被实施的自动增益控制(agc)。agc是一种闭环反馈算法，其将声音信号样本的变化幅度调节并保持在适合于处理这些声音信号样本而没有失真的限制内。agc被设计为在没有额外的延迟的情况下在时域中调节声音信号样本。

9、饱和的问题在多声道编解码器中甚至更具挑战性，通常当解码声道的数量高于输出声道的数量或者解码声道相关时。示例为将经解码的多声道音频渲染为双耳输出。

10、作为解码算法的不稳定性的结果，饱和也经常发生，例如当在基于celp的声音编解码器中使用的长期合成滤波器不稳定时或者当接收到的比特流被帧擦除或比特错误损坏时。

技术实现思路

1、本公开涉及一种用于限制声音信号的失真的方法和设备(限制器)。当声音渲染器被实施在声音信号解码器之后时，可以对渲染的声音信号执行用于限制声音信号的失真的方法和设备(限制器)。

2、根据第一方面，本公开涉及一种用于限制声音信号的失真的两级方法，包括：在第一级中，检测所述声音信号的幅度值，并且使用检测到的幅度值计算控制增益，使用所述控制增益衰减所述声音信号的电平，以及在第二级中，检测所述声音信号的饱和，并且响应于检测到饱和来更新所述控制增益。

3、根据第二方面，本公开涉及一种用于限制来自声音信号解码器的输出声音信号合成的失真的两级方法。在第一级中，检测所述输出声音信号合成的幅度值，使用检测到的幅度值计算控制增益，并且使用所述控制增益衰减所述输出声音信号合成的电平。在第二级中，检测所述输出声音信号合成的饱和，并且响应于检测到饱和来更新所述控制增益。

4、根据另一方面，提供了一种用于限制声音信号的失真的两级失真限制器，包括：(a)第一级，包括电平检测器，用于检测所述声音信号的幅度值并且用于使用检测到的幅度值来计算控制增益，以及使用所述控制增益的所述声音信号的电平的衰减器，以及(b)第二级，包括饱和检测器，用于检测所述声音信号的饱和并且用于响应于检测到饱和来更新所述控制增益。

5、根据另一方面，提供了一种用于限制来自声音信号解码器的输出声音信号合成的失真的两级失真限制器，包括：(a)第一级，包括电平检测器，用于检测所述输出声音信号合成的幅度值并且用于使用检测到的幅度值计算控制增益，使用所述控制增益的所述输出声音信号合成的电平的衰减器；以及(b)第二级，包括饱和检测器，用于检测所述输出声音信号合成的饱和并且响应于检测到饱和来更新所述控制增益。

6、在阅读以下仅通过参考附图的示例给出的两级失真限制器和失真限制方法的示例性实施例的非限制性描述后，前述特征和其他特征将变得更加明显。

本文档来自技高网...

【技术保护点】

1.一种用于限制来自声音信号解码器的输出声音信号合成的失真的两级失真限制器，包括：

2.根据权利要求1所述的两级失真限制器，其中所述输出声音信号合成的所述检测到的幅度值是所述输出声音信号合成的峰值。

3.根据权利要求1或2所述的两级失真限制器，其中所述输出声音信号合成包括多个声道，并且其中所述两级失真限制器是两级多声道失真限制器，所述两级多声道失真限制器的所述第一级和所述第二级被应用于所述输出声音信号合成的每个声道。

4.根据权利要求1至3中任一项所述的两级失真限制器，其中所述电平检测器将所述检测到的幅度值与声音信号合成限制器阈值进行比较，以计算所述控制增益。

5.根据权利要求4所述的两级失真限制器，其中，如果所述检测到的幅度值等于或低于所述限制器阈值，则所述电平检测器将所述控制增益设置为1。

6.根据权利要求4或5所述的两级失真限制器，其中，如果所述检测到的幅度值大于所述限制器阈值，则所述电平检测器将所述控制增益选择为(a)所述检测到的幅度值与所述限制器阈值之间的比率和(b)最低增益限制中的较大者。

7.根

8.根据权利要求7所述的两级失真限制器，其中所述输出声音信号合成由声音信号合成样本形成，并且其中所述衰减器包括：

9.根据权利要求8所述的两级失真限制器，其中，所述增益滤波器是一阶无限脉冲响应(IIR)低通滤波器。

10.根据权利要求1至9中任一项所述的两级失真限制器，其中所述饱和检测器包括饱和检测标志的第一计算器，所述饱和检测标志指示检测到所述输出声音信号合成的饱和。

11.根据权利要求10所述的两级失真限制器，其中所述第一计算器在输出声音信号合成处理帧的开始处初始化所述饱和检测标志。

12.根据权利要求10或11所述的两级失真限制器，其中所述第一计算器更新饱和检测计数器，所述饱和检测计数器存储当前输出声音信号合成处理帧中存在饱和的概率。

13.根据权利要求12所述的两级失真限制器，其中所述声音信号解码器产生指示由所述声音信号解码器接收的比特流中的比特错误的参数，并且当所产生的参数指示所述比特流中的比特错误时，所述第一计算器将所述饱和检测计数器更新为其最大值，并且将所述饱和检测标志设置为饱和指示值。

14.根据权利要求12所述的两级失真限制器，其中当(a)由所述声音信号解码器产生的参数指示由所述声音信号解码器接收的比特流中没有比特错误，并且(b)所述检测到的幅度值大于给定阈值并且所述饱和检测计数器大于0时，所述第一计算器将所述饱和检测标志设置为饱和指示值。

15.根据权利要求12所述的两级失真限制器，其中，如果(a)由所述声音信号解码器产生的参数指示由所述声音信号解码器接收的比特流中没有比特错误，(b)所述检测到的幅度值不大于第一给定阈值和/或所述饱和检测计数器不大于0，并且(c)所述检测到的幅度值大于第二给定阈值，则所述第一计算器将所述饱和检测标志设置为饱和指示值，并且将所述饱和检测计数器更新为所述饱和检测计数器的最大值与所述饱和检测计数器和常数之和之间的最小值。

16.根据权利要求12所述的两级失真限制器，其中如果(a)由所述声音信号解码器产生的参数指示由所述声音信号解码器接收的比特流中的比特错误，(b)所述检测到的幅度值大于第一给定阈值并且所述饱和检测计数器大于0，或者(c)所述检测到的幅度值大于第二给定阈值，则所述第一计算器将所述饱和检测标志设置为饱和指示值。

17.根据权利要求16所述的两级失真限制器，其中所述第一阈值和所述第二阈值与声音信号合成限制器阈值相关。

18.根据权利要求12所述的两级失真限制器，其中如果(a)由所述声音信号解码器产生的参数指示由所述声音信号解码器接收的比特流中没有比特错误，(b)所述检测到的幅度值等于或低于第一给定阈值和/或所述饱和检测计数器等于0，并且(c)所述检测到的幅度值等于或低于第二给定阈值，则所述第一计算器将所述饱和检测计数器更新为0与所述饱和检测计数器和常数之差之间的最大值。

19.根据权利要求10至18中任一项所述的两级失真限制器，其中所述饱和检测器包括第二计算器，所述第二计算器响应于所述饱和检测标志来更新所述控制增益。

20.根据权利要求19所述的两级失真限制器，其中所述第二计算器响应于所述饱和检测标志等于饱和指示值来更新所述控制增益。

<...

【技术特征摘要】
【国外来华专利技术】

1.一种用于限制来自声音信号解码器的输出声音信号合成的失真的两级失真限制器，包括：

2.根据权利要求1所述的两级失真限制器，其中所述输出声音信号合成的所述检测到的幅度值是所述输出声音信号合成的峰值。

5.根据权利要求4所述的两级失真限制器，其中，如果所述检测到的幅度值等于或低于所述限制器阈值，则所述电平检测器将所述控制增益设置为1。

7.根据权利要求1至6中任一项所述的两级失真限制器，其中所述第一级包括启动/释放时间参数的计算器，所述启动/释放时间参数根据所述输出声音信号合成的瞬态特性与非瞬态特性来定义更短或更长的启动/释放时间。

8.根据权利要求7所述的两级失真限制器，其中所述输出声音信号合成由声音信号合成样本形成，并且其中所述衰减器包括：

9.根据权利要求8所述的两级失真限制器，其中，所述增益滤波器是一阶无限脉冲响应(iir)低通滤波器。

11.根据权利要求10所述的两级失真限制器，其中所述第一计算器在输出声音信号合成处理帧的开始处初始化所述饱和检测标志。

17.根据权利要求16所述的两级失真限制器，其中所述第一阈值和所述第二阈值与声音信号合成限制器阈值相关。

20.根据权利要求19所述的两级失真限制器，其中所述第二计算器响应于所述饱和检测标志等于饱和指示值来更新所述控制增益。

21.根据权利要求20所述的两级失真限制器，其中所述第二计算器根据所述检测到的幅度值和声音信号合成限制器阈值来计算增益校正因子，并且使用所述增益校正因子来更新所述控制增益。

22.根据权利要求21所述的两级失真限制器，其中如果所述增益校正因子低于特定阈值，则所述第二计算器使用另一常数校正因子来更新所述控制增益。

23.根据权利要求22所述的两级失真限制器，其中如果所述增益校正因子等于或大于所述特定阈值，则所述第二计算器不执行所述控制增益的更新。

24.一种用于限制来自声音信号解码器的输出声音信号合成的失真的两级失真限制器，包括：

25.一种用于限制来自声音信号解码器的输出声音信号合成的失真的两级失真限制器，包括：

26.一种用于限制来自声音信号解码器的输出声音信号合成的失真的两级方法，包括：

27.根据权利要求26所述的两级失真限制方法，其中所述输出声音信号合成的所述检测到的幅度值是所述输出声音信号合成的峰值。

28.根据权利要求26或27所述的两级失真限制方法，其中所述输出声音信号合成包括多个声道，并且其中所述两级失真限制方法是所述第一级和所述第二级被应用于所述输出声音信号合成的每个声道的两级多声道失真限制方法。

29.根据权利要求26至28中任一项所述的两级失真限制方法，其中检测所述输出声音信号合成幅度值并且计算所述控制增益包括将所述检测到的幅度值与声音信号合成限制器阈值进行比较，以计算所述控制增益。

30.根据权利要求29所述的两级失真限制方法，其中，如果所述检测到的幅度值等于或低于所述限制器阈值，则检测所述输出声音信号合成幅度值并且计算所述控制增益包括将所述控制增益设置为1。

31.根据权利要求29或30所述的两级失真限制方法，其中，如果所述检测到的幅度值大于所述限制器阈值，则检测所述输出声音信号合成幅度值并且计算所述控制增益包括将所述控制增益选择为(a)所述检测到的幅度值与所述限制器阈值之间的比率和(b)最低增益限制中的较大者。

32.根据权利要求26至31中任一项所述的两级失真限制方法，包括，在所述第一级中，计算启动/释放时间参数，所述启动/释放时间参数根据所述输出声音信号合成的瞬态特性与非瞬态特性来定义更短或更长的启动/释放时间。

33.根据权利要求32所述的两级失真限制方法，其中所述输出声音信号合成由声音信号合成样本形成，并且其中衰减所述输出声音信号合成的电平包括：

34.根据权利要求33所述的两级失真限制方法，其中增益滤波包括使用一阶无限脉冲响应(iir)低通滤波器。

35.根据权利要求26至34中任一项所述的两级失真限制方法，其中检测所述输出声音信号合成中的饱和并且更新所述控制增益包括计算指示检测到所述输出声音信号合成的饱和的饱和检测标志。

36.根据权利要求35所述的两级失真限制方法，其中计算所述饱和检测标志包括在输出声音信号合成处理帧的开始处初始化所述饱和检测标志。

37.根据权利要求35或36所述的两级失真限制方法，其中计算所述饱和检测标志包括更新饱和检测计数器，所述饱和检测计数器存储当前输出声音信号合成处理帧中存在饱和的概率。

38.根据权利要求37所述的两级失真限制方法，其中所述声音信号解码器产生指示由所述声音信号解码器接收的比特流中的比特错误的参数，并且其中计算所述饱和检测标志包括：当所产生的参数指示所述比特流中的比特错误时，将所述饱和检测计数器更新为其最大值，并且将所述饱和检测标志设置为饱和指示值。

39.根据权利要求37所述的两级失真限制方法，其中计算所述饱和检测标志包括：当(a)由所述声音信号解码器产生的参数指示由所述声音信号解码器接收的比特流中没有比特错误，并且(b)所述检测到的幅度值大于给定阈值并且所述饱和检测计数器大于0时，将所述饱和检测标志设置为饱和指示值。

40.根据权利要求37所述的两级失真限制方法，其中，如果(a)由所述声音信号解码器产生的参数指示由所述声音信号解码器接收的比特流中没有比特错误，(b)所述检测到的幅度值不大于第一给定阈值和/或所述饱和检测计数器不大于0，并且(c)所述检测到的幅度值大于第二给定阈值，则计算所述饱和检测标志包括将所述饱和检测标志设置为饱和指示值，并且将所述饱和检测计数器更新为所述饱和检测计数器的最大值与所述饱和检测计数器和常数之和之间的最小值。

41.根据权利要求37所述的两级失真限制方法，其中计算所述饱和检测标志包括：如果(a)由所述声音信号解码器产生的参数指示由所述声音信号解码器接收的比特流中的比特错误，(b)所述检测到的幅度值大于第一给定阈值并且所述饱和检测计数器大于0，或者(c)所述检测到的幅度值大于第二给定阈值，则将所述饱和检测标志设置为饱和指示值。

42.根据权利要求41所述的两级失真限制方法，其中所述第一阈值和所述第二阈值与声音信号合成限制器阈值相关。

43.根据权利要求37所述的两级失真限制方法，其中计算所述饱和检测标志包括：如果(a)由所述声音信号解码器产生的参数指示由所述声音信号解码器接收的比特流中没有比特错误，(b)所述检测到的幅度值等于或低于第一给定阈值和/或所述饱和检测计数器等于0，并且(c)所述检测到的幅度值等于或低于第二给定阈值，则将所述饱和检测计数器更新为0与所述饱和检测计数器和常数之差之间的最大值。

44.根据权利要求35至43中任一项所述的两级失真限制方法，其中检测所述输出声音信号合成的饱和并且更新所述控制增益包括响应于所述饱和检测标志来更新所述控制增益。

45.根据权利要求44所述的两级失真限制方法，其中响应于所述饱和检测标志等于饱和指示值来更新所述控制增益。

46.根据权利要求45所述的两级失真限制方法，其中更新所述控制增益包括：根据所述检测到的幅度值和声音信号合成限制器阈值来计算增益校正因子，以及使用所述增益校正因子来更新所述控制增益。

47.根据权利要求46所述的两级失真限制方法，其中更新所述控制增益包括：如果所述增益校正因子低于特定阈值，则使用另一常数校正因子...

【专利技术属性】
技术研发人员：V·埃克斯勒，
申请(专利权)人：沃伊斯亚吉公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人