用于线性预测译码中的自适应共振峰锐化的系统、方法、设备和计算机可读媒体技术方案

技术编号:12106682 阅读:170 留言:0更新日期:2015-09-24 00:34
一种处理音频信号的方法包含确定随着时间的过去所述音频信号的平均信噪比。所述方法包含:基于所述所确定的平均信噪比,确定共振峰锐化因子。所述方法还包含:将基于所述所确定的共振峰锐化因子的滤波器应用到基于来自所述音频信号的信息的码本向量。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】用于线性预测译码中的自适应共振峰锐化的系统、方法、设 备和计算机可读媒体 相关申请的夺叉引用 本申请案主张2013年1月29日申请的共同拥有的美国临时专利申请案第 61/758, 152号和2013年9月13日申请的美国非临时专利申请案第14/026, 765号的优先 权,所述专利申请案的内容以引用的方式明确地并入本文中。
本专利技术涉及音频信号的译码(例如,语音译码)。
技术介绍
线性预测(LP)分析-合成构架对于语音译码来说已经是成功的,因为其非常适合 于用于语音合成的源系统范例。确切地说,当预测残差捕获声带的浊音、清音或混合激励行 为时,通过全极点滤波器来模型化上声道的缓慢时变频谱特性。使用闭环合成分析过程来 模型化和编码来自LP分析的预测残差。 在合成分析码激励线性预测(CELP)系统中,选择导致输入语音与重构语音之间 的最低观测"感知加权"均方误差(MSE)的激励序列。感知加权滤波器使预测误差成形,使 得量化噪声被高能共振峰所掩蔽掉。感知加权滤波器的作用是降低共振峰区域中的误差能 量的重要性。这个降低重要性策略是基于在共振峰区域中量化噪声被语音所部分地掩蔽掉 的事实。在CELP译码中,从两个码本(即,自适应码本(ACB)和固定码本(FCB))产生激励 信号。ACB向量表示过去激励信号的延迟(S卩,延迟了闭环音调值)段并促成整体激励的周 期性分量。在捕获整体激励中的周期性贡献之后,执行固定码本搜索。FCB激励向量部分地 表示激励信号中的剩余非周期性分量并且是使用交错、单式脉冲的代数码本而建构。在语 音译码中,音调锐化技术和共振峰锐化技术提供了语音重构质量的显著改善(例如,在更 低的比特率下)。 共振峰锐化可促成清晰语音中的显著质量增益;但是,在存在噪声的情况下且在 低信噪比(SNR)下,质量增益不大显著。这可能归因于共振峰锐化滤波器的不准确估计并 且部分地归因于另外需要对噪声做出解释的源系统语音模型的某些局限性。在一些情况 下,在存在带宽扩展(其中经变换的共振峰锐化低波段激励被用于高波段合成中)的情况 下,语音质量的降级更为明显。确切地说,低波段激励的某些分量(例如,固定码本贡献) 可经历音调锐化和/或共振峰锐化,以改善低波段合成的感知质量。将来自低波段的音调 锐化和/或共振峰锐化激励用于高波段合成引起可听伪影的可能性可能高于改善整体语 音重构质量的可能性。【附图说明】 图1展示用于低比特率语音译码的码激励线性预测(CELP)合成分析架构的示意 图。图2展示语音信号的帧的一个实例的快速傅里叶变换(FFT)频谱和相对应的LPC 频谱。 图3A展示根据一般配置的用于处理音频信号的方法M100的流程图。 图3B展示根据一般配置的用于处理音频信号的设备MF100的框图。 图3C展示根据一般配置的用于处理音频信号的设备A100的框图。 图3D展示方法M100的实施方案M120的流程图。 图3E展示设备MF100的实施方案MF120的框图。 图3F展示设备A100的实施方案A120的框图。 图4展示用于计算长期SNR的伪码清单的实例。 图5展示用于根据长期SNR来估计共振峰锐化因子的伪码清单的实例。 图6A到6C是y2值对长期SNR的实例图。图7说明供自适应码本搜索的目标信号x(n)的产生。 图8展示FCB估计方法。 图9展示图8的方法的修改例以包含如本文中所描述的自适应共振峰锐化。 图10A展示根据一般配置的用于处理经编码音频信号的方法M200的流程图。 图10B展示根据一般配置的用于处理经编码音频信号的设备MF200的框图。 图10C展示根据一般配置的用于处理经编码音频信号的设备A200的框图。 图11A是说明经由网络NW10通信的发射终端102和接收终端104的实例的框图。 图11B展示音频编码器AE10的实施方案AE20的框图。 图12展示帧编码器FE10的基本实施方案FE20的框图。 图13A展示通信装置D10的框图。 图13B展示无线装置1102的框图。 图14展示手持机H100的正视图、后视图和侧视图。【具体实施方式】 除非通过其上下文明确地限制,否则在本文中使用术语"信号"来指示其一般含义 中的任一者,包含如在导线、总线或其它发射媒体上表达的存储器位置的状态(或存储器 位置的集合)。除非通过其上下文明确地限制,否则在本文中使用术语"产生"来指示其一 般含义中的任一者,例如计算或以其它方式产生等。除非通过其上下文明确地限制,否则在 本文中使用术语"计算"来指示其一般含义中的任一者,例如计算、评估、平滑化和/或从多 个值中选择等。除非通过其上下文明确地限制,否则使用术语"获得"来指示其一般含义中 的任一者,例如计算、导出、接收(例如,从外部装置)和/或检索(例如,从存储元件的阵 列)等。除非通过其上下文明确地限制,否则使用术语"选择"来指示其一般含义中的任一 者,例如识别、指示、应用和/或使用一组两个或两个以上中的至少一者和少于所有者等。 除非通过其上下文明确地限制,否则使用术语"确定"来指示其一般含义中的任一者,例如 决定、建立、总结、计算、选择和/或评估。在本专利技术描述和权利要求书中使用术语"包括" 时,并不排除其它元件或操作。使用术语"基于"(如在"A是基于B"中)来指示其一般含 义中的任一者,包含以下情况:⑴"从……导出"(例如,"B是A的前驱体");(ii) "至少 基于"(例如,"A至少基于B"),及适当时在特定上下文中;(iii) "等于"(例如,"A等于 B")。类似地,使用术语"响应于"来指示其一般含义中的任一者,包含"至少响应于"。 除非另有指示,否则使用术语"系列"来指示一连串两个或两个以上项目。使用术 语"对数"来指示基数为十的对数,不过此类运算到其它基数的扩展是在本专利技术的范围内。 使用术语"频率分量"来指示信号的一组频率或频带中的一者,例如信号的频域表示的样本 (例如,如由快速傅里叶变换或MDCT产生)或信号的子带(例如,巴克(Bark)尺度或梅尔 (mel)尺度子带)等。 除非另有指示,否则对具有特定特征的设备的操作的任何揭示内容还明确地欲揭 示具有类似特征的方法(且反之亦然),且对根据特定配置的设备的操作的任何揭示内容 还明确地欲揭示根据类似配置的方法(且反之亦然)。术语"配置"可参考如通过其特定上 下文指示的方法、设备和/或系统来使用。除非特定上下文另有指示,否则术语"方法"、"过 程"、"程序"及"技术"通用地且可互换地使用。具有多个子任务的"任务"也是方法。除非 特定上下文另有指示,否则术语"设备"与"装置"也通用地且可互换地使用。术语"元件" 和"模块"通常用来指示更大配置的一部分。除非通过其上下文明确地限制,否则在本文中 使用术语"系统"来指示其一般含义中的任一者,包含"相互作用以用于共同目的的一群组 元件"。术语"多个"意指"两个或两个以上"。文件的一部分以引用的方式进行的任何并入 也应理解为并入了在所述部分内参考的术语或变量的定义,其中此些定义出现在文件中的 其它地方,以及并入了在所并入部分中参考的任何图。 术语"译码器"、"编解码器"和"译码系统"可互换地使用以指代包含以下各者的 系统:至少一个编码器,其经配置以接收本文档来自技高网...

【技术保护点】
一种处理音频信号的方法,所述方法包括:确定随着时间的过去所述音频信号的平均信噪比;基于所述所确定的平均信噪比,确定共振峰锐化因子;以及将基于所述所确定的共振峰锐化因子的滤波器应用到基于来自所述音频信号的信息的码本向量。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:文卡特拉曼·S·阿提维韦克·拉金德朗文卡特什·克里希南
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利