音频处理方法、装置、设备、存储介质及计算机程序产品制造方法及图纸

技术编号：35063123 阅读：16 留言：0更新日期：2022-09-28 11:18

本申请提供了一种音频处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品；方法包括：对音频信号进行多通道信号分解处理，得到音频信号的N个子带信号，其中，N为大于2的整数，N个子带信号的频段依次递增；对每个子带信号进行信号压缩处理，得到每个子带信号的子带信号特征；对每个子带信号的子带信号特征进行量化编码处理，得到每个子带信号的码流。通过本申请，能够提高音频编码效率。能够提高音频编码效率。能够提高音频编码效率。

全部详细技术资料下载

【技术实现步骤摘要】
音频处理方法、装置、设备、存储介质及计算机程序产品

[0001]本申请涉及数据处理技术，尤其涉及一种音频处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

技术介绍

[0002]音频编解码技术是包括远程音视频通话在内的通信服务中的一项核心技术。语音编码技术，简单讲，就是使用较少的网络带宽资源去尽量多的传递语音信息。从香农信息论的角度来讲，语音编码是一种信源编码，信源编码的目的是在编码端尽可能的压缩我们想要传递信息的数据量，去掉信息中的冗余，同时在解码端还能够无损(或接近无损)的恢复出来。
[0003]然而，对于如何在保证音频质量的情况下，有效提高音频编码的效率，相关技术尚无有效的解决方案。

技术实现思路

[0004]本申请实施例提供一种音频处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品，能够在保证音频质量的情况下，提高音频编码效率。
[0005]本申请实施例的技术方案是这样实现的：
[0006]本申请实施例提供一种音频处理方法，包括：
[0007]对音频信号进行多通道信号分解处理，得到所述音频信号的N个子带信号，其中，所述N为大于2的整数，所述N个子带信号的频段依次递增；
[0008]对每个所述子带信号进行信号压缩处理，得到每个所述子带信号的子带信号特征；
[0009]对每个所述子带信号的子带信号特征进行量化编码处理，得到每个所述子带信号的码流。
[0010]本申请实施例提供一种音频处理方法，包括：
[0011]...

【技术保护点】

【技术特征摘要】
1.一种音频处理方法，其特征在于，所述方法包括：对音频信号进行多通道信号分解处理，得到所述音频信号的N个子带信号，其中，所述N为大于2的整数，所述N个子带信号的频段依次递增；对每个所述子带信号进行信号压缩处理，得到每个所述子带信号的子带信号特征；对每个所述子带信号的子带信号特征进行量化编码处理，得到每个所述子带信号的码流。2.根据权利要求1所述的方法，其特征在于，每个所述子带信号的子带信号特征的特征维度与每个所述子带信号的频段非正相关，第N个子带信号的子带信号特征的特征维度小于第一个子带信号的子带信号特征的特征维度。3.根据权利要求1所述的方法，其特征在于，所述多通道信号分解处理是通过多层二通道子带分解实现的；所述对音频信号进行多通道信号分解处理，得到所述音频信号的N个子带信号，包括：对所述音频信号进行第一层的所述二通道子带分解处理，得到所述第一层的低频子带信号以及所述第一层的高频子带信号；对第i层的子带信号进行第i+1层的所述二通道子带分解处理，得到所述第i+1层的低频子带信号以及所述i+1层的高频子带信号；其中，所述第i层的子带信号为所述第i层的低频子带信号，或所述第i层的高频子带信号和所述第i层的低频子带信号，所述i为递增的自然数且取值范围为1≤i＜N；将最后一层的子带信号以及每一层中未进行所述二通道子带分解处理的高频子带信号，作为所述音频信号的子带信号。4.根据权利要求3所述的方法，其特征在于，所述对所述音频信号进行第一层的所述二通道子带分解处理，得到所述第一层的低频子带信号以及所述第一层的高频子带信号，包括：对所述音频信号进行采样处理，得到采样信号，其中，所述采样信号包括采样得到的多个样本点；对所述采样信号进行所述第一层的低通滤波处理，得到所述第一层的低通滤波信号；对所述第一层的低通滤波信号进行下采样处理，得到所述第一层的低频子带信号；对所述采样信号进行所述第一层的高通滤波处理，得到所述第一层的高通滤波信号；对所述第一层的高通滤波信号进行下采样处理，得到所述第一层的高频子带信号。5.根据权利要求1所述的方法，其特征在于，所述对每个所述子带信号进行信号压缩处理，得到每个所述子带信号的子带信号特征，包括：针对任意所述子带信号执行以下处理：调用所述子带信号对应的第一神经网络模型；通过所述第一神经网络模型对所述子带信号进行特征提取处理，得到所述子带信号的子带信号特征；其中，所述第一神经网络模型的结构复杂度与所述子带信号的子带信号特征的维度正相关。6.根据权利要求5所述的方法，其特征在于，所述通过所述第一神经网络模型对所述子带信号进行特征提取处理，得到所述子带信号的子带信号特征，包括：
通过所述第一神经网络模型对所述子带信号执行以下处理：对所述子带信号进行卷积处理，得到所述子带信号的卷积特征；对所述卷积特征进行池化处理，得到所述子带信号的池化特征；对所述池化特征进行下采样处理，得到所述子带信号的下采样特征；对所述下采样特征进行卷积处理，得到所述子带信号的子带信号特征。7.根据权利要求1所述的方法，其特征在于，所述对每个所述子带信号进行信号压缩处理，得到每个所述子带信号的子带信号特征，包括：对前k个子带信号分别进行特征提取处理，得到所述前k个子带信号分别对应的子带信号特征；对后N
‑
k个子带信号分别进行频带扩展处理，得到所述后N
‑
k个子带信号分别对应的子带信号特征；其中，所述k为整数且取值范围为1＜k＜N。8.根据权利要求7所述的方法，其特征在于，所述对后N
‑
k个子带信号分别进行频带扩展处理，得到所述后N
‑
k个子带信号分别对应的子带信号特征，包括：针对所述后N
‑
k个子带信号中的任意所述子带信号执行以下处理：基于所述子带信号包括的多个样本点进行频域变换处理，得到所述多个样本点分别对应的变换系数；将所述多个样本点分别对应的变换系数划分为多个子带；对每个所述子带包括的变换系数进行均值处理，得到每个所述子带对应的平均能量，并将所述平均能量作为每个所述子带对应的子带谱包络；将所述多个子带分别对应的子带谱包络确定为所述子带信号对应的子带信号特征。9.根据权利要求8所述的方法，其特征在于，所述基于所述子带信号包括的多个样本点进行频域变换处理，得到所述多个样本点分别对应的变换系数，包括：获取参考音频信号的参考子带信号，其中，所述参考音频信号是与所述音频信号相邻的音频信号，所述参考子带信号与所述子带信号的频段相同；基于所述参考子带信号包括的多个样本点以及所述子带信号包括的多个样本点，对所述子带信号包括的多个样本点进行离散余弦变换处理，得到所述子带信号包括的多个样本点分别对应的变换系数。10.根据权利要求1所述的方法，其特征在于，所述对每个所述子带信号的子带信号特征进行量化编码处理，得到每个所述子带信号的码流，包括：对每个所述子带信号的子带信号特征进行量化处理，得到所述子带信号特征的索引值；对所述子带信号特征的索引值进行熵编码处理，得到所述子带信号的子码流。11.一种音频处理方法，其特征在于，所述方法包括：对N个码流进行量化解码处理，得到每个所述码流对应的子...

【专利技术属性】
技术研发人员：王蒙，肖玮，康迂勇，黄庆博，史裕鹏，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人