音频编码方法技术

技术编号：39717350 阅读：11 留言：0更新日期：2023-12-17 23:24

本申请提供了一种音频编码方法

全部详细技术资料下载

【技术实现步骤摘要】
音频编码方法、音频解码方法、装置、可读存储介质

[0001]本申请涉及人工智能技术，尤其涉及一种音频编码方法
、
音频解码方法
、
装置
、
电子设备
、
计算机可读存储介质及计算机程序产品
。

技术介绍

[0002]人工智能
(AI
，
Artificial Intelligence)
是计算机科学的一个综合技术，通过研究各种智能机器的设计原理与实现方法，使机器具有感知
、
推理与决策的功能
。
人工智能技术是一门综合学科，涉及领域广泛，例如自然语言处理技术以及机器学习
/
深度学习等几大方向，随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值
。
[0003]音频编解码技术是人工智能领域的重要应用之一，音频编解码技术是包括远程音视频通话在内的通信服务中的一项核心技术
。
语音编码技术，简单讲，就是使用较少的网络带宽资源去尽量多的传递语音信息
。
从香农信息论的角度来讲，语音编码是一种信源编码，信源编码的目的是在编码端尽可能的压缩我们想要传递信息的数据量，去掉信息中的冗余，同时在解码端还能够无损
(
或接近无损
)
的恢复出来
。
[0004]相关技术中，在解码的过程中，为了保证音频解码的效率，音频解码的质量会大打折扣
。
专利技术

【技术保护点】

【技术特征摘要】
1.
一种音频解码方法，其特征在于，所述方法包括：对音频码流进行信号解码处理，得到所述音频码流对应的编码特征；其中，所述音频码流是对音频信号进行音频编码得到的；利用至少一个残差单元，对所述音频码流对应的编码特征进行残差处理，得到所述音频码流对应的音频特征；对所述音频码流对应的音频特征进行特征重建处理，得到所述音频码流对应的合成音频信号
。2.
根据权利要求1所述的方法，其特征在于，所述利用至少一个残差单元，对所述音频码流对应的编码特征进行残差处理，得到所述音频码流对应的音频特征，包括：对所述音频码流对应的编码特征进行特征解码处理，得到所述音频码流对应的残差特征；通过所述至少一个残差单元，对所述音频码流对应的残差特征进行特征残差处理，得到所述音频码流对应的音频特征
。3.
根据权利要求2所述的方法，其特征在于，当所述至少一个残差单元为多个级联的残差单元时，所述通过所述至少一个残差单元，对所述音频码流对应的残差特征进行特征残差处理，得到所述音频码流对应的音频特征，包括：通过所述多个级联的残差单元的第一个残差单元，对所述残差特征进行残差处理；将所述第一个残差单元输出的残差结果输出到后续级联的残差单元，通过后续级联的残差单元继续进行残差处理以及残差结果的输出；将所述最后一个残差单元输出的残差结果作为所述音频码流对应的音频特征
。4.
根据权利要求3所述的方法，其特征在于，所述通过所述多个级联的残差单元的第一个残差单元，对所述残差特征进行残差处理，包括：通过所述多个级联的残差单元的第一个残差单元执行以下处理：对所述残差特征进行卷积处理，得到所述第一个残差单元的卷积结果；将所述第一个残差单元的卷积结果与所述残差特征进行相加处理，得到所述第一个残差单元输出的残差结果；所述通过后续级联的残差单元继续进行残差处理以及残差结果的输出，包括：通过所述多个级联的残差单元的第
j
个残差单元执行以下处理：对第
j
‑1个残差单元输出的残差结果进行卷积处理，得到所述第
j
个残差单元的卷积结果；将所述
j
个残差单元的卷积结果与所述第
j
‑1个残差单元输出的残差结果进行相加处理，得到所述第
j
个残差单元输出的残差结果；将所述第
j
个残差单元输出的残差结果输出到第
j+1
个残差单元；其中，
j
为依次递增的正整数，1＜
j
＜
J
，
J
为所述残差单元的数量
。5.
根据权利要求4所述的方法，其特征在于，每个所述残差单元包括空洞卷积算子；所述对所述残差特征进行卷积处理，包括：
通过所述第一个残差单元包括的空洞卷积算子，对所述残差特征进行空洞卷积处理
。6.
根据权利要求5所述的方法，其特征在于，所述对所述残差特征进行空洞卷积处理，包括：对所述残差特征的输入通道进行分组处理，得到多个组别，其中，每个所述组别包括所述残差特征中的至少两个通道对应的第一元素；对每个所述组别内的第一元素进行空洞卷积处理
。7.
根据权利要求5所述的方法，其特征在于，每个所述残差单元还包括至少一个因果卷积算子；所述通过所述第一个残差单元包括的空洞卷积算子，对所述残差特征进行空洞卷积处理之后，所述方法还包括：通过所述第一个残差单元包括的至少一个因果卷积算子，对得到的空洞卷积结果进行因果卷积处理，将得到的因果卷积结果作为所述第一个残差单元的卷积结果
。8.
根据权利要求7所述的方法，其特征在于，所述对得到的空洞卷积结果进行因果卷积处理，包括：对所述空洞卷积结果的输入通道进行分组处理，得到多个组别，其中，每个所述组别包括所述空洞卷积结果中的至少两个通道对应的第二元素；对每个所述组别内的第二元素进行因果卷积处理
。9.
根据权利要求2‑8任一项所述的方法，其特征在于，用于音频解码的第一神经网络包括多个级联的解码块，每个所述解码块包括特征解码块以及至少一个残差单元；所述对所述音频码流对应的编码特征进行特征解码处理，得到所述音频码流对应的残差特征，包括：通过所述多个级联的解码块中的特征解码块，对所述音频码流对应的编码特征进行特征解码处理，得到所述音频码流对应的残差特征；所述对所述音频码流对应的残差特征进行特征残差处理，得到所述音频码流对应的音频特征，包括：通过所述多个级联的解码块中的至少一个残差单元，对所述音频码流对应的残差特征进行残差处理，得到所述音频码流对应的音频特征
。10.
根据权利要求9所述的方法，其特征在于，所述通过所述多个级...

【专利技术属性】
技术研发人员：肖玮，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人