System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 音频解码、编码方法、装置、电子设备及存储介质制造方法及图纸_技高网

音频解码、编码方法、装置、电子设备及存储介质制造方法及图纸

技术编号:43964510 阅读:6 留言:0更新日期:2025-01-07 21:50
本申请提供了一种音频解码、编码方法、装置、电子设备及存储介质,可以应用于车载场景;音频解码方法包括:获取码流,其中,所述码流是对音频信号进行编码得到的;对所述码流进行解码处理,得到所述音频信号的特征向量的预测值;对所述特征向量的预测值进行标签提取处理,得到用于信号增强的标签信息向量,其中,所述标签信息向量的维度与所述特征向量的预测值的维度相同;基于所述特征向量的预测值和所述标签信息向量进行信号重建;将通过所述信号重建得到的所述音频信号的预测值,作为所述码流的解码结果。通过本申请,能够有效抑制音频信号中的声学干扰,进而提高重建得到的音频信号的质量。

【技术实现步骤摘要】

本申请涉及通信,尤其涉及一种音频解码、编码方法、装置、电子设备及存储介质


技术介绍

1、由于语音通信的便利性和及时性,语音通话的应用越来越广泛,例如在网络会议的会议参与方之间传输音频信号(例如语音信号)。而在语音通话中,语音信号可能会被混有噪声等声学干扰,语音信号中所混有的噪声会导致通话质量变差,从而极大地影响了用户的听觉体验。

2、然而,对于如何对语音信号进行增强处理以抑制噪声部分,相关技术尚无有效的解决方案。


技术实现思路

1、本申请实施例提供一种音频解码、编码方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够有效抑制音频信号中的声学干扰,进而提高重建得到的音频信号的质量。

2、本申请实施例的技术方案是这样实现的:

3、本申请实施例提供一种音频解码方法,包括:

4、获取码流,其中,所述码流是对音频信号进行编码得到的;

5、对所述码流进行解码处理,得到所述音频信号的特征向量的预测值;

6、对所述特征向量的预测值进行标签提取处理,得到用于信号增强的标签信息向量,其中,所述标签信息向量的维度与所述特征向量的预测值的维度相同;

7、基于所述特征向量的预测值和所述标签信息向量进行信号重建;

8、将通过所述信号重建得到的所述音频信号的预测值,作为所述码流的解码结果。

9、本申请实施例提供一种音频解码装置,包括:

10、获取模块,用于获取码流,其中,所述码流是对音频信号进行编码得到的;

11、解码模块,用于对所述码流进行解码处理,得到所述音频信号的特征向量的预测值;

12、标签提取模块,用于对所述特征向量的预测值进行标签提取处理,得到用于信号增强的标签信息向量,其中,所述标签信息向量的维度与所述特征向量的预测值的维度相同;

13、重建模块,用于基于所述特征向量的预测值和所述标签信息向量进行信号重建;

14、确定模块,用于将通过所述信号重建得到的所述音频信号的预测值,作为所述码流的解码结果。

15、本申请实施例提供一种音频编码方法,包括:

16、获取音频信号;

17、对所述音频信号进行编码处理,得到码流,其中,所述码流用于供电子设备执行本申请实施例提供的音频解码方法。

18、本申请实施例提供一种音频编码装置,包括:

19、获取模块,用于获取音频信号;

20、编码模块,用于对所述音频信号进行编码处理,得到码流,其中,所述码流用于供电子设备执行本申请实施例提供的音频解码方法。

21、本申请实施例提供一种电子设备,包括:

22、存储器,用于存储可执行指令;

23、处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的音频编解码方法。

24、本申请实施例提供一种计算机可读存储介质,存储有可执行指令,用于被处理器执行时,实现本申请实施例提供的音频编解码方法。

25、本申请实施例提供一种计算机程序产品,包括计算机程序或指令,用于被处理器执行时,实现本申请实施例提供的音频编解码方法。

26、本申请实施例具有以下有益效果:

27、通过对解码得到的特征向量的预测值进行标签提取处理,得到用于信号增强的标签信息向量,并结合特征向量的预测值和标签信息向量进行信号重建,如此,相较于仅仅基于特征向量的预测值进行信号重建,结合特征向量的预测值和标签信息向量进行信号重建,相当于增加了音频信号中核心成分所占的比例,减小了噪声等声学干扰所占的比例,从而可以有效抑制编码端采集的音频信号中包括的噪声成分,进而提高了重建得到的音频信号的质量。

本文档来自技高网...

【技术保护点】

1.一种音频解码方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求1所述的方法,其特征在于,所述基于所述特征向量的预测值和所述标签信息向量进行信号重建,包括:

4.根据权利要求3所述的方法,其特征在于,所述对所述特征向量的预测值和所述标签信息向量进行融合处理,得到融合向量,包括:

5.根据权利要求3所述的方法,其特征在于,

6.根据权利要求1所述的方法,其特征在于,所述对所述码流进行解码处理,得到所述音频信号的特征向量的预测值,包括:

7.根据权利要求1所述的方法,其特征在于,

8.根据权利要求7所述的方法,其特征在于,

9.根据权利要求8所述的方法,其特征在于,

10.根据权利要求7至10任一项所述的方法,其特征在于,所述基于所述特征向量的预测值和所述标签信息向量进行信号重建,包括:

11.根据权利要求10所述的方法,其特征在于,所述对所述N个子带信号分别对应的特征向量的预测值、以及所述N个标签信息向量进行一一对应的融合处理,得到N个融合向量,包括:

12.根据权利要求10所述的方法,其特征在于,所述基于第j融合向量调用第j合成网络进行信号重建,得到第j子带信号的预测值,包括:

13.根据权利要求12所述的方法,其特征在于,

14.一种音频编码方法,其特征在于,所述方法包括:

15.一种处理码流的方法,其特征在于,所述码流基于权利要求1至13任一项所述的音频解码方法进行解码,或者根据权利要求14所述的音频编码方法产生。

16.一种处理码流的方法,其特征在于,在计算机可读存储介质上存储所述码流,所述码流基于权利要求1至13任一项所述的音频解码方法进行解码,或者根据权利要求14所述的音频编码方法产生。

17.一种音频解码装置,其特征在于,所述装置包括:

18.一种音频编码装置,其特征在于,所述装置包括:

19.一种计算机可读存储介质,存储有可执行指令,其特征在于,所述可执行指令被处理器执行时实现权利要求1至13任一项所述的音频解码方法或权利要求14所述的音频编码方法。

20.一种计算机程序产品,包括计算机程序或指令,其特征在于,所述计算机程序或指令被处理器执行时实现权利要求1至13任一项所述的音频解码方法或权利要求14所述的音频编码方法。

...

【技术特征摘要】

1.一种音频解码方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求1所述的方法,其特征在于,所述基于所述特征向量的预测值和所述标签信息向量进行信号重建,包括:

4.根据权利要求3所述的方法,其特征在于,所述对所述特征向量的预测值和所述标签信息向量进行融合处理,得到融合向量,包括:

5.根据权利要求3所述的方法,其特征在于,

6.根据权利要求1所述的方法,其特征在于,所述对所述码流进行解码处理,得到所述音频信号的特征向量的预测值,包括:

7.根据权利要求1所述的方法,其特征在于,

8.根据权利要求7所述的方法,其特征在于,

9.根据权利要求8所述的方法,其特征在于,

10.根据权利要求7至10任一项所述的方法,其特征在于,所述基于所述特征向量的预测值和所述标签信息向量进行信号重建,包括:

11.根据权利要求10所述的方法,其特征在于,所述对所述n个子带信号分别对应的特征向量的预测值、以及所述n个标签信息向量进行一一对应的融合处理,得到n个融合向量,包括:

12.根据权利要求10所述的...

【专利技术属性】
技术研发人员:史裕鹏肖玮王蒙康迂勇黄庆博
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1