System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 音频编码和解码方法、装置及电子设备制造方法及图纸_技高网

音频编码和解码方法、装置及电子设备制造方法及图纸

技术编号:42411931 阅读:5 留言:0更新日期:2024-08-16 16:29
本公开提供一种音频编码和解码方法、装置及电子设备,所述方法的一具体实施方式包括:获取待处理的一帧音频数据;基于多个编码块,对所述音频数据进行编码处理;每个所述编码块包括第一卷积神经网络和循环神经网络;对经过所述编码处理之后的结果进行特征量化处理,得到所述音频数据的目标编码数据。该实施方式对该音频特征进行编码处理得到的全局特征能够充分体现一帧音频数据的时序信息,从而提高了音频编码的效果。

【技术实现步骤摘要】

本公开涉及通信领域,特别涉及一种音频编码和解码方法、装置及电子设备


技术介绍

1、音频数据在被传输或存储的过程中,需要先对其进行编码,经传输或存储后,在音频数据重建时,再进行解码。传统的音频编解码技术中,通常采用预设算法对音频信号进行编码处理,得到编码数据。由于编码数据的数据量大,不利于传输和存储,因此,还需要对编码数据进行压缩处理,经传输或存储后,再对压缩后的数据进行解码还原。因此,被重建的音频数据会丢失很多原音频数据中的信息。目前需要一种对音频数据进行编解码的改进方法。


技术实现思路

1、本公开提供一种音频编码和解码方法、装置及电子设备。

2、根据第一方面,提供一种音频编码方法,所述方法包括:

3、获取待处理的一帧音频数据;

4、基于多个编码块,对所述音频数据进行编码处理;每个所述编码块包括第一卷积神经网络和循环神经网络;

5、对经过所述编码处理之后的结果进行特征量化处理,得到所述音频数据的目标编码数据。

6、根据第二方面,提供一种音频解码方法,所述方法包括:

7、获取目标编码数据;所述目标编码数据为针对一帧音频数据进行编码处理之后,再经过量化处理而得到的;

8、基于多个解码块,对所述目标编码数据进行解码处理,每个所述解码块包括第一卷积神经网络和循环神经网络;

9、将经过所述解码处理之后的结果转换成目标音频数据。

10、根据第三方面,提供一种音频编码装置,所述装置包括:

11、获取模块,用于获取待处理的一帧音频数据;

12、处理模块,用于基于多个编码块,对所述音频数据进行编码处理;每个所述编码块包括第一卷积神经网络和循环神经网络;

13、量化模块,用于对经过所述编码处理之后的结果进行特征量化处理,得到所述音频数据的目标编码数据。

14、根据第四方面,提供一种训练目标模型的装置,所述装置包括:

15、获取模块,用于获取目标编码数据;所述目标编码数据为针对一帧音频数据进行编码处理之后,再经过量化处理而得到的;

16、处理模块,用于基于多个解码块,对所述目标编码数据进行解码处理每个所述解码块包括第一卷积神经网络和循环神经网络;

17、转换模块,用于将经过所述解码处理之后的结果转换成目标音频数据。

18、根据第五方面,提供一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面或第二方面中任一项所述的方法。

19、根据第六方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面或第二方面中任一项所述的方法。

20、本公开的实施例提供的技术方案可以包括以下有益效果:

21、本公开的实施例提供的一种音频编码方法及装置,通过基于卷积神经网络和循环神经网络,对该待处理的每一帧音频数据进行编码处理,并对经过编码处理之后的结果进行特征量化处理,得到编码后的目标编码数据。由于卷积神经网络能够更好的提取音频信号的细节特征,而循环神经网络能够充分提取音频信号的时序信息,因此,使得对音频数据进行编码得到的目标编码数据能够充分体现一帧音频数据的时序信息,从而提高了音频编码的效果。

22、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

本文档来自技高网...

【技术保护点】

1.一种音频编码方法,所述方法包括:

2.根据权利要求1所述的方法,其中,所述循环神经网络包括双向循环神经网络。

3.根据权利要求1所述的方法,其中,所述多个编码块串联连接;其中,每个所述编码块包括多个残差单元,每个所述残差单元包括所述第一卷积神经网络、所述循环神经网络、全连接层和批归一化层,其中,在所述残差单元中,所述第一卷积神经网络、所述循环神经网络、所述全连接层和所述批归一化层依次串联连接。

4.根据权利要求3所述的方法,其中,所述多个残差单元的任一个残差单元通过如下方式进行编码处理:

5.根据权利要求4所述的方法,其中,每个所述残差单元还包括第二卷积神经网络;所述第二卷积神经网络串联连接在所述残差单元中的所述批归一化层之后;

6.根据权利要求3所述的方法,其中,所述多个残差单元中的任一个残差单元通过如下方式进行编码处理:

7.根据权利要求6所述的方法,其中,基于所述第六特征、所述待处理的数据以及所述第三特征,得到目标特征,包括:

8.根据权利要求6所述的方法,其中,每个所述残差单元还包括第二卷积神经网络;所述第二卷积神经网络串联连接在所述残差单元中的所述批归一化层之后;

9.根据权利要求1所述的方法,其中,所述多个编码块串联连接;其中,每个所述编码块包括多个残差单元,每个所述残差单元包括所述第一卷积神经网络;每个所述编码块还包括双向循环单元,所述双向循环单元包括所述循环神经网络、全连接层和批归一化层,其中,所述循环神经网络、所述全连接层和所述批归一化层依次串联连接。

10.根据权利要求9所述的方法,其中,所述多个编码块中的任一个编码块通过如下方式进行编码处理:

11.一种音频解码方法,所述方法包括:

12.根据权利要求11所述的方法,其中,所述循环神经网络包括双向循环神经网络。

13.根据权利要求11所述的方法,其中,所述多个解码块串联连接;其中,每个所述解码块包括多个残差单元,每个所述残差单元包括所述第一卷积神经网络、所述循环神经网络、全连接层和批归一化层,其中,在所述残差单元中,所述第一卷积神经网络、所述循环神经网络、所述全连接层和所述批归一化层依次串联连接。

14.根据权利要求13所述的方法,其中,所述多个残差单元中的任一个残差单元通过如下方式进行解码处理:

15.根据权利要求11所述的方法,其中,所述多个解码块串联连接;其中,每个所述解码块包括多个残差单元,每个所述残差单元包括所述第一卷积神经网络;每个所述解码块还包括双向循环单元,所述双向循环单元包括所述循环神经网络、全连接层和批归一化层,其中,所述循环神经网络、所述全连接层和所述批归一化层依次串联连接。

16.根据权利要求15所述的方法,其中,所述多个解码块中的任一个解码块通过如下方式进行解码处理:

17.一种音频编码装置,所述装置部署于编码器,所述装置包括:

18.一种音频解码装置,所述装置部署于解码器,所述装置包括:

19.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令所述计算机执行权利要求1-16中任一项所述的方法。

20.一种电子设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-16中任一项所述的方法。

...

【技术特征摘要】

1.一种音频编码方法,所述方法包括:

2.根据权利要求1所述的方法,其中,所述循环神经网络包括双向循环神经网络。

3.根据权利要求1所述的方法,其中,所述多个编码块串联连接;其中,每个所述编码块包括多个残差单元,每个所述残差单元包括所述第一卷积神经网络、所述循环神经网络、全连接层和批归一化层,其中,在所述残差单元中,所述第一卷积神经网络、所述循环神经网络、所述全连接层和所述批归一化层依次串联连接。

4.根据权利要求3所述的方法,其中,所述多个残差单元的任一个残差单元通过如下方式进行编码处理:

5.根据权利要求4所述的方法,其中,每个所述残差单元还包括第二卷积神经网络;所述第二卷积神经网络串联连接在所述残差单元中的所述批归一化层之后;

6.根据权利要求3所述的方法,其中,所述多个残差单元中的任一个残差单元通过如下方式进行编码处理:

7.根据权利要求6所述的方法,其中,基于所述第六特征、所述待处理的数据以及所述第三特征,得到目标特征,包括:

8.根据权利要求6所述的方法,其中,每个所述残差单元还包括第二卷积神经网络;所述第二卷积神经网络串联连接在所述残差单元中的所述批归一化层之后;

9.根据权利要求1所述的方法,其中,所述多个编码块串联连接;其中,每个所述编码块包括多个残差单元,每个所述残差单元包括所述第一卷积神经网络;每个所述编码块还包括双向循环单元,所述双向循环单元包括所述循环神经网络、全连接层和批归一化层,其中,所述循环神经网络、所述全连接层和所述批归一化层依次串联连接。

10.根据权利要求9所述的方法,其中,所述多个编码块中的任一个编码块...

【专利技术属性】
技术研发人员:蒋佳为徐林平张德军陈力肖益剑丁飘宋慎义
申请(专利权)人:抖音视界有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1