一种音频编解码的系统和方法技术方案

技术编号：37315857 阅读：16 留言：0更新日期：2023-04-21 22:57

本发明专利技术公开了一种音频编解码的系统，包括：编码模块、解码模块；所述编码模块，用于将音频进行编码，将编码后字符存储在隐藏空间，生成隐变量；将所述隐变量传输到所述解码模块；所述解码模块，用于接受所述编码模块传输的所述隐变量；将所述隐变量转化为实际语音输出。本发明专利技术还公开了一种音频编解码方法。解决了现有技术存在的需要传输的音频过大传输速度耗时长、解码得到的音频质量差的技术缺陷，进而达到可以实现编码速度快、时间损耗小、解码的还原度高、可以无损地将音频还原输出的技术效果。术效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种音频编解码的系统和方法

[0001]本专利技术涉及计算机
，尤其涉及一种音频编解码的系统和方法。

技术介绍

[0002]近年来，随着人工智能，数字人，元宇宙的发展，用户对于高清数字通讯的需求也越来越迫切，在2G、3G时代，电话机器人多采用将音频按照8k采样率进行压缩以实现语音传输，但是随着用户对高清语音的追求，基于8k采样率的语音传输方案已经不能满足人们通话需求，其会损失音频质量，令用户无法体验高清语音方案，或在体验过程中的用户体验不佳。
[0003]相关技术中，实现语音传输的音频编解码系统通常包括以下几种方式：基于信号过程利用opus等系统，虽然该系统支持16k采样率的语音传输方案，但在实际运用过程中仍会有损音质；或者，基于自回归网络的wavernn编码系统，虽然该系统效果相较于纯数字信号过程有所提升，但其最高也仅支持16k采样率的语音传输。
[0004]在实现本专利技术过程中，专利技术人发现现有技术中至少存在如下问题：由于高清音频容量比较大，传输起来对带宽和流量消耗都是非常大的；上述相关技术中的方式均无法满足高清音频的传输，无论在传输效率还是传输质量上均不理想。

技术实现思路

[0005]有鉴于此，本专利技术实施例提供一种音频编解码的系统和方法，能够达到可以实现编码速度快、时间损耗小、解码的还原度高、可以无损地将音频还原输出的技术效果。
[0006]为实现上述目的，根据本专利技术实施例的一个方面，提供了一种音频编解码的系统，包括：编码模块、解码模块；
[0...

【技术保护点】

【技术特征摘要】
1.一种音频编解码的系统，其特征在于，包括：编码模块、解码模块；所述编码模块，用于将音频进行编码，将编码后字符存储在隐藏空间，生成隐变量；将所述隐变量传输到所述解码模块；所述解码模块，用于接受所述编码模块传输的所述隐变量；将所述隐变量转化为实际语音输出。2.根据权利要求1所述的系统，其特征在于，所述编码模块至少包括一个下采样模块；所述解码模块至少包括一个上采样模块。3.根据权利要求2所述的系统，其特征在于，所述下采样模块包括：卷积块；所述卷积块，根据预设子频带数对所述音频进行降维。4.根据权利要求3所述的系统，其特征在于，所述卷积块，还用于根据预设采样率，确定所述音频对应的采样音频；根据所述采样音频对所述存储空间进行压缩，生成压缩音频。5.根据权利要求3所述的系统，其特征在于，所述下采样模块还包括：第一残差块；所述第一残差块用于防止梯度消失，保留音频对应的信息。6.根据权利要求2所述的系统，其特征在于，所述上采样模块包括：反卷积块；所述反卷积块，根据预设子频带数对所述隐变量进行还原。7.根据权利要求6所述的系统，其特征在于，所述上采样模块还包括：第二残差块；所...

【专利技术属性】
技术研发人员：司马华鹏，毛志强，
申请(专利权)人：南京硅基智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人