音频处理方法和装置、存储介质和电子设备制造方法及图纸

技术编号：33716796 阅读：33 留言：0更新日期：2022-06-06 09:02

本说明书实施方式涉及音频处理技术领域，具体涉及一种音频处理方法和音频处理装置，以及计算机可读存储介质和电子设备，解决了采用固定数字增益模式来调节的音频音量不稳定，用户体验差的问题。该音频处理方法，通过对数字增益后的信号进行基音周期检测，若根据基音周期检测的检测数据确定数字增益后的信号中存在语音信号，调节数字增益处理的增益数值。由于基音周期检测的检测频次较高，可以缩短确定数字增益后的信号中的语音信号的存在情况的时间，以快速调节数字增益处理的增益数值，加快了数字增益处理的增益数值的调节频率，甚至可以实时地针对数字增益后的信号的大小调节增益数值，提高了进行数字增益处理后的数字增益后的信号的稳定性。益后的信号的稳定性。益后的信号的稳定性。

全部详细技术资料下载

【技术实现步骤摘要】
音频处理方法和装置、存储介质和电子设备

[0001]本说明书实施方式涉及音频处理
，具体涉及一种音频处理方法和音频处理装置，以及计算机可读存储介质和电子设备。

技术介绍

[0002]音视频通信技术在社交、娱乐、办公和在线教育等场景中的应用越来越广泛。相应地，音视频通信设备的种类也是越来越多样（比如手机、平板和电脑等）。由于音视频通信设备的多样性、人声音量大小不一等因素，导致音视频通信设备采集的音频的音量大小不一。因此，需要对音视频通信设备采集的音频进行增益调节，从而使音频的音量大小统一。
[0003]然而，相关技术采用固定数字增益模式来调节的音频音量不稳定，用户体验差，因此，相关技术中的固定数字增益模式有待改善。

技术实现思路

[0004]有鉴于此，本说明书实施方式提供了一种音频处理方法和音频处理装置，以及计算机可读存储介质和电子设备，解决了采用固定数字增益模式来调节的音频音量不稳定，用户体验差的问题。
[0005]第一方面，本说明书实施方式提供的一种音频处理方法，包括：对数字增益后的信号进行基音周期检测，其中，数字增益后的信号是对待处理音频信号进行数字增益处理后得到的；若根据基音周期检测的检测数据确定数字增益后的信号中存在语音信号，调节数字增益处理的增益数值。
[0006]第二方面，本说明书实施方式提供了一种音频处理装置，包括：检测模块，配置为对数字增益后的信号进行基音周期检测，得到第一语音检测数据，其中，增益音频信号为经数字增益处理后得到的音频信号；调参模块，配置为若...

【技术保护点】

【技术特征摘要】
1.一种音频处理方法，其特征在于，包括：对数字增益后的信号进行基音周期检测，其中，所述数字增益后的信号是对待处理音频信号进行数字增益处理后得到的；若根据所述基音周期检测的检测数据确定所述数字增益后的信号中存在语音信号，调节所述数字增益处理的增益数值。2.根据权利要求1所述的音频处理方法，其特征在于，所述若根据所述基音周期检测确定所述数字增益后的信号中存在语音信号，根据所述基音周期检测的检测结果调节所述数字增益处理的增益数值，包括：对所述数字增益后的信号进行基于神经网络的语音检测；若根据所述基音周期检测的检测数据和所述语音检测的检测数据确定所述数字增益后的信号中存在语音信号，调节所述数字增益处理的增益数值。3.根据权利要求2所述的音频处理方法，其特征在于，所述若根据所述基音周期检测的检测数据和所述语音检测的检测数据确定所述数字增益后的信号中存在语音信号，调节所述数字增益处理的增益数值，包括：根据所述语音检测的检测数据，确定所述数字增益后的信号中的语音帧的音量和所述数字增益后的信号中的嘈杂帧的音量；若根据所述基音周期检测的检测数据和所述语音检测的检测数据确定所述数字增益后的信号中存在语音信号，且所述数字增益后的信号中的语音帧的音量和所述数字增益后的信号中的嘈杂帧的音量的差值落入预设差值阈值范围，上调所述数字增益处理的增益数值。4.根据权利要求2所述的音频处理方法，其特征在于，在所述若根据所述基音周期检测的检测数据和所述语音检测的检测数据确定所述数字增益后的信号中存在语音信号，调节所述数字增益处理的增益数值之前，还包括：基于所述基音周期检测的检测数据，确定第一音频片段的第一语音帧占比信息，其中，所述第一音频片段包含累计时长为第一时长的语音帧；基于所述语音检测的检测数据，确定第二音频片段的第二语音帧占比信息，其中，所述第二音频片段的起始节点与所述第一音频片段的起始节点相同，且所述第二音频片段包含累计时长为第二时长的语音帧；基于所述第一语音帧占比信息和所述第二语音帧占比信息，确定所述数字增益后的信号中是否存在语音信号；其中，所述若根据所述基音周期检测的检测数据和所述语音检测的检测数据确定所述数字增益后的信号中存在语音信号，调节所述数字增益处理的增益数值，包括：若根据所述第一语音帧占比信息和所述第二语音帧占比信息确定所述数字增益后的信号中存在语音信号，调节所述数字增益处理的增益数值。5.根据权利要求4所述的音频处理方法，其特征在于，所述调节所述数字增益处理的增益数值，包括：确定所述第一音频片段包含的语音帧的音量和所述第二音频片段包含的语音帧的音量；基于所述第一音频片段包含的语音帧的音量和所述第二音频片段包含的语音帧的音
量，确定所述第一音频片段的估计音量；基于所述估计音量和预设目标音量，计算所述第一音频片段对应的最大增益数值；将所述数字增益处理的增益数值调节至所述第一音频片段对应的最大增益数值。6.根据权利要求5所述的音频处理方法，其特征在于，在所述将所述数字增益处理的增益数值调节至所...

【专利技术属性】
技术研发人员：方博伟，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人