音频处理方法和装置、存储介质和电子设备制造方法及图纸

技术编号:33716796 阅读:25 留言:0更新日期:2022-06-06 09:02
本说明书实施方式涉及音频处理技术领域,具体涉及一种音频处理方法和音频处理装置,以及计算机可读存储介质和电子设备,解决了采用固定数字增益模式来调节的音频音量不稳定,用户体验差的问题。该音频处理方法,通过对数字增益后的信号进行基音周期检测,若根据基音周期检测的检测数据确定数字增益后的信号中存在语音信号,调节数字增益处理的增益数值。由于基音周期检测的检测频次较高,可以缩短确定数字增益后的信号中的语音信号的存在情况的时间,以快速调节数字增益处理的增益数值,加快了数字增益处理的增益数值的调节频率,甚至可以实时地针对数字增益后的信号的大小调节增益数值,提高了进行数字增益处理后的数字增益后的信号的稳定性。益后的信号的稳定性。益后的信号的稳定性。

【技术实现步骤摘要】
音频处理方法和装置、存储介质和电子设备


[0001]本说明书实施方式涉及音频处理
,具体涉及一种音频处理方法和音频处理装置,以及计算机可读存储介质和电子设备。

技术介绍

[0002]音视频通信技术在社交、娱乐、办公和在线教育等场景中的应用越来越广泛。相应地,音视频通信设备的种类也是越来越多样(比如手机、平板和电脑等)。由于音视频通信设备的多样性、人声音量大小不一等因素,导致音视频通信设备采集的音频的音量大小不一。因此,需要对音视频通信设备采集的音频进行增益调节,从而使音频的音量大小统一。
[0003]然而,相关技术采用固定数字增益模式来调节的音频音量不稳定,用户体验差,因此,相关技术中的固定数字增益模式有待改善。

技术实现思路

[0004]有鉴于此,本说明书实施方式提供了一种音频处理方法和音频处理装置,以及计算机可读存储介质和电子设备,解决了采用固定数字增益模式来调节的音频音量不稳定,用户体验差的问题。
[0005]第一方面,本说明书实施方式提供的一种音频处理方法,包括:对数字增益后的信号进行基音周期检测,其中,数字增益后的信号是对待处理音频信号进行数字增益处理后得到的;若根据基音周期检测的检测数据确定数字增益后的信号中存在语音信号,调节数字增益处理的增益数值。
[0006]第二方面,本说明书实施方式提供了一种音频处理装置,包括:检测模块,配置为对数字增益后的信号进行基音周期检测,得到第一语音检测数据,其中,增益音频信号为经数字增益处理后得到的音频信号;调参模块,配置为若根据第一语音检测数据确定数字增益后的信号中存在语音信号,根据第一语音检测数据调节数字增益处理的增益数值。
[0007]第三方面,本说明书实施方式提供了一种计算机可读存储介质,存储介质存储有指令,当指令由电子设备的处理器执行时,使得电子设备能够执行上述第一方面提及的音频处理方法。
[0008]第四方面,本说明书实施方式提供了一种电子设备,电子设备包括:处理器;用于存储计算机可执行指令的存储器;处理器,用于执行计算机可执行指令,以实现上述第一方面提及的音频处理方法。
[0009]第五方面,本说明书实施方式提供了一种计算机程序产品,计算机程序产品中包括指令,指令被计算机设备的处理器执行时,使得计算机设备能够执行上述第一方面提及的音频处理方法。
[0010]本说明书实施方式提供的音频处理方法,通过对数字增益后的信号进行基音周期检测,若根据基音周期检测的检测数据确定数字增益后的信号中存在语音信号,调节数字增益处理的增益数值。由于基音周期检测的检测频次较高,从而可以缩短确定数字增益后
的信号中的语音信号的存在情况的时间,以快速调节数字增益处理的增益数值,加快了数字增益处理的增益数值的调节频率,甚至可以实时地针对数字增益后的信号的大小调节增益数值,提高了进行数字增益处理后的数字增益后的信号的稳定性,减少甚至避免了进行数字增益处理后的数字增益后的信号的音量忽大忽小的情况。
[0011]另外,由于基音周期检测的检测频次较高,能够加快调节数字增益处理的增益数值的频率,甚至可以实时地针对数字增益后的信号的大小调节增益数值,从而可以适用于不同类型的拾音设备。面对不同类型的拾音设备采集的音量大小不一的待处理音频信号,本说明书实施方式提供的音频处理方法能够快速的调节数字增益处理的增益数值,缓解了因拾音设备的多样性导致的音量差异,从而得到音量较统一的数字增益后的信号。
附图说明
[0012]图1a所示为本说明书一实施方式提供的音频处理方法的应用场景示意图。
[0013]图1b所示为本说明书另一实施方式提供的音频处理方法的应用场景示意图。
[0014]图1c所示为本说明书另一实施方式提供的音频处理方法的应用场景示意图。
[0015]图2所示为本说明书一实施方式提供的音频处理方法的流程示意图。
[0016]图3所示为本说明书一实施方式提供的音频处理方法的原理示意图。
[0017]图4所示为本说明书另一实施方式提供的音频处理方法的原理示意图。
[0018]图5所示为本说明书另一实施方式提供的音频处理方法的流程示意图。
[0019]图6所示为本说明书另一实施方式提供的音频处理方法的流程示意图。
[0020]图7所示为本说明书另一实施方式提供的音频处理方法的原理示意图。
[0021]图8所示为本说明书实施方式提供的音频处理装置的结构示意图。
[0022]图9所示为本说明书另一实施方式提供的音频处理装置的结构示意图。
[0023]图10所示为本说明书另一实施方式提供的音频处理装置的结构示意图。
[0024]图11所示为本说明书另一实施方式提供的音频处理装置的结构示意图。
[0025]图12所示为本说明书实施方式提供的电子设备的结构示意图。
具体实施方式
[0026]下面将结合本说明书实施方式中的附图,对本说明书实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅是本说明书实施方式一部分实施方式,而不是全部的实施方式。基于本说明书实施方式中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本说明书实施方式保护的范围。
[0027]下面结合图1a、图1b和图1c进行应用场景的举例说明。
[0028]图1a所示为本说明书实施方式提供的音频处理方法的应用场景示意图。如图1a所示,本实施方式提及的应用场景涉及音频发送端的客户端和音频接收端的客户端。具体地,音频发送端的客户端采集待处理音频信号(即执行步骤S110),并向音频接收端的客户端发送待处理音频信号(即执行步骤S120)。对应地,音频接收端的客户端对接收的待处理音频信号进行数字增益处理,进而对数字增益后的信号进行基音周期检测,若根据基音周期检测的检测数据确定数字增益后的信号中存在语音信号,调节数字增益处理的增益数值(即执行步骤S130),并播放调节后的音频信号(即执行步骤S140)。
[0029]在另外一些实施方式中,对待处理音频信号的增益调节过程(即步骤S130)亦可以在音频发送端的客户端执行。即,待处理音频信号经音频发送端的客户端处理后再发送给音频接收端的客户端。
[0030]更具体地,本实施方式提及的应用场景可以是语音通话场景,即,音频发送端的客户端和音频接收端的客户端分别是语音通话场景中的不同通话用户的客户端。更具体地,本实施方式提及的应用场景可以是视频会议场景,即,音频发送端的客户端和音频接收端的客户端分别是视频会议场景中的不同会议参与方的客户端。更具体地,本实施方式提及的应用场景可以是在线教育场景,即音频发送端的客户端和音频接收端的客户端分别是不同角色用户(比如教师和学生)的客户端。此外,可以理解,音频发送端亦可以成为音频接收端,音频接收端亦可以成为音频发送端,对此本实施方式不再赘述。
[0031]为了进一步明确音频接收端的客户端对待处理音频信号的增本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频处理方法,其特征在于,包括:对数字增益后的信号进行基音周期检测,其中,所述数字增益后的信号是对待处理音频信号进行数字增益处理后得到的;若根据所述基音周期检测的检测数据确定所述数字增益后的信号中存在语音信号,调节所述数字增益处理的增益数值。2.根据权利要求1所述的音频处理方法,其特征在于,所述若根据所述基音周期检测确定所述数字增益后的信号中存在语音信号,根据所述基音周期检测的检测结果调节所述数字增益处理的增益数值,包括:对所述数字增益后的信号进行基于神经网络的语音检测;若根据所述基音周期检测的检测数据和所述语音检测的检测数据确定所述数字增益后的信号中存在语音信号,调节所述数字增益处理的增益数值。3.根据权利要求2所述的音频处理方法,其特征在于,所述若根据所述基音周期检测的检测数据和所述语音检测的检测数据确定所述数字增益后的信号中存在语音信号,调节所述数字增益处理的增益数值,包括:根据所述语音检测的检测数据,确定所述数字增益后的信号中的语音帧的音量和所述数字增益后的信号中的嘈杂帧的音量;若根据所述基音周期检测的检测数据和所述语音检测的检测数据确定所述数字增益后的信号中存在语音信号,且所述数字增益后的信号中的语音帧的音量和所述数字增益后的信号中的嘈杂帧的音量的差值落入预设差值阈值范围,上调所述数字增益处理的增益数值。4.根据权利要求2所述的音频处理方法,其特征在于,在所述若根据所述基音周期检测的检测数据和所述语音检测的检测数据确定所述数字增益后的信号中存在语音信号,调节所述数字增益处理的增益数值之前,还包括:基于所述基音周期检测的检测数据,确定第一音频片段的第一语音帧占比信息,其中,所述第一音频片段包含累计时长为第一时长的语音帧;基于所述语音检测的检测数据,确定第二音频片段的第二语音帧占比信息,其中,所述第二音频片段的起始节点与所述第一音频片段的起始节点相同,且所述第二音频片段包含累计时长为第二时长的语音帧;基于所述第一语音帧占比信息和所述第二语音帧占比信息,确定所述数字增益后的信号中是否存在语音信号;其中,所述若根据所述基音周期检测的检测数据和所述语音检测的检测数据确定所述数字增益后的信号中存在语音信号,调节所述数字增益处理的增益数值,包括:若根据所述第一语音帧占比信息和所述第二语音帧占比信息确定所述数字增益后的信号中存在语音信号,调节所述数字增益处理的增益数值。5.根据权利要求4所述的音频处理方法,其特征在于,所述调节所述数字增益处理的增益数值,包括:确定所述第一音频片段包含的语音帧的音量和所述第二音频片段包含的语音帧的音量;基于所述第一音频片段包含的语音帧的音量和所述第二音频片段包含的语音帧的音
量,确定所述第一音频片段的估计音量;基于所述估计音量和预设目标音量,计算所述第一音频片段对应的最大增益数值;将所述数字增益处理的增益数值调节至所述第一音频片段对应的最大增益数值。6.根据权利要求5所述的音频处理方法,其特征在于,在所述将所述数字增益处理的增益数值调节至所...

【专利技术属性】
技术研发人员:方博伟
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1