麦克风音量控制方法、装置、设备及存储介质制造方法及图纸

技术编号:34086962 阅读:11 留言:0更新日期:2022-07-11 20:14
本申请实施例提供一种麦克风音量控制方法、装置、设备及存储介质。方法包括:对麦克风采集的语音信号进行语音检测,得到与语音信号对应的至少两种环境指标;采用与每一环境指标对应的语音信号处理方式,分别对语音信号进行语音信号预处理,对应得到至少两个语音信号流;对每一语音信号流进行参数特征提取,得到所述语音信号的至少两个参数状态流;根据所述至少两个参数状态流,分别确定所述麦克风的数字增益调整量和模拟增益调整量;并对应调整所述麦克风的数字增益和模拟增益。通过本申请,能够灵活的根据麦克风当前所处环境的环境指标,适应性的对麦克风进行灵活的数字增益和模型增益调整,使得麦克风音量更加平滑,提高用户体验。户体验。户体验。

【技术实现步骤摘要】
麦克风音量控制方法、装置、设备及存储介质


[0001]本申请实施例涉及终端
,涉及但不限于一种麦克风音量控制方法、装置、设备及存储介质。

技术介绍

[0002]在目前的麦克风增益的自动控制方法中,通常是基于预先设置的一固定自动增益控制算法,来调整麦克风的数字增益和模拟增益,以实现对麦克风的音量控制。相关技术中的方法,并没有考虑到对麦克风音量可能造成影响的多重指标,并不能灵活的根据麦克风当前所处环境来适应性的对麦克风进行灵活的数字增益和模型增益调整,因此,相关技术中的方法,在调整麦克风音量的时候,会表现出音量时大时小的问题,从而极大的降低了用户的使用体验。

技术实现思路

[0003]本申请实施例提供一种麦克风音量控制方法、装置、设备及存储介质,由于根据麦克风当前所处环境的环境指标,适应性的对麦克风进行灵活的数字增益和模型增益调整,因此,使得音量调整后的麦克风音量更加平滑,提高用户体验。
[0004]本申请实施例的技术方案是这样实现的:
[0005]本申请实施例提供一种麦克风音量控制方法,所述方法包括:
[0006]对所述麦克风采集的语音信号进行语音检测,得到与所述语音信号对应的至少两种环境指标;
[0007]采用与每一所述环境指标对应的语音信号处理方式,分别对所述语音信号进行语音信号预处理,对应得到至少两个语音信号流;
[0008]对每一语音信号流进行参数特征提取,得到所述语音信号的至少两个参数状态流;
[0009]根据所述至少两个参数状态流,分别确定所述麦克风的数字增益调整量和模拟增益调整量;
[0010]根据所述数字增益调整量和所述模拟增益调整量,对应调整所述麦克风的数字增益和模拟增益,以实现对所述麦克风的音量控制。
[0011]本申请实施例提供一种麦克风音量控制装置,所述装置包括:
[0012]语音检测模块,用于对所述麦克风采集的语音信号进行语音检测,得到与所述语音信号对应的至少两种环境指标;
[0013]预处理模块,用于与每一所述环境指标对应的语音信号处理方式,分别对所述语音信号进行语音信号预处理,对应得到至少两个语音信号流;
[0014]参数特征提取模块,用于对每一语音信号流进行参数特征提取,得到所述语音信号的至少两个参数状态流;
[0015]确定模块,用于根据所述至少两个参数状态流,分别确定所述麦克风的数字增益
调整量和模拟增益调整量;
[0016]调整模块,用于根据所述数字增益调整量和所述模拟增益调整量,对应调整所述麦克风的数字增益和模拟增益,以实现对所述麦克风的音量控制。
[0017]本申请实施例提供一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中;其中,计算机设备的处理器从所述计算机可读存储介质中读取所述计算机指令,所述处理器用于执行所述计算机指令,实现上述的麦克风音量控制方法。
[0018]本申请实施例提供一种麦克风音量控制设备,包括:存储器,用于存储可执行指令;处理器,用于执行所述存储器中存储的可执行指令时,实现上述的麦克风音量控制方法。
[0019]本申请实施例提供一种计算机可读存储介质,存储有可执行指令,用于引起处理器执行所述可执行指令时,实现上述的麦克风音量控制方法。
[0020]本申请实施例具有以下有益效果:对麦克风采集的语音信号进行语音检测,得到与语音信号对应的至少两种环境指标;采用与每一环境指标对应的语音信号处理方式,对语音信号分别进行不同类型的语音信号预处理,得到至少两个语音信号流,且每一类型的语音信号处理方式对应一种环境指标,然后基于所得到的至少两个语音信号流确定麦克风的数字增益调整量和模拟增益调整量,并根据数字增益调整量和模拟增益调整量实现对麦克风的音量控制,如此,能够灵活的根据麦克风当前所处环境的环境指标,适应性的对麦克风进行灵活的数字增益和模型增益调整,使得麦克风音量更加平滑,提高用户体验。
附图说明
[0021]图1是本申请实施例提供的麦克风音量控制系统的一个可选的架构示意图;
[0022]图2是本申请实施例提供的服务器的结构示意图;
[0023]图3是本申请实施例提供的麦克风音量控制方法的一个可选的流程示意图;
[0024]图4是本申请实施例提供的麦克风音量控制方法的一个可选的流程示意图;
[0025]图5是本申请实施例提供的麦克风音量控制方法的一个可选的流程示意图;
[0026]图6是本申请实施例提供的麦克风音量控制方法的一个可选的流程示意图;
[0027]图7是本申请实施例方法的应用场景图;
[0028]图8是本申请实施例提供的麦克风自动增益控制方法的架构图;
[0029]图9是本申请实施例提供的语音特征池架构图;
[0030]图10是本申请实施例提供的增益控制模块的架构图;
[0031]图11是本申请实施例提供的两级音量控制示意图;
[0032]图12是图11的两级音量控制抽象变换图。
具体实施方式
[0033]为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
[0034]在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可
以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。除非另有定义,本申请实施例所使用的所有的技术和科学术语与属于本申请实施例的
的技术人员通常理解的含义相同。本申请实施例所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
[0035]在目前的麦克风增益的自动控制方法中,一种实现方式是采用语音活动检测(VAD,Voice Activity Detection)技术,并采用预设的自动增益控制算法调整麦克风的数字增益和模拟增益,但是,并没有综合采用传统的VAD和基音等指标来控制增益计算。另一种实现方式是在通话过程中,根据任一调整的模拟自动增益控制(AGC,Automatic Gain Control)的增益值或数字AGC的增益值调整麦克风音量和麦克风加强,若模拟AGC的增益值或数字AGC的增益值为正,先判断只增加麦克风音量能否满足正增益要求,若满足则调整麦克风音量,若不满足则判断是否可以调整麦克风加强,若可以则同时调整麦克风音量和麦克风加强,若麦克风音量与麦克风加强已调至最大值则不进行调整;若模拟AGC的增益值或数字AGC的增益值为负,先判断只降低麦克风音量是否满足负增益要求,若满足,则调整麦克风音量,若不满足,则判断是否可以调整麦克风加强,若可以则同时调整麦克风音量与麦克风加强,若麦克风音量与麦克风加强都已调整至最小值则不进行调整,由此可见,该技术是一种麦本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种麦克风音量控制方法,其特征在于,所述方法包括:对所述麦克风采集的语音信号进行语音检测,得到与所述语音信号对应的至少两种环境指标;采用与每一所述环境指标对应的语音信号处理方式,分别对所述语音信号进行语音信号预处理,对应得到至少两个语音信号流;对每一语音信号流进行参数特征提取,得到所述语音信号的至少两个参数状态流;根据所述至少两个参数状态流,分别确定所述麦克风的数字增益调整量和模拟增益调整量;根据所述数字增益调整量和所述模拟增益调整量,对应调整所述麦克风的数字增益和模拟增益,以实现对所述麦克风的音量控制。2.根据权利要求1所述的方法,其特征在于,所述语音信号处理方式包括去直流滤波处理;所述语音信号流包括去直流滤波后的语音信号流;所述对每一语音信号流进行参数特征提取,得到所述语音信号的至少两个参数状态流,包括:对所述去直流滤波后的语音信号流进行截顶检测,得到所述语音信号流的截顶标志;对所述去直流滤波后的语音信号流进行时域能量包络计算,得到所述语音信号流的能量;对所述去直流滤波后的语音信号流进行麦克风录音的VAD检测,得到所述语音信号流的第一VAD值;将所述截顶标志、所述能量和所述第一VAD值中的至少一个,确定为所述参数状态流。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:根据所述第一VAD值,确定所述语音信号中的至少一个噪声段;对每一所述噪声段进行噪声能量估计,得到对应噪声段的噪声能量谱;从所述语音信号对应的语音信号谱中减去每一噪声段的所述噪声能量谱,得到去噪后的语音能量谱;对所述去噪后的语音能量谱进行时频变换处理,得到噪声抑制后的语音信号流;对应地,对所述噪声抑制后的语音信号流进行参数特征提取,得到所述语音信号的至少两个参数状态流。4.根据权利要求2所述的方法,其特征在于,所述语音信号处理方式还包括回声消除处理;所述语音信号流包括回声消除后的语音信号流;所述对每一语音信号流进行参数特征提取,得到所述语音信号的至少两个参数状态流,还包括:对所述回声消除后的语音信号流进行基音提取,得到所述语音信号流的基音频率;将所述基音频率,确定为所述参数状态流。5.根据权利要求4所述的方法,其特征在于,在对所述语音信号进行所述回声消除处理时,所述方法还包括:当检测到所述语音信号中具有第一类信号时,确定所述第一类信号的能量波动;根据所述能量波动,确定所述语音信号流的第二VAD值;当所述第一类信号在所述语音信号中形成回声信号时,根据所述回声信号确定所述语
音信号的回声状态标志;将所述第二VAD值和所述回声状态标志中的至少一个,确定为所述参数状态流。6.根据权利要求4所述的方法,其特征在于,所述语音信号处理方式还包括噪声抑制处理;所述语音信号流包括噪声抑制后的语音信号流;所述对每一语音信号流进行参数特征提取,得到所述语音信号的至少两个参数状态流,还包括:对所述噪声抑制后的语音信号流进行啸叫检测,得到所述语音信号流的啸叫标志;对所述噪声抑制后的语音信号流进行第二类信号的VAD检测,得到所述语音信号流的第三VAD值;将所述啸叫标志和所述第三VAD值中的至少一个,确定为所述参数状态流。7.根据权利要求6所述的方法,其特征在于,所述方法还包括...

【专利技术属性】
技术研发人员:高毅罗程李斌
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1