本发明专利技术涉及音频处理技术领域中的一种数字音频自动增益方法、系统、计算机存储介质,包括以下步骤:将音频滤波数据分别进行一次数据分帧处理以及二次数据分帧处理,分别得到音频分帧数据一和音频分帧数据二;将音频分帧数据一进行静音检测,并基于静音检测结果,将音频分帧数据一内的每帧数据标记为静音检测标志或非静音检测标志;将静音检测标志和非静音检测标志映射到音频分帧数据二中,得到音频映射数据;基于静音检测标志和非静音检测标志,将音频映射数据中的每帧数据区分为静音段和非静音段;对静音段和非静音段分别进行增益处理,解决了现有音频增益处理时,原始音频数据特点无法保持的问题。特点无法保持的问题。特点无法保持的问题。
【技术实现步骤摘要】
一种数字音频自动增益方法、系统、计算机存储介质
[0001]本专利技术涉及音频处理
,具体涉及一种数字音频自动增益方法、系统、计算机存储介质。
技术介绍
[0002]在音视频安防领域或语音通话过程中,往往会出现以下问题:由于音源与麦克风之间距离的忽远忽近或音源自身忽高忽低,导致麦克风采集到的音量忽大忽小,影响用户体验感。因此,需要对采集到的音频数据进行处理,而现有方案中,通常用峰值作为指标来实现音频的自动增益控制。
[0003]然而针对现有的音频自动增益控制存在以下几点缺陷:其一,现有方案下用实际设备抓取到的音频数据存在较大的背景噪声;其二,现有方案下环境噪声被放大到较高幅值;其三,现有方案的增益系数更新方案只是简单的将幅值限定在某一固定值上,一定程度上会影响原始音频数据的特点;其四,现有方案的增益系数更新的响应速度较慢,往往需要较长的时间才能得到满意的增益值。
技术实现思路
[0004]本专利技术针对现有技术中的缺点,提供了一种数字音频自动增益方法、系统、计算机存储介质,解决了现有音频增益处理时,原始音频数据特点无法保持的问题。
[0005]为了解决上述技术问题,本专利技术通过下述技术方案得以解决:
[0006]一种数字音频自动增益方法,包括以下步骤:
[0007]将音频滤波数据分别进行一次数据分帧处理以及二次数据分帧处理,分别得到音频分帧数据一和音频分帧数据二,其中,所述二次数据分帧处理的分帧帧长与一次数据分帧处理的分帧帧长成倍数关系,且所述二次数据分帧处理的分帧帧长为一次数据分帧处理的分帧帧长的倍数;
[0008]将所述音频分帧数据一进行静音检测,并基于静音检测结果,将所述音频分帧数据一内的每帧数据标记为静音检测标志或非静音检测标志;
[0009]将所述静音检测标志和非静音检测标志映射到所述音频分帧数据二中,得到音频映射数据;
[0010]基于所述静音检测标志和非静音检测标志,将所述音频映射数据中的每帧数据区分为静音段和非静音段;
[0011]对所述静音段和非静音段分别进行增益处理。
[0012]可选的,所述静音检测,包括以下步骤:
[0013]获取所述音频分帧数据一的每帧数据的信号峰值,并基于每帧数据的信号峰值计算音频分帧数据一中各组相邻帧之间的峰值差值;
[0014]设定差值阈值,判断各组相邻帧之间的所述峰值差值的绝对值是否大于差值阈值;
[0015]若是,则判定相邻帧为非静音音频,反之,则判定相邻帧为静音音频。
[0016]可选的,将所述音频分帧数据一内的每帧数据标记为静音检测标志或非静音检测标志,包括以下步骤:
[0017]基于各组相邻帧之间的峰值差值、静音检测结果,将各组相邻帧中的每帧数据标记为静音检测标志或非静音检测标志。
[0018]可选的,将所述音频映射数据中的每帧数据区分为静音段和非静音段,包括以下步骤:
[0019]设定静音标志阈值和非静音标志阈值,并基于所述静音标志阈值和非静音标志阈值设定累计条件;
[0020]获取所述音频映射数据中的每帧数据对应的静音检测标志数值和非静音检测标志数值;
[0021]判断音频映射数据中的每帧数据的对应的静音检测标志数值和非静音检测标志数值是否均满足累计条件;
[0022]若是,则将满足累计条件的帧数据划分为非静音段,若否,则将不满足累计条件的帧数据划分为静音段。
[0023]可选的,将所述静音段和非静音段分别进行增益处理,包括以下步骤:
[0024]基于所述静音段和非静音段,更新音频映射数据中每帧数据的增益系数;
[0025]获取所述音频映射数据中每帧数据的信号峰值;
[0026]设定增益阈值,并基于音频映射数据中各帧数据的信号峰值以及对应的增益系数,计算所述音频映射数据中各帧数据的初步增益值;
[0027]判断所述初步增益值是否大于增益阈值,若是,则重新计算增益系数,若否,则基于更新的增益系数,计算音频分帧数据二中每帧数据增益后的输出数据。
[0028]可选的,更新音频映射数据中每帧数据的增益系数,包括以下步骤:
[0029]当音频映射数据中的帧数据为静音段时,根据更新公式一更新增益系数;
[0030]当音频映射数据中的帧数据为非静音段时,根据更新公式二更新增益系数。
[0031]可选的,所述更新公式一为:
[0032]G(n)=k*G(n
‑
1),其中,G(n)为当前帧数据的增益系数;k为参数值;G(n
‑
1)为前一帧数据的增益系数。
[0033]可选的,所述更新公式二为:
[0034]其中,G(n)为当前帧数据的增益系数;MAX
‑
X(n
‑
1)为上一帧数据的信号峰值;G(n
‑
1)为前一帧数据的增益系数;pre
‑
control为音频分帧数据二增益控制的目标值;a为控制增益系数更新速度的参数。
[0035]一种数字音频自动增益系统,包括音频分帧单元、静音检测单元、标志映射单元、静音区分单元和增益处理单元;
[0036]所述音频分帧单元用于,将音频滤波数据分别进行一次数据分帧处理以及二次数据分帧处理,分别得到音频分帧数据一和音频分帧数据二,其中,所述二次数据分帧处理的分帧帧长与一次数据分帧处理的分帧帧长成倍数关系,且所述二次数据分帧处理的分帧帧长为一次数据分帧处理的分帧帧长的倍数;
[0037]所述静音检测单元用于,将所述音频分帧数据一进行静音检测,并基于静音检测结果,将所述音频分帧数据一内的每帧数据标记为静音检测标志或非静音检测标志;
[0038]所述标志映射单元用于,将所述静音检测标志和非静音检测标志映射到所述音频分帧数据二中,得到音频映射数据;
[0039]所述静音区分单元用于,基于所述静音检测标志和非静音检测标志,将所述音频映射数据中的每帧数据区分为静音段和非静音段;
[0040]所述增益处理单元用于,对所述静音段和非静音段分别进行增益处理。
[0041]一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,执行上述任意一项所述的数字音频自动增益方法。
[0042]采用本专利技术提供的技术方案,与现有技术相比,具有如下有益效果:
[0043]通过设置两次数据分帧处理,并将二次数据分帧处理的分帧帧长设置为一次数据分帧处理的分帧帧长的倍数,其中一次分帧处理用于执行静音检测,即一次数据分帧处理,另一次用于实现自动增益处理,即二次数据分帧处理,实现提高静音检测的准确度,确保一些非静音段不会被识别为静音段;同时在增益控制阶段,保证增益后的音频分帧数据即使在小范围的一帧内不会保持较高的幅值,保证原始音频小范围内高低起伏的特性。
附图说明
[0044]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种数字音频自动增益方法,其特征在于,包括以下步骤:将音频滤波数据分别进行一次数据分帧处理以及二次数据分帧处理,分别得到音频分帧数据一和音频分帧数据二,其中,所述二次数据分帧处理的分帧帧长与一次数据分帧处理的分帧帧长成倍数关系,且所述二次数据分帧处理的分帧帧长为一次数据分帧处理的分帧帧长的倍数;将所述音频分帧数据一进行静音检测,并基于静音检测结果,将所述音频分帧数据一内的每帧数据标记为静音检测标志或非静音检测标志;将所述静音检测标志和非静音检测标志映射到所述音频分帧数据二中,得到音频映射数据;基于所述静音检测标志和非静音检测标志,将所述音频映射数据中的每帧数据区分为静音段和非静音段;对所述静音段和非静音段分别进行增益处理。2.根据权利要求1所述的一种数字音频自动增益方法,其特征在于,所述静音检测,包括以下步骤:获取所述音频分帧数据一的每帧数据的信号峰值,并基于每帧数据的信号峰值计算音频分帧数据一中各组相邻帧之间的峰值差值;设定差值阈值,判断各组相邻帧之间的所述峰值差值的绝对值是否大于差值阈值;若是,则判定相邻帧为非静音音频,反之,则判定相邻帧为静音音频。3.根据权利要求2所述的一种数字音频自动增益方法,其特征在于,将所述音频分帧数据一内的每帧数据标记为静音检测标志或非静音检测标志,包括以下步骤:基于各组相邻帧之间的峰值差值、静音检测结果,将各组相邻帧中的每帧数据标记为静音检测标志或非静音检测标志。4.根据权利要求1所述的一种数字音频自动增益方法,其特征在于,将所述音频映射数据中的每帧数据区分为静音段和非静音段,包括以下步骤:设定静音标志阈值和非静音标志阈值,并基于所述静音标志阈值和非静音标志阈值设定累计条件;获取所述音频映射数据中的每帧数据对应的静音检测标志数值和非静音检测标志数值;判断音频映射数据中的每帧数据的对应的静音检测标志数值和非静音检测标志数值是否均满足累计条件;若是,则将满足累计条件的帧数据划分为非静音段,若否,则将不满足累计条件的帧数据划分为静音段。5.根据权利要求1所述的一种数字音频自动增益方法,其特征在于,将所述静音段和非静音段分别进行增益处理,包括以下步骤:基于所述静音段和非静音段,更新音频映射数据中每帧数据的增益系数;获取所述音频映射数据中每帧数据的信号峰值;设定增益阈值,并基于音频映射数据中各帧数据的信号峰值以及对应的增益系数,计算所述音频映射数据中各帧数据的初步增益值;判断所述初...
【专利技术属性】
技术研发人员:李泽坤,何利蓉,肖文勇,
申请(专利权)人:杭州雄迈集成电路技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。