一种数字音频自动增益方法、系统、计算机存储介质技术方案

技术编号：39032839 阅读：33 留言：0更新日期：2023-10-10 11:46

本发明专利技术涉及音频处理技术领域中的一种数字音频自动增益方法、系统、计算机存储介质，包括以下步骤：将音频滤波数据分别进行一次数据分帧处理以及二次数据分帧处理，分别得到音频分帧数据一和音频分帧数据二；将音频分帧数据一进行静音检测，并基于静音检测结果，将音频分帧数据一内的每帧数据标记为静音检测标志或非静音检测标志；将静音检测标志和非静音检测标志映射到音频分帧数据二中，得到音频映射数据；基于静音检测标志和非静音检测标志，将音频映射数据中的每帧数据区分为静音段和非静音段；对静音段和非静音段分别进行增益处理，解决了现有音频增益处理时，原始音频数据特点无法保持的问题。特点无法保持的问题。特点无法保持的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种数字音频自动增益方法、系统、计算机存储介质

[0001]本专利技术涉及音频处理
，具体涉及一种数字音频自动增益方法、系统、计算机存储介质。

技术介绍

[0002]在音视频安防领域或语音通话过程中，往往会出现以下问题：由于音源与麦克风之间距离的忽远忽近或音源自身忽高忽低，导致麦克风采集到的音量忽大忽小，影响用户体验感。因此，需要对采集到的音频数据进行处理，而现有方案中，通常用峰值作为指标来实现音频的自动增益控制。
[0003]然而针对现有的音频自动增益控制存在以下几点缺陷：其一，现有方案下用实际设备抓取到的音频数据存在较大的背景噪声；其二，现有方案下环境噪声被放大到较高幅值；其三，现有方案的增益系数更新方案只是简单的将幅值限定在某一固定值上，一定程度上会影响原始音频数据的特点；其四，现有方案的增益系数更新的响应速度较慢，往往需要较长的时间才能得到满意的增益值。

技术实现思路

[0004]本专利技术针对现有技术中的缺点，提供了一种数字音频自动增益方法、系统、计算机存储介质，解决了现有音频增益处理时，原始音频数据特点无法保持的问题。
[0005]为了解决上述技术问题，本专利技术通过下述技术方案得以解决：
[0006]一种数字音频自动增益方法，包括以下步骤：
[0007]将音频滤波数据分别进行一次数据分帧处理以及二次数据分帧处理，分别得到音频分帧数据一和音频分帧数据二，其中，所述二次数据分帧处理的分帧帧长与一次数据分帧处理的分帧帧长成倍数关系，且所述二次数据分帧处理的...

【技术保护点】

【技术特征摘要】
1.一种数字音频自动增益方法，其特征在于，包括以下步骤：将音频滤波数据分别进行一次数据分帧处理以及二次数据分帧处理，分别得到音频分帧数据一和音频分帧数据二，其中，所述二次数据分帧处理的分帧帧长与一次数据分帧处理的分帧帧长成倍数关系，且所述二次数据分帧处理的分帧帧长为一次数据分帧处理的分帧帧长的倍数；将所述音频分帧数据一进行静音检测，并基于静音检测结果，将所述音频分帧数据一内的每帧数据标记为静音检测标志或非静音检测标志；将所述静音检测标志和非静音检测标志映射到所述音频分帧数据二中，得到音频映射数据；基于所述静音检测标志和非静音检测标志，将所述音频映射数据中的每帧数据区分为静音段和非静音段；对所述静音段和非静音段分别进行增益处理。2.根据权利要求1所述的一种数字音频自动增益方法，其特征在于，所述静音检测，包括以下步骤：获取所述音频分帧数据一的每帧数据的信号峰值，并基于每帧数据的信号峰值计算音频分帧数据一中各组相邻帧之间的峰值差值；设定差值阈值，判断各组相邻帧之间的所述峰值差值的绝对值是否大于差值阈值；若是，则判定相邻帧为非静音音频，反之，则判定相邻帧为静音音频。3.根据权利要求2所述的一种数字音频自动增益方法，其特征在于，将所述音频分帧数据一内的每帧数据标记为静音检测标志或非静音检测标志，包括以下步骤：基于各组相邻帧之间的峰值差值、静音检测结果，将各组相邻帧中的每帧数据标记为静音检测标志或非静音检测标志。4.根据权利要求1所述的一种数字音频自动增益方法，其特征在于，将所述音频映射数据中的每帧数据区分为静音段和非静音段，包括以下步骤：设定静音标志阈值和非静音标志阈值，并基于所述静音标志阈值和非静音标志阈值设定累计条件；获取所述音频映射数据中的每帧数据对应的静音检测标志数值和非静音检测标志数值；判断音频映射数据中的每帧数据的对应的静音检测标志数值和非静音检测标志数值是否均满足累计条件；若是，则将满足累计条件的帧数据划分为非静音段，若否，则将不满足累计条件的帧数据划分为静音段。5.根据权利要求1所述的一种数字音频自动增益方法，其特征在于，将所述静音段和非静音段分别进行增益处理，包括以下步骤：基于所述静音段和非静音段，更新音频映射数据中每帧数据的增益系数；获取所述音频映射数据中每帧数据的信号峰值；设定增益阈值，并基于音频映射数据中各帧数据的信号峰值以及对应的增益系数，计算所述音频映射数据中各帧数据的初步增益值；判断所述初...

【专利技术属性】
技术研发人员：李泽坤，何利蓉，肖文勇，
申请(专利权)人：杭州雄迈集成电路技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人