音频处理方法、装置、设备及存储介质制造方法及图纸

技术编号：29050871 阅读：12 留言：0更新日期：2021-06-26 06:14

本公开实施例提供一种音频处理方法、装置、设备及存储介质，该方法包括：对音频数据进行时域分析处理，确定所述音频数据中的爆破音候选点；对所述爆破音候选点所在的音频帧进行频域分析处理，确定所述爆破音候选点是否存在爆破音；若存在爆破音，则对所述爆破音候选点进行平滑处理，得到处理后的音频数据。本公开实施例提供的音频处理方法、装置、设备及存储介质，结合时域和频域的分析处理对爆破音进行层进高效检测，有效节约了计算量，提高了音频处理效率，能够快速、准确地检测出爆破音并进行平滑处理，有效提升用户的听感。有效提升用户的听感。有效提升用户的听感。

全部详细技术资料下载

【技术实现步骤摘要】
音频处理方法、装置、设备及存储介质

[0001]本公开实施例涉及音频处理
，尤其涉及一种音频处理方法、装置、设备及存储介质。

技术介绍

[0002]爆破音是指音频里面出现的刺耳卡顿等噪音，产生的原因主要包括音频数据点的截波、音频算法处理漏洞以及设备或者网络延迟等。
[0003]在一些技术中，可以使用频谱分析来检测音频中存在的爆破音，以提高音频播放效果。但是，频谱分析的计算成本较高，效率低下。

技术实现思路

[0004]本公开实施例提供一种音频处理方法、装置、设备及存储介质，以解决对音频数据的处理效率低下的技术问题。
[0005]第一方面，本公开实施例提供一种音频处理方法，包括：
[0006]对音频数据进行时域分析处理，确定所述音频数据中的爆破音候选点；
[0007]对所述爆破音候选点所在的音频帧进行频域分析处理，确定所述爆破音候选点是否存在爆破音；
[0008]若存在爆破音，则对所述爆破音候选点进行平滑处理，得到处理后的音频数据。
[0009]第二方面，本公开实施例提供一种音频处理装置，包括：
[0010]时域分析模块，用于对音频数据进行时域分析处理，确定所述音频数据中的爆破音候选点；
[0011]频域分析模块，用于对所述爆破音候选点所在的音频帧进行频域分析处理，确定所述爆破音候选点是否存在爆破音；
[0012]处理模块，用于在存在爆破音时，对所述爆破音候选点进行平滑处理，得到处理后的音频数据。
[0013]第三方面...

【技术保护点】

【技术特征摘要】
1.一种音频处理方法，其特征在于，包括：对音频数据进行时域分析处理，确定所述音频数据中的爆破音候选点；对所述爆破音候选点所在的音频帧进行频域分析处理，确定所述爆破音候选点是否存在爆破音；若存在爆破音，则对所述爆破音候选点进行平滑处理，得到处理后的音频数据。2.根据权利要求1所述的方法，其特征在于，对音频数据进行时域分析处理，确定所述音频数据中的爆破音候选点，包括：获取所述音频数据中的各采样点的幅值；根据任一采样点的幅值以及该采样点在时域上的相邻采样点的幅值，确定该采样点是否为爆破音候选点。3.根据权利要求2所述的方法，其特征在于，所述爆破音候选点包括卡顿截断候选点和/或卡顿截出候选点；根据任一采样点的幅值以及该采样点在时域上的相邻采样点的幅值，确定该采样点是否为爆破音候选点，包括：若检测到任一采样点的幅值的绝对值大于相邻多个采样点的绝对幅值均值的第一预设倍数，则确定该采样点为爆破音候选点，其中，所述绝对幅值均值为所述相邻多个采样点的幅值的平均值的绝对值，所述相邻多个采样点为时域上与该采样点距离最近的多个采样点；和/或，若检测到任一采样点的幅值的绝对值大于第一预设阈值，且该采样点的后N个采样点的幅值均为零，则确定该采样点为卡顿截断候选点；和/或，若检测到任一采样点的幅值的绝对值大于第二预设阈值，且该采样点的前M个采样点的幅值均为零，则确定该采样点为卡顿截出候选点；其中，M和N均为大于1的整数。4.根据权利要求1
‑
3任一项所述的方法，其特征在于，对所述爆破音候选点所在的音频帧进行频域分析处理，确定所述爆破音候选点是否存在爆破音，包括：以所述爆破音候选点为中心选取关键音频帧；根据帧移确定所述关键音频帧的前一音频帧和后一音频帧；对所述关键音频帧、所述前一音频帧及所述后一音频帧分别加窗并进行短时傅里叶变换，得到每一帧对应的频域信息；根据所述频域信息确定所述爆破音候选点是否存在爆破音。5.根据权利要求4所述的方法，其特征在于，根据所述频域信息确定所述爆破音候选点是否存在爆破音，包括：根据所述频域信息，计算所述关键音频帧、所述前一音频帧及所述后一音频帧中每一帧对应的高频能量；若所述关键音频帧的高频能量大于能量阈值，且大于所述前一音频帧与后一音频帧的平均高频能量的第二预设倍数，则确定所述爆破音候选点存在爆破音。6.根据权利要求3所述的方法，其特征在于，对所述爆破音候选点进行平滑处理，包括：若所述爆破音候选点为卡顿截断候选点，则对所述爆破音候选点进行淡出处理；和/或，
若所述爆破音候选点为卡顿截出候选点，则对所述爆破音候选点进行淡入处理；和/或，若...

【专利技术属性】
技术研发人员：刘琨，周新权，
申请(专利权)人：北京字节跳动网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人