一种音频处理方法、装置及存储介质制造方法及图纸

技术编号:37349845 阅读:13 留言:0更新日期:2023-04-22 21:48
本发明专利技术公开了一种音频处理方法、装置及存储介质,方法包括:针对当前近端音频帧和多个远端音频帧中每个音频帧,利用帧内包含的音频数据生成对应的能量序列;针对当前近端音频帧和多个远端音频帧中每个音频帧,分别对对应的能量序列进行非等比压缩,得到对应的压缩后的能量序列;分别对每个压缩后的能量序列利用预设滑动窗口进行遍历,提取对应音频帧的特征数据,并将当前近端音频帧对应的特征数据确定为近端特征,多个远端音频帧对应的多个特征数据确定为多个远端特征;利用近端特征与多个远端特征,对当前近端音频帧进行回声判断。通过上述方案,提高了判断近端音频中是否包含回声的准确性。准确性。准确性。

【技术实现步骤摘要】
一种音频处理方法、装置及存储介质


[0001]本专利技术涉及音频处理
,尤其涉及一种音频处理方法、装置及存储介质。

技术介绍

[0002]声学回声是指系统播放出来的声音又被麦克风采集后发送给远端,使远端用户听到了自己声音的一种现象。这在语音通信系统中是一种非常常见的现象,所以消除回声就是通信系统不可缺少的部分了。
[0003]通话包括“远端”和“近端”,有语音表示为1,没有语音表示为0,则可以归类出4种状态,分别是:(0,0),(0,1),(1,0),(1,1)。(0,0)表示双方都没有语音,所以不需要回声消除,而其他3种状态都需要做回声消除。然而,现有方法假定(1,1)这种状态不存在,在通信的双方都在讲话的时候,目前无法准确的判断近端音频是否有回声,仅直接使用前面计算出的时延数据进行回声消除,造成的结果就是有可能误消除,即近端音频本身没有回声,却进行回声消除,导致正常的音频受到了抑制,或者,消除的不干净,例如,出现“漏字”现象,即一句话的开头或者结尾就个别字词没有消除掉。

技术实现思路

[0004]为解决上述技术问题,本申请提供了一种音频处理方法、装置及存储介质,使用高精度的特征提取方式进行音频特征提取,从而提高判断近端音频中是否包含回声的准确性,此外,在有回声的情况下,可以进一步准确的计算出回声时延,以提高回声消除质量。
[0005]本申请的技术方案是这样实现的:
[0006]本申请提供了一种音频处理方法,包括:
[0007]针对当前近端音频帧和多个远端音频帧中每个音频帧,利用帧内包含的音频数据生成对应的能量序列;
[0008]针对所述当前近端音频帧和所述多个远端音频帧中每个音频帧,分别对对应的能量序列进行非等比压缩,得到对应的压缩后的能量序列;
[0009]分别对每个压缩后的能量序列利用预设滑动窗口进行遍历,提取对应音频帧的特征数据,并将所述当前近端音频帧对应的特征数据确定为近端特征,所述多个远端音频帧对应的多个特征数据确定为多个远端特征;
[0010]利用所述近端特征与所述多个远端特征,对所述当前近端音频帧进行回声判断。
[0011]在上述方法中,所述针对当前近端音频帧和多个远端音频帧中每个音频帧,利用帧内包含的音频数据生成对应的能量序列之前,所述方法还包括:
[0012]获取当前近端音频帧,以及远端音频序列;
[0013]对所述远端音频序列加窗分帧,得到所述多个远端音频帧。
[0014]在上述方法中,所述针对所述当前近端音频帧和所述多个远端音频帧中每个音频帧,分别对对应的能量序列进行非等比压缩,得到对应的压缩后的能量序列之前,所述方法还包括:
[0015]针对所述当前近端音频帧和所述多个远端音频帧中每个音频帧,分别对对应的能量序列进行滤波处理。
[0016]在上述方法中,所述分别对每个压缩后的能量序列利用预设滑动窗口进行遍历,提取对应音频帧的特征数据,包括:
[0017]对目标能量序列进行能量子带划分,得到顺序排列的多个能量子带;其中,所述目标能量序列为目标音频帧对应的压缩后的能量序列,所述目标音频帧为所述当前近端音频帧和所述多个远端音频帧中任意一个音频帧;
[0018]利用所述预设滑动窗口在所述多个能量子带上顺序滑动,并将所述预设滑动窗口每一次滑动选取到的能量子带确定为一个能量窗口,得到能量窗口序列;
[0019]针对所述能量窗口序列中每个能量窗口,基于窗口包含的能量子带确定对应的特征值;
[0020]利用所述能量窗口序列中不同能量窗口对应的特征值,组成所述目标音频帧对应的特征数据。
[0021]在上述方法中,所述针对所述能量窗口序列中每个能量窗口,基于窗口包含的能量子带确定对应的特征值,包括:
[0022]将目标窗口中预设位置处的能量子带,确定为标准子带;所述目标窗口为所述能量窗口序列中任意一个能量窗口;
[0023]在所述标准子带的能量值,大于所述目标窗口中与所述标准子带不同的每个能量子带的能量值,确定所述目标窗口对应的特征值为1;
[0024]在所述标准子带的能量值,不大于所述目标窗口中与所述标准子带不同的每个能量子带的能量值,确定所述目标窗口对应的特征值为0。
[0025]在上述方法中,所述利用所述近端特征与所述多个远端特征,对所述当前近端音频帧进行回声判断,包括:
[0026]依次计算所述近端特征与所述多个远端特征中每个远端特征的汉明距离;
[0027]在计算出小于预设距离阈值的汉明距离的情况下,判定所述当前近端音频帧中包含回声。
[0028]在上述方法中,所述利用所述近端特征与所述多个远端特征,对所述当前近端音频帧进行回声判断之后,所述方法还包括:
[0029]在判定所述当前近端音频帧中包含回声的情况下,获取相似特征的时序信息;所述相似特征为所述多个远端特征中,与所述近端特征的汉明距离小于预设距离阈值的远端特征;
[0030]利用所述时序信息计算回声时延。
[0031]本申请提供了一种音频处理装置,包括:
[0032]生成模块,用于针对当前近端音频帧和多个远端音频帧中每个音频帧,利用帧内包含的音频数据生成对应的能量序列;
[0033]处理模块,用于针对所述当前近端音频帧和所述多个远端音频帧中每个音频帧,分别对对应的能量序列进行非等比压缩,得到对应的压缩后的能量序列;
[0034]提取模块,用于分别对每个压缩后的能量序列利用预设滑动窗口进行遍历,提取对应音频帧的特征数据,并将所述当前近端音频帧对应的特征数据确定为近端特征,所述
多个远端音频帧对应的多个特征数据确定为多个远端特征;
[0035]判断模块,用于利用所述近端特征与所述多个远端特征,对所述当前近端音频帧进行回声判断。
[0036]在上述装置中,所述生成模块,还用于获取当前近端音频帧,以及远端音频序列;对所述远端音频序列加窗分帧,得到所述多个远端音频帧。
[0037]在上述装置中,所述处理模块,还用于针对所述当前近端音频帧和所述多个远端音频帧中每个音频帧,分别对对应的能量序列进行滤波处理。
[0038]在上述装置中,所述提取模块,具体用于:
[0039]对目标能量序列进行能量子带划分,得到顺序排列的多个能量子带;其中,所述目标能量序列为目标音频帧对应的压缩后的能量序列,所述目标音频帧为所述当前近端音频帧和所述多个远端音频帧中任意一个音频帧;
[0040]利用所述预设滑动窗口在所述多个能量子带上顺序滑动,并将所述预设滑动窗口每一次滑动选取到的能量子带确定为一个能量窗口,得到能量窗口序列;
[0041]针对所述能量窗口序列中每个能量窗口,基于窗口包含的能量子带确定对应的特征值;
[0042]利用所述能量窗口序列中不同能量窗口对应的特征值,组成所述目标音频帧对应的特征数据。
[0043]在上述装置中,所述提取模块,具体用于:
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频处理方法,其特征在于,包括:针对当前近端音频帧和多个远端音频帧中每个音频帧,利用帧内包含的音频数据生成对应的能量序列;针对所述当前近端音频帧和所述多个远端音频帧中每个音频帧,分别对对应的能量序列进行非等比压缩,得到对应的压缩后的能量序列;分别对每个压缩后的能量序列利用预设滑动窗口进行遍历,提取对应音频帧的特征数据,并将所述当前近端音频帧对应的特征数据确定为近端特征,所述多个远端音频帧对应的多个特征数据确定为多个远端特征;利用所述近端特征与所述多个远端特征,对所述当前近端音频帧进行回声判断。2.根据权利要求1所述的方法,其特征在于,所述针对当前近端音频帧和多个远端音频帧中每个音频帧,利用帧内包含的音频数据生成对应的能量序列之前,所述方法还包括:获取当前近端音频帧,以及远端音频序列;对所述远端音频序列加窗分帧,得到所述多个远端音频帧。3.根据权利要求1所述的方法,其特征在于,所述针对所述当前近端音频帧和所述多个远端音频帧中每个音频帧,分别对对应的能量序列进行非等比压缩,得到对应的压缩后的能量序列之前,所述方法还包括:针对所述当前近端音频帧和所述多个远端音频帧中每个音频帧,分别对对应的能量序列进行滤波处理。4.根据权利要求1所述的方法,其特征在于,所述分别对每个压缩后的能量序列利用预设滑动窗口进行遍历,提取对应音频帧的特征数据,包括:对目标能量序列进行能量子带划分,得到顺序排列的多个能量子带;其中,所述目标能量序列为目标音频帧对应的压缩后的能量序列,所述目标音频帧为所述当前近端音频帧和所述多个远端音频帧中任意一个音频帧;利用所述预设滑动窗口在所述多个能量子带上顺序滑动,并将所述预设滑动窗口每一次滑动选取到的能量子带确定为一个能量窗口,得到能量窗口序列;针对所述能量窗口序列中每个能量窗口,基于窗口包含的能量子带确定对应的特征值;利用所述能量窗口序列中不同能量窗口对应的特征值,组成所述目标音频帧对应的特征数据。5.根据权利要求4所述的方法,其特征在于,所述针对所述能量窗口序列中每个能量窗口,基于窗口包含的能量子带确定对应的特征值,包括:将目标窗口中预设位置处的能量子带,确定为标准子带;所述目标窗口为所述能量窗口序列中任意一个能量窗口;在所述标...

【专利技术属性】
技术研发人员:郑攀峰袁俊杰戚兴春陶晓明
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1