The invention discloses a method and a device for encoding audio bandwidth extension if replicated, the invention by calculating the high frequency subband and the Pearson correlation coefficient of each sub-band between the selected subband and the strongest correlation, by judging whether the value of the maximum correlation coefficient is less than the threshold value, to find a more suitable combination between bands, more relevant the original high frequency reconstruction. At the same time, the maximum correlation degree is not the case, the Gauss white noise is introduced to replace the low frequency sub brings high frequency subbands to avoid duplication, because the harmonic characteristics of the signal is not obvious, the spectrum correlation is relatively weak, it is prone to correlation maximum correlation between subbands is also very weak, if you still use the maximum correlation with reconstruction, but error. Therefore, the technical scheme of the embodiment of the invention can carry out the high frequency reconstruction more accurately.
【技术实现步骤摘要】
本专利技术属于音频编码
,具体涉及一种音频编码带宽扩展中频带复制的方法及装置。
技术介绍
心理声学研究表明人们对于音频不同频率下的敏感性具有差异,对低频更敏感而对高频不敏感,因此在音频编码中常常不对高频进行编码以节省码率。而高频部分的完全缺失又会带来听感上的不适,因此往往采用带宽扩展的方式恢复高频。以利用高低频信号之间的相关性为代表的频带复制技术是目前为止效果比较好的一种高频重建方法,它在频域把低频信号整块复制到高频频段,再利用能量参数等边信息对复制的高频段进行修复,从而达到高频重建的目的。现有方法在利用低频信号进行高频重建时,简单的按子带顺序选取低频频带对高频频带进行重建,没有选择性。难以根据信号自身特性,做出自适应的调整,影响高频重建的准确性。虽然高频频带与低频频带具有一定的相关性,但固定的匹配方式,不足以保证相关性最好的高频频带与低频子带能准确的对应,相反可能导致相关性较弱甚至不相关的子带匹配,导致高频重建效果不佳。
技术实现思路
为了解决上述技术问题,本专利技术提供了一种音频编码带宽扩展频带复制的方法及装置。本专利技术的方法所采用的技术方案是:一种音频编码带宽扩展中频带复制的方法,其特征在于,包括以下步骤:步骤1:计算音频信号各低频子带与高频子带之间的相关系数每个原始高频的最大相关系数max(Pn[k])用最大相关矩阵Pmax[n][k]记录,Pn[k]代表第n个高频子带与第k个低频r>子带之间的相关系数;步骤2:为高频子带选择值最大的相关系数,并判断相关系数值是否大于阈值;若是,则为高频子带选择相关系数最大的低频子带为最优复制子带;若否,则用同长度的高斯白噪声作为高频子带的复制子带;步骤3:提取频带复制所需能量信息,输出边信息。作为优选,步骤1的具体实现过程是针对每一个原始高频子带,计算它与各个低频信号子带之间的皮尔逊相关系数,从而得到原始子带与各个待选子带之间的相关性;计算公式为:Pn(k)=Σi=0N-1(x[n,i]-Σi=0N-1x[n,i]N)(y[k,i]-Σi=0N-1y[k,i]N)Σi=0N-1(x[n,i]-Σi=0N-1x[n,i]N)2Σi=0N-1(y[k,i]-Σi=0N-1y[k,i]N)2;]]>式中Pn[k]代表第n个高频子带与第k个低频子带之间的相关系数,x[n,i]表示高频子带样点,其中n表示高频子带序号,i表示子带样点序号,y[k,i]表示低频子带样点,k表示低频子带序号,N表示子带长度。作为优选,步骤2中所述判断相关系数值是否大于阈值,判断条件为:|Pmax[n][k]|>γ;式中Pn[k]代表第n个高频子带与第k个低频子带之间的相关系数,阈值γ取值为0.2。作为优选,步骤3中所述边信息包括频带对应信息和能量信息;所述频带对应信息包括高频子带与相关性最大的低频子带或高斯白噪声之间的对应关系;所述能量信息包括相关性最大的低频子带和高频子带之间的增益值r[i]和高频子带能量均值e[i];r[i]=Σi=0N-1x2[n,i]Σi=0N-1y2[k,i];]]>e[i]=Σi=0N-1x2[n,i]N;]]>式中,r[i]表示第n个高频子带与第k个低频子带间的增益,e[i]表示第n个高频子带能量均值,x[n,i]表示高频子带样点,其中n表示高频子带序号,i表示子带样点序号,y[k,i]表示低频子带样点,k表示低频子带序号,N表示子带长度;若最大相关性值大于阈值,则用相关性最大的低频子带复制高频子带,输出相关性最大的低频子带和高频子带之间的增益值r[i];若最大相关性值小于等于阈值,则用高斯白噪声复制高频子带,输出高频子带能量均值e[i]。本专利技术的装置所采用的技术方案是:一种音频编码带宽扩展中频带复制的装置,其特征在于:包括相关性计算模块、子带选取模块、能量信息提取模块;所述相关性计算模块,用于计算音频信号各高频子带与各低频子带之间的相关系数;所述子带选取模块,用于确定频带对应关系,为高频子带选择值最大的相关系数,并判断相关系数值是否大于阈值;若最大相关系数的值大于阈值,则为高频子带选择相关系数最大的的低频子带为最优复制子带,若最大相关系数的值小于阈值,则用同长度的高斯白噪声作为高频子带的复制子带;所述能量信息提取模块,用于提取频带复制所需能量信息,输出边信息。本专利技术与现有技术相比的有益效果是,本专利技术实施例方案充分考虑到了低频子带和高频子带的相关性,通过计算高频子带与各低频子带之间的皮尔逊相关系数选取最强相关子带,并通过判断最高相关系数数值是否低于阈值,找到频带间更合适、更具关联性的匹配组合,指导原始高频重建。同时对最大相关性相关程度不大的情况,引入高斯白噪声代替低频子带来复制高频子带,避免了由于信号的谐波特性不明显,频谱相关性比较弱,很容易出现最大相关的子带之间的相关性也很弱,如果此时仍然使用最大相关子带重建,反而会引入误差。因此本专利技术实施例技术方案能够更准确的进行高频重建。附图说明图1是本专利技术实施例频带复制的方法流程图。图2是本专利技术实施例的频带复制的装置模块图。具体实施方式为了便于本领域普通技术人员理解和实施本专利技术,下面结合附图及实施例对本专利技术作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本专利技术,并不用于限定本专利技术。请见图1,本专利技术提供的一种音频编码带宽扩展中频带复制的方法,包括以下步骤:步骤1,针对每一个原始高频子带,通过下式计算它与各个低频信号子带之间的皮尔逊相关系数,从而得到原始子带与各个待选子带之间的相关性;Pn(k)=Σi=0N-1(x[n,i]-Σi=0N-1x[n,i]N)(y[k,i]-Σi=0N-1y[k,i]N)Σi=0N-1(x[n,i]-Σi=0N-1x[n,i]N)2Σi=0N-1(y[k,i]-Σi=0N-1y[k,i]N)2;]]>式中本文档来自技高网...
【技术保护点】
一种音频编码带宽扩展中频带复制的方法,其特征在于,包括以下步骤:步骤1:计算音频信号各低频子带与高频子带之间的相关系数,每个原始高频的最大相关系数max(Pn[k])用最大相关矩阵Pmax[n][k]记录,Pn[k]代表第n个高频子带与第k个低频子带之间的相关系数;步骤2:为高频子带选择值最大的相关系数,并判断相关系数值是否大于阈值;若是,则为高频子带选择相关系数最大的低频子带为最优复制子带;若否,则用同长度的高斯白噪声作为高频子带的复制子带;步骤3:提取频带复制所需能量信息,输出边信息。
【技术特征摘要】
1.一种音频编码带宽扩展中频带复制的方法,其特征在于,包括以下步骤:
步骤1:计算音频信号各低频子带与高频子带之间的相关系数,每个原始高频的最大相
关系数max(Pn[k])用最大相关矩阵Pmax[n][k]记录,Pn[k]代表第n个高频子带与第k个低
频子带之间的相关系数;
步骤2:为高频子带选择值最大的相关系数,并判断相关系数值是否大于阈值;
若是,则为高频子带选择相关系数最大的低频子带为最优复制子带;
若否,则用同长度的高斯白噪声作为高频子带的复制子带;
步骤3:提取频带复制所需能量信息,输出边信息。
2.根据权利要求1所述音频编码带宽扩展中频带复制的方法,其特征在于:步骤1的具
体实现过程是针对每一个原始高频子带,计算它与各个低频信号子带之间的皮尔逊相关系数,
从而得到原始子带与各个待选子带之间的相关性;计算公式为:
Pn(k)=Σi=0N-1(x[n,i]-Σi=0N-1x[n,i]N)(y[k,i]-Σi=0N-1y[k,i]N)Σi=0N-1(x[n,i]-Σi=0N-1x[n,i]N)2Σi=0N-1(y[k,i]-Σi=0N-1y[k,i]N)2;]]>式中Pn[k]代表第n个高频子带与第k个低频子带之间的相关系数,x[n,i]表示高频子带样
点,其中n表示高频子带序号,i表示子带样点序号,y[k,i]表示低频子带样点,k表示低频
子带序号,N表示子带长度。
3.根据权利要求1所述音频编码带宽扩展中频带复制的方法,其特征在于:步骤2中所
述判断相关系数值是否大于阈值,判断条件为:
|Pmax[n][k]|&g...
【专利技术属性】
技术研发人员:胡瑞敏,姜林,文彬,胡霞,杨玉红,王晓晨,涂卫平,
申请(专利权)人:武汉大学,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。