用于信息编码的概念制造技术

技术编号:13960494 阅读:89 留言:0更新日期:2016-11-03 01:56
本发明专利技术提供了一种用于对信息信号(IS)编码的信息编码器,该信息编码器(1)包括:分析器(2),用于分析信息信号(IS),以获得预测多项式A(z)的线性预测系数;转换器(3),用于将预测多项式A(z)的线性预测系数转换为预测多项式A(z)的频谱频率表示的频率值f1...fn,其中,转换器(3)被配置为通过分析被定义为P(z)=A(z)+z‑m‑1A(z‑1)和Q(z)=A(z)‑z‑m‑1A(z‑1)的一对多项式P(z)和Q(z)来确定频率值f1...fn,其中,m是预测多项式A(z)的阶数,且l大于等于零,其中,所述转换器(3)被配置为通过建立根据P(z)导出的严格实频谱(RES)和根据Q(z)导出的严格虚频谱(IES),并通过识别根据P(z)导出的严格实频谱(RES)和根据Q(z)导出的严格虚频谱(IES)中的零,来获得频率值(f1...fn);量化器(4),用于根据频率值(f1...fn)来获得量化频率(fq1...fqn)值;以及比特流产生器(5),用于产生包括量化频率值(fq1...fqn)在内的比特流。

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
语音编码中最常用的范例是代数码激励线性预测(ACELP),其在诸如AMR族、G.718和MPEG USAC[1-3]之类的标准中使用。其基于使用源模型对语音建模,包含用于对频谱包络进行建模的线性预测器(LP)、用于对基频进行建模的长期预测器(LTP)以及针对残留的代数码本。线性预测模型的系数对于量化是非常灵敏的,由此通常在量化之前首先将它们变换为线谱频率(LSF)或导抗谱频率(Imittance Spectral Frequencies,即ISF)。LSF/ISF域对于量化误差是鲁棒的;且在这些域中,可以容易地保留预测器的稳定性,由此其提供了用于量化的合适域[4]。可以如下根据具有阶数m的线性预测多项式A(z)来获得在下文中被称为频率值的LSF/ISF。将线性频谱对多项式定义为:P(z)=A(z)+z-m-lA(z-1)Q(z)=A(z)-z-m-lA(z-1) (1)其中,对于线谱对来说,l=1,且对于导抗谱对表示来说,l=0,但是原则上任何l≥0是有效的。在下文中,从而将仅假设l≥0。注意到:可以始终使用A(z)=1/2[P(z)+Q(z)]来重构原始预测器。从而多项式P(z)和Q(z)包含A(z)的所有信息。LSP/ISP多项式的中心特性是:当且仅当A(z)的所有根都在单位圆内,P(z)和Q(z)的根才在单位圆上交错。由于P(z)和Q(z)的根在单位圆上,可以仅用其角度来表示它们。这些角度对应于频率,且由于P(z)和Q(z)的频谱在其对数幅度频谱中与根相对应的频率处具有垂直的线,这些根被称为频率值。由此可见,频率值对预测器A(z)的所有信息进行编码。此外,已发现频率值对于量化误差来说是鲁棒的,使得频率值之一的小误差产生了重构预测器的频谱中的小误差,其在频谱中对应频率附近局部化。由于这些有利特性,LSF或ISF域中的量化在所有主流语音编解码器[1-3]中使用。然而,使用频率值时的挑战之一是根据多项式P(z)和Q(z)的系数高效地找到频率值的位置。归根结底,找到多项式的根是经典难题。之前提出的用于该任务的方法包括以下方案:·早期方案之一使用了零驻留在单位圆上这一事实,由此它们表现为幅度频谱中的零[5]。通过取P(z)和Q(z)的系数的离散傅立叶变换,从而可以在幅度频谱中搜索波谷。每个波谷指示了根的位置,且如果对频谱进行重复上采样,则可以找到所有的根。然而该方法仅得到了近似位置,因为难以根据波谷位置来确定精确的位置。·最常用的方案基于切比雪夫多项式,且在[6]中提出。其依赖于以下认识:多项式P(z)和Q(z)分别是对称和反对称,由此它们包含大量冗余信息。通过移除在z=±1处的琐碎零且代入x=z+z-1(其被称为切比雪夫变换),可以将多项式变换为备选表示FP(x)和FQ(x)。这些多项式的阶数是P(z)和Q(z)的阶数的一半,且它们在范围-2到+2上仅具有实数根。注意到:当x为实数时,多项式FP(x)和FQ(x)是实值的。此外,由于根是简单的,FP(x)和FQ(x)将在其每个根处具有零交点(zero-crossing)。在诸如AMR-WB之类的语音编解码中,应用该方案,使得在实数轴上的固定网格上对多项式FP(x)和FQ(x)求值,以找到所有零交点。通过在零交点附近进行线性插值对根位置进一步求精。该方案的优点是由于省略了冗余系数而导致降低了复杂度。尽管上述方法在现有编解码器中足够有效,但它们确实具有大量的问题。
技术实现思路
要解决的问题是提供改进的用于信息编码的概念。在第一方案中,该问题是由用于对信息信号编码的信息编码器来解决的。该信息编码器包括:分析器,用于分析信息信号,以获得预测多项式A(z)的线性预测系数;转换器,用于将预测多项式A(z)的线性预测系数转换为预测多项式A(z)的频谱频率表示的频率值,其中,所述转换器被配置为通过分析如下定义的一对多项式P(z)和Q(z)来确定频率值:P(z)=A(z)+z-m-lA(z-1)以及Q(z)=A(z)-z-m-lA(z-1),其中,m是预测多项式A(z)的阶数,且l大于等于零,其中,转换器被配置为通过建立根据P(z)导出的严格实频谱和根据Q(z)导出的严格虚频谱,并通过识别根据P(z)导出的严格实频谱和根据Q(z)导出的严格虚频谱中的零,来获得频率值;量化器,用于根据频率值来获得量化频率值;以及比特流产生器,用于产生包括量化频率值在内的比特流。根据本专利技术的信息编码器使用零交点搜索,反之根据现有技术的用于寻找根的频谱方案依赖于找到幅度频谱中的波谷。然而,当搜索波谷时,准确度比在搜索零交点时差。考虑例如序列[4,2,1,2,3]。清楚的是,最小值是第三个元素,由此零将位于第二个和第四个元素之间某处。换言之,不可能确定零是在第三个元素的左侧还是右侧。然而,如果考虑序列[4,2,1,-2,-3],可以立刻看到零交点在第三个和第四个元素之间,由此将我们的误差余量减半。由此可见:使用幅度频谱方案,需要将分析点的数量加倍以获得与零交点搜索相同的准确度。与对幅度|P(z)|和|Q(z)|求值相比,零交点方案在准确度方面具有显著的优势。考虑例如序列3,2,-1,-2。使用零交点方案,显而易见的是零位于2和-1之间。然而,通过研究对应幅度序列3,2,1,2,仅可以推断出零位于第二个和最后一个元素之间某处。换言之,使用零交点方案,与基于幅度的方案相比将准确度加倍。此外,根据本专利技术的信息编码器可以使用长预测器,例如m=128。与此相对,切比雪夫变换仅在A(z)的长度相对小(例如,m≤20)的时候才充分执行。对于长预测器,切比雪夫变换是数值不稳定的,由此该算法的实际实现是不可能的。因此所提出的信息编码器的主要特性是:可以获得与基于切比雪夫的方法一样高或更好的准确度,因为搜索零交点,且由于进行了时域到频域的转换,使得可以用非常低的计算复杂度来找到零。作为结果,根据本专利技术的信息编码器不仅更准确地确定零(根),还具有低计算复杂度。根据本专利技术的信息编码器可以在需要确定序列的线谱的任何信号处理应用中使用。本文中,该信息编码器在语音编码的上下文中示例讨论。本专利技术适用于语音、音频和/或视频编码设备或应用,其采用了用于对频谱幅度包络、感知频率遮蔽阈值、时间幅度包络、感知时间遮蔽阈值、或其他包络形状、或等价于包络形状的其他表示(例如,自相关信号)进行建模的线性预测器,其使用线谱来表示包络的信息,用于编码、分析或处理,其需要用于根据输入信号(例如语音或通用音频信号)来确定线谱的方法,且其中,输入信号被表示为数字滤波器或其他数列。信息信号可以是例如音频信号或视频信号。频率值可以是线谱频率或导抗谱频率。在比特流内发送的量化频率值将使得解码器能够对比特流解码,以重新创建音频信号或视频信号。根据本专利技术的优选实施例,转换器包括:确定设备,用于根据预测多项式A(z)来确定多项式P(z)和Q(z)。根据本专利技术的优选实施例,转换器包括:零识别器,用于识别根据P(z)导出的严格实频谱和根据Q(z)导出的严格虚频谱中的零。根据本专利技术的优选实施例,零识别器被配置为通过以下方式来识别零:a)在零频率上以实频谱开始;b)增加频率,直到找到实频谱上的符号改变为止;c)增加频率,直到找到虚频谱上的另本文档来自技高网
...

【技术保护点】
一种用于对信息信号(IS)编码的信息编码器,所述信息编码器(1)包括:分析器(2),用于分析信息信号(IS),以获得预测多项式A(z)的线性预测系数;转换器(3),用于将预测多项式A(z)的线性预测系数转换为预测多项式A(z)的频谱频率表示的频率值f1...fn,其中,所述转换器(3)被配置为通过分析如下定义的一对多项式P(z)和Q(z)来确定频率值f1...fn:P(z)=A(z)+z‑m‑1A(z‑1)以及Q(z)=A(z)‑z‑m‑1 A(z‑1),其中,m是预测多项式A(z)的阶数,且1大于等于零,其中,所述转换器(3)被配置为通过建立根据P(z)导出的严格实频谱(RES)和根据Q(z)导出的严格虚频谱(IES),并通过识别根据P(z)导出的严格实频谱(RES)和根据Q(z)导出的严格虚频谱(IES)中的零,来获得频率值(f1...fn);量化器(4),用于根据频率值(f1...fn)来获得量化频率(fq1...fqn)值;以及比特流产生器(5),用于产生包括量化频率值(fq1...fqn)在内的比特流。

【技术特征摘要】
【国外来华专利技术】2014.03.07 EP 14158396.3;2014.07.28 EP 14178789.51.一种用于对信息信号(IS)编码的信息编码器,所述信息编码器(1)包括:分析器(2),用于分析信息信号(IS),以获得预测多项式A(z)的线性预测系数;转换器(3),用于将预测多项式A(z)的线性预测系数转换为预测多项式A(z)的频谱频率表示的频率值f1...fn,其中,所述转换器(3)被配置为通过分析如下定义的一对多项式P(z)和Q(z)来确定频率值f1...fn:P(z)=A(z)+z-m-1A(z-1)以及Q(z)=A(z)-z-m-1 A(z-1),其中,m是预测多项式A(z)的阶数,且1大于等于零,其中,所述转换器(3)被配置为通过建立根据P(z)导出的严格实频谱(RES)和根据Q(z)导出的严格虚频谱(IES),并通过识别根据P(z)导出的严格实频谱(RES)和根据Q(z)导出的严格虚频谱(IES)中的零,来获得频率值(f1...fn);量化器(4),用于根据频率值(f1...fn)来获得量化频率(fq1...fqn)值;以及比特流产生器(5),用于产生包括量化频率值(fq1...fqn)在内的比特流。2.根据前一权利要求所述的信息编码器,其中,所述转换器(3)包括:确定设备(6),用于根据所述预测多项式A(z)来确定多项式P(z)和Q(z)。3.根据前述权利要求中任一项所述的信息编码器,其中,所述转换器(3)包括:零识别器(9),用于识别根据P(z)导出的严格实频谱(RES)和根据Q(z)导出的严格虚频谱(IES)中的零。4.根据前一权利要求所述的信息编码器,其中,所述零识别器(9)被配置为通过以下方式来识别零:a)在零频率上以实频谱(RES)开始;b)增加频率,直到找到实频谱(RES)上的符号改变为止;c)增加频率,直到找到虚频谱(IES)上的另一符号改变为止;以及d)重复步骤b)和c),直到找到所有零为止。5.根据权利要求3或权利要求4所述的信息编码器,其中,所述零识别器被配置为通过插值来识别零。6.根据前述权利要求中任一项所述的信息编码器,其中,所述转换器(3)包括:零填充设备(10),用于向多项式P(z)和Q(z)添加具有“0”值的一个或多个系数,以产生一对加长多项式Pe(z)和Qe(z)。7.根据权利要求5或权利要求6所述的信息编码器,其中,所述转换器(3)被配置为使得:在将线性预测系数转换为预测多项式A(z)的频谱频率表示(RES、IES)的频率值(f1...fn)期间,省略针对加长多项式Pe(z)和Qe(z)的已知具有“0”值的系数的至少一部分运算。8.根据权利要求5至7中任一项所述的信息编码器,其中,所述转换器(3)包括:合成多项式形成器(13),被配置为根据所述加长多项式Pe(z)和Qe(z)来建立合成多项式Ce(Pe(z),Qe(z))。9.根据前一权利要求所述的信息编码器,其中,所述转换器(3)被配置为使得:根据P(z)导出的严格实频谱(RES)和根据Q(z)导出的严格虚频谱(IES)是通过变换合成多项式Ce(Pe(z),Qe(z))的单傅立叶变换来建立的。10.根据前述权利要求中任一项所述的信息编码器,其中,所述转换器(3)包括:傅立叶变换设备(8),用于将所述一对多项式P(z)和Q(z)或根据所述一对多项式P(z)和Q(z)导出的一个或多个多项式傅立叶变换到频域中;以及调整设备(7、12),用于调整根据P(z)导出的频谱(RES)的相位使得其是严格实数的,以及用于调整根据Q(z)导出的频谱(IES)的相位使得其是严格...

【专利技术属性】
技术研发人员:汤姆·巴克斯特伦克里斯蒂安·弗斯彻彼得森尤纳斯·弗斯彻马蒂亚斯·哈特伯格阿尔弗索·皮诺
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1