当前位置: 首页 > 专利查询>诺基亚公司专利>正文

用于确定LTP编码系统中的基音延迟的系统和方法技术方案

技术编号:3044985 阅读:162 留言:0更新日期:2012-04-11 18:40
公开了被配置用来使用自适应延迟搜索窗口确定音频编码系统内的信息的当前帧的延迟估计的方法、计算机代码产品、设备、模块、系统和编码器。该系统可以确定该延迟估计是否是可靠的,若不然,则可以选择一个新搜索窗口,并且可以基于该新搜索窗口计算新延迟估计。可以比较自适应阈值和延迟估计的互相关,以便确定该延迟估计是否是可靠的。该系统还可以确定通过使用该预测能否实现编码增益,若不然,则避免计算量很大的时间频率转换。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术一般涉及编码系统领域。更具体地,本专利技术涉及改进的音频编码系统和方法。
技术介绍
在许多应用中,希望把代表信号或文件所需的信息量降到最低程度。通过把信息量降到最低程度,可以节省传送该信号所需的带宽和/或存储该文件所需的存储空间。对于诸如移动通信设备之类的具有有限资源的设备或系统,这是特别有用的。通常用编码器进行压缩的一种信号是音频信号。可以利用音频编码器来压缩时域音频信号,从而可以显著降低表示该信号所需的比特率。理想地,降低经过编码的信号的比特率以使它适合用来传送该信号的传输信道的约束。对于实时通信和流服务应用而言,这是特别有用的。通过使用压缩,也可以减少表示经过编码的音频信号的文件的大小。对于下载和/或存储高质量音频内容而言,这是特别有用的。通常,音频编码器旨在把任何指定比特率或压缩的文件大小的感觉到的失真降到最低程度。然而,比特率越低,或者向文件施加的压缩越多,编码器为满足这两个条件而遇到的挑战越多。通常,最坏可能信号(难以编码的信号)的(编码)性能最终定义任一编码系统的整体性能。在定义任一编码系统的整体性能时的另一个因素是对该信号进行编码所需的编码速度和资源。目前存在许多编码技术和编码器,然而,现有编码技术和编码器的一个问题是它们较慢。现有技术经常遇到的另一个问题是它们需要非常多的例如存储器的资源。尽管在研究条件下这并不是问题,但是对于商业用途特别是对于移动用途来说,编码速度和资源需求可能成为重要考虑。高级音频编码(AAC)是可能用来生成高质量音频文件的一个音频编码系统的示例。作为MP3的后继者的AAC是可以用来生成高质量音频文件的宽带音频编码算法。AAC采用两种编码策略来降低运送高质量数字音频所需的数据量。去除不能感觉到的信号分量,并且消除经过编码的信号中的冗余。AAC通常支持两个频率分辨率,128点和1024点改进的离散余弦变换(MDCT)。前者可以用于瞬态信号段的有效处理,当存在(准)固定信号段时可以使用后者,以实现高能压缩。AAC提供大批可以用于在各种编码条件下尝试使主观音频质量最大化的编码工具。AAC通过使用可以定义对信号进行编码所用的工具子集的配置文件起作用。可以使用一个这样的配置文件(AAC长期预测(LTP))来构建音调信号段的模型,并且这样的配置文件可以提供在对最坏可能信号段编码时的显著质量改善。然而,与其它现有编码技术类似,AACLTP编码器可能会遭受非常慢的编码速度。一个原因是执行了需要大量计算的LTP延迟信息估计。可以对AAC LTP编码器进行配置,从而通过重复过去重构的信号段LTP构建长期相关的模型。用于LTP的一个样本转移函数可以是B(z)=bLTP·z-M(1)其中bLTP是LTP预测器系数,而M是预测器时延,通常称为基音延迟(pitch lag)。通过计算均方误差函数的最小值,可以确定预测器参数(LTP系数和延迟)。定义均方误差函数的一种方式可以是E=Σi=0N-1[x(i)-bLTP·x~(i-M)]2---(2)]]>其中N是帧长(在时域中),x是输入信号段,而 是过去重构的信号。可以按以下方式计算优选的最佳LTP预测器系数bLTP=r/a(3) 其中a=Σi=0N-1x~(i+M)·x~(i+M)---(4)]]>r=Σi=0N-1x(i)·x~(i-M)]]>通过按以下方式在指定延迟范围上计算x和 之间的归一化的互相关的最大值,可以确定LTP延迟M=max{C(τ)},o≤τ<N-1(5)C(τ)={Σi=0N-1x(i)·x~(i-τ)Σi=0N-1x~(i-τ)2}]]>在确定LTP延迟以后,可以使用样本转移函数来计算预测的时域信号。接着,可以把预测的时域信号转换到频域表示,以便进行残留信号计算。在AAC中,这样的时域频域(t/f)转换通常是1024点改进的离散余弦变换(MDCT)。为了使预测增益达到最大值,可以以频带为基础获得差分信号。如果该频带内存在可预测的分量,则可以使用该差分信号;否则使该频带保持不变。可以用一组标记来实现该控制,其中这组标记是在比特流中与其它预测器参数一起传送的。如上所述,诸如上面描述的编码方法往往是较慢的或者需要不切实际的资源数量。在某些应用中,例如在编码速度和资源要求可能是特别重要的问题的移动通信设备中,这可能尤其突出。同样地,需要在仍然保持高质量音频信号的同时能够减少编码时间和资源的对音频信号进行编码的改进的系统、方法、设备和计算机代码产品。
技术实现思路
本专利技术的实施例涉及用于确定AAC LTP编码系统内的信息的当前帧的基音延迟的方法、计算机代码产品、设备、模块、系统和编码器。可以配置各实施例,以便在前一个帧延迟附近选择当前帧内的一个延迟搜索窗口,以及计算该当前帧的该延迟搜索窗口内的基音延迟估计。也可以配置本专利技术的各实施例,以便确定该基音延迟估计是否是不可靠的,如果确定该基音延迟估计是不可靠的,则选择一个新延迟搜索窗口,并且在该新延迟搜索窗口中计算新基音延迟估计。选择新延迟搜索包括,设置与从该当前帧的开始到该搜索窗口的下边界的区域相对应的下部搜索窗口,设置与从该搜索窗口的上边界到该当前帧的结束的区域相对应的上部搜索窗口,计算该下部搜索窗口中的下部基音延迟和该上部窗口中的上部基音延迟,选择与下部基音延迟或上部基音延迟中产生最大互相关的那个相对应的新搜索窗口定位器,在该新搜索窗口定位器周围设置一个新搜索窗口,计算该新搜索窗口的新基音延迟,以及选择该基音延迟或该新基音延迟中产生该最大互相关的那个作为延迟估计器。确定该基音延迟是否可靠包括,比较与基音延迟关联的互相关和自适应阈值。另外,可以配置本专利技术的各实施例,以便确定使用用于该基音延迟的预测能否实现编码增益,若不然,则执行上述时间频率转换。如果确定使用用于该基音延迟的预测能够实现编码增益,则可以执行时间频率转换,可以在频域中评估预测,并且可以确定是否更新该自适应阈值。以下将在详细的说明书中参照附图更详细地论述本专利技术的实施例的这些以及其它特征、方面和优点。附图说明图1是根据本专利技术的系统的一个实施例的框图;图2是根据本专利技术的编码器的一个实施例的框图;图3是根据本专利技术的方法的一个实施例的流程图;图4是图3的流程图的继续;以及图5是根据本专利技术的设备的一个实施例的框图。具体实施例方式参照图1,该图表示音频编码系统10的一个实施例。音频编码系统10包括配置用来对音频信号14进行编码的编码器12。在编码之后,编码器12可以在传输线16上传送经过编码的信号或者发送将要保存为文件的经过编码的信号。也可以包括解码器18,用于接收或加载经过编码的信号,并且对经过编码的信号进行解码,以获得音频信号的再现(解码)版本20。在系统10的各种实施例中,可以把编码器12和/或解码器18包含在无线或有线通信系统中,或者在二者的某些组合中。在诸如具有处理音频信号或数字广播能力的移动电话的移动设备中,以及在诸如个人计本文档来自技高网
...

【技术保护点】
一种用于确定LTP编码系统内的信息的当前帧的基音延迟的方法,该方法包括:在计算前一个帧延迟的窗口的附近,选择该当前帧内的延迟搜索窗口,该延迟搜索窗口具有一个上边界和一个下边界;以及计算该当前帧的该延迟搜索窗口内的基音延迟估计。

【技术特征摘要】
【国外来华专利技术】US 2004-12-27 11/022,6101.一种用于确定LTP编码系统内的信息的当前帧的基音延迟的方法,该方法包括在计算前一个帧延迟的窗口的附近,选择该当前帧内的延迟搜索窗口,该延迟搜索窗口具有一个上边界和一个下边界;以及计算该当前帧的该延迟搜索窗口内的基音延迟估计。2.根据权利要求1所述的方法,还包括确定该基音延迟估计是否是不可靠的;以及如果确定该基音延迟估计是不可靠的;选择一个新延迟搜索窗口并且在该新延迟搜索窗口中计算新基音延迟估计。3.根据权利要求2所述的方法,其中选择新延迟搜索还包括设置与从该当前帧的开始到该下边界的区域相对应的下部搜索窗口;设置与从该上边界到该当前帧的结束的区域相对应的上部搜索窗口;计算该下部搜索窗口中的下部基音延迟和该上部窗口中的上部基音延迟;选择与该下部基音延迟或上部基音延迟中产生最大互相关的那个相对应的新搜索窗口定位器;在该新搜索窗口定位器周围设置一个新搜索窗口;计算该新搜索窗口的新基音延迟;以及选择该基音延迟或该新基音延迟中产生最大互相关的那个作为延迟估计器。4.根据权利要求2所述的方法,其中确定该基音延迟是否可靠还包括,比较与基音延迟关联的互相关和自适应阈值。5.根据权利要求1所述的方法,还包括确定使用用于该基音延迟的预测能否实现编码增益,并且若不然,则执行时间频率转换。6.根据权利要求4所述的方法,还包括确定使用用于该基音延迟的预测能否实现编码增益,并且假如是这样的话,则执行时间频率转换,在频域中评估预测,以及确定是否更新该自适应阈值。7.一种用于确定LTP编码系统内的信息的当前帧的基音延迟的计算机代码产品,该计算机代码产品包括计算机代码,该计算机代码被配置为用于在计算前一个帧延迟的窗口的附近,选择该当前帧内的延迟搜索窗口,该延迟搜索窗口具有一个上边界和一个下边界;以及计算该当前帧的该延迟搜索窗口内的基音延迟估计。8.根据权利要求7所述的计算机代码产品,还包括计算机代码,该计算机代码被配置为用于确定该基音延迟估计是否是不可靠的;以及如果确定该基音延迟估计是不可靠的;选择一个新延迟搜索窗口并且在该新延迟搜索窗口中计算新基音延迟估计。9.根据权利要求8所述的计算机代码产品,其中选择新延迟搜索还包括设置与从该当前帧的开始到该下边界的区域相对应的下部搜索窗口;设置与从该上边界到该当前帧的结束的区域相对应的上部搜索窗口;计算该下部搜索窗口中的下部基音延迟和该上部窗口中的上部基音延迟;选择与该下部基音延迟或上部基音延迟中产生最大互相关的那个相对应的新搜索窗口定位器;在该新搜索窗口定位器周围设置一个新搜索窗口;计算该新搜索窗口的新基音延迟;以及选择该基音延迟或该新基音延迟中产生最大互相关的那个作为延迟估计器。10.根据权利要求8所述的计算机代码产品,其中确定该基音延迟是否可靠还包括,比较与基音延迟关联的互相关和自适应阈值。11.根据权利要求7所述的计算机代码产品,还包括计算机代码,配置为用于确定使用用于该基音延迟的预测能否实现编码增益,并且若不然,则执行时间频率转换。12.根据权利要求10所述的计算机代码产品,还包括计算机代码,配置为用于确定使用用于该基音延迟的预测能否实现编码增益,并且假如是这样的话,则执行时间频率转换,在频域中评估预测,以及确定是否更新该自适应阈值。13.一种用于确定LTP编码系统内的信息的当前帧的基音延迟的设备,该设备包括处理器;存储器;以及编码器,该编码器被配置为用于在计算前一个帧延迟的窗口的附近,选择该当前帧内的延迟搜索窗口,该延迟搜索窗口具有一个上边界和一个下边界;以及计算该当前帧的该延迟搜索窗口内的基音延迟估计。14.根据权利要求13所述的设备,其中该编码器还被配置为用于确定该基音延迟估计是否是不可靠的;以及如果确定该基音延迟估计是不可靠的;选择一个新延迟搜索窗口并且在该新延迟搜索窗口中计算新基音延迟估计。15.根据权利要求14所述的设备,其中选择新延迟搜索还包括设置与从该当前帧的开始到该下边界的区域相对应的下部搜索窗口;设置与从该上边界到该当前帧的结束的区域相对应的上部搜索窗口;计算该下部搜索窗口中的下部基音延迟和该上部窗口中的上部基音延迟;选择与该下部基音延...

【专利技术属性】
技术研发人员:J奥让珀拉
申请(专利权)人:诺基亚公司
类型:发明
国别省市:FI[芬兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1