本发明专利技术提供一种处理音频信号的方法和设备,所述方法包括步骤:接收对应于多个谱系数的输入音频信号;基于所述输入信号的能量来获得位置信息,所述位置信息指示所述谱系数中的特定谱系数的位置;利用所述位置信息以及所述谱系数产生形状矢量;通过搜索对应于所述形状矢量的码本来确定码本索引;以及传输所述码本索引和所述位置信息,其中通过利用从所述谱系数选择的部分来产生所述形状矢量,以及基于所述位置信息来选择所述选择的部分。
【技术实现步骤摘要】
【专利摘要】本专利技术提供一种处理音频信号的方法和设备,所述方法包括步骤:接收对应于多个谱系数的输入音频信号;基于所述输入信号的能量来获得位置信息,所述位置信息指示所述谱系数中的特定谱系数的位置;利用所述位置信息以及所述谱系数产生形状矢量;通过搜索对应于所述形状矢量的码本来确定码本索引;以及传输所述码本索引和所述位置信息,其中通过利用从所述谱系数选择的部分来产生所述形状矢量,以及基于所述位置信息来选择所述选择的部分。【专利说明】处理音频信号的方法和设备 本申请是2013年2月25日提交的国际申请日为2011年8月23日的申请号为 201180041093. 7 (PCT/KR2011/006222)的,专利技术名称为"处理音频信号的方法和设备"的专 利申请的分案申请。
本专利技术涉及用于处理音频信号的设备及其方法。虽然本专利技术适合于广范围的应 用,但是它特别适合于对音频信号编码或解码。
技术介绍
压缩编码是指一系列的通过通信线路传送数字信息,或在适合于存储介质的形式 存储数字化信息的信号处理技术。在一般情况下,视频,音频和文本进行压缩编码。特别是, 对于音频进行压缩编码的技术被称为音频压缩。 音频压缩技术可包括对音频信号进行频率变换(例如,MDCT(修正离散余弦变 换))的方法。在这样做时,将作为MDCT的结果的MDCT系数传输给解码器。如果这样的话, 解码器通过利用MDCT系数进行频率逆变换(例如,iMDCT (逆MDCT)),来重建音频信号。 然而,近来,随着各种各样的媒体和数据传输媒体的发展,人们需要一种用于有效 地处理视频信号的方法和装置。
技术实现思路
技术问题 但是,在传输MDCT系数的过程中,如果传输全部数据,则可能引起降低比特率效 率的问题。如果传输诸如脉冲等等的数据,则可能引起降低重建速率的问题。 技术方案 因此,本专利技术旨在基本上避免由于现有技术的限制和缺点所致的一个或多个问 题。本专利技术的目的是提供一种处理音频信号的设备及其方法,通过其基于能量产生的形状 矢量(shape vector)可用于传输谱系数(例如,MDCT系数)。 本专利技术的另一目的是提供一种处理音频信号的设备及其方法,通过其形状矢量被 归一化(normalize)然后被传输,以在传输形状矢量时缩小动态范围。 本专利技术的另一目的是提供一种处理音频信号的设备及其方法,通过其在传输每步 骤产生的多个归一化值时,对除了值的平均值之外的其余值进行矢量量化。 有益效果 因此,本专利技术提供以下效果和/或特点。 首先,在传输谱系数时,当传输基于能量产生的形状矢量时,能够以较少的比特数 提高重建速度。 第二,因为将形状矢量归一化然后传输,所以本专利技术缩小了动态范围,从而提高了 比特效率。 第三,本专利技术通过在多级中重复形状矢量产生步骤来传输多个形状矢量,从而在 不显著提高比特率的情况下更准确地重建谱系数。 第四,在传输归一化值时,本专利技术单独地传输多个归一化值的平均值,并且只矢量 量化与差分矢量(differential vector)相对应的值,从而提高了比特效率。 第五,对归一化值差分矢量进行的矢量量化的结果几乎与SNR以及分配给差分矢 量的总比特数无关,但是与形状矢量的总比特数高度相关。因此,虽然将较少的比特数分配 给归一化值差分矢量,但是在不对重建速度造成显著麻烦方面是有利的。 【专利附图】【附图说明】 图1是根据本专利技术实施例的音频信号处理设备的方框图。 图2是描述用于产生形状矢量的处理的示意图。 图3是描述用于通过多级(m = 0,…)处理产生形状矢量的处理的示意图。 图4示出形状矢量的矢量量化所必需的码本的一个示例。 图5是形状矢量的总比特数与信噪比(SNR)之间的关系的示意图。 图6是归一化值差分码矢量的总比特数与信噪比(SNR)之间的关系的示意图。 图7是用于比特流中包括的元素的语法的一个示例的示意图。 图8是根据本专利技术一个实施例的音频信号处理设备中的解码器的构造的示意图。 图9是其中实现根据本专利技术一个实施例的音频信号处理设备的产品的示意性方 框图。 图10是说明其中实现根据本专利技术一个实施例的音频信号处理设备的产品之间的 关系的不意图。 图11是其中实现根据本专利技术一个实施例的音频信号处理设备的移动终端的示意 性方框图。 【具体实施方式】 为了实现这些和其他优点并根据本专利技术的目的,如同具体实施并宽泛描述的,根 据本专利技术一个实施例的处理音频信号的方法可包括步骤:接收对应于多个谱系数的输入音 频信号,基于输入信号的能量来获得位置信息,所述位置信息指示多个谱系数中的特定一 个的位置,利用所述位置信息以及所述谱系数来产生形状矢量,通过搜索对应于所述形状 矢量的码本来确定码本索引,以及传输所述码本索引和所述位置信息,其中利用从所述谱 系数选择的部分来产生所述形状矢量,并且其中基于所述位置信息来选择所选择的部分。 根据本专利技术,所述方法可进一步包括步骤:产生关于指定谱系数的符号信息以及 传输所述符号信息,其中进一步基于所述符号信息来产生所述形状矢量。 根据本专利技术,所述方法可进一步包括步骤:产生用于所选择的部分的归一化值。码 本索引确定步骤可包括步骤:通过利用归一化值将所述形状矢量归一化来产生归一化形状 矢量,以及通过搜索对应于所述归一化形状矢量的码本来确定所述码本索引。 根据本专利技术,所述方法可进一步包括步骤:计算第一级到第M级归一化值的平均 值,利用从所述第一级到第M级归一化值减去所述平均值所得到的值来产生差分矢量,通 过搜索对应于所述差分矢量的码本来确定所述归一化值索引,以及传输所述平均值以及对 应于所述归一化值的归一化索引。 根据本专利技术,输入音频信号可包括第(m+1)级输入信号,所述形状矢量可包括第 (m+1)级形状矢量,所述归一化值可包括第(m+1)级归一化值,并且基于第m级输入信号、第 m级形状矢量以及第m级归一化值可产生第(m+1)级输入信号。 根据本专利技术,码本索引确定步骤可包括步骤:利用包括加权因子和所述形状矢量 的成本函数来搜索所述码本,以及确定对应于所述形状矢量的码本索引,所述加权因子可 根据所选择的部分而变化。 根据本专利技术,所述方法可进一步包括步骤:利用所述输入音频信号以及对应于所 述码本索引的形状码矢量来产生残差信号,以及通过对所述残差信号进行频率包络编译来 产生包络参数索引。 为了进一步实现这些和其他优点并根据本专利技术的目的,根据本专利技术另一实施例用 于处理音频信号的设备可包括:位置检测单元,接收对应于多个谱系数的输入音频信号,所 述位置检测单元基于输入信号的能量来获得位置信息,所述位置信息指示多个谱系数中的 特定一个的位置;形状矢量产生单元,利用所述位置信息以及所述谱系数来产生形状矢量; 矢量量化单元,通过搜索对应于所述形状矢量的码本来确定码本索引;以及复用单元,传输 所述码本索引和所述位置信息,其中利用从所述谱系数选择的部分来产生所述形状矢量, 并且其中基于所述位置信息来选择所选择的部分。 根据本专利技术,所述位置检测单元可产生关于指定谱系数的符号信息,所本文档来自技高网...
【技术保护点】
一种解码音频信号的方法,包括:接收位置信息、符号信息、码本索引、归一化平均值、归一化值索引、包络参数索引以及平均能量;利用所述位置信息以及所述符号信息来获得对应于所述码本索引的形状码矢量;获得对应于所述归一化值索引的归一化值差分码矢量;通过将所述归一化平均值加到所述归一化值差分码矢量,来产生归一化值码矢量;以及利用所述形状码矢量以及所述归一化值码矢量重建第一合成信号。
【技术特征摘要】
...
【专利技术属性】
技术研发人员:李昌宪,丁奎赫,金洛榕,田惠晶,李炳锡,姜仁圭,
申请(专利权)人:LG电子株式会社,
类型:发明
国别省市:韩国;KR
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。