当前位置: 首页 > 专利查询>索尼公司专利>正文

编码设备和编码方法技术

技术编号:10346314 阅读:186 留言:0更新日期:2014-08-22 11:23
本发明专利技术公开了一种编码设备和编码方法。该编码设备包括:子带划分装置,配置成将输入信号划分成多个子带,并生成低频子带信号和高频子带信号;特征量计算装置,配置成使用输入信号和低频子带信号中的至少一个来计算特征量;伪高频子带功率计算装置,配置成基于特征量来计算伪高频子带功率;伪高频子带功率差异计算装置,配置成根据高频子带信号来计算高频子带功率,并计算伪高频子带功率差异;高频编码装置,配置成对伪高频子带功率差异进行编码,以生成高频编码数据;低频编码装置,配置成对低频信号进行编码,以生成低频编码数据;以及多路复用装置,配置成对低频编码数据和高频编码数据进行多路复用,以获得输出代码串。

【技术实现步骤摘要】
编码设备和编码方法本申请为2010年9月29日提交的国际申请号为PCT/JP2010/066882、专利技术名称为“频带扩展设备和方法、编码设备和方法、解码设备和方法、以及程序”的PCT申请的分案申请,该PCT申请进入中国国家阶段日期为2012年4月6日,国家申请号为201080045206.6。
本专利技术涉及频带扩展设备和方法、编码设备和方法、解码设备和方法、以及程序,具体地涉及其中由于频带的扩展而使得音乐信号能够以较高的音质进行播放的频带扩展设备和方法、编码设备和方法、解码设备和方法、以及程序。
技术介绍
近年来,通过网络等来分发音乐数据的音乐分发服务越来越被广泛地使用。对于这样的音乐分发服务,通过编码音乐信号而获得的编码数据被作为音乐数据分发。作为音乐信号的编码方法,抑制编码数据的文件容量并降低比特率以便于减小降低在下载事件中花费的时间量的编码方法已成为主流。这样的音乐信号编码方法大体上分为:例如MP3(MPEG(运动图像专家组)音频层3)(国际标准ISO/IEC11172-3)等的编码方法;以及例如HE-AAC(高效MPEG4AAC)(国际标准ISO/IEC14496-3)等的编码方法。在由MP3代表的编码方法中,删除了很难被人耳检测到的、大约15kHz或更高的高频带(下文称为“高频”)的音乐信号分量,并对剩余的低频带(下文称为“低频”)的信号分量进行编码。这种编码方法在下文中将被称为高频删除编码方法。关于该高频删除编码方法,可以抑制编码数据的文件容量。然而,高频声音可以尽管极细微地被人检测到,所以如果根据通过解码所述编码数据获得的解码后的音乐信号来生成并输出声音,会发生音质的劣化,例如丢失原始声音所具有的真实感或声音变得低沉。相反地,在由HE-AAC代表的编码方法中,从高频信号分量中提取特征信息,并且该特征信息与低频信号分量一起编码。这种编码方法将在下文中称为高频特征编码方法。在高频特征编码方法中,只有高频信号分量的特征信息被编码为与高频信号分量相关的信息,由此可以在抑制音质的劣化的同时提高编码效率。在解码已使用高频特征编码方法进行编码的编码数据中,低频信号分量和特征信息被解码,并且根据解码之后的低频信号分量和特征信息来生成高频信号分量。从而,通过根据低频信号分量生成高频信号分量,这种扩展低频信号分量的频带的技术在下文将被称为频带扩展技术。作为频带扩展技术的应用示例,会存在在对使用上述高频删除编码方法的编码数据进行解码之后的后处理。在该后处理中,通过从解码之后的低频信号分量中生成在编码中丢失的高频信号分量来对低频信号分量的频带进行扩展(参见PTL1)。注意,在PTL1中的用于频带扩展的方法在下文中将被称为PTL1带扩展方法。关于PTL1带扩展方法,设备根据输入信号的功率谱来估计高频功率谱(下文在适用的情况下称为高频包络),其中使用解码之后的低频信号分量作为输入信号,并根据所述低频信号分量生成具有所述高频的频率包络的高频信号分量。图1示出了作为输入信号的解码后的低频功率谱以及估计的高频包络的示例。在图1中,竖轴表示对数方式的功率,而横轴表示频率。设备根据与输入信号相关的编码格式的类型以及例如为采样率、比特率等的信息(下文称为“边信息”)来确定高频信号分量的低频端的频段(下文称为“扩展起始频段”)。接着,设备将作为低频信号分量的输入信号划分成多个子带信号。设备求出划分之后的多个子带信号,即,从扩展起始频段开始的、在低频率侧(下文简称为“低频侧”)上的多个子带信号的每一个子带信号的功率的时间方向的每个组的平均值(下文称为“组功率”)。如图1所示,设备使用在低频侧的多个子带信号的各个组功率的平均值来作为功率,并使用扩展起始频段的下边缘上的频率处的点来作为起点。设备估计以预定的斜率通过起点的线性线来作为从扩展起始频段开始的在高频率侧(下文称为高频侧)的频率包络。注意,用于起点的功率方向的位置可以由用户来调节。设备根据在低频侧的多个子带信号生成在高频侧的多个子带信号的每一个,以如所估计的那样变成在高频侧的频率包络。设备将添加在高频侧的多个生成的子带信号,以作为高频信号分量,并且进一步地添加低频信号分量并进行输出。从而,在频带扩展之后的音乐信号变得更接近原始音乐信号。因此,可以播放具有较高音质的音乐信号。以上描述的PTL1频段扩展方法具有如下优点:能够在解码音乐信号的编码数据之后扩展音乐信号的频带,其中这样的编码数据具有各种高频删除编码方法和各种比特率。引用列表专利文献PTL1:日本未审查专利申请公报No.2008-139844
技术实现思路
技术问题然而,PTL1频段扩展方法可以对于如下点进行改进:估计的高频侧频率包络是具有预定斜率的线性线,即,对于频率包络的形状是固定的这点。也就是说,音乐信号的功率谱具有各种形状,并且取决于音乐信号的类型不少情况将会从使用PTL1频段扩展方法估计的高频侧频率包络发生较大的变化。图2示出了攻击型的音乐信号(攻击型音乐信号)的原始功率谱的示例,其伴随有时间上的突变,例如当大声击鼓一次时。注意,图2还一起示出了作为输入信号的攻击性音乐信号的低频侧信号分量以及按照PTL1频段扩展方法根据该输入信号估计的高频侧频率包络。如图2中所示,攻击型音乐信号的原始高频侧功率谱近似平坦。相反地,估计的高频侧频率包络具有预定的负斜率,即使在起点处将它调整到更接近原始功率谱的功率,与原始功率谱的差异也会随着频率的增加而增加。从而,对于PTL1频段扩展方法,估计的高频侧频率包络不能够以高的精确度实现原始高频侧频率包络。因此,如果声音从频带扩展之后的音乐信号中生成并输出,则从听的角度来看,与原始声音相比,将会丢失声音的清晰度。另外,对于例如上述HE-ACC等的高频特征编码方法,高频侧频率包络被用作为待编码的高频信号分量的特征信息,但是,需要解码侧以高度精确的方式来再生原始高频侧频率包络。本专利技术已将这样的情况纳入考虑,并使得音乐信号能够由于频带的扩展而以高音质播放。问题的解决方案根据本专利技术的第一方面的频带扩展设备,包括:信号划分装置,所述信号划分装置被配置成将输入信号划分成多个子带信号;特征量计算装置,所述特征量计算装置被配置成使用所述输入信号和由所述信号划分装置所划分的多个子带信号中的至少一个来计算表示所述输入信号的特征的特征量;高频子带功率估计装置,所述高频子带功率估计装置被配置成基于由所述特征量计算装置所计算的特征量来计算高频子带功率的估计值,所述高频子带功率是具有高于所述输入信号的频带的频带的子带信号的功率;以及高频信号分量生成装置,所述高频信号分量生成装置被配置成基于由所述信号划分装置所划分的多个子带信号和由所述高频子带功率估计装置所计算的高频子带功率的估计值来生成高频信号分量;从而使用由所述高频信号分量生成装置所生成的高频信号分量来扩展所述输入信号的频带。特征量计算装置可以计算作为所述多个子带信号的功率的低频子带功率,以作为特征量。特征量计算装置可以计算作为所述多个子带信号的功率的低频子带功率的时间变化,以作为特征量。特征量计算装置可以计算所述输入信号在预定频带中的最大功率与最小功率之间的差异,以作为特征量。特征量计算装置可以计算所述输入信号在预定频带中的功率的最大值与最小值之间的差本文档来自技高网
...
编码设备和编码方法

【技术保护点】
一种编码设备,包括:子带划分装置,所述子带划分装置被配置成将输入信号划分成多个子带,并生成由在低频侧的多个子带组成的低频子带信号和由在高频侧的多个子带组成的高频子带信号;特征量计算装置,所述特征量计算装置被配置成使用所述输入信号和由所述子带划分装置生成的所述低频子带信号中的至少一个来计算表示所述输入信号的特征的特征量;伪高频子带功率计算装置,所述伪高频子带功率计算装置被配置成基于由所述特征量计算装置所计算的所述特征量来计算作为所述高频子带信号的伪功率的伪高频子带功率;伪高频子带功率差异计算装置,所述伪高频子带功率差异计算装置被配置成根据由所述子带划分装置所生成的所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并计算伪高频子带功率差异,所述伪高频子带功率差异是相对于由所述伪高频子带功率计算装置所计算的所述伪高频子带功率的差异;高频编码装置,所述高频编码装置被配置成对由所述伪高频子带功率差异计算装置所计算的所述伪高频子带功率差异进行编码,以生成高频编码数据;低频编码装置,所述低频编码装置被配置成对作为所述输入信号的低频信号的低频信号进行编码,以生成低频编码数据;以及多路复用装置,所述多路复用装置被配置成对由所述低频编码装置生成的所述低频编码数据和由所述高频编码装置生成的所述高频编码数据进行多路复用,以获得输出代码串。...

【技术特征摘要】
2009.10.07 JP 2009-233814;2010.04.13 JP 2010-092681.一种编码设备,包括:子带划分装置,所述子带划分装置被配置成将输入信号划分成多个子带,并生成由在低频侧的多个子带组成的低频子带信号和由在高频侧的多个子带组成的高频子带信号;特征量计算装置,所述特征量计算装置被配置成使用所述输入信号和由所述子带划分装置生成的所述低频子带信号中的至少一个来计算表示所述输入信号的特征的特征量;伪高频子带功率计算装置,所述伪高频子带功率计算装置被配置成基于由所述特征量计算装置所计算的所述特征量来计算作为所述高频子带信号的伪功率的伪高频子带功率;伪高频子带功率差异计算装置,所述伪高频子带功率差异计算装置被配置成根据由所述子带划分装置所生成的所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并计算伪高频子带功率差异,所述伪高频子带功率差异是相对于由所述伪高频子带功率计算装置所计算的所述伪高频子带功率的差异;高频编码装置,所述高频编码装置被配置成对由所述伪高频子带功率差异计算装置所计算的所述伪高频子带功率差异进行编码,以生成高频编码数据;低频编码装置,所述低频编码装置被配置成对作为所述输入信号的低频信号的低频信号进行编码,以生成低频编码数据;以及多路复用装置,所述多路复用装置被配置成对由所述低频编码装置生成的所述低频编码数据和由所述高频编码装置生成的所述高频编码数据进行多路复用,以获得输出代码串;其中,所述伪高频子带功率差异计算装置基于每个子带的所述伪高频子带功率和所述高频子带功率来针对用于计算所述伪高频子带功率的多个系数中的每一个计算评价值;并且其中,所述高频编码装置生成指示作为最高评价值的所述评价值的系数的索引,以作为所述高频编码数据。2.根据权利要求1所述的编码设备,还包括:低频解码装置,所述低频解码装置被配置成对由所述低频编码装置生成的所述低频编码数据进行解码,以生成低频信号;其中,所述子带划分装置根据由所述低频解码装置生成的所述低频信号来生成所述低频子带信号。3.根据权利要求1所述的编码设备,其中,所述高频编码装置计算在所述伪高频子带功率差异与在预定的多个伪高频子带功率差异空间中的代表向量或代表值之间的相似度,以生成与其相似度是最大值的代表向量或代表值对应的索引,以作为所述高频编码数据。4.根据权利要求1所述的编码设备,其中,所述伪高频子带功率差异计算装置基于每个子带的所述...

【专利技术属性】
技术研发人员:山本优树知念彻本间弘幸光藤祐基
申请(专利权)人:索尼公司
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1