本发明专利技术的编码装置包括:第一编码单元,对作为语音信号和/或音乐信号的输入信号中,作为低频带的低频部分进行编码,生成第一编码数据;振幅归一化单元,将解码第一编码数据所得到的第一频谱划分为多个子带,并在多个子带中以各子带内的振幅的最大值分别进行归一化,从而生成低频部分的归一化频谱;频带搜索单元,搜索在输入信号的高于低频的高频带的扩展频带的频谱即第二频谱与低频部分的归一化频谱之间相关值最大的特定的频带,频带搜索单元将以低频部分的归一化频谱的振幅值为非零的位置为起点的频带作为多个候选,从多个候选中搜索相关值最大的特定的频带。
【技术实现步骤摘要】
编码装置和编码方法本申请是国际申请日为2012年8月24日、申请号为201280036790.8、专利技术名称为“编码装置、解码装置、编码方法和解码方法”的专利技术专利申请的分案申请。
本专利技术涉及编码装置、解码装置、编码方法和解码方法。
技术介绍
专利文献1中,公开了能够对超宽带(Super-Wide-band:SWB。一般为0.05~14kHz频带)的语音信号或音乐信号高效率地进行编码的技术,该技术在ITU-T中已标准化(例如,非专利文献1和2)。该技术中,语音信号或音乐信号等输入信号的低频部分(例如,7kHz以下的频带)由核心编码单元进行编码,高频部分(例如,高于7kHz的频带)由扩展频带编码单元进行编码。另外,一般而言,核心编码单元使用CELP(CodeExcitedLinearPrediction:码激励线性预测)编码。另一方面,扩展频带编码单元使用由核心编码单元进行了编码的信息在频域中进行编码。具体而言,扩展频带编码单元对由核心编码单元进行了编码的低频部分(7kHz以下)的窄频带信号进行解码,将变换为MDCT(ModifiedDiscreteCosineTransform:改进的离散余弦变换)系数(频谱)得到的频谱(低频解码频谱)用于高频部分(频率高于7kHz的频带。以下称为“扩展频带”)的编码。在扩展频带中进行编码时,首先,对于由核心编码单元生成的低频解码频谱,用频谱功率的包络(或包络线(envelope)。以下称为包络线)进行归一化。具体而言,将包含低频解码谱的低频部分划分为多个子带,对每个子带计算能量(子带能量)。接着,进行子带能量的平滑化,以使频域中的能量变动平滑。接着,使用平滑化后的子带能量,进行各子带中包含的频谱的归一化。扩展频带编码单元在如上得到的频谱(归一化频谱)与输入信号的扩展频带频谱之间搜索相关性高的频带,将表示相关性高的频带的信息作为滞后(lag)进行编码。另外,扩展频带编码单元将相关性高的低频频带复制(copy)到扩展频带,以将相关性高的低频频带用作扩展频带的频谱精细结构(频率精细结构)。然后,扩展频带编码单元在频谱精细结构与扩展频带频谱之间计算增益,并对增益进行编码。通过进行以上处理,从低频的频谱生成扩展频带的频谱。此外,在输入信号中从低频频谱生成扩展频带频谱时对低频频谱进行归一化的理由如下。一般而言,在低频频谱中能量的偏颇非常大,在高频的扩展频带频谱中能量的偏颇小。即,高频部分中,与低频部分相比,局部性地出现大峰值的情况较少,因而若将高峰性高的信号复制到高频部分(扩展频带),则有可能导致音质劣化。因此,在编码装置中对低频频谱进行归一化是因为,在消除低频频谱的能量偏颇来进行平坦化(归一化)之后计算与扩展频带频谱之间的相关性,则能够更高效率地进行编码。另一方面,非专利文献3中公开了在核心编码单元中使用变换编码的现有技术。在该现有技术中,将MPEG(MovingPictureExpertsGroup,动态图像专家组)AAC(高级音频编码)方式用于核心编码单元。另外,使用与上述说明的扩展频带的编码方式不同的SBR(SpectralBandReplication,频带复制)方式进行扩展频带的编码。现有技术文献专利文献[专利文献1]日本特表2009-515212号公报非专利文献[非专利文献1]ITU-TStandardG.718AnnexB,2008[非专利文献2]ITU-TStandardG.729AnnexE,2008[非专利文献3]MartinDietz,LarsLiljeryd,KristoferOliverKunz,”SpectralBandReplication,anovelapproachinaudiocoding”,Preprint5553,112thAESConvention,Munich,2002
技术实现思路
专利技术要解决的问题在非专利文献1和2中,核心编码单元中使用CELP编码。CELP编码有能够对于语音信号非常高效率地进行编码,且编码性能良好的优点,但有对于音乐信号编码性能不足的缺点。但是,在用于对采样率为32kHz的SWB的信号(SWB信号)进行编码时,需要提高音乐信号的编码性能。在此情况下,可以考虑在核心编码单元中使用变换编码来代替CELP编码。一般而言,变换编码使用限定了数量的脉冲对频谱进行编码,因而低频频谱由离散的脉冲串表现。在对于这种以离散的脉冲串表现的频谱,如非专利文献1和2所述,划分成子带来计算子带能量,进行平滑化并估计包络线的情况下,用于正确地计算子带能量的频谱就不足了。因此,在编码装置中,有可能估计出偏离本来的包络线(即输入信号的包络线)的形状的包络线。即使编码装置用这样求得的不正确的包络线进行低频频谱的归一化,有时归一化频谱也得不到平坦化,会存在振幅极大的频谱。观察语音信号或音乐信号的频谱,在高频部分中,与低频部分相比,基本上不会局部地出现大的峰值。因此,若将高峰性高的状态的低频部分复制到高频部分,则高频部分产生高峰性过大的频谱,导致音质劣化。这样,在低频频谱的特性不平坦的情况下,对使用低频频谱生成的扩展频带的音质造成不良影响。本专利技术的目的在于,提供通过将使峰值性为足够低的状态的低频部分复制到高频部分(扩展频带),能够防止在高频部分中产生高峰性过大的频谱,生成高质量的扩展频带频谱的编码装置、解码装置、编码方法和解码方法。解决问题的方案本专利技术的一个方案的编码装置包括:第一编码单元,对作为语音信号和/或音乐信号的输入信号中,作为低频带的低频部分进行编码,生成第一编码数据;振幅归一化单元,将解码所述第一编码数据所得到的第一频谱划分为多个子带,并在所述多个子带中以各子带内的振幅的最大值分别进行归一化,从而生成所述低频部分的归一化频谱;频带搜索单元,搜索在所述输入信号的高于所述低频的高频带的扩展频带的频谱即第二频谱与所述低频部分的归一化频谱之间相关值最大的特定的频带,所述频带搜索单元将以所述低频部分的归一化频谱的振幅值为非零的位置为起点的频带作为多个候选,从所述多个候选中搜索所述相关值最大的特定的频带。本专利技术的一个方案的编码方法包括以下步骤:对作为语音信号和/或音乐信号的输入信号中,作为低频带的低频部分进行编码,生成第一编码数据的步骤;将解码所述第一编码数据所得到的第一频谱划分为多个子带,并在所述多个子带中以各子带内的振幅的最大值分别进行归一化,从而生成所述低频部分的归一化频谱的步骤;搜索在所述输入信号的高于所述低频的高频带的扩展频带的频谱即第二频谱与所述低频部分的归一化频谱之间相关值最大的特定的频带的步骤,在所述特定的频带的搜索中,将以所述低频部分的归一化频谱的振幅值为非零的位置为起点的频带作为多个候选,从所述多个候选中搜索所述相关值最大的特定的频带。本专利技术的一个方案的编码装置在对输入信号的扩展频带、即高频部分的频谱进行编码时,将低频部分复制到高频部分,由此生成扩展频带频谱,该编码装置包括:第一编码单元,对作为语音信号或音乐信号的输入信号的规定频率以下的低频部分进行编码,生成第一编码数据;振幅归一化单元,对于划分所述低频部分所得到的多个子带的每一个子带,以各个子带的振幅的最大值分别对解码所述第一编码数据所得到的第一频谱进行归一化,从而得到本文档来自技高网...
【技术保护点】
编码装置,包括:第一编码单元,对作为语音信号和/或音乐信号的输入信号中,作为低频带的低频部分进行编码,生成第一编码数据;振幅归一化单元,将解码所述第一编码数据所得到的第一频谱划分为多个子带,并在所述多个子带中以各子带内的振幅的最大值分别进行归一化,从而生成所述低频部分的归一化频谱;频带搜索单元,搜索在所述输入信号的高于所述低频的高频带的扩展频带的频谱即第二频谱与所述低频部分的归一化频谱之间相关值最大的特定的频带,所述频带搜索单元将以所述低频部分的归一化频谱的振幅值为非零的位置为起点的频带作为多个候选,从所述多个候选中搜索所述相关值最大的特定的频带。
【技术特征摘要】
2011.09.09 JP 2011-197295;2011.12.21 JP 2011-279621.编码装置,包括:第一编码单元,对作为语音信号和/或音乐信号的输入信号中,作为低频带的低频部分进行编码,生成第一编码数据;振幅归一化单元,将解码所述第一编码数据所得到的第一频谱划分为多个子带,并在所述多个子带中以各子带内的振幅的最大值分别进行归一化,从而生成所述低频部分的归一化频谱;频带搜索单元,搜索在所述输入信号的高于所述低频的高频带的扩展频带的频谱即第二频谱与所述低频部分的归一化频谱之间相关值最大的特定的频带,所述频带搜索单元将以所述低频部分的归一化频谱的振幅值为非零的位置为起点的频带作为多个候选,从所述多个候选中搜索所述相关值最大的特定的频带。2.如权利要求1所述的编码装置,表示所述特定的...
【专利技术属性】
技术研发人员:河岛拓也,大毛胜统,押切正浩,
申请(专利权)人:松下电器美国知识产权公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。