编码方法和解码方法技术

技术编号:10802489 阅读:144 留言:0更新日期:2014-12-24 09:58
本发明专利技术提供了编码方法和解码方法。该编码方法包括:根据不同于修正离散余弦变换(MDCT)编码方案的异质编码方案,来编码输入信号的语音特征信号;和根据该MDCT编码方案来编码所述输入信号的音频特征信号,其中所述编码语音特征信号的步骤包括:当在该输入信号中的语音特征信号和音频特征信号之间发生切换时,编码该语音特征信号中的额外信息。

【技术实现步骤摘要】
【专利摘要】本专利技术提供了。该编码方法包括:根据不同于修正离散余弦变换(MDCT)编码方案的异质编码方案,来编码输入信号的语音特征信号;和根据该MDCT编码方案来编码所述输入信号的音频特征信号,其中所述编码语音特征信号的步骤包括:当在该输入信号中的语音特征信号和音频特征信号之间发生切换时,编码该语音特征信号中的额外信息。【专利说明】 本专利申请是下列专利技术专利申请的分案申请: 申请号:200980145832. X 申请日:2009年9月18日 专利技术名称:在基于修正离散余弦变换的译码器与异质译码器间转换的编码设备和 解码设备
本专利技术涉及一种设备与方法,其用于在把基于修正离散余弦变换(MDCT)的音频 译码器和不同的语音/音频译码器相结合来编解码音频信号时,减少在执行不同类型译码 器转换时生成的扭曲(artifact)。
技术介绍
当根据输入信号的特征而对语音和音频相结合的输入信号应用不同的编码/解 码方法时,可改善性能和音质。例如,对具有语音信号相似特征的信号应用基于码激励线性 预测 CELP 的编码器(Code Excited Linear Prediction-based encoder),而对与音频信 号相同的信号应用基于变频的编码器(frequency conversion-based encoder),是有效率 的。 通过应用上面所述的概念,可开发统一语音和音频编码USAC (Unified Speech and Audio Coding)。该USAC可不断地接收输入信号并在特定时间分析输入信号。然后,USAC 可通过根据输入信号的特征进行切换来应用不同类型的编码设备,来编码输入信号。 USAC中的信号切换(signal switching)过程中,会生成信号扭曲(signal artifact)。由于USAC为每个区块编码输入信号,所以在应用不同类型的编码时会生成块 扭曲(blocking artifact)。为了克服这种缺点,USAC可在应用不同编码时对块应用窗口, 来执行重叠相加操作。但是,这种情况下,可能会因为重叠而需要额外的比特流信息,且当 频繁出现切换时,用于消除块扭曲的额外的比特流可能会增加。当比特流增加,编码效率会 降低。 特别是,USAC可采用基于修正离散余弦变换(MDCT)的编码设备来编码音频特征 信号。MDCT方式可将时域的输入信号变换为频域的输入信号,并在块间执行重叠相加操作。 MDCT方式具有即使执行重叠相加操作,比特率也可能不会增加的优点,但存在可能会在时 域中生成混叠的缺点。 在这种情况下,基于MDCT方式,50 %重叠相加操作会被对相邻块执行来还原输入 信号。也就是说,要被输出的当前块可基于前一个块的输出结果被解码。但是,当前一个块 没有使用MDCT方式的USAC被编码时,使用MDCT方式编码的当前块,可能无法通过重叠相 加操作解码,因为前一个块的MDCT信息可能无法使用。因此,在切换之后使用MDCT方式编 码当前块时,USAC可能会额外要求前一个块的MDCT信息。 当频繁发生切换时,用于解码的额外的MDCT信息比例可增加至切换量。在这种情 况下,比特率会由于额外的MDCT信息而增加,而编码效率可能会明显降低。因此,需要一种 方法,来在切换过程中去除块扭曲并尽可能减少额外的MDCT信息。
技术实现思路
本专利技术的一个方面,提供了一种编码方法及设备和解码方法及设备,其可去除块 信号扭曲并尽可能减少切换时所需的MDCT信息。 根据本专利技术的一个方面,提供了第一编码单元,其根据不同于基于MDCT的译 石马方式(Modified Discrete Cosine Transform-based coding scheme)的异质译石马方 式(hetero coding scheme)来编码输入信号的语音特征信号(speech characteristic signal);和第二编码单元,其根据基于MDCT的译码方式来编码输入信号的音频特征信号 (audio characteristic signal)。当所述输入信号的当前巾贞中存在在语音特征信号和音 频特征信号之间发生切换的折点(folding point)时,所述第二编码单元,可通过应用不超 过所述折点的分析窗口来执行编码。折点可以是当MDCT和反MDCTaMDCT :Inverse MDCT) 被执行时,混叠信号被折叠处的区域。当执行N点MDCT (N-point MDCT)时,折点可位于N/4 和3N/4点处。折点可以是与MDCT相关的众所周知的特征的任何一个,用于折点的数学基 础(mathematical basis)在此将不做说明。另外,MDCT和折点的概念的描述,将参照图5 详细说明。 此外,为方便说明,当前一个帧信号是语音特征信号而当前帧是音频特征信号时, 当连接两种不同类型特征的信号时使用的折点,以下可称为"发生切换处的折点"。同时,当 后一个帧信号是语音特征信号而当前帧信号是音频特征信号时,在连接两个不同类型特征 的信号时使用的折点,以下可称为"发生切换处的折点"。 根据本专利技术的一个方面,提供了一种编码设备,包括:窗口处理单元,其对输入信 号的当前帧应用分析窗口;MDCT变换单元,其针对应用了分析窗口的当前帧执行MDCT变 换;和比特流生成单元,其编码已进行了 MDCT变换的当前帧并生成输入信号的比特流。当 所述输入信号的当前帧中存在在语音特征信号和音频特征信号之间发生切换的折点时,所 述窗口处理单元应用不超过折点的分析窗口。 根据本专利技术的一个方面,提供了一种解码设备,包括:第一解码单元,其根据不同 于基于MDCT的译码方式的异质译码方式来解码被编码的输入信号的语音特征信号;第二 解码单元,其根据基于MDCT的译码方式来解码被编码的输入信号的音频特征信号;和块 补偿单元,其针对第一解码单元的结果和第二解码单元的结果来执行块补偿并还原输入信 号。当所述输入信号的当前帧中存在在语音特征信号和音频特征信号之间发生切换的折点 时,所述块补偿单元应用不超过所述折点的合成窗口。 根据本专利技术的一个方面,提供一种解码设备,包括:块补偿单元,当输入信号的当 前帧中存在在语音特征信号和音频特征信号之间发生切换的折点时,其对所述当前帧和从 语音特征信号中提取出的额外的信息分别应用合成窗口,来还原输入信号。 根据本专利技术的一个方面,提供一种编码方法,包括:根据不同于修正离散余弦变换 (MDCT)编码方案的异质编码方案,来编码输入信号的语音特征信号;和根据该MDCT编码方 案来编码所述输入信号的音频特征信号,其中所述编码语音特征信号的步骤包括:当在该 输入信号中的语音特征信号和音频特征信号之间发生切换时,编码该语音特征信号中的额 外信息。 根据本专利技术的一个方面,提供一种编码方法,包括:向指示音频特征信号的当前帧 应用分析窗口;针对其中应用分析窗口的当前帧来执行MDCT ;编码当前帧;和生成包括编 码的当前帧和额外信息的输入信号的比特流,其中该额外信息对应于语音特征信号中的区 域,用于基于该MDCT编码方案来还原当前帧。 根据本专利技术的一本文档来自技高网
...

【技术保护点】
一种编码方法,包括:根据不同于修正离散余弦变换(MDCT)编码方案的异质编码方案,来编码输入信号的语音特征信号;和根据该MDCT编码方案来编码所述输入信号的音频特征信号,其中所述编码语音特征信号的步骤包括:当在该输入信号中的语音特征信号和音频特征信号之间发生切换时,编码该语音特征信号中的额外信息。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:白承权李泰辰金珉第张大永姜京玉洪镇佑朴浩综朴荣喆
申请(专利权)人:韩国电子通信研究院光云大学校产学协力团
类型:发明
国别省市:韩国;KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1