用于在频域信息的频率分辨率以及相应时间覆盖范围不恒定的情况下确定和修改频域音频信号的感知响度的方法和设备,以及上面具有当被执行时使得实施这些方法的指令的计算机可读介质。将感知响度处理的频率(以及因而时间)分辨率在最长块尺寸处保持恒定。一种方法包括块组合器和响度修改内插器。
【技术实现步骤摘要】
【国外来华专利技术】
本公开一般涉及音频信号处理,特别地,涉及感知音频编码。
技术介绍
存在许多用于客观地确定音频信号的感知响度的方法。也已知用于使用例如感知响度模型以希望的量缩放音频信号的感知响度的方法。也已知这样的方法,所述方法包括缩放各单个频带的响度,由此保存感知响度谱或音品,同时调整总体感知响度。这些方法典型地将与数字化的音频信号对应的采样分割成被变换到频域的重叠块。被这样向重叠的数据块施加的变换被称为“重叠变换(lapped transform) 用于确定以及可能地更改感知响度的方法使用如短时离散傅立叶变换或(短时)变型的离散余弦变换的这些重叠变换。用于压缩数字化音频信号的感知编码方法也是已知的,这些编码方法包括将与数字化音频信号对应的采样分割成被变换到频域的重叠块。希望确定以及可能地修改可能被感知编码的音频信号的感知响度。感知编码方法常常具有随时间改变的块长度。AC-3(也已知作为Dolby Digital)和AAC(也已知作为 MPEG-2/AAC和MPEG-4/AAC,或者简单地被称为MPEG/AAC音频)各使用两个块尺寸。在可改变的音频信号块尺寸的情况下有效率地确定以及可能地修改频域音频信号的感知响度可能是复杂的操作。附图说明图1示出感知音频解码器的简化功能框图。图2示出包含MDCT域中的响度处理的感知音频解码器的简化框图。图3示出更详细地描述图2的响度处理元件的实施例中的一些处理的简化框图。图4示出被配置为在频域(例如MDCT域)中确定响度以及修改响度的本专利技术的一个设备实施例。图5A 5E示出在使用利用从示例性响板击打的Dolby Digital信号获得的MDCT 谱的本专利技术的实施例的组合中涉及的不同MDCT谱。图6示出使用MDCT数据并且用于本专利技术的一些实施例中的响度确定的例子的简单框图。图7A和图7B示出对于由使用内插(图7A)和使用复制(图7B)从短块确定的长块获得的Dolby Digital数据的以宋(sone)为单位确定的响度的比较。图8示出使用MDCT数据并且用于本专利技术的一些实施例中的用于水平调节 (leveling)的响度确定和修改的例子的简单框图。图9通过简单的例子图示适用于使用256时域采样的短块长度和512时域采样的长块长度的感知编码数据(例如Dolby Digital)的增益内插。图10通过简单的例子图示适用于使用256时域采样的短块长度和2048时域采样的长块长度的感知编码数据(例如MPEG-2/AAC和MPEG-4/AAC)的增益内插图11示出包括处理系统的一个设备实施例的简化框图,所述处理系统在操作中被配置为实施本专利技术的方法实施例。该设备包括被配置有指令的计算机可读介质,该指令在被执行时使得实施本专利技术的方法实施例。具体实施例方式概要本专利技术涉及用于在频域信息的频率分辨率以及相应时间覆盖范围不恒定的情况下确定和修改频域音频信号的感知响度的方法和设备,以及上面具有当被执行时使得实施这些方法的指令的计算机可读介质。这直接适用于使用改变的块尺寸的情况下的感知音频编码器,这种可变块尺寸有助于提高瞬变音频信号的声音质量。用于包括多种块尺寸的数据的一个方面包括将感知响度处理的频率(以及因而时间)分辨率在最长块尺寸处保持恒定,其包括对于比最长块尺寸短的一个或更多个块尺寸中的特定短块尺寸的数据,组合所述特定短块尺寸的多个块的频域信息以形成用于输入到响度处理的最长块尺寸数据,以及内插从对这种所形成的最长块尺寸数据的响度处理输出的增益信息,以用于与所述特定短块尺寸的频域信号相乘。特定的实施例包括音频数据的处理方法,所述音频数据包含通过以多种块尺寸进行例如重叠变换的变换所确定的频域数据。该方法包括接受多种块尺寸的频域音频数据块。对于比最长块尺寸短的一个或更多个块尺寸中的特定短块尺寸的接受的数据块,该方法包括组合所述特定短块尺寸的多个频域数据块以形成最长块尺寸的频域数据块。该方法还包括实施最长块尺寸的接受的块的感知响度处理。实施所述感知响度处理包括确定一个或更多个感知响度参数。所述响度处理可包括确定要应用于接受的频域数据块或其延迟形态的至少一个响度修改。所述至少一个响度修改的确定使用所述一个或更多个确定的感知响度参数。该方法可包括对于以所形成的最长块尺寸确定的所述至少一个响度修改,内插所确定的至少一个响度修改,以将其应用于被用于形成所确定的至少一个响度修改的所述特定短块尺寸的接受的数据块;和将所确定的至少一个响度修改或至少一个内插的响度修改应用于接受的频域数据块。该方法可包括延迟频域音频数据块,使得所述至少一个响度修改或内插的修改被应用于频域数据块的延迟形态。在一些实施例中,所述至少一个响度修改包括一组增益,因此,所述内插确定内插的增益,并且,应用所确定的至少一个响度修改或内插的响度修改包括应用所述一组增益或一组内插的增益。在其中至少一个响度修改包括一组增益的一些实施例中,所述内插确定内插的增益并且使用所确定的增益值之间的线性内插。一些实施例中的组合特定短块尺寸的多个频域数据块以形成最长块尺寸的频域数据包括交织所述特定短块尺寸的频域数据。在其它的实施例中,所述组合包括复制所述特定短块尺寸的频域数据的值以创建最长块尺寸的频域数据。例如,最近的(latest)特定短块尺寸块的特定短块尺寸的频域数据被用于创建最长块尺寸的频域数据。所述一个或更多个感知响度参数可包括音频数据的激励(excitation)和音频数据的特性响度(specific loudness)。实施感知响度处理可包括响度水平调节、增益控制、 噪声补偿和/或动态均衡化中的一个或更多个。所述变换可以是重叠变换,例如,短时离散傅立叶变换(STDFT),或者变型的离散余弦变换(MDCT),或者短时离散正弦变换。也可使用其它的重叠变换。所述数据可来自通过使用多于一个块尺寸的感知编码器编码的编码音频数据。例子包括AC-3和AAC。特定的实施例包括一种设备,该设备包括至少包含处理器的处理系统和计算机可读介质,该处理系统在操作中被配置为实施音频数据的感知响度处理的方法,所述音频数据包括通过以多种块尺寸进行例如重叠变换的变换所确定的频域数据。该方法包括接受多种块尺寸的频域音频数据块。对于比最长块尺寸短的一个或更多个块尺寸中的特定短块尺寸的接受的数据块,该方法包括组合所述特定短块尺寸的多个频域数据块以形成最长块尺寸的频域数据块。该方法还包括实施最长块尺寸的接受的块的感知响度处理。实施所述感知响度处理包括确定一个或更多个感知响度参数。该方法可包括对于以所形成的最长块尺寸确定的所述至少一个响度修改,内插所确定的至少一个响度修改,以将其应用于被用于形成所确定的至少一个响度修改的所述特定短块尺寸的接受的数据块;和将所确定的至少一个响度修改或至少一个内插的响度修改应用于接受的频域数据块。该方法可包括延迟频域音频数据块,使得所述至少一个响度修改或内插的修改被应用于频域数据块的延迟形态。不同的实施例可包括以上在此概要部分或本文的其它部分中描述的特征中的一个或更多个。特定的实施例包括配置有指令的计算机可读介质,该指令在被至少一个处理器执行时实施音频数据的感知响度处理的方法,所述音频数据包括通过以多种块尺寸进行例如重叠变换的变换所确定的频域数据。该方法包括接受本文档来自技高网...
【技术保护点】
1.一种音频数据的感知响度处理方法,所述音频数据包含通过以多种块尺寸进行变换所确定的频域数据,该方法包含:接受多种块尺寸的频域音频数据块;对于比最长块尺寸短的一个或更多个块尺寸中的特定短块尺寸的接受的数据块,组合所述特定短块尺寸的多个频域数据块以形成最长块尺寸的频域数据块,实施最长块尺寸的接受的块的感知响度处理,其中,实施所述感知响度处理包括:确定一个或更多个感知响度参数。
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:M·J·斯米泽斯,
申请(专利权)人:杜比实验室特许公司,
类型:发明
国别省市:US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。