提供了用于提取和改变输入信号的混响内容的方法和装置。估计混响系统的脉冲响应的方法包括:将具有脉冲响应的混响系统的信号抽样为块的序列;为序列的每个块,确定与先前块的幅度相关的幅度;使用确定出的幅度作为有限脉冲响应滤波器的参数形成脉冲响应的估计。利用来自混响系统的具有较少声道的信号生成多声道信号的方法包括:将来自具有脉冲响应的混响系统的信号抽样为块的序列;为序列的每个块,确定与先前块的幅度相关的幅度;使用确定的幅度作为有限脉冲响应滤波器的参数形成脉冲响应的估计;对信号应用估计的脉冲响应的求逆以得出直接信号分量和混响信号分量其中至少之一;且重组直接信号分量和混响信号分量以生成多声道信号。
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及对输入信号的混响和非混响分量的分解和变更,且更具体而 言涉及减弱或增强输入信号的分量的可辨性。该方法能特定地用于减弱或增 强音频信号中的混响。在很多情况下,信号中发现的混响不适于其最终用途,因此我们希望有 变更混响的方法。而且我们希望不用直接测量混响被记录的声学空间就能够 变更这种混响。
技术介绍
几乎所有的音频信号都由原始干信号(original dry signal)和混响的组 合构成。混响源于干信号经过混响系统。例如,考虑在音乐厅表演的歌手。 在这种情况下,歌手的声音是干信号,且音乐厅是混响系统。如果我们在音 乐厅中的某个位置放置麦克风以记录产生的声音,我们将得到其上叠加了音 乐厅的混响特性的干语音信号。即,麦克风捕获了歌手直接发出的声音分量 以及由于声音在音乐厅中传播而产生的混响分量的混合。一旦原始干信号上叠加了声学空间的混响特性,则极难恢复原始干信号 (或直接信号分量)。类似地,极难改变混响分量的特性或强度。难点部分 地在于混响依赖于原始干信号这一事实。即,混响是从原始干信号生成的。而且,我们通常不存取关于混响系统的任意相关信息。利用音乐厅中的 歌手的示例,麦克风不直接记录音乐厅的声学细节。而是,它记录了歌手声 音在叠加了音乐厅的声学特性之后的声音。在诸如音乐录制之类的某些应用中,十分希望有一定量的混响,因为它能对每个音符进行令人愉悦的扩展并能提供有深度和围绕的感觉。当然,某 些声学空间(例如,音乐厅)就是比其他声学空间更令人感到愉悦。然而,人们一般不能进入最令人感到愉悦的声学空间,所以记录的声音的混响分量 可能不会像希望的那样好。即,混响不能完全适用于该记录声音。当前,在 这种情况下,不能做出什么来变更记录声音的分量。如果记录声音缺少混响能量,则可以通过人工混响设备处理记录声音来添加更多的混响能量。然而, 这些设备产生的混响听上去不自然,且不能补充记录声音中已经存在的混响 的音程。相反,如果记录声音具有太多的混响,则当前也不能做什么来减小 混响分量的水平。如果记录声音具有正确的混响量,但是不具有正确的特性, 则当前不能做什么来变更混响特性。在这些情况其中每一种情况下,若能够 修改直接的声音分量以及混响能量的水平和特性以获得合适的混响特性,则 是非常有益的。在其他应用中,即使适度的混响也是不适当的,因为它抑制了信号的清 晰度和可理解性。例如,在诸如通常使用免提电话的电信会i^的应用情况中, 办公室或会议室的混响可能会具有使语音信号声音"空洞,,的不利影响。这 通常被称为雨桶效果。在诸如安全、监视和取证之类的其他相关应用中,混 响是极不希望有的,因为它可能减弱语音信号的可理解性。然而,在这些情 况下,典型地不可能对声学空间的混响特性做任何控制。在语音识别系统中, 混响降低了系统正确地识别词语的能力,且因而降低了识别率。如果识别率 变得太低,则语音识别系统可能变得不可用。对于有听力障碍的人,混响可 能会造成独特的困难,因为不希望的混响效应通常会被他们的听力障碍所增 大。对于有听力障碍的人而言,混响对语音可理解性的负面影响通常更为严 重。当听力辅助设备放大声学信号以使得声学信号更容易被听到时,它同时 放大了直接声音分量和混响分量。因此,放大的信号不帮助克服混响的不利 影响。在每一种这样的应用情况中,若能够减小混响分量的水平使得它相对 于直接声音分量处于合适的水平将是十分有利的。试图減小音频信号中的混 响量一个通常的方法,是^f吏用定向麦克风或麦克风阵列。定向麦克风和麦克风阵列接受从某些方向到达的声音,且拒绝从其他方向到达的声音。因此, 如果麦克风被放置得很恰当,则它将接受所需的干信号,同时拒绝某些混响 部分。定向麦克风和麦克风阵列的成功使用,需要人们知道所需信号所处的位 置。如果该位置未知,或它随时间变化,则该方法不能令人满意地工作,因 为所需的信号也可能被拒绝。而且,由于麦克风阵列的物理尺寸,所需的硬 件资源(例如,麦克风、放大器等)的数量的增加以及导致的成本增加,该 方法不适于用在某些应用中。相反,在不知道声学空间的任何知识并且不知 道声源的位置的情况下能够用单个非定向麦克风来盲目地将混响分量水平减小到合适的水平,是极其有利的。在电影和电视作品中,我们听到的声音(例如,对话和声效)具有与我 们在屏幕上所见的图像相配的混响特性是很重要的。例如,如果图像指示场 景发生在小房间中,则声音应具有小房间的混响特性,即使声音可能实际是在很大的摄影棚中记录的。术语"房间音调(room tone)"通常在电影和电 视作品中用来描述声学空间的声学特性。 一般而言,电影和电视作品中的声 音通常是在极其不同的地点记录的。例如, 一部分对话可能在拍摄电影时记 录,而其他部分对话可能在录音或"配音"室中记录。这里,演员在观看他 们表演的视频的同时吟诵他们的台词。这种处理已知为自动对白替换 (ADR),且是十分常用的作法。为了使对话的各个部分听起来自然而真实, 必须匹配不同记录声音的房间音调,使得它们听起来就好像它们在同样的声 学空间中记录的一样。而且,人们通常希望使记录声音听起来就好像它们在 具有特定房间音调的特定声学空间中记录的 一样。在ADR示例中,记录声音通常是非常干的,因为录音或配音室通常是 精心控制的声学空间。即,通常在记录中几乎没有混响。在这种情况下,人们可能希望向记录声音中强加以特定房间的混响特性。如果不能直接获得房 间的声学特性,这可能是十分困难的。然而,该房间中记录的其他记录声音是可以获得的。在这种情况下,能够从记录声音中提取声学空间的声学特性 将是十分有用的。能够向记录声音中强加以适当的声学空间的混响特性也是 很有用的。在对话的不同部分在不同的声学空间中记录而在每一个声学空间均具 有相当大的混响量的情况下,则任务是以某种方式匹配不同记录声音的混响 特性。为了完成这点,必须在应用合适的声学空间的混响特性之前,首先去 除进行录音的房屋的混响特性。如上所述,这是很困难的任务,至今不能得 到满意的解决。在这种情况下,能够去除记录声音的声学特性且然后应用适 当的声学空间的声学特性是十分有用的。在一类情形中,音频信号中发现的混响是不恰当的,因为混响限制了人 们以某种方式处理信号的能力。例如,在音频数据缩减系统中,目标是压缩 信号,使得较少量的数据用于存储或发射信号。这种系统使用编码器来压缩 信号,且使用解码器来用于在以后恢复信号。这些音频数据缩减系统可以是 "无损耗的",在这种情况下,没有信息因为压缩处理而丟失,所以能在解码器处完美地恢复原始信号。其他版本是"有损耗的",所以在解码器处恢 复的信号并不与原始输入信号完全相同。音频数据缩减系统依赖于在音频信 号中存在高度冗余。即它们在"可预测"的音频信号上工作得最好。然而, 音频信号中的混响降低了音频信号的可预测性。当前没有克服混响效果以改 善音频数据缩减系统的性能的方法。非常希望能够在解码器压缩信号之前将 信号分解成其直接声音分量和混响分量,且然后在解码了压缩信号之后恢复 混响信号。混响限制了处理信号的能力的另 一 示例是音频水印(audio watermarking )。在音频水印中,目标是在音频信号中隐藏信息。该隐藏的信 息可用本文档来自技高网...
【技术保护点】
一种估计混响系统的脉冲响应的方法,包括以下步骤: 将来自混响系统的信号抽样为块的序列,其中该混响系统具有脉冲响应; 对于所述序列的每个块,确定与先前块的幅度相关的幅度; 通过使用确定出的幅度作为用于有限脉冲响应滤波器的参数 ,形成所述脉冲响应的估计。
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:吉尔伯特AJ索洛德里,
申请(专利权)人:哈曼国际工业有限公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。