扬声器在高噪声环境下传播人音可通过放大声音的共振峰而提高清晰度。该清晰度主要是从声音共振峰的频率分布方式得到的,故有选择地增强共振峰即可使高背景噪声中的语言只极小增加幅度即易于听懂。共振峰由频谱分析器分别选择和放大。在处理的共振峰和未处理的基带声成分再结合之前,有选择地加权它们,以显著改善输出信号的清晰度。(*该技术在2011年保护过期,可自由使用*)
【技术实现步骤摘要】
本专利技术涉及口语传播,更具体地说,涉及到在较高环境噪声下人的声音的清晰度。有线广播系统通常用于在大区域内发布通告或者与处于同一总位置的一大群人进行口头交流。听者所处的区域往往要遭受很大的背景噪声,这种噪声的程度常会达到使期望的从有线广播扬声器系统发出的讲话信息的清晰度大大降低。有许多这种环境,那里由于较高的环境噪声掩盖或干扰了本应由听者听到的播讲者的声音,所以传递的信息被漏掉了或至少部分地漏掉了。这些环境包括机场,地铁,公共汽车及火车站,飞机,火车、航空母舰,着陆中的航空器直升飞机,码头设施及其它噪声场合。在想要了解有关飞机或火车到达及出发的公告的人中没有任何一个对难于从这种背景噪声的存在中分辨出有用的信号而满意。为了在较高的背景噪声情况下将清晰度损失减至最小的尝试涉及到使用均衡器,限辐电路,或简单地增大有线广播的音量。而均衡器或限辐电路本身也可能增加背景噪声,因此不能解决所述问题。增加有线广播系统的声音或音量的总体水平并不能显著改善清晰度,并经常会引起其它问题,如回授及听者的不适。尽管这个问题长久以来广为人知,但并未得到解决。实际上,目前没有一种已知的方法能显著地改善被较高的环境噪声所掩盖的声源公共广播(例如有线广播之类)的清晰度。因此,本专利技术的目的在于提供改善的不会被背景噪声降低的声音传播的清晰度。按照一个最佳实施例关施本专利技术的原则,声音的主要频率部分被有选择地放大并结合以提供一个改善了清晰度的声音信号,有选择地增强浊音(Voiced Sounds)及清音(Unvoiced Sounds)的主要频率部分(共振峰频率Formants),同时对增强的频率部分加权及结合而产生一个结合的输出信号,从而提高了一种即存在很强的背景噪声也能显著增加清晰度的声音信号。附图的主要说如下附图说明图1表示典型扬声器系统或录音系统中声音处理器连接的简化框图;图2表未人的讲话中一定的典型共振峰曲线;图3为一个用于增强语音清晰度的处理系统的框图;图4是用于增强语音清晰度的处理系统的改进形式的框图;图5为利用图4系统的一个频谱分析器的框图;以及图6说明用于图4处理系统中的一个典型的压控放大器。图1以一种非常简单的形式示出了一种具有声音清晰度处理的有线广播的基本组成部分。声源10,它可以是一个直播的麦克风或一台放音机,如磁带,唱盘或类似物,提供一个记录的声音通告,将一个声音电信号送到放大系统12,该系统在线路14上提供出输出信号,并直送入16处所指的扬声器系统。扬声器系统16通常包括多个沿着一定区域的不同位置放置的喇叭,通过它们即可听到有线广播的通告。如前所述,这种区域通常具有较强的背景噪声而显著地降低了有线广播系统通告的清晰度。听者需极为注意和非常小心方可理解在机场,火车站或类似的强背景噪声环境中有线广播通告中的所有的话。即便如此,也难能确定通告的所有内容,并在有些情况下,通告几乎完全不能分辨出来。按照本专利技术,在系统放大器12与扬声器系统16之间插入一个声音处理系统18,即使在较强的背景噪声下也会使扬声器系统16发出的声音的清晰度被显著地提高,而无须显著提高扬声器16产生的声音的音量,图1中的系统,可用一个记录装置替代如扬声器系统16所表示的装置,可以用来增强记录的清晰度,即可以在噪杂的环境中播放,也可在噪声环境中初始记录讲话声音。下面更具体地描述该系统。声音处理器18是一种灵敏的自适应系统,它采用了这种方式的优点即使人的话音能被各个人的耳和大脑所产生、听到及处理。简单地说,处理器系统18识别声音中元音、辅音、摩擦者及爆破音的主率部分,对它们有选择地放大并加权,再结合提供一个显著增加清晰度的声音信号。简要地描述一下话音的发出及理解的机制将有助于理解本专利技术工作原理。人的话音是通过在声道中产生声音,并使这些声音在不同频率下发生共振而形成。元音是由肺中排出的气流使人的声褶(通常称为声带)振动而产生的。声带振动产生的声音是由基本频率或基带及相继的较高频率的许多谐音部分或谐波组成,这些谐音的幅度随着频率以每八度音大约12分贝的速率增加而下降。基带或基本频率及其谐波经过声道,声道在咽喉、头及口腔内具有各种腔穴,从而形成若干单独的共振。声道具有多种特征方式的共振,在某种程度上,它的作用好比多个工作于基带或基本频率及其谐波上的共振器。因为声道的有选择地共振作用,声带的基本频率的几个部分的幅度并未随着增加频率而以平滑的曲线降低,而是在对应于声道的特定共振频率处显示出尖峰。这些峰或共振称为共振峰(formants)。图2表示了浊音(如元音)的曲线,标绘了对应于多个谐波频率的幅度。在曲线的左侧,在最低频率处,是由声带振动产生的基本频率或基带,对于一个典型成年男声来说,这个基带频率在大约60和250HZ之间。基本频率的许多谐波由各个成分22a,22b,22c等指示。可以看出,整个声信号是由基带及分布在整个带上的许多各自的谐波组成的。在声信号中感兴趣的频带通常在60至大约7500HZ之间。图2说了各个谐波的情况,它们的幅度随着频率的上升而自然下降,其幅度的下降并不是以平缓的曲线,而显示出一定的峰,如26、28和30所示。这些峰代表声带的各个共振,并且因展示的目的只示出了三个,尽管在一般人的声道中可具有4个,5个或更多。这些峰,或声道共振,即为话音中的共振峰。对于成年男声的前四个(较低频率)共振峰分别接近于大约500,1500,2500和3500HZ。运动各种发音器官(包括颌,舌体,舌尖)可在很宽的范围内改变几个共振峰的频率。对于各个发音器官的形状或位置来说,不同的共振具有不同的灵敏度。讲话者可有选择地使这些器官运动,发出所需的元音的声音。相反,当听话时,每个元音通过其唯一的一组共振峰即可被识别。上述关于浊音及图2中的共振峰的讨论同样适用于清音,因其也具有由声道的共振腔引起的共振峰,浊音是由声带在由肺产生的气流中振动引起的并构成人讲话中词语的元音。清音是在声带不振动的情况下由声带产生的。清音包括辅音、爆破音和摩擦音。这些音由舌牙齿及口的作用而产生,这些器官控制由肺释放的空气,但声带并不振动。这包括各种辅音的声音。清音包括讲话中涉及字母M、N、L、Z、G(如在frigid中),DG(如在judge中),等。尽管这些爆破音,摩擦音及辅助音不涉及声带振动,但具有特征频率,通常比声带振动的基本频率要高,其范围通常为2000至3000HZ。然而,不管在声道内产生的声音是因声带振动而产生(浊音),或是声带不振动而产生(辅音、爆破音、摩擦音),声道共振即产生共振峰,即在产生的基本频率的各不同谐波内的共振峰。已经发现在人的话音中的这些共振峰对听者听到的语言清晰度起主要贡献。也就是说,听者是依靠特定的元音或辅音,爆破音或摩擦音的共振峰的具体形式,即几个共振峰的相关频率的形式来识别它们。共振峰形式可以较高或较低音调的基本频率为基础,如女人或儿童的较高音调的声音,男人的较低音调的声音。但无管怎样,对听者来说,由共振峰形式或即共振峰的相关频率即可识别讲话声的性质。关于人的声音的声学论述可见题为《演唱声学》的文章(《The Acoustics of the Singing Voice》)作者J.Sunberg该篇文章收编于《Readings 本文档来自技高网...
【技术保护点】
一种用于增强声音清晰度的方法,所述声音是从扬声器发出并传播到一种有环境噪声的区域,所述扬声器接收的输入信号是从具有共振峰的声音电信号中得到的,所述的方法包含的步骤是:有选择地放大所述共振峰的至少一些中的每一个,以及组合所述已放大的共振峰提供一种增强的声音信号。
【技术特征摘要】
...
【专利技术属性】
技术研发人员:阿诺德I克莱曼,
申请(专利权)人:SRS实验室公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。