检测语音可识别度及在噪音和回响空间改善语音公告系统可识别度的系统和方法技术方案

技术编号:2821307 阅读:250 留言:1更新日期:2012-04-11 18:40
一种为检测并纠正不可接受水平的语音可识别度,而评测接收到的测试音频的系统和方法,该测试音频在感兴趣的空间或者区域被发送或接收。在语言信号的呈现过程中,通过变更速率、音调、振幅和频带能量来改善可识别度。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种评测在某区域的由个人系统提供的音频输出的质量的系统和方法。更具体而言,在特定区域,评测和处理所提供的音频的可识别度以便改善可识别度。
技术介绍
已知由语音公告系统发射或发送到某区域的语音或音频并不仅仅因为其是可听到的就必然是可识别的。在很多场合,例如体育场、机场、建筑物等,发送到某个区域的语音可能足够大到完全可以听到,但是并不可识别。这种顾虑通常适合于语音公告系统以及与消防安全、建筑或者区域监控系统相关的系统。 存在把语音消息发送到依照基于性能的可识别度测量进行监控的区域的需求,在一个标准中提出了这种需求,即,NFPA 72-2002。已知,尽管例如会议室或者办公区域这种感兴趣区域可以提供非常良好的声学效果,一些如上文所述的空间,显示出降低了语音可识别度的声学特性。 此外,被监控的区域可能包括建筑物的一个或多个楼层中的空间,或者显示出动态声学特性的建筑物。建筑物空间受制于随时间发生的改变,例如表面处理和精整的改变,办公室的重新布置,会议室的提供和礼堂的采用等。 2003年12月18日提交的名为“语音公告系统的可识别度测量”并于此转让给受让人的一份美国专利申请No.10/740200,其公开并要求保护了一种方法。在此引入该申请作为参考。 存在以下持续的需求,即测量建筑物空间的某些声学属性以便进行语音信息的纠正。 因此,持续存在以下需求,即一种对经过改善的、更有效的方法和系统的当前需求,该方法和系统不仅测量感兴趣区域的语音可识别度,而且能执行语音信息的纠正以便改善这种可识别度。按以下方式得以引入一些或者全部这种纠正能力是可取的,即利用有意地广泛分布在检测区域的环境条件检测器。优选地,可以把这种语音消息纠正引入到当前安装的检测器中,并且也可以有成本效益的作为升级引入到现有系统的检测器中以及其它类型的模块中。 附图说明 图1是根据本专利技术的系统的方框图; 图1A是根据本专利技术的音频输出单元的方框图; 图1B是备选的音频输出单元; 图1C是可用于图1系统的示例公用控制单元的方框图; 图2A是一种可用于图1系统的类型的检测器的方框图; 图2B是可用于图1系统的感测和处理模块的方框图; 图3A,B一起作为根据本专利技术的方法的流程图; 图4是说明在何处纠正是可能的状态空间图。 具体实施例方式 尽管本专利技术的实施例可以采用多种不同形式,按如下理解在附图中展示了并在此详细地说明了其具体的实施方案,即当前的公开是作为对本专利技术原理的例示,而并非把本专利技术限制到所描述的具体实施例。 根据本专利技术的系统和方法检测并评测源自一个或多个传感器例如扩音器的音频输出用以测量建筑物空间或被监控区域的某些声学属性。分析的结果可以用来确定发送到该区域的语音信息会由于空间的声学属性降低到何种程度以及是否需要对这种语音信息进行纠正。 根据本专利技术的一方面,广泛布置在一个区域的一个或多个声检测器按预定的时间周期检测并量化输入的预定可听测试信号。例如,可以按特定的时间间隔发射测试信号至该区域。对接收信号以及残留的环境声音的分析可以包括建立频谱分布和环境噪音水平。回响或者衰减时间可由对具体测试信号的结尾因素的分析确定。 根据本专利技术的另一方面,可以考虑把音频发送至该区域的扬声器和放大器链的特性。可以评测包括最大可获得声压水平(SPL)和已检测音频中呈现的频带的特性。可以作出以下确定,即空间的噪音和回响特性是否会把发射的语音的可识别度降低到其不能被补偿的程度。确定的结果可被系统操作员利用并且可用于手动和/或自动的纠正方法中。 根据本专利技术的系统和方法提供了一种自适应方法用于随时间监控空间或区域的特性。各放大器和输出传感器组合的性能随后被评测以便确定是否在各自的空间或区域提供了所需水平的语音可识别度。 根据本专利技术的另一方面,提供了系统和方法,通过以下方式用于改善空间或区域的语音可识别度,即降低语音的速率和/或把放大的语音信号的能量集中到对人的理解来说最重要的频带。这可以包括对于音调(pitch)、节拍、频带和声压水平的独立控制。 在本专利技术的另一实施例中,评测从输入的环境噪音中提取的频带能量信息用以决定特定频带中对语音可识别度重要的能量水平是否是不希望的。这种基于性能的测量随着可能改变的时间和空间为可识别度特性提供了实时反馈。感兴趣的频带中的能量水平可能是可接受的,这样在一个空间构形中不需要纠正。然而,如果空间发生改变,在那些特定频带中的能量水平可能对于要保证可识别的语音来说是不可接受的。 在本专利技术的另一方面中,如果所测量的空间的回响特性足够长,可以暂时地把发送到区域的音频语音的呈现伸展一适合于改善可识别度的量。根据本专利技术的系统中可用的装置可以集成一个或多个数字信号处理器和各自的模块用以在把信号提供给放大器和输出传感器链之前时间上和频谱上调整信号。根据任意允许的系统分区都可以提供分析和纠正。 而且,根据本专利技术,可以分析存储的先前获得的频带能量数据,先前获得的数据。可以评测对语音可识别度重要的预定频带中的能量水平。如果对于可识别的语音来说是可接受的,发送可接受的可识别度确定给相关的监控系统。 如果预定频带中的能量水平对于可识别的语音来说是不可接受的,采用各自的编程处理器或数字信号处理器用以增强对语音识别重要的频带来改善可识别度,可以在呈现之前调整语音信号中的频谱。 因而,依据此处的系统和方法可以通过以下方式改善语音可识别度,即降低其速度,调整其音调,调整其频谱,和/或调整其声压水平(SPL)。速度、音调、频率和SPL的变化可以动态调整以适合于特定区域的环境声音情况。例如,语音输出系统可能在普通办公环境中展示出一组特性和在人们试图离开空间时反应出空间中的环境噪音水平变化的另一组特性。 此外,本系统和方法寻求动态确定监控空间的声学属性,该监控空间与提供紧急语音公告信息相关而且满足语音可识别度的基于性能的标准。这种监控也可以给那些具有以下声学属性的空间提供反馈,即声学属性是边缘的并且没有对语音信息进行声学纠正时则可能不符合这些标准。 图1说明了对本专利技术进行实例化的系统10。系统10的至少一些部分位于评测语音可识别度的区域R。可以理解,区域R可以是建筑物的部分或者整个楼层,或者多个楼层。建筑物的类型和/或区域或空间R的大小都并非对本专利技术的限制。 系统10可以采用多个语音输出单元12-1,12-2...12-n。语音单元12-n的数目或者它们在区域R中的位置都并非对本专利技术的限制。 语音单元12-1,12-2...12-n可以通过有线或无线媒介16与置换控制单元20进行音频输出和监控系统的双向通信。可以理解,单元20可以是部分的或集成了区域控制和监控系统,该系统可能包括语音公告系统、火警系统、安全系统和/或建筑物控制系统,所有这些都不是限制。应当理解,单元20的确切细节不是对本专利技术的限制。还应理解,语音输出单元12-1,12-2...12-n可以是连接至上文所述类型的火警系统的语音公告系统的一部分,其可以是监控系统20的一部分。 其它的音频输出单元可以包括通过线缆18连接到单元20的扬声器14。扬声器14也可以被用作扩音系统。 系统10还可以集成包含成员22-1,22-2...22-m的多个音频感测模块。音频感测模本文档来自技高网...

【技术保护点】
一种方法,包括: 按预定时间间隔感测区域中的环境声音; 分析感测到的环境声音; 重叠环境声音和多个具有预定特性的测试音频信号; 感测被重叠的环境声音;以及 确定区域中的语音可识别度是否降低到超出了可接受标准的程度。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:DM希尔兹PJ尊斯特
申请(专利权)人:霍尼韦尔国际公司
类型:发明
国别省市:US[美国]

网友询问留言 已有1条评论
  • 来自[美国加利福尼亚州圣克拉拉县山景市谷歌公司] 2015年01月04日 12:30
    回响指回声反响声音回旋激荡语出魏巍东方第二部第二章邓军是有名的大嗓门这时的声音更象洪钟一般在山谷里惹起一阵回响
    0
1