用于嘈杂环境中语音信号分离的头戴式耳机制造技术

技术编号:3042332 阅读:309 留言:0更新日期:2012-04-11 18:40
头戴式耳机被构造成在嘈杂的声环境中产生听觉上不同的语音信号。所述头戴式耳机将一对分开的麦克风定位在用户的嘴附近。所述麦克风中的每一个都接收用户的语音,并且还接收声环境噪声。包含噪声和信息分量的麦克风信号被接收到分离处理中。所述分离处理产生具有基本减少了噪声分量的语音信号。然后对所述语音信号进行处理,以便进行传输。在一个实施例中,传输过程包括利用蓝牙无线电装置将所述语音信号发送到本地控制模块。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种用于从嘈杂的声环境分离语音信号的电子通信设备。更具体地,本专利技术的一个实施例提供了一种用于生成语音信号的头戴式耳机(headset)或耳塞(earpiece)。
技术介绍
声环境通常是嘈杂的,因此难于可靠地检测期望的信息信号并对之产生影响。例如,一个人可以期望利用语音通信信道与另一个人进行通信。所述信道例如可以由移动无线手持装置、步谈机、双向无线电装置或其他通信设备来提供。为了改进可用性,人们可以利用与上述通信设备相连的头戴式耳机或耳塞。头戴式耳机或耳塞通常具有一个或多个耳用扬声器和麦克风。麦克风通常在话筒吊杆(boom)上向人的嘴延伸,以提高麦克风拾取人讲话声音的可能性。人在讲话时,麦克风接收人的语音信号并将其转换成电子信号。麦克风还会接收到来自各种噪声源的声音信号,因此在电子信号中还会包括噪声成分。由于手持装置可以使麦克风距离人嘴几英寸,而环境可具有许多无法控制的噪声源,因此最后获得的电子信号可以具有实质的噪声成分。这种实质的噪声导致令人不满意的通信过程,并且可以导致通信设备无法有效地工作,从而增加电池的消耗。在一个特殊的实施例中,语音信号是在嘈杂的环境中生成的,语音处理方法用于使该语音信号与环境噪声分离。这种语音信号处理在日常通信的许多领域都是非常重要的,因为在真实世界的条件下噪声几乎总是存在的。噪声被定义为所有干扰或降低感兴趣的语音信号的信号组合。真实世界中充满多种噪声源,包括单一的点噪声源,点噪声源通常会侵入多个声音中,从而引起混响。除非与背景噪声分开和隔离,否则将难以可靠而有效地使用期望的语音信号。背景噪声可以包括由普通环境产生的多种噪声信号、由其他人的背景谈话产生的信号以及每个信号生成的反射和混响。当使用者在经常为嘈杂的环境中交谈时,期望使用者的语音信号与背景噪声分离。诸如蜂窝电话、扬声器电话、头戴式耳机、无绳电话、电话会议、CB收音机、步谈机、计算机电话应用软件、计算机和汽车语音指令应用程序以及其他不用手的应用程序、对讲机和麦克风系统等的语音通信媒介,可以利用语音信号处理来使期望的语音信号与背景噪声分离。已经创建了许多方法来使期望的声音信号与背景噪声信号分离,其中包括简单的滤波处理。现有技术的噪声滤波器将具有预定特征的信号识别为白噪声信号,并且从输入信号中去除这种信号。尽管这些方法对于声音信号的实时处理来说是足够简单和迅速的,但是它们并不能容易地适用于不同的语音环境,并且可能会导致要分解的语音信号产生实质性衰减。预定假设的噪声特征可能是包含过多的(over-inclusive)或包含过少的(under-inclusive)。因此,通过这些方法可以将人的语音的一部分视为“噪声”,从而从输出的语音信号中将该部分去除,并且通过这些方法可以将背景噪声的一部分(例如音乐或谈话)视为非噪声,从而将该部分包含在输入的语音信号中。在信号处理应用程序中,通常利用传感器(例如麦克风)来获取一个或多个输入信号。传感器所提供的信号是许多信号源的混合信号。总的来说,信号源及其混合特征是未知的。除了信号源独立性的一般统计假定之外,在不了解信号源的其他信息的情况下,信号处理问题在本领域中公知为“盲源分离(BSS)问题”。盲分离问题会以许多常见的形式出现。例如,众所周知的是,即使在包含许多单个声音源的环境中人们也可以将精力集中于单个声音源,这一现象通常称作“鸡尾酒会效应(cocktail-party effect)”。在从信号源到麦克风的传输过程中,每个源信号都以时变方式被延迟和削弱,然后每个源信号又与其他被独立延迟和削弱的源信号混合,从而包括了源信号本身的多径版本(混响),即,来自不同方向的被延迟的版本。接收所有这些声信号的人能够收听声音信号的特定集合,而过滤或忽略其他的干扰源(包括多径信号)。现有技术中,在物理设备和这些设备的计算仿真方面,投入了相当大的努力来解决鸡尾酒会效应。各种噪声缓解技术被普遍采用,包括从在分析前对信号进行简单消除到用于噪声谱的自适应估计方案,其中用于噪声谱的自适应估计方案依赖于语音信号和非语音信号之间的正确辨别。这些技术的总的特征在第6,002,776号美国专利(该专利的内容通过引用而并入本文)中进行了描述。具体地,第6,002,776号美国专利描述了一种用于分离源信号的方案,其中两个或两个以上的麦克风安装在包含相等数量或更少数量的不同声音源的环境中。第一模块利用信息到达方向(direction-of-arrival)尝试提取出原始的源信号,而信道之间的任何剩余的串扰都由第二模块去除。这种配置在分离空间局部化的点声音源并且该点声音源具有清晰定义的到达方向时可能是有效的,但是这种配置在真实世界空间分布噪声环境中却不能分离出语音信号,因为对于这种环境来说无法确定特定的信号到达方向。例如独立分量分析(ICA)的方法提供了使语音信号和噪声源分离的相对精确和灵活的方式。ICA是一种用于分离混合的源信号(分量)的技术,其中假定所述混合的源信号相互独立。在最简单的形式中,独立分量分析对混合信号的权值进行“非混合”矩阵运算,例如将该矩阵与混合信号相乘,以产生分离的信号。对所述权值指定初始值,然后对所述权值进行调整,以最大化信号的联合熵,从而最小化信息冗余。该权值调整和熵增大过程重复进行,直到信号的信息冗余减小到最小为止。由于这一技术不需要与每个信号的来源有关的信息,因此它被称为“盲源分离”法。盲源分离问题指的将来自多个独立信号源的混合信号进行分离的思想。已经开发了许多流行的ICA算法以优化其性能,其中包括许多通过对仅在十年前存在的算法进行重大修改而演变的算法。例如,A.J.Bell和TJ Sejnowski在Neural Computation 71129-1159(1995)中描述的成果、以及Bell,AJ.的第5,706,402号美国专利中描述的成果通常并不按照其取得专利的形式被使用。相反地,为了优化该算法的性能,该算法通过多个不同的实体(entity)而经历了几次重新定性。这种变化之一包括采用Amari,Cichocki,Yang(1996)中所描述的“自然梯度”。其他流行的ICA算法包括计算例如累积量的高阶统计量的方法(Cardoso,1992;Comon,1994;Hyvaerinen and Oja,1997)。然而,许多公知的ICA算法并不能有效地分离真实环境中所记录的信号,其中真实环境中固有地包括回声(例如与反射有关的、由房间结构引起的回声)。需要强调的是,到目前为止所提到的方法局限于将由源信号的线性静止混合产生的信号进行分离。由于直接路径信号(direct path signal)与其回声副本相加而导致的现象被称作混响,并给人工语音增强和识别系统带来了较多的问题。ICA算法可能需要能够分离这些时延信号和回声信号的长滤波器,因而排除了有效的实时应用。公知的ICA信号分离系统通常采用作为神经网络的滤波器网络,而从输入到滤波器网络中的任意数量的混合信号中分解出单独的信号。也就是说,ICA网络用于将一组声音信号分成多个有序的信号集(其中每个信号都代表特定的声音源)。例如,如果ICA网络接收包括钢琴音乐和人的谈话的声音信号,那么双端口的ICA网络便会将该声音信号分本文档来自技高网...

【技术保护点】
一种头戴式耳机,包括:外壳;耳部扬声器;与所述外壳相连的第一麦克风;与所述外壳相连的第二麦克风;以及与所述第一麦克风和所述第二麦克风耦合的处理器,所述处理器执行以下步骤:从所述第一麦克风接收第一语音信号加噪声信号;从所述第二麦克风接收第二语音信号加噪声信号;将所述第一语音信号加噪声信号以及所述第二语音信号加噪声信号作为信号分离处理的输入;产生语音信号;以及发送所述语音信号。

【技术特征摘要】
【国外来华专利技术】US 2004-7-22 10/897,2191.一种头戴式耳机,包括外壳;耳部扬声器;与所述外壳相连的第一麦克风;与所述外壳相连的第二麦克风;以及与所述第一麦克风和所述第二麦克风耦合的处理器,所述处理器执行以下步骤从所述第一麦克风接收第一语音信号加噪声信号;从所述第二麦克风接收第二语音信号加噪声信号;将所述第一语音信号加噪声信号以及所述第二语音信号加噪声信号作为信号分离处理的输入;产生语音信号;以及发送所述语音信号。2.如权利要求1所述的头戴式耳机,进一步包括无线电装置,并且其中所述语音信号被发送到所述无线电装置。3.如权利要求2所述的头戴式耳机,其中所述无线电装置根据蓝牙标准工作。4.如权利要求1所述的头戴式耳机,进一步包括远程控制模块,并且其中所述语音信号被发送到所述远程控制模块。5.如权利要求1所述的头戴式耳机,进一步包括侧音电路,其中所述语音信号被部分地发送到所述侧音电路,并且在所述耳部扬声器中播放。6.如权利要求1所述的头戴式耳机,进一步包括第二外壳;位于所述第二外壳中的第二耳部扬声器;并且其中所述第一麦克风位于所述第一外壳中,而所述第二麦克风位于所述第二外壳中。7.如权利要求1所述的头戴式耳机,其中所述耳部扬声器、所述第一麦克风以及所述第二麦克风位于所述外壳中。8.如权利要求7所述的头戴式耳机,其中所述麦克风中至少之一与另一个麦克风被定位成朝向不同的风向。9.如权利要求1所述的头戴式耳机,其中所述第一麦克风被定位成距离用户嘴至少3英寸。10.如权利要求1所述的头戴式耳机,其中所述第一麦克风和所述第二麦克风被构造成MEMS麦克风。11.如权利要求1所述的头戴式耳机,其中所述第一麦克风和所述第二麦克风是从MEMS麦克风的集合中选取的。12.如权利要求1所述的头戴式耳机,其中所述第一麦克风和所述第二麦克风被定位成所述第一麦克风的进入端口与所述第二麦克风的输入端口正交。13.如权利要求1所述的头戴式耳机,其中所述麦克风之一与所述外壳隔开。14.如权利要求1所述的头戴式耳机,其中所述信号分离处理为盲源分离处理。15.如权利要求1所述的头戴式耳机,其中所述信号分离处理为独立分量分析处理。16.一种无线头戴式耳机,包括外壳;无线电装置;耳部扬声器;与所述外壳相连的第一麦克风;与所述外壳相连的第二麦克风;以及处理器,其执行以下步骤从所述第一麦克风接收第一信号;从所述第二麦克风接收第二信号;检测话音活动;响应于对所述话音活动的检测而生成控制信号;利用信号分离处理生成语音信号;以及将所述语音信号发送到所述无线电装置。17.如权利要求16所述的无线头戴式耳机,其有且仅有一个外壳,其中所述无线电装置、耳部扬声器、第一麦克风、第二麦克风以及处理器位于所述外壳中。18.如权利要求16所述的无线头戴式耳机,其中所述第一麦克风位于所述外壳中,而所述第二麦克风位于第二外壳中。19.如权利要求16所述的无线头戴式耳机,其中所述第一外壳和所述第二外壳连接在一起,以形成立体声头戴式耳机。20.如权利要求16所述的无线头戴式耳机,其中所述第一麦克风与所述外壳隔开,而所述第二麦克风与所述第二外壳隔开。21.如权利要求16所述的无线头戴式耳机,其中所述第一麦克风与所述外壳隔开,并通过导线与所述外壳相连。22.如权利要求16所述的无线头戴式耳机,其中所述处理进一步执行以下步骤响应于所述控制...

【专利技术属性】
技术研发人员:埃里克维斯杰里米托曼汤姆戴维斯布里安莫迈耶
申请(专利权)人:索福特迈克斯有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1