近端语音检测器制造技术

技术编号:14783297 阅读:54 留言:0更新日期:2017-03-10 04:17
近端语音检测器。一种用于对通信系统处的语音进行分类的近端语音检测器,该通信系统接收来自近端麦克风的麦克风信号和来自远端通信系统的远端信号,该近端语音检测器包括:信号处理器,该信号处理器被构造成将麦克风信号和远端信号变换到频域中;计算单元,该计算单元被构造成形成:表示存在于麦克风信号中的近端语音的近端信号的估计;和麦克风信号与近端信号之间的增益的测度;以及信号分类器,该信号分类器被构造成根据增益的方差的测度和近端信号的方差的测度对通信系统处的语音进行分类。

【技术实现步骤摘要】

本专利技术涉及近端语音检测器和用于对通信系统处的语音进行分类的方法。
技术介绍
在电话中,音频信号(例如,包括语音信号)在近端与远端之间传输。在近端处接收的远端信号可以从扬声器输出。在近端处的麦克风可以用于捕获要传输到远端的近端信号。当在近端处所输出的远端信号中的至少一些被包括在传输回远端的麦克风信号中时,发生“回声”。在该场景中,回声可以被认为远端信号的反射。图1中例示了示例情景,示出了由远端麦克风捕获且由近端扬声器输出的信号。回声为近端处的扬声器与麦克风之间的声耦合的后果;近端麦克风除了捕获近端扬声器的语音和任何近端背景噪声之外还捕获源于它自己的扬声器的信号。结果为远端扬声器处的回声。在互联网协议电话(VoIP)通信系统中,由于由VoIP通信装置的音频接口引入的固有延迟,回声是特别明显的。为了从麦克风信号去除不希望的回声并恢复近端语音信号,可以形成对回声的估计并从麦克风信号消除该估计。这种估计通常根据远端语音信号在自适应回声估计滤波器(AEEF)处合成。图2中示出了该结构,在图2中,AEEF203根据远端信号x形成回声的估计e,然后从麦克风信号m减去204回声信号,以形成真实的近端信号d的估计,从该近端信号消除远端信号的回声。这种回声消除结构的性能依赖于自适应回声估计滤波器(AEEF)的自适应控制。在特定条件下,例如在麦克风信号中存在近端信号期间,需要冻结AEEF的系数或应用可忽略的步长。在近端信号的存在期间调整AEEF的系数会导致AEEF的发散。可以采用近端语音检测器(NSD)来检测近端语音及其输出的存在,其用于决定什么时候冻结AEEF的系数且防止它们的调整。这保持近端语音存在期间的回声路径建模和回声消除稳定性。近端语音检测器还可以检测双端通话的开始(有时称为双端通话检测器或DTD)。这是因为在双端通话期间,存在近端语音和远端语音这两者,这导致允许AEEF的系数调整时的相同发散问题。图2中示出了关于AEEF的近端语音检测器205的典型结构。用于近端语音检测器(NSD)的传统算法使用AEEF本身的参数来产生二进制信号,其用于决定AEEF的滤波器系数应被冻结还是可以允许调整,或者(例如,根据回声与近端信号比)确定滤波器的合适步长。由此,这种算法的性能依赖于AEEF的性能。如果AEEF未收敛,则NSD会将回声检测为近端,导致慢收敛速率。在平台中的一些上,由于平台非线性、低回声噪声比(ENR)等,AEEF会从不收敛至其最佳系数集。在这种情况下,NSD在语音呼叫的整个会话期间无法正常工作。已经提出了对用于近端语音检测器的传统算法的各种改进,其不依赖自适应回声消除器的参数。由D.L.Duttweiler作为“Atwelvechanneldigitalechocanceler”,IEEETransactionsonCommunications,26(5):647-653,May1978公开的盖格尔(Geigei)DTD算法已在线回声消除器中被证明是成功的。然而,该算法在用于回声信号与近端信号的不同比下的回声消除器时不总是提供可靠的性能。还提出了基于互相关的方法,诸如V.Das等人的“Anewcrosscorrelationbaseddoubletalkdetectionalgorithmfornonlinearacousticechocancellation”,TENCON2014IEEERegion10Conference,pages1-6,October2014,,该方法如具有基于相干性的方法,诸如T.Gansler等人的“Adouble-talkdetectorbasedoncoherence”,IEEETransactionsonCommunications,44(11):1421-1427,November1996。然而,这些方案在非线性和双端通话下遭受差的性能。近来,已提出盲源分离(BSS)技术来执行双端通话期间的回声消除,诸如Y.Sakai和M.T.Akhtar的“Theperformanceoftheacousticechocancellationusingblindsourceseparationtoreducedouble-talkinterference”,2013InternationalSymposiumonIntelligentSignalProcessingandCommunicationsSystems(ISPACS),pages61-66,November2013。类似地,M.Kanadi等人的“Avariablestep-size-basedICAmethodforafastandrobustacousticechocancellationsystemwithoutrequiringdouble-talkdetector,2013IEEEChinaSummitInternationalConferenceonSignalandInformationProcessing(ChinaSIP),pages118-121,July2013提出了用于BSS的独立成分分析(ICA),其用于使回声和近端从麦克风信号分离。分离的回声然后应用于调整AEEF。因为这些BSS方法基于长块处理,所以它们遭受缓慢的收敛速度和在近端语音检测中的相当大的延迟。另外,为了检测双端通话的时段而对远端信号使用诸如奇异值分解(SVD)的技术在计算上是昂贵的且依赖存在于EEF中的估计误差。
技术实现思路
根据本专利技术的第一方面,提供了一种用于对通信系统处的语音进行分类的近端语音检测器,该通信系统接收来自近端麦克风的麦克风信号和来自远端通信系统的远端信号,所述近端语音检测器包括:信号处理器,该信号处理器被构造成将所述麦克风信号和所述远端信号变换到所述频域中;计算单元,该计算单元被构造成形成:表示存在于所述麦克风信号中的近端语音的近端信号的估计;和所述麦克风信号与所述近端信号之间的增益的测度;以及信号分类器,该信号分类器被构造成根据所述增益的方差的测度和所述近端信号的方差的测度对所述通信系统处的语音进行分类。所述计算单元可以被构造成关于多个频率窗口(frequencybin)中的每一个形成对所述近端信号的所述估计和所述增益的测度,并且所述方差的测度为跨所述频率窗口的方差的测度。所述信号处理器可以被构造成通过执行短时间傅里叶变换(STFT)来变换所述麦克风信号和所述远端信号。在所述信号处理器处形成的所述麦克风信号和所述远端信号可以表示所述麦克风信号和所述远端信号在所述频域中的幅度谱。所述麦克风信号和所述远端信号可以各被表示为帧序列,并且所述近端语音检测器被构造成关于所述序列的各帧形成输出分类。所述信号处理器可以被构造成还通过执行以下中的一个或更多个来处理所述所接收的麦克风信号和远端信号:所述麦克风信号和所述远端信号的同步;所述麦克风信号和所述远端信号的缩放(scaling);以及所述麦克风信号和所述远端信号的归一化。所述信号处理器或计算单元可以被构造成平滑所述远端信号,以保持所述远端信号的所述幅度谱达所述远端信号中的回声混响的长度。所述计算单元可以被构造成通过根据所述远端信号对所述麦克风信号操作维纳滤波器来形成对本文档来自技高网
...
近端语音检测器

【技术保护点】
一种用于对通信系统处的语音进行分类的近端语音检测器,该通信系统接收来自近端麦克风的麦克风信号和来自远端通信系统的远端信号,所述近端语音检测器包括:信号处理器,该信号处理器被构造成将所述麦克风信号和所述远端信号变换到频域中;计算单元,该计算单元被构造成形成:表示存在于所述麦克风信号中的近端语音的近端信号的估计;和所述麦克风信号与所述近端信号之间的增益的测度;以及信号分类器,该信号分类器被构造成根据所述增益的方差的测度和所述近端信号的方差的测度对所述通信系统处的语音进行分类。

【技术特征摘要】
2015.08.27 GB 1515267.11.一种用于对通信系统处的语音进行分类的近端语音检测器,该通信系统接收来自近端麦克风的麦克风信号和来自远端通信系统的远端信号,所述近端语音检测器包括:信号处理器,该信号处理器被构造成将所述麦克风信号和所述远端信号变换到频域中;计算单元,该计算单元被构造成形成:表示存在于所述麦克风信号中的近端语音的近端信号的估计;和所述麦克风信号与所述近端信号之间的增益的测度;以及信号分类器,该信号分类器被构造成根据所述增益的方差的测度和所述近端信号的方差的测度对所述通信系统处的语音进行分类。2.根据权利要求1所述的近端语音检测器,其中,所述计算单元被构造成关于多个频率窗口中的每个形成对所述近端信号的所述估计和所述增益的测度,并且所述方差的测度为跨所述频率窗口的方差的测度。3.根据权利要求1所述的近端语音检测器,其中,所述信号处理器被构造成通过执行短时间傅里叶变换STFT来变换所述麦克风信号和所述远端信号。4.根据权利要求1所述的近端语音检测器,其中,在所述信号处理器处形成的所述麦克风信号和所述远端信号表示所述麦克风信号和所述远端信号在所述频域中的幅度谱。5.根据权利要求1所述的近端语音检测器,其中,所述麦克风信号和所述远端信号各被表示为帧序列,并且所述近端语音检测器被构造成关于所述序列的各帧形成输出分类。6.根据权利要求1所述的近端语音检测器,其中,所述信号处理器被构造成还通过执行以下中的一个或更多个来处理所述所接收的麦克风信号和远端信号:所述麦克风信号和远端信号的同步;所述麦克风信号和所述远端信号的缩放;以及所述麦克风信号和所述远端信号的归一化。7.根据权利要求1所述的近端语音检测器,其中,所述信号处理器或所述计算单元被构造成平滑所述远端信号,以保持所述远端信号的所述幅度谱达所述远端信号中的回声混响的长度。8.根据权利要求1所述的近端语音检测器,其中,所述计算单元被构造成通过根据所述远端信号对所述麦克风信号操作维纳滤波器来形成对所述近端信号的所述估计。9.根据权利要求1所述的近端语音检测器,其中,所述计算单元被构造成关于各频率窗口估计所述麦克风信号与所述远端信号的比,所述麦克风信号与所述远端信号的所述比用于形成所述麦克风信号与所述近端信号之间的所述增益的测度。10.根据权利要求9所述的近端语音检测器,其中,所述计算单元被构造成关于各频率窗口、根据所述麦克风信号与所述远端信号的所述比以及针对之前帧形成的增益的测度来估计所述近端信号与所述远端信号的比。11.根据权利要求10所述的近端语音检测器,其中,所述近端信号与所述远端信号的所述比包括作为所述麦克风信号与所述远端信号的所述比的半波整流函数的分量。12.根据权利要求10所述的近端语音检测器,其中,所述计算单...

【专利技术属性】
技术研发人员:S·K·曼尼G·那玛尼
申请(专利权)人:想象技术有限公司
类型:发明
国别省市:英国;GB

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1