当前位置: 首页 > 专利查询>英特尔公司专利>正文

用于综合电信处理的话音激活检测器制造技术

技术编号:3046862 阅读:230 留言:0更新日期:2012-04-11 18:40
公开了一种用于检测话音是否存在的综合话音激活检测器。在一个实施例中,综合话音激活检测器包括半导体集成电路,它具有至少一个执行话音检测的信号处理单元和存储信号处理指令的存储装置,这些指令供所述至少一个信号处理单元执行,从而:检测是否存在噪声以确定噪声标记是否应当置位;检测预定数目的过零点以确定过零点标记是否应当置位;以及检测是否存在阈值量的能量以确定能量标记是否应当置位;检测是否存在瞬时能量以确定瞬时能量标记是否应当置位。综合话音激活检测器利用噪声、过零点、能量以及瞬时能量标记的组合来确定是否存在噪声。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术一般涉及信号处理器。更具体地说,本专利技术涉及综合电信处理所用的电话信号处理器和话音激活检测器。
技术介绍
单片数字信号处理器(DSP)是比较熟悉的。DSP与通用微处理器的区别一般在于DSP通常包括用于执行数字数值的乘法的专用乘法器和累加器(MAC),从而支持加速的算术运算。典型的DSP器件所用的指令集通常包括MAC指令,用于执行新操作数的乘法以及与累加寄存器内存储的在先累加值的相加。MAC指令通常是先有技术的数字信号处理器中提供的唯一的指令,其中两种DSP运算,先相乘后相加,是由一条指令的执行来完成的。但是,当在数据上执行信号处理功能时,通常需要以可变的组合来执行其它DSP运算。可利用DSP的一个领域是电信系统中。DSP在电信系统中的一种应用是数字滤波。在此情况下,DSP通常以在数字域或时域中实现某些滤波器功能的指令来编程。典型有限脉冲响应(FIR)滤波器的数学算法可以看作是方程Yn=h0X0+h1X1+h2X2+…+hNXN,其中hn是从1到N编号的固定滤波系数,而Xn是数据样值。方程Yn可利用软件程序来估算。但是,在一些应用中,必需尽快地估算该方程。实现此方面的一种方法是利用诸如被编程以计算方程Yn的DSP器件之类的硬件组件来执行计算。为了进一步加速该过程,需要将方程矢量化并且将计算分布在多个DSP中,以便更快得到最终结果。多个DSP并行运算以加速计算过程。在此情况下,各项乘法均等分散在DSP的各乘法器上,以便同时计算各项。各项加法类似地均等分散在DSP的各加法器上,以便同时计算。在矢量化处理中,处理各项的顺序是无关紧要的,因为组合是相关的。如果改变各项的处理顺序,则对函数的矢量化处理中预期的最终结果没有影响。应用有限脉冲响应滤波器的一个领域是用于电话处理的回波消除。采用回波消除来消除全双工电话通信信道上的回波。回波消除过程对双向传输中来自主发送信号的回波所引起的无用信号进行隔离和滤波。可使用单个或多个DSP芯片来实现具有有限脉冲响应滤波器的回波消除器,以便提供回波消除。但是,回波消除仅仅是电信处理的一部分。通常,电话处理功能分散在电话通信系统的多个器件、组件或板上。现在参照图8,说明典型的先有技术的电话通信系统。电话、传真或数据调制解调器一端连接到本地用户环路802,相反的一端连接到另一本地用户环路802’。本地用户环路802和802’各自连接到2线/4线混合电路804和804’。混合电路804由电阻网络、电容和铁氧体磁心变压器构成。混合电路804将在PSTN 812的电话交换机之间工作的4线电话中继线806(每个方向上一对)转换成各个2线本地用户环路802和802’。混合电路804用于将远端的4线中继线806上来自讲话者的所有能量引导到近端的2线本地用户环路802上的听者。回波810’往往是在来自远端讲话者的语音信号离开四线806’对上的远端混合电路804’时形成的,并且在穿过PSTN 812之后到达近端,而且可能被近端的听者听到。在传统电话网中,把回波消除器放在PSTN的各端,以便减小并且试图消除该回波。现在参照图9,说明典型的先有技术的数字回波消除器900。先有技术的数字回波消除器900在电话中继线上连接在混合电路804和公共交换电话网(PSTN)902之间。数字回波消除器的管理规范是ITU-T推荐标准G.168“数字网络回波消除器”。本文使用了来自ITU-T文件G.168的如下术语,并且表示在图9中。连接向着本地电话听筒的一端或一侧称作近端、近侧或发送侧910。连接向着远处电话听筒的一端或一侧称作远端、远侧或接收侧920。从近端910到远端920的电路部分是发送路径930。从远端到近端的电路部分是接收路径935。终端系统用户或电话系统108与混合电路804的中心局终端之间的本地环路802中的电路部分(即铜线、混合电路)是终端路径。从近端910进入回波消除器900的语音信号是发送输入Sin。从远端920进入回波消除器的语音信号是接收输入Rin。从回波消除器900输出到远端920的语音信号是发送输出Sout。从回波消除器出来而进入近端910的语音信号是接收输出Rout。典型先有技术的数字回波消除器900包括回波估算器902的基本组件、数字减法器904和非线性处理器906。通常,典型先有技术的数字回波消除器900中的回波消除过程从消除阻抗不匹配开始。为了实现这一点,典型数字回波消除器900分接头接收侧输入信号(Rin)。处理Rin以便在回波估算器(902)中产生Sin的估算值。Sin用作回波消除过程的参考信号。Rin还一直不经改变地传到近端910,作为Rout信号。回波估算器902是在DSP中实现的线性有限脉冲响应(FIR)卷积滤波器。估算器902接受Rin上话音的连续样值(通常是每125微秒16位样值)。话音样值与逼近端路径中电路的脉冲响应的一组滤波系数相乘,从而产生回波估算值。随着时间推移,改变(即调整)这组滤波系数,直到它们准确地表示所需的脉冲响应而形成准确的回波估算值。把回波估算值耦合到减法器904中。如果回波估算值是准确的,则它基本上等效于Sin上的实际回波,而从减法器906到非线性处理器的输出基本消除了线性回波。非线性处理器906用于去除非线性回波源。随着在诸如因特网或异步转移模式(ATM)之类的分组网上提供电话通信信道的兴趣不断增长,电话处理已变得更加复杂。附图简介附图说明图1A是采用本专利技术的系统的框图。图1B是图1A中系统的网关内采用本专利技术的印刷电路板的框图。图2是本专利技术的专用信号处理器(ASSP)的框图。图3是本专利技术的ASSP内的核心处理器的示例的框图。图4是图3的核心处理器内的RISC处理单元的框图。图5A是图3的核心处理器内的信号处理单元的示例的框图。图5B是说明信号处理单元的总线结构的图5A的更详细框图。图6A是说明采用本专利技术的指令集结构的DSP算法的程序模型的示例指令序列。图6B是说明二元DSP指令的置换的图表。图6C是控制扩展的二元DSP指令的示例位图。图6D是非扩展的二元DSP指令的示例位图。图6E和6F列出本专利技术的ISA的20位指令集。图6G列出本专利技术的ISA的扩展控制指令集。图6H列出本专利技术的ISA的40位DSP指令集。图6I列出本专利技术的ISA的寻址指令集。图7是说明信号处理单元的功能块的指令解码和配置的框图。图8是说明PSTN电话网和其中回波的先有技术框图。图9是说明PSTN电话网的典型先有技术回波消除器的先有技术框图。图10是结合了本专利技术的综合电信处理器的分组网络系统的框图。图11是用于多个全双工信道之一的综合电信处理器的固件电信处理模块的框图。图12是从近端到分组网的电信处理的流程图。图13是在近端将从网络到综合电信处理器的分组电信处理成TDM信号的流程图。图14A是在用于电话处理的综合电信处理器150的示例功能框之间的数据流和交互作用的框图。图14B是用于进行话音激活检测的算法的流程图。图14C是话音激活检测的输入语音的快速傅里叶变换(FFT)处理的算法的流程图。图14D是用于话音激活检测的过零检测的流程图。图14E是用于话音激活检测的噪声检测的过程的流程图。图14F是用于话音激活检测的能量判别的过程的流程图。图14G是用于话音本文档来自技高网...

【技术保护点】
一种综合话音激活检测器,用于检测话音是否存在,所述综合话音激活检测器包括:半导体集成电路,其中包括,至少一个信号处理单元,用以执行话音检测;以及处理器可读存储部件,用以存储信号处理指令,供所述至少一个信号处理单元执行,从而: 检测是否存在噪声以确定噪声标记是否应当置位;检测预定数目的过零点以确定过零点标记是否应当置位;检测是否存在阈值量的能量以确定能量标记是否应当置位;检测是否存在瞬时能量以确定瞬时能量标记是否应当置位;以及利用噪声、过零点、能量 以及瞬时能量标记的组合来确定是否存在噪声。

【技术特征摘要】
【国外来华专利技术】US 2001-8-23 09/938,104;US 2000-9-9 60/231,5101.一种综合话音激活检测器,用于检测话音是否存在,所述综合话音激活检测器包括半导体集成电路,其中包括,至少一个信号处理单元,用以执行话音检测;以及处理器可读存储部件,用以存储信号处理指令,供所述至少一个信号处理单元执行,从而检测是否存在噪声以确定噪声标记是否应当置位;检测预定数目的过零点以确定过零点标记是否应当置位;检测是否存在阈值量的能量以确定能量标记是否应当置位;检测是否存在瞬时能量以确定瞬时能量标记是否应当置位;以及利用噪声、过零点、能量以及瞬时能量标记的组合来确定是否存在噪声。2.如权利要求1所述的综合话音激活检测器,其特征在于,所述信号处理指令还供所述至少一个信号处理单元执行,从而进行快速傅里叶变换(FFT)处理以确定FFT标记是否应当置位。3.如权利要求1所述的综合话音激活检测器,其特征在于,所述信号处理指令还供所述至少一个信号处理单元执行,从而进行中间话音激活判定,通过确定如果瞬时能量标记被置位或能量标记被置位并且噪声标记未被置位且过零点标记未被置位,将中间话音激活判定标记置位以表明检测到话音。4.如权利要求3所述的综合话音激活检测器,其特征在于,所述信号处理指令还供所述至少一个信号处理单元执行,从而在作出中间话音激活判定之后,进行释放延迟和语音跳入处理以确定应当对话音激活标记置位或清零。5.如权利要求4所述的综合话音激活检测器,其特征在于,所述信号处理指令还供所述至少一个信号处理单元执行,从而在所述话音激活标记被置位的情况下,发送要被分组的语音净荷并且更新所述话音激活检测标记,以便与所述半导体集成电路的其它功能进行外部交互作用。6.如权利要求4所述的综合话音激活检测器,其特征在于,所述信号处理指令还供所述至少一个信号处理单元执行,从而在所述话音激活标记未被置位的情况下,禁止自动电平控制并且使静寂插入描述净荷预备好。7.如权利要求1所述的综合话音激活检测器,其特征在于,检测预定数量的过零点以确定过零点标记是否应当置位的步骤包括确定过零值的均方根是否大于阈值。8.如权利要求1所述的综合话音激活检测器,其特征在于,检测是否存在噪声以确定噪声标记是否应当置位的步骤包括确定当前帧中的能量乘以阈值是否大于延迟帧能量。9.如权利要求1所述的综合话音激活检测器,其特征在于,检测是否存在阈值量的能量以确定能量标记是否应当置位的步骤包括确定帧的自相关的对数是否大于能量阈值。10.如权利要求1所述的综合话音激活检测器,其特征在于,检测是否存在瞬时能量以确定瞬时能量标记是否应当置位的步骤包括确定在第十个延迟样值的自相关下的当前帧能量与在第十个延迟样值的自相关下的在先帧能量之间的差是否大于先前帧自相关乘以阈值。11.一种用于检测话音是否存在的话音激活检测方法,所述方法包括检测是否存在噪声以确定噪声标记是否应当置位;检测预定数目的过零点以确定过零点标记是否应当置位;检测是否存在阈值量的能量以确定能量标记是否应当置位;检测是否存在瞬时能量以确定瞬时能量标记是否应当置位;以及利用噪声、过零点、能量以及瞬时能量标记的组合来确定是否存在噪声。12.如权利要求11所述的方法,其特征在于还包括进行快速傅里叶变换(FFT)处理以确定FFT标记是否应当置位。13.如权利要求11所述的方法,其特征在于还包括进行中间话音激活判定,通过确定如果瞬时能量标记被置位或能量标记被置位并且噪声标记未被置位且过零点标记未被置位,则将中间话音激活判定标记置位以表明检测到话音。14.如权利要求13所述的方法,其特征在于还包括在作出中间话音激活判定之后,进行释放延迟和语音跳入处理以确定是否应当对话音激活标记置位或清零。15.如权利要求14所述的方法,其特征在于还包括在所述话音激活标记被置位的情况下,发送要被分组的语音净荷并且更新所述话音激活检测标记,以便与其它功能进行外部交互作用。16.如权利要求14所述的方法,其特征在于还包括在所述话音激活标记未被置位的情况下,禁止自动电平控制并且使静寂插入描述净荷预备好。17.如权利要求11所述的方法,其特征在于,检测预定数量的过零点以确定过零点标记是否应当置位的步骤包括确定过零值的均方根是否大于阈值。18.如权利要求11所述的方法,其特征在于,检测是否存在噪声以确定噪声标记是否应当置位的步骤包括确定当前帧中的能量乘以阈值是否大于延迟帧能量。19.如权利要求11所述的方法,其特征在于,检测是否存在阈值量的能量以确定能量标记是否应当置位的步骤包括确定帧的自相关的对数是否大于能量阈值。20.如权利要求11所述的方法,其特征在于,检测是否存在瞬时能量以确定瞬时能量标记是否应当置位的步骤包括确定在第十个延迟样值的自相关下的当前帧能量与在第十个延迟样值的自相关下的在先帧能量之间的差是否大于先前帧自相关乘以阈值。21.一种装置,它包括至少一个信号处理单元,用以执行话音检测;以及存储装置,用以存储信号处理指令,供所述至少一个信号处理单元执行,从而确定噪声标记、过零点标记、能量标记以及瞬时能量标记是否应当置位;以及利用噪声、过零点、能量以及瞬时能量标记的组合来确定是否存在噪声。22.如权利要求21所述的装置,其特征在于,所述信号处理指令还供所述至少一个信号处理单元执行,从而检测是否存在噪声以确定噪声标记是否应当置位;检测预定数目的过零点以确定过零点标记是否应当置位;检测是否存在阈值量的能量以确定能量标记是否应当置位;以及检测是否存在瞬时能量以确定瞬时能量标记是否应当置位。23.如权利要求21所述的装置,其特征在于,所述信号处理指令还供所述至少一个信号处理单元执行,从而进行快速傅里叶变换(FFT)处理以确定FFT标记是否应当置位。24.如权利要求21所述的装置,其特征在于,所述信号处理指令还供所述至少一个信号处理单元执行,从而进行中间话音激活判定,通过确定如果瞬时能量标记被置位或能量标记被置位并且噪声标记未被置...

【专利技术属性】
技术研发人员:AB斯特劳斯A比斯特S希Z朱RS普拉布胡
申请(专利权)人:英特尔公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1