一种增强声环境中目标语音信号拾取的信号处理方法技术

技术编号：10668611 阅读：451 留言：0更新日期：2014-11-20 13:50

本发明专利技术涉及一种增强声环境中目标语音信号拾取的信号处理方法。（1）通过实验获取ESN网络的参数，建立相应的音源模型；（2）将模型用于两种场合：当模型的输出为期望的某目标语音信号，输入为该目标语音源的声环境反射声信号和目标语音信号的混合时，模型可用于现场扩声的回声消除；当模型的输出为期望的某目标语音信号，输入为其它特定语音源的声环境反射声信号和目标语音信号的混合时，模型可用于两个特定人间语音通信的回声消除；（3）模型在实际声环境中给目标语音人使用时，拾音的位置发生变化，也能抑制训练所指的音源信号的反射信号，而输出相应增强的目标语音信号。本发明专利技术克服因拾音位置移动，而造成语音信号质量受到的影响。

全部详细技术资料下载

【技术实现步骤摘要】
一种增强声环境中目标语音信号拾取的信号处理方法
本专利技术属于室内语音信号拾取的处理技术，涉及通过实验对回声状态神经网络的参数选择和训练建模的数字信号处理方法，特别是一种增强声环境中目标语音信号拾取的信号处理方法。
技术介绍
在现场扩声中，消除回声影响的涉及对象是：特定目标语音和该特定目标语音的环境反射声，主要用于提高声增益。主要的相关技术有：（1）传统技术如窄带均衡是滤除峰值的处理，消除反馈自振；移频法是采用对信号进行频谱移动再扩声，用以破坏反馈自振条件等，它们存在的一个共同问题都是处理技术复杂，并且不利于语音信号的保真；(2)基于现代的数字信号处理的方法则采用自适应滤波处理的回声抵消技术。在语音通信中，消除回声影响的涉及对象是：特定目标语音和另一个特定语音的环境反射声，主要达到语音增强的目的。回声消除的相关产品主要在两个方面：基于DSP平台的回声消除器和基于Windows平台的语音通信的回声消除算法软件。它们均是基于自适应回声抵消技术的产品，回声抵消必须精确地模拟回声路径，并且迅速地适应它的变化。这包括自适应滤波器的结构和自适应算法的选择，以及减少噪声对算法收敛速度的影响等。自适应回声抵消处理主要有以下两方面问题：首先，设计主要针对以下的使用问题：（1）处理同时通话。只有远端信号没有近端信号时，获得对回声模拟的滤波器系数，当加入近端信号时等于引进另外大的随机分量到自适应过程，滤波器系数会围绕这个中值的变化而显著增大，导致性能下降。对此必须检测近端信号存在的关键元件，在同时讲话时使自适应功能停止，保持前面的滤波器系数不变。（2）基于自适应滤波的算法常用的...
一种增强声环境中目标语音信号拾取的信号处理方法

【技术保护点】
一种增强声环境中目标语音信号拾取的信号处理方法，其特征在于：包括以下步骤：步骤1：确定建立的模型类型：包括第一音源模型和第二音源模型，所述第一音源模型为抑制目标语音本身在声环境中产生的的反射声信号而相应增强目标语音信号；所述第二音源模型为抑制另一特定人语音在声环境中产生的反射声信号而相应增强目标语音信号；步骤2：模型的训练数据源分为两种获取准备：当准备建立第一音源模型时，需获取目标语音信号的数据采样点；当准备建立第二音源模型时，需获取特定人语音信号和目标语音信号的数据采样点；步骤3：获取训练模型用的环境反射声信号：首先，从电声系统对室内声环境输入激励信号，获取室内声环境的脉冲响应信号，并转换成数字信号；其次，设定阶数，利用基于自相关的线性预测算法获取全极点滤波器系数，该全极点滤波器用于模拟声环境中的声信道传输特性；再而，以准备抑制的反射声所对应的音源信号或经过全极点滤波器获得相应的环境反射声信号；步骤4：ESN网络参数的确定：ESN网络的方程为：其中，表示内部神经元激活函数，通常取双曲正切函数,表示输出函数，典型情况下取恒等函数，为时刻储备池的状态变量，为时刻系统输入向量，是网络时刻的...

【技术特征摘要】
1.一种增强声环境中目标语音信号拾取的信号处理方法，其特征在于：包括以下步骤：步骤1：确定建立的模型类型：包括第一音源模型和第二音源模型，所述第一音源模型为抑制目标语音本身在声环境中产生的的反射声信号而相应增强目标语音信号；所述第二音源模型为抑制另一特定人语音在声环境中产生的反射声信号而相应增强目标语音信号；步骤2：模型的训练数据源分为两种获取准备：当准备建立第一音源模型时，需获取目标语音信号S1(n)的数据采样点；当准备建立第二音源模型时，需获取特定人语音信号m(n)和目标语音信号S1(n)的数据采样点；步骤3：获取训练模型用的环境反射声信号：首先，从电声系统对室内声环境输入激励信号，获取室内声环境的脉冲响应信号，并转换成数字信号y(n)；其次，设定阶数p，利用基于自相关的线性预测算法获取全极点滤波器系数，该全极点滤波器用于模拟声环境中的声信道传输特性；再而，以准备抑制的反射声所对应的音源信号m(n)或S1(n)经过全极点滤波器获得相应的环境反射声信号S2(n)；步骤4：ESN网络参数的确定：ESN网络的方程为：X(i+1)＝f(WX(i)+WinU(i)+WbackY(i))其中，f表示内部神经元激活函数，通常取双曲正切函数,fout表示输出函数，典型情况下取恒等函数，X(i)为i时刻储备池的状态变量，U(i)为i时刻系统输入向量，Y(i)是ESN网络i时刻的输出；W为随机产生并且稀疏连接的高维方阵，储备池一经产生，其连接权值保持不变；Win和W分别为ESN网络的输入权值矩阵和输出权值向量；Wback为输出对状态变量连接权值向量；表示输出的偏置项或代表噪声；Win和Wback随机产生而且保持不变，唯一需要调整的是输出权值Wout；为使麦克风取一定长度的信号帧输入模型后，能够处理输出相应长度的目标语音帧，上述三个随机连接权值向量的取值如下：Win＝a×(2×rand(N,1)-1)，即N×1随机矩阵，取值在(-a，a)之间；Wback＝b×rand(N,1)，即N×1随机矩阵，取值在(0，b)之间；W＝c×sprand(N,N,p),即N×N，稀疏连接p的正态分布随机矩阵，取值(0，c)之间；其中，N值越小，建立状态的时间相对越短，提高模型运算的实时性，而N值越大模型精确性越高，但可能使泛化能力下降；a、b、c取值为：①a决定输入储备池的尺度,a≥1；②0<b<1；③0<c<1；N≥300，p＝0.01-0.05；步骤5：以U(n)＝S1(n)+S2(n)作为ESN网络输入，D＝S1(n)作为目标期望，对ESN网络进行训练，得到抑制特定音源反射声而相应增强目标语音信号的模型；i时刻，储备池的状态变量X的状态方程：X(i)＝tanh(WinU(i)+WX(i-1)+WbackD(i-1))；对于给定非线性系统输入输出对(U(n),D(n)；n＝1,2,3,...)，利用ESN网络辨识该系统的过程为：首先，初始化储备池中的权值W和Win；其次，输入U(n)激励系统，求得ESN网络的各个时刻状态响应；储备池中的状态变量与期望输出...

【专利技术属性】
技术研发人员：陈国钦，
申请(专利权)人：福建师范大学福清分校，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人