当前位置: 首页 > 专利查询>南京大学专利>正文

一种针对大功率目标信号的语音提取方法技术

技术编号:26602252 阅读:33 留言:0更新日期:2020-12-04 21:25
本发明专利技术公开了一种针对大功率目标信号的语音提取方法。该方法的步骤包括:步骤1,获取待处理混合语音的时频域信号;步骤2,初始化各频带的分离向量;将混合语音时频域信号进行白化预处理,然后对所有频带的分离向量进行联合优化,收敛后对分离向量进行标准化,得到最终的目标语音分离向量并由此估计出目标语音的时频域信号;步骤3,将估计出的目标语音时频域信号通过短时傅里叶逆变换,得到时域的目标语音信号。本发明专利技术的方法可以针对多个传声器实现多通道环境下的目标语音提取,有利于节省计算量,并保证目标语音提取的准确性。

【技术实现步骤摘要】
一种针对大功率目标信号的语音提取方法
本专利技术涉及语音处理的
,尤其是涉及一种针对大功率目标语音的提取方法。
技术介绍
语音分离技术可以从多个声源的混合信号中分离出原始的声源信号,是语音信号处理领域的一项重要任务,在智能家居系统、视频会议系统以及语音识别系统等多种应用场景下都发挥了重要作用。在多通道的语音信号处理方案中,独立矢量分析(IVA)以及它的变体被认为是最先进的分离方法,它对所有的声源信号都进行了完全的分离。然而,在很多的应用场景中,只需要估计出某一个特定话者的语音信号。通常的语音分离方法对那些不需要的声源信号也进行了估计,并且还要采取额外的步骤从所有分离出的信号当中挑选出目标的源信号,这样的做法浪费计算量且增加了系统的复杂程度。所以这种情况下,采用语音提取方法比起语音分离更加的高效。已有的语音提取方法都需要对目标信号以及干扰信号作严格的假定,或是对源信号混合方式有先验的知识,这在很大程度上限制了此类方法在实际中的应用。如何高效、准确地针对目标信号进行提取,即使在很少的限制条件下也能保证算法的性能,是一个值得关注的技术问题。
技术实现思路
为了解决上述技术问题,本专利技术提出了一种针对大功率目标信号的语音提取方法,该方法能准确、高效地对目标信号进行提取,并且估计出的目标信号有良好的效果。本专利技术采用的技术方案为:一种针对大功率目标信号的语音提取方法,包括如下步骤:步骤1,获取待处理混合语音的时频域信号;步骤2,初始化各频带的分离向量;将步骤1得到的混合语音时频域信号进行白化预处理,然后对所有频带的分离向量进行联合优化,收敛后对分离向量进行标准化,得到最终的目标语音分离向量并由此估计出目标语音的时频域信号;步骤3,将步骤2估计出的目标语音时频域信号通过短时傅里叶逆变换,得到时域的目标语音信号。进一步地,所述步骤1的具体步骤为:利用信号采集系统获取待处理混合语音的时域信号,对时域信号做短时傅里叶变换,得到待处理混合语音的时频域信号。进一步地,所述步骤2中,初始化各频带的分离向量采用的是独热向量,向量的第一个元素是1,其余元素是0。进一步地,所述步骤2中,进行白化预处理的具体步骤为:(1)根据各个频带的混合语音时频域信号计算对应频带的协方差矩阵;(2)将各频带的所述协方差矩阵进行特征值分解,获取按降序排列的由特征向量构成的特征向量矩阵,以及按降序排列的特征值作为对角元素构成的特征值对角矩阵;(3)根据所述特征向量矩阵以及特征值对角矩阵得到各频带白化的混合语音信号。进一步地,所述步骤2中,对所有频带的分离向量进行联合优化的具体步骤为:(1)根据源信号模型选取得分函数,从而获得代价函数;(2)根据所述代价函数,利用快速不动点迭代方法得到分离向量的迭代更新规则;(3)使用所述迭代更新规则进行迭代直到收敛,得到各频带优化后的分离向量。进一步地,所述步骤2中,对分离向量进行标准化的具体步骤为:(1)根据各个频带的协方差矩阵以及各频带优化后的分离向量,得到各频带混合向量;(2)根据各频带混合向量,对各频带优化后的分离向量进行标准化,得到各个频带最终的目标语音分离向量。本专利技术针对大功率的目标语音信号,实现了一种高效的语音提取方法。该方法能够有针对性地对多个传声器实现多通道环境下的目标信号进行提取,有利于节省计算量,提取准确率高,同时保证了恢复出来的源信号的效果。附图说明图1为本专利技术的语音提取方法的流程示意图;图2为本专利技术所适用的一个场景示意图;图3是现有的ILRMA方法、FIVE方法、OGIVE-w方法与本专利技术方法在不同声源个数情况下的SIR提升值对比图。图4是现有的FIVE方法、OGIVE-w方法与本专利技术方法在不同声源个数情况下对目标信号正确提取率的对比图。具体实施方式本专利技术针对大功率的目标语音提取方法主要包括以下几个部分:1、信号获取1)将两个以上的传声器以线阵列的形式布放来采集声源的信号,然后通过AD转换将模拟信号转换为数字信号。2)对信号做短时傅里叶变换若第m个传声器采集到的混合信号为xm(t),对其进行短时傅里叶变换,变换到时-频域,忽略时间帧数指标n,第k个频带的信号表示为总共M个传声器采集到的信号构成混合信号向量上标T表示转置操作。3)对信号进行白化预处理对全部K个频带,计算xk的协方差矩阵其中,表示取样本平均。对进行特征值分解,得到按降序排列的特征值以及对应的单位范数特征向量以特征值为对角元素构成对角矩阵其中diag(·)表示构造对角矩阵,以单位特征向量为列构成矩阵通过以下的方式对xk进行白化:表示白化后的信号。2、对目标信号的分离向量进行优化1)基于负熵的代价函数若第n个源信号矢量表示为sn,相应的估计信号表示为yn,为了使各估计信号之间尽可能地独立,采用负熵来作为独立性的度量,所以代价函数可以写为如下形式:其中N{yn}代表变量yn的负熵,H{yn}代表变量yn的熵,是与yn具有相同均值和方差的高斯变量,所以是一个常数项,可以忽略。于是代价函数可以简化为:其中表示源信号sn的概率分布函数,令将代价函数改写成上式是对N个源信号非高斯性的求和,所以可以通过寻找单个变量的非高斯性极大值来对某一个源信号进行提取。在很多实际的运用场景,通常目标源信号比起其他干扰信号有更高的功率(例如在所有说话人中目标说话人距离麦克风阵列最近,或者是在嘈杂的环境中目标说话人有意地提高音量),所以在本实施例中将大功率源信号最为目标信号进行提取。经过了白化之后,针对大功率源信号进行提取的代价函数为:2)对各频带分离向量进行初始化对所有的k=1,2,…,K,将分离向量初始化为:下标o表示初始值,其中e1是独热向量(one-hotvector),向量的第一个元素为1,其余元素为0.由于经过了白化,白化后的第一个主成分最接近于目标源信号,所以初始化点在优化面上更靠近目标源信号(相比于其他干扰信号)对应的极值点,更容易收敛到目标源信号的分离向量。3)快速不动点迭代最小化代价函数的解需要满足使代价函数的一阶导数为零的条件,将代价函数对分离向量进行求导,并利用泰勒展式做近似得到:下标o表示当前次迭代的参数。分别用G′(·)和G″(·)表示G(·)的一阶和二阶导数,可以进一步计算出(8)式右边的项,上式最后的等号是由于常用的圆周对称假设将(9),(10),(11)代入(8),得到如下的迭代更新规则:在每一步迭代之后,都需要对分离向量进行归一化:4)源信号分布模型根据不同的源信号先验分布模型,G有不同的形式。本专利技术实施例中采用了三种不同的分布:一种是常用的圆周对称拉普拉斯分布(SSL),相应本文档来自技高网...

【技术保护点】
1.一种针对大功率目标信号的语音提取方法,其特征在于,该方法包括如下步骤:/n步骤1,获取待处理混合语音的时频域信号;/n步骤2,初始化各频带的分离向量;将步骤1得到的混合语音时频域信号进行白化预处理,然后对所有频带的分离向量进行联合优化,收敛后对分离向量进行标准化,得到最终的目标语音分离向量并由此估计出目标语音的时频域信号;/n步骤3,将步骤2估计出的目标语音时频域信号通过短时傅里叶逆变换,得到时域的目标语音信号。/n

【技术特征摘要】
1.一种针对大功率目标信号的语音提取方法,其特征在于,该方法包括如下步骤:
步骤1,获取待处理混合语音的时频域信号;
步骤2,初始化各频带的分离向量;将步骤1得到的混合语音时频域信号进行白化预处理,然后对所有频带的分离向量进行联合优化,收敛后对分离向量进行标准化,得到最终的目标语音分离向量并由此估计出目标语音的时频域信号;
步骤3,将步骤2估计出的目标语音时频域信号通过短时傅里叶逆变换,得到时域的目标语音信号。


2.根据权利要求1所述的一种针对大功率目标信号的语音提取方法,其特征在于,所述步骤1的具体步骤为:利用信号采集系统获取待处理混合语音的时域信号,对时域信号做短时傅里叶变换,得到待处理混合语音的时频域信号。


3.根据权利要求1所述的一种针对大功率目标信号的语音提取方法,其特征在于,所述步骤2中,初始化各频带的分离向量采用的是独热向量,向量的第一个元素是1,其余元素是0。


4.根据权利要求1所述的一种针对大功率目标信号的语音提取方法,其特征在于,所述步骤2中,进行白化预处理的具体步骤为:
(1)根据各个频带的混合语音时频域信号计算对应频带的协方差矩阵;
(2)将各频带的所述协方差矩阵进行特征值分解,获取按降序排列的由特征向量构成的特征向量矩阵,以及按降序排列的特征值作为对角元素构成的特征值对角矩阵;
(3)根据所述特征向量矩阵以及特征值对角矩阵得到各频带白化的混合语音信号。


5.根据权利要求4所述的一种针对大功率目标信号的语音提取方法,其特征在于,所述步骤2中,对所有频带的分离向量进行联合优化...

【专利技术属性】
技术研发人员:廖乐乐卢晶
申请(专利权)人:南京大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1