一种针对大功率目标信号的语音提取方法技术

技术编号：26602252 阅读：33 留言：0更新日期：2020-12-04 21:25

本发明专利技术公开了一种针对大功率目标信号的语音提取方法。该方法的步骤包括：步骤1，获取待处理混合语音的时频域信号；步骤2，初始化各频带的分离向量；将混合语音时频域信号进行白化预处理，然后对所有频带的分离向量进行联合优化，收敛后对分离向量进行标准化，得到最终的目标语音分离向量并由此估计出目标语音的时频域信号；步骤3，将估计出的目标语音时频域信号通过短时傅里叶逆变换，得到时域的目标语音信号。本发明专利技术的方法可以针对多个传声器实现多通道环境下的目标语音提取，有利于节省计算量，并保证目标语音提取的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种针对大功率目标信号的语音提取方法
本专利技术涉及语音处理的
，尤其是涉及一种针对大功率目标语音的提取方法。
技术介绍
语音分离技术可以从多个声源的混合信号中分离出原始的声源信号，是语音信号处理领域的一项重要任务，在智能家居系统、视频会议系统以及语音识别系统等多种应用场景下都发挥了重要作用。在多通道的语音信号处理方案中，独立矢量分析(IVA)以及它的变体被认为是最先进的分离方法，它对所有的声源信号都进行了完全的分离。然而，在很多的应用场景中，只需要估计出某一个特定话者的语音信号。通常的语音分离方法对那些不需要的声源信号也进行了估计，并且还要采取额外的步骤从所有分离出的信号当中挑选出目标的源信号，这样的做法浪费计算量且增加了系统的复杂程度。所以这种情况下，采用语音提取方法比起语音分离更加的高效。已有的语音提取方法都需要对目标信号以及干扰信号作严格的假定，或是对源信号混合方式有先验的知识，这在很大程度上限制了此类方法在实际中的应用。如何高效、准确地针对目标信号进行提取，即使在很少的限制条件下也能保证算法的性能，是一个值得关注的技术问题。
技术实现思路
为了解决上述技术问题，本专利技术提出了一种针对大功率目标信号的语音提取方法，该方法能准确、高效地对目标信号进行提取，并且估计出的目标信号有良好的效果。本专利技术采用的技术方案为：一种针对大功率目标信号的语音提取方法，包括如下步骤：步骤1，获取待处理混合语音的时频域信号；步骤2，初始化各频带的分离向量...

【技术保护点】
1.一种针对大功率目标信号的语音提取方法，其特征在于，该方法包括如下步骤：/n步骤1，获取待处理混合语音的时频域信号；/n步骤2，初始化各频带的分离向量；将步骤1得到的混合语音时频域信号进行白化预处理，然后对所有频带的分离向量进行联合优化，收敛后对分离向量进行标准化，得到最终的目标语音分离向量并由此估计出目标语音的时频域信号；/n步骤3，将步骤2估计出的目标语音时频域信号通过短时傅里叶逆变换，得到时域的目标语音信号。/n

【技术特征摘要】
1.一种针对大功率目标信号的语音提取方法，其特征在于，该方法包括如下步骤：
步骤1，获取待处理混合语音的时频域信号；
步骤2，初始化各频带的分离向量；将步骤1得到的混合语音时频域信号进行白化预处理，然后对所有频带的分离向量进行联合优化，收敛后对分离向量进行标准化，得到最终的目标语音分离向量并由此估计出目标语音的时频域信号；
步骤3，将步骤2估计出的目标语音时频域信号通过短时傅里叶逆变换，得到时域的目标语音信号。

2.根据权利要求1所述的一种针对大功率目标信号的语音提取方法，其特征在于，所述步骤1的具体步骤为：利用信号采集系统获取待处理混合语音的时域信号，对时域信号做短时傅里叶变换，得到待处理混合语音的时频域信号。

3.根据权利要求1所述的一种针对大功率目标信号的语音提取方法，其特征在于，所述步骤2中，初始化各频带的分离向量采用的是独热向量，向量的第一个元素是1，其余元素是0。

4.根据权利要求1所述的一种针对大功率目标信号的语音提取方法，其特征在于，所述步骤2中，进行白化预处理的具体步骤为：
(1)根据各个频带的混合语音时频域信号计算对应频带的协方差矩阵；
(2)将各频带的所述协方差矩阵进行特征值分解，获取按降序排列的由特征向量构成的特征向量矩阵，以及按降序排列的特征值作为对角元素构成的特征值对角矩阵；
(3)根据所述特征向量矩阵以及特征值对角矩阵得到各频带白化的混合语音信号。

5.根据权利要求4所述的一种针对大功率目标信号的语音提取方法，其特征在于，所述步骤2中，对所有频带的分离向量进行联合优化...

【专利技术属性】
技术研发人员：廖乐乐，卢晶，
申请(专利权)人：南京大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人