语音分离方法、装置、介质和电子设备制造方法及图纸

技术编号：26973655 阅读：14 留言：0更新日期：2021-01-06 00:07

公开了一种语音分离方法、装置、介质和电子设备。其中的语音分离方法包括：获取待处理的时频域混合信号；根据所述时频域混合信号以及包含有幅度调整因子的高斯混合模型的独立向量分析的代价函数，获得所述时频域混合信号的分离矩阵；根据所述分离矩阵，从所述时频域混合信号中获得每个声源的时频域信号。本公开提供的技术方案有利于提高语音分离技术的可实施性，从而有利于提高语音分离技术的适用范围。

全部详细技术资料下载

【技术实现步骤摘要】
语音分离方法、装置、介质和电子设备
本公开涉及语音处理技术，尤其是一种语音分离方法、语音分离装置、存储介质以及电子设备。
技术介绍
语音分离技术可以从由多个声源混合信号中提取出初始声源信号，从而实现对期望信号的增强。目前，语音分离技术已被使用于智能家居系统、视频会议系统以及语音识别系统等多种应用中。基于GMM(GaussianMixtureModel，高斯混合模型)-IVA(IndependentVectorAnalysis，独立向量分析)的语音分离技术，是一种将GMM作为IVA算法中的声源先验模型的语音分离技术。然而，由于GMM中的参数通常需要采用预训练的方式来确定初始值，因此，基于GMM-IVA的语音分离技术不能较好的适用于无法进行预训练的应用场景中。如何提高基于GMM-IVA的语音分离技术的语音分离的适用范围，是一个值得关注的技术问题。
技术实现思路
为了解决上述技术问题，提出了本公开。本公开的实施例提供了一种语音分离方法、语音分离装置、存储介质以及电子设备。根据本公开实施例的一方面，提供一种语音分离方法，包括：获取待处理的时频域混合信号；根据所述时频域混合信号以及包含有幅度调整因子的高斯混合模型的独立向量分析的代价函数，获得所述时频域混合信号的分离矩阵；根据所述分离矩阵，从所述时频域混合信号中获得每个声源的时频域信号。根据本公开实施例的另一方面，提供一种语音分离装置，包括：获取混合信号模块，用于获取待处理的时频域混合信号；获取分离矩阵模块，用于根据所述获取混合信号模块获取到...

【技术保护点】
1.一种语音分离方法，包括：/n获取待处理的时频域混合信号；/n根据所述时频域混合信号以及包含有幅度调整因子的高斯混合模型的独立向量分析的代价函数，获得所述时频域混合信号的分离矩阵；/n根据所述分离矩阵，从所述时频域混合信号中获得每个声源的时频域信号。/n

【技术特征摘要】
1.一种语音分离方法，包括：
获取待处理的时频域混合信号；
根据所述时频域混合信号以及包含有幅度调整因子的高斯混合模型的独立向量分析的代价函数，获得所述时频域混合信号的分离矩阵；
根据所述分离矩阵，从所述时频域混合信号中获得每个声源的时频域信号。

2.根据权利要求1所述的语音分离方法，其中，所述获取待处理的时频域混合信号，包括：
基于多个音频采集装置各自对应的通道获取时域信号，得到多个时域信号；
将所述多个时域信号中的每一个时域信号转换为基于时频域的时频点信号，得到多个第一时频点信号；
将所述多个第一时频点信号进行空间白化处理，获得空间白化处理后的多个第二时频点信号；
其中，所述待处理的时频域混合信号由所述多个第二时频点信号形成。

3.根据权利要求1或2所述的语音分离方法，其中，所述根据所述时频域混合信号以及包含有幅度调整因子的高斯混合模型的独立向量分析的代价函数，获得所述时频域混合信号的分离矩阵，包括：
确定包含有幅度调整因子的高斯混合模型中的多个参数的初始值；
根据所述时频域混合信号，对具有初始值的高斯混合模型的独立向量分析的代价函数进行期望最大化处理，获得所述时频域混合信号的分离矩阵。

4.根据权利要求3所述的语音分离方法，其中，所述确定包含有幅度调整因子的高斯混合模型中的多个参数的初始值，包括：
为各声源的高斯混合模型中的各高斯模型的帧间共有频域特征以及各声源的高斯混合模型中的各帧的幅度调整因子分别设置初始值；
利用预先设置的均匀概率分布，确定各声源的高斯混合模型中的各高斯模型的先验概率的初始值。

5.根据权利要求3或4所述的语音分离方法，其中，所述根据所述时频域混合信号以及包含有幅度调整因子的高斯混合模型的独立向量分析的代价函数，获得所述时频域混合信号的分离矩阵，包括：
根据所述时频域混合信号，对具有初始值的高斯混合模型的独立向量分析的代价函数进行期望最大化处理，获得所述代价函数中...

【专利技术属性】
技术研发人员：顾昭仪，卢晶，
申请(专利权)人：南京人工智能高等研究院有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人