【技术实现步骤摘要】
本专利技术属于音频
,具体涉及。
技术介绍
概率线性判别分析(ProbabilisticLinear Discriminant Analysis,PLDA)已被证明是一种有效的低维空间表示方法,其优异的性能体现在人脸识别和说话人识别等多种生物身份认证领域。PLDA的基本方法可以表述为,在训练阶段利用训练数据之间的类内差异(within-1ndividual)变量和类间差异(between-1ndividual)变量产生一个生成模型(generativemodel);在识别阶段,该方法主要计算一种用于描述基于待识别数据的类内差异相似度。概率线性判别分析(ProbabilisticLinear Discriminant Analysis,PLDA)是一种基于线性判别分析(Linear Discriminant Analysis, LDA)的概率扩展方法。LDA是在1996年由Belhumeur引入模式识别和人工智能领域的,LDA通过产生原始数据空间的线性变换矩阵将原始高维数据投影到低维最佳鉴别矢量空间。LDA主要根据Fisher准则,将不同类数据尽量分开,将同一类数据尽量聚拢,保证投影后的数据在新的空间中具有最小的类内距离和最大的类间距离。当类的个数大于两个的时候采用多类LDA算法,内容如下假设有属于c(c>2)类的给定数据Ixiij e RN},其中i(l≤i≤C)表示类别,j表示第i类中的第j (I≤j≤Hi)个数据,IIi为第i类中的数据数,数据总数为n,第i类的平均值为IV所有数据的整体平均值为m。LDA的目标是寻找Xm的一个最佳投影矩阵 ...
【技术保护点】
一种基于局部学习的说话人识别方法,包括训练阶段与识别阶段,其特征在于,训练阶段包括:将训练数据通过提取特征和聚类方法分为特征空间上的多类训练集;针对每类训练集进行局部学习,通过概率线性判别分析方法获得多个模型Xi,j,c=μc+Fchi,c+Gcwi,j,c+εi,j,c;其中,X代表训练数据,i代表第i个说话人,j代表第j个数据矢量,c代表第c类,μc为第c类训练数据的均值矢量,矩阵Fc代表第c类训练数据的类间子空间的基,hi,c代表Fc在子空间的对应位置,矩阵Gc代表第c类训练数据的类内子空间的基,wi,j,c代表Gc在子空间的对应位置,εi,j,c代表第c类训练数据的残留噪声;识别阶段包括:对待识别数据提取特征并进行分类判决得到特征空间上的多类待识别集;针对每类待识别集进行局部学习,根据训练数据得到的多个模型计算每类待识别集的后验概率作为结果。
【技术特征摘要】
1.一种基于局部学习的说话人识别方法,包括训练阶段与识别阶段,其特征在于, 训练阶段包括 将训练数据通过提取特征和聚类方法分为特征空间上的多类训练集; 针对每类训练集进行局部学习,通过概率线性判别分析方法获得多个模型Xq,。=y C+FchijC+GcWij Jj c+ ε ijJjC ; 其中,X代表训练数据,i代表第i个说话人,j代表第j个数据矢量,c代表第c类,μ。为第c类训练数据的均值矢量,矩阵F。代表第c类训练数据的类间子空间的基,hi,。代表F。在子空间的对应位置,矩阵G。代表第c类训练数据的类内子空间的基,Wij。代表G。在子空间的对应位置,ε 代表第c类训练数据的残留噪声; 识别阶段包括 对待识别数据提取特征并进行分类判决得到特征空间上的多类待识别集; 针对每类待识别集进行局部学习,根据训练数据得到的多个模型计算每类待识别集的后验概率作为结果。2.按照权利要求1所述基于局部学习的说话人识别方法,其特征在于,所述训练数据与识别阶段的提取特征方法均是通过对原始语音数据提取Mel频率倒谱系数(MelFrequency Cepstrum Coefficient, MFCC)作为特征数据实现。3.按照权利要求1或2所述基于局部学习的说话人识别方法,其特征在于,所述训练数据的聚类方法的具体实现步骤如下 步骤一、根据预设的k值建立初始划分来获得k个初始聚类; 步骤二、计算每个数据到各个聚类中心数据值的距离,将它加入到最邻近的一个聚类; 步骤三、重新计算每个聚类中心数据值; 步骤四、重复步骤二和步骤三,直到各个聚类中心数据值在某个精度范围内不变化或...