System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及声纹聚类领域,具体涉及一种基于声纹聚类的阈值选取方法、声纹聚类方法及装置。
技术介绍
1、声纹聚类是指将属于同一人的语音数据聚为一类的技术。一般的算法流程是提取每条语音数据的声纹特征,然后计算声纹特征间的相似度,根据聚类算法及阈值进行聚类。在实际的使用中,通常阈值的设定是基于预先准备的测试数据进行调优和选取,从而固定阈值。然而由于语音的时长,质量,编码等因素会影响到实际场景下声纹特征间相似度的分布情况,使得预设的阈值的分类效果变差甚至失效。
技术实现思路
1、针对上述提到声纹聚类中由于预设阈值不匹配实际场景造成效果差的技术问题。本申请的实施例的目的在于提出了一种基于声纹聚类的阈值选取方法、声纹聚类方法及装置,来解决以上
技术介绍
部分提到的技术问题。
2、第一方面,本专利技术提供了一种基于声纹聚类的阈值选取方法,包括以下步骤:
3、获取待聚类的语音数据集合,并提取语音数据集合中的每个语音数据的声纹特征;
4、计算每两个语音数据的声纹特征之间的相似度,得到相似度集合;
5、对相似度集合进行二分类,得到对应相似度低的第一类相似度集合以及对应相似度高的第二类相似度集合,分别计算第一类相似度集合和第二类相似度集合中相似度的均值和标准差;
6、基于第一类相似度集合和第二类相似度集合中相似度的均值和标准差采用高斯混合模型对相似度集合进行二次拟合,得到高斯混合模型的参数,根据高斯混合模型的参数选取声纹聚类算法的阈值。
< ...【技术保护点】
1.一种基于声纹聚类的阈值选取方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于声纹聚类的阈值选取方法,其特征在于,所述基于所述第一类相似度集合和第二类相似度集合中相似度的均值和标准差采用高斯混合模型对所述相似度集合进行二次拟合,得到高斯混合模型的参数,具体包括:
3.根据权利要求2所述的基于声纹聚类的阈值选取方法,其特征在于,所述高斯混合模型包括第一高斯模型和第二高斯模型,公式如下:
4.根据权利要求3所述的基于声纹聚类的阈值选取方法,其特征在于,所述采用所述第一类相似度集合和第二类相似度集合中相似度的均值和标准差对所述高斯混合模型进行初始化,具体包括:
5.根据权利要求3所述的基于声纹聚类的阈值选取方法,其特征在于,所述声纹聚类算法的阈值包括(u1+u2)/2、u1+2σ1或者u2-2σ2。
6.根据权利要求1所述的基于声纹聚类的阈值选取方法,其特征在于,所述二分类的方式包括k-means算法。
7.一种声纹聚类方法,其特征在于,包括以下步骤:
8.一种基于声纹聚类的阈值选取装置,
9.一种电子设备,包括:
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
...【技术特征摘要】
1.一种基于声纹聚类的阈值选取方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于声纹聚类的阈值选取方法,其特征在于,所述基于所述第一类相似度集合和第二类相似度集合中相似度的均值和标准差采用高斯混合模型对所述相似度集合进行二次拟合,得到高斯混合模型的参数,具体包括:
3.根据权利要求2所述的基于声纹聚类的阈值选取方法,其特征在于,所述高斯混合模型包括第一高斯模型和第二高斯模型,公式如下:
4.根据权利要求3所述的基于声纹聚类的阈值选取方法,其特征在于,所述采用所述第一类相似度集合和第二类相似度集合中相似度的均值和标准差对所述高斯混合模型进行初...
【专利技术属性】
技术研发人员:洪国强,肖龙源,李海洲,李稀敏,叶志坚,
申请(专利权)人:厦门快商通科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。