当前位置: 首页 > 专利查询>河海大学专利>正文

一种基于DBSCAN算法的声纹识别方法技术

技术编号:14135971 阅读:115 留言:0更新日期:2016-12-10 03:55
本发明专利技术公开了一种基于DBSCAN算法的声纹识别方法,包括语音特征的提取,语音片段相似度的评价,训练集语音的筛选,对检验语音的判断算法。其中,语音特征提取采用mel倒谱系数进行特征提取;语音相似度评价采用余弦相似度进行相似度的计算;训练语音的筛选采用固定阈值进行筛选;对检验语音的判断利用改进的DBSCAN算法进行判断。本发明专利技术基于DBSCAN算法的声纹识别方法,不需要很庞大的训练集,只需要一些经过筛选的训练语音作为训练集即可,并且利用这些训练语音的分布特性对检验语音进行判别,具有十分良好的用户体验和较高的识别率。

【技术实现步骤摘要】

本专利技术涉及一种基于DBSCAN算法的声纹识别方法,通过计算机对说话人进行识别,属于语音识别

技术介绍
随着网络和通信的发展以及智能手机的普及,电子商务及移动支付迅速兴起。由于网络的不安全性因素,信息安全成了当今社会关注的焦点问题,身份认证作为信息安全的一种重要手段也越来越受到人们的重视。目前使用最广泛的身份认证方式属于密码验证存取行为,此类认证方式存在着密码遗忘、易被破解等诸多问题,一旦被非法用户获取,将会对个人或单位造成巨大损失。因此人们试图寻找一种更为安全可靠的身份认证方式,而人体所固有的生物特征为此提供了更为便捷的途径。人体有许多固有特征,比如指纹、虹膜等,这些生物识别技术已经得到了一定程度的开发和利用。声纹同样也是我们人类每个人都独有的特征,每个人的声音特点都是独一无二的,与指纹一样,声纹是说话人独一无二的语音特征,即使说出同一句话,在能量、频谱、语调等等方面都是不一样的。但是,在声纹识别领域目前的利用程度较低,声纹识别必将是生物识别领域的下一片蓝海。
技术实现思路
本专利技术所要解决的技术问题是:提供一种基于DBSCAN算法的声纹识别方法,该方法不需要很庞大的训练集,只需要经过筛选的训练语音作为训练集即可,识别准确率较高。本专利技术为解决上述技术问题采用以下技术方案:一种基于DBSCAN算法的声纹识别方法,包括如下步骤:步骤1,获取检验语音和某说话人的训练集语音,训练集语音包含预设的偶数个训练语音,利用mel倒谱系数分别对训练集语音和检验语音进行语音特征提取,得到各自对应的语音特征向量;步骤2,对步骤1得到的训练集语音的语音特征向量,利用基于余弦相似度的分组筛选方法进行筛选,当经过筛选后得到的语音特征向量的个数少于步骤1的预设值时,继续获取训练语音,并进行语音特征提取和筛选,直至最后得到的语音特征向量的个数满足步骤1的预设值;步骤3,利用改进的DBSCAN算法对检验语音进行识别,在改进的DBSCAN算法中,利用距离参数计算检验语音与训练语音是否相似的阈值时,定义距离参数为利用区间估计计算该阈值时的置信区间的大小。作为本专利技术的一种优选方案,所述步骤1的具体过程为:根据奈奎斯特采样定律对训练语音进行依次采样并存储,得到训练集语音;利用mel倒谱系数分别对训练集语音和检验语音进行语音特征提取,得到各自对应的特征系数,将特征系数矢量化,从而得到各自对应的语音特征向量。作为本专利技术的一种优选方案,步骤2所述对步骤1得到的训练集语音的语音特征向量,利用基于余弦相似度的分组筛选方法进行筛选的具体过程为:将步骤1得到的训练集语音的语音特征向量按顺序标号,并以标号的奇偶分为两组,计算每组中各语音特征向量与其他语音特征向量的余弦相似度,并将余弦相似度转化为角度值,判断每组中各角度值与其他角度值之间的差值,当差值小于等于固定阈值时,则将该角度值对应的语音特征向量保留;否则,不保留。作为本专利技术的一种优选方案,所述步骤3的具体过程为:利用检验语音的语音特征向量与步骤2得到的各训练语音的语音特征向量,计算检验语音与各训练语音的余弦相似度,并将余弦相似度转化为角度值;当判断检验语音与其中一条训练语音是否相似时,利用距离参数计算检验语音与该训练语音是否相似的阈值,该阈值表示为其中,Y表示阈值,a表示距离参数对应于标准正态分布的横坐标,μ、σ分别表示该训练语音与其他训练语音之间的余弦相似度对应的角度值的平均值和标准差,判断检验语音与该训练语音的余弦相似度对应的角度值是否小于等于该训练语音对应的阈值,如果是,则认为检验语音与该训练语音相似,否则不相似;当相似的训练语音个数大于等于设定阈值时,认为检验语音与训练语音的说话人匹配,否则不匹配。作为本专利技术的一种优选方案,所述余弦相似度的计算公式为: c o s θ = Σ 1 m ( A i × B i ) Σ 1 m A i 2 × Σ 1 m B i 2 , ]]>其中,Ai表示第一个语音特征向量第i维的数值,Bi表示第二个语音特征向量第i维的数值,θ表示要计算的两条语音之间的余弦相似度对应的角度值,m表示各语音特征向量的维度。本专利技术采用以上技术方案与现有技术相比,具有以下技术效果:1、本专利技术基于DBSCAN算法的声纹识别方法,不需要很庞大的训练集,只需要一些经过筛选的训练语音作为训练集即可,并且利用这些训练语音的分布特性对检验语音进行判别。2、本专利技术基于DBSCAN算法的声纹识别方法,在实际使用过程中,灵活方便,使用快捷,具有十分良好的用户体验和较高的识别率。附图说明图1是本专利技术基于DBSCAN算法的声纹识别方法的整体架构图。图2是本专利技术中DBSCAN算法的一般模型图。图3是实施例中采用本专利技术基于DBSCAN算法的声纹识别方法进行识别的流程图。图4是本专利技术中利用正态分布的区间估计计算阈值的示意图。具体实施方式下面详细描述本专利技术的实施方式,所述实施方式的示例在附图中示出。下面通过参考附图描述的实施方式是示例性的,仅用于解释本专利技术,而不能解释为对本专利技术的限制。一种基于DBSCAN算法的声纹识别方法,包括:语音特征的提取,训练集语音的筛选,对检验语音的判断算法。所述语音特征提取采用mel倒谱系数进行特征提取;训练语音的筛选采用“基于余弦相似度的分组筛选”方法进行筛选;对检验语音的判断利用改进的DBSCAN算法进行判断。进一步地,所述语音特征提取过程中,根据经典的奈奎斯特采样定律,以高于两倍普通人所能发出的声音的最高频率进行采样并存储,并且利用经典的mel倒谱系数对所获取的语音信号进行特征提取,并把所获得一系列特征系数矢量化,得到一组多维向量。进一步地,所述训练语音筛选,一共筛选2n个语音片段数本文档来自技高网...
一种基于DBSCAN算法的声纹识别方法

【技术保护点】
一种基于DBSCAN算法的声纹识别方法,其特征在于,包括如下步骤:步骤1,获取检验语音和某说话人的训练集语音,训练集语音包含预设的偶数个训练语音,利用mel倒谱系数分别对训练集语音和检验语音进行语音特征提取,得到各自对应的语音特征向量;步骤2,对步骤1得到的训练集语音的语音特征向量,利用基于余弦相似度的分组筛选方法进行筛选,当经过筛选后得到的语音特征向量的个数少于步骤1的预设值时,继续获取训练语音,并进行语音特征提取和筛选,直至最后得到的语音特征向量的个数满足步骤1的预设值;步骤3,利用改进的DBSCAN算法对检验语音进行识别,在改进的DBSCAN算法中,利用距离参数计算检验语音与训练语音是否相似的阈值时,定义距离参数为利用区间估计计算该阈值时的置信区间的大小。

【技术特征摘要】
1.一种基于DBSCAN算法的声纹识别方法,其特征在于,包括如下步骤:步骤1,获取检验语音和某说话人的训练集语音,训练集语音包含预设的偶数个训练语音,利用mel倒谱系数分别对训练集语音和检验语音进行语音特征提取,得到各自对应的语音特征向量;步骤2,对步骤1得到的训练集语音的语音特征向量,利用基于余弦相似度的分组筛选方法进行筛选,当经过筛选后得到的语音特征向量的个数少于步骤1的预设值时,继续获取训练语音,并进行语音特征提取和筛选,直至最后得到的语音特征向量的个数满足步骤1的预设值;步骤3,利用改进的DBSCAN算法对检验语音进行识别,在改进的DBSCAN算法中,利用距离参数计算检验语音与训练语音是否相似的阈值时,定义距离参数为利用区间估计计算该阈值时的置信区间的大小。2.根据权利要求1所述基于DBSCAN算法的声纹识别方法,其特征在于,所述步骤1的具体过程为:根据奈奎斯特采样定律对训练语音进行依次采样并存储,得到训练集语音;利用mel倒谱系数分别对训练集语音和检验语音进行语音特征提取,得到各自对应的特征系数,将特征系数矢量化,从而得到各自对应的语音特征向量。3.根据权利要求1所述基于DBSCAN算法的声纹识别方法,其特征在于,步骤2所述对步骤1得到的训练集语音的语音特征向量,利用基于余弦相似度的分组筛选方法进行筛选的具体过程为:将步骤1得到的训练集语音的语音特征向量按顺序标号,并以标号的奇偶分为两组,计算每组中各语音特征向量与其他语音特征向量的余弦相似度,并将余弦相似度转化为角度值,判断每组中各角度值与其他角度值之间的差值,当差值小于等于固定阈值时,则将该角度值对应的语音特征向量保留;否则,不保留。4.根据权利要求1所述基于DBSCAN算法的声纹识别方法,其特征在于,所述步骤3的具体过程为:利用检验语音的语音特征向量与步骤2得到的各训练语音的语音特征向量,计算检验语音与各训练语音的余弦相似度,并将余弦相似度转化为角度值;当判断检验语音与其中一条训练语音是否相似时,利用距离参数计算检验语音与该训练语音是否相似的阈值,该阈值表示为其中,Y表示阈值,a表示距离参数对应于标准正态分布的横坐标,μ、σ分别表示该训练语音与其他训练语音之间的余弦相似度对应的角度值的平均值和标准差,判断检验语...

【专利技术属性】
技术研发人员:唐家博张雪洁黄星期金薛冬李瑞李智
申请(专利权)人:河海大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1