基于网络融合的声纹识别方法及系统技术方案

技术编号:33737288 阅读:67 留言:0更新日期:2022-06-08 21:34
本发明专利技术公开了基于网络融合的声纹识别方法及系统,涉及声纹识别技术领域,过程包括用户进行注册登录并存储个人信息至服务器;声纹存储模块对服务器内存储的阅读语音进行声纹处理;语音采集模块对用户的语音进行实时获取;声纹识别模块进行声纹认证,声纹识别模块将声纹处理模块发送的识别包进行初识别,获取中间变量值Zbi,并接收声纹处理模块发送的实时的中间变量值Zbj;声纹处理模块利用计算公式计算确认认证指数RZ,遍历服务器内存储的所有用户的识别包,设定认证指数阈值,当存在认证指数RZ大于认证指数阈值则将对应认证指数RZ值最大的用户发送至声纹识别模块,声纹识别模块完成声纹识别。模块完成声纹识别。模块完成声纹识别。

【技术实现步骤摘要】
基于网络融合的声纹识别方法及系统


[0001]本专利技术属于声纹识别
,具体是基于网络融合的声纹识别方法及系统。

技术介绍

[0002]声纹识别,生物识别技术的一种,也称为说话人识别,包括说话人辨认和说话人确认。声纹识别就是把声信号转换成电信号,再用计算机进行识别。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。
[0003]在现有的声纹识别过程中,同一个人的声音具有易变性,易受身体状况、年龄、情绪等的影响;比如不同的麦克风和信道对识别性能有影响;比如环境噪音对识别有干扰;又比如混合说话人的情形下人的声纹特征不易提取;为此,提出基于网络融合的声纹识别方法及系统。

技术实现思路

[0004]本专利技术旨在至少解决现有技术中存在的技术问题之一。
[0005]为实现上述目的,根据本专利技术的第一方面的实施例提出基于网络融合的声纹识别系统,包括注册登录模块、语音采集模块、声纹处理模块、服务器以及声纹识别模块;
[0006]所述注册登录模块用于用户输入个人信息完成注册,并将注册成功的个人信息发送至服务器内部进行存储;
[0007]所述服务器用于存储注册登录模块发送的注册成功的个人信息,并将个人信息内的阅读语音发送至声纹处理模块;
[0008]所述声纹处理模块用于对服务器发送的语音包进行处理,声纹处理模块获取语音包,并进一步获取阅读语音,将阅读语音划分为若干个语音片段,声纹处理模块获取语音片段i的声音响度以及声音频率,并分别进行标记为Ai、Fi;声纹处理模块通过计算公式计算出语音片段的特征值Tzi,声纹处理模块将后一语音片段的特征值Tz(i+1)与当前语音片段的特征值Tzi进行相减得到中间变量值Zbi;声纹处理模块将当前语音片段的特征值Tzi与中间变量值Zbi进行组合,并标记为识别包;
[0009]语音采集模块用于对用户的语音进行实时的获取,将采集的实时阅读语音发送至声纹处理模块,获取语音片段的特征值Tzj与中间变量值Zbj;
[0010]声纹识别模块用于对接收到的特征值Tzj确定用户身份,声纹识别模块将声纹处理模块发送的识别包进行初识别,获取中间变量值Zbi,并接收声纹处理模块发送的实时的中间变量值Zbj;声纹处理模块利用计算公式计算确认认证指数RZ,遍历服务器内存储的所有用户的识别包,设定认证指数阈值,当存在认证指数RZ大于认证指数阈值则将对应认证指数RZ值最大的用户发送至声纹识别模块,声纹识别模块完成声纹识别。
[0011]优选的,所述个人信息包括于姓名、年龄以及阅读语音;阅读语音为用户在进行注册时朗读的指定文字的音频数据,注册登录模块内置语音采集单元。
[0012]优选的,所述语音采集模块为语音采集设备,且语音采集设备的型号与语音采集单元的语音采集设备的型号一致。
[0013]优选的,服务器将用户按照注册成功时间将用户进行编号,且将编号与阅读语音进行绑定,生成指定语音包,服务器发送至声纹处理模块的阅读语音是以语音包的形式进行发送传输。
[0014]优选的,在进行语音片段编号时,去除静音的语音片段。
[0015]根据本专利技术的第二方面的实施例提出基于网络融合的声纹识别方法,包括以下步骤:
[0016]用户进行注册登录并存储个人信息至服务器;
[0017]声纹存储模块对服务器内存储的阅读语音进行声纹处理;
[0018]语音采集模块对用户的语音进行实时获取;
[0019]声纹识别模块进行声纹认证,声纹识别模块将声纹处理模块发送的识别包进行初识别,获取中间变量值Zbi,并接收声纹处理模块发送的实时的中间变量值Zbj;声纹处理模块利用计算公式计算确认认证指数RZ,遍历服务器内存储的所有用户的识别包,设定认证指数阈值,当存在认证指数RZ大于认证指数阈值则将对应认证指数RZ值最大的用户发送至声纹识别模块,声纹识别模块完成声纹识别。
[0020]与现有技术相比,本专利技术的有益效果是:
[0021]本专利技术阅读语音为用户在进行注册时朗读的指定文字的音频数据,即所述注册登录模块内置语音采集单元,所述语音采集单元与本系统中的语音采集模块功能一致,且采用同样型号的语音采集设备,保证在进行声纹识别时不会受不同采集设备的影响;在对语音片段进行顺序编号时,因为涉及到个人的个人说话习惯的问题,以及在进行语音划分时的细化程度,所以在进行语音片段编号时,去除静音的语音片段;
[0022]语音采集模块对用户的语音进行实时获取时,获取的内容为阅读语音,阅读语音为指定文字的音频数据,且指定文字与用户在进行注册时朗读的指定文字一致;所述语音采集模块为语音采集设备,且语音采集设备的型号与语音采集单元的语音采集设备的型号一致,是为了保证在进行声纹识别时不会受不同采集设备的影响;
[0023]在进行声纹识别时,遍历服务器内存储的所有用户的识别包,设定认证指数阈值,当存在认证指数RZ大于认证指数阈值则将对应认证指数RZ值最大的用户发送至声纹识别模块,声纹识别模块完成声纹识别。
附图说明
[0024]图1为本专利技术的原理图。
[0025]图2为本专利技术的流程图。
具体实施方式
[0026]下面将结合实施例对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0027]如图1所示,基于网络融合的声纹识别系统,包括注册登录模块、语音采集模块、声纹处理模块、服务器以及声纹识别模块;
[0028]所述注册登录模块用于用户输入个人信息完成注册,并将注册成功的个人信息发送至服务器内部进行存储;所述个人信息包括但不限于姓名、年龄以及阅读语音;在一个具体的实施例中,阅读语音为用户在进行注册时朗读的指定文字的音频数据,即所述注册登录模块内置语音采集单元,所述语音采集单元与本系统中的语音采集模块功能一致,且采用同样型号的语音采集设备,保证在进行声纹识别时不会受不同采集设备的影响;
[0029]其中,所述服务器用于存储注册登录模块发送的注册成功的个人信息,并将个人信息内的阅读语音发送至声纹处理模块,其中需要进行说明的是,服务器将用户按照注册成功时间将用户进行编号,且将编号与阅读语音进行绑定,生成指定语音包,服务器发送至声纹处理模块的阅读语音是以语音包的形式进行发送传输;
[0030]需要进行说明的是,所述声纹处理模块用于对服务器发送的语音包进行处理,具体的,所述声纹处理模块对语音包进行处理的过程包括以下步骤:
[0031]步骤一:声纹处理模块获取语音包,并进一步获取阅读语音,将阅读语音划分为若干个语音片段,并对每个语音片段进行顺序编号;标记为i,其中i为正整数,且i=1,2
……
n;
[0032]其中需要进行说明的是,在对语音片段进行顺序编号时本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于网络融合的声纹识别系统,其特征在于,包括注册登录模块、语音采集模块、声纹处理模块、服务器以及声纹识别模块;所述注册登录模块用于用户输入个人信息完成注册,并将注册成功的个人信息发送至服务器内部进行存储;所述服务器用于存储注册登录模块发送的注册成功的个人信息,并将个人信息内的阅读语音发送至声纹处理模块;所述声纹处理模块用于对服务器发送的语音包进行处理,声纹处理模块获取语音包,并进一步获取阅读语音,将阅读语音划分为若干个语音片段,声纹处理模块获取语音片段i的声音响度以及声音频率,并分别进行标记为Ai、Fi;声纹处理模块通过计算公式计算出语音片段的特征值Tzi,声纹处理模块将后一语音片段的特征值Tz(i+1)与当前语音片段的特征值Tzi进行相减得到中间变量值Zbi;声纹处理模块将当前语音片段的特征值Tzi与中间变量值Zbi进行组合,并标记为识别包;语音采集模块用于对用户的语音进行实时的获取,将采集的实时阅读语音发送至声纹处理模块,获取语音片段的特征值Tzj与中间变量值Zbj;声纹识别模块用于对接收到的特征值Tzj确定用户身份,声纹识别模块将声纹处理模块发送的识别包进行初识别,获取中间变量值Zbi,并接收声纹处理模块发送的实时的中间变量值Zbj;声纹处理模块利用计算公式计算确认认证指数RZ,遍历服务器内存储的所有用户的识别包,设定认证指数阈值,当存在认证指数RZ大于认证指数阈值则将对应认证指数RZ值最大的用户发送至声纹识别模块,声纹识别模块完成声纹识别。2.根据...

【专利技术属性】
技术研发人员:陈亮
申请(专利权)人:广州科慧健远医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1