一种基于声谱图的声纹识别集成模型的防御方法及防御装置制造方法及图纸

技术编号：24577796 阅读：17 留言：0更新日期：2020-06-21 00:38

本发明专利技术公开了一种基于声谱图的声纹识别集成模型的防御方法，包括：(1)采集音频文件，并对音频文件转化为声谱图，该声谱图作为良性样本；(2)利用良性样本训练多个声纹识别模型，获得训练好的多个声纹识别模型；(3)采用投票机制从训练好的多个声纹识别模型从筛选获得较优的多个声纹识别模型进行集成，形成声纹识别集成模型，利用良性样本重新训练声纹识别集成模型；(4)采集布谷鸟搜索算法分别攻击多个声纹识别模型，生成对抗样本；(5)利用对抗样本和良性样本对步骤(3)获得的声纹识别集成模型进行再训练，获得能够抵抗攻击的声纹识别集成模型；(6)利用步骤(5)获得的声纹识别集成模型对音频文件对应的声谱图进行防御识别。

An integrated model of Voiceprint Recognition Based on Spectrogram

全部详细技术资料下载

【技术实现步骤摘要】
一种基于声谱图的声纹识别集成模型的防御方法及防御装置
本专利技术属于信息安全研究领域，具体涉及一种基于声谱图的声纹识别集成模型的防御方法及防御装置。
技术介绍
由于每个人的发声器官—舌，牙齿，肺等在尺寸和形态上存在很大差异，因此每个人说话的声音都不同，其声谱图都存在差异，实际上就是每个人的声音都带有独特的身份信息，声纹识别就是利用了声音的这一特性来识别说话人的身份。声纹识别是生物识别技术的一种，分为文本相关和文本无关的声纹识别。文本无关的声纹识别：指声纹识别系统对于语音文本内容是没有任何要求，说话人的说话内容比较自由随意。文本相关的声纹识别：指说话人识别系统，要求用户必须按照事先指定的内容进行发音。文本相关声纹识别模型要求用户按照规定的文本发音，一旦用户的发音有误就会造成身份无法识别的情况，应用面较窄。文本无关的声纹识别模型对用户的发声内容没有要求，识别方便，其应用面较为广泛，但实现难度较高。深度神经网络可以充分利用语音特征之间的关联性，将连续帧的语音特征合并后进行训练，使声纹识别系统的识别率大幅度提高。基于深度神经网络的声纹识别系统在提高识别准确率为人们带来便利的同时，也带来了相应的风险。深度神经网络容易受到对输入数据添加细微扰动形式的对抗攻击，攻击者在获得某一目标说话人的特征后，可以给某个说话人音频添加精心计算的扰动，使得生成的对抗样本被声纹识别模型错误的识别为目标说话人，这给声纹识别系统以及个人的财产安全带来了极大的安全隐患。已有的声纹识别攻击方法主要分为白盒和黑盒攻击。白盒攻击是攻击者在已知模...

【技术保护点】
1.一种基于声谱图的声纹识别集成模型的防御方法，其特征在于，包括以下步骤：/n(1)采集音频文件，并将音频文件转化为声谱图，该声谱图作为良性样本；/n(2)利用良性样本训练多个图像识别模型，使图像识别模型达到声纹识别的效果，从而获得多个基于图像的声纹识别模型；/n(3)采用投票机制将步骤(2)中训练好的多个基于图像的声纹识别模型进行集成，形成声纹识别集成模型，利用良性样本重新训练声纹识别集成模型；/n(4)采用布谷鸟搜索算法分别攻击多个声纹识别模型，生成对抗样本，并将对抗样本转化为声谱图，作为恶性样本；/n(5)利用恶性样本和良性样本对步骤(3)获得的基于图像的声纹识别集成模型进行再训练，获得能够抵抗攻击的声纹识别集成模型；/n(6)利用步骤(5)获得的声纹识别集成模型对音频文件对应的声谱图进行防御识别。/n

【技术特征摘要】
1.一种基于声谱图的声纹识别集成模型的防御方法，其特征在于，包括以下步骤：
(1)采集音频文件，并将音频文件转化为声谱图，该声谱图作为良性样本；
(2)利用良性样本训练多个图像识别模型，使图像识别模型达到声纹识别的效果，从而获得多个基于图像的声纹识别模型；
(3)采用投票机制将步骤(2)中训练好的多个基于图像的声纹识别模型进行集成，形成声纹识别集成模型，利用良性样本重新训练声纹识别集成模型；
(4)采用布谷鸟搜索算法分别攻击多个声纹识别模型，生成对抗样本，并将对抗样本转化为声谱图，作为恶性样本；
(5)利用恶性样本和良性样本对步骤(3)获得的基于图像的声纹识别集成模型进行再训练，获得能够抵抗攻击的声纹识别集成模型；
(6)利用步骤(5)获得的声纹识别集成模型对音频文件对应的声谱图进行防御识别。

2.如权利要求1所述的基于声谱图的声纹识别集成模型的防御方法，其特征在于，将音频文件转化为声谱图的具体步骤为：
对音频进行分帧，并对每帧语音信号加窗处理后进行短时傅里叶变换；
计算短时傅里叶变换结果的功率谱，并对功率谱进行归一化处理，获得声谱图，将声谱图与对应的说话者组成一个良性样本。

3.如权利要求1所述的基于声谱图的声纹识别集成模型的防御方法，其特征在于，所述图像识别模型采用VGG16或VGG19。

4.如权利要求3所述的基于声谱图的声纹识别集成模型的防御方法，其特征在于，所述利用良性样本训练多个基于图像的声纹识别模型的具体过程为：
对声谱图进行预处理，将声谱图大小设置为224×224×3，获得声谱图样本；
声谱图样本xi经过声纹识别模型输出的置信度为yipre，用交叉熵作损失函数，利用损失函数L(xi)优化声纹识别模型的参数；
L(xi)＝-[yilogyipre+(1-yi)log(1-yipre)]
利用测试集中的声谱图测试训练的声纹识别模型的准确率，在识别精度达不到要求时，重新训练声纹识别模型，直到识别精度达到要求为止。

5.如权利要求1所述的基于声谱图的声纹识别集成模型的防御方法，其特征在于，步骤(3)的具体过程为：
利用投票机制将多个声纹识别模型进行集成，获得声纹识别集成模型；
投票...

【专利技术属性】
技术研发人员：陈晋音，叶林辉，王雪柯，郑喆，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人