【技术实现步骤摘要】
本专利技术涉及语音处理领域,特别涉及一种应用于说话人识别的噪声消除方法。
技术介绍
随着现代社会信息的全球化,说话人识别成为语音识别技术研究热点之一。随着互联网的普及,网上用户登录、网上支付等也面临着一定的风险,声纹密码可以在原有密码基础上增加账户的安全性。声纹识别即说话人识别系统,目前在实验环境下达到了很高的识别效果,但在实际应用中却表现不佳。导致这一结果的原因主要是由于实际应用中噪声对语音的影响,这里的噪声主要包括环境噪声和信道噪声。当前,如何提高噪声条件下的声纹识别效果,已经成为了该领域的研究重点。在参考文献[1](SadjadiSO,HasanT,HansenJHL.MeanHilbertEnvelopeCoefficients(MHEC)forRobustSpeakerRecognition[C]//INTERSPEECH.2012)、参考文献[2](ShaoY,WangDL.Robustspeakeridentificationusingauditoryfeaturesandcomputationalauditorysceneanalysis[C]//Acoustics,SpeechandSignalProcessing,2008.ICASSP2008.IEEEInternationalConferenceon.IEEE,2008:1589-1592)和参考文献[3](LiQ,HuangY.Robustspeakeridentificationusinganauditory-basedfeature[C]//AcousticsSpeechan ...
【技术保护点】
一种应用于说话人识别的噪声消除方法,包括:利用加噪后语音的声学谱特征时域上相邻的多帧特征来消除特征中噪声的影响。
【技术特征摘要】
1.一种应用于说话人识别的噪声消除方法,包括:利用加噪后语音的声学谱特征时域上相邻的多帧特征来消除特征中噪声的影响。2.根据权利要求1所述的应用于说话人识别的噪声消除方法,其特征在于,该方法包括以下步骤:步骤1)、判断测试集中的语音数据所包含的噪声类型,对所含噪声类型中的任意一种噪声类型,在较宽的信噪比范围内取若干个有代表性的信噪比,作为与该噪声类型相对应的信噪比;其中,所述测试集包括了用于做说话人识别的语音数据;步骤2)、采用多个不含噪声的训练集语音数据作为噪声消除训练数据,为噪声消除训练数据按照步骤1)取定的若干个信噪比分别进行加噪,得到加噪后的噪声消除训练数据组;其中,所述训练集包括来自说话人识别系统中的通用背景模型的语音数据;步骤3)、对未加噪前的噪声消除训练数据和步骤2)所得到的加噪后的噪声消除训练数据分别提取声学谱特征,得到对应的声学谱特征组;步骤4)、根据步骤3)所得到的未加噪前的噪声消除训练数据的声学谱特征组,以及按照某一信噪比加噪后的噪声消除训练数据的声学谱特征组,利用梯度下降算法训练该信噪比对应的特征邻近帧补偿的模型参数;重复本步骤,直至得到步骤1)中所选择的所有信噪比所对应的特征邻近帧补偿的模型参数;步骤5)、为测试集中的语音提取声学谱特征;步骤6)、为测试集中的每句语音分别做噪声类型判断和信噪比估计;步骤7)、根据步骤6)所得到的噪声类型与信噪比估计结果,从步骤1)中所确定的若干个有代表性的信噪比中寻找最为接近的信噪比,然后从步骤4)所得到的结果中选取与该...
【专利技术属性】
技术研发人员:袁庆升,颜永红,包秀国,黄厚军,云晓春,周若华,陈训逊,黄文廷,
申请(专利权)人:国家计算机网络与信息安全管理中心,中国科学院声学研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。