合成语音识别方法、装置、设备及存储介质制造方法及图纸

技术编号：34449501 阅读：32 留言：0更新日期：2022-08-06 16:48

本发明专利技术涉及生物识别技术，揭露了一种合成语音识别方法，包括：获取待识别语音信号，并对所述待识别语音信号执行语音加窗分帧处理，得到分帧语音集；分别提取所述分帧语音集中每一帧语音信号的基音频率，并根据所述基音频率从所述分帧语音集中的语音信号中筛选出为浊音帧的语音信号；利用预构建的谐波加噪声模型提取所述分帧语音集中为浊音帧的语音信号的谐波信息及噪声信息；利用所述谐波信息及所述噪声信息计算所述待识别语音信号的子带能量比，并根据所述子带能量比判定所述待识别语音信号是否为合成语音。本发明专利技术还提出一种合成语音识别装置、设备以及存储介质。本发明专利技术可以提高合成语音识别的精准度。合成语音识别的精准度。合成语音识别的精准度。

全部详细技术资料下载

【技术实现步骤摘要】
合成语音识别方法、装置、设备及存储介质

[0001]本专利技术涉及生物识别
，尤其涉及一种合成语音识别方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]随着声纹识别技术的发展，现如今用户可以通过声纹来表征用户的身份信息，但也随着声纹合成技术的进步，用户的声纹特征会被恶意合成，用户的身份信息得不到保障。因此，亟需一种合成声纹识别方法来识别被恶意合成的声纹，及时保障用户的信息安全。

技术实现思路

[0003]本专利技术提供一种合成语音识别方法、装置、设备及存储介质，其主要目的在于解决进行合成语音识别的精准度较低的问题。
[0004]为实现上述目的，本专利技术提供的一种合成语音识别方法，包括：
[0005]获取待识别语音信号，并对所述待识别语音信号执行语音加窗分帧处理，得到分帧语音集；
[0006]分别提取所述分帧语音集中每一帧语音信号的基音频率，并根据所述基音频率从所述分帧语音集中的语音信号中筛选出为浊音帧的语音信号；
[0007]利用预构建的谐波加噪声模型提取所述分帧语音集中为浊音帧的语音信号的谐波信息及噪声信息；
[0008]利用所述谐波信息及所述噪声信息计算所述待识别语音信号的子带能量比，并根据所述子带能量比判定所述待识别语音信号是否为合成语音。
[0009]可选地，所述对所述待识别语音信号执行语音加窗分帧处理，得到分帧语音集，包括：
[0010]对所述待识别语音信号执行交叠分段处理，得到分段语音信号；
[0011...

【技术保护点】

【技术特征摘要】
1.一种合成语音识别方法，其特征在于，所述方法包括：获取待识别语音信号，并对所述待识别语音信号执行语音加窗分帧处理，得到分帧语音集；分别提取所述分帧语音集中每一帧语音信号的基音频率，并根据所述基音频率从所述分帧语音集中的语音信号中筛选出为浊音帧的语音信号；利用预构建的谐波加噪声模型提取所述分帧语音集中为浊音帧的语音信号的谐波信息及噪声信息；利用所述谐波信息及所述噪声信息计算所述待识别语音信号的子带能量比，并根据所述子带能量比判定所述待识别语音信号是否为合成语音。2.如权利要求1所述的合成语音识别方法，其特征在于，所述对所述待识别语音信号执行语音加窗分帧处理，得到分帧语音集，包括：对所述待识别语音信号执行交叠分段处理，得到分段语音信号；利用预构建的加窗函数对所述分段语音信号执行加权计算，得到分帧语音集。3.如权利要求2所述的合成语音识别方法，其特征在于，所述对所述待识别语音信号执行语音加窗分帧处理之前，所述方法还包括：提取所述待识别语音信号中的高频分量；利用预构建的语音信号加重技术对所述高频分量执行预加重处理。4.如权利要求3所述的合成语音识别方法，其特征在于，所述利用预构建的语音信号加重技术对所述高频分量执行预加重处理，包括：构建所述高频分量的连续折线图，并判断所述连续折线图中处于相邻位置的两个相邻高频分量是否相同；在所述连续折线图中处于相邻位置的两个相邻高频分量相同时，保持两个所述相邻高频分量不变；当所述连续折线图中处于相邻位置的两个相邻高频分量不相同时，则将两个所述相邻高频分量中后一个高频分量增大预设倍数，相邻的前一个高频分量保持不变。5.如权利要求1所述的合成语音识别方法，其特征在于，所述根据所述基音频率从所述分帧语音集中的语音信号中筛选出为浊音帧的语音信号，包括：对所述分帧语音集中的语音信号执行降采样处理；计算所述执行降采样处理后的所述分帧语音集中的语音信号的互相关函数的峰值点，并根据所述峰值点确定所述分帧语音集中每一帧语音信号的基音频率；判断所述基音频率是否处于预设的基音频率区间；当所述基音频率不处于所...

【专利技术属性】
技术研发人员：魏林强，
申请(专利权)人：平安普惠企业管理有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人