基于波形时频域分析的语义和声纹双重识别的方法及系统技术方案

技术编号：22331805 阅读：26 留言：0更新日期：2019-10-19 12:35

本申请公开了一种基于波形时频域分析的语义和声纹双重识别的方法、系统及存储介质。其中，所述语义和声纹双重识别的方法包括：获取语音信号，基于小波时频域分析方法对语音信号进行降噪处理，根据经过降噪处理的语音信号建立信号时频方差图像，利用多层感知机对信号时频方差图像进行处理并识别语义和声纹。本申请实施例中，由于采用小波时频域分析方法在小波域实现对语音信号的降噪处理与特征提取处理，将一维的语音信号变换成二维的语音图像，利用图像处理的方法处理语音图像，因此能够从时域和频域同时对语音信号进行细致的分析以获得更详细的特征信息，从而能够实现语义和声纹的双重识别，以提升用户的使用体验。

全部详细技术资料下载

【技术实现步骤摘要】
基于波形时频域分析的语义和声纹双重识别的方法及系统
本申请实施例涉及但不限于声音识别
，尤其涉及一种基于波形时频域分析的语义和声纹双重识别的方法、系统及存储介质。
技术介绍
语音识别，包括声纹识别和语义识别，声纹识别是指根据语音信号中包含的个人特征分量辨认说话人的身份，其关注的是说话人的个性特征；而语义识别则是根据语音信号中包含的内容信息识别说话人的说话内容，其关注的是说话人之间的共性特征。现有的语音识别方法中，往往只提取声纹特征而不识别语义内容，或者只对语义内容进行分析而没有对语音信号中包含的其他丰富信息进行充分的挖掘，仅能实现识别个人身份或者识别语义内容的功能，但这在信息技术高速发展的今天，是远不能满足人们的使用需求的，因此迫切需要一种更好的语音识别方法，以能够满足人们在物联网时代中对各种智能设备的使用。
技术实现思路
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。一方面，本申请实施例提供了一种基于波形时频域分析的语义和声纹双重识别的方法、系统及存储介质，能够对语义和声纹进行双重识别，以提升用户的使用体验。另一方面，本申请实施例提供了一种基于波形时频域分析的语义和声纹双重识别的方法，包括：获取语音信号；基于小波时频域分析方法对所述语音信号进行降噪处理；根据经过降噪处理的语音信号建立信号时频方差图像；利用经过训练的多层感知机对所述信号时频方差图像进行处理，识别语义和声纹。进一步，所述基于小波时频域分析方法对所述语音信号进行降噪处理，包括以下步骤：对所述语音信号进行端点检测，获取所述语音信号的起点和终点，得到有用语音信号；对所...

【技术保护点】
1.基于波形时频域分析的语义和声纹双重识别的方法，包括：获取语音信号；基于小波时频域分析方法对所述语音信号进行降噪处理；根据经过降噪处理的语音信号建立信号时频方差图像；利用经过训练的多层感知机对所述信号时频方差图像进行处理，识别语义和声纹。

【技术特征摘要】
1.基于波形时频域分析的语义和声纹双重识别的方法，包括：获取语音信号；基于小波时频域分析方法对所述语音信号进行降噪处理；根据经过降噪处理的语音信号建立信号时频方差图像；利用经过训练的多层感知机对所述信号时频方差图像进行处理，识别语义和声纹。2.根据权利要求1所述的方法，其特征在于，所述基于小波时频域分析方法对所述语音信号进行降噪处理，包括以下步骤：对所述语音信号进行端点检测，获取所述语音信号的起点和终点，得到有用语音信号；对所述有用语音信号进行小波变换，获取所述有用语音信号在不同尺度下的初始小波系数；获取第一自适应阈值，利用所述第一自适应阈值对所述有用语音信号进行整体降噪；获取第二自适应阈值，利用所述第二自适应阈值对经过整体降噪的有用语音信号进行局部降噪；获得对应于经过降噪处理的语音信号的小波系数。3.根据权利要求2所述的方法，其特征在于，所述获取第一自适应阈值，利用所述第一自适应阈值对所述有用语音信号进行整体降噪，包括：利用以下公式获取第一自适应阈值：其中，λj为尺度j上的第一自适应阈值，为尺度j上带有噪声的有用语音信号xj(n)的小波系数的标准差，为尺度j上有用语音信号sj(n)的小波系数的标准差，j>0；根据所述第一自适应阈值利用以下公式对所述有用语音信号进行整体降噪：其中，为尺度j上经过整体降噪后的有用语音信号的小波系数，sgn(·)为符号函数。4.根据权利要求3所述的方法，其特征在于，所述获取第二自适应阈值，利用所述第二自适应阈值对经过整体降噪的有用语音信号进行局部降噪，包括：利用以下公式获取第二自适应阈值：其中，为尺度j上的第二自适应阈值，为尺度j上带有噪声的有用语音信号xj(n)的小波系数的方差，为尺度j上有用语音信号sj(n)的小波系数的方差，为尺度j上噪声信号vj(n)的小波系数的方差，j>0；根据所述第二自适应阈值利用以下公式对经过整体降噪的有用语音信号进行局部降噪：其中，为尺度j上经过整体降噪后的有用语音信号的小波系数，yj(n)为尺度j上经过降噪处理的语音信号的小波系数。...

【专利技术属性】
技术研发人员：罗高涌，林海龙，曹海涛，胡宇鹏，
申请(专利权)人：江门市华恩电子研究院有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人