一种基于模糊支持向量机的语音情感识别方法技术

技术编号：10525794 阅读：144 留言：0更新日期：2014-10-09 11:14

本发明专利技术涉及语音情感识别技术，具体的说是涉及一种基于模糊支持向量机的语音情感识别方法。本发明专利技术的方法包括：对输入的带有情感的语音信号进行预处理；所述预处理包括预加重滤波和加窗分帧；提取处理后的语音信号的特征信息梅尔倒普系数(MFCC)；对所提取的梅尔倒普系数用核主成份分析(KPCA)进行降维处理；根据降维后的梅尔倒普系数特征信息进行分类识别，并输出识别结果；具体的分类识别方法为采用FSVM算法进行；本发明专利技术的有益效果为，通过MFCC情感特征，然后用KPCA对特征降维减少了冗余的信息，比直接使用MFCC特征的识别效果要好很多，其识别率更高，效果更好，且识别速度更快。本发明专利技术尤其适用于语音智能情感识别。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音情感识别技术，具体的说是涉及一种基于模糊支持向量机的语音情感识别方法。
技术介绍
专家已经从生理和心理两个领域对情感研究了很长一段时间，随着人工智能的快速发展，人机交互中的情感研究引起了广大专家的极大兴趣。在人机交互中，希望人类跟机器能更自然的进行交流，这就需要机器能够理解人类的情感，所以机器对情感的分类识别显得尤其重要了。在人类交流中，语音包含了丰富的信息，所以机器可以通过语音对情感进行分类识别。专家们对语音情感分类识别已经进行了大量的研究和分析，一般包括语音情感库的建立、情感特征提取、分类识别方法的研究。前人为了提高语音情感的识别率，对每一个环节都进行了改进研究，但没有形成一个统一的系统，识别率也不是很高。前人用梅尔倒谱系数（MFCC)作为识别特征，但在识别之前没有对此特征做进一步处理，这就会出现很多冗余的信息影响识别效果。前人在使用分类器的时候发现噪声或孤立点对识别率影响特别大，为了消除这种影响提高识别率，选择一个合适的分类器成了研究的重点。为了提高语音情感识别率，对情感特征作适当处理和选择合适的分类方法尤其重要。
技术实现思路
本专利技术所要解决的，就是针对传统技术存在的问题，提出一种基于模糊支持向量机的语音情感识别方法。本专利技术解决上述技术问题所采用的技术方案是：一种基于模糊支持向量机的语音情感识别方法，其特征在于，包括以下步骤： a.对输入的语音信号预处理；所述预处理包括预加重滤波和加窗分帧，其中预加重滤波的预加重系数α为0. 97,加窗分帧的帧长...

【技术保护点】
一种基于模糊支持向量机的语音情感识别方法，其特征在于，包括以下步骤：a.对输入的语音信号预处理；所述预处理包括预加重滤波和加窗分帧；b.提取处理后的语音信号的特征信息；所述特征信息为梅尔倒普系数；c.对提取的梅尔倒普系数进行降维处理；所述降维处理具体为采用核主成份分析进行降维；d.将降维处理后的梅尔倒普系数特征信息输入模糊支持向量机分类器，模糊支持向量机分类器输出分类识别结果；所述模糊支持向量机分类器采用模糊支持向量算法对语音训练样本进行训练，具备语音情感分类识别能力；所述语音训练样本经过上述步骤a～c处理后，再用于训练模糊支持向量机分类器；所述模糊支持向量算法的具体步骤为：d1.假设训练样本S0＝{(x1,y1,s1)(x2,y2,s2),…,(xl,yl,sl)},其中(xl,yl,sl)中的xl为输入样本，yl为输入样本所对应的输出类别值，sl为输入样本的隶属度值，下标l为样本数；d2.在约束条件下求解使目标函数0≤μi≤siC0,i＝1,…,l.U=min12Σi=1lΣj=1lμiμjyiyjk(xi,xj)-Σi=1lμ...

【技术特征摘要】
1. 一种基于模糊支持向量机的语音情感识别方法，其特征在于，包括以下步骤： a. 对输入的语音信号预处理；所述预处理包括预加重滤波和加窗分帧； b. 提取处理后的语音信号的特征信息；所述特征信息为梅尔倒普系数； c. 对提取的梅尔倒普系数进行降维处理；所述降维处理具体为采用核主成份分析进行降维； d...

【专利技术属性】
技术研发人员：周代英，谭发曾，贾继超，田兵兵，寥阔，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人