一种基于情感数据场的连续语音情感预测算法制造技术

技术编号：10442878 阅读：213 留言：0更新日期：2014-09-17 19:00

本发明专利技术公开了一种基于情感数据场的连续语音情感预测算法，首先根据数据场理论，利用情感数据场中势函数建立不同语音情感特征向量之间的联系；其次，在短时间上选取多个语音情感特征向量，用群体智能算法在情感数据场中研究各语音情感特征向量的变化趋势，将这种变化趋势作为语音情感的识别结果。实验表明，本发明专利技术的方法可以有效的解决语音情感识别中存在的情感跟踪延迟问题并有效预测说话人情感的变化。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于情感数据场的连续语音情感预测方法
本专利技术涉及一种语音情感预测方法，特别涉及一种对情感变化连续语音的基于情感数据场的情感预测方法。
技术介绍
语音情感识别是人机智能化交互的一个重要研究领域，已有许多研究机构致力于该领域的研究。然而目前语音情感识别处理的对象往往局限于语料库中已分割好的短句，例如丹麦情感语音数据库(DES)、柏林情感语音数据库等，并且对语料库的语音情感识别已经能够获得比较高的识别率。但是在现实生活中，人们的情感表达和状态是一个连续变化的过程。实用语音情感识别系统要求处理的对象应该是未分割成短句的实时采集的连续情感语音。例如在电话服务中心，实用语音情感识别系统要能够预测和识别服务人员的情绪变化，预防对客户的不友好态度；航天、航空等特殊领域需要实时识别操作人员情感状态的变化，避免不必要的事故发生等。目前传统的语音情感识别方法都是孤立地考虑统计特征的情感特征向量，存在情感跟踪延迟或者不能及时识别情感的变化的问题，故无法实现对连续语音的情感预测。
技术实现思路
要解决的技术问题：针对现有技术的不足，本专利技术提出一种基于情感数据场的连续语音情感预测方法，解决现有技术的语音情感识别方法对连续语音的情感预测存跟踪延迟，无法实现对连续语音进行情感预测。技术方案：为解决上述技术问题，本专利技术采用以下技术方案：一种基于情感数据场的连续语音情感预测方法,获取训练样本的语音情感特征向量，利用语音情感特征向量作为数据构成情感数据场以形成语音情感特征空间，情感数据场中的势函数建立起不同语音情感特征向量之间的联系；在进行情感预测时，等间隔的对测试样本采集语音情感...
一种<a href="http://www.xjishu.com/zhuanli/21/201410283309.html" title="一种基于情感数据场的连续语音情感预测算法原文来自X技术">基于情感数据场的连续语音情感预测算法</a>

【技术保护点】
一种基于情感数据场的连续语音情感预测算法,其特征在于：获取训练样本的语音情感特征向量，利用语音情感特征向量作为数据构成情感数据场以形成语音情感特征空间，情感数据场中的势函数建立起不同语音情感特征向量之间的联系；在进行情感预测时，等间隔的对测试样本采集语音情感特征向量，判断语音情感是否发生变化，若未发生变化则返回重新获取下一时刻的语音情感特征向量并判断，若语音情感发生变化则等间隔的选取语音情感特征向量，利用TSP蚁群算法中的多个蚂蚁分别一一对应模拟选取出来的多个语音情感特征向量，利用TSP蚁群算法中的多个城市分别一一对应模拟多个语音情感的类型，在情感数据场中计算每种语音情感的类型在选取出来的多个情感特征向量处产生的势值大小，选择势值中最大的一个所对应的语音情感的类型即为预测语音情感变化后的情感类型。

【技术特征摘要】
1.一种基于情感数据场的连续语音情感预测方法,其特征在于：获取训练样本的语音情感特征向量，利用语音情感特征向量作为数据构成情感数据场以形成语音情感特征空间，情感数据场中的势函数建立起不同语音情感特征向量之间的联系；在进行情感预测时，等间隔的对测试样本采集语音情感特征向量，判断语音情感是否发生变化，若未发生变化则返回重新获取下一时刻的语音情感特征向量并判断，若语音情感发生变化则等间隔的选取语音情感特征向量，利用TSP蚁群算法中的多个蚂蚁分别一一对应模拟选取出来的多个语音情感特征向量，利用TSP蚁群算法中的多个城市分别一一对应模拟多个语音情感的类型，在情感数据场中计算每种语音情感的类型在选取出来的多个情感特征向量处产生的势值大小，选择势值中最大的一个所对应的语音情感的类型即为预测语音情感变化后的情感类型。2.根据权利要求1所述的一种基于情感数据场的连续语音情感预测方法，其特征在于：包括顺序执行的以下步骤：(1)、建立情感数据场首先求取训练样本中属于各种情感类别的语音情感特征向量，将这些语音情感特征向量进行特征规范化后作为数据点构成情感数据场，其中属于不同情感类别的数据点分布在情感数据场中不同的区域，然后建立情感数据场中的势函数，则情感数据场中任一语音情感特征向量x的位势即势函数值如下式中D表示同类情感训练样本的语音情感特征向量的集合；f(x,xi)＝exp{-(x-xi)TΣ-1(x-xi)}其中：Σ表示训练样本的语音情感特征向量组成的协方差矩阵，Σ＝E[x-E(x)][x-E(x)T]；T表示转置矩阵；x表示待求位势的样本的语音情感特征向量；xi表示训练样本i的语音情感特征向量；(2)、利用情感数据场对情感变化的语音进行预测和识别步骤2-1、进行预测和识别时，依据已建立的情感数据场判别当前时刻的语音情感类型，将判断结果作为基本情感，基本情感的中心为ωi；步骤2-2、确定对测试样本的分析间隔，然后在预测和识别情感的时刻开始之前的...

【专利技术属性】
技术研发人员：查诚，黄程韦，赵力，
申请(专利权)人：东南大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人