【技术实现步骤摘要】
一种针对自然语言进行情绪识别的方法
本专利技术涉及一种针对自然语言进行情绪识别的方法,属于自然语言处理和机器学习领域。
技术介绍
作为人机交互中最直接和最有效的方式,自然语言是传递和表达信息最精确、最复杂的重要媒介。人与人之间正常的自然语言交互,往往含有感情色彩,在不同的情绪下,同一句话可能会表达出不同的含义,因此,声音和语言都是语义理解的重要参量。而当下的聊天机器人,基本上通过语音识别技术,依据说话人的文本内容,进行语义理解与交互。用户收到的响应,要么是文本信息,要么是经过TTS语音合成的没有感情色彩的反馈。这种仅依赖文本内容而不考虑情绪状态进行语义理解的方式,使得机器人不能够全面的理解说话人的意图。目前也有很多基于文本内容进行情绪识别的研究,比如,人在愤怒的状态下可能会使用更多的侮辱性的词汇;在高兴的时候,可能会使用一些积极向上的词汇。但是,应用到具有自然语言交互的机器人对话系统中时,往往难以正确识别到客户正确的情绪反应。语音本身就富含大量的情感信息,比如,人在紧张的时候,更容易有停顿和语法方面的错误;在愤怒的时候,声音明显会响亮很多。综合考虑语音和文本内容两方面的信息,通过机器学习,判断出客户正确的情绪反应,并依此进行答案和情绪反馈,会让机器人更加智能的与客户进行交流。
技术实现思路
本专利技术要解决的技术问题是提供一种针对自然语言进行情绪识别的方法,综合考虑语音和文本内容两方面的信息,通过机器学习算法,判断出客户正确的情绪反应,并根据客户问题和情绪识别结果,让机器人更加智能、自然的与客户进行交流。为了解决所述技术问题,本专利技术采用的技术方案是:一种针 ...
【技术保护点】
一种针对自然语言进行情绪识别的方法,其特征在于:该方法对收集的自然语言分别进行基于文本内容和基于语音的的情绪识别,然后综合两方面的信息,判断客户情绪类别,包括以下步骤:S01)、采集载有自然语言的语音信息,通过语音识别将其转换为文本信息,输入到事先建立好的文本情绪分类器,判断该文本信息是积极、消极还是客观,并输出各个类别的置信度;S02)、基于现有的语音库和机器人不断采集的自然语音,提取不同情绪状态下的声学特征并进行统计学习,建立一个语音情绪分类器,载有自然语言的语音信息输入后,判断该语音信息是积极、消极还是客观,并输出各个类别的置信度;S03)、参考基于文本内容的类别置信度和基于语音的类别置信度,通过支持向量机进行训练学习,最终得到一个综合语音和文本内容的情绪分析分类器。
【技术特征摘要】
1.一种针对自然语言进行情绪识别的方法,其特征在于:该方法对收集的自然语言分别进行基于文本内容和基于语音的的情绪识别,然后综合两方面的信息,判断客户情绪类别,包括以下步骤:S01)、采集载有自然语言的语音信息,通过语音识别将其转换为文本信息,输入到事先建立好的文本情绪分类器,判断该文本信息是积极、消极还是客观,并输出各个类别的置信度;S02)、基于现有的语音库和机器人不断采集的自然语音,提取不同情绪状态下的声学特征并进行统计学习,建立一个语音情绪分类器,载有自然语言的语音信息输入后,判断该语音信息是积极、消极还是客观,并输出各个类别的置信度;S03)、参考基于文本内容的类别置信度和基于语音的类别置信度,通过支持向量机进行训练学习,最终得到一个综合语音和文本内容的情绪分析分类器。2.根据权利要求1所述的针对自然语言进行情绪识别的方法,其特征在于:基于文本内容的情绪识别包括以下步骤:S11)、构建语料库,依据现有的情绪分类语料库,将其分为积极、消极和客观三组样本,同时,通过机器人不断地与客户进行自然语言交互,收集文本内容信息,不断地丰富语料库;S12)、特征词选择,采用CHI算法从构建的语料库中选择能够区分情绪类别的特征词;S13)、权重计算,根据步骤S11提供的语料库和步骤S12提供的特征词,采用改进的TF-IDF算法进行特征词统计和权重计算;S14)、采用SVM进行样本训练和测试,语料库中分为积极、消极和客观三类,采用SVM算法进行三分类的训练学习,训练结束后,输入由语音信息转换成的文本内容,即可输出各个类别的置信度。3.根据权利要求1所述的针对自然语言进行情绪识别的方法,其特征在于:基于语音的情绪识别包括以下步骤:S21)、构建语音库,依据现有采集的语音构建语音库,同时通过机器人不断的进行现场语料采集来进行补充;S22)、语音信号的预处理和特征采集,将采集的语音信号进行采样、量化、加窗分帧的预处理之后进行特征提取,提取时域下的持续时间、短时能量...
【专利技术属性】
技术研发人员:申冲,张传锋,朱锦雷,
申请(专利权)人:神思电子技术股份有限公司,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。