基于相似度词序矩阵的电力客服工单情感量化分析方法技术

技术编号:20745389 阅读:31 留言:0更新日期:2019-04-03 10:25
本发明专利技术公开了基于相似度词序矩阵的电力客服工单情感量化分析方法,涉及一种电力客服工单分析方法。传统的情感分析方法不能有效甄别情感强度。本发明专利技术包括基于Word2Vec相似度情感词拓展联想步骤、多元情感语料库构建步骤、相似度词序矩阵情感量化算法步骤;对工单进行分类梳理、数据清洗,基于百度词库形成初始化多元情感词库,采用逆向最大匹配算法进行工单文本分词,基于Word2Vec神经网络构建融合客户诉求语义的积极词、消极词、否定词、程度副词、以及词序的词向量,通过机器学习训练生成融合诉求情感的学习模型,基于词性亲疏关系来拓展词性语料库,采用相似度词序矩阵量化算法进行情感量化计算,完成客服工单情感量化分析,有效区分情感强弱差异。

【技术实现步骤摘要】
基于相似度词序矩阵的电力客服工单情感量化分析方法
本专利技术涉及一种电力客服工单分析方法,尤其涉及基于相似度词序矩阵的电力客服工单情感量化分析方法。
技术介绍
随着社会经济的发展,电力体制改革的不断深化,供电企业只有坚持以客户为中心,提升客户满意度,才能取得市场化竞争优势。而95598作为客户交流与沟通的重要渠道窗口,通过对客服工单中隐含的客户特征、情感信息进行深度挖掘,实现量化客户诉求情感分析,有利于快速了解客户的关注焦点,有利于根据客户情感倾向性识别潜在的投诉客户,有利于支撑工单紧急度优先处理与分析,有利于根据反馈信息判别某项业务的实施效果,这些对电力企业和客户都将具有十分重要的意义。传统方式下,针对工单诉求情感分析,需要设立多名诉求分析专职对客户诉求工单进行人工分析和处理,耗费大量人力成本。情感分析主要是面向非结构化文本的自然语言处理,通过对文本中隐藏的情感信息进行分析,挖掘人对于事物或者事件所持有的观点和态度。目前,普遍情感分析侧重于情感极性分类,简单表示为情感是正向的还是负向的;而情感强度体现则需要量化情感手段实现。传统情感分析过程主要分为三部分:特征工程、特征选择和机器学习算法应用。它偏向于使用工程特征或者极性转移规则来提高准确率。而对文本的情感量化分析计算在国内外研究并不多,多数研究侧重于情感倾向性分类。传统的情感分析方法基于词袋(bag-of-word)特征和词频统计,同时多数研究侧重于情感倾向性分类,这种方法存在以下三方面缺陷:(1)缺失词的上下文顺序和语义理解;(2)忽略词的语义间差异;(3)侧重于情感倾向性分类无法体现情感强弱差异。总之不能有效甄别情感强度。
技术实现思路
本专利技术要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供基于相似度词序矩阵的电力客服工单情感量化分析方法,以达到有效甄别情感强度的目的。为此,本专利技术采取以下技术方案。基于相似度词序矩阵的电力客服工单情感量化分析方法,包括基于Word2Vec相似度情感词拓展联想步骤、多元情感语料库构建步骤、相似度词序矩阵情感量化算法步骤;Word2Vec相似度情感词拓展联想步骤:用于初始化多元分类词库,分类词库分为积极词、消极词、中性词、否定词、程度副词,通过Word2Vec相似度矩阵实现相近情感词拓展关联,同时这些词融合客户诉求语义的词性倾向和词序强弱关系;通过对工单诉求进行Word2Vec深度学习形成积极词、消极词、中性词、否定词、程度副词之间的空间关联关系;多元情感语料库构建步骤:用于基于词向量空间距离亲疏关系,丰富拓展初始化情感分类词,构建融合客户诉求情感倾向的多元情感语料库;在对电力客服业务工单和不满意工单进行文本特征分词过程中,基于百度词库与电力专有词库,采用逆向最大匹配算法,形成初步语料库梳理,涉及积极词、消极词、中性词、否定词、程度副词五类词性分类;通过Word2Vec构建词向量,经过机器学习训练形成以初步情感语料库为中心的倾向性词空间距离关系,从而进一步提炼拓展多元词性语料库;相似度词序矩阵情感量化算法步骤:用于根据情感语料库提炼成果,基于Word2Vec神经网络的构建词向量极性空间关系,计算单一工单诉求相似度情感量化得分;完成客服工单情感量化分析,确定紧急程度;其中情感量化计算公式为:(i=0,1,...,T-1)AN-P=WordsNearest(Lnegative,Lpositive,10000)AP-N=WordsNearest(Lpositive,Lnegative,10000)式中:Smolecule表示所有词情感量化分子累计求和,T表示单一诉求所有词总量,SEQ表示单一工单诉求相似度情感量化得分,words[i]表示经过分词的工单诉求数组中第i个词,AN-P基于消极词到积极词关联最近词语有序集合,AP-N基于积极词到消极词关联最近词语有序集合,Ldegree表示程度副词集合,Lnay表示否定词集合,Lpositive表示积极词集合,Lnegative表示消极词集合,Lneutral表示中性词集合,表示第i词在AP-N有序集合中的排列位置,表示第i词在AN-P有序集合中的排列位置,WordsNearest则为Wotd2vec空间关联关系方法,δlow、δneutral、δinterval分别表示情感量化消极系数下限、情感量化中性系数下限、情感量化中性区间。本技术方案基于Word2Vec神经网络对历史客户工单进行深度学习,通过学习模型中词向量空间距离表征相近语义和词的亲疏关系,同时通过Word2Vec建模后的同一极性亲疏关系来构建词序,通过词序来表示同一情感倾向的强弱关系。通过上述技术手段在情感量化计算中融合词的上下文顺序、语义理解和词间的情感强弱差异,根据历史工单诉求与语义相近理解、同一词性的两个词情感强弱差异来影响情感量化计算结果。在无监督模式下丰富拓展有限的情感语料库,简化大量人力情感语料梳理工作,基于有限的情感语料库拓展丰富缺失的情感语料。基于有限的情感语料,融合电力业务专有词库,基于Word2Vec神经网络对历史工单深度学习形成积极词、消极词、中性词、否定词、程度副词之间的空间关联关系,即以有限情感语料库为中心的倾向性词空间亲疏关系,从而进一步提炼拓展多元词性语料库。本技术方案能对各个工单诉求有效区分情感强弱差异,实现情感量化分析评价而非投诉倾向性分类,以决定业务处理的紧急程度。加入情感在线计算与分析介入,可以全方位地为客户考虑,理解客户情绪,通过对客户情感的预判,为在适当时机介入差异化情感安抚和疏导,减少客户在线咨询时间,提升客户满意度。作为优选技术手段:δlow、δneutral、δinterval分别为0.2、0.5、0.1。作为优选技术手段:电力客服工单情感量化分析方法包括基于Word2Vec相似度情感词拓展联想,用于初始化多元分类词库,分类词库分为积极词、消极词、中性词、否定词、程度副词,通过Word2Vec相似度矩阵实现相近情感词拓展关联,同时这些词融合客户诉求语义的词性倾向和词序强弱关系;通过对工单诉求进行Word2Vec深度学习形成积极词、消极词、中性词、否定词、程度副词之间的空间关联关系。作为优选技术手段:电力客服工单情感量化分析方法包括多元情感语料库构建,用于基于词向量空间距离亲疏关系,丰富拓展初始化情感分类词,构建融合客户诉求情感倾向的多源情感语料库;在对电力客服业务工单和不满意工单进行文本特征分词过程中,基于百度词库与电力专有词库,采用逆向最大匹配算法,形成初步语料库梳理,涉及积极词、消极词、中性词、否定词、程度副词五类词性分类;通过Word2Vec构建词向量,经过机器学习训练形成以初步情感语料库为中心的倾向性词空间距离关系,从而进一步提炼拓展多元词性语料库。作为优选技术手段:多元情感语料库构建包括以下步骤:a)结合电力客服工单文本特征,对历史电力客服工单和不满意工单进行分类梳理、数据清洗,基于百度词库梳理形成词料;b)初始化语料梳理,语料分为积极词、消极词、中性词、否定词、程度副词;c)初始化语料词库;d)输入一段时序的工单诉求信息;e)通过Word2Vec神经网络工单分词深度学习,获得学习模型;f)通过Word2Vec亲疏关联关系分离词性;本文档来自技高网
...

【技术保护点】
1.基于相似度词序矩阵的电力客服工单情感量化分析方法,其特征在于:包括基于Word2Vec相似度情感词拓展联想步骤、多元情感语料库构建步骤、相似度词序矩阵情感量化算法步骤;Word2Vec相似度情感词拓展联想步骤:用于初始化多元分类词库,分类词库分为积极词、消极词、中性词、否定词、程度副词,通过Word2Vec相似度矩阵实现相近情感词拓展关联,同时这些词融合客户诉求语义的词性倾向和词序强弱关系;通过对工单诉求进行Word2Vec深度学习形成积极词、消极词、中性词、否定词、程度副词之间的空间关联关系;多元情感语料库构建步骤:用于基于词向量空间距离亲疏关系,丰富拓展初始化情感分类词,构建融合客户诉求情感倾向的多元情感语料库;在对电力客服业务工单和不满意工单进行文本特征分词过程中,基于百度词库与电力专有词库,采用逆向最大匹配算法,形成初步语料库梳理,涉及积极词、消极词、中性词、否定词、程度副词五类词性分类;通过Word2Vec构建词向量,经过机器学习训练形成以初步情感语料库为中心的倾向性词空间距离关系,从而进一步提炼拓展多元词性语料库;相似度词序矩阵情感量化算法步骤:用于根据情感语料库提炼成果,基于Word2Vec神经网络的构建词向量极性空间关系,计算单一工单诉求相似度情感量化得分;完成客服工单情感量化分析,确定紧急程度;其中情感量化计算公式为:...

【技术特征摘要】
1.基于相似度词序矩阵的电力客服工单情感量化分析方法,其特征在于:包括基于Word2Vec相似度情感词拓展联想步骤、多元情感语料库构建步骤、相似度词序矩阵情感量化算法步骤;Word2Vec相似度情感词拓展联想步骤:用于初始化多元分类词库,分类词库分为积极词、消极词、中性词、否定词、程度副词,通过Word2Vec相似度矩阵实现相近情感词拓展关联,同时这些词融合客户诉求语义的词性倾向和词序强弱关系;通过对工单诉求进行Word2Vec深度学习形成积极词、消极词、中性词、否定词、程度副词之间的空间关联关系;多元情感语料库构建步骤:用于基于词向量空间距离亲疏关系,丰富拓展初始化情感分类词,构建融合客户诉求情感倾向的多元情感语料库;在对电力客服业务工单和不满意工单进行文本特征分词过程中,基于百度词库与电力专有词库,采用逆向最大匹配算法,形成初步语料库梳理,涉及积极词、消极词、中性词、否定词、程度副词五类词性分类;通过Word2Vec构建词向量,经过机器学习训练形成以初步情感语料库为中心的倾向性词空间距离关系,从而进一步提炼拓展多元词性语料库;相似度词序矩阵情感量化算法步骤:用于根据情感语料库提炼成果,基于Word2Vec神经网络的构建词向量极性空间关系,计算单一工单诉求相似度情感量化得分;完成客服工单情感量化分析,确定紧急程度;其中情感量化计算公式为:AN-P=WordsNearest(Lnegative,Lpositive,10000)AP-N=WordsNearest(Lpositive,Lnegative,10000)式中:Smolecule表示所有词情感量化分子累计求和,T表示单一诉求所有词总量,SEQ表示单一工单诉求相似度情感量化得分,words[i]表示经过分词的工单诉求数组中第i个词,AN-P基于消极词到积极词关联最近词语有序集合,AP-N基于积极词到消极词关联最近词语有序集合,Ldegree表示程度副词集合,Lnay表示否定词集合,Lpositive表示积极词集合,Lnegative表示消极词集合,Lneutral表示中性词集合,表示第i词在AP-N有...

【专利技术属性】
技术研发人员:景伟强张爽沈皓罗欣朱蕊倩魏骁雄陈博麻吕斌葛岳军陈奕汝钟震远叶红豆
申请(专利权)人:浙江华云信息科技有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1