一种评论情感分析方法、系统、电子设备及存储介质技术方案

技术编号:30227783 阅读:18 留言:0更新日期:2021-09-29 09:55
本发明专利技术提出一种评论情感分析方法、系统、电子设备及存储介质,其方法技术方案包括获取一评论集合,使用一情感模型对所述评论集合进行情感极性判断,得到对应的情感极性标签;为所述评论集合中的评论计算归因分数向量,并得到对应的归因分数向量集合,所述归因分数向量包括所述评论中每个字的归因分数;根据所述归因分数向量抽取所述评论的关键词;根据所述情感极性标签和所述关键词以可视化的形式进行展示。本申请解决了现有评论情感分析方法无法同时满足不需要标注、与情感极性相关、区分多义词、不限定词范围的问题。不限定词范围的问题。不限定词范围的问题。

【技术实现步骤摘要】
一种评论情感分析方法、系统、电子设备及存储介质


[0001]本专利技术属于自然语言处理领域,尤其涉及一种评论情感分析方法、系统、电子设备及存储介质。

技术介绍

[0002]随着移动互联网的发展,出现了各种各样的APP帮助人们解决衣食住行等各方面的需求。这些APP为了提升用户体验通常都提供了用户评论的功能。如何通过这些用户的评论来指导产品或者服务的改进是一个十分有挑战且有意义的任务。
[0003]情感分析(Sentiment Analysis)是一种常见的分析用户评论的方法,其主要目标是判断用户评论的情感极性(正面、负面等)。目前,主要使用文本分类模型对评论的情感极性进行判断。但是,仅有评论的情感极性无法为改进产品或者服务提供更加深入的洞见。因此,本专利提出了一种基于关键词的评论情感分析方法,该方法能够更加精准的解释导致情感极性的原因,为进一步改善产品或者服务提供有效的洞察。
[0004]目前最常见的解释评论情感的方法是基于关键词的。举例来说,如果要快速了解某产品近期导致负面评论的原因,可以对近期的负面评论进行关键词抽取,然后将高频关键词通过可视化的方法展示给用户,这样就能帮助用户快速定位导致负面评论的原因。但上述方法具有下列缺陷:
[0005](1)有监督的关键词抽取方法需要大量的人工标注,其不但成本高昂且无法很好的抽取出未标注类型的关键词;
[0006](2)基于情感词典的关键词抽取只能抽取情感词典中存在的单词,不存在的单词则无法被抽取。此外,该方法也无法对多义词进行识别,例如在评论“不好意思,这个产品真的不好用!”中存在2个“不好”,但只有“不好用”中的“不好”才导致了负面情感,但是基于情感词典的方法无法识别这两种情况。
[0007](3)基于TF

IDF或者TextRank的关键词抽取方法是独立于评论情感的,也就是说抽取的关键词并不一定与评论情感相关。

技术实现思路

[0008]本申请实施例提供了一种评论情感分析方法、系统、电子设备及存储介质,以至少解决现有评论情感分析方法无法同时满足不需要标注、与情感极性相关、区分多义词、不限定词范围的问题。
[0009]第一方面,本申请实施例提供了一种评论情感分析方法,包括:情感极性判断步骤,获取一评论集合,使用一情感模型对所述评论集合进行情感极性判断,得到对应的情感极性标签;归因分数计算步骤,为所述评论集合中的评论计算归因分数向量,并得到对应的归因分数向量集合,所述归因分数向量包括所述评论中每个字的归因分数;关键词抽取步骤,根据所述归因分数向量抽取所述评论的关键词;评论情感展示步骤,根据所述情感极性标签和所述关键词以可视化的形式进行展示。
[0010]优选的,所述归因分数计算步骤进一步包括:基于积分梯度法计算所述评论的所述归因分数向量,公式为
[0011][0012]式中,为所述评论集合中一评论的归因分数向量,为情感模型,x为所述评论集合中的一条所述评论,x=(x1,x2,...,x
n
),其中x
i
表示评论的第i个字,y为x所对应的情感极性;
[0013]将所述归因分数向量进行标准化,公式为
[0014][0015]式中,||
·
||表示向量的L2范数。
[0016]优选的,所述关键词抽取步骤进一步包括:使用一分词工具对所述评论集合中的所述评论进行分词,并为所述评论中的每个词计算归因强度和归因纯度,根据所述归因强度和所述归因纯度抽取所述关键词。
[0017]优选的,所述归因强度的计算方法为:
[0018][0019]式中,s
i
为归因强度,t为所述评论中某个词所包含的字的数量,a
ij
为所述评论中每个字的归因分数。
[0020]优选的,所述归因纯度的计算方法为:
[0021][0022]第二方面,本申请实施例提供了一种评论情感分析系统,适用于上述一种评论情感分析方法,包括:情感极性判断模块,获取一评论集合,使用一情感模型对所述评论集合进行情感极性判断,得到对应的情感极性标签;归因分数计算模块,为所述评论集合中的评论计算归因分数向量,并得到对应的归因分数向量集合,所述归因分数向量包括所述评论中每个字的归因分数;关键词抽取模块,根据所述归因分数向量抽取所述评论的关键词;评论情感展示模块,根据所述情感极性标签和所述关键词以可视化的形式进行展示。
[0023]在其中一些实施例中,所述归因分数计算模块进一步包括:基于积分梯度法计算所述评论的所述归因分数向量,公式为
[0024][0025]式中,为所述评论集合中一评论的归因分数向量,为情感模型,x为所述评论集合中的一条所述评论,x=(x1,x2,...,x
n
),其中x
i
表示评论的第i个字,y为x所对应的情感极性;
[0026]将所述归因分数向量进行标准化,公式为
[0027][0028]式中,||
·
||表示向量的L2范数。
[0029]在其中一些实施例中,所述关键词抽取模块进一步包括:使用一分词工具对所述评论集合中的所述评论进行分词,并为所述评论中的每个词计算归因强度和归因纯度,根据所述归因强度和所述归因纯度抽取所述关键词。
[0030]第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的一种评论情感分析方法。
[0031]第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的一种评论情感分析方法。
[0032]本申请可应用于深度学习
相比于相关技术,本申请实施例提供的一种评论情感分析方法,通过归因技术和启发式的规则来寻找与情感极性高度相关的关键词,其克服了已有方法的缺点,包括:
[0033](1)不需要人工进行关键词的标注,从而能够降低成本;
[0034](2)不同于基于情感词典的方法,本专利技术对关键词没有限制;
[0035](3)可以根据语义来区分多义词,即能确定评论“不好意思,这个产品真的不好用!”中后一个“不好”才是导致负面情感的关键词;
[0036](4)不同于TF

IDF和TextRank,本专利技术抽取的关键词与评论的情感高度相关。
附图说明
[0037]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0038]图1为本专利技术的评论情感分析方法流程图;
[0039]图2为本专利技术的评论情感分析系统的框架图;
[0040]图3为本专利技术的电子设备的框架图;
[0041]以上图中:
[0042]1、情感模型训本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种评论情感分析方法,其特征在于,包括:情感极性判断步骤,获取一评论集合,使用一情感模型对所述评论集合进行情感极性判断,得到对应的情感极性标签;归因分数计算步骤,为所述评论集合中的评论计算归因分数向量,并得到对应的归因分数向量集合,所述归因分数向量包括所述评论中每个字的归因分数;关键词抽取步骤,根据所述归因分数向量抽取所述评论的关键词;评论情感展示步骤,根据所述情感极性标签和所述关键词以可视化的形式进行展示。2.根据权利要求1所述的评论情感分析方法,其特征在于,所述归因分数计算步骤进一步包括:基于积分梯度法计算所述评论的所述归因分数向量,公式为式中,为所述评论集合中一评论的归因分数向量,为情感模型,x为所述评论集合中的一条所述评论,x=(x1,x2,

,x
n
),其中x
i
表示评论的第i个字,y为x所对应的情感极性;将所述归因分数向量进行标准化,公式为式中,||
·
||表示向量的L2范数。3.根据权利要求1所述的评论情感分析方法,其特征在于,所述关键词抽取步骤进一步包括:使用一分词工具对所述评论集合中的所述评论进行分词,并为所述评论中的每个词计算归因强度和归因纯度,根据所述归因强度和所述归因纯度抽取所述关键词。4.根据权利要求3所述的评论情感分析方法,其特征在于,所述归因强度的计算方法为:式中,s
i
为归因强度,t为所述评论中某个词所包含的字的数量,a
ij
为所述评论中每个字的归因分数。5.根据权利要求3所述的评论情感分析方法,其特征在于,所述归因纯度的计算方法为:6.一种评论情感分析...

【专利技术属性】
技术研发人员:白强伟黄艳香
申请(专利权)人:上海明略人工智能集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1