一种电商在线评论文本情感分析方法技术

技术编号:17387929 阅读:198 留言:0更新日期:2018-03-04 13:15
本发明专利技术公开了一种电商在线评论文本情感分析方法,属于自然语言处理技术与情感判断领域,构建电商在线评论情感词典,首先实现电商在线评论文本预处理成句子单元,再对句子单元利用n‑gram模式中2元语法进行处理,处理后的情感值pi相加汇总后得到句子单元的情感基本值p,生成p‑list,求解p‑综合,进行情感判断,帮助企业更加合理做出营销策略。

An online comment text affective analysis method

The invention discloses a business online review text sentiment analysis method, belonging to Natural Language Processing technology and emotion judgment field, building electricity supplier online review sentiment dictionary, the first electricity supplier to achieve online review text preprocessing unit of sentences, sentence unit using 2 yuan N gram grammatical patterns in the treatment, after treatment the emotion value added PI obtains the sentence unit emotion basic value p, P list, for P, emotional judgment, help enterprises to make more reasonable marketing strategy.

【技术实现步骤摘要】
一种电商在线评论文本情感分析方法
本专利技术属于自然语言处理技术与情感判断领域,具体涉及一种电商在线评论文本情感分析方法。
技术介绍
随着我国电子商务的健康发展,流量红利期已过,客户成本越来越高。电子商务企业如何识别客户消费偏好,开展精准营销,降低竞争成本,是每个企业必备功课。在线评论数据是电子商务交易完成后,客户对产品的质量、价格、服务等方面的评价。在线评论数据已成为企业获取客户消费偏好、开展精准营销的重要信息来源。这种评价集往往带有很强的情感倾向。研究客户的情感倾向既能度量客户对企业的认可度,也能挖掘客户的消费偏好。一种科学准确的电商在线评论情感分析方法,可以让企业快速掌握客户的消费偏好,发现自己的不足,提高企业竞争力。然而,现有的技术中,并没有解决文本情感分析准确率低、情感变化与实时监测的问题,也很难准确评估一个客户的价值。因此,一种电商文本在线评论情感分析方法,是当前急需解决的问题。
技术实现思路
根据以上现有技术的不足,本专利技术提出一种电商在线评论文本情感分析方法,通过n-gram中的2元语法对电商在线评论情感词典进行处理,有效的掌握了客户的喜好,有利于产品在市场的均衡。为了解决上述技术问题,本专利技术采用的技术方案为:一种电商在线评论文本情感分析方法,其特征在于,包括以下步骤:步骤1:构建电商在线评论情感词典,情感词典包括正面情感词语集合、负面情感词语集合、否定词集合和程度词集合;步骤2:对电商在线评论中的每个顾客在线评论文本进行预处理,对文本分段分句得到句子,通过标点符号将句子划分为句子单元,然后对句子单元中的文字进行分词,形成词组;步骤3:对步骤2中得到的词组进行n-gram处理,利用n-gram中的2元语法对句子单元中的词组组合形成2元词组,结合电商在线评论情感词典计算句子单元的情感基本值p;步骤4:电商在线评论中每个顾客在线评论被切分为句子,句子又被切分为句子单元,故每个顾客在线评论根据每个句子单元的情感基本值p,生成一个情感值p列表即p-list;步骤5:根据每个顾客在线评论的p-list,进行相加汇总计算出p-综合;步骤6:利用步骤5中的p-综合与0进行结果比较,对每个顾客的在线评论进行情感倾向判断。上述方法步骤中,所述步骤3的具体过程为:步骤3.1:2元语法对句子单元中的词组进行组合,形成2元词组,处以前面位置的称为前位词,处以后面位置的称为后位词;步骤3.2:后位词结合情感词典中正面情感词语集合和负面情感词语集合进行情感值p的计算判断;前位词结合否定词集合判断情感值p是否*(-1),前位词结合程度词集合判断情感值p是否*(-1);结果对于每个2元词组均获得一个情感值pi;步骤3.3:将整个句子单元中2元词组的情感值pi相加汇总后得到句子单元的基本值p。上述方法步骤中,所述步骤5中的p-综合为p-list中p值的统计求和计算得到的。本专利技术有益效果是:本专利技术解决了文本情感分析在电商在线评论分析中准确率低的问题,能够评估客户的价值,能够为后续情感变化与监测、顾客满意区分和精准营销做好铺垫;应用本专利技术,可以让企业快速了解在线评论的情感倾向,提高购物体验,准确作出营销决策;也能迅速识别产品服务中存在的问题,提高服务质量,增强企业竞争力。附图说明下面对本说明书附图所表达的内容及图中的标记作简要说明:图1是本专利技术的具体实施方式的流程图。具体实施方式下面通过对实施例的描述,本专利技术的具体实施方式如所涉及的各构件的形状、构造、各部分之间的相互位置及连接关系、各部分的作用及工作原理、制造工艺及操作使用方法等,作进一步详细的说明,以帮助本领域技术人员对本专利技术的专利技术构思、技术方案有更完整、准确和深入的理解。一种电商在线评论文本情感分析方法,包括以下步骤:步骤1:构建电商在线评论情感词典,情感词典包括正面情感词语集合、负面情感词语集合、否定词集合和程度词集合;以正面情感词语集合为例,格式如下(部分词语):‘不错’、‘开心’、‘满意’、‘欢喜’、‘棒棒’等词语。情感词语的集合在本专业中有默认的分配方式,是常见的数据库,在此,不再赘述。步骤2:电商在线评论文本预处理,包括对文本分段分句得到句子,通过标点符号(‘,’、‘!’、‘。’、‘;’、‘、’等标点符号)将句子划分为的句子单元,然后对句子单元中的文字进行分词,形成词组。以txt文本为例,格式如下(以下是一个顾客的在线评论案例):文本原文:“派件太快了,第一次被这样的速度惊呆,超开心!”切分为句子单元后词组形式如下:句子单元1词组:派件太快了句子单元2词组:第一次被这样速度惊呆句子单元3词组:超开心步骤3:对词组进行n-gram处理,利用n-gram中的2元语法对句子单元中的词组进行组合后形成2元词组,计算句子单元的情感基本值p。具体内容为:步骤3.1:2元语法对句子单元中的词组进行组合,组合后,处以前面位置的称为前位词,处以后面位置的称为后位词。例如“文本”和“情感”组合而成的2元语法“文本情感”,其中“文本”称为为前位词,“情感”称为后位词。步骤3.2:后位词结合情感词典中正面情感词语集合和负面情感词语集合进行情感基本值p的计算判断,p初始值设定为0,在正面情感词语集合出现时情感基本值为p+1,在负面情感词语集合出现时情感基本值p-1,故p可以为1、0或者-1。前位词结合否定词集合进行计算判断,如果出现否定词字典中的词语,则情感基本值p*(-1);如果不出现,则情感基本值p不变;前位词的情感基本值计算的同时或者计算之后判断前位词中是否出现程度词集合中的词语(前位词情感基本值和判断值的计算科颖不考虑优先级),如果出现程度词字典中的词语,则前位词结合程度词集合继续计算p值,p*(程度词赋予的权重);如果没有出现程度词,则p值不变。词语在集合中的判断,依照筛选的原则,首先判断是否出现在正面情感词语集合,如果在正面情感词语集合出现则为正面情感词语,如果没有出现;依照此方法依次判断评论词语是否出现在负面情感词语集合、否定词集合和程度词集合,如果不在这些词语集合中,则不做判断。评论词语的属性判断后,进而计算情感基本值p。步骤3.3:将整个句子单元中基于2元语法所组成的2元词组对应的情感值pi相加汇总后得到句子单元的p值。因为句子已经被切分成非常小的单元,在句子单元中往往仅出现单一情感,所以一个句子单元中所有经过2元语法计算的情感值pi相加汇总后得到该句子单元的情感基本值p。上述实施例句子单元1的结果如下:句子单元1中2元词组:派件太快太快了句子单元1的p值:1。其中,p1表示“派件太快”的情感基本计算值,p2表示“太快了”的情感基本计算值。p1初始值为0,“派件太快”作为一个2元语法结构,“太快”在正面情感词语集合中出现,p1=0+1=1,“派件”没有在否定词集合、程度词集合出现,故p1继续为1;p2初始值为0,“太快了”作为另一个2元语法结构,“了”没有在正面情感词语集合中出现,p2依然为0;句子单元1的p值为p1+p2=1+0=1。其中p1为“派件太快”对应的情感值1,p2为“太快了”对应的情感值0。步骤4:电商在线评论中每个顾客在线评论被切分为句子,句子又被切分为句子单元,因此每个顾客在线评论实际上由多个句子单元组成。故每个顾客在线评论根据每个句子单元的情本文档来自技高网...
一种电商在线评论文本情感分析方法

【技术保护点】
一种电商在线评论文本情感分析方法,其特征在于,包括以下步骤:步骤1:构建电商在线评论情感词典,情感词典包括正面情感词语集合、负面情感词语集合、否定词集合和程度词集合;步骤2:对电商在线评论中的每个顾客在线评论文本进行预处理,对文本分段分句得到句子,通过标点符号将句子划分为句子单元,然后对句子单元中的文字进行分词,形成词组;步骤3:对步骤2中得到的词组进行n‑gram处理,利用n‑gram中的2元语法对句子单元中的词组组合形成2元词组,结合电商在线评论情感词典计算句子单元的情感基本值p;步骤4:电商在线评论中每个顾客在线评论被切分为句子,句子又被切分为句子单元,故每个顾客在线评论根据每个句子单元的情感基本值p,生成一个情感值p列表即p‑list;步骤5:根据每个顾客在线评论的p‑list,进行相加汇总计算出p‑综合;步骤6:利用步骤5中的p‑综合与0进行结果比较,对每个顾客的在线评论进行情感倾向判断。

【技术特征摘要】
1.一种电商在线评论文本情感分析方法,其特征在于,包括以下步骤:步骤1:构建电商在线评论情感词典,情感词典包括正面情感词语集合、负面情感词语集合、否定词集合和程度词集合;步骤2:对电商在线评论中的每个顾客在线评论文本进行预处理,对文本分段分句得到句子,通过标点符号将句子划分为句子单元,然后对句子单元中的文字进行分词,形成词组;步骤3:对步骤2中得到的词组进行n-gram处理,利用n-gram中的2元语法对句子单元中的词组组合形成2元词组,结合电商在线评论情感词典计算句子单元的情感基本值p;步骤4:电商在线评论中每个顾客在线评论被切分为句子,句子又被切分为句子单元,故每个顾客在线评论根据每个句子单元的情感基本值p,生成一个情感值p列表即p-list;步骤5:根据每个顾客在线评论的p-list,进行相加汇总计算出p-综合...

【专利技术属性】
技术研发人员:刘玉林王召义黄义兵虞昌亮刘超
申请(专利权)人:安徽商贸职业技术学院
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1