当前位置: 首页 > 专利查询>苏州大学专利>正文

基于极性转移规则的情感分类方法技术

技术编号:7083229 阅读:239 留言:0更新日期:2012-04-11 18:40
本发明专利技术实施例公开了一种基于极性转移规则的情感分类方法,其步骤包括:在待分类文本中找出情感词,并获取与所述情感词相对应的情感词极性;使用两个或两个以上的极性转移规则判断所述情感词是否发生极性转移;所述极性转移规则包括:基于否定结构的极性转移规则,或基于转折结构的极性转移规则,或基于语态结构的极性转移规则,或基于隐含结构的极性转移规则;根据获取的所述情感词极性及极性转移判断结果,计算出待分类文本的情感极性;根据待分类文本的情感极性对待分类文本进行分类。本发明专利技术方法避免了发生极性转移的情感词对文本分类结果带来的不利影响,有利于提高文本的分类效果。

【技术实现步骤摘要】

本专利技术涉及本专利技术涉及自然语言处理
及模式识别领域,是一种。
技术介绍
随着互联网的飞速发展,互联网上的信息越来越丰富,如何从海量数据中分析信息、并提取有用信息是一个关键问题。在实际生活中,人们越来越习惯于在网络上表达自己的观点和情感,在网络上存在大量的带有情感的文本,这类文本往往以商品评论、论坛评论、博客的形式存在,并且都能很好的反映人们的看法和意见。若从这些海量文本中提取这一类带有情感的文本,并对其进行文本情感的分析和研究,具有很强的应用价值,例如用户可以根据商品的评论了解商品的信息,选择合适的品牌;商家根据用户的评论改进商品的品质,争取更大的市场;追踪社会舆论趋势,发现社会热点问题等。文本情感分析就是针对这些应用问题提出的一个新兴研究课题。所谓文本情感分析,就是对说话人的态度(或称观点、情感)进行分析,也就是对文本中的主观性信息进行分析。文本情感极性分析属于自然语言处理研究领域的范畴。情感分类(Sentiment Classification)是情感分析中的一个基本任务。该任务旨在将文本按照情感极性进行分类。与传统基于主题的文本分类相比,情感分类被认为更具有挑战性。 情感分类具体是指将文本分为正面文本或者负面文本。例如,“我非常喜欢这本书”,通过情感分类,这句话将被分为正面文本,而“这本书实在太烂了”,被分类为负面文本。目前,现有的情感分类方法大致可以分为两种第一种是基于机器学习的监督分类方法,该方法分为训练过程和分类过程。其中,在训练过程中,需要人工标注一定规模的正面文本和负面文本作为训练样本。这种方法的分类效果比较好,但是分类仅仅应用在与训练样本来自同一领域的待分类文本;第二种分类方法是基于情感词表的非监督学习方法,这种方法主要是指词计数(Term Counting)的方法。该方法使用情感词表去统计样本中正面情感词和负面情感词的数目,如果正面词的数目多于负面词的数目,则判断样本为正面样本,反之则为负面样本。该方法的实现非常简单和方便,执行效率很高,不足的地方就是分类的效果相对较差。一个影响分类效果的主要原因是,样本的文本中包括的情感词的极性往往同整个样本表达的极性并不一致,这种情感词的极性同整个文本极性不一致的情况称为情感极性转移现象。例如,“I do not like this boot at all. ”这句话中,包括一个正面情感词“like”,但是整句话的情感极性为负面,由此可知,使用词计数的分类方法得到的分类结果正确率不高。
技术实现思路
本专利技术实施例提供了一种,实现由情感词的极性准确地反应文本的情感极性,有利于进一步提高文本的分类效果。一种,其步骤包括在待分类文本中找出情感词,并获取与所述情感词相对应的情感词极性;使用两个或两个以上的极性转移规则判断所述情感词是否发生极性转移;所述极性转移规则包括基于否定结构的极性转移规则, 或基于转折结构的极性转移规则,或基于语态结构的极性转移规则,或基于隐含结构的极性转移规则;根据获取的所述情感词极性及极性转移判断结果,计算出待分类文本的情感极性;根据待分类文本的情感极性对待分类文本进行分类。相对于现有技术,本专利技术实施例能充分考虑情感极性转移现象,使用四种不同类型的规则去组合判断情感是否发生极性转移,获得的分类效果远远高于直接使用情感词的传统词计数方法。这是由于每一种情感转移规则都有其独特的判断规则,而且在后续的分类过程中,发生极性反转的比例也是不一样的,更能真实反映情感极性转移的情况。本专利技术实施例提供的一种避免了发生情感极性转移的情感词对文本分类结果带来的不利影响,有利于提高文本的分类效果。附图说明图1为本专利技术实施例提供的一种的流程示意图。具体实施例方式本专利技术实施例提供了一种,充分考虑情感极性转移现象,实现由情感词的极性准确地反应文本的情感极性,提高文本的分类效果。以下结合附图对本专利技术作出具体说明。请参考图1,一种,其步骤包括101、在待分类文本中找出情感词,并获取与情感词相对应的情感词极性;具体地说,在找出情感词之前,先预置情感词与情感词极性的对应表,然后,在待分类的文本中查找出情感词的时候,对照预置的情感词与情感词极性的对应表,在待分类的文本中找出在情感词与情感词极性的对应表中出现的情感词,并同时,获取到与情感词相对应的情感词极性。102、使用两个或两个以上的极性转移规则判断情感词是否发生极性转移;使用两个或两个以上的极性转移规则,判断在待分类的文本中,且在预置情感词与情感词极性的对应表中查找出来的情感词,是否发生了情感转移,即极性转移。在本实施例中,极性转移规则包括有基于否定结构的极性转移规则,或基于转折结构的极性转移规则,或基于语态结构的极性转移规则,或基于隐含结构的极性转移规则;进一步地,基于否定结构的极性转移规则的内容如下若情感词所在的那个句子中出现了功能型否定关键词,则情感词发生极性转移;和/或,若情感词所在的那个句子中出现了上下文型否定关键词,且所述情感词与所述上下文型否定关键词之间不超过5个单词,则情感词发生极性转移;基于转折结构的极性转移规则的内容如下若情感词所在的那个句子内前半句或者后半句中出现转折关键词,则情感词发生极性转移;基于语态结构的极性转移规则的内容如下若情感词所在的那个句子中,在情感词前出现了语态关键词,则情感词发生极性转移;基于隐含结构的极性转移规则的内容如下若情感词所在的句子中出现隐含关键词,则情感词发生极性转移;需要提出的是,在这四种极性转移规则里提到的功能型否定关键词、上下文型否定关键词、转折关键词、语态关键词、隐含关键词已设定好的关键词,即先定义好这四类关键词包含了哪些单词,如表1,列举了一部分关键词及其包含的单词的对应关系,当然,这四类关键词及其包含的单词的对应关系不仅限于表中所举出。表 权利要求1.一种,其特征在于,包括步骤在待分类文本中找出情感词,并获取与所述情感词相对应的情感词极性; 使用两个或两个以上的极性转移规则判断所述情感词是否发生极性转移;所述极性转移规则包括基于否定结构的极性转移规则,或基于转折结构的极性转移规则,或基于语态结构的极性转移规则,或基于隐含结构的极性转移规则;根据获取的所述情感词极性及极性转移判断结果,计算出待分类文本的情感极性; 根据待分类文本的情感极性对待分类文本进行分类。2.根据权利要求1所述的分类方法,其特征在于,所述在待分类文本中找出情感词,并获取与所述情感词相对应的情感词极性包括对照预置的情感词与情感词极性的对应表,在待分类文本中找出情感词,并根据所述对应表,获取与所述情感词相对应的情感词极性。3.根据权利要求1所述的分类方法,其特征在于,所述基于否定结构的极性转移规则包括若情感词所在的句子中出现功能型否定关键词,则所述情感词发生极性转移; 和/或,若情感词所在的句子中出现上下文型否定关键词,且所述情感词与所述上下文型否定关键词之间不超过5个单词,则所述情感词发生极性转移;所述功能型否定关键词和上下文型否定关键词为预设定的关键词。4.根据权利要求1所述的分类方法,其特征在于,所述基于转折结构的极性转移规则包括若情感词所在的句子内前半句或者后半句中出现转折关键词,则所述情感词发生极性转移;所述转折关键词为预设定的关键词。5.根据权利要求1所述本文档来自技高网
...

【技术保护点】
1.一种基于极性转移规则的情感分类方法,其特征在于,包括步骤:在待分类文本中找出情感词,并获取与所述情感词相对应的情感词极性;使用两个或两个以上的极性转移规则判断所述情感词是否发生极性转移;所述极性转移规则包括:基于否定结构的极性转移规则,或基于转折结构的极性转移规则,或基于语态结构的极性转移规则,或基于隐含结构的极性转移规则;根据获取的所述情感词极性及极性转移判断结果,计算出待分类文本的情感极性;根据待分类文本的情感极性对待分类文本进行分类。

【技术特征摘要】

【专利技术属性】
技术研发人员:李寿山钱龙华周国栋
申请(专利权)人:苏州大学
类型:发明
国别省市:32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1