基于人工智能的情感分类方法和相关装置制造方法及图纸

技术编号:25599058 阅读:20 留言:0更新日期:2020-09-11 23:56
本申请实施例公开了一种基于人工智能的情感分类方法和相关装置,针对需要进行情感分类的待分类文本,可以根据文本特征,通过胶囊网络模型中的胶囊结构获取对应的输出结果。胶囊网络模型中包括与要素一一对应的胶囊结构,针对任意一个胶囊结构,该胶囊结构中包括所对应目标要素的特征向量,通过该特征向量可以得到输出结果中的第一识别结果和第二识别结果。基于胶囊网络模型中每个胶囊结构的输出数据,可以确定待分类文本对应于要素的情感分类结果。基于胶囊结构的特点,实现了通过胶囊网络模型对不同要素的针对性情感识别,将要素和情感有机的关联起来,不仅降低了人为经验的在情感识别上的影响,而且大大提高了对应于要素的情感分类精度。

【技术实现步骤摘要】
基于人工智能的情感分类方法和相关装置
本申请涉及数据处理领域,特别是涉及一种情感分类方法和相关装置。
技术介绍
用户在使用互联网的过程中会产生大量的文本信息,例如聊天内容、购物评价、商品点评、博客、朋友圈等等。这些文本信息可以体现出用户的不同类别情感,例如正向情感、负向情感等。如果能够准确确定出文本信息中用户情感的类别,可以为产品研发、内容推荐、市场预测等提供重要数据依据。在确定文本信息所体现情感类别的相关技术中,主要采用情感字典作为的依据。情感字典中需要包括了大量人工标注类别的情感词,标注过程非常依赖人为经验,且难以覆盖全面。而且,同一情感词针对不同的要素(例如食物、价格)所体现出的情感可能完全不同,即使使用人工标注也难以实现准确区分。
技术实现思路
为了解决上述技术问题,本申请提供了一种情感分类方法和相关装置,提高了对应于要素的情感分类精度。本申请实施例公开了如下技术方案:一方面,本申请实施例提供了一种情感分类方法,所述方法包括:获取待分类文本;所述待分类文本包括多个词;根据所述待分类文本的文本特征,确定对应胶囊网络模型中胶囊结构的输入数据;所述文本特征包括所述多个词分别对应的词特征向量,所述胶囊结构与要素一一对应,所述要素用于标识对象类别,所述对象类别所包括的对象具有相关的情感词,所述胶囊结构中包括所对应目标要素的特征向量;获取所述胶囊结构基于所述特征向量和注意力机制确定的输出数据,所述输出数据包括第一识别结果和第二识别结果,所述第一识别结果用于标识所述多个词中是否包括属于所述目标要素的词,所述第二识别结果用于标识所述多个词相对于所述目标要素的情感类别;根据所述胶囊网络模型中每个胶囊结构的输出数据,确定所述待分类文本对应于要素的情感分类结果。另一方面,本申请实施例提供了一种情感分类装置,所述装置包括第一获取单元、第一确定单元、第二获取单元和第二确定单元:所述第一获取单元,用于获取待分类文本;所述待分类文本包括多个词;所述第一确定单元,用于根据所述待分类文本的文本特征,确定对应胶囊网络模型中胶囊结构的输入数据;所述文本特征包括所述多个词分别对应的词特征向量,所述胶囊结构与要素一一对应,所述要素用于标识对象类别,所述对象类别所包括的对象具有相关的情感词,所述胶囊结构中包括所对应目标要素的特征向量;所述第二获取单元,用于获取所述胶囊结构基于所述特征向量和注意力机制确定的输出数据,所述输出数据包括第一识别结果和第二识别结果,所述第一识别结果用于标识所述多个词中是否包括属于所述目标要素的词,所述第二识别结果用于标识所述多个词相对于所述目标要素的情感类别;所述第二确定单元,用于根据所述胶囊网络模型中每个胶囊结构的输出数据,确定所述待分类文本对应于要素的情感分类结果。另一方面,本申请实施例提供了一种情感分类设备,所述设备包括处理器以及存储器:所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;所述处理器用于根据所述程序代码中的指令执行上述情感分类方法。另一方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行上述情感分类方法。由上述技术方案可以看出,针对需要进行情感分类的待分类文本,可以根据待分类文本的文本特征,通过胶囊网络模型中的胶囊结构获取对应的输出结果。胶囊网络模型中包括与要素一一对应的胶囊结构,针对任意一个胶囊结构,该胶囊结构中包括所对应目标要素的特征向量,通过该特征向量并基于注意力机制,可以得到输出结果中的第一识别结果和第二识别结果。由于文本特征具有待分类文本所包括多个词分别对应的词特征向量,故通过胶囊结构中的特征向量,可以从单个词的角度确定出多个词中是否具有符合目标要素的词,即第一识别结果,以及从文本整体的角度确定多个词相对于目标要素的情感类别,即第二识别结果。从而,基于胶囊网络模型中每个胶囊结构的输出数据,可以确定待分类文本对应于要素的情感分类结果。基于胶囊结构的特点,实现了通过胶囊网络模型对不同要素的针对性情感识别,将要素和情感有机的关联起来,不仅降低了人为经验的在情感识别上的影响,而且大大提高了对应于要素的情感分类精度。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种情感分类方法的应用场景示意图;图2为本申请实施例提供的一种情感分类方法流程图;图3为本申请实施例提供的一种胶囊结构示意图;图4为本申请实施例提供的一种得到胶囊网络模型的方法流程图;图5为本申请实施例提供的一种应用胶囊网络模型进行情感分类的流程图;图6为本申请实施例提供的一种情感分类装置示意图;图7为本申请实施例提供的一种数据处理设备结构图;图8为本申请实施例提供的一种服务器的结构图。具体实施方式下面结合附图,对本申请的实施例进行描述。目前,在确定文本信息所体现情感类别的相关技术中,主要采用情感字典作为依据。该情感字典中包括大量人工标注类别的情感词,以及为情感词添加的关于情感类别的标签,如情感字典中的“高”这一情感词,为其添加有情感类别为“正向情感”的标签。可以理解,该标注过程非常依赖人为经验,且难以全面覆盖各类情感词,影响文本信息的情感类别确定准确率。而且,同一情感词针对不同的要素(Aspect)(例如食物(Food)、价格(Price)等),所体现出的情感类别可能完全不同,即情感词的要素适应性较差。例如,“高”这一情感词对“价格”的情感类别为“负向情感”,对于“食物”的情感类别是不明确的,对“分辨率”的情感类别为“正向情感”。可见,即使使用人工标注也难以实现情感类别的准确区分。为此,本申请实施例提供了一种情感分类方法,以降低人为经验在情感识别上的影响,提高待分类文本的情感类别分类精度。需要说明,本申请实施例涉及的情感分类可以是指,当待分类文本中包括属于某些要素的词时,确定该待分类文本针对该要素体现的情感类别。其中,所提及的要素可以用于标识能够被形容、被评价的对象类别,如“食物”,“价格”等。且针对这些对象类别,可以具有相关的情感词来表达对这些对象类别所包括对象的情感。例如,对于对象类别“食物”,具有如“美味”、“好吃”等情感词来表达对该对象类别包括的对象如“烤鱼”的情感。情感类别用于体现针对要素的情感倾向。情感类别的维度可以根据实际场景或需求进行设置,如仅需要确定待分类文本针对某一要素的评价好坏,可以设置情感类别包括正向情感和负向情感这两个维度的情感类别,在一些场景下,也可以将情感类别分为三个维度(正向情感、中性情感、负向情感)、五个维度(正向情感+、本文档来自技高网...

【技术保护点】
1.一种情感分类方法,其特征在于,所述方法包括:/n获取待分类文本;所述待分类文本包括多个词;/n根据所述待分类文本的文本特征,确定对应胶囊网络模型中胶囊结构的输入数据;所述文本特征包括所述多个词分别对应的词特征向量,所述胶囊结构与要素一一对应,所述要素用于标识对象类别,所述对象类别所包括的对象具有相关的情感词,所述胶囊结构中包括所对应目标要素的特征向量;/n获取所述胶囊结构基于所述特征向量和注意力机制确定的输出数据,所述输出数据包括第一识别结果和第二识别结果,所述第一识别结果用于标识所述多个词中是否包括属于所述目标要素的词,所述第二识别结果用于标识所述多个词相对于所述目标要素的情感类别;/n根据所述胶囊网络模型中每个胶囊结构的输出数据,确定所述待分类文本对应于要素的情感分类结果。/n

【技术特征摘要】
1.一种情感分类方法,其特征在于,所述方法包括:
获取待分类文本;所述待分类文本包括多个词;
根据所述待分类文本的文本特征,确定对应胶囊网络模型中胶囊结构的输入数据;所述文本特征包括所述多个词分别对应的词特征向量,所述胶囊结构与要素一一对应,所述要素用于标识对象类别,所述对象类别所包括的对象具有相关的情感词,所述胶囊结构中包括所对应目标要素的特征向量;
获取所述胶囊结构基于所述特征向量和注意力机制确定的输出数据,所述输出数据包括第一识别结果和第二识别结果,所述第一识别结果用于标识所述多个词中是否包括属于所述目标要素的词,所述第二识别结果用于标识所述多个词相对于所述目标要素的情感类别;
根据所述胶囊网络模型中每个胶囊结构的输出数据,确定所述待分类文本对应于要素的情感分类结果。


2.根据权利要求1所述的方法,其特征在于,所述胶囊结构包括要素注意力模块和情感注意力模块,所述获取所述胶囊结构基于所述特征向量和注意力机制确定的输出数据,包括:
根据所述特征向量和所述输入数据,通过所述要素注意力模块确定相对于所述目标要素,所述多个词分别对应的第一注意力权值;所述第一注意力权值用于标识所对应词属于所述目标要素的可能性;
根据所述第一注意力权值,确定所述第一识别结果;
根据所述特征向量和所述输入数据,通过所述情感注意力模块确定相对于所述目标要素,所述多个词分别对应的第二注意力权值;所述第二注意力权值用于标识所对应词属于与所述目标要素相关的情感词的可能性;
根据所述第二注意力权值,确定所述第二识别结果。


3.根据权利要求2所述的方法,其特征在于,所述根据所述第一注意力权值,确定所述第一识别结果,包括:
根据所述文本特征和所述第一注意力权值,确定所述第一识别结果;
所述根据所述第二注意力权值,确定所述第二识别结果,包括:
根据所述文本特征和所述第二注意力权值,确定所述第二识别结果。


4.根据权利要求2所述的方法,其特征在于,所述胶囊结构还包括共享注意力模块,所述方法还包括:
根据所述特征向量和所述输入数据,通过所述共享注意力模块确定相对于所述目标要素,所述多个词分别对应的第三注意力权值;所述第三注意力权值用于标识所对应词在属于所述目标要素和属于所述情感词间的偏向程度;
所述根据所述第一注意力权值,确定所述第一识别结果,包括:
根据所述第一注意力权值和所述第三注意力权值,确定所述第一识别结果;
所述根据所述第二注意力权值,确定所述第二识别结果,包括:
根据所述第二注意力权值和所述第三注意力权值,确定所述第二识别结果。


5.根据权利要求1-4任意一项所述的方法,其特征在于,所述胶囊网络模型包括由多个胶囊结构共享的预处理层,所述根据所述待分类文本的文本特征,确定对应胶囊网络模型中胶囊结构的输入数据,包括:
根据所述多个胶囊结构分别对应的要素,通过所述预处理层对所述文本特征进行针对所述多个胶囊结构的预处理,得到所述多个胶囊结构分别对应的输入数据;其中,针对所述多个胶囊结构中的一个胶囊结构,这个胶囊结构对应的输入数据是结合所述多个胶囊结构中其他胶囊结构所对应输入数据确定的。


6.根据权利要求2所述的方法,其特征在于,所述胶囊结构设置有对应的字典库,所述字典库包括词与要素权重参数间的对应关系,所述方法还包括:
若所述情感分类结果中包括对应所述目标要素的子情感分类结果,确定所述待分类文本中属于所述目标要素的第一词,以及所述第一词对应的第一注意力权值;
根据所述第一词对应的第一注意力权值,更新所述字典库中所述第一词对应的要素权重参数;
在完成针对文本集合的情感分类后,根据所述字典库中的要素权重参数,确定所述目标要素对应的要素词列表,所述文本集合包括所述待分类文本。


7.根据权利要求6所述的方法,其特征在于,所述字典库还包括词与情感权重参数间的对应关系,所述方法还包括:
若所述情感分类结果中包括对应所述目标要素的子情感分类结果,确定所述待分类文本中属于所述情感词的第二词,以及所述第二词对应的第二注意力权值;
根据所述第二词对应的第二注意力权值,更新所述字典库中所述第二词对应的情感权重参数;
在完成针对所述文本集合的情感分类后,根据所述字典库中的情感权重参数,确定所述目标要素对应的情感词列表。


8.根据...

【专利技术属性】
技术研发人员:王业全孙爱欣王爱华朱小燕魏望
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1