本发明专利技术公开了一种情感分析装置,包括:输入处理单元,适于基于预定方面,将目标文本中的各个词映射为与各个词对应的第一向量;循环神经网络处理单元,适于接收各个词的第一向量,并利用循环神经网络模型得到与各个词对应的第二向量;位置衰变单元,适于基于各个词与预定方面之间的位置关系将各个词的第二向量映射为第三向量;注意力处理单元,适于基于各个词的第三向量,计算得到各个词的注意力分布;加权组合单元,适于基于注意力分布对各个词的第三向量进行加权组合;以及分类输出单元,适于基于加权组合单元的输出确定目标文本对于预定方面的情感极性。本发明专利技术还公开了对应的情感分析方法、计算设备和可读存储介质。计算设备和可读存储介质。计算设备和可读存储介质。
【技术实现步骤摘要】
一种情感分析装置、方法、计算设备及可读存储介质
[0001]本专利技术涉及自然语言处理
,尤其涉及一种情感分析装置、方法、计算设备及可读存储介质。
技术介绍
[0002]随着互联网技术的发展和普及,各种社交平台、购物平台产生海量文本数据。这些文本通常包含对各种对象(例如产品、服务)的评价。对对象的评价具有情感极性,例如可以是积极、消极或者中性的。挖掘这种情感极性的技术称之为情感分析技术。
[0003]文本通常包含有对于一个或者多个方面(aspect)的情感极性,然而,现有的情感分析技术仅能提取出整体的情感分类,无法获取针对各个方面的情感极性,导致不能全方位全面的了解用户对对象的评价。
[0004]因此,需要一种更先进的情感分析方案,以便针对各个方面进行情感分类。
技术实现思路
[0005]为此,本专利技术实施例提供一种情感分析装置、方法、计算设备及可读存储介质,以力图解决或者至少缓解上面存在的至少一个问题。
[0006]根据本专利技术实施例的一个方面,提供了一种情感分析装置,适于确定目标文本对于预定方面的情感极性,情感分析装置包括:输入处理单元,适于基于预定方面,将目标文本中的各个词映射为与各个词对应的第一向量;循环神经网络处理单元,适于接收各个词的第一向量,并利用循环神经网络模型得到与各个词对应的第二向量;位置衰变单元,适于接收各个词的第二向量,并基于各个词与预定方面之间的位置关系将各个词的第二向量映射为第三向量;注意力处理单元,适于接收各个词的第三向量,并基于各个词的第三向量,计算得到各个词的注意力分布;加权组合单元,基于接收各个词的第三向量和注意力分布,并基于注意力分布对各个词的第三向量进行加权组合;以及分类输出单元,适于接收加权组合单元的输出,基于加权组合单元的输出确定目标文本对于预定方面的情感极性。
[0007]可选地,在根据本专利技术实施例的装置中,嵌入处理单元包括:实体标识嵌入处理单元,适于将目标文本中的各个词与预定方面之间的标识关系映射为与各个词对应的标识向量;词嵌入处理单元,适于将目标文本中的各个词映射为与各个词对应的词向量;以及嵌入组合单元,适于将各个词对应的词向量和标识向量进行组合,得到与各个词对应的第一向量。
[0008]可选地,在根据本专利技术实施例的装置中,标识关系指示目标文本中的词是否为预定方面对应的实体词。
[0009]可选地,在根据本专利技术实施例的装置中,循环神经网络处理单元利用的循环神经网络为双向长短期记忆网络。
[0010]可选地,在根据本专利技术实施例的装置中,注意力处理单元适于采用结构化注意力机制,基于各个词的第三向量,计算得到各个词的注意力分布。
[0011]可选地,在根据本专利技术实施例的装置中,结构化注意力机制包括多头结构化注意力机制,注意力处理单元适于基于各个词的第三向量,计算得到各个词对应于多头的多个注意力分布。
[0012]可选地,在根据本专利技术实施例的装置中,还包括与循环神经网络处理单元相连接的条件随机场处理单元,注意力处理单元适于基于条件随机场处理单元来计算注意力分布。
[0013]可选地,在根据本专利技术实施例的装置中,注意力处理单元适于基于各个词的预定标签、第三向量、循环神经网络处理单元输出的发射分数和条件随机场处理单元的转移分数,来计算注意力分布。
[0014]可选地,在根据本专利技术实施例的装置中,加权组合单元适于对于各个注意力分布,均基于注意力分布对各个词的第三向量进行加权组合,以得到多个第四向量;将多个第四向量进行组合,得到并输出目标文本的第五向量。
[0015]可选地,在根据本专利技术实施例的装置中,分类输出单元包括全连接神经网络处理单元和Softmax处理单元。
[0016]可选地,在根据本专利技术实施例的装置中,预定方面对应的实体词从目标文本中抽取得到。
[0017]根据本专利技术实施例的另一个方面,提供了一种情感分析方法,包括:基于预定方面,将目标文本中的各个词映射为与各个词对应的第一向量;利用循环神经网络模型得到与各个词对应的第二向量;基于各个词与预定方面之间的位置关系将各个词的第二向量映射为第三向量;基于各个词的第三向量,计算得到各个词的注意力分布;基于注意力分布对各个词的第三向量进行加权组合;以及基于进行加权组合得到的向量,确定目标文本对于预定方面的情感极性。
[0018]可选地,在根据本专利技术实施例的方法中,基于预定方面,将目标文本中的各个词映射为与各个词对应的第一向量的步骤包括:将目标文本中的各个词与预定方面之间的标识关系映射为与各个词对应的标识向量;将目标文本中的各个词映射为与各个词对应的词向量;将各个词对应的词向量和标识向量进行组合,得到与各个词对应的第一向量。
[0019]可选地,在根据本专利技术实施例的方法中,标识关系指示目标文本中的词是否为预定方面对应的实体词。
[0020]可选地,在根据本专利技术实施例的方法中,循环神经网络为双向长短期记忆网络。
[0021]可选地,在根据本专利技术实施例的方法中,基于各个词的第三向量,计算得到各个词的注意力分布的步骤包括:采用结构化注意力机制,基于各个词的第三向量,计算得到各个词的注意力分布。
[0022]可选地,在根据本专利技术实施例的方法中,基于各个词的第三向量,计算得到各个词的注意力分布的步骤包括:采用多头结构化注意力机制,基于各个词的第三向量,计算得到各个词对应于多头的多个注意力分布。
[0023]可选地,在根据本专利技术实施例的方法中,计算注意力分布的步骤包括:采用条件随机场来计算注意力分布。
[0024]可选地,在根据本专利技术实施例的方法中,基于注意力分布对各个词的第三向量进行加权组合的步骤包括:对于各个注意力分布,均基于注意力分布对各个词的第三向量进
行加权组合,以得到多个第四向量;将多个第四向量进行组合,得到目标文本的第五向量。
[0025]根据本专利技术实施例的另一个方面,提供了一种计算设备,包括:一个或多个处理器;存储器;以及一个或多个程序,其中一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行,该一个或多个程序包括用于执行根据本专利技术实施例的情感分析方法中的任一方法的指令。
[0026]根据本专利技术实施例的还有一个方面,提供了一种存储程序的可读存储介质,该程序包括指令,该指令当由计算设备执行时,使得计算设备执行根据本专利技术实施例的情感分析方法的中任一方法。
[0027]根据本专利技术实施例的情感分析方案通过对目标文本中各词的嵌入处理、循环神经网络处理、衰变处理、注意力机制处理和分类处理,可以获取目标文本对于预定方面的情感极性。
[0028]其中,通过组合词的标识向量和词向量,获取到预定方面的标识信息,提高了情感分析判断的准确度。通过基于词与预定方面的位置关系来进行衰变,减弱了距离预定方面远的词对预定方面的情感极性的影响,进一步提高了情感分析判断的准确度。
[0029]其中,采用结构化注意力机制(例如采用条件随机场)可以有效提取目标文本中的本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种情感分析装置,适于确定目标文本对于预定方面的情感极性,所述情感分析装置包括:输入处理单元,适于基于所述预定方面,将所述目标文本中的各个词映射为与各个词对应的第一向量;循环神经网络处理单元,适于接收各个词的第一向量,并利用循环神经网络模型得到与各个词对应的第二向量;位置衰变单元,适于接收各个词的第二向量,并基于各个词与所述预定方面之间的位置关系将各个词的第二向量映射为第三向量;注意力处理单元,适于接收各个词的第三向量,并基于所述各个词的第三向量,计算得到所述各个词的注意力分布;加权组合单元,适于接收所述各个词的第三向量和注意力分布,并基于所述注意力分布对所述各个词的第三向量进行加权组合;以及分类输出单元,适于接收所述加权组合单元的输出,基于所述加权组合单元的输出确定所述目标文本对于所述预定方面的情感极性。2.如权利要求1所述的装置,其中,所述嵌入处理单元包括:实体标识嵌入处理单元,适于将所述目标文本中的各个词与所述预定方面之间的标识关系映射为与各个词对应的标识向量;词嵌入处理单元,适于将所述目标文本中的各个词映射为与各个词对应的词向量;以及嵌入组合单元,适于将各个词对应的词向量和标识向量进行组合,得到与各个词对应的所述第一向量。3.如权利要求2所述的装置,其中,所述标识关系指示所述目标文本中的词是否为所述预定方面对应的实体词。4.如权利要求1所述的装置,其中,所述循环神经网络处理单元利用的循环神经网络为双向长短期记忆网络。5.如权利要求1所述的装置,其中,所述注意力处理单元适于采用结构化注意力机制,基于所述各个词的第三向量,计算得到所述各个词的注意力分布。6.如权利要求5所述的装置,其中,所述结构化注意力机制包括多头结构化注意力机制,所述注意力处理单元适于基于所述各个词的第三向量,计算得到所述各个词对应于多头的多个注意力分布。7.如权利要求5或6所述的装置,还包括与所述循环神经网络处理单元相连接的条件随机场处理单元,所述注意力处理单元适于基于所述条件随机场处理单元来计算所述注意力分布。8.如权利要求7所述的装置,其中,所述注意力处理单元适于基于所述各个词的预定标签、第三向量、所述循环神经网络处理单元输出的发射分数和所述条件随机场处理单元的转移分数,来计算所述注意力分布。9.如权利要求6所述的装置,其中,所述加权组合单元适于对于各个注意力分布,均基于所述注意力分布对所述各个词的第三向量进行加权组
合,以得到多个第四向量;将所述多个第四向量进行组合,得到并输出所述目标文本的第五向量。10.如权利要求1所述的装置,其中,所述分类输出单元包括全连接神...
【专利技术属性】
技术研发人员:许璐,黄非,司罗,邴立东,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。