一种情绪特征提取的方法及装置制造方法及图纸

技术编号:35215780 阅读:9 留言:0更新日期:2022-10-15 10:30
本申请提供了一种情绪特征提取的方法及装置,可应用于人工智能领域、云计算领域、大数据领域、物联网领域、移动互联领域或金融领域。该方法包括:基于训练后的第一预设模型提取待提取文本的情绪特征。第一预设模型先基于时序特征进行叠加,再提取待提取文本中的情绪特征。这样,通过训练的第一预设模型对待提取文本进行提取,使得获得情绪特征不依赖于既定的语言规则。因此,避免了基于规则的编制方法无法识别新出现的流行词和表情符的问题。由此,提高了词典覆盖率,进一步提升了情绪判断的准确度。确度。确度。

【技术实现步骤摘要】
一种情绪特征提取的方法及装置


[0001]本申请涉及人工智能
,尤其涉及一种情绪特征提取的方法及装置。

技术介绍

[0002]近年来,随着大数据的不断深入发展,以大数据为基础的金融服务模式也应用而生。上述金融服务模式需要借助客户情绪画像对用户进行深入挖掘。而构建客户情绪画像需要进行用户情绪分析。可以采用情绪词典的方法对用户情绪进行分析。情绪词典是指借助于自然语言处理技术从多种文本中实现隐藏情绪特征的识别和提取,并以此作为对用户情绪判断的依据。
[0003]然而现有的情绪词典主要是基于规则进行编制的。所谓基于规则的情绪词典编制方法是基于语言学角度,利用领域专家经年积累的经验知识对规则进行编写。对于金融文本来讲,每年都有新型的流行词产生,且经常需要根据表情符进行情绪判断。上述编制方法难以对新出现的流行词和表情符进行识别和判断,造成情绪词典覆盖率受限问题。以上述情绪词典为基础对客户情绪画像进行刻画,会造成情绪判断准确度低。
[0004]因此,如何提高情绪词典覆盖率,进而提升判断用户情绪的准确度是本领域技术人员亟待解决的技术问题。

技术实现思路

[0005]有鉴于此,本申请实施例提供了一种情绪特征提取的方法及装置,旨在提升情绪词典覆盖率,进一步提升判断客户情绪的准确度。
[0006]第一方面,本申请实施例提供了一种情绪特征提取的方法,所述方法包括:
[0007]获取待提取文本;所述待提取文本包括情绪特征;所述情绪特征包括新型的情绪流行词和表情符;
[0008]基于训练后的第一预设模型提取所述待提取文本中的所述情绪特征;所述第一预设模型用于提取所述待提取文本的局部特征;所述第一预设模型由先时序特征叠加再局部特征提取的方式实现。
[0009]可选的,所述第一预设模型为循环卷积神经网络RCNN模型;所述RCNN模型包括循环神经网络RNN的循环层和卷积神经网络CNN的卷积层和池化层;
[0010]所述基于第一预设模型提取所述待提取文本中的所述情绪特征,包括:
[0011]基于所述循环神经网络RNN的循环层,生成一级特征,所述一级特征为所述待提取文本的局部特征;
[0012]基于所述一级特征和所述卷积神经网络CNN的卷积层和池化层,生成所述情绪特征;所述池化层进行分段池化处理。
[0013]可选的,所述方法还包括:提取主题特征,所述主题特征用于对情绪进行分类;所述提取主题特征包括:
[0014]基于第二预设模型和所述待提取文本,生成所述待提取文本的主题特征;所述第
二预设模型为双词主题情绪联合模型JSBTM模型,所述双词主题情绪联合模型JSBT包括双词主题模块BTM和情绪主题联合模型JST。
[0015]可选的,所述方法还包括:
[0016]根据提取的所述情绪特征,基于第一预设算法,进行所述情绪特征的权重计算;所述第一预设算法为词频

逆向文件频率TF

IDF算法。
[0017]可选的,所述方法还包括:
[0018]根据提取的所述情绪特征,基于第二预设算法生成词向量;所述词向量为包括所述情绪特征的向量;所述第二预设算法为词向量学习模型HIT;
[0019]根据所述词向量和分类词典,生成金融情绪词典;所述分类词典为传统的情绪词典。
[0020]第二方面,本申请实施例提供了一种情绪特征提取的装置,
[0021]获取单元,用于获取待提取文本;所述待提取文本包括情绪特征;所述情绪特征包括新型的情绪流行词和表情符;
[0022]情绪特征提取单元,用于基于训练后的第一预设模型提取所述待提取文本中的所述情绪特征;所述第一预设模型用于提取所述待提取文本的局部特征;所述第一预设模型由先时序特征叠加再局部特征提取的方式实现。
[0023]可选的,所述第一预设模型为循环卷积神经网络RCNN模型;所述RCNN模型包括循环神经网络RNN的循环层和卷积神经网络CNN的卷积层和池化层;所述提取单元包括:
[0024]局部特征提取模块,用于基于所述循环神经网络RNN的循环层,生成一级特征,所述一级特征为所述待提取文本的局部特征;
[0025]情绪特征提取模块,用于基于所述一级特征和所述卷积神经网络CNN的卷积层和池化层,生成所述情绪特征;所述池化层进行分段池化处理。
[0026]可选的,所述装置还包括:
[0027]主题特征提取单元,用于提取主题特征,所述主题特征用于对情绪进行分类。
[0028]可选的,所述装置还包括:
[0029]权重提取单元,用于根据提取的所述情绪特征,基于第一预设算法,进行所述情绪特征的权重计算;所述第一预设算法为词频

逆向文件频率TF

IDF算法。
[0030]第三方面,本申请实施例提供了一种计算机存储介质,所述计算机存储介质中存储有代码,当所述代码被运行时,运行所述代码的设备实现前述第一方面任一项所述的情绪特征提取方法。
[0031]本申请实施例提供了一种情绪特征提取的方法及装置。在执行所述方法时:首先获取待提取文本,然后基于训练后的第一预设模型提取待提取文本的情绪特征。第一预设模型先基于时序特征进行叠加,再提取待提取文本中的情绪特征。这样,通过训练的第一预设模型对待提取文本进行提取,使得获得情绪特征不依赖于既定的语言规则。因此,避免了基于规则的编制方法无法识别新出现的流行词和表情符的问题。由此,提高了词典覆盖率,进一步提升了情绪判断的准确度。
附图说明
[0032]为更清楚地说明本实施例或现有技术中的技术方案,下面将对实施例或现有技术
描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0033]图1为本申请实施例提供的一种情绪特征提取的方法和装置的示例性应用场景图;
[0034]图2为本申请实施例提供的方法的一种情绪特征提取的方法流程图;
[0035]图3为本申请实施例提供的另一种情绪特征提取方法流程图;
[0036]图4为本申请实施例提供的一种客户情绪画像刻画的方法流程图;
[0037]图5为本申请实施例提供的一种情绪特征提取装置结构示意图。
具体实施方式
[0038]正如前文所述,现有技术采用情绪词典的方法。现有的情绪词典是基于规则进行编制的。专利技术人发现:基于规则的情绪词典编制方法是基于语言学角度,利用领域专家经年积累的经验知识对规则进行编写。对于金融文本来讲,每年都有新型的流行词产生,且经常需要根据表情符进行情绪判断。上述编制方法难以对新型的流行词和表情符进行识别和判断,由此造成情绪词典覆盖率受限,进而导致情绪判断准确度低。
[0039]针对上述问题,专利技术人提出了基于训练后的第一预设模型提取用户情绪特征的方式,即先基于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种情绪特征提取的方法,其特征在于,所述方法包括:获取待提取文本;所述待提取文本包括情绪特征;所述情绪特征包括新型的情绪流行词和表情符;基于训练后的第一预设模型提取所述待提取文本中的所述情绪特征;所述第一预设模型用于提取所述待提取文本的局部特征;所述第一预设模型由先时序特征叠加再局部特征提取的方式实现。2.根据权利要求1所述方法,其特征在于,所述第一预设模型为循环卷积神经网络RCNN模型;所述RCNN模型包括循环神经网络RNN的循环层和卷积神经网络CNN的卷积层和池化层;所述基于训练后的第一预设模型提取所述待提取文本中的所述情绪特征,包括:基于所述循环神经网络RNN的循环层,生成一级特征,所述一级特征为所述待提取文本的局部特征;基于所述一级特征和所述卷积神经网络CNN的卷积层和池化层,生成所述情绪特征;所述池化层进行分段池化处理。3.根据权利要求1所述方法,其特征在于,所述方法还包括:提取主题特征,所述主题特征用于对情绪进行分类;所述提取主题特征包括:基于第二预设模型和所述待提取文本,生成所述待提取文本的所述主题特征;所述第二预设模型为双词主题情绪联合模型JSBTM模型,所述双词主题情绪联合模型JSBT包括双词主题模块BTM和情绪主题联合模型JST。4.根据权利要求3所述方法,其特征在于,所述方法还包括:根据提取的所述情绪特征,基于第一预设算法,进行所述情绪特征的权重计算;所述第一预设算法为词频

逆向文件频率TF

IDF算法。5.根据权利要求1所述方法,其特征在于,所述方法还包括:根据提取的所述情绪特征,基于第二预设算法生成词向量;所述词向量为包括所述情绪特征的向量;所述第二预设算法为词向...

【专利技术属性】
技术研发人员:陶英杰
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1