基于BERT的多特征融合实体情感分析方法及系统技术方案

技术编号:28295654 阅读:15 留言:0更新日期:2021-04-30 16:19
本申请公开了一种基于BERT的多特征融合实体情感分析方法及系统,所述方法包括以下步骤:对文本进行标注,获取实体情感数据;基于所述实体情感数据进行模型训练,获取实体情感分类模型;使用所述实体情感分类模型对预测文本进行实体情感分析。通过本申请,可以提高实体情感分类性能。

【技术实现步骤摘要】
基于BERT的多特征融合实体情感分析方法及系统
本专利技术涉及自然语言处理
更具体的说,本专利技术涉及一种基于BERT的多特征融合实体情感分析方法及系统。
技术介绍
随着众多互联网平台的快速兴起和不断发展,人们已习惯于在各大平台分享自己的所感所想。在众多领域中,通过对用户生成内容洞悉用户的需求与体验已经成为了众多服务商的普遍需求。作为自然语言处理领域热门应用技术之一的实体情感分析,为这一需求提供了细致且有效的解决方案。相较于传统的情感分类技术,实体情感分类的研究对象是更为细粒度的特定实体。特定实体的情感可以为不同任务提供特征,使任务应用场景更加丰富灵活。目前,基于BERT预训练模型的句子级情感分析方法可以获得较为先进的性能,通常考虑单一特征(实体语义特征)或是使用较为复杂的模型对某一特征进行融合,但仍然存在以下不足:1、在实体情感分析任务上,由于未能利用更多实体相关的特征,性能并不如预期;2、并未综合考虑实体语义信息与实体位置信息、句子语义信息和实体上下文特征之间的关联关系,单纯使用实体语义特征的模型导致模型性能低;3、使用多特征融合的模型,特征融合方式复杂,计算开销大,性能提升不明显,模型复杂度较高。
技术实现思路
本申请实施例提供了一种基于BERT的多特征融合实体情感分析方法,以至少解决相关技术中主观因素影响的问题。本专利技术提供了一种基于BERT的多特征融合实体情感分析方法,所述方法包括以下步骤:标注步骤:对文本进行标注,获取实体情感数据;训练步骤:基于所述实体情感数据进行模型训练,获取实体情感分类模型;预测步骤:使用所述实体情感分类模型对预测文本进行实体情感分析。作为本专利技术的进一步改进,所述标注步骤具体包括以下步骤:构建步骤:构建标注平台;输入步骤:将所述文本输入所述标注平台中进行人工实体与实体情感标注,获取所述实体情感数据。作为本专利技术的进一步改进,所述构建步骤具体包括以下步骤:规则定义步骤:定义标注规则;标签定义步骤:定义标注标签;实例给定步骤:给定标注实例。作为本专利技术的进一步改进,所述训练步骤具体包括以下步骤:校验步骤:对所述实体情感数据进行数据格式校验,并划分获取训练数据集;标记步骤:对所述训练数据集进行位置信息标记;特征获取步骤:将含有标记信息的所述训练数据集输入BERT预训练模型,获取隐藏层输出特征向量;特征融合步骤:基于所述隐藏层输出特征向量获取融合特征向量;参数获取步骤:通过softmax将所述融合特征向量进行概率化,获取模型参数。作为本专利技术的进一步改进,所述标记步骤中位置信息标记包括整句分类标识符标记、实体起始位置标记、实体结束位置标记。作为本专利技术的进一步改进,所述特征融合步骤具体包括以下步骤:组合步骤:使用加和取算数平均再输入给前馈神经网络的方式对所述隐藏层输出特征向量进行组合,计算出整句分类向量、实体上文向量、实体下文向量和实体向量;拼接步骤:将所述整句分类向量、实体上文向量、实体下文向量和实体向量拼接后进行融合,获取所述融合特征向量。作为本专利技术的进一步改进,使用反向传播梯度下降对所述模型参数进行调整。基于相同专利技术思想,本专利技术还基于任一项专利技术创造所揭示的基于BERT的多特征融合实体情感分析方法,揭示了一种基于BERT的多特征融合实体情感分析系统,所述基于BERT的多特征融合实体情感分析系统,包括:标注模块,对文本进行标注,获取实体情感数据;训练模块,基于所述实体情感数据进行模型训练,获取实体情感分类模型;预测模块,使用所述实体情感分类模型对预测文本进行实体情感分析。作为本专利技术的进一步改进,所述标注模块具体包括:构建单元,构建标注平台;输入单元,将所述文本输入所述标注平台中进行人工实体与实体情感标注,获取所述实体情感数据。作为本专利技术的进一步改进,所述构建单元具体包括:规则定义单元,定义标注规则;标签定义单元,定义标注标签;实例给定单元,给定标注实例。与现有技术相比,本专利技术的有益效果如下:1、提出了一种基于BERT的多特征融合实体情感分析方法,通过恰当的方式融合实体语义信息、实体位置信息、句子语义信息和实体上下文特征信息,对实体情感分类任务模型性能进行提升;2、在实体情感分析任务上,结合多种特征向量进行实体情感分析,有效提升性能;3、使用多特征融合,特征融合方式简洁,计算复杂度降低。本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是本专利技术实施例提供的一种基于BERT的多特征融合实体情感分析方法整体流程图;图2是本实施例所揭示的技术方案整体流程图;图3是图1所揭示的步骤S1整体流程图;图4是图3所揭示的步骤S11整体流程图;图5是图1所揭示的步骤S2整体流程图;图6是本实施例所揭示的实体情感分类模型示意图;图7是图5所揭示的步骤S24整体流程图;图8是本实施例提供的一种基于BERT的多特征融合实体情感分析系统结构框架图;图9是根据本专利技术实施例的计算机设备的框架图。以上图中:1、标注模块;2、训练模块;3、预测模块;11、构建单元;12、输入单元;111、规则定义单元;112、标签定义单元;113、实例给定单元;21、校验单元;22、标记单元;23、特征获取单元;24、特征融合单元;241、组合单元;242、拼接单元;25、参数获取单元;80、总线;81、处理器;82、存储器;83、通信接口。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的
技术实现思路
的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位本文档来自技高网
...

【技术保护点】
1.一种基于BERT的多特征融合实体情感分析方法,其特征在于,包括如下步骤:/n标注步骤:对文本进行标注,获取实体情感数据;/n训练步骤:基于所述实体情感数据进行模型训练,获取实体情感分类模型;/n预测步骤:使用所述实体情感分类模型对预测文本进行实体情感分析。/n

【技术特征摘要】
1.一种基于BERT的多特征融合实体情感分析方法,其特征在于,包括如下步骤:
标注步骤:对文本进行标注,获取实体情感数据;
训练步骤:基于所述实体情感数据进行模型训练,获取实体情感分类模型;
预测步骤:使用所述实体情感分类模型对预测文本进行实体情感分析。


2.如权利要求1所述的基于BERT的多特征融合实体情感分析方法,其特征在于,所述标注步骤具体包括以下步骤:
构建步骤:构建标注平台;
输入步骤:将所述文本输入所述标注平台中进行人工实体与实体情感标注,获取所述实体情感数据。


3.如权利要求2所述的基于BERT的多特征融合实体情感分析方法,其特征在于,所述构建步骤具体包括以下步骤:
规则定义步骤:定义标注规则;
标签定义步骤:定义标注标签;
实例给定步骤:给定标注实例。


4.如权利要求1所述的基于BERT的多特征融合实体情感分析方法,其特征在于,所述训练步骤具体包括以下步骤:
校验步骤:对所述实体情感数据进行数据格式校验,并划分获取训练数据集;
标记步骤:对所述训练数据集进行位置信息标记;
特征获取步骤:将含有标记信息的所述训练数据集输入BERT预训练模型,获取隐藏层输出特征向量;
特征融合步骤:基于所述隐藏层输出特征向量获取融合特征向量;
参数获取步骤:通过softmax将所述融合特征向量进行概率化,获取模型参数。


5.如权利要求4所述的基于BERT的多特征融合实体情感分析方法,其特征在于,所述标记步骤...

【专利技术属性】
技术研发人员:吴佳鸣
申请(专利权)人:北京明略昭辉科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1