System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于标注的情感分析方法、装置、计算机设备及存储介质制造方法及图纸_技高网

基于标注的情感分析方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:40462806 阅读:5 留言:0更新日期:2024-02-22 23:17
本发明专利技术涉及自然语言处理技术领域,公开了一种基于标注的情感分析方法、装置、计算机设备及存储介质。该方法通过获取第一训练文本数据,根据预设的情感句语义模型对第一训练文本数据进行标注,得到情感句标注数据;获取第二训练文本数据以及与第二训练文本数据对应的情感词类型标签,根据第二训练文本数据和情感词类型标签确定情感词标注数据;根据情感句标注数据和情感词标注数据对预设的待训练模型进行训练,得到情感分析模型;将待分析文本数据输入情感分析模型进行分析,得到与待分析文本数据对应的情感类型。本发明专利技术基于情感句标注数据和情感词标注数据之间的相互增强处理,减小了标注工作任务量,提高了模型泛化能力和跨领域应用效果。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,尤其涉及一种基于标注的情感分析方法、装置、计算机设备及存储介质


技术介绍

1、随着互联网技术的发展,每天都会在网络和社交平台上产生海里的文本数据资源,挖掘文本数据资源丰富的内部信息并作情感分析可以应用在不同的领域,例如网络舆论分析、商品评论分析、客户服务评价和业务风险预测分析等。

2、现有的情感分析主要是通过有监督的机器学习实现的,具体是在给定已有标注数据的情况下,通过学习输入数据与对应标签之间的关系,训练出一个情感分类模型。但是,为了适应信息量的增加,监督学习需要大量的标注数据来训练模型,标注工作会非常耗时费力。同时,由于标注数据往往涉及到主观判断,不同的标注者可能会因为个人认知差异而标注不一致,从而影响模型的泛化能力。此外,由于不同领域之间存在差异,导致针对一个应用领域训练的模型无法有效迁移到其他应用领域,往往需要使用大量数据重新训练模型。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种基于标注的情感分析方法、装置、计算机设备及存储介质,以解决现有情感分析时的标注工作任务量大、模型泛化能力低和跨领域应用效果差的问题。

2、一种基于标注的情感分析方法,包括:

3、获取第一训练文本数据,根据预设的情感句语义模型对所述第一训练文本数据进行标注,得到情感句标注数据;

4、获取第二训练文本数据以及与所述第二训练文本数据对应的情感词类型标签,根据所述第二训练文本数据和所述情感词类型标签确定情感词标注数据;

5、根据所述情感句标注数据和所述情感词标注数据对预设的待训练模型进行训练,得到情感分析模型;

6、将待分析文本数据输入所述情感分析模型进行分析,得到与所述待分析文本数据对应的情感类型。

7、一种基于标注的情感分析装置,包括:

8、情感句标注模块,用于获取第一训练文本数据,根据预设的情感句语义模型对所述第一训练文本数据进行标注,得到情感句标注数据;

9、情感词标注模块,用于获取第二训练文本数据以及与所述第二训练文本数据对应的情感词类型标签,根据所述第二训练文本数据和所述情感词类型标签确定情感词标注数据;

10、模型训练模块,用于根据所述情感句标注数据和所述情感词标注数据对预设的待训练模型进行训练,得到情感分析模型;

11、情感分析模块,用于将待分析文本数据输入所述情感分析模型进行分析,得到与所述待分析文本数据对应的情感类型。

12、一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现上述基于标注的情感分析方法。

13、一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行如上述基于标注的情感分析方法。

14、上述基于标注的情感分析方法、装置、计算机设备及存储介质中,该方法通过预设的情感句语义模型对情感句进行自动化标注,并结合对情感词的人工标注任务,实现了情感句标注和情感词标注之间的相互辅助和相互增强处理,减小了标注工作任务量。同时,基于情感句和情感词两方面的标注数据,可以在大幅度减小情感词标注数据的数据量情况下训练出准确率更高、效果更好的情感分析模型,提高了模型泛化能力。此外,在不同的应用领域采用对应领域的情感词标注数据训练模型,即可实现跨领域应用,达到用户满意的效果。

本文档来自技高网...

【技术保护点】

1.一种基于标注的情感分析方法,其特征在于,包括:

2.如权利要求1所述的基于标注的情感分析方法,其特征在于,所述根据预设的情感句语义模型对所述第一训练文本数据进行标注,得到情感句标注数据,包括:

3.如权利要求1所述的基于标注的情感分析方法,其特征在于,所述第二训练文本数据包括特定领域情感词;

4.如权利要求1所述的基于标注的情感分析方法,其特征在于,所述根据所述情感句标注数据和所述情感词标注数据对预设的待训练模型进行训练,得到情感分析模型,包括:

5.如权利要求4所述的基于标注的情感分析方法,其特征在于,所述预设的待训练模型包括BERT模型、第一线性层和第二线性层;

6.如权利要求1所述的基于标注的情感分析方法,其特征在于,所述待分析文本数据包括待分析情感词;

7.如权利要求1所述的基于标注的情感分析方法,其特征在于,所述获取第一训练文本数据之前,包括:

8.一种基于标注的情感分析装置,其特征在于,包括:

9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,其特征在于,所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述基于标注的情感分析方法。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,其特征在于,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1至7中任一项所述基于标注的情感分析方法。

...

【技术特征摘要】

1.一种基于标注的情感分析方法,其特征在于,包括:

2.如权利要求1所述的基于标注的情感分析方法,其特征在于,所述根据预设的情感句语义模型对所述第一训练文本数据进行标注,得到情感句标注数据,包括:

3.如权利要求1所述的基于标注的情感分析方法,其特征在于,所述第二训练文本数据包括特定领域情感词;

4.如权利要求1所述的基于标注的情感分析方法,其特征在于,所述根据所述情感句标注数据和所述情感词标注数据对预设的待训练模型进行训练,得到情感分析模型,包括:

5.如权利要求4所述的基于标注的情感分析方法,其特征在于,所述预设的待训练模型包括bert模型、第一线性层和第二线性层;

6.如权利要求1所述的基于标注的情...

【专利技术属性】
技术研发人员:刘杨李运洋林跃卢品吟
申请(专利权)人:深圳市东信云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1