System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于多元特征融合与情感差异分析的谣言检测方法技术_技高网

一种基于多元特征融合与情感差异分析的谣言检测方法技术

技术编号:44569822 阅读:0 留言:0更新日期:2025-03-11 14:28
本发明专利技术公开了一种基于多元特征融合与情感差异分析的谣言检测方法,具体涉及谣言检测技术领域,其技术要点为:分别将网络正文数据和多个网络评论数据分别输入到BERT模型中进行特征提取,得到网络正文数据对应的正文语义特征和正文情感特征,以及分别得到每个网络评论数据对应的评论语义特征和评论情感特征;将正文语义特征分别和多个评论语义特征进行特征融合,得到融合语义特征,并分别计算正文情感特征与每个评论情感特征之间的差异性得到差异性向量特征;将融合语义特征和差异性向量特征进行特征融合生成融合特征,利用全连接网络对融合特征进行鉴别得到新闻事件对应的谣言鉴别结果。

【技术实现步骤摘要】

本专利技术涉及谣言检测,具体涉及一种基于多元特征融合与情感差异分析的谣言检测方法


技术介绍

1、谣言通常被认为是没有证据支持、没有权威信息支持或没有官方声明的未经证实的信息。与真实事件不同的是,谣言事件通常在情感表达上使用一些较为极端或强烈的词语,或是为了吸引人们的注意使用较为夸张的、与内容关联不强的标题和图片,试图操控读者的情感和立场,引发强烈的情绪反应,从而更易于接受和传播。

2、近年来,谣言检测技术逐渐受到重视,然而,现有方法仍存在一些显著的不足。许多传统的谣言检测研究主要依赖于语义特征的提取,往往忽视了情感特征对谣言传播的影响。其次,现有方法在情感标签的获取上多依赖于人工标注,且通常采用单一情感分类体系,这限制了对评论中复杂情感的深入理解,缺乏对情感差异的有效挖掘,可能导致谣言判断的偏差,影响了模型的整体性能。部分研究尝试利用深度学习技术提高特征提取的效果,但仍存在特征融合和情感分析的不足,未能实现语义特征与情感特征的有效结合,从而影响了谣言检测的准确性和效率。

3、因此,本专利技术旨在提供一种基于多元特征融合与情感差异分析的谣言检测方法,以解决上述提到的相关问题。


技术实现思路

1、本专利技术所要解决的技术问题是现有技术中未能实现语义特征与情感特征的有效结合,从而影响了谣言检测的准确性和效率的相关问题,目的在于提供一种基于多元特征融合与情感差异分析的谣言检测方法,通过将获取的新闻事件的网络正文数据和该网络正文数据对应的多个网络评论数据输入到bert模型中,分别获得网络正文数据和多个网络评论数据的情感特征以及语义特征;再将正文语义特征分别和多个评论语义特征进行细粒度特征融合得到融合语义特征,通过计算正文情感特征与每个评论情感特征之间的差异性得到差异性向量特征;最终将融合语义特征和差异性向量特征进行融合得到最后的融合特征,利用全连接网络作为的鉴别器对该融合特征进行谣言鉴别得到谣言鉴别结果,从而实现将语义特征和情感特征相结合,以提高谣言鉴别效果,解决了现有技术中未能实现语义特征与情感特征的有效结合,从而影响了谣言检测的准确性和效率的相关问题。

2、本专利技术通过下述技术方案实现:

3、一种基于多元特征融合与情感差异分析的谣言检测方法,方法包括:

4、获取新闻事件的网络正文数据和该网络正文数据对应的多个网络评论数据;

5、分别将网络正文数据和多个网络评论数据分别输入到bert模型中进行特征提取,得到网络正文数据对应的正文语义特征和正文情感特征,以及分别得到每个网络评论数据对应的评论语义特征和评论情感特征;

6、将正文语义特征分别和多个评论语义特征进行特征融合,得到融合语义特征,并分别计算正文情感特征与每个评论情感特征之间的差异性得到差异性向量特征;

7、将融合语义特征和差异性向量特征进行特征融合生成融合特征,利用预先训练后的全连接网络对融合特征进行鉴别,以得到新闻事件对应的谣言鉴别结果。

8、进一步地,方法还包括:

9、利用交叉熵损失函数计算谣言鉴别结果与真实结果之间的误差值,根据误差值对全连接网络的参数进行迭代优化,直至损失函数收敛以得到优化训练后的全连接网络。

10、进一步地,分别将网络正文数据和多个网络评论数据分别输入到bert模型中进行特征提取,得到网络正文数据对应的正文语义特征和正文情感特征,以及分别得到每个网络评论数据对应的评论语义特征和评论情感特征,具体为:

11、将网络正文数据和多个网络评论数据分别输入到bert模型中,得到网络正文数据对应的正文特征表示,以及每个网络评论数据对应的评论特征表示;

12、通过多层感知机对正文特征表示和多个评论特征表示中的语义特征进行提取,分别得到正文语义特征和多个评论语义特征;

13、再通过多层感知机对正文特征表示和多个评论特征表示中的情感特征进行提取,分别得到正文情感特征和多个评论情感特征。

14、进一步地,将正文语义特征分别和多个评论语义特征进行特征融合,得到融合语义特征,并分别计算正文情感特征与每个评论情感特征之间的差异性得到差异性向量特征,具体为:

15、利用多个评论语义特征构建评论语义特征矩阵,对评论语义特征矩阵进行转置后分别与正文语义特征进行矩阵乘法运算得到语义分数,再将语义分数与评论语义特征矩阵进行矩阵乘法运算,得到融合语义特征;

16、通过计算正文情感特征分别与多个评论情感特征之间的欧几里得距离,利用多个欧几里得距离构建得到差异性向量特征。

17、进一步地,将融合语义特征和差异性向量特征进行特征融合生成融合特征,利用全连接网络对融合特征进行鉴别,以得到网络正文数据对应的谣言鉴别结果,具体为:

18、对融合语义特征和差异性向量特征进行特征融合拼接,得到融合特征;

19、将融合特征和对应的真假标签输入到全连接网络中,通过全连接网络中的softmax函数进行谣言鉴别,得到新闻事件对应的谣言鉴别结果。

20、本专利技术还提供一种基于多元特征融合与情感差异分析的谣言检测系统,该系统用于上述任意一项所述的一种基于多元特征融合与情感差异分析的谣言检测方法中,所述系统包括:

21、数据获取模块,用于获取新闻事件的网络正文数据和该网络正文数据对应的多个网络评论数据;

22、特征提取模块,用于分别将网络正文数据和多个网络评论数据分别输入到bert模型中进行特征提取,得到网络正文数据对应的正文语义特征和正文情感特征,以及分别得到每个网络评论数据对应的评论语义特征和评论情感特征;

23、特征处理模块,用于将正文语义特征分别和多个评论语义特征进行特征融合,得到融合语义特征,并分别计算正文情感特征与每个评论情感特征之间的差异性得到差异性向量特征;

24、谣言鉴别模块,用于将融合语义特征和差异性向量特征进行特征融合生成融合特征,利用预先训练后的全连接网络对融合特征进行鉴别,以得到新闻事件对应的谣言鉴别结果。

25、进一步地,系统还包括:

26、网络优化模块,用于利用交叉熵损失函数计算谣言鉴别结果与真实结果之间的误差值,根据误差值对全连接网络的参数进行迭代优化,直至损失函数收敛以得到优化训练后的全连接网络。

27、本专利技术还提供一种计算机设备,包括系统存储器和处理器,所述系统存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述中任意一项所述的方法的步骤。

28、本专利技术还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述中任意一项所述的方法的步骤。

29、本专利技术还提供一种包含指令的计算机程序产品,其特征在于,当所述指令被计算机设备集群运行时,使得所述计算机设备集群执行如上述任一项所述的方法。

30、本专利技术与现有技术相比,具有如下的优点和有益效果:

31、在本专利技术中本文档来自技高网...

【技术保护点】

1.一种基于多元特征融合与情感差异分析的谣言检测方法,其特征在于,方法包括:

2.根据权利要求1所述的一种基于多元特征融合与情感差异分析的谣言检测方法,其特征在于,方法还包括:

3.根据权利要求1所述的一种基于多元特征融合与情感差异分析的谣言检测方法,其特征在于,分别将网络正文数据和多个网络评论数据分别输入到BERT模型中进行特征提取,得到网络正文数据对应的正文语义特征和正文情感特征,以及分别得到每个网络评论数据对应的评论语义特征和评论情感特征,具体为:

4.根据权利要求3所述的一种基于多元特征融合与情感差异分析的谣言检测方法,其特征在于,将正文语义特征分别和多个评论语义特征进行特征融合,得到融合语义特征,并分别计算正文情感特征与每个评论情感特征之间的差异性得到差异性向量特征,具体为:

5.根据权利要求3所述的一种基于多元特征融合与情感差异分析的谣言检测方法,其特征在于,将融合语义特征和差异性向量特征进行特征融合生成融合特征,利用全连接网络对融合特征进行鉴别,以得到网络正文数据对应的谣言鉴别结果,具体为:

6.一种基于多元特征融合与情感差异分析的谣言检测系统,其特征在于,该系统用于权利要求1-5任意一项所述的一种基于多元特征融合与情感差异分析的谣言检测方法中,所述系统包括:

7.根据权利要求6所述的一种基于多元特征融合与情感差异分析的谣言检测系统,其特征在于,系统还包括:

8.一种计算机设备,包括系统存储器和处理器,所述系统存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任意一项所述的方法的步骤。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任意一项所述的方法的步骤。

10.一种包含指令的计算机程序产品,其特征在于,当所述指令被计算机设备集群运行时,使得所述计算机设备集群执行如权利要求的1至5任一项所述的方法。

...

【技术特征摘要】

1.一种基于多元特征融合与情感差异分析的谣言检测方法,其特征在于,方法包括:

2.根据权利要求1所述的一种基于多元特征融合与情感差异分析的谣言检测方法,其特征在于,方法还包括:

3.根据权利要求1所述的一种基于多元特征融合与情感差异分析的谣言检测方法,其特征在于,分别将网络正文数据和多个网络评论数据分别输入到bert模型中进行特征提取,得到网络正文数据对应的正文语义特征和正文情感特征,以及分别得到每个网络评论数据对应的评论语义特征和评论情感特征,具体为:

4.根据权利要求3所述的一种基于多元特征融合与情感差异分析的谣言检测方法,其特征在于,将正文语义特征分别和多个评论语义特征进行特征融合,得到融合语义特征,并分别计算正文情感特征与每个评论情感特征之间的差异性得到差异性向量特征,具体为:

5.根据权利要求3所述的一种基于多元特征融合与情感差异分析的谣言检测方法,其特征在于,将融合语义特征和差异性向量特征进行特征融合生...

【专利技术属性】
技术研发人员:吴渝李奇琪蒲晓吴浩
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1