System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 虚假新闻检测方法及装置、电子设备、可读存储介质制造方法及图纸_技高网

虚假新闻检测方法及装置、电子设备、可读存储介质制造方法及图纸

技术编号:42414810 阅读:16 留言:0更新日期:2024-08-16 16:31
本公开提供了一种虚假新闻检测方法及装置、电子设备、可读存储介质,属于深度学习技术领域,该方法包括:根据目标新闻中的第一文本特征和第一图像特征确定对应于目标新闻的语义关联数据;语义关联数据包括第一数据和第二数据;第一数据和第二数据为不同种类的数据;对第一数据进行处理得到第三数据;第三数据包括虚假痕迹信息;基于第二数据和第三数据对目标大语言模型进行训练;基于已训练的目标大语言模型进行虚假新闻检测。本公开基于多模态的数据处理技术,能够更能准确地反映新闻内容的真实性和完整性。

【技术实现步骤摘要】

本公开属于深度学习,更具体地说,是涉及一种虚假新闻检测方法及装置、电子设备、可读存储介质


技术介绍

1、随着生成模型如gpt模型和diffusion模型的持续发展和广泛应用,各类虚假信息的制作成本逐渐降低,从而日益侵蚀到新闻领域。虚假新闻的传播对政治、经济、公共卫生等多个领域造成了巨大的威胁,引发了社会以及公众对信息真实性的严重担忧。现有模型对虚假新闻的检测准确率比较低,难以识别语言模型生成的伪造成本。


技术实现思路

1、本公开的目的在于提供一种虚假新闻检测方法及装置、电子设备、可读存储介质,以提高对虚假新闻的检测准确率。

2、本公开实施例的第一方面,提供了一种虚假新闻检测方法,包括:

3、根据目标新闻中的第一文本特征和第一图像特征确定对应于所述目标新闻的语义关联数据;所述语义关联数据包括第一数据和第二数据;所述第一数据和所述第二数据为不同种类的数据;

4、对所述第一数据进行处理得到第三数据;所述第三数据包括虚假痕迹信息;

5、基于所述第二数据和所述第三数据对目标大语言模型进行训练;基于已训练的目标大语言模型进行虚假新闻检测。

6、本公开实施例的第二方面,提供了一种虚假新闻检测装置,包括:

7、数据获取模块,用于根据目标新闻中的第一文本特征和第一图像特征确定对应于所述目标新闻的语义关联数据;所述语义关联数据包括第一数据和第二数据;所述第一数据和所述第二数据为不同种类的数据;

8、数据处理模块,用于对所述第一数据进行处理得到第三数据;所述第三数据包括虚假痕迹信息;

9、模型训练模块,用于基于所述第二数据和所述第三数据对目标大语言模型进行训练;基于已训练的目标大语言模型进行虚假新闻检测。

10、本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的虚假新闻检测方法的步骤。

11、本公开实施例的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的虚假新闻检测方法的步骤。

12、本公开实施例提供的虚假新闻检测方法及装置、电子设备、可读存储介质的有益效果在于:

13、首先,本公开通过综合目标新闻中的文本特征和图像特征,能够更全面地获取文本和图像的语义关联数据。这种多模态的数据处理方式,相较于单一模态的方法,更能准确地反映新闻内容的真实性和完整性。

14、其次,对第一数据进行处理得到包含虚假痕迹信息的第三数据,这一步骤进一步丰富了伪造新闻的语料库,使得目标大语言模型能够拥有对开放世界强大的认知能力,为后续的虚假新闻检测提供了重要的依据。

15、再者,基于第二数据和第三数据对目标大语言模型进行训练,使得模型能够学习到新闻中的真实语义和伪造特征,从而提高了模型在虚假新闻检测任务上的准确性和泛化能力。

16、最后,通过已训练的目标大语言模型进行虚假新闻检测,能够快速、准确地识别出虚假新闻,为公众提供可靠的信息来源。

本文档来自技高网...

【技术保护点】

1.一种虚假新闻检测方法,其特征在于,包括:

2.如权利要求1所述的虚假新闻检测方法,其特征在于,所述根据目标新闻中的第一文本特征和第一图像特征确定对应于所述目标新闻的语义关联数据,包括:

3.如权利要求1所述的虚假新闻检测方法,其特征在于,所述对所述第一数据进行处理得到第三数据,包括:

4.如权利要求3所述的虚假新闻检测方法,其特征在于,所述对所述第一数据进行分割处理得到多个分割图数据,包括:

5.如权利要求4所述的虚假新闻检测方法,其特征在于,所述对所述第一数据和特征类别进行相似度计算和采样得到采样数据,包括:

6.如权利要求4所述的虚假新闻检测方法,其特征在于,所述对所述采样数据进行分割处理得到多个分割图数据,包括:

7.如权利要求3所述的虚假新闻检测方法,其特征在于,所述对所述第一数据进行数据转换处理得到聚合数据,包括:

8.一种虚假新闻检测装置,其特征在于,包括:

9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。

...

【技术特征摘要】

1.一种虚假新闻检测方法,其特征在于,包括:

2.如权利要求1所述的虚假新闻检测方法,其特征在于,所述根据目标新闻中的第一文本特征和第一图像特征确定对应于所述目标新闻的语义关联数据,包括:

3.如权利要求1所述的虚假新闻检测方法,其特征在于,所述对所述第一数据进行处理得到第三数据,包括:

4.如权利要求3所述的虚假新闻检测方法,其特征在于,所述对所述第一数据进行分割处理得到多个分割图数据,包括:

5.如权利要求4所述的虚假新闻检测方法,其特征在于,所述对所述第一数据和特征类别进行相似度计算和采样得到采样数据,包括:

6.如权利要求4所述的虚假新闻...

【专利技术属性】
技术研发人员:李佩佩刘炫男崔兴何召锋
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1