一种虚假新闻检测方法及系统技术方案

技术编号：41527064 阅读：32 留言：0更新日期：2024-06-03 23:01

本发明专利技术公开了一种虚假新闻检测方法及系统，属于虚假新闻检测技术领域。包括以下步骤：构建知识图谱，以及设置判定条件；赋予待检测新闻初始可信度权重值；将待检测新闻的新闻文本输入至WebGLM模型中，并获取n个网页、以及标题文本；提取所述标题文本中的目标信息，基于所述知识图谱，判定所述目标信息是否符合判定条件，得到判定结果；基于判定结果，判断是否更改初始可信度权重值：若是，则得到新的可信度权重值，判断新的可信度权重值是否小于阈值：若是，则判定待检测新闻为虚假新闻；反之，则判定待检测新闻为真实新闻。本方法结合了实时的语言模型检索，在信息传播的初期阶段快速识别虚假新闻，有助于即时采取措施遏制虚假信息的扩散。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于虚假新闻检测，具体涉及一种虚假新闻检测方法及系统。

技术介绍

1、当今社交媒体和数字信息的普及，使得虚假新闻的传播速度和范围前所未有地扩大。因此，对虚假新闻进行检测变得至关重要。这不仅可以保护公众免受误导和恶意信息的影响，还能维护社会秩序和稳定。及时辟谣虚假信息，确保舆论环境的健康，提高媒体和信息来源的可信度，同时促进公众对真实信息的信任。

2、检测虚假新闻最初主要依赖于传统的规则和基于规则的方法，但这些方法往往缺乏灵活性和适应性，对于复杂的虚假新闻难以准确判断。随着自然语言处理技术的发展，基于机器学习的方法得到了广泛应用，特别是基于监督学习和深度学习的算法，如卷积神经网络(cnn)和循环神经网络(rnn)。这些方法可以自动从大量数据中学习特征，提高了虚假新闻检测的准确率。

3、然而，新闻内容的多样性使得现有的检测方法难以适用于各种情况，涵盖的领域和主题繁多，每个领域都有其独特的语言特点和信息结构。其次，对抗性生成模型的发展使得制造逼真的虚假信息变得更容易，这对检测器的性能提出了新的挑战。此外，虚假信息可能在短时间内快速传播，检测器需要具备实时性才能在信息传播初期进行有效的识别。

技术实现思路

1、专利技术目的：为了解决上述问题，本专利技术提供了一种虚假新闻检测方法及系统。

2、技术方案：一种虚假新闻检测方法，包括以下步骤：

3、构建知识图谱，以及设置判定条件；

4、获取待检测新闻，并赋予待检测新闻初始可信度权重值；

5、将待检测新闻的新闻文本输入至webglm模型中，并按照与所述新闻文本相关度从高至低的次序获取n个网页、以及每个网页相关的标题文本；

6、提取所述标题文本中的目标信息，基于所述知识图谱，按照预定优先级顺序判定所述目标信息是否符合判定条件，得到判定结果；

7、基于所述判定结果，判断是否更改初始可信度权重值：若是，则得到新的可信度权重值，

8、判断新的可信度权重值是否小于阈值：若是，则判定待检测新闻为虚假新闻；反之，则判定待检测新闻为真实新闻。

9、进一步地所述知识图谱的构建包括以下步骤：

10、将x个媒体、y条谣言对应更新至媒体库、谣言特征库中；赋予每个媒体相应的标签，并基于所述标签对所述媒体进行分类；

11、提取所述媒体库中每个媒体对应的基本信息以及媒体与媒体之间的关系信息基于基本信息以及关系信息对应生成媒体知识结构、以及媒体关系知识结构；

12、获取所述谣言特征库中每个谣言对应的基本信息以及谣言与真实事件的关系信息基于基本信息关系信息对应生成谣言知识结构、谣言关系知识结构；

13、对媒体知识结构、媒体关系知识结构、谣言知识结构、谣言关系知识结构进行知识融合，并进行知识建模，创建实体类别和关系类别，并生成相应的继承关系、约束关系、地域属性、以及时间属性。

14、进一步地所述继承关系定义为：获取媒体与媒体之间的上下位关系，赋予下位媒体继承于上位媒体的性质；

15、所述约束关系定义为：基于媒体或新闻事件的类型，获取其特有的属性；基于所述属性形成约束该媒体或新闻事件的条件；

16、所述地域属性定义为：任一媒体涵盖这特定区域；

17、所述时间属性定位为：任一新闻事件的发生时间在发布时间之前。

18、进一步地所述判定条件至少包括以下条件：不可靠来源条件、多次发布相似谣言条件、无独立证据条件、不符合逻辑条件、跟踪相关实体条件、情感化言辞条件、专业机构辟谣条件、以及谣言传播者条件。

19、进一步地还包括以下步骤：

20、判断所述目标信息是否符合专业机构辟谣条件，得到判断结果：若是，则判定所述待检测新闻为虚假新闻；反之，则进行以下步骤：

21、判定所述目标信息是否符合不可靠来源条件、多次发布相似谣言条件、跟踪相关实体条件、谣言传播者条件中一个或多个，得到判断结果：若是，则更改初始可信度权重值，得到新的可信度权重值，若新的可信度权重值小于阈值，则判定待检测新闻为虚假新闻；反之，则进行以下步骤：

22、判定所述目标信息是否符合无独立证据条件、不符合逻辑条件、情感化言辞条件中的一个或多个，得到判断结果：若是，则更改初始可信度权重值，得到新的可信度权重值，若新的可信度权重值小于阈值，则判定待检测新闻为虚假新闻；反之，则判定待检测新闻为真实新闻。

23、进一步地所述媒体库中至少包括以下媒体：国际新闻机构、国内新闻机构、事实核实机构、政府部门、学术机构、专业行业媒体、社交平台、国际组织、主流传媒、地方性媒体、专业新闻网站、以及科学研究机构。

24、进一步地所述基本信息中至少包括媒体名称、媒体类型、媒体地域、以及媒体评级属性；

25、所述关系信息至少包括合作关系、竞争关系、或隶属关系；

26、所述基本信息至少包括谣言发布者、谣言内容、发布时间、谣言影响范围；

27、所述关系信息至少包括对应关系、否定关系、或引用关系。

28、进一步地媒体知识结构、媒体关系知识结构、谣言知识结构、谣言关系知识结构采用三元组知识结构。

29、在另一个技术方案中提出了一种虚假新闻检测系统，用于实现如上述的一种虚假新闻检测方法，所述系统包括：

30、第一模块，被设置构建知识图谱，以及设置判定条件；

31、第二模块，被设置获取待检测新闻，并赋予待检测新闻初始可信度权重值；

32、第三模块，被设置将待检测新闻的新闻文本输入至webglm模型中，并按照与所述新闻文本相关度从高至低的次序获取n个网页、以及每个网页相关的标题文本；

33、第四模块，被设置提取所述标题文本中的目标信息，基于所述知识图谱，按照预定优先级顺序判定所述目标信息是否符合判定条件，得到判定结果；

34、第五模块，被设置基于所述判定结果，判断是否更改初始可信度权重值：若是，则得到新的可信度权重值：

35、第六模块，被设置判断新的可信度权重值是否小于阈值：若是，则判定待检测新闻为虚假新闻；反之，则判定待检测新闻为真实新闻。

36、有益效果：

37、(1)本专利技术通过充分发挥先进的语言模型的能力，实现对新闻文本的高效搜索，能够快速定位可能的虚假新闻，同时利用知识图谱的丰富信息对搜索结果进行推理和验证，从而提升了虚假新闻检测的准确度和效率；

38、(2)本专利技术不受特定领域或主题的限制，适用于各种类型的新闻内容，包括政治、经济、社会等多个领域，相对于传统方法更具通用性；本方法结合了实时的语言模型检索，在信息传播的初期阶段快速识别虚假新闻，有助于即时采取措施遏制虚假信息的扩散。

本文档来自技高网...

【技术保护点】

1.一种虚假新闻检测方法，其特征在于，包括以下步骤：

2.如权利要求1所述的一种虚假新闻检测方法，其特征在于，所述知识图谱的构建包括以下步骤：

3.如权利要求2所述的一种虚假新闻检测方法，其特征在于，所述继承关系定义为：获取媒体与媒体之间的上下位关系，赋予下位媒体继承于上位媒体的性质；

4.如权利要求1所述的一种虚假新闻检测方法，其特征在于，所述判定条件至少包括以下条件：不可靠来源条件、多次发布相似谣言条件、无独立证据条件、不符合逻辑条件、跟踪相关实体条件、情感化言辞条件、专业机构辟谣条件、以及谣言传播者条件。

5.如权利要求4所述的一种虚假新闻检测方法，其特征在于，还包括以下步骤：

6.如权利要求1所述的一种虚假新闻检测方法，其特征在于，所述媒体库中至少包括以下媒体：国际新闻机构、国内新闻机构、事实核实机构、政府部门、学术机构、专业行业媒体、社交平台、国际组织、主流传媒、地方性媒体、专业新闻网站、以及科学研究机构。

7.如权利要求2所述的一种虚假新闻检测方法，其特征在于，所述基本信息中至少包括媒体名称、媒体

8.如权利要求2所述的一种虚假新闻检测方法，其特征在于，媒体知识结构、媒体关系知识结构、谣言知识结构、谣言关系知识结构采用三元组知识结构。

9.一种虚假新闻检测系统，其特征在于，用于实现如权利要求1至8任意一项所述的一种虚假新闻检测方法，所述系统包括：

...

【技术特征摘要】

1.一种虚假新闻检测方法，其特征在于，包括以下步骤：

2.如权利要求1所述的一种虚假新闻检测方法，其特征在于，所述知识图谱的构建包括以下步骤：

5.如权利要求4所述的一种虚假新闻检测方法，其特征在于，还包括以下步骤：

6...

【专利技术属性】
技术研发人员：鲁瑞，王海荣，吕晓宝，王元兵，冯凯，
申请(专利权)人：中科曙光南京研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人