一种基于强化学习和事理知识图谱的真假消息鉴别方法技术

技术编号：33304044 阅读：16 留言：0更新日期：2022-05-06 12:12

本发明专利技术提出一种基于强化学习和事理知识图谱的真假消息鉴别方法。互联网和新媒体的发展突破了网络消息时空的限制，使得虚假消息能够在短时间内对现实世界产生巨大影响。目前谣言检测还主要依赖用户举报，无法大规模对网络中的信息进行检测，而基于深度学习的检测方法时效性不强且缺少训练数据。为提高对网络中真假信息的检测效率，及时对突发事件进行真假判别，基于强化学习和事理知识图图谱，提出一种真假消息鉴别方法，使用弱分类器对舆情数据进行真假分类，使用强化学习筛选置信度高的舆情数据，使用基于事理知识图谱的真对筛选后的舆情数据进行真假鉴别，并根据鉴别结果更新强化学习和弱分类器。学习和弱分类器。学习和弱分类器。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于强化学习和事理知识图谱的真假消息鉴别方法

[0001]本专利技术涉及深度学习、强化学习、自然语言处理、事理知识图谱等技术，具体涉及到真假消息检测算法。

技术介绍

[0002]目前谣言检测还主要依赖用户举报，无法大规模对网络中的信息进行检测，而基于深度学习的检测方法时效性不强且缺少训练数据。为提高对网络中真假信息的检测效率，及时对突发事件进行真假判别，基于强化学习和事理知识图图谱，提出一种真假消息鉴别方法。最接近本专利技术的技术有：
[0003](1)基于神经网络的多模态谣言检测方法：该方法使用VGG
‑
19网络提取图像内容特征,使用DenseNet提取图像内嵌文本内容,使用LSTM网络提取文本内容特征,与图像特征串接后,通过完全连接层获取图像与文本共享表示的均值与方差向量,借助从高斯分布中采样的随机变量以形成重新参数化的多模态特征并作为谣言检测器的输入进行谣言检测。但该方法没有利用相关的领域知识，无法对新谣言进行检测，不具备泛化能力。
[0004](2)基于强化学习的谣言早期检测模型：该模型将社交媒体中发布的帖子按其发布时间以信息流的形式进行输入。每当一个新帖子到来，模型都会对其进行判别，并将判别结果输入到强化学习模块，强化学习模块利用奖励机制对当前检测结果进行判断，并根据准确率来进行策略选择。如果准确率满足要求，则输出判别结果，否则继续监听。该模型利用强化学习对检测结果进行判别，存在奖励机制复杂，无法完全模拟真实环境等问题，并且对新出现的谣言不具备较好的检测效果。
...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习和事理知识图谱的真假消息鉴别方法，将大量的网络舆情数据以及用户评论和反馈数据联合建模，通过弱分类器实现真假消息预分类，强化学习筛选器选择置信度高的数据，用以分类训练，分类器将事理知识图谱与预训练语言表示模型BERT相结合，使机器在语义解析时，能够利用相关舆情知识进行真假推理。具体包括以下步骤：步骤(1)、对每一条舆情数据进行分词、去除停用词预处理；步骤(2)、手动标定小部分预处理好的数据集；并使用标定好的部分数据微调XLNET预训练模型；步骤(3)、在使用XLNET模型对无标签数据进行弱分类；步骤(4)、针对步骤(3)分好类的数据，使用强化学习算法筛选出高置信度的数据；步骤(5)、结合事理知识图谱，使用BERT对步骤(4)筛选出来的数据进...

【专利技术属性】
技术研发人员：陈涛，张卫山，王振琦，孙晨瑜，
申请(专利权)人：中国石油大学华东，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人