当前位置: 首页 > 专利查询>三峡大学专利>正文

基于生成传播结构特征的早期谣言检测方法及装置制造方法及图纸

技术编号:33126654 阅读:18 留言:0更新日期:2022-04-17 00:37
本发明专利技术提供一种基于生成传播结构特征的早期谣言检测方法及装置,该方法包括:获取待检测事件的第一源文本;将第一源文本输入条件变分自编码器中,得到条件变分自编码器生成的待检测事件的第一传播结构特征;条件变分自编码器根据样本事件的第二源文本和第二传播结构特征进行训练获取;第二传播结构特征基于图卷积神经网络模型对样本事件的传播结构图进行特征提取获得;传播结构图根据样本事件的第二源文本和第二源文本对应的响应推文构建获取;将第一源文本和第一传播结构特征输入分类模型中,得到分类模型输出的待检测事件的谣言检测结果。本发明专利技术实现在获取到待检测事件的源文本后,即可快速准确地获取待检测事件的谣言检测结果。检测结果。检测结果。

【技术实现步骤摘要】
基于生成传播结构特征的早期谣言检测方法及装置


[0001]本专利技术涉及数据处理
,尤其涉及一种基于生成传播结构特征的早期谣言检测方法及装置。

技术介绍

[0002]随着互联网时代的兴起与发达,信息流动和传播速度也越来越快,人们在社交媒体上可以自由发布信息,这也导致谣言传播迅速。谣言是指违背事情真相或凭空捏造的事情,具有一定的欺骗性,是扰乱社会秩序甚至给社会带来严重恐慌和经济损失的言论。因此如何从社交媒体上海量的信息中辨别谣言是一项严峻的挑战。
[0003]谣言检测技术是通过相关的计算机知识和技能对谣言鉴定进行建模并识别的过程。现有的谣言检测技术存在如下问题:(1)现有的谣言检测研究局限于针对经过一定时间传播后的谣言进行检测,即谣言只有经过大量曝光后才可能被识别,对早期谣言检测欠缺,缺乏一定的时效性;(2)现有的研究在早期谣言检测中大多根据文本信息进行谣言检测,但由于信息结构的多样化,仅根据文本信息难以获取准确的谣言检测结果。

技术实现思路

[0004]本专利技术提供一种基于生成传播结构特征的早期谣言检测方法及装置,用以解决现有技术中谣言检测方法时效性差和准确度低的缺陷,实现在获取到谣言的源文本时,即可及时准确地检测出谣言。
[0005]本专利技术提供一种基于生成传播结构特征的早期谣言检测方法,包括:
[0006]获取待检测事件的第一源文本;
[0007]将所述第一源文本输入条件变分自编码器中,得到所述条件变分自编码器生成的所述待检测事件的第一传播结构特征;其中,所述条件变分自编码器根据样本事件的第二源文本和第二传播结构特征进行训练获取;所述第二传播结构特征基于图卷积神经网络模型对样本事件的传播结构图进行特征提取获得;所述传播结构图根据所述样本事件的第二源文本和所述第二源文本对应的响应推文构建获取;
[0008]将所述第一源文本和第一传播结构特征输入分类模型中,得到所述分类模型输出的所述待检测事件的谣言检测结果;所述分类模型根据所述第二源文本信息和第二传播结构特征,以及所述样本事件的谣言检测标签进行训练获取。
[0009]根据本专利技术提供的一种基于生成传播结构特征的早期谣言检测方法,所述将所述第一源文本和第一传播结构特征输入分类模型中,得到所述分类模型输出的所述待检测事件的谣言检测结果,包括:
[0010]将所述第一源文本输入所述分类模型的特征提取层,得到所述第一源文本的文本特征;
[0011]将所述文本特征与所述第一传播结构特征进行拼接后,输入所述分类模型的分类层,得到所述待检测事件的谣言检测结果。
[0012]根据本专利技术提供的一种基于生成传播结构特征的早期谣言检测方法,所述分类模型的特征提取层基于循环神经网络模型构建生成;
[0013]所述分类模型的分类层基于softmax函数构建生成。
[0014]根据本专利技术提供的一种基于生成传播结构特征的早期谣言检测方法,所述传播结构图基于如下步骤构建:
[0015]以所述样本事件中的第二源文本和各响应推文为节点,根据任意两个节点之间的响应关系构建所述样本事件的传播结构图。
[0016]根据本专利技术提供的一种基于生成传播结构特征的早期谣言检测方法,所述响应关系包括转发关系、时间维度关系和评论关系。
[0017]根据本专利技术提供的一种基于生成传播结构特征的早期谣言检测方法,所述第二传播结构特征基于如下步骤获取:
[0018]将所述样本事件的传播结构图输入所述图卷积神经网络模型中,得到所述图卷积神经网络模型的特征提取层输出的所述样本事件的第二传播结构特征;
[0019]其中,所述图卷积神经网络模型根据所述样本事件的传播结构图和所述样本事件的谣言检测标签进行训练获取。
[0020]根据本专利技术提供的一种基于生成传播结构特征的早期谣言检测方法,所述将所述第一源文本输入条件变分自编码器中,得到所述条件变分自编码器生成的所述待检测事件的第一传播结构特征,包括:
[0021]对所述第一源文本进行预处理;
[0022]其中,所述预处理包括去除乱码数据和文本向量化处理;
[0023]将预处理后的第一源文本输入所述条件变分自编码器中,得到所述待检测事件的第一传播结构特征。
[0024]本专利技术还提供一种基于生成传播结构特征的早期谣言检测装置,包括:
[0025]文本获取模块,用于获取待检测事件的第一源文本;
[0026]传播结构特征生成模块,用于将所述第一源文本输入条件变分自编码器中,得到所述条件变分自编码器生成的所述待检测事件的第一传播结构特征;其中,所述条件变分自编码器根据样本事件的第二源文本和第二传播结构特征进行训练获取;所述第二传播结构特征基于图卷积神经网络模型对样本事件的传播结构图进行特征提取获得;所述传播结构图根据所述样本事件的第二源文本和所述第二源文本对应的响应推文构建获取;
[0027]谣言检测模块,用于将所述第一源文本和第一传播结构特征输入分类模型中,得到所述分类模型输出的所述待检测事件的谣言检测结果;所述分类模型根据所述第二源文本信息和第二传播结构特征,以及所述样本事件的谣言检测标签进行训练获取。
[0028]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述基于生成传播结构特征的早期谣言检测方法的步骤。
[0029]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于生成传播结构特征的早期谣言检测方法的步骤。
[0030]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器
执行时实现如上述任一种所述基于生成传播结构特征的早期谣言检测方法的步骤。
[0031]本专利技术提供的基于生成传播结构特征的早期谣言检测方法及装置,通过根据样本事件的第二源文本和响应推文构建传播结构图,并基于图卷积神经网络模型对传播结构图进行特征提取获得样本事件的第二传播结构特征,根据样本事件的第二源文本、第二传播结构特征进行迭代,即可得到可根据事件的源文本,模拟生成传播结构特征的条件变分自编码器;在获取到待检测事件的第一源文本时,即可基于条件变分自编码器自动模拟生成待检测事件的第一传播结构特征;然后,联合待检测事件的第一传播结构特征和第一源文本,即可对待检测事件进行谣言检测;一方面,整个谣言检测过程中,只需要获取到待检测事件的第一源文本,即可快速生成相应的传播结构特征,减少收集大量响应推文后才能获取传播结构特征带来的延时,且在谣言的发布的源头上即可检测出谣言,有效提高谣言检测的时效性;另一方面,将事件的源文本信息和传播结构特征进行结合,丰富了与谣言检测相关的特征,使得谣言检测结果更加准确。
附图说明
[0032]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于生成传播结构特征的早期谣言检测方法,其特征在于,包括:获取待检测事件的第一源文本;将所述第一源文本输入条件变分自编码器中,得到所述条件变分自编码器生成的所述待检测事件的第一传播结构特征;其中,所述条件变分自编码器根据样本事件的第二源文本和第二传播结构特征进行训练获取;所述第二传播结构特征基于图卷积神经网络模型对所述样本事件的传播结构图进行特征提取获得;所述传播结构图根据所述样本事件的第二源文本和所述第二源文本对应的响应推文构建获取;将所述第一源文本和第一传播结构特征输入分类模型中,得到所述分类模型输出的所述待检测事件的谣言检测结果;所述分类模型根据所述第二源文本信息和第二传播结构特征,以及所述样本事件的谣言检测标签进行训练获取。2.根据权利要求1所述的基于生成传播结构特征的早期谣言检测方法,其特征在于,所述将所述第一源文本和第一传播结构特征输入分类模型中,得到所述分类模型输出的所述待检测事件的谣言检测结果,包括:将所述第一源文本输入所述分类模型的特征提取层,得到所述第一源文本的文本特征;将所述文本特征与所述第一传播结构特征进行拼接后,输入所述分类模型的分类层,得到所述待检测事件的谣言检测结果。3.根据权利要求1所述的基于生成传播结构特征的早期谣言检测方法,其特征在于,所述分类模型的特征提取层基于循环神经网络模型构建生成;所述分类模型的分类层基于softmax函数构建生成。4.根据权利要求1

3任一所述的基于生成传播结构特征的早期谣言检测方法,其特征在于,所述传播结构图基于如下步骤构建:以所述样本事件中的第二源文本和各响应推文为节点,根据任意两个节点之间的响应关系构建所述样本事件的传播结构图。5.根据权利要求4所述的基于生成传播结构特征的早期谣言检测方法,其特征在于,所述响应关系包括转发关系、时间维度关系和评论关系。6.根据权利要求1

3任一所述的基于生成传播结构特征的早期谣言检测方法,其特征在于,所述第二传播结构特征基于如下步骤获取:将所...

【专利技术属性】
技术研发人员:朱玉敏董方敏徐义春
申请(专利权)人:三峡大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1