System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及计算机,特别是涉及一种文本信息处理方法、装置、计算机设备、存储介质和计算机程序产品。
技术介绍
1、随着计算机技术和人工智能技术的发展,出现了自然语言处理(nlp,naturallanguage processing)技术,它能接收自然语言,转译自然语言,最终分析自然语言并输出结果。自然语言处理技术可应用于文本处理,机器翻译、语义识别和情感分析等领域。同时,伴随着互联网的发展,各类社交网站也在不断发展,伴随着各种真假的舆论信息也开始在网上泛滥。而虚假的舆论信息往往会对人们的正常生产生活造成负面影响,因此可以借助自然语言处理地方式来对舆论相关的文本信息数据进行处理,识别出其中的虚假舆论信息,从而减少这些虚假舆论信息所造成的不良影响。
2、传统技术中,在对舆论信息的真实性进行校验时,一般都是直接提取出舆论信息中的文本信息,而后通过自然语言技术来直接对这部分文本信息进行处理来辨别舆论信息的真假,然而这种方法只能对信息量较少的文本信息本身进行处理,从而影响了基于文本信息进行舆论信息真假性判别的准确性。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够有效提高舆论信息判别准确性的文本信息处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本申请提供了一种文本信息处理方法。所述方法包括:
3、获取已发布的舆情文本信息;
4、确定所述舆情文本信息的用户传播网络,并确定所述用户传播网络中用户账户的用
5、基于所述用户标签和所述用户传播网络进行舆情文本信息真假性判别的图注意力处理,得到基于用户社交属性的第一舆情信息预测结果;
6、基于所述舆情文本信息的文本特征进行舆情文本信息真假性判别的文本信息分类处理,得到基于文本内容的第二舆情信息预测结果;
7、结合所述第一舆情信息预测结果和所述第二舆情信息预测结果对所述舆情文本信息进行真实性判别,得到所述舆情文本信息的判别结果。
8、在其中一个实施例中,所述确定所述舆情文本信息的用户传播网络,并确定所述用户传播网络中用户账户的用户标签包括:
9、获取所述舆情文本信息的转发节点;
10、根据所述舆情文本信息的转发节点确定所述舆情文本信息的用户传播网络;
11、确定所述用户传播网络中用户账户的用户社交属性;
12、基于所述用户社交属性,通过随机森林算法识别所述用户账户的用户标签。
13、在其中一个实施例中,所述基于所述用户标签和所述用户传播网络进行舆情文本信息真假性判别的图注意力处理,得到基于用户社交属性的第一舆情信息预测结果包括:
14、确定所述用户传播网络的度中心性;
15、基于所述用户标签和所述用户传播网络的度中心性,确定用户标签权重;
16、所述用户传播网络中用户账户的用户社交属性构建用户社交属性矩阵;
17、对所述用户标签权重和所述用户社交属性矩阵做点乘处理,得到加权社交属性矩阵;
18、基于所述加权社交属性矩阵进行舆情文本信息真假性判别的图注意力处理,得到基于用户社交属性的第一舆情信息预测结果。
19、在其中一个实施例中,所述基于所述舆情文本信息的文本特征进行舆情文本信息真假性判别的文本信息分类处理,得到基于文本内容的第二舆情信息预测结果包括:
20、对所述舆情文本信息进行分词处理,得到文本分词结果;
21、通过语义特征提取模型提取所述文本分词结果的分词特征向量;
22、基于所述分词特征向量,通过文本分类模型对舆情文本信息进行舆情文本信息真假性判别的文本信息分类处理,得到基于文本内容的第二舆情信息预测结果。
23、在其中一个实施例中,所述基于所述分词特征向量,通过文本分类模型对舆情文本信息进行舆情文本信息真假性判别的文本信息分类处理,得到基于文本内容的第二舆情信息预测结果包括:
24、基于所述分词特征向量构建所述舆情文本信息的词向量矩阵;
25、对所述词向量矩阵进行多头自注意力处理,得到融合所述舆情文本信息中上下文语义的特征融合结果;
26、将所述特征融合结果输入文本分类模型,通过所述文本分类模型对舆情文本信息进行舆情文本信息真假性判别的文本信息分类处理,得到基于文本内容的第二舆情信息预测结果。
27、在其中一个实施例中,所述结合所述第一舆情信息预测结果和所述第二舆情信息预测结果对所述舆情文本信息进行真实性判别,得到所述舆情文本信息的判别结果包括:
28、确定所述第一舆情信息预测结果的第一权重信息、和所述第二舆情信息预测结果的第二权重信息;
29、基于所述第一舆情信息预测结果和所述第一权重信息的乘积,得到第一预测参数,基于所述第二舆情信息预测结果和所述第二权重信息的乘积,得到第二预测参数;
30、基于所述第一预测参数和所述第二预测参数之和,得到判别参数;
31、基于所述判别参数和判别阈值,得到舆情文本信息的判别结果。
32、第二方面,本申请还提供了一种文本信息处理装置。所述装置包括:
33、信息获取模块,用于获取已发布的舆情文本信息;
34、标签识别模块,用于确定所述舆情文本信息的用户传播网络,并确定所述用户传播网络中用户账户的用户标签,所述用户标签用于标记虚假用户;
35、第一预测模块,用于基于所述用户标签和所述用户传播网络进行舆情文本信息真假性判别的图注意力处理,得到基于用户社交属性的第一舆情信息预测结果;
36、第二预测模块,用于基于所述舆情文本信息的文本特征进行舆情文本信息真假性判别的文本信息分类处理,得到基于文本内容的第二舆情信息预测结果;
37、信息判别模块,用于结合所述第一舆情信息预测结果和所述第二舆情信息预测结果对所述舆情文本信息进行真实性判别,得到所述舆情文本信息的判别结果。
38、第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
39、获取已发布的舆情文本信息;
40、确定所述舆情文本信息的用户传播网络,并确定所述用户传播网络中用户账户的用户标签,所述用户标签用于标记虚假用户;
41、基于所述用户标签和所述用户传播网络进行舆情文本信息真假性判别的图注意力处理,得到基于用户社交属性的第一舆情信息预测结果;
42、基于所述舆情文本信息的文本特征进行舆情文本信息真假性判别的文本信息分类处理,得到基于文本内容的第二舆情信息预测结果;
43、结合所述第一舆情信息预测结果和所述第二舆情信息预测结果对所述舆情文本信息进行真实性判别,得到所述舆情文本信息的判别结果。
44、本文档来自技高网...
【技术保护点】
1.一种文本信息处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述确定所述舆情文本信息的用户传播网络,并确定所述用户传播网络中用户账户的用户标签包括:
3.根据权利要求1所述的方法,其特征在于,所述基于所述用户标签和所述用户传播网络进行舆情文本信息真假性判别的图注意力处理,得到基于用户社交属性的第一舆情信息预测结果包括:
4.根据权利要求1所述的方法,其特征在于,所述基于所述舆情文本信息的文本特征进行舆情文本信息真假性判别的文本信息分类处理,得到基于文本内容的第二舆情信息预测结果包括:
5.根据权利要求4所述的方法,其特征在于,所述基于所述分词特征向量,通过文本分类模型对舆情文本信息进行舆情文本信息真假性判别的文本信息分类处理,得到基于文本内容的第二舆情信息预测结果包括:
6.根据权利要求1至5任意一项所述的方法,其特征在于,所述结合所述第一舆情信息预测结果和所述第二舆情信息预测结果对所述舆情文本信息进行真实性判别,得到所述舆情文本信息的判别结果包括:
7.一种文本信息处理装
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
...【技术特征摘要】
1.一种文本信息处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述确定所述舆情文本信息的用户传播网络,并确定所述用户传播网络中用户账户的用户标签包括:
3.根据权利要求1所述的方法,其特征在于,所述基于所述用户标签和所述用户传播网络进行舆情文本信息真假性判别的图注意力处理,得到基于用户社交属性的第一舆情信息预测结果包括:
4.根据权利要求1所述的方法,其特征在于,所述基于所述舆情文本信息的文本特征进行舆情文本信息真假性判别的文本信息分类处理,得到基于文本内容的第二舆情信息预测结果包括:
5.根据权利要求4所述的方法,其特征在于,所述基于所述分词特征向量,通过文本分类模型对舆情文本信息进行舆情文本信息真假性判别的文本信息分类处理,得到基于文本内容的第二...
【专利技术属性】
技术研发人员:薛海涛,
申请(专利权)人:中国银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。