System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开涉及计算机,尤其涉及一种网络舆情监测方法、装置、设备以及存储介质。
技术介绍
1、随着互联网技术的不断发展和新媒体的日益兴起,每个人都可以成为信息的发布者和传播者,这使得舆论具有了爆炸性的增长和无法预测的扩散速度,如果引导不善,负面的网络舆情将对社会公共安全形成较大威胁。近几年来,由于舆情监测的准确性和效率不高,导致很多企业面对突发事件,因为没有及时发现或者处置不当受到不小的打击,也有因为在舆情刚出现时由于未采取回避措施从而引起了更大的危机。因此,专利技术一种网络舆情监测方法来解决上述问题很有必要。
技术实现思路
1、本公开的实施例提供了一种网络舆情监测方法、装置、设备以及存储介质。
2、第一方面,本公开的实施例提供了一种网络舆情监测方法,该方法包括:
3、获取网络舆情数据;
4、将所述网络舆情数据输入预先训练得到的情感分类模型,得到情感分类结果;
5、基于tf-idf算法对情感分类结果为负面的网络舆情数据进行关键词筛选,生成舆情特征关键词;
6、基于所述舆情特征关键词进行热度计算,进行舆情的热度排序和预警。
7、在第一方面的一些可实现方式中,所述预先训练得到的情感分类模型为bert-cbam模型;
8、所述预先训练得到的情感分类模型是通过以下步骤训练得到的:
9、获取历史网络舆情数据;
10、对所述历史网络舆情数据进行情感标注,生成训练样本集;
11、根据
12、在第一方面的一些可实现方式中,根据所述训练样本集对所述bert-cbam模型进行训练包括:
13、使用半监督学习的方式对所述bert-cbam模型进行训练。
14、在第一方面的一些可实现方式中,所述bert-cbam模型以bert预训练模型为基础模型,包括文本编码层、注意力聚焦层和输出层,其中,
15、所述文本编码层负责通过bert编码器将短文本转换成向量矩阵;
16、所述注意力聚焦层通过cam和sam,结合卷积神经网络,从向量矩阵中提取深层语义和关键特征;
17、所述输出层由全连接层加softmax函数组成,从所述关键特征中得到情感分类结果;
18、所述bert预训练模型是基于所述训练样本集对bert模型进行预训练得到的。
19、在第一方面的一些可实现方式中,所述基于tf-idf算法对情感分类结果为负面的网络舆情数据进行关键词筛选,生成舆情特征关键词包括:
20、计算情感分类结果为负面的网络舆情数据的文本词频tf与逆文档频率idf,得出每个词的tf-idf值;
21、按tf-idf值降序排列,将其中排序靠前的前n个关键词作为舆情特征关键词,其中,n为大于等于1的正整数。
22、在第一方面的一些可实现方式中,基于所述舆情特征关键词进行热度计算,进行舆情的热度排序和预警包括:
23、对预设时间段内获得的舆情特征关键词进行热度计算,并按热度计算结果降序排列,选取其中排序靠前的前n个舆情特征关键词,其中,n为大于等于1的正整数;
24、根据选取的舆情特征关键词,选择对应的网络舆情数据;
25、对选择的网络舆情数据进行热度量化并排序;
26、当某一网络舆情数据热度指数大于或等于预设阈值则进行预警。
27、在第一方面的一些可实现方式中,该方法还包括:
28、对所述热度排序和预警情况进行分析,报告描述舆情状态并进行舆情监测状态可视化展示。
29、第二方面,本公开的实施例提供了一种网络舆情监测装置,该装置包括:
30、数据获取模块,用于获取网络舆情数据;
31、情感分类模块,用于将所述网络舆情数据输入预先训练得到的情感分类模型,得到情感分类结果;
32、特征提取模块,用于基于tf-idf算法对情感分类结果为负面的网络舆情数据进行关键词筛选,生成舆情特征关键词;
33、监测预警模块,用于基于所述舆情特征关键词进行热度计算,进行舆情的热度排序和预警。
34、第三方面,本公开的实施例提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如以上所述的方法。
35、第四方面,本公开的实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如以上所述的方法。
36、本公开的实施例中,首先可以基于情感分类模型对网络舆情数据进行情感分类,其次可以使用tf-idf算法对情感分类结果为负面的网络舆情数据进行关键词筛选,最后可以通过舆情热度计算方法,对每个网络舆情数据进行热度量化并排序,判断出当下急需处理的负面舆情信息,提高监测效率,且当某一网络舆情数据热度指数大于或等于预设阈值则进行预警,避免负面舆情进一步扩大,进而实现对舆情态势的精准把握和预警。
37、应当理解,
技术实现思路
部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
【技术保护点】
1.一种网络舆情监测方法,其特征在于,包括:
2.根据权利要求1所述的方法,其中,
3.根据权利要求2所述的方法,其特征在于,所述根据所述训练样本集对所述BERT-CBAM模型进行训练包括:
4.根据权利要求2所述的方法,其特征在于,所述BERT-CBAM模型以BERT预训练模型为基础模型,包括文本编码层、注意力聚焦层和输出层,其中,
5.根据权利要求1所述的方法,其特征在于,所述基于TF-IDF算法对情感分类结果为负面的网络舆情数据进行关键词筛选,生成舆情特征关键词包括:
6.根据权利要求1所述的方法,其特征在于,所述基于所述舆情特征关键词进行热度计算,进行舆情的热度排序和预警包括:
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
8.一种网络舆情监测装置,其特征在于,包括:
9.一种电子设备,包括:
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一权利要求所述的方法。
【技术特征摘要】
1.一种网络舆情监测方法,其特征在于,包括:
2.根据权利要求1所述的方法,其中,
3.根据权利要求2所述的方法,其特征在于,所述根据所述训练样本集对所述bert-cbam模型进行训练包括:
4.根据权利要求2所述的方法,其特征在于,所述bert-cbam模型以bert预训练模型为基础模型,包括文本编码层、注意力聚焦层和输出层,其中,
5.根据权利要求1所述的方法,其特征在于,所述基于tf-idf算法对情感分类结果为负面的网络舆情数据...
【专利技术属性】
技术研发人员:何胜文,林乔木,刘羿漩,董兴鹏,邵承志,
申请(专利权)人:中科星图智慧科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。