一种基于大数据的舆情监测系统及方法技术方案

技术编号:39326440 阅读:8 留言:0更新日期:2023-11-12 16:04
本发明专利技术公开了一种基于大数据的舆情监测系统及方法,属于舆情监测技术领域。本发明专利技术包括:S10:基于大数据对互联网上对应事件中的评论信息进行获取,对评论信息中的有用信息按照舆情分析角度进行分类,根据各类评论信息对对应事件的舆论走向情况进行预测,基于预测的舆论走向,判断是否对对应事件进行舆情监控;S20:根据对应事件在各时刻的转发情况和搜索情况,以及S10中预测的对应事件的舆论走向情况,对对应事件的传播情况进行预测;S30:对对应事件的舆情管理时间进行确定。本发明专利技术能够对对应事件的舆情管理时间进行确定,保证对应事件在舆情不可控前对舆情进行正向引导,实现对舆情事件的全面分析和监测,提高了系统的监测效果。效果。效果。

【技术实现步骤摘要】
一种基于大数据的舆情监测系统及方法


[0001]本专利技术涉及舆情监测
,具体为一种基于大数据的舆情监测系统及方法。

技术介绍

[0002]舆情监测是指整合互联网信息采集技术及信息智能处理技术,通过对互联网海量信息自动抓取、自动分类聚类、主题检测、专题聚焦,实现用户的网络舆情监测。
[0003]现有的舆情监测系统在对舆情进行监测时只对事件中的部分信息进行采集和分析,无法实现对舆情事件的全面分析和监测,以及现有系统中的舆情监测技术功能较为单一,无法对舆情监控时间进行预测,即无法实现对舆情的有效控制,以及在对舆情进行分析时,分析过程较为繁琐且分析效率过低。

技术实现思路

[0004]本专利技术的目的在于提供一种基于大数据的舆情监测系统及方法,以解决上述
技术介绍
中提出的问题。
[0005]为了解决上述技术问题,本专利技术提供如下技术方案:一种基于大数据的舆情监测方法,其特征在于:所述方法包括:S10:基于大数据对互联网上对应事件中的评论信息进行获取,对评论信息中的有用信息按照舆情分析角度进行分类,根据各类评论信息对对应事件的舆论走向情况进行预测,基于预测的舆论走向,判断是否对对应事件进行舆情监控;S20:根据对应事件在各时刻的转发情况和搜索情况,以及S10中预测的对应事件的舆论走向情况,对对应事件的传播情况进行预测;S30:对对应事件的舆情管理时间进行确定。
[0006]进一步的,所述S10包括:S101:以时间间隔t对互联网上对应事件中的评论信息进行获取,根据评论信息之间是否具有回复关系,将获取的评论信息分为主要评论信息和次要评论信息,主要评论信息表示无回复信息且自身非回复信息的评论信息,次要评论信息为主要评论信息的回复信息,判断主要评论信息和匹配的次要评论信息的评论观点是否一致,若不一致,则将匹配的次要评论信息修改为主要评论信息,或作为与其评论观点一致的主要评论信息的次要评论信息,若一致,则无需对次要评论信息进行修改,对主要评论信息与对应事件之间的关联程度进行获取,若关联程度低于设定阈值,则表示对应主要评论信息和匹配的次要评论信息为无用信息,将无用信息和评论信息中评论观点保持中立的评论信息删除,删除后剩余信息为有用信息;S102:根据S101中的有用信息对对应事件的受争议点数量进行确定,对确定的受争议点进行随机组合,基于随机组合情况,对对应事件的舆情分析角度数量进行确定,具体的确定公式为:W=∑n v=1{n!/[v*(n

v)!]};
其中,v=1,2,

,n,表示组合内受争议点的数量,n表示对应事件的受争议点总数量,n!表示n的阶乘,(n

v)!表示n

v的阶乘,W表示对应事件的舆情分析角度数量,舆情分析角度指对应事件受争议点对应的争议角度,例如,对应事件的受争议点为学生应该注重课外活动,对应的舆情分析角度为学生是否应该注重课外活动;将S101中的有用信息按照舆情分析角度进行分类,将属于同一分类的主要评论信息放入同一集合中,根据集合中的主要评论信息和与集合中主要评论信息匹配的次要评论信息,对对应事件的舆论走向进行预测;S103:若对应事件的舆论走向为正向,则此时无需对对应事件进行舆情监控,若对应事件的舆论走向为负向,则此时需要对对应事件进行舆情监控。
[0007]进一步的,所述S102对对应事件的舆论走向进行预测的具体方法为;A.对集合中主要评论信息的评论观点进行提取,利用公式F
i
=[∑m,rj=1,i=1a
ji
+∑m,rj=1,i=1 (a
ji
*b
j
)]/(m+∑m j=1b
j
)对提取的各评论观点的支持率进行计算,其中,j=1,2,

,m,表示集合中放入的主要评论信息对应的编号,m表示放入集合中的主要评论信息总数量,i=1,2,

,r,表示提取的评论观点对应的编号,r表示提取的评论观点的总数量,a
ji
=0或a
ji
=1,当a
ji
=1时表示编号为j的主要评论信息支持编号为i的评论观点,当a
ji
=0时表示编号为j的主要评论信息不支持编号为i的评论观点,b
j
表示与编号为j的主要评论信息匹配的次要评论信息总数,F
i
表示集合中对编号为i的评论观点的支持率;B.根据A中计算的对提取的各评论观点的支持率,对对应事件的舆论走向进行预测,具体的预测公式为:E=∑W,rp=1,i=1[α
p
*(F
ip

i
)];其中,p=1,2,

,W,表示集合对应的编号,α
p
表示编号为p的集合对应的舆情分析角度所对应的比例系数,∑Wp=1α
p
=1,F
ip
表示集合p中对编号为i的评论观点的支持率,β
i
=0或β
i
=1,当β
i
=1时,表示编号为i的评论观点为正向评论,当β
i
=0时,表示编号为i的评论观点为负向评论,E表示对应事件的舆论走向参考值;当0.6≤E≤1时,表示对应事件的舆论走向为正向,当0≤E<0.6时,表示对应事件的舆论走向为负向。
[0008]进一步的,所述S20包括:S201:根据S102中在各时刻预测的对应事件的舆论走向参考值,对对应事件在各时刻的传播速率进行计算,传播速率=[(E
T+t*(z

1)

E
T+t*z
)/(1

E
T+t*(z

1)
)],其中,T表示获取对应事件中评论信息的初始时间,z表示获取对应事件中评论信息的次数,z≥2,E
T+t*z
表示对应事件在T+t*z时间点的舆论走向参考值;S202:对对应事件在各时刻的转发情况和搜索情况进行获取,基于获取信息对对应事件在各时刻的传播程度进行预测,具体的预测公式为:S=γ*(Q
T+t*z

Q
T+t*(z

1)
)+(1

γ)*(P
T+t*z

P
T+t*(z

1)
);其中,γ表示比例系数,Q
T+t*z
表示对应事件在T+t*z时间点的转发量,P
T+t*z
表示对应事件在T+t*z时间点的搜索量,S表示对应事件在T+t*z时间点的传播程度。
[0009]进一步的,所述S30根据S201中预测的对应事件在各时刻的传播速率,以及S202中预测的对应事件在各时刻的传播程度,对对应事件的舆情管理时间进行确定,具体的确定方法为:对对应事件在各时刻的传播速率和传播程度之间的乘积进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的舆情监测方法,其特征在于:所述方法包括:S10:基于大数据对互联网上对应事件中的评论信息进行获取,对评论信息中的有用信息按照舆情分析角度进行分类,根据各类评论信息对对应事件的舆论走向情况进行预测,基于预测的舆论走向,判断是否对对应事件进行舆情监控;所述S10包括:S101:以时间间隔t对互联网上对应事件中的评论信息进行获取,根据评论信息之间是否具有回复关系,将获取的评论信息分为主要评论信息和次要评论信息,判断主要评论信息和匹配的次要评论信息的评论观点是否一致,若不一致,则将匹配的次要评论信息修改为主要评论信息,或作为与其评论观点一致的主要评论信息的次要评论信息,若一致,则无需对次要评论信息进行修改,对主要评论信息与对应事件之间的关联程度进行获取,若关联程度低于设定阈值,则表示对应主要评论信息和匹配的次要评论信息为无用信息,将无用信息和评论信息中评论观点保持中立的评论信息删除,删除后剩余信息为有用信息;S102:根据S101中的有用信息对对应事件的受争议点数量进行确定,对确定的受争议点进行随机组合,基于随机组合情况,对对应事件的舆情分析角度数量进行确定,具体的确定公式为:W=∑n v=1{n!/[v*(n

v)!]};其中,v=1,2,

,n,表示组合内受争议点的数量,n表示对应事件的受争议点总数量,n!表示n的阶乘,(n

v)!表示n

v的阶乘,W表示对应事件的舆情分析角度数量;将S101中的有用信息按照舆情分析角度进行分类,将属于同一分类的主要评论信息放入同一集合中,根据集合中的主要评论信息和与集合中主要评论信息匹配的次要评论信息,对对应事件的舆论走向进行预测;S103:若对应事件的舆论走向为正向,则此时无需对对应事件进行舆情监控,若对应事件的舆论走向为负向,则此时需要对对应事件进行舆情监控;S20:根据对应事件在各时刻的转发情况和搜索情况,以及S10中预测的对应事件的舆论走向情况,对对应事件的传播情况进行预测;S30:对对应事件的舆情管理时间进行确定。2.根据权利要求1所述的一种基于大数据的舆情监测方法,其特征在于:所述S102对对应事件的舆论走向进行预测的具体方法为;A.对集合中主要评论信息的评论观点进行提取,利用公式F
i
=[∑m,rj=1,i=1a
ji
+∑m,rj=1,i=1 (a
ji
*b
j
)]/(m+∑m j=1b
j
)对提取的各评论观点的支持率进行计算,其中,j=1,2,

,m,表示集合中放入的主要评论信息对应的编号,m表示放入集合中的主要评论信息总数量,i=1,2,

,r,表示提取的评论观点对应的编号,r表示提取的评论观点的总数量,a
ji
=0或a
ji
=1,当a
ji
=1时表示编号为j的主要评论信息支持编号为i的评论观点,当a
ji
=0时表示编号为j的主要评论信息不支持编号为i的评论观点,b
j
表示与编号为j的主要评论信息匹配的次要评论信息总数,F
i
表示集合中对编号为i的评论观点的支持率;B.根据A中计算的对提取的各评论观点的支持率,对对应事件的舆论走向进行预测,具体的预测公式为:E=∑W,rp=1,i=1[α
p
*(F
ip

i
)];其中,p=1,2,

,W,表示集合对应的编号,α
p
表示编号为p的集合对应的舆情分析角度所
对应的比例系数,∑Wp=1α
p
=1,F
ip
表示集合p中对编号为i的评论观点的支持率,β
i
=0或β
i
=1,当β
i
=1时,表示编号为i的评论观点为正向评论,当β
i
=0时,表示编号为i的评论观点为负向评论,E表示对应事件的舆论走向参考值;当0.6≤E≤1时,表示对应事件的舆论走向为正向,当0≤E<0.6时,表示对应事件的舆论走向为负向。3.根据权利要求2所述的一种基于大数据的舆情监测方法,其特征在于:所述S20包括:S201:根据S102中在各时刻预测的对应事件的舆论走向参考值,对对应事件在各时刻的传播速率进行计算,传播速率=[(E
T+t*(z

1)

E
T+t*z
)/(1

E
T+t*(z

1)
)],其中,T表示获取对...

【专利技术属性】
技术研发人员:钱俊冬
申请(专利权)人:北京橙色风暴数字技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1