一种互联网舆情事件传播指数的获取方法和系统技术方案

技术编号:15542340 阅读:104 留言:0更新日期:2017-06-05 11:20
本发明专利技术提供一种互联网舆情事件传播指数的获取方法,所述获取方法为:1、输入舆情事件;2、采集在各个媒体源中抓取该舆情事件的相关舆情文章,并存入舆情事件分析库;3、对该舆情事件的所有舆情文章进行分析,以文章的发布时间先后对所有媒体源文章进行排序,形成舆情事件传播轨迹,同时,对每一篇文章进行单文章传播指数计算;4、通过文章传播指数提取舆情事件传播轨迹关键信息;5、通过舆情事件传播轨迹关键信息构建最终模型。本发明专利技术模型更为精确、更能反映舆情事件从生成、发展、爆发、高峰期、衰弱、结束等整个生命周期的发展态势。

Method and system for acquiring propagation index of Internet public sentiment event

The present invention provides a method for obtaining the Internet public opinion event propagation index, the acquisition method is: 1, enter the public opinion events; 2, collected in various media sources in grasping the public opinion events related to public opinion articles, and stored in the event of public opinion analysis library; 3, analyze all the public opinion the public opinion of the event, to the release time to sort all the media source, the formation of public opinion event propagation path, at the same time, the spread of single index was calculated for each article; 4, through the dissemination of public opinion index extraction event propagation track key information; 5, the final model of public opinion events spread track key information. The model of the invention is more accurate, and can reflect the development trend of the whole life cycle of the public opinion events from generation, development, explosion, peak period, weakness and ending.

【技术实现步骤摘要】
一种互联网舆情事件传播指数的获取方法和系统
本专利技术涉及互联网
,尤其涉及一种互联网舆情事件传播指数的获取方法和系统。
技术介绍
互联网舆情是指在互联网上流行的对社会问题不同看法的网络舆论,是社会舆论的一种表现形式。以网络为载体,以事件为核心,广大网民情感、态度、意见、观点的表达、传播与互动,以及后续影响力的集合。通过互联网传播公众对现实生活中某些热点、焦点问题所持的有较强影响力、倾向性的言论和观点。互联网舆情的表现方式多种多样,例如:新闻评论、论坛帖子、微博博文、微信文章等。近年来,网络舆情对政治生活秩序和社会稳定的影响与日俱增,一些重大的网络舆情事件使人们开始认识到网络对社会监督起到的巨大作用。同时,网络舆情突发事件如果处理不当,极有可能诱发民众的不良情绪,引发群众的违规和过激行为,进而对社会稳定构成威胁。同时,随着我国正处的改革关键期、矛盾突发期诸种问题冲突的叠合积聚,网络舆情已经成为当前社会和谐度和稳定度的标志,成为领导和社会各界的关注焦点。舆情事件传播指数是通过对互联网中各种类型媒体所发布的信息进行独立的第三方观察,形成量化统计和定性分析,并结合算法推导、归纳总结而最终形成的一套网络舆情传播指数体系,从而实现对网络舆情的科学收集、分析研判和预警对策一整套科学规范的工作体系。目前,对于舆情事件的传播量化已有一定的方案,但存在监测媒体源不够全面,模型未切合实际、未能反应事件动态变化等问题,本专利申请针对目前方案的缺点,提出一种不同于现有方案的全新传播指数量化模型。现有技术方案一:基于指定站点的单媒体源文章基础要素计算在申请号为【201310525071.9】,标题为:《一种网络舆情事件的热度分析方法及系统》的专利中,提出了此种计算方法。该方法对指定网站的文章进行采集、保存。通过聚类,形成不同的话题事件,针对话题事件内的文章,提取文章的基本传播要素,如阅读数、回复数等,进行加权计算,得到单篇文章的传播指数,再对所有文章的指数进行累计,得到最终的传播指数。该方法存在明显的缺点。其一:该方法的数据范围存在明显缺陷,仅依靠指定的少数站点进行判断,未能实现全网监控。其二:随着微博、微信、微视等为代表的自媒体和以数字媒体、手机报、门户网站等为代表的新媒体空前繁荣发展,舆情的传播呈现多种媒体源交叉传播的特点,仅监控采集普通网站站点明显未符合当前舆情的传播特点。其三:该方法的指数模型也存在较大问题,舆情事件并非静态的数据信息,一个事件的形成、发展、爆发、衰退都受时间的影响,而该方案未考虑这些因素。现有技术方案二:基于样本库的多媒体源文章基础要素计算在申请号为【201510042230.9】,标题为:《一种舆情热度的快速计算方法》的专利中,提出了此种计算方法。该专利技术提出一种在信息量不完整的情况下采取对部分媒体源(新闻、论坛、微博)的采集、存储,形成基础的样本库,基于该基础样本库构建指数模型,对所涉及的媒体单独计算指数,各媒体源指数模型之间互不相关,对各个媒体源指数进行相加,即为最终的指数。相较于方案一,现有方案二的优点是:引入了多媒体源的指数计算方式,使指数计算精度较高,同时,不断累积的样本库,对于指数模型的构建起到不断优化的作用。但是该方法依然存在如下缺点。其一:在当前的新媒体繁荣发展的前提下,微博、微信、电子报等媒体源越来越受关注,已成为网民发表舆论的首选场景,而该方法中,纳入计算的媒体源却未包含微信、电子报等媒体,因此,基础样本库数据构成不够严谨,缺少现实意义。其二:未能解决方案一中同样出现的,忽略舆情事件动态变化的因素。其三:该专利技术最终的传播指数来自于各个媒体源指数的加权总和,同时各个媒体源的传播指数却是互相独立的,而在实际情况中,舆情事件的传播存在着跨媒体源的传播路径,例如用户将舆情信息从论坛分享至微博,各媒体源指数应与传播路径、传播时间息息相关。综上所述,目前对于舆情传播指数的计算已存在相应的方案,但现有方案均存在模块构建较为简单、未能解决跨媒体源传播的复杂情况、媒体源不够全面等问题。同时,应注意到,舆情传播并发是一种动态的事件,其模型的建立,应能反应舆情事件的形成、发展、爆发、高峰、衰落等生命周期,同时,应能体现出事件传播中跨媒体源传播的影响因素,而在现有方案中,均未能达到上述要求。
技术实现思路
本专利技术要解决的技术问题之一,在于提供一种互联网舆情事件传播指数的获取方法,能反映舆情事件从生成、发展、爆发、高峰期、衰弱、结束等整个生命周期的发展态势。本专利技术问题之一是这样实现的:一种互联网舆情事件传播指数的获取方法,所述获取方法包括如下步骤:步骤1、输入舆情事件;步骤2、采集在各个媒体源中抓取该舆情事件的相关舆情文章,并存入舆情事件分析库;步骤3、对该舆情事件的所有舆情文章进行分析,以文章的发布时间先后对所有媒体源文章进行排序,形成舆情事件传播轨迹,同时,对每一篇文章进行单文章传播指数计算;步骤4、通过文章传播指数提取舆情事件传播轨迹关键信息;步骤5、通过舆情事件传播轨迹关键信息构建最终模型。进一步的,所述媒体源包括:新闻、博客、论坛、贴吧、微博、微信、电子报、或者主流新闻APP。进一步的,所述步骤3中对每一篇文章进行单文章传播指数计算,具体为:针对不同的媒体源,结合当前媒体源的流行趋势,采取不同的媒体源指数;不同的媒体源根据不同的传播学要素采用不同的量化方式:新闻、论坛、贴吧类型计算模型为:NPI=[30%×r1+70%×c]×m1×g1其中NPI为单篇文章传播指数:r1为文章阅读数c为评论数m1为媒体源指数,新闻m1取值2,贴吧m1取值1.5,论坛取值1g1为在同类媒体源下排名权重博客类型计算模型为:BPI=[10%×r1+40%c1+50%×r2]×m1×g1其中BPI为单篇文章传播指数:r1为文章阅读数c为评论数r2为转发数m1为媒体源指数,博客m1取值1g1为在同类媒体源下排名权重微博类计算模型为:WPI=[10%×r1+40%×c+40%×r2+10%×(40%×c2+60%×r3)]×m1×g1其中WPI为单篇文章传播指数:r1为文章阅读数c为评论数r2为转发数c2为转发微博中评论总数r3为转发微博中转发总数m1为媒体源指数,微博的m1为3.5g1为在同类媒体源下排名权重微信类计算模型为:WPI=[20%×r+70%×a+10%ln(f+1)]×m1×r1其中WPI为单篇文章传播指数:r1为文章阅读数a为点赞数f为等价粉丝数m1为媒体源指数,微信的m1为3g1为在同类媒体源下排名权重。进一步的,取得整个事件中单篇指数最高的文章,此为舆情事件传播指数峰值,记为Smax,该舆情事件,记为Tmiddle;获得事件的有效传播时间T,定义事件传播衰弱指数为1/10;取发生时间小于Tmiddle,且得分小于Smax/10的最小时间作为事件有效开始传播时间Tstart;同理,取发生时间大于Tmiddle,且得分大于Smax/10的最大时间作为事件有效结束传播时间Tend;得到舆情事件有效传播时间:T=Tend–Tstart,在T时间内的舆情文章总数量记为C。进一步的,所述最终模型为其中:EPI为事件最终的传播指数;SMi为舆情事件中单个媒体源单篇最高得分;Mc为该事件有效传播时间内传播轨迹本文档来自技高网
...
一种互联网舆情事件传播指数的获取方法和系统

【技术保护点】
一种互联网舆情事件传播指数的获取方法,其特征在于:所述获取方法包括如下步骤:步骤1、输入舆情事件;步骤2、采集在各个媒体源中抓取该舆情事件的相关舆情文章,并存入舆情事件分析库;步骤3、对该舆情事件的所有舆情文章进行分析,以文章的发布时间先后对所有媒体源文章进行排序,形成舆情事件传播轨迹,同时,对每一篇文章进行单文章传播指数计算;步骤4、通过文章传播指数提取舆情事件传播轨迹关键信息;步骤5、通过舆情事件传播轨迹关键信息构建最终模型。

【技术特征摘要】
1.一种互联网舆情事件传播指数的获取方法,其特征在于:所述获取方法包括如下步骤:步骤1、输入舆情事件;步骤2、采集在各个媒体源中抓取该舆情事件的相关舆情文章,并存入舆情事件分析库;步骤3、对该舆情事件的所有舆情文章进行分析,以文章的发布时间先后对所有媒体源文章进行排序,形成舆情事件传播轨迹,同时,对每一篇文章进行单文章传播指数计算;步骤4、通过文章传播指数提取舆情事件传播轨迹关键信息;步骤5、通过舆情事件传播轨迹关键信息构建最终模型。2.根据权利要求1所述的一种互联网舆情事件传播指数的获取方法,其特征在于:所述媒体源包括:新闻、博客、论坛、贴吧、微博、微信、电子报、或者主流新闻APP。3.根据权利要求1所述的一种互联网舆情事件传播指数的获取方法,其特征在于:所述步骤3中对每一篇文章进行单文章传播指数计算,具体为:针对不同的媒体源,结合当前媒体源的流行趋势,采取不同的媒体源指数;不同的媒体源根据不同的传播学要素采用不同的量化方式:新闻、论坛、贴吧类型计算模型为:NPI=[30%×r1+70%×c]×m1×g1其中NPI为单篇文章传播指数:r1为文章阅读数c为评论数m1为媒体源指数,新闻m1取值2,贴吧m1取值1.5,论坛取值1g1为在同类媒体源下排名权重博客类型计算模型为:BPI=[10%×r1+40%c1+50%×r2]×m1×g1其中BPI为单篇文章传播指数:r1为文章阅读数c为评论数r2为转发数m1为媒体源指数,博客m1取值1g1为在同类媒体源下排名权重微博类计算模型为:WPI=[10%×r1+40%×c+40%×r2+10%×(40%×c2+60%×r3)]×m1×g1其中WPI为单篇文章传播指数:r1为文章阅读数c为评论数r2为转发数c2为转发微博中评论总数r3为转发微博中转发总数m1为媒体源指数,微博的m1为3.5g1为在同类媒体源下排名权重微信类计算模型为:WPI=[20%×r+70%×a+10%ln(f+1)]×m1×r1其中WPI为单篇文章传播指数:r1为文章阅读数a为点赞数f为等价粉丝数m1为媒体源指数,微信的m1为3g1为在同类媒体源下排名权重。4.根据权利要求1所述的一种互联网舆情事件传播指数的获取方法,其特征在于:所述步骤4具体为:取得整个事件中单篇指数最高的文章,此为舆情事件传播指数峰值,记为Smax,该舆情事件,记为Tmiddle;获得事件的有效传播时间T,定义事件传播衰弱指数为1/10;取发生时间小于Tmiddle,且得分小于Smax/10的最小时间作为事件有效开始传播时间Tstart;同理,取发生时间大于Tmiddle,且得分大于Smax/10的最大时间作为事件有效结束传播时间Tend;得到舆情事件有效传播时间:T=Tend–Tstart,在T时间内的舆情文章总数量记为C。5.根据权利要求4所述的一种互联网舆情事件传播指数的获取方法,其特征在于:所述最终模型为其中:EPI为事件最终的传播指数;SMi为舆情事件中单个媒体源单篇最高得分;Mc为该事件有效传播时间内传播轨迹所跨越的媒体源数量;T为该事件传播的有效时间;C为该事件有效时间内的舆情文章总数量;Si为第i篇文章单篇传播指数得分。6.一种互联网舆情事件传播指数的获取系统,其...

【专利技术属性】
技术研发人员:陈江海倪时龙苏江文王秋琳
申请(专利权)人:福建亿榕信息技术有限公司国家电网公司国网信息通信产业集团有限公司国网信通亿力科技有限责任公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1