一种新闻传播溯源的分析方法技术

技术编号:25223959 阅读:23 留言:0更新日期:2020-08-11 23:13
本发明专利技术公开了一种新闻传播溯源的分析方法,新闻传播溯源的分析步骤如下:数据采集网页、编码处理、编码比对、比较相似度、相似文章输出排序、输出结果。本发明专利技术提供了一种分析准确、全面的新闻传播溯源方法。本发明专利技术基于相似文本识别技术同时分析网页URL、作者、数据源等相关属性。本发明专利技术准确率提升,溯源结果达到领先水平,溯源计算性能高,支持海量数据的溯源分析。

【技术实现步骤摘要】
一种新闻传播溯源的分析方法
本专利技术涉及计算机网络
,确切地说是一种新闻传播溯源的分析方法。
技术介绍
随着互联网的快速发展,媒体传播的速度越来越快;如何高效的分析某篇文章的传播过程,成为需要解决的一个难题。目前分析的方法主要是根据新闻标题或作者是否一致来判定是否是同一篇文章,是否是二次传播。这样的方式,容易产生信息遗漏,分析不准、分析不全。
技术实现思路
本专利技术要解决的技术问题是根据新闻标题或作者是否一致来判定是否是同一篇文章,是否是二次传播。这样的方式,容易产生信息遗漏,分析不准、分析不全。为解决上述技术问题,本专利技术采用如下技术手段:一种新闻传播溯源的分析方法,新闻传播溯源的分析步骤如下:步骤1:数据采集网页:利用网页提取技术,提取网页内的全部信息数据;步骤2:编码处理:针对网页采集信息中标题和正文分别进行编码处理;步骤3:编码比对:将编码同历史文章的编码进行比对,输出相似度;步骤4:比较相似度:比较相似度接近文章的作者、发布时间和来源站点;步骤5:相似文章输出排序:输出数据分析结果,将相似文章输出,输出结果按照发布时间排序;步骤6:输出结果:输出溯源分析结果,完成新闻传播溯源。作为优选,本专利技术更进一步的技术方案是:所述的数据采集网页提取的全部信息数据包括标题、正文、作者、发布时间等结构化数据。所述的编码处理针对标题和正文分别进行hash编码。所述的比较相似度中分析是否是同一个文章还是二次传播的文章。本专利技术提供了一种分析准确、全面的新闻传播溯源方法。本专利技术基于相似文本识别技术同时分析网页URL、作者、数据源等相关属性。本专利技术准确率提升,溯源结果达到领先水平,溯源计算性能高,支持海量数据的溯源分析。附图说明图1为本专利技术的结构框图。具体实施方式下面结合实施例,进一步说明本专利技术。参见图1可知,本专利技术一种新闻传播溯源的分析方法,新闻传播溯源的分析步骤如下:步骤1:数据采集网页:利用网页提取技术,提取网页内的全部信息数据;数据采集网页提取的全部信息数据包括标题、正文、作者、发布时间等结构化数据。步骤2:编码处理:针对网页采集信息中标题和正文分别进行编码处理;编码处理针对标题和正文分别进行hash编码。步骤3:编码比对:将编码同历史文章的编码进行比对,输出相似度;步骤4:比较相似度:比较相似度接近文章的作者、发布时间和来源站点;比较相似度中分析是否是同一个文章还是二次传播的文章。步骤5:相似文章输出排序:输出数据分析结果,将相似文章输出,输出结果按照发布时间排序;步骤6:输出结果:输出溯源分析结果,完成新闻传播溯源。本专利技术关键点(1)历史文章的编码算法;(2)判定是同一文章还是二次传播文章的标准。由于以上所述仅为本专利技术的具体实施方式,但本专利技术的保护不限于此,任何本
的技术人员所能想到本技术方案技术特征的等同的变化或替代,都涵盖在本专利技术的保护范围之内。本文档来自技高网
...

【技术保护点】
1.一种新闻传播溯源的分析方法,其特征在于所述的新闻传播溯源的分析步骤如下:/n步骤1:数据采集网页:利用网页提取技术,提取网页内的全部信息数据;/n步骤2:编码处理:针对网页采集信息中标题和正文分别进行编码处理;/n步骤3:编码比对:将编码同历史文章的编码进行比对,输出相似度;/n步骤4:比较相似度:比较相似度接近文章的作者、发布时间和来源站点;/n步骤5:相似文章输出排序:输出数据分析结果,将相似文章输出,输出结果按照发布时间排序;/n步骤6:输出结果:输出溯源分析结果,完成新闻传播溯源。/n

【技术特征摘要】
1.一种新闻传播溯源的分析方法,其特征在于所述的新闻传播溯源的分析步骤如下:
步骤1:数据采集网页:利用网页提取技术,提取网页内的全部信息数据;
步骤2:编码处理:针对网页采集信息中标题和正文分别进行编码处理;
步骤3:编码比对:将编码同历史文章的编码进行比对,输出相似度;
步骤4:比较相似度:比较相似度接近文章的作者、发布时间和来源站点;
步骤5:相似文章输出排序:输出数据分析结果,将相似文章输出,输出结果按照发布时间排序;
步骤6:输出结果:...

【专利技术属性】
技术研发人员:徐利东远贵良
申请(专利权)人:山东贝赛信息科技有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1