【技术实现步骤摘要】
一种新闻传播溯源的分析方法
本专利技术涉及计算机网络
,确切地说是一种新闻传播溯源的分析方法。
技术介绍
随着互联网的快速发展,媒体传播的速度越来越快;如何高效的分析某篇文章的传播过程,成为需要解决的一个难题。目前分析的方法主要是根据新闻标题或作者是否一致来判定是否是同一篇文章,是否是二次传播。这样的方式,容易产生信息遗漏,分析不准、分析不全。
技术实现思路
本专利技术要解决的技术问题是根据新闻标题或作者是否一致来判定是否是同一篇文章,是否是二次传播。这样的方式,容易产生信息遗漏,分析不准、分析不全。为解决上述技术问题,本专利技术采用如下技术手段:一种新闻传播溯源的分析方法,新闻传播溯源的分析步骤如下:步骤1:数据采集网页:利用网页提取技术,提取网页内的全部信息数据;步骤2:编码处理:针对网页采集信息中标题和正文分别进行编码处理;步骤3:编码比对:将编码同历史文章的编码进行比对,输出相似度;步骤4:比较相似度:比较相似度接近文章的作者、发布时间和来源站点;步骤5:相似文章输出排序:输出数据分析结果,将相似文章输出,输出结果按照发布时间排序;步骤6:输出结果:输出溯源分析结果,完成新闻传播溯源。作为优选,本专利技术更进一步的技术方案是:所述的数据采集网页提取的全部信息数据包括标题、正文、作者、发布时间等结构化数据。所述的编码处理针对标题和正文分别进行hash编码。所述的比较相似度中分析是否是 ...
【技术保护点】
1.一种新闻传播溯源的分析方法,其特征在于所述的新闻传播溯源的分析步骤如下:/n步骤1:数据采集网页:利用网页提取技术,提取网页内的全部信息数据;/n步骤2:编码处理:针对网页采集信息中标题和正文分别进行编码处理;/n步骤3:编码比对:将编码同历史文章的编码进行比对,输出相似度;/n步骤4:比较相似度:比较相似度接近文章的作者、发布时间和来源站点;/n步骤5:相似文章输出排序:输出数据分析结果,将相似文章输出,输出结果按照发布时间排序;/n步骤6:输出结果:输出溯源分析结果,完成新闻传播溯源。/n
【技术特征摘要】
1.一种新闻传播溯源的分析方法,其特征在于所述的新闻传播溯源的分析步骤如下:
步骤1:数据采集网页:利用网页提取技术,提取网页内的全部信息数据;
步骤2:编码处理:针对网页采集信息中标题和正文分别进行编码处理;
步骤3:编码比对:将编码同历史文章的编码进行比对,输出相似度;
步骤4:比较相似度:比较相似度接近文章的作者、发布时间和来源站点;
步骤5:相似文章输出排序:输出数据分析结果,将相似文章输出,输出结果按照发布时间排序;
步骤6:输出结果:...
【专利技术属性】
技术研发人员:徐利东,远贵良,
申请(专利权)人:山东贝赛信息科技有限公司,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。