一种网文统计的方法及系统技术方案

技术编号：3854605 阅读：229 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及一种网文统计的方法及系统，其中，将内容相似的网文聚类为同类网文组，计算所述同类网文组中各网文的网文统计系统ＮＡＳＳ值和各个同类网文组的ＮＡＳＳ总值，根据所述各个同类网文组的ＮＡＳＳ总值对各个同类网文组的排序。本发明专利技术实施例提供给用户相关主题的网文，发现舆论热点，既能避免漏掉重要的网文，又大大提高用户阅读的效率，节省用户的时间。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及互联网技术，特别涉及一种互联网中网文统计的方法及系统。
技术介绍
上世纪90年代以来，随着互联网在全世界范围内的大规模商业化应用，越来越多的人从互联网上获取信息。今天，互联网已经逐渐取代报纸、杂志和广播电视等传统媒体，成为重要的和具有强大影响力的媒体。通过互联网获取新闻或其他信息己经成为人们获取最新资讯的重要方式。发布在互联网上的文章，包括各种博客、论坛帖文和新闻等网络文章，以下统称为网文，具有发布迅速、更新快捷、容量大、阅传播迅速、阅读者可以跟帖发表评论等诸多传统媒体无法具备的优势。也正是这个优势，又成为了网文的弱势由于网文数量巨大、品质参差不齐，使阅读网文的读者往往有堕入信息海洋无法自拔的感觉。据不完全统计，全球大约300个比较重要的中文新闻及综合网站，每天发布各类网文超过20万条，一般阅读者即使花费大量的时间，可能也无法从数量众多的网文中获取某一事件的比较完整的信息，或者发现自己感兴趣的网文。对同一般的网络阅读者来说，不同网站发布的关于同一主题、内容类似的网文，没有特别的意义。但是从网络媒体影响力的角度看，由于不同网站有着自己特定的读者群，所以大量重复发布的网文，对于扩大网站影响力、增大网站的流量等方面有着重要的意义。对于传统媒体，定量计算内容一样的报刊文章或电视新闻等的影响力，是一件十分困难的事情。今天，计算机技术的发展和互联网的普及给我们提供了这个可能。按照经典的新闻传播理论，媒体的议题设置不会改变受众对于议题的看法，但是议题设置会引起受众的关注并大大影响读者的思考点，这恰恰是媒体舆论引导的作用所...

【技术保护点】
一种网文统计的方法，其特征在于，包括：　将内容相似的网文聚类为同类网文组；　计算所述同类网文组中各网文的网文统计系统ＮＡＳＳ值和各个同类网文组的ＮＡＳＳ总值；　根据所述各个同类网文组的ＮＡＳＳ总值对各个同类网文组排序。

【技术特征摘要】

【专利技术属性】
技术研发人员：王稼夫，
申请(专利权)人：北京精讯云顿数据软件有限公司，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人