System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及信息自动推送,具体为一种基于汇聚线索的新闻选题的推荐系统及方法。
技术介绍
1、新闻选题是新闻制作中最基础、最关键的环节。在诸多的新闻事件中,采编人员要进行斟酌和考量,进行有效的选择、立题。好的新闻选题,要在符合客观真实性的前提条件下,给读者带来正能量,要在一定程度上反应社会发展的现实状态,要跟上时代发展的步伐。因此,需要采编人员具有较强的判断力,而正确的判断来自于平时的积累。
2、在缺乏新闻报道的时候,需要付出大量人力和资源来获取可供报道的选题。
3、互联网媒体宣传渠道蓬勃发展,媒体机构每天都需要报道更多的新闻信息,网络中充斥大量的新闻报道内容,媒体人员需要构思一个良好的选题,更是难上加难。
技术实现思路
1、为了解决上述问题,本专利技术提供一种基于汇聚线索的新闻选题的推荐系统,包括:线索采集模块、关键词提取模块、数据分析模块、选题生成模块、生成推送模块;所述线索采集模块用于收集整理全网的线索信息;所述关键词提取模块用于对收集到的线索信息进行关键字词的提取;所述数据分析模块用于依据提取出的关键字词进行分析;所述选题生成模块用于生成新闻选题推荐指数列表;所述生成推送模块用于将生成的新闻选题推荐指数列表推送至用户。
2、进一步地,所述线索采集模块设置有线索入库api服务及线索同步api服务;所述线索入库api服务用于实时接收三方线索数据并储存;所述线索同步api服务用于实时订阅互联网新闻推送、舆情数据推送,并进行线索同步。
4、进一步地,所述新闻选题推荐指数列表依据不同数据类型设置不同的推荐内容;所述推荐内容在同一数据类型下的个数存在阈值。
5、进一步地,还包括一个线索资源库,用于存储采集到或分析处理后的线索数据信息。
6、一种基于汇聚线索的新闻选题的推荐方法,包括以下步骤:s1.实时自动采集整理全网各个平台线索信息,并储存至线索资源库中;s2.对采集到的线索信息进行关键词提取和数据分析;s3.依据数据分析结果进行权重计算并生成选题列表;s4.将生成的选题列表推送至用户。
7、进一步地,所述s2步骤具体包括以下子步骤:s21.数据去重;s22.数据清洗;s23.关键词提取;s24.数据分类;s25.数据相关内容分析。
8、进一步地,所述s25步骤具体包括:热度分析:批量线索进行相同分类、相同人物、相同事件、相似地点和时间的统计,将离散的线索信息之间形成关联数据,并统计线索链接的相关路径数,加上线索去重的热度值,得到线索最终热度值;关注度分析:将相同分类、相同人物、相同事件、相似地点和时间的同组组线索,叠加每条线索的评论数,将评论数通过边际函数处理,获取评论数的关注度区间;时效性分析:将同组线索的最新报道时间减去最早报道时间,得到线索持续报道时间;情绪分析:分析线索内容和评论内容,进行舆情情绪模型分析,获取线索正面、中性、负面的情绪结果;可信度分析:根据线索的来源进行可信度评分。
9、进一步地,所述关注度分析中关注度区间具体包括以下五个区间:极少关注、少关注、普通关注、重要关注、爆红关注。
10、进一步地,所述时效性分析中线索持续报道时间越长则线索时效性值越大,具体划分为:短时效、中时效、长时效和超长时效。
11、本专利技术提供了一种基于汇聚线索的新闻选题的推荐系统及方法,具有以下有益效果:
12、(1)本专利技术汇聚完备的来源渠道的线索信息,对线索进行去重、清洗、nlp语义分析,获取线索的热度、关注度、时效性、情绪、可信度等多个维度的评分,综合判断后形成高效、有价值的选题推荐。
13、(2)本专利技术解决了人员收集信息不全的问题,全面覆盖线索采集来源;解决了人员以主观爱好挑选线索,不客观的问题,提供高质量的选题推荐;解决了需要耗费人员大量时间的问题,自动高效生成选题推荐;解决了报道选题不足的问题,随时都有大量的选题推荐,供人员使用。通过选题的推荐,大大的节省了记者和编辑在选题上花费的时间,提升新闻生产的效率。
本文档来自技高网...【技术保护点】
1.一种基于汇聚线索的新闻选题的推荐系统,其特征在于,包括:线索采集模块、关键词提取模块、数据分析模块、选题生成模块、生成推送模块;
2.根据权利要求1所述的基于汇聚线索的新闻选题的推荐系统,其特征在于,所述线索采集模块设置有线索入库API服务及线索同步API服务;
3.根据权利要求1所述的基于汇聚线索的新闻选题的推荐系统,其特征在于,所述数据分析模块中对数据的分析处理具体包括:数据去重、数据清洗、数据分类、热度分析、关注度分析、时效性分析、情绪分析、可信度分析。
4.根据权利要求1所述的基于汇聚线索的新闻选题的推荐系统,其特征在于,所述新闻选题推荐指数列表依据不同数据类型设置不同的推荐内容;所述推荐内容在同一数据类型下的个数存在阈值。
5.根据权利要求1所述的基于汇聚线索的新闻选题的推荐系统,其特征在于,还包括一个线索资源库,用于存储采集到或分析处理后的线索数据信息。
6.一种基于汇聚线索的新闻选题的推荐方法,基于权利要求1-5任一项所述的基于汇聚线索的新闻选题的推荐系统,其特征在于,包括以下步骤:
7.根
8.根据权利要求7所述的基于汇聚线索的新闻选题的推荐方法,其特征在于,所述S25步骤具体包括:
9.根据权利要求8所述的基于汇聚线索的新闻选题的推荐方法,其特征在于,所述关注度分析中关注度区间具体包括以下五个区间:极少关注、少关注、普通关注、重要关注、爆红关注。
10.根据权利要求8所述的基于汇聚线索的新闻选题的推荐方法,其特征在于,所述时效性分析中线索持续报道时间越长则线索时效性值越大,具体划分为:短时效、中时效、长时效和超长时效。
...【技术特征摘要】
1.一种基于汇聚线索的新闻选题的推荐系统,其特征在于,包括:线索采集模块、关键词提取模块、数据分析模块、选题生成模块、生成推送模块;
2.根据权利要求1所述的基于汇聚线索的新闻选题的推荐系统,其特征在于,所述线索采集模块设置有线索入库api服务及线索同步api服务;
3.根据权利要求1所述的基于汇聚线索的新闻选题的推荐系统,其特征在于,所述数据分析模块中对数据的分析处理具体包括:数据去重、数据清洗、数据分类、热度分析、关注度分析、时效性分析、情绪分析、可信度分析。
4.根据权利要求1所述的基于汇聚线索的新闻选题的推荐系统,其特征在于,所述新闻选题推荐指数列表依据不同数据类型设置不同的推荐内容;所述推荐内容在同一数据类型下的个数存在阈值。
5.根据权利要求1所述的基于汇聚线索的新闻选题的推荐系统,其特征在于,还包括一个线索资源库,用于存储采集到或分析处理后的线索数据信息。
【专利技术属性】
技术研发人员:徐国栋,张宁,徐辉世,魏忠书,李晓平,杨奕涛,薛文峰,姜文革,
申请(专利权)人:成都东方盛行电子有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。