System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于汇聚线索的新闻选题的推荐系统及方法技术方案_技高网

一种基于汇聚线索的新闻选题的推荐系统及方法技术方案

技术编号:40611451 阅读:10 留言:0更新日期:2024-03-12 22:19
本发明专利技术公开了一种基于汇聚线索的新闻选题的推荐系统及方法。系统包括线索采集模块、关键词提取模块、数据分析模块、选题生成模块、生成推送模块。方法包括以下步骤:S1.实时自动采集整理全网各个平台线索信息,并储存至线索资源库中;S2.对采集到的线索信息进行关键词提取和数据分析;S3.依据数据分析结果进行权重计算并生成选题列表;S4.将生成的选题列表推送至用户。本发明专利技术解决了人员收集信息不全的问题,全面覆盖线索采集来源;解决了人员以主观爱好挑选线索,不客观的问题,提供高质量的选题推荐;解决了需要耗费人员大量时间的问题,自动高效生成选题推荐;解决了报道选题不足的问题,随时都有大量的选题推荐,供人员使用。

【技术实现步骤摘要】

本专利技术涉及信息自动推送,具体为一种基于汇聚线索的新闻选题的推荐系统及方法


技术介绍

1、新闻选题是新闻制作中最基础、最关键的环节。在诸多的新闻事件中,采编人员要进行斟酌和考量,进行有效的选择、立题。好的新闻选题,要在符合客观真实性的前提条件下,给读者带来正能量,要在一定程度上反应社会发展的现实状态,要跟上时代发展的步伐。因此,需要采编人员具有较强的判断力,而正确的判断来自于平时的积累。

2、在缺乏新闻报道的时候,需要付出大量人力和资源来获取可供报道的选题。

3、互联网媒体宣传渠道蓬勃发展,媒体机构每天都需要报道更多的新闻信息,网络中充斥大量的新闻报道内容,媒体人员需要构思一个良好的选题,更是难上加难。


技术实现思路

1、为了解决上述问题,本专利技术提供一种基于汇聚线索的新闻选题的推荐系统,包括:线索采集模块、关键词提取模块、数据分析模块、选题生成模块、生成推送模块;所述线索采集模块用于收集整理全网的线索信息;所述关键词提取模块用于对收集到的线索信息进行关键字词的提取;所述数据分析模块用于依据提取出的关键字词进行分析;所述选题生成模块用于生成新闻选题推荐指数列表;所述生成推送模块用于将生成的新闻选题推荐指数列表推送至用户。

2、进一步地,所述线索采集模块设置有线索入库api服务及线索同步api服务;所述线索入库api服务用于实时接收三方线索数据并储存;所述线索同步api服务用于实时订阅互联网新闻推送、舆情数据推送,并进行线索同步。

>3、进一步地,所述数据分析模块中对数据的分析处理具体包括:数据去重、数据清洗、数据分类、热度分析、关注度分析、时效性分析、情绪分析、可信度分析。

4、进一步地,所述新闻选题推荐指数列表依据不同数据类型设置不同的推荐内容;所述推荐内容在同一数据类型下的个数存在阈值。

5、进一步地,还包括一个线索资源库,用于存储采集到或分析处理后的线索数据信息。

6、一种基于汇聚线索的新闻选题的推荐方法,包括以下步骤:s1.实时自动采集整理全网各个平台线索信息,并储存至线索资源库中;s2.对采集到的线索信息进行关键词提取和数据分析;s3.依据数据分析结果进行权重计算并生成选题列表;s4.将生成的选题列表推送至用户。

7、进一步地,所述s2步骤具体包括以下子步骤:s21.数据去重;s22.数据清洗;s23.关键词提取;s24.数据分类;s25.数据相关内容分析。

8、进一步地,所述s25步骤具体包括:热度分析:批量线索进行相同分类、相同人物、相同事件、相似地点和时间的统计,将离散的线索信息之间形成关联数据,并统计线索链接的相关路径数,加上线索去重的热度值,得到线索最终热度值;关注度分析:将相同分类、相同人物、相同事件、相似地点和时间的同组组线索,叠加每条线索的评论数,将评论数通过边际函数处理,获取评论数的关注度区间;时效性分析:将同组线索的最新报道时间减去最早报道时间,得到线索持续报道时间;情绪分析:分析线索内容和评论内容,进行舆情情绪模型分析,获取线索正面、中性、负面的情绪结果;可信度分析:根据线索的来源进行可信度评分。

9、进一步地,所述关注度分析中关注度区间具体包括以下五个区间:极少关注、少关注、普通关注、重要关注、爆红关注。

10、进一步地,所述时效性分析中线索持续报道时间越长则线索时效性值越大,具体划分为:短时效、中时效、长时效和超长时效。

11、本专利技术提供了一种基于汇聚线索的新闻选题的推荐系统及方法,具有以下有益效果:

12、(1)本专利技术汇聚完备的来源渠道的线索信息,对线索进行去重、清洗、nlp语义分析,获取线索的热度、关注度、时效性、情绪、可信度等多个维度的评分,综合判断后形成高效、有价值的选题推荐。

13、(2)本专利技术解决了人员收集信息不全的问题,全面覆盖线索采集来源;解决了人员以主观爱好挑选线索,不客观的问题,提供高质量的选题推荐;解决了需要耗费人员大量时间的问题,自动高效生成选题推荐;解决了报道选题不足的问题,随时都有大量的选题推荐,供人员使用。通过选题的推荐,大大的节省了记者和编辑在选题上花费的时间,提升新闻生产的效率。

本文档来自技高网...

【技术保护点】

1.一种基于汇聚线索的新闻选题的推荐系统,其特征在于,包括:线索采集模块、关键词提取模块、数据分析模块、选题生成模块、生成推送模块;

2.根据权利要求1所述的基于汇聚线索的新闻选题的推荐系统,其特征在于,所述线索采集模块设置有线索入库API服务及线索同步API服务;

3.根据权利要求1所述的基于汇聚线索的新闻选题的推荐系统,其特征在于,所述数据分析模块中对数据的分析处理具体包括:数据去重、数据清洗、数据分类、热度分析、关注度分析、时效性分析、情绪分析、可信度分析。

4.根据权利要求1所述的基于汇聚线索的新闻选题的推荐系统,其特征在于,所述新闻选题推荐指数列表依据不同数据类型设置不同的推荐内容;所述推荐内容在同一数据类型下的个数存在阈值。

5.根据权利要求1所述的基于汇聚线索的新闻选题的推荐系统,其特征在于,还包括一个线索资源库,用于存储采集到或分析处理后的线索数据信息。

6.一种基于汇聚线索的新闻选题的推荐方法,基于权利要求1-5任一项所述的基于汇聚线索的新闻选题的推荐系统,其特征在于,包括以下步骤:

7.根据权利要求6所述的基于汇聚线索的新闻选题的推荐方法,其特征在于,所述S2步骤具体包括以下子步骤:S21.数据去重;S22.数据清洗;S23.关键词提取;S24.数据分类;S25.数据相关内容分析。

8.根据权利要求7所述的基于汇聚线索的新闻选题的推荐方法,其特征在于,所述S25步骤具体包括:

9.根据权利要求8所述的基于汇聚线索的新闻选题的推荐方法,其特征在于,所述关注度分析中关注度区间具体包括以下五个区间:极少关注、少关注、普通关注、重要关注、爆红关注。

10.根据权利要求8所述的基于汇聚线索的新闻选题的推荐方法,其特征在于,所述时效性分析中线索持续报道时间越长则线索时效性值越大,具体划分为:短时效、中时效、长时效和超长时效。

...

【技术特征摘要】

1.一种基于汇聚线索的新闻选题的推荐系统,其特征在于,包括:线索采集模块、关键词提取模块、数据分析模块、选题生成模块、生成推送模块;

2.根据权利要求1所述的基于汇聚线索的新闻选题的推荐系统,其特征在于,所述线索采集模块设置有线索入库api服务及线索同步api服务;

3.根据权利要求1所述的基于汇聚线索的新闻选题的推荐系统,其特征在于,所述数据分析模块中对数据的分析处理具体包括:数据去重、数据清洗、数据分类、热度分析、关注度分析、时效性分析、情绪分析、可信度分析。

4.根据权利要求1所述的基于汇聚线索的新闻选题的推荐系统,其特征在于,所述新闻选题推荐指数列表依据不同数据类型设置不同的推荐内容;所述推荐内容在同一数据类型下的个数存在阈值。

5.根据权利要求1所述的基于汇聚线索的新闻选题的推荐系统,其特征在于,还包括一个线索资源库,用于存储采集到或分析处理后的线索数据信息。

【专利技术属性】
技术研发人员:徐国栋张宁徐辉世魏忠书李晓平杨奕涛薛文峰姜文革
申请(专利权)人:成都东方盛行电子有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1