一种基于大数据处理的新闻传播方法技术

技术编号：38139430 阅读：27 留言：0更新日期：2023-07-08 09:53

本发明专利技术提供一种基于大数据处理的新闻传播方法，涉及新闻传播技术领域，具体包括以下步骤：S1.数据信息获取，通过使用爬虫程序，模拟浏览器发送请求（获取网页代码）、提取有用的关键信息数据并存放于数据库或文件中，并根据新闻信息标签对其进行分类归纳，实现请求通过在新闻传播平台利用cookie实现模拟登录。该方法在请求时通过传入关键词和时间，排序方法要按照时间排序，穿入关键词包括积极词，中性词和消极词，并利用random模块随机生成数字下标，进行随机抽取关键词搜索，以求得到的数据能代表当天的用户主流心态，并定时定量地针对特定群体投放相对喜好的新闻内容，易于抓住接受群体注意力，有利于提升新闻传播的效率。有利于提升新闻传播的效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于大数据处理的新闻传播方法

[0001]本专利技术涉及新闻传播
，具体为一种基于大数据处理的新闻传播方法。

技术介绍

[0002]随互现在联网技术的快速发展与广泛应用，基于互联网的新闻传播方式已经对人们的生活产生日益显著的影响，各新闻网站及软件平台渐渐变成人们获取信息与分享观点的核心平台，为了提高新闻信息传播效率，提升用户的信息接收体验，基于大数据处理采集的用户数据流量，充分考虑到不同用户群体不同时间段的接收喜好，根据不同时间不同群体不同喜好进行对应新闻信息定制，以此不断提升大数据新闻传播效率和宣扬效果。
[0003]随着现代社会信息跟更迭速度的日益加快，现代新闻的传播及时性和有效性对于基于大数据处理的传播方式提出了更高的要求，因此，如何提供一种基于大数据处理的新闻传播方法在当前的环境中显得尤为重要。

技术实现思路

[0004]（一）解决的技术问题针对现有技术的不足，本专利技术提供了一种基于大数据处理的新闻传播方法，解决了基于大数据处理的偏好内容新闻主动推送传播效率进一步提升的问题。
[0005]（二）技术方案为实现以上目的，本专利技术通过以下技术方案予以实现：一种基于大数据处理的新闻传播方法，具体包括以下步骤：S1.数据信息获取通过使用爬虫程序，模拟浏览器发送请求(获取网页代码)、提取有用的关键信息数据并存放于数据库或文件中，并根据新闻信息标签对其进行分类归纳；S2.数据预处理使用 jieba 库实现对S1采集的新闻信息进行分词，将内容语句精确切分，对切分词语进行清洗，去...

【技术保护点】

【技术特征摘要】
1.一种基于大数据处理的新闻传播方法，其特征在于，具体包括以下步骤：S1.数据信息获取通过使用爬虫程序，模拟浏览器发送请求(获取网页代码)、提取有用的关键信息数据并存放于数据库或文件中，并根据新闻信息标签对其进行分类归纳；S2.数据预处理使用 jieba 库实现对S1采集的新闻信息进行分词，将内容语句精确切分，对切分词语进行清洗，去除其中无用词语，即删除停用词，统计清洗后剩余词语在新闻内容中出现的频率，即统计词频；S3.获得情感词组合使用 SnowNLP 库，判断S2新闻文本词语的情感，得出的数值是该文本蕴含情感的概率；S4.计算句子情感通过S3得出新闻文本独立句例蕴含情感的概率；S5.计算新闻情感根据S4获取新闻文本各独立句例蕴含情感，根据多句例综合比对确定新闻文本综合情感；S6.限定投送范围人群根据获取后台用户浏览数据，根据偏好类型对多数用户浏览偏好添加标签，限定划分符合用户浏览偏好的范围人群账户；S7.针对推送根据S6限定投送用户人群范围，增大针对性相关新闻内容投送。2.根据权利要求1所述的一种基于大数据处理的新闻传播方法，其特征在于：S1在平台网站输入提前注册好的账号和密码，设置好需要爬虫的时间范围，启动爬虫程序，输出结果，并将结果输出为 Excel 表格文件。3.根据权...

【专利技术属性】
技术研发人员：王微，王越，曹聪颖，薛冯铭，张佳旭，
申请(专利权)人：河北环境工程学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人