一种基于深度学习的新闻数据处理系统及其处理方法技术方案

技术编号:22783834 阅读:42 留言:0更新日期:2019-12-11 04:15
为了解决现有技术中的问题,本公开提供了一种基于深度学习的新闻数据处理系统及其处理方法,通过深度学习,向用户推送新闻,提高新闻推送的准确率,提高用户体验。包括获取训练样本新闻的第一预设数量的待推送新闻关键词、用户偏好新闻的第一预设数量的用户偏好新闻关键词、用户反馈的用户满意度评分;训练BP神经网络模型;并根据BP神经网络模型向待推送用户推送待推送新闻;本公开基于深度学习,自动处理待推送新闻,将待推送新闻推送给所需的用户,实现新闻数据的有效利用,提高新闻推送效率,提高用户体验。

A news data processing system based on deep learning and its processing method

In order to solve the problems in the prior art, the present disclosure provides a news data processing system based on in-depth learning and a processing method thereof. Through in-depth learning, news is pushed to users, the accuracy of news push is improved, and the user experience is improved. Including obtaining the first preset number of news keywords to be pushed, the first preset number of user preferred news keywords, and the user satisfaction score of user feedback; training the BP neural network model; and pushing the news to be pushed to the users to be pushed according to the BP neural network model; the disclosure automatically processes the news to be pushed based on in-depth learning , push the news to be pushed to the required users, realize the effective use of news data, improve the efficiency of news push, and improve the user experience.

【技术实现步骤摘要】
一种基于深度学习的新闻数据处理系统及其处理方法
本公开涉及新闻数据处理领域,尤其涉及一种基于深度学习的新闻数据处理系统及其处理方法。
技术介绍
随着网络媒体和信息技术的发展,网络新闻已经不仅仅局限于从线下获取新闻内容,而是逐渐写错了适应社会需求的大众网络媒体,网络新闻报道借助互联网传播快捷的优势,需要在第一时间将接收到的最新的信息推送给用户,提高用户的体验;现有技术中,将新闻按种类进行分类,根据用户喜欢的种类进行新闻推送;其不足在于:如果按新闻种类进行新闻推送,被推送新闻正好是用户感兴趣的新闻概率较低;往往需要推送10篇以上新闻,甚至推送上百篇新闻后,才会出现一篇用户想要的新闻,新闻推送效果差,不利于用户体验。
技术实现思路
为了解决上述技术问题中的至少一个,本公开提供了一种基于深度学习的新闻数据处理系统及其处理方法,通过深度学习,向用户推送新闻,提高新闻推送的准确率,提高用户体验。本专利技术公开的一方面,一种基于深度学习的新闻数据处理方法,包括:获取训练样本新闻的第一预设数量的待推送新闻关键词;获取用户偏好新闻的第一预设数量的用户偏好新闻关键词;向用户推送待推送样本新闻,并获取用户反馈的用户满意度评分;基于待推送新闻关键词、用户偏好新闻关键词和用户反馈的满意度评分得到训练样本;建立BP神经网络模型,根据待推送新闻关键词、用户偏好新闻关键词、用户满意度评分对BP神经网络模型进行BP神经网络训练;获取待推送新闻的第一预设数量的待推送新闻关键词和待推送用户的第一预设数量的用户偏好新闻关键词,输入BP神经网络模型,得到用户满意度评分,并根据用户满意度评分确定是否向待推送用户推送待推送新闻。可选的,获取训练样本新闻的第一预设数量的待推送新闻关键词,包括:获取训练样本新闻的新闻关键词,判断训练样本新闻的新闻关键词的数量,若训练样本新闻的新闻关键词的数量多于第一预设数量,则随机获取其中第一预设数量的新闻关键词作为待推送新闻关键词;若训练样本新闻的新闻关键词的数量少于第一预设数量,则缺少的新闻关键词以预设关键词作为待推送新闻关键词。可选的,获取用户偏好新闻的第一预设数量的用户偏好新闻关键词,包括:获取用户偏好新闻的新闻关键词,判断用户偏好新闻的新闻关键词的数量,若用户偏好新闻的新闻关键词的数量多于第一预设数量,则随机获取其中第一预设数量的新闻关键词作为待推送新闻关键词;若用户偏好新闻的新闻关键词的数量少于第一预设数量,则缺少的新闻关键词以预设关键词作为用户偏好新闻关键词。可选的,获取待推送新闻的第一预设数量的待推送新闻关键词和待推送用户的第一预设数量的用户偏好新闻关键词,包括:获取待推送新闻的新闻关键词,判断待推送新闻的新闻关键词的数量,若待推送新闻的新闻关键词的数量多于第一预设数量,则随机获取其中第一预设数量的新闻关键词作为待推送新闻关键词;若训练样本新闻的新闻关键词的数量少于第一预设数量,则缺少的新闻关键词以预设关键词作为待推送新闻关键词;获取用户偏好新闻的新闻关键词,判断用户偏好新闻的新闻关键词的数量,若用户偏好新闻的新闻关键词的数量多于第一预设数量,则随机获取其中第一预设数量的新闻关键词作为待推送新闻关键词;若用户偏好新闻的新闻关键词的数量少于第一预设数量,则缺少的新闻关键词以预设关键词作为用户偏好新闻关键词。可选的,所述方法还包括:建立参照词典;在获取训练样本新闻的第一预设数量的待推送新闻关键词时,将待推送新闻关键词作为参照关键词,并录入参照词典中;在获取用户偏好新闻的第一预设数量的用户偏好新闻关键词时,将用户偏好新闻关键词作为参照关键词,并录入参照词典中;获取待推送新闻的第一预设数量的待推送新闻关键词和待推送用户的第一预设数量的用户偏好新闻关键词包括:获取待推送新闻中的字符,并将待推送新闻中的字符与参照词典中的参照关键词进行比对,若比对成功,则将比对成功的参照关键词作为待推送新闻的预备关键词;将待推送新闻的预备关键词与待推送新闻中的字符进行比对,判断预备关键词在待推送新闻出现的次数;获取预备关键词出现的次数最多的前第一预设数量个预备关键词作为待推送新闻关键词。可选的,所述方法还包括:建立参照词典;获取训练样本新闻的第一预设数量的待推送新闻关键词时,将待推送新闻关键词作为预备参照关键词,获取用户偏好新闻的第一预设数量的用户偏好新闻关键词时,将用户偏好新闻关键词作为预备参照关键词;判断参照词典中是否存在与该预备参照关键词一致的参照关键词,若存在与该预备参照关键词一致的参照关键词,则取消该预备参照关键词,若不存在与该预备参照关键词一致的参照关键词,则判断参照词典中是否存在与该预备参照关键词一致的预备参照关键词,若存在与该预备参照关键词一致的预备参照关键词,则增加参照词典中该参照关键词的权重,若不存在与该预备参照关键词一致的预备参照关键词,则在参照词典中增加该预备参照关键词,并初始化该预备参照关键词的权重;判断参照词典中预备参照关键词的权重是否大于预设权重,若大于预设权重,则将该预备参照关键词置为参照关键词获取待推送新闻的第一预设数量的待推送新闻关键词和待推送用户的第一预设数量的用户偏好新闻关键词包括:获取待推送新闻中的字符,并将待推送新闻中的字符与参照词典中的参照关键词进行比对,若比对成功,则将比对成功的参照关键词作为待推送新闻的预备关键词;将待推送新闻的预备关键词与待推送新闻中的字符进行比对,判断预备关键词在待推送新闻出现的次数Fi、在待推送新闻的标题中出现的次数Gi,以及预备关键词在待推送新闻中各段落出现的次数Eij;计算通过公式1计算各预备关键词的权重Di;公式1中,Di表示预备关键词i的权重,Fi表示预备关键词i在待推送新闻出现的次数,Gi表示预备关键词i在待推送新闻的标题中出现的次数Gi,Eij表示预备关键词i在待推送新闻中的第j段出现的次数,n表示待推送新闻的总段落数;按各预备关键词的权重Di的从大到小排序,以排在前第一预设数量的预备关键词作为待推送新闻关键词。本专利技术的另一方面,一种基于深度学习的新闻数据处理系统,包括:训练样本获取模块,用于获取训练样本新闻的第一预设数量的待推送新闻关键词;获取用户偏好新闻的第一预设数量的用户偏好新闻关键词;向用户推送待推送样本新闻,并获取用户反馈的用户满意度评分;基于待推送新闻关键词、用户偏好新闻关键词和用户反馈的满意度评分得到训练样本;训练模块:建立BP神经网络模型,根据待推送新闻关键词、用户偏好新闻关键词、用户满意度评分对BP神经网络模型进行BP神经网络训练;新闻推送模块:获取待推送新闻的第一预设数量的待推送新闻关键词和待推送用户的第一预设数量的用户偏好新闻关键词,输入BP神经网络模型,得到用户满意度评分,并根据用户满意度评分确定是否向待推送用户推送待推送新闻。可选的,获取训练样本新闻的第一预设数量的待推送新闻关键词,包括:获取训练样本新闻的新闻关键词,判断训练样本新闻本文档来自技高网...

【技术保护点】
1.一种基于深度学习的新闻数据处理方法,其特征在于,包括:/n获取训练样本新闻的第一预设数量的待推送新闻关键词;/n获取用户偏好新闻的第一预设数量的用户偏好新闻关键词;/n向用户推送待推送样本新闻,并获取用户反馈的用户满意度评分;/n基于待推送新闻关键词、用户偏好新闻关键词和用户反馈的满意度评分得到训练样本;/n建立BP神经网络模型,根据待推送新闻关键词、用户偏好新闻关键词、用户满意度评分对BP神经网络模型进行BP神经网络训练;/n获取待推送新闻的第一预设数量的待推送新闻关键词和待推送用户的第一预设数量的用户偏好新闻关键词,输入BP神经网络模型,得到用户满意度评分,并根据用户满意度评分确定是否向待推送用户推送待推送新闻。/n

【技术特征摘要】
1.一种基于深度学习的新闻数据处理方法,其特征在于,包括:
获取训练样本新闻的第一预设数量的待推送新闻关键词;
获取用户偏好新闻的第一预设数量的用户偏好新闻关键词;
向用户推送待推送样本新闻,并获取用户反馈的用户满意度评分;
基于待推送新闻关键词、用户偏好新闻关键词和用户反馈的满意度评分得到训练样本;
建立BP神经网络模型,根据待推送新闻关键词、用户偏好新闻关键词、用户满意度评分对BP神经网络模型进行BP神经网络训练;
获取待推送新闻的第一预设数量的待推送新闻关键词和待推送用户的第一预设数量的用户偏好新闻关键词,输入BP神经网络模型,得到用户满意度评分,并根据用户满意度评分确定是否向待推送用户推送待推送新闻。


2.如权利要求1所述的一种基于深度学习的新闻数据处理方法,其特征在于,获取训练样本新闻的第一预设数量的待推送新闻关键词,包括:获取训练样本新闻的新闻关键词,判断训练样本新闻的新闻关键词的数量,若训练样本新闻的新闻关键词的数量多于第一预设数量,则随机获取其中第一预设数量的新闻关键词作为待推送新闻关键词;若训练样本新闻的新闻关键词的数量少于第一预设数量,则缺少的新闻关键词以预设关键词作为待推送新闻关键词。


3.如权利要求1所述的一种基于深度学习的新闻数据处理方法,其特征在于,获取用户偏好新闻的第一预设数量的用户偏好新闻关键词,包括:获取用户偏好新闻的新闻关键词,判断用户偏好新闻的新闻关键词的数量,若用户偏好新闻的新闻关键词的数量多于第一预设数量,则随机获取其中第一预设数量的新闻关键词作为待推送新闻关键词;若用户偏好新闻的新闻关键词的数量少于第一预设数量,则缺少的新闻关键词以预设关键词作为用户偏好新闻关键词。


4.如权利要求1所述的一种基于深度学习的新闻数据处理方法,其特征在于,获取待推送新闻的第一预设数量的待推送新闻关键词和待推送用户的第一预设数量的用户偏好新闻关键词,包括:获取待推送新闻的新闻关键词,判断待推送新闻的新闻关键词的数量,若待推送新闻的新闻关键词的数量多于第一预设数量,则随机获取其中第一预设数量的新闻关键词作为待推送新闻关键词;若训练样本新闻的新闻关键词的数量少于第一预设数量,则缺少的新闻关键词以预设关键词作为待推送新闻关键词;获取用户偏好新闻的新闻关键词,判断用户偏好新闻的新闻关键词的数量,若用户偏好新闻的新闻关键词的数量多于第一预设数量,则随机获取其中第一预设数量的新闻关键词作为待推送新闻关键词;若用户偏好新闻的新闻关键词的数量少于第一预设数量,则缺少的新闻关键词以预设关键词作为用户偏好新闻关键词。


5.如权利要求1所述的一种基于深度学习的新闻数据处理方法,其特征在于,所述方法还包括:
建立参照词典;
在获取训练样本新闻的第一预设数量的待推送新闻关键词时,将待推送新闻关键词作为参照关键词,并录入参照词典中;
在获取用户偏好新闻的第一预设数量的用户偏好新闻关键词时,将用户偏好新闻关键词作为参照关键词,并录入参照词典中;
获取待推送新闻的第一预设数量的待推送新闻关键词和待推送用户的第一预设数量的用户偏好新闻关键词包括:获取待推送新闻中的字符,并将待推送新闻中的字符与参照词典中的参照关键词进行比对,若比对成功,则将比对成功的参照关键词作为待推送新闻的预备关键词;将待推送新闻的预备关键词与待推送新闻中的字符进行比对,判断预备关键词在待推送新闻出现的次数;获取预备关键词出现的次数最多的前第一预设数量个预备关键词作为待推送新闻关键词。


6.如权利要求1所述的一种基于深度学习的新闻数据处理方法,其特征在于,所述方法还包括:
建立参照词典;
获取训练样本新闻的第一预设数量的待推送新闻关键词时,将待推送新闻关键词作为预备参照关键词,获取用户偏好新闻的第一预设数量的用户偏好新闻关键词时,将用户偏好新闻关键词作为预备参照关键词;
判断参照词典中是否存在与该预备参照关键词一致的参照关键词,若存在与该预备参照关键词一致的参照关键词,则取消该预备参照关键词,若不存在与该预备参照关键词一致的参照关键词,则判断参照词典中是否存在与该预备参照关键词一致的预备参照关键词,若存在与该预备参照关键词一致的预备参照关键词,则增加参照词典中该参照关键词的权重,若不存在与该预...

【专利技术属性】
技术研发人员:郑骥祁海峰
申请(专利权)人:北京人民在线网络有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1