基于人工智能的新闻推荐方法及装置制造方法及图纸

技术编号:14756431 阅读:33 留言:0更新日期:2017-03-02 23:04
本发明专利技术实施例公开了一种基于人工智能的新闻推荐方法及装置,所述方法包括:获取待推荐新闻的第一新闻特征和已浏览新闻的第二新闻特征;根据所述第一新闻特征和所述第二新闻特征确定所述待推荐新闻和所述已浏览新闻是否为雷同新闻;若为雷同新闻,则拒绝推荐所述待推荐新闻;若为非雷同新闻,则推荐所述待推荐新闻。本发明专利技术实施例通过确定待推荐新闻和所述已浏览新闻是否为雷同新闻,仅将非雷同新闻推荐给用户,能够有效避免重复向用户推荐雷同新闻,以提高新闻推荐效率。

【技术实现步骤摘要】

本专利技术实施例涉及信息处理
,尤其涉及一种基于人工智能的新闻推荐方法及装置
技术介绍
人工智能(ArtificialIntelligence,AI),它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。在信息快速发展的时代,随着互联网技术发展,越来越多的新闻资讯进入大众视野,随之新闻相关产品也出现在人们的日常生活中,与人们日常生活息息相关。例如,常见的新闻相关产品有“今日头条”、“百度好看”、“手机百度资讯”等。它们主要是从各类新闻网站挖掘新闻,根据不同用户的兴趣和新闻本身热度、关注度等情况,将新闻推荐给用户。由于新闻来源广泛,不可避免有雷同新闻的情况。比如,A网站原创一条新闻,B网络转载,C网站略加修改之后转载,D网站基于相同新闻事件,又原创一条新闻。四则新闻其实是同一事件,新闻推荐产品都会挖掘出来,并不知道其中差别,会都推荐给用户,但是用户往往看过一条新闻之后已经知道新闻事件,没有必要再看到同样的新闻。尤其对于那些标题有差别的雷同新闻,用户往往看完新闻之后才知道是雷同新闻,造成用户时间浪费。
技术实现思路
本专利技术实施例提供一种基于人工智能的新闻推荐方法及装置,能够避免重复向用户推荐雷同新闻,以提高新闻推荐效率。第一方面,本专利技术实施例提供了一种基于人工智能的新闻推荐方法,包括:获取待推荐新闻的第一新闻特征和已浏览新闻的第二新闻特征;根据所述第一新闻特征和所述第二新闻特征确定所述待推荐新闻和所述已浏览新闻是否为雷同新闻;若为雷同新闻,则拒绝推荐所述待推荐新闻;若为非雷同新闻,则推荐所述待推荐新闻。第二方面,本专利技术实施例还提供了一种基于人工智能的新闻推荐装置,包括:特征获取模块,用于获取待推荐新闻的第一新闻特征和已浏览新闻的第二新闻特征;雷同确定模块,用于根据所述第一新闻特征和所述第二新闻特征确定所述待推荐新闻和所述已浏览新闻是否为雷同新闻;新闻推荐模块,用于若为雷同新闻,则拒绝推荐所述待推荐新闻;若为非雷同新闻,则推荐所述待推荐新闻。本专利技术实施例提供了一种基于人工智能的新闻推荐的方法,通过确定待推荐新闻和所述已浏览新闻是否为雷同新闻,仅将非雷同新闻推荐给用户,能够有效避免重复向用户推荐雷同新闻,以提高新闻推荐效率。附图说明图1是本专利技术实施例一中的一种基于人工智能的新闻推荐方法的流程图;图2是本专利技术实施例二中的一种基于人工智能的新闻推荐方法的流程图;图3是本专利技术实施例三中的一种基于人工智能的新闻推荐方法的流程图;图4是本专利技术实施例四中的一种基于人工智能的新闻推荐方法的流程图;图5是本专利技术实施例五中的一种基于人工智能的新闻推荐方法的流程图;图6是本专利技术实施例六中的一种基于人工智能的新闻推荐装置的结构图;图7是本专利技术实施例七中的一种基于人工智能的新闻推荐装置的结构图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一提供的一种基于人工智能的新闻推荐方法的流程图,本实施例可适用于各种新闻推荐的情况,该方法可以由本专利技术实施例提供的新闻推荐装置来执行,该装置可采用软件和/或硬件的方式实现,该装置可集成在任何提供新闻推荐功能的设备中,例如典型的是用户终端设备,可以是电脑,也可以是移动终端(例如手机)、平板电脑等,如图1所示,具体包括:S110、获取待推荐新闻的第一新闻特征和已浏览新闻的第二新闻特征。其中,新闻是指新近发生的事实的报道,是消息、通讯、特写、速写、报告文学等多种新闻文体的总称,狭义的新闻专指消息。待推荐新闻的第一新闻特征可以是待推荐新闻的标题、正文、图片、视频等,能够详细报道该待推荐新闻的一些关键性信息;同样,已浏览新闻的第二新闻特征也可以是已浏览新闻的标题、正文、图片、视频等,能够详细报道该新闻的一些关键性信息。当获取待推荐新闻的第一新闻特征为推荐新闻的标题时,那么获取已浏览新闻的第二新闻特征也为已浏览新闻的标题;当获取待推荐新闻的第一新闻特征为推荐新闻的正文内容时,那么获取已浏览新闻的第二新闻特征也为已浏览新闻的正文内容;当获取待推荐新闻的第一新闻特征为推荐新闻的视频时,那么获取已浏览新闻的第二新闻特征也为已浏览新闻的视频。获取上述新闻特征的执行主体可以为网页中的搜索引擎,也可以为移动终端中包含的新闻类应用软件。S120、根据所述第一新闻特征和所述第二新闻特征确定所述待推荐新闻和所述已浏览新闻是否为雷同新闻。其中,雷同新闻可以是新闻内容完全一样的新闻,也可以是关于同一新闻事件的不同报道,虽然文字表达有所不同,但是实质内容一样。所述第一新闻特征和所述第二新闻特征可以为标题,也可以为正文内容,还可以为图片或者视频等。根据第一新闻特征和所述第二新闻特征确定所述待推荐新闻和所述已浏览新闻是否为雷同新闻。判断是否为雷同新闻的方法可以为MinHash算法、Shingling算法、SimHash去重算法或者构造训练模型(如神经网络模型)等。具体的,若确定所述待推荐新闻和所述已浏览新闻为雷同新闻,则执行步骤S130,若确定所述待推荐新闻和所述已浏览新闻为非雷同新闻,则执行步骤S140。S130、拒绝推荐所述待推荐新闻。S140、推荐所述待推荐新闻。具体的,如果待推荐新闻和已浏览过的新闻为雷同新闻,说明待推荐新闻和已浏览过的新闻为重复性新闻或者类似新闻,那么应该拒绝该条推荐新闻;但是如果待推荐新闻和已浏览过的新闻为非雷同新闻,说明待推荐新闻和已浏览过的新闻重复性不高,那么可以推荐所述待推荐新闻。例如,用户A打开手机中的新闻类应用软件浏览新闻,新闻类应用软件的首页会推荐最新、最热、跟用户A生活息息相关或者跟用户A兴趣爱好有关的新闻内容供用户A选择观看。当用户A点开了“2016年国庆节放假安排”的新闻内容时,那么“2016年国庆节放假安排”的标题作为已浏览新闻的第二特征信息。当待推荐新闻为“2016年国庆节放假几天?”时,获取待推荐新闻的标题作为第一新闻特征。由于两个标题雷同,确定待推荐新闻和已浏览新闻为雷同新闻,因此新闻类应用软件不会再为用户A推荐“2016年国庆节放假几天?”的新闻。由于互联网的崛起给报纸、电视以及杂志等传统媒体带来了巨大挑战,互联网的新闻是突破传统的新闻概念,在视、感方面给用户全新的体验。同一条新闻,不仅有文字和图片,还有视频、音频和网络评论等,呈现方式多种多样。互联网新闻满足了用户在信息时代对信息的需求,但也使得用户在面对大量信息时无法从中获得对自己真正有用的那部分信息,对信息的使用效率反而降低了,而通常解决这个问题最常规的办法是新闻推荐。但是互联网上存在大量的近似重复或完全重复的新闻,因此,在用户已经浏览过一个新闻后,不管是一天前浏览过的新闻还是一个月前浏览过的新闻,推荐新闻时都有必要对获取推荐的新闻进行检测,获取待推荐新闻的第一新闻特征和已浏览新闻的第二新闻特征进行比本文档来自技高网...
基于人工智能的新闻推荐方法及装置

【技术保护点】
一种基于人工智能的新闻推荐方法,其特征在于,包括:获取待推荐新闻的第一新闻特征和已浏览新闻的第二新闻特征;根据所述第一新闻特征和所述第二新闻特征确定所述待推荐新闻和所述已浏览新闻是否为雷同新闻;若为雷同新闻,则拒绝推荐所述待推荐新闻;若为非雷同新闻,则推荐所述待推荐新闻。

【技术特征摘要】
1.一种基于人工智能的新闻推荐方法,其特征在于,包括:获取待推荐新闻的第一新闻特征和已浏览新闻的第二新闻特征;根据所述第一新闻特征和所述第二新闻特征确定所述待推荐新闻和所述已浏览新闻是否为雷同新闻;若为雷同新闻,则拒绝推荐所述待推荐新闻;若为非雷同新闻,则推荐所述待推荐新闻。2.根据权利要求1所述的方法,其特征在于,根据所述第一新闻特征和所述第二新闻特征确定所述待推荐新闻和所述已浏览新闻是否为雷同新闻包括:将所述第一新闻特征和所述第二新闻特征输入神经网络模型中进行学习;根据学习结果确定所述待推荐新闻和所述已浏览新闻是否为雷同新闻。3.根据权利要求2所述的方法,其特征在于,根据学习结果确定所述待推荐新闻和所述已浏览新闻是否为雷同新闻包括:若所述学习结果满足预设条件,则确定所述待推荐新闻和已浏览新闻为雷同新闻;若所述学习结果不满足预设条件,则确定所述待推荐新闻和已浏览新闻为非雷同新闻。4.根据权利要求3所述的方法,其特征在于,所述预设条件包含以下至少一种:所述神经网络模型输出的分值高于预设分值、标题一致、正文相似度高于预设阈值和来源相同。5.根据权利要求2所述的方法,其特征在于,将所述第一新闻特征和所述第二新闻特征输入神经网络模型中进行学习包括:确定判定所述待推荐新闻和所述已浏览新闻是否为雷同新闻所采用的判定雷同标准;若所述判定雷同标准为第一类雷同标准,则采用神经网络模型中的第一类雷同训练子模型对所述第一新闻特征和所述第二新闻特征进行学习;和/或,若所述判定雷同标准为第二类雷同标准,则采用神经网络模型中的第二类雷同训练子模型对所述第一新闻特征和所述第二新闻特征进行学习。6.根据权利要求5所述的方法,其特征在于,所述第一类雷同标准为同一新闻事件和同一新闻来源,被其它新闻网站进行如下任意一种操作:转载、盗版和改编;和/或,所述第二类雷同标准为同一新闻事件,被不同媒体进行如下任意一种操作:报道、原创和附加自己媒体的评论。7.根据权利要求5或6所述的方法,其特征在于,若为雷同新闻,则拒绝推荐所述待推荐新闻包括:若根据所述第一类雷同标准确定所述待推荐新闻和所述已浏览新闻为雷同新闻,则直接拒绝推荐所述待推荐新闻;或者,若根据所述第二类雷同标准确定所述待推荐新闻和所述已浏览新闻为雷同新闻,且检测到推荐设置项为拒绝推荐,则拒绝推荐所述待推荐新闻。8.根据权利要求2-6任一项所述的方法,其特征在于,还包括:获取已知雷同新闻和/或已知非雷同新闻;根据所述已知雷同新闻的第三新闻特征构造已知雷同新闻的第一训练样本,和/或根据所述已知非雷同新闻的第四新闻特征构造已知非雷同新闻的第二训练样本;利用神经网络对所述第一训练样本和/或所述第二训练样本进行训练,得到所述神经网络模型。9.根据权利要求8所述的方法,其特征在于,所述神经网络模型的输出结果满足以下条件:所述待推荐新闻和所述已浏览新闻为雷同新闻的分值高于为非雷同新闻的分值。10.根据权利要求8或9所述的方法,其特征在于,获取已知雷同新闻和/或已知非雷同新闻包括:采用爬虫技术挖掘存在转载、盗版和改编中的至少一种关系的新闻聚对,将所述新闻聚对作为第一已知雷同新闻;将不存在转载、盗版和改编中的至少一种关系的新闻作为第一已知非雷同新闻;相应的,利用神经网络对所述第一训练样本和/或所述第二训练样本进行训练,得到所述神经网络模型包括:利用神经网络对所述第一已知雷同新闻的训练样本和/或所述第一已知非雷同新闻的训练样本进行训练,得到所述神经网络模型中的第一雷同训练子模型;和/或,采用爬虫技术挖掘新闻标题、内容和发布时间匹配程度超过预设程度的新闻组合,将所述新闻组合作为第二已知雷同新闻;将所述匹配程度未过预设程度的新闻作为第二已知非雷同新闻;相应的,利用神经网络对所述第一训练样本和/或所述第二训练样本进行训练,得到所述神经网络模型包括:利用神经网络对所述第二已知雷同新闻的训练样本和/或所述第二已知非雷同新闻的训练样本进行训...

【专利技术属性】
技术研发人员:田植良
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1