文本资讯的推荐方法及系统技术方案

技术编号:14158911 阅读:78 留言:0更新日期:2016-12-12 01:40
本发明专利技术提供一种文本资讯的推荐方法,包括:建立资讯推荐池;获取需要推荐资讯文章的文本内容;将需要推荐资讯的文章切分为多个词;根据LDA模型库中词的多维topic分布预测需要推荐资讯文章的多维topic分布;计算需要推荐资讯的文章与资讯推荐池中文章的资讯相关性;根据资讯相关性的计算结果对资讯推荐池中的相关资讯进行排序;根据排序结果输出推荐资讯。该方法可以解决资讯推荐时相关资讯的语义歧义与语义相关的问题,并考虑了资讯热度和实时性,提升了用户点击率。本发明专利技术还提供一种实现上述文本资讯的推荐方法的系统。

【技术实现步骤摘要】

本专利技术涉及计算机
,尤其涉及一种文本资讯的推荐方法及系统
技术介绍
随着互联网的迅猛发展,网络资讯的数量不断增长。这给网络用户获取资讯带来了便利,同时也造成了信息过载的问题。如何在海量信息中快速有效地查找并定位到需要的信息成为当前互联网发展中的突出问题,也是网络信息检索研究的热点。为解决上述问题,很多新闻网站通过诸如“相关新闻”、“相关阅读”、“更多新闻”、“相关推荐”、以及“延伸阅读”之类的资讯推荐方式向用户推荐与用户终端上当前显示的新闻相关的其他资讯,作为扩展阅读。目前对于资讯的推荐大多是基于文本TAG的推荐方式,通过提取资讯文本的关键词并按照关键词作为索引来聚合文章,进行资讯推荐时根据关键词索引对应的文章,这种推荐方式存在如下问题:1.无法解决相关资讯的语义歧义与语义相关问题。例如,“富士苹果真好,赶快买”和“苹果iphone6真好,赶快买”,两条资讯虽然在词意上存在相关性,但其语义却并不相关,再例如“如果时间回到2006年,马云和杨致远的手还会握在一起吗”和“阿里巴巴集团和雅虎就股权回购一事签署了最终协议”,两条资讯虽然在词意上并不相关,但其语义却存在相关性。2.未能考虑资讯热度和实时性,用户体验差。例如,“84岁默多克与59岁前超模订婚”与“普莉希拉效应VS邓文迪法则,一定要有真正的邂逅”以及“资产保全Ι鼎元传承FO揭秘:邓文迪也扳不倒的家族信托”,而后两条资讯在当前情况下明显与“默多克”不相关。
技术实现思路
有鉴于此,本专利技术提供一种文本资讯的推荐方法及系统,该方法和系统可以解决资讯推荐时相关资讯的语义歧义与语义相关的问题,并考虑了资讯热度和实时性,提升了用户点击率。本专利技术实施例提供的一种文本资讯的推荐方法,包括:建立资讯推荐池;获取需要推荐资讯文章的文本内容;将需要推荐资讯的文章切分为多个词;根据LDA模型库中词的多维topic分布预测需要推荐资讯文章的多维topic分布;计算需要推荐资讯的文章与资讯推荐池中文章的资讯相关性;根据资讯相关性的计算结果对资讯推荐池中的相关资讯进行排序;根据排序结果输出推荐资讯。本专利技术实施例提供的一种文本资讯的推荐系统,包括:资讯推荐池,其内存储有多篇资讯文本;资讯文本获取模块,用于获取需要推荐资讯文章的文本内容;分词工具,用于将需要推荐资讯的文章切分为多个词;LDA模型库,其内存储有多个词的多维topic分布;LDA预测模块,用于根据文章中词的多维topic分布预测文章的多维topic分布;资讯相关性计算模块,用于根据文章的多维topic分布计算需要推荐资讯的文章与资讯推荐池中文章的资讯相关性;资讯排序模块,用于根据资讯相关性的计算结果对资讯推荐池中的相关资讯进行排序;结果输出模块,用于根据排序结果输出推荐资讯。本专利技术实施例提供的文本资讯的推荐方法及系统,在计算需要推荐资讯的文章与资讯推荐池中文章的资讯相关性时不仅针对文章中的所有关键词,通篇考虑了文章的上下文语境来计算,解决了文章的语义歧义和语义资讯相关性问题,还考虑了资讯热度和实时性对资讯相关性的影响,提升了用户体验,大幅提升了资讯PV转化率,使资讯PV转化率提升了将近200%。为让本专利技术的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。附图说明图1为本专利技术实施例提供的文本资讯的推荐方法及系统的应用环境图。图2为图1中的终端设备的一种结构框图。图3为图1中的服务器的一种结构框图。图4为本专利技术第一实施例提供的文本资讯的推荐方法的流程示意图。图5为图4中步骤S10的主要步骤的流程示意图。图6为图4中步骤S14的主要步骤的流程示意图。图7为本专利技术第二实施例提供的文本资讯的推荐方法的流程示意图。具体实施方式为更进一步阐述本专利技术为实现预定专利技术目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本专利技术的具体实施方式、结构、特征及其功效,详细说明如后。请参考图1,图1为本专利技术实施例提供的文本资讯的推荐方法及系统的应用环境图。如图1所示,安装有浏览器客户端的终端设备100与服务器200通过网络连接,服务器200连接数据库300,该数据库300用于存储各种数据,如本专利技术中的资讯推荐池、LDA模型等,该数据库300可以独立于该服务器200,也可以设置在该服务器200之内。终端设备100可以是各种电子装置,如个人电脑、笔记本电脑、平板电脑、手机等。网络可为但不限于互联网、企业内部网、局域网、移动通信网及其组合。请参考图2,图2示出了终端设备100的一个实施例的结构框图。如图2所示,终端设备100包括存储器102、存储控制器104,一个或多个(图中仅示出一个)处理器106、外设接口108、射频模块110、定位模块112、摄像模块114、音频模块116、显示模块118以及按键模块120。这些组件通过一条或多条通讯总线/信号线122相互通讯。可以理解,图2所示的结构仅为示意,终端设备100还可包括比图2中所示更多或者更少的组件,或者具有与图2所示不同的配置。图2中所示的各组件可以采用硬件、软件或其组合实现。其中,存储器102可用于存储软件程序以及模块,如本专利技术实施例中的文本资讯的推荐方法及系统对应的程序指令/模块,处理器106通过运行存储在存储器102内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现本专利技术实施例中的文本资讯的推荐方法。存储器102可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储系统、闪存、或者其他非易失性固态存储器。在一些实例中,存储器102可进一步包括相对于处理器106远程设置的存储器,这些远程存储器可以通过网络连接至终端设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。处理器106以及其他可能的组件对存储器102的访问可在存储控制器104的控制下进行。外设接口108将各种输入/输入装置耦合至处理器106以及存储器102。处理器106运行存储器102内的各种软件、指令以执行终端设备的各种功能以及进行数据处理。在一些实施例中,外设接口108,处理器106以及存储控制器104可以在单个芯片中实现,在其他一些实例中,也可以分别由独立的芯片实现。射频模块110用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯。射频模块110可包括各种现有的用于执行这些功能的电路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。射频模块110可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。上述的无线网络可以使用各种通信标准、协议及技术,包括但并不限于全球移动通信系统(Global System for Mobile Communication,GSM)、增强型移动通信技术(Enhanced Data GSM Environment,EDGE),宽带码分多址技术(wideband code division multiple access,W-CDMA),码分多址技术(Code division access,CDMA)本文档来自技高网...
文本资讯的推荐方法及系统

【技术保护点】
一种文本资讯的推荐方法,其特征在于,所述方法包括:建立资讯推荐池;获取需要推荐资讯文章的文本内容;将需要推荐资讯的文章切分为多个词;根据LDA模型库中词的多维topic分布预测需要推荐资讯文章的多维topic分布;计算需要推荐资讯的文章与资讯推荐池中文章的资讯相关性;根据资讯相关性的计算结果对资讯推荐池中的相关资讯进行排序;根据排序结果输出推荐资讯。

【技术特征摘要】
1.一种文本资讯的推荐方法,其特征在于,所述方法包括:建立资讯推荐池;获取需要推荐资讯文章的文本内容;将需要推荐资讯的文章切分为多个词;根据LDA模型库中词的多维topic分布预测需要推荐资讯文章的多维topic分布;计算需要推荐资讯的文章与资讯推荐池中文章的资讯相关性;根据资讯相关性的计算结果对资讯推荐池中的相关资讯进行排序;根据排序结果输出推荐资讯。2.根据权利要求1所述的文本资讯的推荐方法,其特征在于,需要推荐资讯的文章与资讯推荐池中文章的资讯相关性以需要推荐资讯的文章与资讯推荐池中的文章在多维topic空间中的余弦距离、资讯推荐池中文章的PV加权和过期惩罚来表示。3.根据权利要求1所述的文本资讯的推荐方法,其特征在于,所述文本资讯的推荐方法还包括:获取资讯推荐池中文章的PV热度;以及获取资讯推荐池中文章的发布时间;所述计算需要推荐资讯的文章与资讯推荐池中文章的资讯相关性的步骤指根据需要推荐资讯的文章与资讯推荐池中文章的多维topic分布和资讯推荐池中文章的PV热度和发布时间计算需要推荐资讯的文章与资讯推荐池中文章的资讯相关性。4.根据权利要求1所述的文本资讯的推荐方法,其特征在于,计算需要推荐资讯的文章与资讯推荐池中文章的资讯相关性时采用的公式为: S ( x , x ′ , v , t ) = Σ k = 1 n x k x ′ k Σ k = 1 n x k 2 Σ k = 1 n x ′ k 2 + λ log v ( t + b ) γ , ]]>式中x为需要推荐资讯文章的LDA向量,x’为资讯推荐池中文章的LDA向量,k为文章中LDA向量的个数,v为资讯推荐池中资讯的pv热度,t为资讯过期的时间,b为资讯过期时间的偏置平滑,γ为资讯过期缩放调节系数,λ为回归系数。5.根据权利要求4所述的文本资讯的推荐方法,其特征在于,计算需要推荐资讯的文章与资讯推荐池中文章的资讯相关性时采用的公式中λ的取值为0.25,γ的取值为1.5。6.根据权利要求1所述的文本资讯的推荐方法,其特征在于,所述建立资讯推荐池的步骤包括:收集资讯文本,获取资讯文本的内容;将收集的资讯文本切分为多个词;根据LDA模型库中词的多维topic分布预测资讯文本的多维topic分布;以及将收集的资讯文本按照一定的次序放入资讯推荐池。7.一种文本资讯的推荐系统,其特征在于,其包括:资讯推荐池,其内存储有多篇资讯文本;资讯文本获取模块,用于...

【专利技术属性】
技术研发人员:史继群
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1