问题推荐方法、装置及系统制造方法及图纸

技术编号:11369905 阅读:57 留言:0更新日期:2015-04-30 01:10
本发明专利技术涉及一种问题推荐方法、装置及系统,方法包括:服务器根据用户的短期兴趣、长期兴趣以及人群兴趣构建用户的兴趣向量,用户的兴趣向量中包括多个兴趣项;根据多个兴趣项由待解决问题集合中获取候选推荐问题;根据点击率模型预估所述用户回答候选推荐问题的概率,并根据预估的概率选取待推荐问题;向客户端推荐所述待推荐问题。本发明专利技术可以解决现有技术中推荐兴趣滞后的问题,以及推荐结果不全面、结果单一的现象,也可以提高互动问答平台的问题回答率。

【技术实现步骤摘要】
问题推荐方法、装置及系统
本专利技术涉及计算机互联网
,特别是涉及一种问题推荐方法、装置及系统。
技术介绍
现在越来越多的互动问答社区为广大用户提供了问答互动平台。其特点是:一些用户作为提问者在社区中提出问题,另一些有能力作答的用户以回答者的身份发现并回答这些问题,解决提问者的疑问;而问题和答案会在平台中沉淀下来,形成知识库,可以为后来具有相同问题的“提问者”直接提供解答。在互动问答社区中,每天会有数以十万级的问题被提出,为了能够让这些问题得到快速有效的回答,就需要一种途径让回答者们能及时地发现符合自己兴趣和能力的问题。问题推荐系统的目的就是向有能力的用户推荐符合其兴趣和能力的问题。现有的问题推荐方法主要有两类:一类是基于用户兴趣匹配的问题推荐方法,另一类是基于点击(CTR,ClickThroughRate)预估的问题推荐方法。如图1所示,基于用户兴趣匹配的问题推荐,利用离线挖掘,通过用户已有的回答来挖掘用户的兴趣;通过兴趣匹配,为用户推荐匹配其兴趣的待解决问题。如图2所示,基于点击预估的问题推荐,通过历史的曝光日志(记录了哪些问题展示给了哪些用户)与回答日志(记录了哪些问题被哪些用户回答过),离线训练出点击预测模型;在推荐中,利用该模型预测一个待解决问题展示给一个特定用户后被其回答的概率,根据回答概率度对所有待解决问题排序,取TopN作为推荐结果进行展示。但是,离线挖掘用户兴趣滞后于用户的兴趣变化,推荐结果中无法体现用户的近期行为所反应出来的兴趣迁移。通过离线计算,从用户的历史回答记录中挖掘出来的兴趣是用户的长期兴趣,这种长期兴趣相对稳定,随时间变化慢,反映用户在较长一段时间内的行为所体现出的兴趣点的累积。但是用户的兴趣是会随着时间迁移(发生变化)的,并且越近的行为对于体现用户兴趣变化的作用越大。传统的离线计算的方式往往是通过定时计算来更新用户兴趣模型,无法做到实时捕捉用户兴趣变化,无法挖掘到用户的近期行为而产生的短期兴趣,从而也就无法在推荐结果中迅速体现。在基于点击预估的问题推荐系统中,由于待解决问题的数量比较多,不可能针对所有的问题进行计算,因此也会采用用户兴趣匹配的方法,首先对待解决问题进行初步的筛选,仅提取出与用户兴趣相匹配的若干问题作为候选,然后再进行回答概率的预估计算。用户兴趣是依靠对其行为数据的挖掘得到的,无论是基于用户兴趣匹配还是基于点击预估的问题推荐,都需要依靠用户兴趣进行问题和用户兴趣的匹配计算。但是对于一些不活跃用户而言,由于其行为数据非常少(有些甚至没有),那么这部分用户就无法通过挖掘的手段来获取其用户兴趣,也就无法匹配到兴趣相关的问题;此外,有很大一部分的用户即使能够提取到兴趣,也会产生兴趣稀疏的现象,这些用户的兴趣点过于集中,或者兴趣点很偏僻,很少有相关问题切中该兴趣点,也会造成推荐结果不全面、结果单一的现象。
技术实现思路
本专利技术的目的在于,提供一种问题推荐方法、装置及系统,可以解决现有技术中的问题。本专利技术实施例提供一种问题推荐方法,包括:服务器根据用户的短期兴趣、长期兴趣以及人群兴趣构建所述用户的兴趣向量,所述用户的兴趣向量中包括多个兴趣项;根据所述多个兴趣项由待解决问题集合中获取候选推荐问题;根据所述点击率模型预估所述用户回答所述候选推荐问题的概率,并根据预估的概率选取待推荐问题;以及向所述客户端推荐所述待推荐问题。本专利技术实施例提供一种问题推荐装置,包括:兴趣向量计算模块,用于根据用户的短期兴趣、长期兴趣以及人群兴趣构建所述用户的兴趣向量,所述用户的兴趣向量中包括多个兴趣项;候选推荐问题获取模块,用于根据所述多个兴趣项由待解决问题集合中获取候选推荐问题;待推荐问题获取模块,用于根据所述点击率模型预估所述用户回答所述候选推荐问题的概率,并根据预估的概率选取待推荐问题;以及问题推荐模块,用于向所述客户端推荐所述待推荐问题。本专利技术实施例提供一种问题推荐系统,包括客户端以及服务器,所述客户端向所述服务器发送问题推荐请求,所述服务器根据问题推荐请求向所述客户端返回待推荐问题。所述服务器包括:提供兴趣向量计算模块,用于计算所述用户的短期兴趣、长期兴趣、人群兴趣以及建立点击率模型,根据所述用户的短期兴趣、长期兴趣以及人群兴趣构建的所述用户的兴趣向量,所述用户的兴趣向量中包括多个兴趣项;候选推荐问题获取模块,用于根据所述多个兴趣项由待解决问题集合中获取候选推荐问题;待推荐问题获取模块,用于根据所述点击率模型预估所述用户回答所述候选推荐问题的概率,并根据预估的概率选取待推荐问题;以及问题推荐模块,用于向所述客户端推荐所述待推荐问题。本专利技术所提出的问题推荐方法、装置及系统通过融合用户的短期兴趣、长期兴趣和人群兴趣来构建用户的兴趣向量,并根据用户的兴趣向量中的兴趣项由待解决问题集合中获取候选推荐问题,再根据点击率模型预估用户回答候选推荐问题的概率,根据预估的概率选取待推荐的问题,并向客户端推荐所述待推荐问题,使得推荐的问题既符合用户的兴趣又是用户回答意愿较高的问题,一方面,解决了现有技术中基于用户兴趣匹配的问题推荐方法中推荐兴趣滞后的问题,以及基于点击预估的问题推荐方法中推荐结果不全面、结果单一的现象,另一方面,可以提高互动问答平台的问题回答率。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。附图说明图1为现有技术的一种问题推荐方法的原理示意图;图2为现有技术的另一种问题推荐方法的原理示意图;图3为本专利技术第一实施例中的问题推荐方法的流程示意图;图4为本专利技术第二实施例中的问题推荐方法的流程示意图;图5为本专利技术第二实施例中的问题推荐方法的原理框图;图6为图4中步骤S21的具体流程示意图;图7为用户短期兴趣项的循环队列示意图;图8为图4中步骤S23的具体流程示意图;图9为图4中步骤S24的具体流程示意图;图10为候选推荐问题选取的原理框图;图11为图4中步骤S25的具体流程示意图;图12为CTR模型训练和CTR预估的原理框图;图13为本专利技术第三实施例中的问题推荐装置的结构示意图;图14为本专利技术第四实施例中的问题推荐装置的结构示意图;图15为图14中短期兴趣计算单元的具体结构示意图;图16为图14中人群兴趣计算单元的具体结构示意图;图17为图14中点击率模型建立单元的具体结构示意图;图18为本专利技术第五实施例中的问题推荐系统的原理框图。具体实施方式为更进一步阐述本专利技术为达成预定专利技术目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本专利技术提出的问题推荐方法及系统其具体实施方式、方法、步骤、结构、特征及其功效,详细说明如下。本专利技术中提出的问题推荐方法针对
技术介绍
中的问题,通过实时捕获用户的实时回答记录,计算用户的短期兴趣,解决基于用户兴趣匹配的问题推荐方法中推荐兴趣滞后的问题;通过对用户填写的兴趣或历史回答记录进行人口学统计分析,构建人群兴趣模型,补充用户兴趣,解决基于点击预估的问题推荐方法中推荐结果不全面、结果单一的现象;结合用户的长期兴趣、短期兴趣、人群兴趣构建完整的用户兴趣向量,在待解决问题集合中检索候选推荐问题,并以本文档来自技高网
...

【技术保护点】
一种问题推荐方法,其特征在于,包括:服务器根据用户的短期兴趣、长期兴趣以及人群兴趣构建所述用户的兴趣向量,所述用户的兴趣向量中包括多个兴趣项;根据所述多个兴趣项由待解决问题集合中获取候选推荐问题;根据点击率模型预估所述用户回答所述候选推荐问题的概率,并根据预估的概率选取待推荐问题;以及向所述客户端推荐所述待推荐问题。

【技术特征摘要】
1.一种问题推荐方法,其特征在于,包括:根据用户在距离当前时间预定时长内的实时回答记录,计算所述用户的短期兴趣;根据历史回答记录,获取所述用户的长期兴趣;根据历史回答记录、用户的属性以及与每种用户属性对应的兴趣项出现的概率,计算所述用户的人群兴趣,以及根据历史回答记录、历史曝光记录建立点击率模型,其中,所述点击率模型用于预估问题被展示后被用户回答的概率;根据用户的短期兴趣、长期兴趣以及人群兴趣构建所述用户的兴趣向量,所述用户的兴趣向量中包括多个兴趣项;根据所述多个兴趣项由待解决问题集合中获取候选推荐问题;根据点击率模型预估所述用户回答所述候选推荐问题的概率,并根据预估的概率选取待推荐问题;以及向客户端推荐所述待推荐问题。2.如权利要求1所述的方法,其特征在于,所述根据所述用户在距离当前时间预定时长内的实时回答记录,计算所述用户的短期兴趣的步骤,包括:获取用户在距离当前时间预定时长内的实时回答记录;根据所述实时回答记录,提取每个问题对应的兴趣项以及回答每个问题的时间,以回答每个问题的时间为所述问题对应的兴趣项的时间戳,以所述兴趣项为元素并根据其对应的时间戳构建循环队列;根据所述循环队列计算每个兴趣项对应的权重;以及根据每个兴趣项对应的权重计算所述用户的短期兴趣。3.如权利要求2所述的方法,其特征在于,所述根据所述循环队列计算每个兴趣项对应的权重的步骤,包括:根据每个兴趣项在所述循环队列中的位置,计算每个兴趣项出现在该位置上时的时间衰减函数以及每个兴趣项出现在该位置上时的时间戳与当前时间的时长;以及根据每个兴趣项出现在该位置上时的时间衰减函数以及每个兴趣项出现在该位置上时的时间戳与当前时间的时长,计算每个兴趣项对应的权重。4.如权利要求1所述的方法,其特征在于,所述根据历史回答记录、用户的属性以及与每种用户属性对应的兴趣项出现的概率,计算所述用户的人群兴趣的步骤,包括:根据用户的属性组合,将所有用户分为多个不同类型的人群;计算与用户的属性组合所对应的每个兴趣项出现的概率;根据所述概率,计算与每种类型的人群对应的兴趣项的权重;根据所述用户的属性,查找与所述用户对应的人群;以及根据该人群对应的兴趣项的权重,计算所述用户的人群兴趣。5.如权利要求1所述的方法,其特征在于,所述根据用户的短期兴趣、长期兴趣以及人群兴趣构建用户的兴趣向量的步骤,包括:通过向量的线性加权,将所述用户的短期兴趣、长期兴趣以及人群兴趣进行合并,得到用户的兴趣向量。6.如权利要求5所述的方法,其特征在于,用户短期兴趣的向量加权系数大于用户长期兴趣的向量加权系数,用户长期兴趣的向量加权系数大于用户人群兴趣的向量加权系数,其中,用户短期兴趣的向量加权系数大于等于0.5且小于等于0.8,用户长期兴趣的向量加权系数大于等于0.1且小于等于0.5,用户人群兴趣的向量加权系数大于等于0.1且小于等于0.5。7.如权利要求1所述的方法,其特征在于,所述根据历史回答记录、历史曝光记录建立点击率模型的步骤,包括:将所述历史曝光记录中已被用户回答过的问题标记为正样本,将所述历史曝光记录中未被用户回答过的问题标记为负样本;提取所有正样本和负样本的特征向量;以及利用所述正样本和负样本的特征向量进行点击率模型训练,建立点击率模型。8.如权利要求7所述的方法,其特征在于,所述特征向量包括:用户特征向量、问题特征向量以及场景特征向量。9.如权利要求1所述的方法,其特征在于,根据所述多个兴趣项由待解决问题集合中获取候选推荐问题的步骤,包括:根据所述多个兴趣项,计算待解决问题集合中的问题与所述用户的兴趣向量的相关性;根据相关性对这些问题进行排序;以及提取相关性在预定范围内的问题作为所述候选推荐问题。10.如权利要求1所述的方法,其特征在于,所述根据点击率模型预估所述用户回答所述候选推荐问题的概率的步骤,包括:提取所述用户、候选推荐问题以及当前场景的特征向量;利用所述特征向量以及所述点击率模型预估所述用户回答所述候选推荐问题的概率。11.如权利要求1所述的方法,其特征在于,所述根据预估的概率选取待推荐问题的步骤包括根据预估的概率对候选推荐问题进行排序,提取概率在预定范围内的问题作为所述待推荐问题。12.一种问题推荐装置,运行于服务器,其特征在于,包括:兴趣向量计算模块,用于根据用户的短期兴趣、长期兴趣以及人群兴趣构建所述用户的兴趣向量,所述用户的兴趣向量中包括多个兴趣项,其中,所述兴趣向量计算模块包括:短期兴趣计算单元,用于根据所述用户在距离当前时间预定时长内的实时回答记录,计算所述用户的短期兴趣,长期兴趣获取单元,用于根据历史回答记录,获取所述用户的长期兴趣,人群兴趣计算单元,用于根据历史回答记录、用户的属性以及与每种用户属性对应的兴趣项出现的概率,计算所...

【专利技术属性】
技术研发人员:冯扬李京生孙拔群
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1