【技术实现步骤摘要】
问题推荐方法、装置及系统
本专利技术涉及计算机互联网
,特别是涉及一种问题推荐方法、装置及系统。
技术介绍
现在越来越多的互动问答社区为广大用户提供了问答互动平台。其特点是:一些用户作为提问者在社区中提出问题,另一些有能力作答的用户以回答者的身份发现并回答这些问题,解决提问者的疑问;而问题和答案会在平台中沉淀下来,形成知识库,可以为后来具有相同问题的“提问者”直接提供解答。在互动问答社区中,每天会有数以十万级的问题被提出,为了能够让这些问题得到快速有效的回答,就需要一种途径让回答者们能及时地发现符合自己兴趣和能力的问题。问题推荐系统的目的就是向有能力的用户推荐符合其兴趣和能力的问题。现有的问题推荐方法主要有两类:一类是基于用户兴趣匹配的问题推荐方法,另一类是基于点击(CTR,ClickThroughRate)预估的问题推荐方法。如图1所示,基于用户兴趣匹配的问题推荐,利用离线挖掘,通过用户已有的回答来挖掘用户的兴趣;通过兴趣匹配,为用户推荐匹配其兴趣的待解决问题。如图2所示,基于点击预估的问题推荐,通过历史的曝光日志(记录了哪些问题展示给了哪些用户)与回答日志(记录了哪些问题被哪些用户回答过),离线训练出点击预测模型;在推荐中,利用该模型预测一个待解决问题展示给一个特定用户后被其回答的概率,根据回答概率度对所有待解决问题排序,取TopN作为推荐结果进行展示。但是,离线挖掘用户兴趣滞后于用户的兴趣变化,推荐结果中无法体现用户的近期行为所反应出来的兴趣迁移。通过离线计算,从用户的历史回答记录中挖掘出来的兴趣是用户的长期兴趣,这种长期兴趣相对稳定,随时间变 ...
【技术保护点】
一种问题推荐方法,其特征在于,包括:服务器根据用户的短期兴趣、长期兴趣以及人群兴趣构建所述用户的兴趣向量,所述用户的兴趣向量中包括多个兴趣项;根据所述多个兴趣项由待解决问题集合中获取候选推荐问题;根据点击率模型预估所述用户回答所述候选推荐问题的概率,并根据预估的概率选取待推荐问题;以及向所述客户端推荐所述待推荐问题。
【技术特征摘要】
1.一种问题推荐方法,其特征在于,包括:根据用户在距离当前时间预定时长内的实时回答记录,计算所述用户的短期兴趣;根据历史回答记录,获取所述用户的长期兴趣;根据历史回答记录、用户的属性以及与每种用户属性对应的兴趣项出现的概率,计算所述用户的人群兴趣,以及根据历史回答记录、历史曝光记录建立点击率模型,其中,所述点击率模型用于预估问题被展示后被用户回答的概率;根据用户的短期兴趣、长期兴趣以及人群兴趣构建所述用户的兴趣向量,所述用户的兴趣向量中包括多个兴趣项;根据所述多个兴趣项由待解决问题集合中获取候选推荐问题;根据点击率模型预估所述用户回答所述候选推荐问题的概率,并根据预估的概率选取待推荐问题;以及向客户端推荐所述待推荐问题。2.如权利要求1所述的方法,其特征在于,所述根据所述用户在距离当前时间预定时长内的实时回答记录,计算所述用户的短期兴趣的步骤,包括:获取用户在距离当前时间预定时长内的实时回答记录;根据所述实时回答记录,提取每个问题对应的兴趣项以及回答每个问题的时间,以回答每个问题的时间为所述问题对应的兴趣项的时间戳,以所述兴趣项为元素并根据其对应的时间戳构建循环队列;根据所述循环队列计算每个兴趣项对应的权重;以及根据每个兴趣项对应的权重计算所述用户的短期兴趣。3.如权利要求2所述的方法,其特征在于,所述根据所述循环队列计算每个兴趣项对应的权重的步骤,包括:根据每个兴趣项在所述循环队列中的位置,计算每个兴趣项出现在该位置上时的时间衰减函数以及每个兴趣项出现在该位置上时的时间戳与当前时间的时长;以及根据每个兴趣项出现在该位置上时的时间衰减函数以及每个兴趣项出现在该位置上时的时间戳与当前时间的时长,计算每个兴趣项对应的权重。4.如权利要求1所述的方法,其特征在于,所述根据历史回答记录、用户的属性以及与每种用户属性对应的兴趣项出现的概率,计算所述用户的人群兴趣的步骤,包括:根据用户的属性组合,将所有用户分为多个不同类型的人群;计算与用户的属性组合所对应的每个兴趣项出现的概率;根据所述概率,计算与每种类型的人群对应的兴趣项的权重;根据所述用户的属性,查找与所述用户对应的人群;以及根据该人群对应的兴趣项的权重,计算所述用户的人群兴趣。5.如权利要求1所述的方法,其特征在于,所述根据用户的短期兴趣、长期兴趣以及人群兴趣构建用户的兴趣向量的步骤,包括:通过向量的线性加权,将所述用户的短期兴趣、长期兴趣以及人群兴趣进行合并,得到用户的兴趣向量。6.如权利要求5所述的方法,其特征在于,用户短期兴趣的向量加权系数大于用户长期兴趣的向量加权系数,用户长期兴趣的向量加权系数大于用户人群兴趣的向量加权系数,其中,用户短期兴趣的向量加权系数大于等于0.5且小于等于0.8,用户长期兴趣的向量加权系数大于等于0.1且小于等于0.5,用户人群兴趣的向量加权系数大于等于0.1且小于等于0.5。7.如权利要求1所述的方法,其特征在于,所述根据历史回答记录、历史曝光记录建立点击率模型的步骤,包括:将所述历史曝光记录中已被用户回答过的问题标记为正样本,将所述历史曝光记录中未被用户回答过的问题标记为负样本;提取所有正样本和负样本的特征向量;以及利用所述正样本和负样本的特征向量进行点击率模型训练,建立点击率模型。8.如权利要求7所述的方法,其特征在于,所述特征向量包括:用户特征向量、问题特征向量以及场景特征向量。9.如权利要求1所述的方法,其特征在于,根据所述多个兴趣项由待解决问题集合中获取候选推荐问题的步骤,包括:根据所述多个兴趣项,计算待解决问题集合中的问题与所述用户的兴趣向量的相关性;根据相关性对这些问题进行排序;以及提取相关性在预定范围内的问题作为所述候选推荐问题。10.如权利要求1所述的方法,其特征在于,所述根据点击率模型预估所述用户回答所述候选推荐问题的概率的步骤,包括:提取所述用户、候选推荐问题以及当前场景的特征向量;利用所述特征向量以及所述点击率模型预估所述用户回答所述候选推荐问题的概率。11.如权利要求1所述的方法,其特征在于,所述根据预估的概率选取待推荐问题的步骤包括根据预估的概率对候选推荐问题进行排序,提取概率在预定范围内的问题作为所述待推荐问题。12.一种问题推荐装置,运行于服务器,其特征在于,包括:兴趣向量计算模块,用于根据用户的短期兴趣、长期兴趣以及人群兴趣构建所述用户的兴趣向量,所述用户的兴趣向量中包括多个兴趣项,其中,所述兴趣向量计算模块包括:短期兴趣计算单元,用于根据所述用户在距离当前时间预定时长内的实时回答记录,计算所述用户的短期兴趣,长期兴趣获取单元,用于根据历史回答记录,获取所述用户的长期兴趣,人群兴趣计算单元,用于根据历史回答记录、用户的属性以及与每种用户属性对应的兴趣项出现的概率,计算所...
【专利技术属性】
技术研发人员:冯扬,李京生,孙拔群,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。