【技术实现步骤摘要】
项目使用时长预测方法、装置、设备及存储介质
本专利技术实施例涉及计算机
,尤其涉及项目使用时长预测方法、装置、设备及存储介质。
技术介绍
现代社会,随着信息技术的快速发展,移动互联网的普及,信息过载已越来越成为人们生活中的挑战。推荐系统的出现,通过学习用户的历史行为,预测用户对其他内容的喜好程度,一方面方便了用户快速获取自己喜好的内容,同时满足了平台选择合适的用户展现自己的物品或资源等(可统称为项目),极大地缓解了用户与平台中间沟通的难题,促进了平台与用户的交互性。当前主流的推荐系统可分为多个阶段,如召回、粗排、精排和重排等。在各个阶段中,均涉及筛选或排序问题,用户针对项目的使用时长是筛选或排序过程中的重要依据,也即,使用时长是推荐系统中的一个重要指标,可以反映出用户对项目的偏好程度和产品体验,同时一般与用户的留存、优质项目数量以及项目展现次数等指标正相关,因此,准确地对使用时长进行预测非常重要。目前,针对使用时长的预测方案中,通常仅将项目属性信息和用户交互信息简单的加在一起,作为预测下一项目的使用时长的依据,预测结果不够准确,且项目属性信息中一般采用项目标识(Identitydocument,ID)等来标识项目身份,导致向量数据稀疏、线上存储和检索带来严重计算开销,因此,现有的时长预测方案需要改进。
技术实现思路
本专利技术实施例提供了项目使用时长预测方法、装置、设备及存储介质,可以优化现有的项目使用时长预测方案。第一方面,本专利技术实施例提供了一种项目使用时长预测方法,基于神经网 ...
【技术保护点】
1.一种项目使用时长预测方法,其特征在于,基于神经网络模型实现,所述方法包括:/n根据用户兴趣画像信息和用户属性信息构建用户侧向量,其中,所述用户兴趣画像信息包含根据用户的历史行为数据确定的用户针对不同项目标签的感兴趣程度信息,所述历史行为数据包括用户在预设历史时段内使用各历史项目过程中产生的使用历史数据和交互行为数据,所述项目标签用于表征项目的类别;/n根据所述各历史项目对应的使用时长和项目属性信息,以及待预测项目对应的项目属性信息,构建项目侧向量,其中,所述项目属性信息中以项目标签信息标识项目身份;/n对所述用户侧向量和所述项目侧向量进行拼接,得到待预测信息;/n经过预设神经网络层对所述待预测信息进行处理,得到所述待预测目标对应的预测使用时长。/n
【技术特征摘要】 【专利技术属性】
1.一种项目使用时长预测方法,其特征在于,基于神经网络模型实现,所述方法包括:
根据用户兴趣画像信息和用户属性信息构建用户侧向量,其中,所述用户兴趣画像信息包含根据用户的历史行为数据确定的用户针对不同项目标签的感兴趣程度信息,所述历史行为数据包括用户在预设历史时段内使用各历史项目过程中产生的使用历史数据和交互行为数据,所述项目标签用于表征项目的类别;
根据所述各历史项目对应的使用时长和项目属性信息,以及待预测项目对应的项目属性信息,构建项目侧向量,其中,所述项目属性信息中以项目标签信息标识项目身份;
对所述用户侧向量和所述项目侧向量进行拼接,得到待预测信息;
经过预设神经网络层对所述待预测信息进行处理,得到所述待预测目标对应的预测使用时长。
2.根据权利要求1所述的方法,其特征在于,在根据用户兴趣画像和用户属性信息构建用户侧向量之前,还包括:
根据所述使用历史数据确定所述各历史项目对应的项目标签;
针对每个项目标签,基于贝叶斯方法根据所述交互行为数据计算用户针对当前项目标签的贝叶斯分数,将所述贝叶斯分数作为所述感兴趣程度信息;
将各项目标签对应的感兴趣程度信息相加,得到用户兴趣画像信息。
3.根据权利要求1所述的方法,其特征在于,所述根据所述各历史项目对应的使用时长和项目属性信息,以及待预测项目对应的项目属性信息,构建项目侧向量,包括:
对于所述各历史项目中的每个历史项目,基于当前历史项目对应的使用时长和所述预设历史时段对应的使用时长统计信息确定用户对于所述当前历史项目的时长维度评分,并根据所述时长维度评分和所述当前历史项目对应的项目属性信息确定所述当前历史项目对应的项目信息;
根据所述各历史项目分别对应的项目信息以及待预测项目对应的项目属性信息,构建项目侧向量。
4.根据权利要求3所述的方法,其特征在于,所述使用时长统计信息包括平均使用时长;
所述基于当前历史项目对应的使用时长和所述预设历史时段对应的使用时长统计信息确定用户对于所述当前历史项目的时长维度评分,包括:
基于当前历史项目对应的使用时长和所述预设历史时段对应的平均使用时长的差值确定用户对于所述当前历史项目的时长维度评分;
所述根据所述时长维度评分和所述当前历史项目对应的项目属性信息确定所述当前历史项目对应的项目信息,包括:
根据所述时长维度评分和所述当前历史项目对应的项目属性信息的乘积确定所述当前历史项目对应的项目信息。
5.根据权利要求4所述的方法,其特征在于,所述使用时长统计信息还包括使用时长均方差;
所述基于当前历史项目对应的使用时长和所述预设历史时段对应的使用时长统计信息确定用户对于所述当前历史项目的时长维度评分,包括:
采用预设标准化算法基于当前历史项目对应的使用时长、所述预设历史时段对应的平均使用时长和使用时长均方差确定用户对于所述当前历史项目的时长维度评分,其中,所述时长维度评分的取值范围为-1到1之间。
6.根据权利要求3所述的方法,其特征在于,所述项目属性信息中还包含使用位置信息、项目来源信息和项目封面信息中的至少一种。
技术研发人员:胡星,李建扣,
申请(专利权)人:广州市百果园信息技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。