项目使用时长预测方法、装置、设备及存储介质制造方法及图纸

技术编号:26597986 阅读:17 留言:0更新日期:2020-12-04 21:20
本发明专利技术实施例公开了项目使用时长预测方法、装置、设备及存储介质。其中,该方法基于神经网络模型实现,包括:根据用户兴趣画像信息和用户属性信息构建用户侧向量,其中,用户兴趣画像信息包含根据用户的历史行为数据确定的用户针对不同项目标签的感兴趣程度信息,项目标签用于表征项目的类别,根据各历史项目对应的使用时长和项目属性信息,以及待预测项目对应的项目属性信息,构建项目侧向量,其中,项目属性信息中以项目标签信息标识项目身份,对用户侧向量和项目侧向量进行拼接,得到待预测信息,经过预设神经网络层对所述待预测信息进行处理,得到待预测目标对应的预测使用时长。本发明专利技术实施例提供的技术方案,可以提高使用时长的预测效果。

【技术实现步骤摘要】
项目使用时长预测方法、装置、设备及存储介质
本专利技术实施例涉及计算机
,尤其涉及项目使用时长预测方法、装置、设备及存储介质。
技术介绍
现代社会,随着信息技术的快速发展,移动互联网的普及,信息过载已越来越成为人们生活中的挑战。推荐系统的出现,通过学习用户的历史行为,预测用户对其他内容的喜好程度,一方面方便了用户快速获取自己喜好的内容,同时满足了平台选择合适的用户展现自己的物品或资源等(可统称为项目),极大地缓解了用户与平台中间沟通的难题,促进了平台与用户的交互性。当前主流的推荐系统可分为多个阶段,如召回、粗排、精排和重排等。在各个阶段中,均涉及筛选或排序问题,用户针对项目的使用时长是筛选或排序过程中的重要依据,也即,使用时长是推荐系统中的一个重要指标,可以反映出用户对项目的偏好程度和产品体验,同时一般与用户的留存、优质项目数量以及项目展现次数等指标正相关,因此,准确地对使用时长进行预测非常重要。目前,针对使用时长的预测方案中,通常仅将项目属性信息和用户交互信息简单的加在一起,作为预测下一项目的使用时长的依据,预测结果不够准确,且项目属性信息中一般采用项目标识(Identitydocument,ID)等来标识项目身份,导致向量数据稀疏、线上存储和检索带来严重计算开销,因此,现有的时长预测方案需要改进。
技术实现思路
本专利技术实施例提供了项目使用时长预测方法、装置、设备及存储介质,可以优化现有的项目使用时长预测方案。第一方面,本专利技术实施例提供了一种项目使用时长预测方法,基于神经网络模型实现,该方法包括:根据用户兴趣画像信息和用户属性信息构建用户侧向量,其中,所述用户兴趣画像信息包含根据用户的历史行为数据确定的用户针对不同项目标签的感兴趣程度信息,所述历史行为数据包括用户在预设历史时段内使用各历史项目过程中产生的使用历史数据和交互行为数据,所述项目标签用于表征项目的类别;根据所述各历史项目对应的使用时长和项目属性信息,以及待预测项目对应的项目属性信息,构建项目侧向量,其中,所述项目属性信息中以项目标签信息标识项目身份;对所述用户侧向量和所述项目侧向量进行拼接,得到待预测信息;经过预设神经网络层对所述待预测信息进行处理,得到所述待预测目标对应的预测使用时长。第二方面,本专利技术实施例提供了一种项目使用时长预测装置,基于神经网络模型实现,所述装置包括:用户侧向量构建模块,用于根据用户兴趣画像信息和用户属性信息构建用户侧向量,其中,所述用户兴趣画像信息包含根据用户的历史行为数据确定的用户针对不同项目标签的感兴趣程度信息,所述历史行为数据包括用户在预设历史时段内使用各历史项目过程中产生的使用历史数据和交互行为数据,所述项目标签用于表征项目的类别;项目侧向量构建模块,用于根据所述各历史项目对应的使用时长和项目属性信息,以及待预测项目对应的项目属性信息,构建项目侧向量,其中,所述项目属性信息中以项目标签信息标识项目身份;向量拼接模块,用于对所述用户侧向量和所述项目侧向量进行拼接,得到待预测信息;使用时长预测模块,用于经过预设神经网络层对所述待预测信息进行处理,得到所述待预测目标对应的预测使用时长。第三方面,本专利技术实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本专利技术实施例提供的项目使用时长预测方法。第四方面,本专利技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术实施例提供的项目使用时长预测方法。本专利技术实施例中提供的项目使用时长预测方案,利用神经网络模型根据用户兴趣画像信息和用户属性信息构建用户侧向量,其中,用户兴趣画像信息包含根据用户的历史行为数据确定的用户针对不同项目标签的感兴趣程度信息,历史行为数据包括用户在预设历史时段内使用各历史项目过程中产生的使用历史数据和交互行为数据,项目标签用于表征项目的类别,根据各历史项目对应的使用时长和项目属性信息以及待预测项目对应的项目属性信息构建项目侧向量,其中,项目属性信息中以项目标签信息标识项目身份,对用户侧向量和项目侧向量进行拼接,得到待预测信息,经过预设神经网络层对待预测信息进行处理,得到待预测目标对应的预测使用时长。通过采用上述技术方案,将用户兴趣画像引入到用户侧的向量建模中,增强了用户侧向量的表示能力,用于生成用户兴趣画像的历史行为数据所属的历史项目与构建项目侧向量依据的历史项目相同,保证用户兴趣画像信息是动态变化的,能够更加准确地表示用户近期的兴趣变化动态,且用户兴趣画像信息对应的项目标签与项目属性信息中的项目标签信息一致,对于项目使用时长的预测增加了可解释性,且项目侧向量的构建基于项目标签进行,多个不同项目标识的项目可能对应同一个项目标签,相比于现有技术中基于项目编号构建的方案来说,解决了向量数据稀疏、线上存储和检索带来严重计算开销等问题,将用户侧向量和项目侧向量拼接后形成待预测信息,可以表征用户侧信息对项目侧信息的增强,提高待预测信息的表达能力,经过预设神经网络层处理后,能够准确预测使用时长。附图说明图1为本专利技术实施例提供的一种项目使用时长预测方法的流程示意图;图2为本专利技术实施例提供的又一种项目使用时长预测方法的流程示意图;图3为本专利技术实施例提供的另一种项目使用时长预测方法的流程示意图;图4为本专利技术实施例提供的一种神经网络模型示意图;图5为本专利技术实施例提供的一种多头注意力编码方式示意图;图6为本专利技术实施例提供的一种项目使用时长预测装置的结构框图;图7为本专利技术实施例提供的一种计算机设备的结构框图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。此外,在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。图1为本专利技术实施例提供的一种项目使用时长预测方法的流程示意图,该方法基于神经网络模型实现,可以由项目使用时长预测装置执行,其中该装置可由软件和/或硬件实现,一般可集成在计算机设备中。如图1所示,该方法包括:步骤101、根据用户兴趣画像信息和用户属性信息构建用户侧向量,其中,所述用户兴趣画像信息包含根据用户的历史行为数据确定的用户针对不同项目标签的感兴趣程度信息,所述历史行为数据包括用户在预设历史时段内使用各历史项目过程中产生的使用历史数据和交互行为数据,所述项目标签用于表征项目的类别。示例性的,本专利技术实施例中的项目可以包括在互联网(可体现为各种平台)上发布的物品(如在线商城中的商品或二手交易网站上的物品等等)或资源(如短视频平台中的短视频、推荐引擎中的新闻、音乐播放平台中的音乐以及在线答题应用程序中的题目等等),具体类型不做限定。对于不同类型的项目,其对应的使用时长可以有不同的表述方式。以商品为例本文档来自技高网...

【技术保护点】
1.一种项目使用时长预测方法,其特征在于,基于神经网络模型实现,所述方法包括:/n根据用户兴趣画像信息和用户属性信息构建用户侧向量,其中,所述用户兴趣画像信息包含根据用户的历史行为数据确定的用户针对不同项目标签的感兴趣程度信息,所述历史行为数据包括用户在预设历史时段内使用各历史项目过程中产生的使用历史数据和交互行为数据,所述项目标签用于表征项目的类别;/n根据所述各历史项目对应的使用时长和项目属性信息,以及待预测项目对应的项目属性信息,构建项目侧向量,其中,所述项目属性信息中以项目标签信息标识项目身份;/n对所述用户侧向量和所述项目侧向量进行拼接,得到待预测信息;/n经过预设神经网络层对所述待预测信息进行处理,得到所述待预测目标对应的预测使用时长。/n

【技术特征摘要】
1.一种项目使用时长预测方法,其特征在于,基于神经网络模型实现,所述方法包括:
根据用户兴趣画像信息和用户属性信息构建用户侧向量,其中,所述用户兴趣画像信息包含根据用户的历史行为数据确定的用户针对不同项目标签的感兴趣程度信息,所述历史行为数据包括用户在预设历史时段内使用各历史项目过程中产生的使用历史数据和交互行为数据,所述项目标签用于表征项目的类别;
根据所述各历史项目对应的使用时长和项目属性信息,以及待预测项目对应的项目属性信息,构建项目侧向量,其中,所述项目属性信息中以项目标签信息标识项目身份;
对所述用户侧向量和所述项目侧向量进行拼接,得到待预测信息;
经过预设神经网络层对所述待预测信息进行处理,得到所述待预测目标对应的预测使用时长。


2.根据权利要求1所述的方法,其特征在于,在根据用户兴趣画像和用户属性信息构建用户侧向量之前,还包括:
根据所述使用历史数据确定所述各历史项目对应的项目标签;
针对每个项目标签,基于贝叶斯方法根据所述交互行为数据计算用户针对当前项目标签的贝叶斯分数,将所述贝叶斯分数作为所述感兴趣程度信息;
将各项目标签对应的感兴趣程度信息相加,得到用户兴趣画像信息。


3.根据权利要求1所述的方法,其特征在于,所述根据所述各历史项目对应的使用时长和项目属性信息,以及待预测项目对应的项目属性信息,构建项目侧向量,包括:
对于所述各历史项目中的每个历史项目,基于当前历史项目对应的使用时长和所述预设历史时段对应的使用时长统计信息确定用户对于所述当前历史项目的时长维度评分,并根据所述时长维度评分和所述当前历史项目对应的项目属性信息确定所述当前历史项目对应的项目信息;
根据所述各历史项目分别对应的项目信息以及待预测项目对应的项目属性信息,构建项目侧向量。


4.根据权利要求3所述的方法,其特征在于,所述使用时长统计信息包括平均使用时长;
所述基于当前历史项目对应的使用时长和所述预设历史时段对应的使用时长统计信息确定用户对于所述当前历史项目的时长维度评分,包括:
基于当前历史项目对应的使用时长和所述预设历史时段对应的平均使用时长的差值确定用户对于所述当前历史项目的时长维度评分;
所述根据所述时长维度评分和所述当前历史项目对应的项目属性信息确定所述当前历史项目对应的项目信息,包括:
根据所述时长维度评分和所述当前历史项目对应的项目属性信息的乘积确定所述当前历史项目对应的项目信息。


5.根据权利要求4所述的方法,其特征在于,所述使用时长统计信息还包括使用时长均方差;
所述基于当前历史项目对应的使用时长和所述预设历史时段对应的使用时长统计信息确定用户对于所述当前历史项目的时长维度评分,包括:
采用预设标准化算法基于当前历史项目对应的使用时长、所述预设历史时段对应的平均使用时长和使用时长均方差确定用户对于所述当前历史项目的时长维度评分,其中,所述时长维度评分的取值范围为-1到1之间。


6.根据权利要求3所述的方法,其特征在于,所述项目属性信息中还包含使用位置信息、项目来源信息和项目封面信息中的至少一种。

【专利技术属性】
技术研发人员:胡星李建扣
申请(专利权)人:广州市百果园信息技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1