物料投放方法、装置、终端设备及介质制造方法及图纸

技术编号:37122301 阅读:19 留言:0更新日期:2023-04-01 05:18
本发明专利技术公开了一种物料投放方法、装置、终端设备及计算机可读存储介质,该方法包括:获取当前用户的历史点击物料序列;基于所述历史点击物料序列,确定物料投放最优动作序列;将所述物料投放最优动作序列中的多个待投放物料进行投放,并在投放完成后,评估所述多个待投放物料的物料投放价值。本发明专利技术能够实现多类型物料的精准投放。型物料的精准投放。型物料的精准投放。

【技术实现步骤摘要】
物料投放方法、装置、终端设备及介质


[0001]本专利技术涉及人工智能
,尤其涉及一种物料投放方法、装置、终端设备及计算机可读存储介质。

技术介绍

[0002]在金融领域的个性化推荐中,存在需要同时向目标用户推荐多个该用户可能感兴趣的物料的场景,比如,在银行APP中的一个栏位上推荐多条财富产品、理财资讯、促活活动等,这些物料往往来自不同的品类和领域,以满足用户不同方向的兴趣,从而提高用户粘性。与此同时,还需在运营侧提升物料投放的多样性和丰富度。
[0003]该场景下的主流解决方案为深度学习单物料点击率预估模型排序结合物料品类投放比例人工调整的方式,具体为:针对某一位用户,将其用户画像数据与物料池中每个物料的信息存放于存储介质中。当该用户浏览到目标位置时,客户端会向服务器发送获取物料列表请求,服务器收到请求后从存储介质中提取对应数据,并导入预先准备好的深度学习模型文件至内存环境,随后该模型会以用户画像与单个物料的所有信息为输入,通过模型内部计算得到该用户对该物料的点击率可能性数值。进而将所有候选物料的点击率预估值倒序排序,排名前N对应的物料即可返回给客户端进行展示。另外,为了避免用户收到的投放物料品类单一,在点击率预估排序的基础上会根据实际业务品类对排序结果做人工调整,比如,为了保证某一物料品类的曝光量,对该品类进行调权,即人为放大该物料的点击率预估值。
[0004]可见,上述单物料点击率预估模型排序结合品类投放比例调整的物料投放方式,主要有如下三种缺陷:一是单靠人工调整物料投放权重成本高,需要依赖专家确定每种品类的权重,且无法快速适应实际场景下多变的客户兴趣和业务目标,反应速度慢;二是效果较差,人工调权会损害模型的点击率预估效果,因为实际情况下两者可能会产生相悖的投放结果,同时,引入统一的品类权重缺乏个性化;三是没有考虑最终投放多个物料之间的关系,用户在浏览物料实际上有先后次序,当前单物料点击率预估技术并没有考虑物料间的相关性。
[0005]总的来说,现有的物料投放方式,无法针对各用户实现多类型物料的精准投放。

技术实现思路

[0006]本专利技术的主要目的在于提供一种物料投放方法、装置、终端设备及计算机可读存储介质,旨在实现多类型物料的精准投放。
[0007]为实现上述目的,本专利技术提供一种物料投放方法,所述方法包括以下步骤:
[0008]获取当前用户的历史点击物料序列;
[0009]基于所述历史点击物料序列,确定物料投放最优动作序列;
[0010]将所述物料投放最优动作序列中的多个待投放物料进行投放,并在投放完成后,评估所述多个待投放物料的物料投放价值。
[0011]可选地,所述基于所述历史点击物料序列,确定物料投放最优动作序列的步骤,包括:
[0012]获取所述历史点击物料序列对应的用户表征向量;
[0013]基于预设的物料空间中的物料向量,并结合所述历史点击物料序列对应的用户表征向量,获取包含多个物料的动作序列;
[0014]将所述动作序列中靠前的预设数量的物料作为待投放物料,并根据所述待投放物料确定物料投放最优动作序列。
[0015]可选地,在所述获取所述历史点击物料序列对应的用户表征向量的步骤之前,还包括:
[0016]构建物料投放对象的用户画像向量;
[0017]所述获取所述历史点击物料序列对应的用户表征向量的步骤,包括:
[0018]将所述用户画像向量与所述历史点击物料序列进行结合得到所述用户表征向量。
[0019]可选地,在所述基于预设的物料空间中的物料向量,并结合所述历史点击物料序列对应的用户表征向量,获取包含多个物料的动作序列的步骤之前,还包括:
[0020]构建所述物料空间;
[0021]获取所述物料空间中各物料的物料向量。
[0022]可选地,所述基于预设的物料空间中的物料向量,并结合所述历史点击物料序列对应的用户表征向量,获取包含多个物料的动作序列的步骤,包括:
[0023]按照预设次数,重复执行:将所述物料空间中各物料的物料向量分别与所述历史点击物料序列对应的用户表征向量相乘得到多个相乘结果;获取所述多个相乘结果中的最大值所对应的所述物料空间中的物料,并将所述物料置于预设初始动作序列的尾部,并将所述物料从所述物料空间中删除,获取所述包含多个物料的动作序列。
[0024]可选地,所述评估所述多个待投放物料的物料投放价值的步骤,包括:
[0025]根据多个所述待投放物料对应的多维向量,并结合所述用户画像向量和所述历史点击物料序列,获取此次物料投放的物料投放价值。
[0026]可选地,在所述获取当前用户的历史点击物料序列的步骤之前,还包括:
[0027]构建物料投放模型;
[0028]通过预设策略梯度算法,对所述物料投放模型进行训练,并在训练完成后执行当前用户的历史点击物料序列的步骤。
[0029]为实现上述目的,本专利技术还提供一种物料投放装置,所述物料投放装置包括:
[0030]获取模块,用于获取当前用户的历史点击物料序列;
[0031]确定模块,用于基于所述历史点击物料序列,确定物料投放最优动作序列;
[0032]投放模块,用于将所述物料投放最优动作序列中的多个待投放物料进行投放,并在投放完成后,评估所述多个待投放物料的物料投放价值。
[0033]为实现上述目的,本专利技术还提供一种终端设备,所述终端设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的物料投放程序,所述物料投放程序被所述处理器执行时实现如上所述的物料投放方法的步骤。
[0034]此外,为实现上述目的,本专利技术还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有物料投放程序,所述物料投放程序被处理器执行时实现如上所述的物料
投放方法的步骤。
[0035]为实现上述目的,本专利技术还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如上所述的物料投放方法的步骤。
[0036]本专利技术提供一种物料投放方法、装置、终端设备、计算机可读存储介质以及计算机程序产品,通过获取当前用户的历史点击物料序列;基于所述历史点击物料序列,确定物料投放最优动作序列;将所述物料投放最优动作序列中的多个待投放物料进行投放,并在投放完成后,评估所述多个待投放物料的物料投放价值。
[0037]相比于现有技术中模型结合人工的单物料投放方式,在本专利技术中,能够根据用户的历史点击物料序列,直接确定多个待投放物料,并将多个投放物料进行投放,并在投放后评估此次物料投放的物料投放价值。因此,本专利技术能够根据用户历史物料点击情况进行物料投放,提升了物料投放精度,同时,本专利技术还能够向用户投放多个物料,提升了物料投放丰富度,进而使得物料投放更加贴合用户实际浏览情况和使用需求,有效提升了用户体验。另外,在本专利技术中,无需人工干预各物料的权重,因此也提升了物料投放效率和投放精度。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种物料投放方法,其特征在于,所述物料投放方法包括:获取当前用户的历史点击物料序列;基于所述历史点击物料序列,确定物料投放最优动作序列;将所述物料投放最优动作序列中的多个待投放物料进行投放,并在投放完成后,评估所述多个待投放物料的物料投放价值。2.如权利要求1所述的物料投放方法,其特征在于,所述基于所述历史点击物料序列,确定物料投放最优动作序列的步骤,包括:获取所述历史点击物料序列对应的用户表征向量;基于预设的物料空间中的物料向量,并结合所述历史点击物料序列对应的用户表征向量,获取包含多个物料的动作序列;将所述动作序列中靠前的预设数量的物料作为待投放物料,并根据所述待投放物料确定物料投放最优动作序列。3.如权利要求2所述的物料投放方法,其特征在于,在所述获取所述历史点击物料序列对应的用户表征向量的步骤之前,还包括:构建物料投放对象的用户画像向量;所述获取所述历史点击物料序列对应的用户表征向量的步骤,包括:将所述用户画像向量与所述历史点击物料序列进行结合得到所述用户表征向量。4.如权利要求3所述的物料投放方法,其特征在于,在所述基于预设的物料空间中的物料向量,并结合所述历史点击物料序列对应的用户表征向量,获取包含多个物料的动作序列的步骤之前,还包括:构建所述物料空间;获取所述物料空间中各物料的物料向量。5.如权利要求4所述的物料投放方法,其特征在于,所述基于预设的物料空间中的物料向量,并结合所述历史点击物料序列对应的用户表征向量,获取包含多个物料的动作序列的步骤,包括:按照预设次数,重复执行:将所述物料空间中各物料的物料向量分别与所述历史点击物...

【专利技术属性】
技术研发人员:姚泽丽
申请(专利权)人:招商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1