一种模型训练以及信息推送方法及装置制造方法及图纸

技术编号:31742889 阅读:22 留言:0更新日期:2022-01-05 16:21
本说明书公开了一种模型训练以及信息推送方法及装置,可基于各商品的商品特征,通过预先训练的增益预估模型,确定单位资源量相对于各商品所带来的增益。之后,根据单位资源量相对于各商品所带来的增益,以及各商品对应的待推送信息所包含的资源总量,确定各商品对应的待推送信息的类型,并向用户进行信息推送。通过增益预估模型预估单位资源量相对于各商品所带来的增益,并按照单位资源量相对于各商品所带来的增益,确定向用户推送的各商品对应的推送信息。提升了信息推送的有效性,使推送信息对应的资源量更符合用户需要,减少推送信息的资源浪费。息的资源浪费。息的资源浪费。

【技术实现步骤摘要】
一种模型训练以及信息推送方法及装置


[0001]本申请涉及人工智能
,尤其涉及一种模型训练以及信息推送方法及装置。

技术介绍

[0002]随着互联网技术的发展,越来越多的用户通过网络平台执行业务,如,通过电商平台购买商品,通过社交平台进行通信等。
[0003]其中,各网络平台为了提高用户留存率,通过向用户推送信息的方式,使用户根据推送信息对应的资源获取相应服务,提升用户体验。
[0004]目前,在进行信息推送时,各网络平台通常随机向各用户推送不同类型的信息,使各用户根据获取到的推送信息对应的资源,获取相应服务。
[0005]但是,由于各用户所需的服务不同,往往出现分配的推送信息的资源与用户的实际需求不符的情况,导致推送信息对应的资源被浪费。

技术实现思路

[0006]本说明书实施例提供一种模型训练以及信息推送方法及装置,用于部分解决现有技术中的问题。
[0007]本说明书实施例采用下述技术方案:
[0008]本说明书提供的一种模型训练方法,包括:
[0009]针对每个商品,获取该商品的商品特征以及历史数据,所述历史数据至少包含商品在历史上的第一被操作次数和第二被操作次数;其中,所述第一被操作次数是未将该商品对应的推送信息推送给用户的情况下,用户对该商品执行指定操作的次数;所述第二被操作次数是将该商品对应的推送信息推送给用户的情况下,用户对该商品执行指定操作的次数;
[0010]根据该商品在历史上的第一被操作次数、第二被操作次数,以及历史上推送给用户的该商品对应的推送信息中包含的资源总量,确定单位资源量相对于该商品所带来的增益;
[0011]将各商品的商品特征作为各训练样本,并将单位资源量相对于各商品所带来的增益作为各训练样本的标注;
[0012]针对每个训练样本,将该训练样本输入待训练的增益预估模型,确定所述增益预估模型输出的单位资源量相对于该商品所带来的待优化增益,并以最小化所述待优化增益与该训练样本的标注之间的差异为目标,调整所述待训练的增益预估模型中的模型参数;
[0013]其中,所述增益预估模型用于预估单位资源量相对于各商品所带来的增益,并基于单位资源量相对于各商品所带来的增益,以及当前各商品对应的待推送信息所包含的资源总量,确定各商品对应的待推送信息并进行信息推送。
[0014]可选地,根据该商品在历史上的第一被操作次数、第二被操作次数,以及历史上推
送给用户的该商品对应的推送信息中包含的资源总量,确定单位资源量相对于该商品所带来的增益,具体包括:
[0015]从历史上推送给用户的该商品对应的推送信息中包含的资源总量中,确定历史上用户实际使用的资源总量;
[0016]根据该商品在历史上的第一被操作次数、第二被操作次数,以及历史上用户实际使用的资源总量,确定单位资源量相对于该商品所带来的增益。
[0017]可选地,所述第一被操作次数包括未将该商品对应的推送信息推送给用户的情况下,用户对该商品的第一访问量以及第一下单量,所述第二被操作次数包括将该商品对应的推送信息推送给用户的情况下,用户对该商品的第二访问量以及第二下单量;
[0018]根据该商品在历史上的第一被操作次数、第二被操作次数,以及历史上推送给用户的该商品对应的推送信息中包含的资源总量,确定单位资源量相对于该商品所带来的增益,具体包括:
[0019]根据该商品在历史上的第一访问量以及第一下单量,确定该商品的第一下单转化率;
[0020]根据该商品在历史上的第二访问量以及第二下单量,确定该商品的第二下单转化率;
[0021]根据所述第一下单转化率、所述第二下单转化率、所述第二访问量以及历史上推送给用户的该商品对应的推送信息中包含的资源总量,确定单位资源量相对于该商品所带来的增益。
[0022]本说明书提供的一种信息推送方法,包括:
[0023]获取各商品的商品特征;
[0024]针对每个商品,将该商品的商品特征,输入预先训练的增益预估模型,确定单位资源量相对于该商品所带来的增益;其中,所述增益预估模型采用上述模型训练方法训练得到;
[0025]根据所述单位资源量相对于各商品所带来的增益以及各商品对应的待推送信息所包含的资源总量,确定各商品对应的待推送信息的类型,并根据各商品对应的待推送信息的类型,向用户推送各商品对应的推送信息;
[0026]其中,不同类型的推送信息对应的资源量不同。
[0027]可选地,根据所述单位资源量相对于各商品所带来的增益以及各商品对应的待推送信息所包含的资源总量,确定各商品对应的待推送信息的类型,具体包括:
[0028]按照所述单位资源量相对于各商品所带来的增益的排序,划分若干商品分组;
[0029]根据各商品分组中的商品数量,以及各商品对应的待推送信息所包含的资源总量,确定各商品分组对应的待推送信息的类型;
[0030]根据各商品分组对应的待推送信息的类型,确定各商品对应的待推送信息的类型;其中,同一商品分组中的各商品对应的待推送信息的类型相同。
[0031]可选地,所述方法还包括:
[0032]针对每个用户,根据该用户的画像信息以及历史行为信息,确定该用户分别在未接收到该商品对应的推送信息的情况下的下单概率,以及在接收到该商品对应的推送信息的情况下的下单概率;
[0033]根据该用户分别在未接收到该商品对应的推送信息的情况下的下单概率、在接收到该商品对应的推送信息的情况下的下单概率以及该商品对应的推送信息的类型,向用户推送该商品对应的推送信息。
[0034]本说明书提供一种模型训练装置,包括:
[0035]获取模块,配置为针对每个商品,获取该商品的商品特征以及历史数据,所述历史数据至少包含商品在历史上的第一被操作次数和第二被操作次数;其中,所述第一被操作次数是未将该商品对应的推送信息推送给用户的情况下,用户对该商品执行指定操作的次数;所述第二被操作次数是将该商品对应的推送信息推送给用户的情况下,用户对该商品执行指定操作的次数;
[0036]确定模块,配置为根据该商品在历史上的第一被操作次数、第二被操作次数,以及历史上推送给用户的该商品对应的推送信息中包含的资源总量,确定单位资源量相对于该商品所带来的增益;
[0037]样本准备模块,配置为将各商品的商品特征作为各训练样本,并将单位资源量相对于各商品所带来的增益作为各训练样本的标注;
[0038]训练模块,配置为针对每个训练样本,将该训练样本输入待训练的增益预估模型,确定所述增益预估模型输出的单位资源量相对于该商品所带来的待优化增益,并以最小化所述待优化增益与该训练样本的标注之间的差异为目标,调整所述待训练的增益预估模型中的模型参数,其中,所述增益预估模型用于预估单位资源量相对于各商品所带来的增益,并基于单位资源量相对于各商品所带来的增益,以及当前各商品对应的待推送信息所包含的资源总量,确定各商品对应的待本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:针对每个商品,获取该商品的商品特征以及历史数据,所述历史数据至少包含商品在历史上的第一被操作次数和第二被操作次数;其中,所述第一被操作次数是未将该商品对应的推送信息推送给用户的情况下,用户对该商品执行指定操作的次数;所述第二被操作次数是将该商品对应的推送信息推送给用户的情况下,用户对该商品执行指定操作的次数;根据该商品在历史上的第一被操作次数、第二被操作次数,以及历史上推送给用户的该商品对应的推送信息中包含的资源总量,确定单位资源量相对于该商品所带来的增益;将各商品的商品特征作为各训练样本,并将单位资源量相对于各商品所带来的增益作为各训练样本的标注;针对每个训练样本,将该训练样本输入待训练的增益预估模型,确定所述增益预估模型输出的单位资源量相对于该商品所带来的待优化增益,并以最小化所述待优化增益与该训练样本的标注之间的差异为目标,调整所述待训练的增益预估模型中的模型参数;其中,所述增益预估模型用于预估单位资源量相对于各商品所带来的增益,并基于单位资源量相对于各商品所带来的增益,以及当前各商品对应的待推送信息所包含的资源总量,确定各商品对应的待推送信息并进行信息推送。2.如权利要求1所述的方法,其特征在于,根据该商品在历史上的第一被操作次数、第二被操作次数,以及历史上推送给用户的该商品对应的推送信息中包含的资源总量,确定单位资源量相对于该商品所带来的增益,具体包括:从历史上推送给用户的该商品对应的推送信息中包含的资源总量中,确定历史上用户实际使用的资源总量;根据该商品在历史上的第一被操作次数、第二被操作次数,以及历史上用户实际使用的资源总量,确定单位资源量相对于该商品所带来的增益。3.如权利要求1所述的方法,其特征在于,所述第一被操作次数包括未将该商品对应的推送信息推送给用户的情况下,用户对该商品的第一访问量以及第一下单量,所述第二被操作次数包括将该商品对应的推送信息推送给用户的情况下,用户对该商品的第二访问量以及第二下单量;根据该商品在历史上的第一被操作次数、第二被操作次数,以及历史上推送给用户的该商品对应的推送信息中包含的资源总量,确定单位资源量相对于该商品所带来的增益,具体包括:根据该商品在历史上的第一访问量以及第一下单量,确定该商品的第一下单转化率;根据该商品在历史上的第二访问量以及第二下单量,确定该商品的第二下单转化率;根据所述第一下单转化率、所述第二下单转化率、所述第二访问量以及历史上推送给用户的该商品对应的推送信息中包含的资源总量,确定单位资源量相对于该商品所带来的增益。4.一种信息推送方法,其特征在于,包括:获取各商品的商品特征;针对每个商品,将该商品的商品特征,输入预先训练的增益预估模型,确定单位资源量相对于该商品所带来的增益;其中,所述增益预估模型采用权利要求1~3任一所述的方法
训练得到;根据所述单位资源量相对于各商品所带来的增益以及各商品对应的待推送信息所包含的资源总量,确定各商品对应的待推送信息的类型,并根据各商品对应的待推送信息的类型,向用户推送各商品对应的推送信息;其中,不同类型的推送信息对应的资源量不同。5.如权利要求4所述的方法,其特征在于,根据所述单位资源量相对于各商品所带来的增益以及各...

【专利技术属性】
技术研发人员:钱心远李翔
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1