基于CTR预测模型的目标推荐方法及装置制造方法及图纸

技术编号:37704540 阅读:11 留言:0更新日期:2023-06-01 23:52
本公开涉及机器学习技术领域,提供了一种基于CTR预测模型的目标推荐方法及装置。该方法包括:利用卷积层、池化层和全连接层构建多组特征生成层,并利用嵌入层和多组特征生成层构建特征生成网络,其中,多组特征生成层彼此使用的卷积核不同;利用特征拼接层、特征组合层、多层感知机和softmax层构建特征分类网络;利用特征生成网络和特征分类网络构建CTR预测模型;依据推荐任务对CTR预测模型进行训练,利用训练后的CTR预测模型执行推荐任务。采用上述技术手段,解决现有技术中,CTR预测中特征交互比较少,比较稀疏,导致CTR预测准确率低的问题。题。题。

【技术实现步骤摘要】
基于CTR预测模型的目标推荐方法及装置


[0001]本公开涉及机器学习
,尤其涉及一种基于CTR预测模型的目标推荐方法及装置。

技术介绍

[0002]推荐系统在当今生活扮演着不可或缺的作用,无论是网络购物,新闻阅读,还是视频观看等,都有其身影。用户点击预测(Click Through Rate,CTR)是推荐系统中的关键任务,它可以估计用户点击一个item的概率,用于执行CTR任务的称之为CTR预测模型。对于CTR预测最关键的是如何有效选择特征交互,然而目前在CTR预测中特征交互比较少,比较稀疏。
[0003]在实现本公开构思的过程中,专利技术人发现相关技术中至少存在如下技术问题:CTR预测中特征交互比较少,比较稀疏,导致CTR预测准确率低的问题。

技术实现思路

[0004]有鉴于此,本公开实施例提供了一种基于CTR预测模型的目标推荐方法、装置、电子设备及计算机可读存储介质,以解决现有技术中,CTR预测中特征交互比较少,比较稀疏,导致CTR预测准确率低的问题。
[0005]本公开实施例的第一方面,提供了一种基于CTR预测模型的目标推荐方法,包括:利用卷积层、池化层和全连接层构建多组特征生成层,并利用嵌入层和多组特征生成层构建特征生成网络,其中,多组特征生成层彼此使用的卷积核不同;利用特征拼接层、特征组合层、多层感知机和softmax层构建特征分类网络;利用特征生成网络和特征分类网络构建CTR预测模型;依据推荐任务对CTR预测模型进行训练,利用训练后的CTR预测模型执行推荐任务。<br/>[0006]本公开实施例的第二方面,提供了一种基于CTR预测模型的目标推荐装置,包括:第一构建模块,被配置为利用卷积层、池化层和全连接层构建多组特征生成层,并利用嵌入层和多组特征生成层构建特征生成网络,其中,多组特征生成层彼此使用的卷积核不同;第二构建模块,被配置为利用特征拼接层、特征组合层、多层感知机和softmax层构建特征分类网络;第三构建模块,被配置为利用特征生成网络和特征分类网络构建CTR预测模型;训练模块,被配置为依据推荐任务对CTR预测模型进行训练,利用训练后的CTR预测模型执行推荐任务。
[0007]本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
[0008]本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
[0009]本公开实施例与现有技术相比存在的有益效果是:因为本公开实施例通过利用卷
积层、池化层和全连接层构建多组特征生成层,并利用嵌入层和多组特征生成层构建特征生成网络,其中,多组特征生成层彼此使用的卷积核不同;利用特征拼接层、特征组合层、多层感知机和softmax层构建特征分类网络;利用特征生成网络和特征分类网络构建CTR预测模型;依据推荐任务对CTR预测模型进行训练,利用训练后的CTR预测模型执行推荐任务,因此,采用上述技术手段,可以解决现有技术中,CTR预测中特征交互比较少,比较稀疏,导致CTR预测准确率低的问题,进而提高CTR预测准确率。
附图说明
[0010]为了更清楚地说明本公开实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0011]图1是本公开实施例提供的一种基于CTR预测模型的目标推荐方法的流程示意图;图2是本公开实施例提供的一种训练后的CTR预测模型执行推荐任务的流程示意图;图3是本公开实施例提供的一种基于CTR预测模型的目标推荐装置的结构示意图;图4是本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
[0012]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本公开实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本公开。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本公开的描述。
[0013]图1是本公开实施例提供的一种基于CTR预测模型的目标推荐方法的流程示意图。图1的基于CTR预测模型的目标推荐方法可以由计算机或服务器,或者计算机或服务器上的软件执行。如图1所示,该基于CTR预测模型的目标推荐方法包括:S101,利用卷积层、池化层和全连接层构建多组特征生成层,并利用嵌入层和多组特征生成层构建特征生成网络,其中,多组特征生成层彼此使用的卷积核不同;S102,利用特征拼接层、特征组合层、多层感知机和softmax层构建特征分类网络;S103,利用特征生成网络和特征分类网络构建CTR预测模型;S104,依据推荐任务对CTR预测模型进行训练,利用训练后的CTR预测模型执行推荐任务。
[0014]本公开实施例可以理解为构建一个CTR预测模型,具体地:用多个卷积层、池化层和全连接层的组合构建多组特征生成层,多组特征生成层彼此使用的卷积核不同,比如某组特征生成层是由1维卷积层、1维池化层和全连接层依次连接构成的(该组特征生成层使用的是1维卷积核);嵌入层后接多组并列的特征生成层,作为特征生成网络;依次连接特征拼接层、特征组合层、多层感知机和softmax层,得到特征分类网络;特征生成网络后接特征分类网络,作为CTR预测模型。
[0015]CTR,全称是Click Through Rate,也就是点击预测模型。本公开实施例中训练得
到的CTR预测模型可以用于网络购物、新闻阅读以及视频观看等场景中预测用户喜欢的目标,将预测的目标推荐给用户。如在网络购物场景中推荐任务是商品推荐任务;如在新闻阅读场景中推荐任务是文本推荐任务;如在视频观看场景中推荐任务是视频推荐任务。多层感知机(英文简写是MLP,英文全称是Multilayer Perceptron)。
[0016]现有技术中,CTR预测中,可以看做是训练中特征交互比较少,比较稀疏,所以训练得到的CTR预测模型准确率低,一组特征生成层可以是实现一种特征交互,本公开实施例中特征生成网络使用了多组特征生成层(现有技术中特征生成网络使用了一组特征生成层),所以增加了特征交互,所以可以提高CTR预测准确率。
[0017]进一步地,本公开实施例还可以理解为改进CTR预测模型,现有CTR预测模型的特征生成网络仅使用一组特征生成层,本公开实施例在特征生成网络增加了多组特征生成层,同时为了应对特征生成网络的改进,在特征分类网络中增加特征拼接层和特征组合层(现有CTR预测模型的特征分类网络仅是由多层感知机和softmax层组成的)。特征拼接层和特征组合层可以将特征生成网络中生成的多个多维嵌入特征向量进行拼接和组合。
[0018]根据本公开实施例提供的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于CTR预测模型的目标推荐方法,其特征在于,包括:利用卷积层、池化层和全连接层构建多组特征生成层,并利用嵌入层和多组特征生成层构建特征生成网络,其中,多组特征生成层彼此使用的卷积核不同;利用特征拼接层、特征组合层、多层感知机和softmax层构建特征分类网络;利用所述特征生成网络和所述特征分类网络构建CTR预测模型;依据推荐任务对所述CTR预测模型进行训练,利用训练后的所述CTR预测模型执行所述推荐任务。2.根据权利要求1所述的方法,其特征在于,依据推荐任务对所述CTR预测模型进行训练,包括:获取所述推荐任务对应的训练数据集;将所述训练数据集中的训练样本输入所述CTR预测模型:所述特征生成网络中的嵌入层对所述训练样本进行处理,输出多个多维嵌入特征向量;所述特征生成网络中的多组特征生成层对多个多维嵌入特征向量进行处理,输出多个多维交互特征向量,其中,每组特征生成层输出一个多维交互特征向量;所述特征分类网络对多个多维嵌入特征向量和多个多维交互特征向量进行处理,得到分类结果;利用交叉熵损失函数计算所述分类结果和所述训练样本对应的标签之间的损失值,利用所述损失值优化所述CTR预测模型的模型参数,以完成对所述CTR预测模型的训练。3.根据权利要求1所述的方法,其特征在于,所述嵌入层后接多组并列的特征生成层,作为所述特征生成网络。4.根据权利要求2所述的方法,其特征在于,所述特征分类网络对多个多维嵌入特征向量和多个多维交互特征向量进行处理,得到分类结果,包括:将多个多维嵌入特征向量和多个多维交互特征向量输入所述特征分类网络:所述特征分类网络中的特征拼接层对多个多维嵌入特征向量和多个多维交互特征向量进行拼接,得到拼接特征向量,其中,所述拼接特征向量包括多个一维特征向量;所述特征分类网络中的特征组合层对所述拼接特征向量中每任意两个一维特征向量进行组合,得到多个组合特征;多个组合特征依次经过多层感知机和softmax层,得到分类结果。5.根据权利要求4所述的方法,其特征在于,所述...

【专利技术属性】
技术研发人员:董辉暴宇健
申请(专利权)人:北京龙智数科科技服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1